Académique Documents
Professionnel Documents
Culture Documents
X(Nhijos)
ni(frecuencia)
0
50
1
80
Mayor Frecuencia
2
90
3
70
4
50
5
30
6
20
7
5
8
3
9
2
9
2
10
3
11
5
12
3
13
4
14
3
Moda = LI +
1
ci
1 + 2
donde 1 = ni ni 1 ; 2 = ni ni +1
y adems:
1,25 1,30
1,30 1,35
1,35 1,45
1,45 1,60
1,60 o ms
Diremos que 1,35 1,45 es el intervalo modal lo que significa que la mayor frecuencia de
unidades de observacin (personas) se encuentran entre los valores 1,35 y 1,45. En este
ejemplo se observa que, por el hecho de que las amplitudes no son iguales la comparacin entre
las frecuencias de los intervalos puede resultar injusta.
Si en cambio se considera la tabla para las observaciones de la variable Peso:
X(Peso)
ni (Frecuencia)
27 32
32 37
37 42
42 47
47 52
ni = n3 = 7;
ni-1 = n2 = 5;
ni+1 = n4 = 5;
ci = 0,1;
1 = 2; 2 = 2
.Por lo tanto
Se nota que esta nmero no debera ser presentado como moda por cuanto su frecuencia, en general, es desconocida
y en gran cantidad de aplicaciones puede resultar igual a cero
ni = n2 = 7;
ni-1 = n1= 3;
ni+1 = n3 = 6;
1 = 4; 2 = 1
ci = 5;
.Por lo tanto
X(1)
X(2)
X(j)
A lo ms n/2 observaciones
X(i)
X(i+1)
X(n)
A lo ms n/2 observaciones
Mediana
Por ejemplo, consideremos los valores de X correspondientes a la variable Ingreso (en miles $),
presentada en el Captulo I
Unidades
Informac.
10
11
12
13
14
15
16
17
18
19
20
X(Ingreso)
400
350
1.000
525
738
473
412
380
734
803
1.320
632
795
978
260
325
660
319
1.230
324
X (orden.)
260
319
324
325
350
380
400
412
473
525
632
660
734
738
795
803
978
1.000
1.230
1.320
Subndice
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
(19)
(20)
El nmero de observaciones es 20 y la mitad de las mismas (50% de las observaciones) ser 10.
El valor de X = 380 no es mediana puesto que si bien hay 5 (5 10) observaciones menores que
ese valor, hay 14 (14 10) observaciones mayores que el valor 380.
En cambio el valor X = 525 es mediana por cuanto hay 9 observaciones menores que este valor
(9 10) y hay 10 observaciones mayores que l (10 10)
Por igual razonamiento se puede comprobar que X = 632 es tambin una mediana y por lo tanto
lo ser cualquier otro nmero entre 525 y 632. Al intervalo determinado por estos extremos se
llama intervalo mediano.
Veamos otro ejemplo considerando la variable Edad slo para las primeras 15 personas
Unidades
Informac.
10
11
12
13
14
15
X(Edad)
10
11
11
14
12
10
12
13
13
12
13
14
11
X (orden.)
10
10
10
11
11
11
11
11
12
12
12
13
13
Subndice
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
En este caso la mitad de las observaciones es 7,5. Para que un valor de X = x0 sea mediana
basta que el nmero de valores de X menores que este valor (x0) sea menor o igual a 7
(tcnicamente menor que 7,5) y simultneamente el nmero de los valores X que superan este
valor x0 sea tambin menor o igual a 7 (tcnicamente menor que 7,5).
Puede comprobarse que X = 11 cumple con esta condicin por cuanto slo 5 observaciones son
menores que este valor y simultneamente 5 observaciones son mayores que dicho valor.
Asimismo se puede comprobar que no hay otro valor de X que pueda ser mediana.
Mtodos de clculo de la Mediana de X
Sean x1, x2, xi, , xn-1, xn los n valores de X observados y sean x(1), x(2), x(i), , x(n-1), x(n)
estos mismos valores puestos en orden de menor a mayor.
Entonces:
Si n es impar el valor x((n+1)/2) , es decir el valor que una vez ordenado ocupa el lugar
(n+1)/2, es el valor mediano o simplemente, la mediana
Si n es par los valores x(n/2) y x(n/2 +1) cumplen la condicin de no dejar ms del 50% de
las observaciones ni a su izquierda ni a su derecha. En efecto, el primero dejar a su
izquierda y a su derecha, a lo ms n/2 1 valores observados y por lo tanto es una
mediana. Tambin lo es el segundo valor indicado por cuanto a su izquierda deja a lo
ms n/2 valores y a su derecha, a lo ms, n/2 2 observaciones.
En este caso se observa adems que todo nmero entre x(n/2) y x(n/2 +1) cumple con la
condicin de ser mediana, por lo que al intervalo [x(n/2) , x(n/2 +1) ] se llama intervalo
mediano y todo valor de este intervalo es una mediana
Ejemplo
Consideremos el ejemplo de la variable Edad y dispongamos sus 20 valores observados en
forma ordenada:
9, 9, 9, 9, 10, 10, 10, 11, 11, 12, 12, 12, 12, 13, 13, 13, 14, 14, 14, 14
10
11
X(2)
X(j)
xp
X(i)
X(i+1)
X(n)
Percentil de
orden p
Por ejemplo, un percentil de orden 0,15 ser un valor x0,15 tal que, a lo ms 15% (100x0,15)% de
los valores observados de X son menores que x0,15 y tambin, a lo ms, el 85% (100(1-0,15))%
de los valores de X observados tienen valores mayores que este valor x0,15.
Puede verificarse que el percentil de orden 0,5 (p0,5) es la mediana.
Cuartilas.
Las Cuartilas son los percentiles de orden 0,25(p0,25); 0,50 (p0,5); 0,75 (p0,75) que son llamados,
respectivamente, 1er Cuartil: 2 Cuartil y 3er Cuartil.
Quintiles
Los Qintiles son los percentiles de orden 0,2(p0,20); 0,4(p0,40); 0,6(p0,60); 0,8(p0,80) que se llaman:
1er Quintil: 2 Quintil; 3er Quintil; 4 Quintil y 5 Quintil respectivamente.
Deciles
Son los percentiles de orden 0,1 (p0,1); 0,2 (p0,2); 0,3 (p0,3); 0,4 (p0,4); 0,5 (p0,5); 0,6 (p0,6); 0,7 (p0,7);
0,8 (p0,8); 0,9 (p0,9), que se llaman, respectivamente, 1er Decil; 2 Decil; 3er Decil; 4 Decil, etc.
Mtodo de clculo de percentiles
Sean x(1), x(2), x(i), , x(n-1), x(n) los valores ordenados de las observaciones de X.
Entonces:
Ejemplos:
Para los valores observados de la variable Edad calcularemos el percentil de orden 0,20
(p=0,2). Los valores ordenados son:
9, 9, 9, 9, 10, 10, 10, 11, 11, 12, 12, 12, 12, 13, 13, 13, 14, 14, 14, 14
Entonces:
np = 20x0,20 = 4. Por ser entero los valores que ocupan el 4 y 5 lugar que corresponden a los
valores 9 y 10 respectivamente, son percentiles de orden 0,2. Por lo tanto todo nmero mayor o
igual a 9 y menor o igual 10 sern tambin percentiles de orden 0,2.
Si en cambio se desea calcular el percentil de orden 0,18 (p=0,18) se tiene que:
np = 20x0,18 = 3,6 que no es entero. La parte entera de 3,6 es 3 por lo que la parte entera de 3,6
ms 1 es 4. El valor observado de X que ocupa el 4 lugar es 9. Luego 9 es el percentil de
orden 0,18.
Si consideramos ahora la variable Peso, los valores observados puestos de menor a mayor son:
25, 28, 29, 30, 30, 31, 32, 33, 34, 36, 37, 37, 38, 39, 40, 41, 42, 45, 47, 47
Entonces
El percentil de orden 0,36 ser el valor de X que ocupa el octavo lugar (la parte entera de
20x0,36= 7,2, es 7)
Los percentiles de orden 0,30 sern los nmeros mayores o iguales al 6 valor (20x0,3 = 6) y
menor o igual al 7 valor (6+1). Por lo tanto un percentil de orden 0,3 ser cualquier nmero
mayor o igual a 31 y menor o igual a 32.
Mtodo de Clculo mediante Tablas de Frecuencias
La definicin de percentiles lleva implcito que sus respectivos clculos estn basados en los
valores originales dados por la matriz de datos para la respectiva variable X.
Sin embargo en ocasiones puede ocurrir que no se cuente con estos valores originales aunque
s se disponga de informacin agrupada de la variable X mediante una tabla de frecuencia.
1) Valores no agrupados. Si los datos no estn agrupados, sea p tal que 0<p<1. y sea xp el
primer valor de X donde se cumple que la frecuencia relativa acumulada (Fi) de X es mayor o
igual a p. Entonces:
Si en el valor xp la frecuencia Fi = p, entonces xp y el valor de X siguiente a xp sern el percentil
de orden p.
Si en el valor de xp su frecuencia Fi > p, entonces nicamente xp es percentil de orden p
Veamos algunos ejemplos de clculo de percentiles mediante tabla de frecuencias
Consideremos distribucin de frecuencias de valores no agrupados de la variable Edad ya
presentada y supongamos que se desea calcular el percentil de orden p = 0,5 (Mediana).
Valores
de X
Frecuencia
Absoluta
Frecuencia
Acumulada
Frecuencia
Relativa
Frec. Relat.
Acumulada
ni
Ni
Fi
Fi
0,10
0,10
10
0,15
0,25
11
10
0,25
0,50
12
13
0,15
0,65
13
17
0,20
0,85
14
20
0,15
1,00
Total
20
Pp = LI + [ p n N i 1 ]
ci
, donde
ni
2
5
7
5
1
20
Frecuencia
Acumulada
2
7
14
19
20
Frecuencia
Relativa
0,10
0,25
0,35
0,25
0,05
1
Frec. Relat.
Acumulada
0,10
0,35
0,70
0,95
1,00
Supongamos que se desea calcular la Mediana (percentil de orden 0,5). El intervalo donde se
encuentra la Mediana ser el primer intervalo para el cual la Frecuencia Relativa Acumulada es
mayor o igual a 0,5. En nuestro ejemplo este intervalo es 1,35 1,45.
Para aplicar la frmula tenemos que:
P=0,5
LI = 1,35
Ni-1 =7
ni = 7
ci = 1,45-1,35=0,10
Entonces
Pp = LI + [ p n N i 1 ]
ci
0,10
0, 30
= 1, 35 + ( 0, 5 20 7 )
= 1, 35 +
= 1, 3928
ni
7
7
i =1
i =1
( X i X ) 2 ( X i k ) 2 k R
Se puede demostrar (ver Anexo a este Captulo) que este nmero se calcula mediante la frmula
X=
1 n
Xi
n i =1
Ejemplo: en la Matriz de Datos del Captulo I consideremos la variable Edad. La suma de sus 20
20
valores es 233 (
1 20
233
xi =
= 11, 65
20 i =1
20
Como ejercicio se pide verificar que las Medias de: Peso, Talla, Ingreso y Rendimiento para la
referida Matriz de Datos son respectivamente: 37,15Kg; 1,402mts; $632.900; 5,15
Calculo de la Media mediante de Tabla de Frecuencias
1) Valores no agrupados. Es posible calcular la media a base de la Tabla de Frecuencia de
valores de X no agrupados observando que:
n
i =1
k
1
x
=
xi fi para frecuencias relativas
i
n i =1
i =1
Por lo tanto:
X=
1 k
xi ni para frecuencias absolutas
n i =1
k
Frecuencia
Absoluta
ni
1
2 0
i=1
xini
Frecuencia
Relativa
fi
xifi
9x2=18
0,10
9x0,1=0,90
10
10x3=30
0,15
10x0,15=1,50
11
11x5=55
0,25
11x0,25=2,75
12
12x3=36
0,15
12x0,15=1,80
13
13x4=52
0,20
13x0,20=2,60
14
14x3=42
0,15
14x0,15=2,10
Total
=20
=233
xini =11,65
Media de X
1
2 3 3 = 1 1, 6 5
2 0
X =
1
20
i=1
Marca de Frecuencia
Clase
Absoluta
1,275
1,325
1,40
1,525
1,70
( m a r c a c la s e ) i n i =
2
5
7
5
1
20
Marca Clase x
Frec. Absol.
Frecuencia
Relativa
2,55
6,625
9,8
7,625
1,7
= 28,3
1
2 8 , 3 = 1, 4 1 5
20
0,10
0,25
0,35
0,25
0,05
1
Frec. Relat.
Acumulada
0,1275
0,33125
0,49
0,38125
0,085
= 1,42
Media de X (aprox.)
A base de los datos originales la Media es 1,402 mts. Los clculos aproximados usando las
marcas de clase, en este ejemplo dieron 1,415 mts.
Clculo de la Media mediante Programas Computacionales
(X
i =1
k ) 2 la media es el
valor que mejor representa a un conjunto de datos, pero esto no necesariamente significa que
los representa adecuadamente. Para conocer cun bien representa una media a un conjunto de
datos se define el indicador Varianza mediante
Var ( X ) = X2 =
1 n
( X i X )2
n i =1
2
X
1
n
i =1
( X i X )2 =
1
n
i =1
2
i
.Esta ltima
Edad (X)
xi 11,65
( xi 11,65)2
-2,65
7,0225
2
3
10
11
-1,65
-0,65
2,7225
0,4225
11
-0,65
0,4225
5
6
7
14
12
10
2,35
0,35
-1,65
5,5225
0,1225
2,7225
8
9
12
13
0,35
1,35
0,1225
1,8225
10
11
9
13
-2,65
1,35
7,0225
1,8225
12
13
12
13
0,35
1,35
0,1225
1,8225
14
15
16
14
11
10
2,35
-0,65
-1,65
5,5225
0,4225
2,7225
17
18
19
20
11
13
14
11
-0,65
1,35
2,35
-0,65
0,4225
1,8225
5,5225
0,4225
= 48, 55
Indicador de la representatividad
de 11,65 respecto del conjunto
de valores de la Edad
Var ( X ) = X2 =
1 n
1 n
48,55
2
x
X
=
= 2, 4275
(
)
( xi 11, 65) 2 =
i
n i =1
20 i =1
20
Edad (X)
Unidades
1
81
2
3
10
11
100
121
11
121
5
6
7
14
12
10
196
144
100
8
9
12
13
144
169
10
11
9
13
81
169
12
13
12
13
144
169
14
15
16
14
11
10
196
121
100
17
18
19
20
11
13
14
11
121
169
196
121
= 233
xi2
Var ( X ) = X2 =
=
2
1 n 2
Xi X =
n i =1
1
2763 11, 652 = 138,15 135, 7225 = 2, 4275
20
= 2763
Var ( X ) =
2
X
1
n
i =1
i =1
i =1
x i2 X
1
n
i =1
x i2 n1 X
Frecuencia
Absoluta
ni
xini
9x2=18
10
10x3=30
11
11x5=55
12
12x3=36
13
13x4=52
14
14x3=42
xi2ni
2
9 x2=162
2
10 x3=300
2
11 x5=605
2
12 x3=432
2
13 x4=676
2
14 x3=588
Total
=20
=233
xi ni =2763
Entonces:
2
1 6 2
1
Var ( X ) = = xi ni X = 2763 11, 652 = 2, 4275
n i =1
20
2
X
Marca de Frecuencia
Clase
Absoluta
1,275
1,325
1,40
1,525
1,70
Marca Clase x
Frec. Absol.
(Marca Clase) x
Frec. Absol.
2,55
6,625
9,8
7,625
1,7
= 28,3
3,25125
8,778125
13,72
11,628125
2,89
=40,2675
2
5
7
5
1
20
2
1 6
1
28,3
Var ( X ) = = (marca declase)i2 ni X = 40, 2675
= 2,0134 2,0022 = 0,0012
20
n i =1
20
2
X
DE ( X ) = X = X2 =
1 n
( X i X )2
n i =1
Ejemplo:
En el caso de la Edad DE ( X Edad ) = X Edad =
X2
Edad
= 2, 4275 = 1,5580
X2
Talla
= 0, 009466 = 0, 0973
CV ( X ) =
X
X
Para los efectos de este Curso usaremos la siguiente regla prctica: si CV(X) 0,1 aceptaremos
que X representa adecuadamente al conjunto de valores de X observados (cuanto ms cerca
de cero es mejor su representatividad).
Ejemplos
En el caso de la Edad CV ( X Edad ) =
Edad
X2
Edad
2, 4275
= 0,1337 0,1
11, 65
Por lo tanto la Media de la Edad (11,65 )no representa adecuadamente al conjunto de valores de
Edades en la Matriz de Datos
En el caso de la Talla CV ( X Talla ) =
Talla
X2
X
Talla
0, 0973
= 0, 0694 0,1
1, 402
En este caso la Talla Media (1,402 mts) representa adecuadamente al conjunto observado de
tallas (20 observaciones).
INDICADORES DE DISPERSIN DE LOS DATOS
Se trata de construir indicadores que informen sobre si los datos se encuentran concentrados
(o presentan valores homogneos) o bien si los datos se encuentran dispersos (o bien sus
valores son heterogneos).
Varianza, Desviacin Estndar y Coeficiente de Variacin.
Hemos visto que la Varianza, la Desviacin Estndar y el Coeficiente de Variacin son
indicadores de dispersin (o concentracin) de los datos respecto de la Media. Adems se
demostr que esta dispersin respecto de la Media es menor que la dispersin respecto de
cualquier otro nmero.
Por tal motivo la dispersin respecto de la Media (que es la mnima) se considera como la
dispersin de los datos y en consecuencia tanto la Varianza, como la Desviacin Estndar y el
Coeficiente de Variacin resultan indicadores de esta dispersin.
Recorrido (o Rango)
Sea
a = min xii = 1, 2,..., N = xmin y sea b = max xii = 1, 2,..., N = xmax . Se define el
Si en cambio
y1 y2 < x1 x2
a)
b)
Si
Si
100(1 p )% de las observaciones eran mayores que x p se tendr que respecto de los
valores de la variable Y , se tendr que a lo ms 100(1 p )% de las observaciones sern
menores que
Y = a + bX
En efecto:
Y=
1
N
yi =
i =1
1
N
(a + bxi ) =
i =1
N
1
Na
+
b
xi = a + b X
N
i =1
Varianza
La relacin es:
V (Y ) = b 2V ( X )
Demostracin:
V (Y ) =
b2
1
N
1
N
( y Y )
N
i =1
(x X )
N
i =1
1
N
(
N
i =1
a + bxi a + b X
))
1
N
b (x X )
N
i =1
= b2 V ( X )
Recorrido o Rango
La relacin es:
Y respectivamente
En efecto, si
{
} {
}
= max { yi = 1, 2,..., N } = max {a + bxi = 1, 2,..., N } = a + bx
y por lo tanto si
max
{
} {
}
= max { yi = 1, 2,..., N } = max {a + bxi = 1, 2,..., N } = a + bx
En consecuencia, si
min
R(Y ) = ymax ymin = ( a + bxmin ) ( a + bxmax ) = b ( xmin xmax ) = (b) ( xmax xmin ) = ( b ) R ( X )
Entonces
R(Y ) = b R ( X ) b R .
ANEXO
Enunciado:
Sea X =
1 n
X i entonces
n 1=1
(X
i =1
X ) 2 ( X i k ) 2 k R
i =1
Demostracin:
n
(X
i =1
i =1
i =1
i =1
k ) 2 = ( X i X + X k ) 2 = ( X i X ) 2 + 2( X k ) ( X i X ) + ( X k ) 2
pero
n
i =1
i =1
i =1
i =1
( X i X ) = X i nX = X i X i = 0
en consecuencia
n
i =1
i =1
( X i k )2 = ( X i X )2 + ( X k )2 como ( X k )2 0 k R
Se tiene que
n
i =1
i =1
( X i k )2 ( X i X )2 k R