Vous êtes sur la page 1sur 6

DISTRIBUCION JI-CUADRADA (X2)

Las distribucin Chi cuadrado, se derivan de la distribucin Normal y estn relacionadas con la
teora del muestreo pequeo n< 30.
Son muy importantes pues son la base de metodologas inferenciales, tales como Intervalos de
Confianza y Pruebas de Hiptesis.
En otros estudios se les define como la suma de diferencias cuadrticas relativas entre valores
experimentales (observados) y valores tericos (esperados).

Definicin: Sea k variables aleatorias normales e independientes, cada una


con media 0 y desviacin tpica 1. Entonces, la variable aleatoria:

Se llama la variable aleatoria chi cuadrado con k grados de libertad.

La denominada Distribucin Chi Cuadrado (que usualmente se escribe y se lee como: Ji Cuadrado), es
una distribucin cuadrtica de la probabilidad que utiliza bsicamente variables aleatorias continuas. La
Distribucin Chi Cuadrado de la probabilidad se denota mediante la letra griega minscula ji elevada al
cuadrado (2), y consiste en establecer un espacio continuo delimitado por la suma de los cuadrados de n
variables aleatorias que son independientes entre s, espacio dentro del cual la variable X puede asumir
cualquiera de los infinitos valores que lo conforman, y por tanto para establecer el valor aproximado de una
variable X dentro de ese espacio se procede a incluir una estimacin de sus posibles lmites que estn dados
por los distintos Grados de Libertad que pueden existir entre las variables aleatorias analizadas que dan
origen al referido espacio. En otras palabras, la Distribucin Chi Cuadrado en un delimitado espacio
conjuga un determinado nmero de variables aleatorias independientes entre s, con unos valores de
probabilidad ubicados entre 1 y 0 que son atribuibles a esas variables, y con unos lmites de la probabilidad
para el verdadero valor de X delimitados por los Grados de Libertad atribuibles a las variables aleatorias
analizadas.

Explicacin de los grados de libertad usados en la distribucin chi cuadrado:

Dentro de la Distribucin Ji Cuadrado los denominados Grados de Libertad atribuibles a un conjunto de


variables equivalen al nmero de datos independientes entre s existentes dentro de ese conjunto que es
necesario conocer previamente para poder estimar el valor de cualquier otro dato independiente del mismo
grupo. Por ejemplo, si se afirma que en un cesto hay un conjunto de 10 manzanas, conformado por 2 clases
independientes de manzanas, pues algunas de esas 10 manzanas son de color rojo y otras son de color verde,
entonces en tal caso basta con saber que en el cesto hay 4 manzanas rojas para poder calcular
inmediatamente que las restantes son 6 manzanas de color verde, es decir, en este caso hay 2 clases de datos
independientes entre s (rojas y verdes), pero para poder conocer el valor de una clase de esos dos datos es
siempre necesario conocer previamente el valor de la otra clase de datos, motivo por el cual se concluye
que el Grado de Libertad o el grado de independencia existente entre las dos clases de datos tiene un valor
de uno.

En otro ejemplo, si se afirma que en una sala hay un conjunto de 30 personas, conformado por 3 clases de
razas independientes entre s, pues algunas de esas personas son caucsicas, otras son negras y otras son
asiticas, entonces basta con saber que en la sala hay 12 personas caucsicas y 9 negras para poder calcular
exactamente que las restantes 9 personas son asiticas, es decir, en este caso hay 3 clases de datos
independientes entre s, pero para poder conocer cul es el valor de una clase particular de esos datos es
siempre necesario conocer previamente el valor de las otras 2 clases de datos; en otras palabras, si slo se
sabe que en la sala hay 12 personas caucsicas, ese dato resulta insuficiente para poder saber con exactitud
cuntas son negras y cuntas son asiticas dentro de las restantes 18 personas de la sala, y si slo se sabe
que en la sala 9 personas son asiticas, ese dato por s slo tambin resulta insuficiente para poder saber
cuntas son negras y cuntas son caucsicas dentro de las restantes 21 personas de la sala, motivo por el
cual se concluye que el Grado de Libertad o grado de independencia existente entre las tres clases de datos
tiene un valor de 2, pues nicamente conociendo el valor de 2 clases de datos se puede saber con exactitud
cmo estn distribuidas las tres clases de razas dentro de la poblacin total del conjunto analizado.
En realidad la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se extraen todas las
muestras posibles de una poblacin normal y a cada muestra se le calcula su varianza, se obtendr la
distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el estadstico X2. Si se
elige una muestra de tamao n de una poblacin normal con varianza, el estadstico:

Tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1grados de libertad y se
denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada est dado por:

Donde n es el tamao de la muestra, s2 la varianza muestral y 2 la varianza de la poblacin de donde se


extrajo la muestra. El estadstico ji-cuadrada tambin se puede dar con la siguiente expresin:

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un nmero infinito de
distribuciones X2.
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se
5. extienden a la derecha; esto es, estn sesgadas a la derecha.
6. Cuando n>2, la media de una distribucin X2 es n-1 y la varianza es 2(n-1).
7. El valor modal de una distribucin X2 se da en el valor (n-3).

La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-
2).

Distribucin
2 Chi-cuadrado
Para denotar el valor crtico de una distribucin X2 con gl grados de libertad se usa el smbolo

; este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el eje
horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado izquierdo
y a lo largo del lado superior de la misma tabla.

Clculo de Probabilidad

El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber cmo se va a
comportar la varianza o desviacin estndar en una muestra que proviene de una distribucin normal.

Ejemplos:

1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar uno de sus destinos en una
ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto. Si se elige al
azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2.

Solucin:

Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue:


El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se encuentra que a este
valor le corresponde un rea a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)

2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin normal
con varianza =6 , tenga una varianza muestral:

a. Mayor que 9.1


b. Entre 3.462 y 10.745

Solucin.

a. Primero se proceder a calcular el valor de la ji-cuadrada:

Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la derecha de 0.05. Por lo
que la P(s2 >9.1) = 0.05

1. Se calcularn dos valores de ji-cuadrada:

Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el valor de
13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la derecha de 0.01.
Como se est pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos 0.01 quedando
0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94
Estimacin de la Varianza

Para poder estimar la varianza de una poblacin normal se utilizar la distribucin ji-cuadrada.

Al despejar esta frmula la varianza poblacional nos queda:

Los valores de X2 dependern de nivel de confianza que se quiera al cual le llamamos . Si nos
ubicamos en la grfica se tiene:

Ejemplos:

1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por
cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de
confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye
estacompaa, suponga una poblacin normal.

Solucin:

Primero se calcula la desviacin estndar de la muestra:

Al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.


Para obtener un intervalo de confianza de 95% se elige un = 0.05.
Despus con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.

Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de
izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para la varianza es:
Grficamente:

Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La
interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un nivel de
confianza del 95% se sabe que la varianza de la poblacin de los pesos de los paquetes de semillas
de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los


resultados que producen muestras estndar. En un estudio de la cantidad de calcio en el agua potable,
el cual se efecta como parte del control de calidad, se analiz seis veces la misma muestra en el
laboratorio en intervalos aleatorios. Los seis resultados en partes por milln fueron 9.54, 9.61, 9.32,
9.48, 9.70 y 9.26.Estimar la varianza de los resultados de la poblacin para este estndar, usando un
nivel de confianza del 90%.

Solucin:
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose dos
resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza est dado por: