Vous êtes sur la page 1sur 13

CHI CUADRADO

Karl Pearson Introdujo el método de la chi-cuadrado para dar una medida


de ajuste entre datos y distribuciones para contrastar la homogeneidad entre
varias muestras y la independencia entre variables.

¿Qué es chi-cuadrado?

En estadística la distribución de Pearson o llamada chi-cuadrado es una


distribución de probabilidad continua con un parámetro K, que representa los
gados de libertad de la variable aleatoria.

¿Qué son los grados de libertad?

• Son las mediciones de la cantidad de valores en la estadística que están


libre para variar sin influir en el resultado de la estadística. Se encuentran
mediante la fórmula n − r, donde n =número de sujetos en la muestra,
también pueden ser representados por k – r.
• K = número de grupos, cuando se realizan operaciones con grupos y no
con sujetos individuales
• R = número de sujetos o grupos estadísticamente dependientes.
• Esta distribución chi-cuadrado es una prueba de hipótesis que compara
la distribución observada de los datos con una distribución esperada de
los datos.

Tipos de pruebas de chi cuadrado

Se presenta cuando tenemos una variable y en dos variables

En el caso de una variable se utiliza las pruebas de bondad de ajuste para


aprobar que tan bien una muestra de datos categóricos se ajusta a una
distribución teórica, el estadístico chi-cuadrado cuantifica que tanto varía la
distribución observada de conteos con respectos a la distribución hipotética.

En el caso de tener dos variables tenemos:

1
Pruebas de independencia se utiliza para determinar si el valor observado de
una variable depende del valor observado de otra variable.

Pruebas de homogeneidad se utiliza para determinar si una variable está


asociada a otra variable.

Propiedades de las distribuciones chi cuadrada

• Los valores de X2 son mayores o iguales que 0.


• La forma de una distribución x2 depende del gl=n-1. En consecuencia,
hay un número infinito de distribuciones X2.
• El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
• Las distribuciones x2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
• Cuando n>2, la media de una distribución x2 es n-1 y la varianza es 2(n-
1).
• El valor modal de una distribución x2 se da en el valor (n-3).

Prueba de hipótesis

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer


el estadístico X2. Si se elige una muestra de tamaño n de una población normal
con varianza , el estadístico:

Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1
grados de libertad y se denota x2 (x es la minúscula de la letra griega ji). El
estadístico ji-cuadrada está dado por

2
Donde n es el tamaño de la muestra, s2 la varianza muestral y la varianza de la
población de donde se extrajo la muestra. El estadístico ji-cuadrada también se
puede dar con la siguiente expresión

Fórmula para pruebas de Bondad de Ajuste

Donde:

f0 = frecuencias observadas

f0 = frecuencias esperadas

x 2 = chi-cuadrado

3
Principales aplicaciones de la chi‐cuadrado

1) Al analizar en una población un carácter cualitativo o cuantitativo el


estudio resulta muy tedioso por el gran número de elementos del que
consta la población.
2) Generalmente, se examina una muestra tomada de la población, lo que
lleva a tener una serie de datos, y ver hasta qué punto la muestra se pude
considerar perteneciente a una distribución teórica conocida.
3) Siempre existirán desviaciones entre la distribución empírica u
observada y la distribución teórica. Se plantea la cuestión de saber si estas
desviaciones son debidas al azar o al haber tomado una distribución
teórica inadecuada.

Ejercicio

Una compañía que produce una parte maquinada para un motor, afirma que tiene
una varianza de diámetro no mayor a 0.0002 pulgadas.

Una muestra aleatoria de 10 de dichas partes dio una varianza de muestra s2 =


0.0003. Si se supone que las medidas del diámetro se distribuyen en forma
normal, ¿hay evidencia para refutar lo que afirma el proveedor?

Use = 0.05.

Solución:

Como en todos los ensayos de hipótesis que se han realizado anteriormente el


procedimiento es el mismo. Después de que se identifican los datos, se plantea
la hipótesis para determinar el tipo de ensayo.

Datos:

= 0.0002

n = 10

s2 = 0.0003

4
= 0.05

Paso 2

Ensayo de hipótesis:

Ho; <= 0.0002

H1; > 0.0002

Paso 3

Tabla chi-cuadrado

= 0.05

gl = n-1

gl = 10-1

Grados de Libertad (gl)= 9

Gráfica

5
Regla de decisión:

Si X2R 16.919 no se rechaza Ho.

Si X2R>16.919 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como 11.52 está entre 2.7 y 19.023, no se rechaza H o, y se concluye con un nivel de
significancia de 0.05 que la varianza del contenido de azúcar del almíbar no ha cambiado,
esto es de 18 mg2

6
T STUDENT

Nacimiento de la T de Student.

El estadístico “T” fue introducido por William Sealy Gosset en 1908, un


químico que trabajaba para la cervecería Guinness de Dublín. Student era
su seudónimo de escritor. Gosset había sido contratado gracias a la política de
Claude Guinness de reclutar a los mejores graduados de Oxford y Cambridge, y
con el objetivo de aplicar los nuevos avances en bioquímica y estadística al
proceso industrial de Guinness. Gosset desarrolló el test t como una forma
sencilla de monitorizar la calidad de la famosa cerveza stout. Publicó su test en
la revista inglesa Biometrika en el año 1908, pero fue forzado a utilizar un
seudónimo por su empleador, para mantener en secreto los procesos industriales
que se estaban utilizando en la producción. Aunque de hecho, la identidad de
Gosset era conocida por varios de sus compañeros estadísticos.

Definición

Se aplica cuando la población estudiada sigue una distribución normal


pero el tamaño muestral es demasiado pequeño como para que el estadístico en
el que está basada la inferencia esté normalmente distribuido, utilizándose una
estimación de la desviación típica en lugar del valor real.

Propiedades de las distribuciones T


1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, está más dispensa que la curva normal estándar.
3. A medida que k aumenta, la dispersión de la curva t correspondiente disminuye.
4. A medida que k→∞, la secuencia de curvas t se aproxima a la curva normal estándar.

Pruebas t para dos muestras apareadas y desapareadas

Desapareadas o de muestras independientes

Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen


dos grupos de muestras aleatorias, independientes e idénticamente distribuidas a partir de las
dos poblaciones a ser comparadas.

Por ejemplo

7
Supóngase que estamos evaluando el efecto de un tratamiento médico, y reclutamos a 100
sujetos para el estudio. Luego elegimos aleatoriamente 50 sujetos para el grupo en tratamiento
y 50 sujetos para el grupo de control. En este caso, obtenemos dos muestras independientes y
podríamos utilizar la forma desapareada de la prueba t. La elección aleatoria no es esencial en
este caso, si contactamos a 100 personas por teléfono y obtenemos la edad y género de cada
una, y luego se utiliza una prueba t bimuestral para ver en que forma la media de edades difiere
por género, esto también sería una prueba t de muestras independientes, a pesar de que los datos
son observacionales.

De muestras dependientes o apareadas

Las pruebas t de muestras dependientes o apareadas, consisten típicamente en una


muestra de pares de valores con similares unidades estadísticas, o un grupo de unidades que
han sido evaluadas en dos ocasiones diferentes (una prueba t de mediciones repetitivas).

Un ejemplo típico de prueba t para mediciones repetitivas sería por ejemplo que los sujetos
sean evaluados antes y después de un tratamiento.

Una prueba 't basada en la coincidencia de pares muéstrales se obtiene de una muestra
desapareada que luego es utilizada para formar una muestra apareada, utilizando para ello
variables adicionales que fueron medidas conjuntamente con la variable de interés.

La valoración de la coincidencia se lleva a cabo mediante la identificación de pares de


valores que consisten en una observación de cada una de las dos muestras, donde las
observaciones del par son similares en términos de otras variables medidas. Este enfoque se
utiliza a menudo en los estudios observacionales para reducir o eliminar los efectos de los
factores de confusión.

Fórmulas para aplicación de la Distribución T de Student

Entonces la variable aleatoria tiene una distribución t :

Donde:

t = es la distribución T de Student

8
= Media de los valores dados

µ= Media poblacional

s= Es la varianza

n= Número de elementos de la muestra

Tabla “T” Student

9
EJERCICIOS

Se aplica una prueba de autoestima a 25 personas quienes obtienen una calificación promedio
de 62.1 con una desviación estándar de 5.58. Se sabe que el valor correcto de la prueba debe
ser mayor a 60. ¿Existe suficiente evidencia para comprobar que no hay problemas de
autoestima en el grupo seleccionado? Considera un nivel de significancia de 0.05

Paso 1

Hipótesis Alternativa (Hi): Lo que se quiere comprobar

 El grupo no tiene problemas de autoestima.

Valor de autoestima mayor a 60 Hipótesis

Nula (Ho): Lo contrario a la hipótesis alternativa  El grupo tiene problemas de autoestima.

Valor de autoestima menor a 60.

Paso 2

Determinar nivel de significancia: α=0.05

Paso 3

Evidencia Muestral

Paso 4

Aplicando la Distribución de Probabilidad

10
Buscando en la tabla de Distribución de t de Student, encuentras el valor del área:

Paso 5

Resultados: P= 0.042 y α=0.05 Siendo P < α Por lo tanto: Se acepta Hipótesis Alternativa.
Existe suficiente evidencia para demostrar que el grupo no tiene problemas de autoestima

Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en


lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una
muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho
con su afirmación.

¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y
una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es
aproximadamente normal.

Solución:

Datos:

gl= 24
t=0,05
µ=500
S=40
n=25

De la tabla encontramos que t 0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante
queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y
1.711.

11
Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un
valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02.

De aquí que es probable que el fabricante concluya que el proceso produce un mejor producto
del que piensa.

12
REFERENCIA BIBLIOGRÁFICA

https://lookaside.fbsbx.com/file/EJERCICIOS%20T%20STUDENT%20Y%20CHI%20CUADRAD
O%20PARA%20EL%20EXAMEN%20%28Recuperado%29.pdf?token=AWwUh1zPToHRXcglvB
Ayvp6NeQOKottbTtk8SA9iM19NPe76c

http://moodle2.unid.edu.mx/dts_cursos_mdl/lic/AE/E/AM/12/Distribucion_tStudent.pdf

https://www.uv.es/ceaces/normaMu/t/t.htm

13

Vous aimerez peut-être aussi