Vous êtes sur la page 1sur 15

Inferencia estadstica.

La estadstica inferencial es una parte de la estadstica que comprende los


mtodos y procedimientos que por medio de la induccin determina
propiedades de una poblacin estadstica, a partir de una pequea parte de la
misma. La estadstica inferencial comprende como aspectos importantes:

La toma de muestras o muestreo, que se refiere a la forma adecuada


de considerar una muestra que permita obtener conclusiones
estadsticamente vlidas y significativas.

La estimacin de parmetros o variables estadsticas, que permite


estimar valores poblacionales a partir de muestras de mucho menor
tamao.

El contraste de hiptesis, que permite decidir si dos muestras son


estadsticamente diferentes, si un determinado procedimiento tiene un
efecto estadstico significativo, etc.

Manera de elaborarlo.Planteamiento del problema


Un problema de inferencia estadstica suele iniciarse con una fijacin de objetivos o
algunas preguntas del tipo:
cul ser la media de esta poblacin respecto a tal caracterstica?
Se parecen estas dos poblaciones?
Hay alguna relacin entre ... ?
En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar,
las variables, etc.

Elaboracin de un modelo
En caso de establecer un modelo terico, se replantea el procedimiento y se llega a
una conclusin lgica.
Los posibles modelos son distribuciones de probabilidad.

Extraccin de la muestra
Se usa alguna tcnica de muestreo o un diseo experimental para obtener
informacin de una pequea parte de la poblacin.

Tratamiento de los datos


En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos
y se calculan los valores que sern necesarios en pasos posteriores, como la media
muestral, la varianza muestral
Los mtodos de esta etapa estn definidos por la estadstica descriptiva.

Estimacin de los parmetros


Con determinadas tcnicas se realiza una prediccin sobre cules podran ser los
parmetros de la poblacin

Contraste de hiptesis
Los contrastes de hiptesis son tcnicas que permiten simplificar el modelo
matemtico bajo anlisis. Frecuentemente el contraste de hiptesis recurre al uso
de estadsticos mustrales.

Conclusiones
Se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto
pueden servir para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cclico
que permite conocer cada vez mejor la poblacin y caractersticas de estudio.

Aplicacin.El objetivo de la Estadstica es medir y modelar la variabilidad del


proceso mediante un modelo probabilstico.

Para modelar la variabilidad de una variable aleatoria si slo se dispone del


conocimiento de una muestra de la misma se sigue el siguiente modo de
actuacin:
1. Planteamiento del problema.
2. Seleccin de la muestra (Muestreo estadstico), en algunos estudios la
muestra se obtiene por simulacin (Simulacin Estadstica)
3. Estudio descriptivo de la muestra, analtico y grfico (Estadstica
Descriptiva).
4. En base al conocimiento de los modelos probabilsticos ms utilizados y
teniendo en cuenta el planteamiento del problema y el estudio descriptivo
previo, elegir un modelo de probabilidad (Teora de la Probabilidad).
5. Estimar los parmetros del modelo supuesto a partir de las observaciones
muestrales utilizando los mtodos de Inferencia Estadstica: estimacin
puntual, estimacin por intervalos de confianza y contrastes de hiptesis
paramtricos.
6. Chequear que el modelo de probabilidad ajustado a los datos es adecuado y
que se verifican las hiptesis supuestas en el estudio, por ejemplo, que las
observaciones muestrales son independientes, que no existen
observaciones errneas,...,etc. Para ello se utilizan los mtodos
de Inferencia no Paramtrica.
7. Si se acepta que el modelo ajustado es adecuado se puede utilizar para
obtener resultados y conclusiones sobre la variable en estudio. En caso
contrario, se debe reformular el modelo de probabilidad y repetir el proceso
desde el paso 4.
Si se obtiene ms informacin se puede mejorar el conocimiento de la variabilidad
de la variable de inters. Puede hacerse por los siguientes medios:
Mejorar la estimacin de los parmetros del modelo, utilizando mtodos
estadsticos ms eficaces.
Aumentando el tamao muestral.
Reducir la variabilidad controlando la variabilidad sistemtica que puede ser
debida a factores que influyen en la variable en estudio o controlando otras
variables relacionadas con la variable de inters y que explican en mayor o
menor medida su comportamiento. Para ello es necesario disponer de
informacin adicional a la de la propia variable de inters, y tener datos de los
factores y/o variables explicativas que influyen en ella.
Este texto se estudian los modelos estadsticos que estudian una variable
utilizando su relacin con otras variables y/o factores. En particular se estudiarn
los dos modelos estadsticos ms importantes y utilizados en la prctica,

El Diseo de Experimentos, que estudia la variabilidad de la variable de


inters controlando los factores que pueden influir en la misma.
Los Modelos de Regresin, que estudian la variabilidad de la variable de
inters teniendo en cuenta la relacin funcional de la misma con otras variables
explicativas.

Ejemplo 1
Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como son:
El mtodo de la enseanza recproca.
El mtodo de instruccin directa.
La combinacin de mtodos de instruccin directa y enseanza recproca.
20 Las preguntas por resolver son:
1. Cul de los mtodos mejora la comprensin lectora?
2. Para el prximo ao el mtodo identificado como el mejor, dar buenos resultados, para el
alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin Bsica
Secundaria?
La primera pregunta es un caso de incertidumbre, porque, basndonos en el estudio de tres
muestras independientes y en igualdad de condiciones se aplicar uno de los tres mtodos a
cada muestra de manera independiente; con el apoyo de la Estadstica Inferencial absolvemos
esta pregunta, eligiendo a la que mejora significativamente la Comprensin Lectora, para este
tipo de alumnos. La segunda pregunta es un caso de toma de decisiones, porque Javier
Hernndez Len no ha participado en el estudio, pero se le aplicar el mejor mtodo que
resulte de la investigacin realizada, ahora bien, con qu confianza, diremos que ese mtodo
lograr que Javier mejore su comprensin lectora en ingls. Los casos de incertidumbre y
toma de decisiones son resueltos por la Estadstica Inferencial, por supuesto apoyado por la
probabilidad

PRUEBAS CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA

Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre


concuerdan exactamente con los resultados tericos esperados, segn las reglas de
probabilidad. Por ejemplo, aunque consideraciones tericas conduzcan a esperar 50
caras y 50 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se
obtengan exactamente estos resultados.
Supngase que en una determinada muestra se observan una serie de posibles sucesos
E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas frecuencias
observadas y que, segn las reglas de probabilidad, se espera que ocurran con
frecuencias e1, e2, e3, . . . ,eK llamadas frecuencias tericas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren significativamente de las
frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1 y
E2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto
satisfactoriamente con los mtodos de las unidades anteriores. En esta unidad se
considera el problema general.
Definicin de X2
Una medida de la discrepancia existente entre las frecuencias observadas y esperadas es
suministrada por el estadstico X2, dado por:

donde si el total de frecuencias es N,

Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que


si X2>0, no coinciden exactamente. A valores mayores de X2, mayores son las
discrepancias entre las frecuencias observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximacin mejora para
valores superiores.
El nmero de grados de libertad

est dado por:


=k1m

en donde:
K = nmero de clasificaciones en el problema.
m = nmero de parmetros estimados a partir de los datos muestrales para obtener los
valores esperados.

Ensayo de Hiptesis
En la prctica, las frecuencias esperadas se calculan de acuerdo con la hiptesis Ho. Si
bajo esta hiptesis el valor calculado de X2 dado es mayor que algn valor crtico, se
deduce que las frecuencias observadas difieren significativamente de las esperadas y se
rechaza Ho al nivel de significacin correspondiente. En caso contrario, no se rechazar.
Este procedimiento se llama ensayo o prueba de chi-cuadrado de la hiptesis.
Debe advertirse que en aquellas circunstancias en que X2 est muy prxima a cero debe
mirarse con cierto recelo, puesto que es raro que las frecuencias observadas concuerden
demasiado bien con las esperadas. Para examinar tales situaciones, se puede determinar
si el valor calculado de X2 es menor que las X2 crticas o de tabla (ensayo unilateral
izquierdo), en cuyos casos se decide que la concordancia es bastante buena.
Ejemplos:
1. La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120
veces. Ensayar la hiptesis de que el dado est bien hecho al nivel de significacin
del 0.05.

Cara
Frecuencia
Observada

25

17

15

23

24

16

Solucin:
Ensayo de Hiptesis:
Ho; Las frecuencias observadas y esperadas son significativamente iguales
(dado bien hecho)
H1; Las frecuencias observadas y esperadas son diferentes (dado cargado).
Primero se procede a calcular los valores esperados. Como es bien sabido por
todos la probabilidad de que caiga cualquier nmero en un dado no cargado es de
1/6. Como la suma de los valores observados es de 120, se multiplica este valor
por 1/6 dando un resultado de 20 para cada clasificacin.

Cara

Total

Frecuencia
Observada

25

17

15

23

24

16

120

Frecuencia esperada

20

20

20

20

20

20

Grados de libertad = k-1-m = 6-1-0 = 5


No se tuvo que calcular ningn parmetro para obtener las frecuencias esperadas.

Regla de decisin:
Si X2R

11.1 no se rechaza Ho.

Si X2R >11.1 se rechaza Ho.


Clculos:

Justificacin y decisin:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una significacin de
0.05 que el dado est bien hecho.
2. En los experimentos de Mendel con guisantes, observ 315 lisos y amarillos, 108
lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su
teora, estos nmeros deberan presentarse en la proporcin 9:3:3:1. Hay alguna
evidencia que permita dudar de su teora al nivel de significacin del 0.01?
Solucin:
Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel no es correcta.
El nmero total de guisantes es 315+108+101+32=556. Puesto que los nmeros
esperados estn el la proporcin 9:3:3:1 (9+3+3+1=16), se esperara:

lisos y amarillos

lisos y verdes

rugosos y amarillos

rugosos y verdes
Grados de libertad = k-1-m = 4-1-0 = 3
No se tuvo que calcular ningn parmetro para obtener las frecuencias esperadas.

Regla de decisin:
Si X2R

11.3 no se rechaza Ho.

Si X2R >11.3 se rechaza Ho.


Clculos:

Justificacin y decisin:
Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel de
significacin de 0.01 que la teora de Mendel es correcta.
Como el valor de 0.470 est cercano a cero, se procede a hacer un ensayo
unilateral izquierdo:

Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel es muy acertada.

Regla de decisin:
Si X2R

0.115 no se rechaza Ho.

Si X2R < 0.115 se rechaza Ho.


Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o la
teora de Mendel solo es buena.
3. Una encuesta sobre 320 familias con 5 nios dio la distribucin que aparece en la
siguiente tabla. Es el resultado consistente con la hiptesis de que el nacimiento
de varn y hembra son igualmente posibles? Use

= 0.05.

Nmero de nios

Nmero de nias

Nmero de
familias

18

56

110

88

40

Solucin:
Ensayo de hiptesis:
H0; El nacimiento de nios y nias es igualmente probable.
H1; El nacimiento de nios y nias no es igualmente probable.

Este experimento tiene un comportamiento binomial, puesto que se tienen dos


posibles resultados y la probabilidad de xito se mantiene constante en todo el
experimento.
Se le llamar xito al nacimiento de un varn o nio. Por lo que la variable
aleatoria "x" tomar valores desde 0 hasta 5.
Como se quiere ver si es igualmente probable el nacimiento de nios y nias, la
probabilidad de xito ser de 0.5.
Utilizando la frmula de la distribucin binomial se calcularn las probabilidades,
que multiplicadas por el nmero total de familias nos darn los valores esperados
en cada clasificacin.
Recordando la frmula de la distribucin binomial:

en donde n = 5 y "x" es el nmero de nios .

Probabilidad de 5 nios y 0 nias =

Probabilidad de 4 nios y 1 nia =

Probabilidad de 3 nios y 2 nias =

Probabilidad de 2 nios y 3 nias =

Probabilidad de 1 nio y 4 nias =

Probabilidad de 0 nios y 5 nias =


Si cada una de estas probabilidades se multiplican por 320 se obtienen los valores
esperados:

Nmero de nios

Nmero de nias

Nmero de familias

18

56

110

88

40

Frecuencias
esperadas

10

50

100

100

50

10

Grados de libertad: k-1-m = 6-1-0 = 5

Total

320

Regla de decisin:
Si X2R

11.1 no se rechaza Ho.

Si X2R >11.1 se rechaza Ho.


Clculos:

Justificacin y decisin:
Como el 12 es mayor a 11.1, se rechaza H0 y se concluye con un
el nacimiento de hombres y mujeres no es igualmente probable.

= 0.05 que

4. Una urna contiene 6 bolas rojas y 3 blancas. Se extraen al azar dos bolas de la
urna, se anota su color y se vuelven a la urna. Este proceso se repite un total de
120 veces y los resultados obtenidos se muestran en la siguiente tabla. Determinar
al nivel de significacin del 0.05 si los resultados obtenidos son consistentes con
los esperados.

Bolas blancas

Nmero de extracciones

53

61

Solucin:
Este experimento tiene las caractersticas de una distribucin hipergeomtrica, por lo cual
se calcularn los valores esperados con el razonamiento de esta distribucin.
Se llamara "x" a la variable aleatoria de inters que en este caso sern las bolas rojas.
Por lo tanto "x" puede tomar valores desde 0 hasta 2.
La frmula de la distribucin hipergeomtrica es:

Se tiene:

Probabilidad de extraer 0 rojas y 2 blancas:

Probabilidad de extraer 1 roja y 1 blanca:

Probabilidad de extraer 2 rojas y 0 blancas:

Con las probabilidades anteriores se obtendrn los valores esperados multiplicando por
120.

Bolas blancas

Nmero de extracciones

53

61

Frecuencias esperadas

10

60

50

Grados de libertad: k-1-m = 3-1-0 = 2

Regla de decisin:
Si X2R

5.991 no se rechaza Ho.

Si X2R >5.991 se rechaza Ho.


Clculos:

Justificacin y decisin:
Como el 4.83 no es mayor a 5.991, no se rechaza H0 y se concluye con un
= 0.05 que los resultados son los mismos que los esperados.

Vous aimerez peut-être aussi