Vous êtes sur la page 1sur 13

EDUC 6390: Estadstica aplicada en la educacin Julio E.

Rodrguez Torres Conferencia 11 La estadstica inferencial y las distribuciones de probabilidad Bosquejo I. Tipos de estadsticas....................................................................................................1 A. Descriptiva..............................................................................................................1 B. Inferencial...............................................................................................................1 Poblacin................................................................................................................2 Muestra...................................................................................................................2 Parmetro...............................................................................................................2 Estadstica..............................................................................................................2 II. Distribucin de probabilidad de variables discretas......................................................2 A. Definicin................................................................................................................2 B. Caractersticas........................................................................................................4 1. Valor esperado...................................................................................................4 2. Varianza y desviacin estndar..........................................................................5 III. Modelos matemticos.................................................................................................5 A. La distribucin binomial...........................................................................................6 1. El modelo............................................................................................................6 2. Caractersticas....................................................................................................7 Media......................................................................................................................7 Desviacin estndar...............................................................................................7 B. Distribucin normal.................................................................................................7 1. El modelo matemtico........................................................................................7 a. Importancia de la distribucin normal..................................................................7 b. Propiedades de la distribucin normal................................................................8 c. El modelo matemtico.........................................................................................8 d. La curva normal estandarizada...........................................................................9 I. Tipos de estadsticas A. Descriptiva Se origina con la recoleccin de datos poblacionales para censos. Se usa en Roma y se habla de ella en los evangelios. Su nfasis recae en los aspectos de presentar y describir datos. Definicin: Consiste de los mtodos utilizados para recolectar, presentar y describir datos de manera adecuada. B. Inferencial Se origina en el Renacimiento con el desarrollo de la probabilidad matemtica, que a su vez se basa en el estudio de los juegos de azar. Tiene que ver con poblaciones, muestras, parmetros y estadsticas. Poblacin La poblacin es el total de objetos bajo consideracin. Es el grupo sobre el cual se quiere hacer una inferencia. La mayor parte de las veces es muy grande. Algunas veces es hipottica. Si, por ejemplo, se quiere probar que la semejanza entre personas afecta el nivel de atraccin, se hace imposible encontrar una poblacin de personas semejantes en todos los aspectos.

Muestra Una muestra es la porcin de la poblacin seleccionada para un experimento o investigacin. Esta seleccin se hace porque generalmente el costo, el tiempo y los recursos son limitados para llevar a cabo el experimento con toda la poblacin. Partiendo del estudio de la muestra, el investigador puede hacer inferencias sobre la poblacin. Parmetro El parmetro es una medida de una caracterstica numrica de la poblacin. (Media, mediana, varianza, etc.). Es un elemento descriptivo de la poblacin. Estadstica Es una medida que se utiliza para describir una caracterstica numrica de la muestra, no de la poblacin como en el caso del parmetro. La estadstica inferencial sirve para determinar como una estadstica y un parmetro se relacionan. Definiciones posibles de la estadstica inferencial: 1. Consiste de los mtodos y procedimientos que hacen posible la estimacin de una caracterstica de la poblacin basndose exclusivamente en los resultados obtenidos en la muestra. 2. Es el conjunto de mtodos que hacen posible la estimacin de un parmetro basndose exclusivamente en la estadstica correspondiente. 3. Son las generalizaciones sobre la poblacin basadas exclusivamente en los resultados de la muestra. Pero antes de entrar de lleno en la estadstica inferencial es preciso clarificar un par de conceptos importantes sobre probabilidad. II. Distribucin de probabilidad de variables discretas A. Definicin Una distribucin de Probabilidad es una lista o tabla que incluye todos los posibles eventos o valores de una variable y su probabilidad. Ejemplo 1: Si se lleva a cabo un experimento que consiste en lanzar un dado una sola vez y los eventos son los valores obtenidos. La distribucin de probabilidad del experimento debe incluir todos los posibles valores que se pueden obtener y su probabilidad Valor 1 2 3 Probabilidad 1/6 1/6 1/6

4 5 6

1/6 1/6 1/6

De esta tabla se pueden obtener otras probabilidades mediante la suma de probabilidades Cul es la probabilidad de obtener 2 3? P(2 3)= P(2) + P(3) = 1/6 + 1/6 = 2/6 = 1/3 Cul es la probabilidad de obtener 3 menos? P(1 2 3) = P(1)+P(2)+P(3) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2 Cul es la probabilidad de obtener un nmero par? P(2 4 6) = P(2)+P(4)+P(6) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2 Ejemplo 2: Si se lleva a cabo un experimento que consiste en lanzar dos dados una sola vez y los eventos son la suma de los valores obtenidos. La distribucin de probabilidad del experimento debe incluir todos los posibles valores que se pueden obtener y su probabilidad Valores 2 3 4 5 6 7 8 9 10 11 12 combinaciones posibles (1,1) (1,2),(2,1) (1,3),(3,1),(2,2) (1,4),(4,1),(3,2),(2,3) (1,5),(5,1),(2,4),(4,2),(3,3) (1,6),(6,1),(2,5),(5,2),(3,4),(4,3) (2,6),(6,2),(3,5),(5,3),(4,4) (3,6),(6,3),(4,5),(5,4) (4,6),(6,4),(5,5) (5,6),(6,5) (6,6) Prob 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

De esta tabla se pueden obtener otras probabilidades mediante la suma de probabilidades

Cul es la probabilidad de obtener una suma de 4 o menos? P(2 3 4) = P(2)+P(3)+P(4) = 1/36 + 2/36 + 3/36 = 6/36 = 1/6 Cul es la probabilidad de obtener por lo menos 11? P(11 12) = P(11)+P(12) = 2/36 + 1/36 = 3/36 = 1/12 B. Caractersticas Las caractersticas ms importantes de una distribucin de probabilidad son la media y la desviacin estndar. 1. Valor esperado El valor esperado de una distribucin de probabilidad no es otra cosa que la media aritmtica. El smbolo que se utiliza es la letra griega X con el suscrito x. Se obtiene multiplicando cada valor de la variable por su probabilidad y sumando todo eso. Nota: Las siguientes son diez observaciones de un experimento: 2.1 2.1 2.1 2.1 3.2 3.2 4 4 4 4.3

La media es la suma dividida entre 10 2.1 + 2.1 + 2.1 + 2.1 + 3.2 + 3.2 + 4 + 4 + 4 + 4.3 10 Pero esto es lo mismo que: (4)(2.1) + (2)(3.2) + (3)(4) +(l)(4.3) 10 (4/10)(2.1) + (2/10)(3.2) + (3/10)(4) + (1/10)(4.3) = 3.11 La distribucin de probabilidad en este caso hubiera sido: Valor 2.1 3.2 4 4.3 Definicin de valor esperado: Probabilidad 4/10 2/10 3/10 1/10

donde X = variable Xi = ith valor de X P(Xi) = probabilidad de Xi i = 1,2,3,...N Nota: La media no es necesariamente un valor de la distribucin. Ejemplo: El valor esperado de lanzar el dado una vez es el promedio que se obtendra si se lanzara el dado muchas veces. (1)(1/6) + (2)(1/6) + (3)(1/6) + (4)(1/6)+ (5)(1/6) +(6)(1/6) = 21/6 = 3.5 2. Varianza y desviacin estndar La varianza de una distribucin de probabilidad es el promedio de las diferencias cuadradas que hay entre cada valor y la media. Nota: Las siguientes son diez observaciones de un experimento: 2.1 2.1 2.1 3.2 3.2 4 4 4 4.3

La media que se obtuvo fue 3.11 y la varianza debe ser: [(2.1-3.11)2 +(2.13.11)2 + (2.1-3.11)2 + (2.1-3.11)2 + (3.2-3.11)2 +(3.2-3.11)2 + (4-3.11)2 + (4-3.11)2 + (4-3.11)2 +(4. 3-3.11)2]/ 10 = 9.6721 que no es otra cosa que la frmula de la varianza (
X

)2

donde X = variable Xi = ith valor de X P(Xi) = probabilidad de Xi i = 1,2,3,...N

La desviacin estndar es la raz cuadrada positiva de la varianza

III. Modelos matemticos Se ha sealado que una distribucin de probabilidad de una variable discreta no es otra cosa que una tabla donde aparece el valor de la variable y su probabilidad. Estas distribuciones de probabilidad generalmente surgen de observaciones o de fenmenos cuyas leyes se conocen bien como en el caso de los dados. Cuando el fenmeno que se quiere trabajar se ha observado cuidadosamente se puede crear un MODELO MATEMTICO que lo describe. Esta es la funcin ms importante de las matemticas, facilitar el estudio de la naturaleza con modelos que la interpretan. Por ejemplo, la forma de decir que las cosas en un grupo miden el doble de las de otro grupo se expresa como la funcin y = 2x Lo mismo sucede con las distribuciones de probabilidad. Hay algunas para las que hay modelos matemticos que evitan el trabajo de calcular todo lo que se ha estado haciendo hasta ahora. Estos modelos o funciones se llaman Funciones de distribuciones de probabilidad. Hay modelos para variables discretas y para variables continuas. De entre todos se van a estudiar dos ejemplos, la funcin binomial para una variable discreta y la funcin normal para una variable continua. A. La distribucin binomial 1. El modelo La funcin binomial se puede utilizar como modelo solamente cuando las observaciones son independientes unas de otras y cada observacin se puede clasificar como un xito o un fracaso. Ejemplos: Sacar bolas blancas o negras de una urna; sacar cara o cruz al lanzar una moneda; escoger una respuesta en una pregunta de seleccin mltiple cuando uno no sabe nada. Ejemplo: En un experimento se llama xito al hecho de obtener un 5 cuando se lanzan dos dados. Cul es la probabilidad de obtener un cinco?Cul es la probabilidad de obtener dos cincos? Al crear la distribucin de probabilidad de lanzar dos dados se obtiene la siguiente tabla: Valores 2 3 4 5 6 combinaciones posibles (1,1) (1,2),(2,1) (1,3),(3,1),(2,2) (1,4),(4,I),(3,2),(2,3) (1,5),(5,1),(2,4),(4,2),(3,3) Prob 1/36 2/36 3/36 4/36 5/36

7 8 9 10 11 12

(1,6),(6,1),(2,5),(5,2),(3,4),(4,3) (2,6),(6,2),(3,5),(5,3),(4,4) (3,6),(6,3),(4,5),(5,4) (4,6),(6,4),(5,5) (5,6),(6,5) (6,6)

6/36 5/36 4/36 3/36 2/36 1/36

Los nicos eventos de xito son: (1,5), (5,1), (2,5), (5,2), (3,5), (5,3), (4,5), (5,4), (5,5), (5,6), (6,5). Por lo tanto la probabilidad de 2 xitos es 1/36 = 0.028; de un xito es 10/36 = 0.278; y de ningn xito es 25/36 = 0.694. Este mismo resultado se puede obtener sin necesidad de crear la tabla, pero utilizando el modelo matemtico de la distribucin binomial

donde P (X = x/n,p) es la probabilidad de que X = x Cuando se conocen p y n n = tamao de la muestra p = probabilidad de xito 1 - p = probabilidad de fracaso x = nmero de xitos en la muestra. En el ejemplo anterior en vez de hacer el trabajo intuitivamente, se puede utilizar la frmula de la distribucin binomial n = 2 (dos dados); p = 1/6 = 0.17; 1-p = 5/6 = 0.83 x = 0; x = 1; x = 2 P (no xito) = P(0) = (2!)/(2!0!)[(0.17)0(0.83)2] = 0.694 P(1 xito) = P(1) = (2!)/(1!1!)[(0.17)1(0.83)1] = 0.278 P (2 xitos) = P(2) = (2!)/(0!2!)[(0.17)2(0.83)0] = 0.028

2. Caractersticas Media E (X) =


X

= np

Desviacin estndar

B. Distribucin normal 1. El modelo matemtico La distribucin binomial y otras como la Poisson son modelos matemticos que se utilizan cuando la variable es discreta y satisface los requisitos del modelo. Si la variable es continua entonces se usa principalmente la distribucin normal. La gran diferencia entre ambas es que con variables discretas siempre es posible hallar la probabilidad de un valor dado puesto que los valores de la variable son discretos. Sin embargo cuando la variable es continua slo se puede hallar la probabilidad de un intervalo dado. Esta probabilidad se visualiza siempre como el rea debajo de la curva que representa la distribucin. a. Importancia de la distribucin normal i. Es el modelo matemtico por excelencia en muchas situaciones de la vida real ii. Sirve para aproximar la binomial y otras distribuciones discretas iii. Es la base de la inferencia estadstica b. Propiedades de la distribucin normal i. Es simtrica y tiene forma de campana

ii. Las medidas de tendencia central son iguales

iii. Ql y Q3 estn situados a 2/3 de una desviacin estndar. El 68 % del rea de la curva (probabilidad) se encuentra a una desviacin estndar de la media.

iv. La variable tiene un alcance infinito. c. El modelo matemtico La funcin matemtica que se usa como modelo es:

donde: e = 2.71 = 3.14


X

= media de la poblacin = desviacin estndar de la poblacin

x = un valor de la variable continua Como e y son constantes, la forma de la curva normal depende solamente de los dos parmetros de la distribucin normal, la media X y la desviacin estndar X. Las curvas normales varan dependiendo de estos dos parmetros. En matemticas, el rea debajo de la curva se halla por medio del integral de la funcin. Para evitar el proceso de hallar el integral, en estadsticas se utilizan tablas que ya traen el rea de diferentes secciones de la curva. Puesto que hay un nmero infinito de combinaciones para los dos parmetros, hay un nmero infinito de curvas normales diferentes.

Este problema se ha resuelto prcticamente cuando se transforman todas estas posibles curvas normales en una llamada la curva normal estandarizada. (standard normal curve). d. La curva normal estandarizada Propiedades i. ii.
Z

=0 =1

iii. El rea bajo la curva que aparece en las tablas corresponde a la probabilidad (Hinkle p.618) Nota: Obsrvese que el rea bajo la curva corresponde ahora a la probabilidad, de igual manera que en conferencias anteriores corresponda al porcentaje o la proporcin de puntuaciones en el intervalo dado. Por lo tanto la bsqueda de la probabilidad es exactamente igual a la bsqueda del porcentaje o proporcin de puntuaciones en un intervalo dado. iv. Cualquier variable normal puede ser transformada en la normal estandarizada por medio de la siguiente frmula:

donde

es la media de la distribucin y

su desviacin estndar.

Ejemplos:

En una fbrica el tiempo que le toma a un trabajador ensamblar una pieza est distribuido normalmente con X = 50 seg. y X = 7 seg. Ejemplo 1: Cul es la probabilidad de que un obrero pase entre 50 y 57 segundos ensamblando la pieza?

a. Primero hay que asegurarse que la variable est distribuida normalmente (Lo dice el problema) y trazar la grfica que va a servir de modelo para el problema. b. Despus hay que convertir la escala dada a la escala de la distribucin normal estndar usando la frmula z1 = (50-50)/7 = 0 z2 = (57-50)/7 = 1 c. Por medio de la tabla se observa que el rea entre 0 y 1 es 0.3413 d. Como probabilidad, porcentaje y rea bajo la curva significan lo mismo, es posible decir que: ie: La probabilidad de que un obrero seleccionado al azar ensamble la pieza en ese tiempo es 0.3413 ie: El porcentaje de obreros que pueden ensamblar esa pieza en ese lapso de tiempo es 34.13 % ie: De cada 100 obreros cerca de 34 pueden ensamblar la pieza en ese lapso de tiempo Ejemplo 2: Halla P(x 45)

z1 = (45-50)/7 = -0.71 En la tabla el rea correspondiente es 0.2389 (beyond z) P(z 45) = 0.2389 (beyond z) Dada la probabilidad o el porcentaje de obreros, se puede hallar el tiempo Ejemplo 3: Cunto tiempo debe pasar antes que 50% de los obreros puedan ensamblar una pieza? La media, 50 segundos. Ejemplo 4: Cunto tiempo pasar antes que 10% de los obreros pueda ensamblar una pieza?

Probabilidad es 0.1 y el nmero que ms se aproxima en la tabla en trminos de rea es 0.1003 (beyond z) z1 = -1.28 Por lo tanto x1 = 41.04 ie: P10 = 41.04 Actividades: Hinkle pp. 186 ej. 11,12 Lectura: Hinkle capt. 7 pp. 152-170 MENU 6390 -1.28 = (x1 - 50)/7