Probab Il I Dad Vay Mode Los

V.
CAPITULO: INTRODUCCION A LA TEORIA DE LA PROBABILIDAD
Una forma de interpretar la realidad es a travs de los modelos matemticos, los que en general pueden ser modelos determinsticos o modelos no determinsticos o aleatorios. Los modelos determinsticos son aquellos que describen de alguna manera el principio de causalidad, es decir, causa efecto. As tenemos que al lanzar un baln inflado a un estanque con agua, el resultado es que la bola queda flotando. Los modelos no determinsticos o aleatorios son aquellos en que no es posible predecir con certeza los resultados antes de realizado el experimento. As al aplicar un nuevo tratamiento no sabemos exactamente a cuantos pacientes ser efectivo. Al extraer una pieza de plstico fabricada mediante por moldeo a alta presin, no sabemos con certeza si estar dentro o fuera de especificaciones. A este tipo de experimentos los denominaremos experimentos aleatorios. 5.1.- ESPACIOS MUESTRALES Y SUCESOS:
Sistema Fsico Mediciones Modelo Anlisis
Variables Controladas
ENTRADA
S I S T E M A
SALIDA
Variables de Ruido 5.2 EXPERIMENTO ALEATORIO: Definicin Un Experimento aleatorio es aquel que proporciona diferentes resultados aun cuando sea repetido de la misma manera
115
5.3.- ESPACIO MUESTRAL Definicin Es el conjunto de todos los resultados posibles que pueden resultar al realizar un Experimento Aleatorio. Se denota con la letra S o la letra griega omega
Ejemplos de Experimentos Aleatorios: 1.- Supngase que se analiza un cilindro de aire, para detectar la presencia de una partcula no deseada. 2.- El grado de Calidad de un producto que se fabrica en un proceso cualesquiera. 3.- Se produce un ensamblaje de dos componentes diferentes e independientes, para formar una cierta pieza, y cada una de ellas debe clasificarse para verificar si cumplen separadamente los requerimientos de calidad. 4.- Cada una hora se selecciona una parte moldeada por inyeccin, y se mide con exactitud la longitud de ella. 5.- Cada diez minutos se debe verificar el volumen de llenado de los envases de un cierto producto realizado por una mquina automtica, con la finalidad de determinar si las latas cumplen con las especificaciones de volumen que deben contener. La evaluacin contina hasta encontrar una lata que no cumpla con las especificaciones.
Los experimentos aleatorios generan espacios muestrales que pueden contener un nmero FINITO o INFINITO de elementos
5.4.- ESPACIO MUESTRAL DISCRETO: Definicin
Cuando est formado por un conjunto finito o infinito contable de resultados
116
5.5.- SUCESO O EVENTO ALEATORIO Definicin
Es cualquier SUBCONJUNTO del Espacio Muestral asociado a un Experimento Aleatorio.
Puesto que los eventos o sucesos son subconjuntos, entonces es posible utilizar las operaciones bsicas de conjuntos, tales como: unin, interseccin, complementos, diferencias, etc. para formar otros sucesos de inters. Ejemplo: Se analizan 49 muestras de polibicarbonato plstico para determinar resistencia a las rayaduras y a los golpes obtenindose los siguientes resultados. Resistencia a los golpes Alta Baja Alta Resistencia a las rayaduras Baja 2 3 40 4 su
Suceso A : La muestra tiene una alta resistencia a los golpes Suceso A`: La muestra tiene una baja resistencia a los golpes Suceso B : La muestra tiene una alta resistencia a la rayadura Suceso B`: La muestra tiene una baja resistencia a la rayadura Explicite gramaticalmente los siguientes sucesos y cuantifquelos. Use diagramas de Venn. Suceso AB: Suceso AB: Suceso A` B 5.6.- DESCRIPCIN DEL ESPACIO MUESTRAL Los espacios muestrales pueden describirse grficamente de varias formas, pero una de las ms tiles y prcticas es el Diagrama de rbol.Cuando un espacio muestral puede construirse en varios pasos o etapas, entonces cada una de las ni maneras de completar el primer paso puede representarse como una rama del rbol. Cada una de las maneras de completar el segundo paso puede representarse con n2 ramas que comienzan donde terminan las ramas originales
117
Ejemplos: 1. En un sistema de comunicacin digital, cada mensaje se clasifica segn llega o no dentro del tiempo establecido por el diseo del sistema. Si se clasifican tres mensajes, donde cada uno de ellos puede recibirse a tiempo o tarde, el diagrama de rbol tendr ocho ramas, para todos los resultados posibles de estos tres mensajes. 2.- El fabricante de un automvil proporciona vehculos equipados con distintas opciones que el cliente selecciona. Cada vehculo se puede solicitar: Con o sin transmisin automtica Con o sin aire acondicionado Con o sin cierre centralizado de puertas Con o sin alza vidrios elctricos Con una de tres opciones posibles en cuanto a un sistema de sonido En uno de cuatro colores exteriores Si el espacio muestral est formado por el conjunto de todos los tipos posibles de vehculos cul es el nmero de resultados en el espacio muestral? 5.7.- PRINCIPIO FUNDAMENTAL DEL CONTEO Definicin: Si A1 , A2,.........,An son n acciones distintas que se pueden realizar de k1 , k2 ,................,kn maneras respectivamente, el total de maneras como se pueden efectuar todas las acciones en sucesin, est dado por: k1 * k2 * .........................................*kn 5.8.- EVENTOS MUTUAMENTE EXCLUYENTES Definicin Dos eventos E1 y E2 son M.E si E1 E2 =
Resumen de operaciones conjuntistas: a) b) c) d) e) f) g) ( E` )` = E (A B) C = (A C) ( B C) (A B) C = (A C) ( B C) (A B)` = A` B` (A B)` = A` B` A B = B A A B = B A
118
5.9.- INTERPRETACION DE LA PROBABILIDAD * Como una idea intuitiva, cuantifica la posibilidad de que se presente un resultado. La probabilidad de un resultado puede interpretarse como la probabilidad Subjetiva grado de creencia de que ocurra el resultado. o
Basada en el modelo conceptual de la repeticin de la repeticin del exp. Aleatorio. La probabilidad del resultado se interpreta como el valor lmite de la proporcin de veces que el resultado aparece en n repeticiones del exp. Aleatorio. Como frecuencia relativa: nmero de casos favorables dividido por el nmero de casos posibles.
Cada vez que un espacio muestral est formado por N posibles resultados, todos Igualmente probables, la probabilidad de cada uno de ellos ser de 1 / N
5.10.- PROBABILIDAD DE UN SUCESO Definicin Para un espacio muestral discreto, la probabilidad de un evento E, denotada como P(E),es igual a la suma de las probabilidades de los resultados en E Ejemplo: La tabla siguiente muestra la distribucin del nmero de defectos en ctodos de cobre producidas en una empresa minera de la Regin, que son colectadas para someterlos a un proceso de muestreo y tener una idea de la distribucin del nmero de defectos de presentacin, por unidad.
N de defectos 0 1 2 3 4 ms TOTAL
Cantidad 1 500 50 20 10 5 1 585
Proporcin 0,9464 0,0315 0,0126 0,0063 0,0032 1,0000
119
a). Cul es la probabilidad de qu un ctodo no contenga defectos?
P(X=0)=
1500 1585 = 0,9064
b). Cul es la probabilidad de que un ctodo tenga 1 o 3 defectos? P (X = 1 ) + P ( X = 3 ) =
50 10 + = 0,0315 + 0,0063 = 0,0378 1585 1585
c).-Cul es la probabilidad de que un ctodo tenga entre 1 y 3 defectos?
P (1 x 3) = P( x = 1) + P ( x = 2 ) + P( x = 3) P (1 x 3) = 50 20 10 + + 1585 1585 1585
P (1 x 3) = 0,0315 + 0,0126 + 0,0063 P (1 x 3) = 0,0504

5.11.- AXIOMAS DE PROBABILIDAD La probabilidad es un nmero que se asigna a cada suceso o evento, asociado a un espacio muestral de un exp. Aleatorio, y que satisface las siguientes propiedades: Si es el espacio muestral del exp. Aleatorio y E es cualquier evento asociado a dicho espacio, entonces:
(1) P() = 1 (2) 0 P(E) 1 (3) Para dos sucesos o eventos E1 y E2 con E1 E2 = P(E1 E2) = P(E1) + P(E2)
5.12.- REGLAS DE ADICION DE PROBABILIDADES 1. - P(AB) = P(A) + P(B) P(AB) Ejemplo: La tabla siguiente presenta la historia del control de calidad de 940 obleas de un proceso de fabricacin de semiconductores, donde se registraron los resultados de la medicin de dos variables: Contaminacin alta y ubicacin en el centro del instrumento de deposicin electrnica.
120
Ubicacin en el Centro del Instrumento Contaminacin Alta NO SI TOTAL NO 514 112 626 SI 68 246 314 TOTAL 582 358 940
Usando diagramas de Venn ,represente y calcule las siguientes probabilidades: P(A B) ; P(A` B) ; P(A B)` ; P(A B`) ; P(A B)` Ejemplo:A partir de la tabla siguiente , que muestra la clasificacin de obleas por contaminacin y posicin N de particulas Contaminantes 0 1 2 3 4 5 ms TOTAL Centro 0,30 0,15 0,10 0,06 0,04 0,07 0,72 En la orilla 0,10 0,05 0,05 0,04 0,01 0,03 0,28 Totales 0,40 0,20 0,15 0,10 0,05 0,10 1,00
Determine Cul es la probabilidad de que al seleccionar al azar una oblea de este lote, sta haya estado en el centro del instrumento de deposicin? Cul es la probabilidad de que una oblea que contiene cuatro o ms partculas se haya encontrado en la orilla del instrumento de deposicin? Cul es la probabilidad de que una oblea se haya encontrado en la orilla de la herramienta o que contenga cuatro o ms partculas? Cul es la probabilidad de que una oblea contenga menos de dos partculas o de que se haya encontrado en la orilla y contenga ms de cuatro partculas?
Si A y B son eventos mutuamente excluyentes, entonces P(A B) = P(A) + P(B)
121
Si A , B y C son tres eventos cualesquiera asociados a un espacio muestral, entonces P (A B C) = P(A) + P(B) + P(C) P(A B) - P(AC) P(BC) + P(A B C)
En general se dice que una coleccin de eventos E1, E2, ........, En es mutuamente excluyente, si ninguno de ellos se traslapa o intersecta con otro. Ei Ej = i# j
Para una coleccin de eventos mutuamente excluyentes, P(E1 E2 ........... Ek) = P(E1 ) + P(E2 ) + .................+ P(Ek )
5.13.- PROBABILIDAD CONDICIONAL:
P( A / B).
La notacin anterior se lee como la probabilidad condicional de A dado B, y se interpreta como la probabilidad de que ocurre el suceso A, dado que ocurre el suceso B. Definicin: P( A / B) = P (A B) P(B)
Ejemplo: Los resultados de 266 muestras de aire se clasifican de acuerdo con la presencia de dos molculas raras diferentes. Molcula 1 presente SI Molcula 2 presente NO SI TOTAL 24 12 36 212 18 230 236 30 266 NO TOTAL
P(molcula 2 presente / molcula 1 presente)=P(B / A) =P(A B) / P(A) P(A B)= 12/266 ; P(A)=36/266 Ntese que, en este ejemplo, las cuatro siguientes probabilidades son diferentes: P(A) = 36/266 ; P(B) = 30/266 ; P(A/B)= 12/30 ; P(B/A) = 12/36
122
El problema anterior presentado en un diagrama de rbol Molcula 1 presente no Molcula 2 presente si
no
si
no
si
5.14.- REGLAS DE MULTIPLICACIN La definicin de probabilidad condicional dada anteriormente puede re-escribirse de modo tal que proporcione una expresin general para la probabilidad de la interseccin de dos eventos. P(AB) = P(A/B)x P(B) = P(B/A) x P(A) = P(BA) La regla de multiplicacin es til para determinar la probabilidad de un evento, que depende de otros.
BA
BA`
A`
Entonces el Conjunto B= (A B) (A`B) P(B) = P[(A B) (A`B)] = P(A B) + P( A`B) = P(B/A)*P(A) + P(B/A`)*P(A`) Ejemplo: Sea F el evento donde el producto falla. Sea A el evento donde el circuito est expuesto a altos niveles de contaminacin. P(F/A) = 0.1 ; P(F/A`) = 0.005 ; P(A) = 0.2 y por tanto P(A`) = 0.8 P(F) = 0.1* 0.2 + 0.005* 0.8 = 0.024 El resultado anterior puede interpretarse como el promedio ponderado de las dos probabilidades de falla.
123
515.- REGLA DE PROBABILIDAD TOTAL, PARA VARIOS EVENTOS. Supngase que E1,E2, ...........Ek, son k conjuntos mutuamente excluyentes y colectivamente exhaustivos. Entonces P(B) = P(BE1) + P(BE2) + P(BE3) + ...................+ P(BE k) P(B) = P(B/E1)*P(E1) + P(B/E2)*P(E2) + .................... + P(B/E k)*P(E k)
E1
B
E2 E2
E3 E3
E4
Entonces el Conjunto "B" se puede expresar como B=(BE1) + (BE2) + (BE3) + (BE4) P(B) = P(BE1) + P(BE2) + P(BE3) + P(BE4) EJEMPLO: Supngase que 0.1 es la probabilidad de que un circuito integrado expuesto a Altos Niveles de contaminacin durante el proceso de manufactura sea la causa de falla del producto; que 0.01 es la probabilidad de que falle cuando es expuesto a niveles de contaminacin media; 0.001 es la probabilidad de falla cuando la contaminacin es baja. En una corrida o tanda de produccin particular, el 20%,30% y 50% estuvieron expuestos a niveles altos, medios y bajos de contaminacin, respectivamente Contaminacin alta media baja
0.2 P(F/alta) 0.1 0.02 P(F`/alta) 0.9 0.18
0.3 P(F/media) 0.01 0.003 P(F`/media) 0.99 0.297 P(F/baja) 0.001 0.0005
0.5 P(F`/baja) 0.999 0.4995
P(F) = P(F/E1)*P(E1) + P(F/E2)*P(E2) + P(F/E3)*P(E3) = 0.0235
124
5.16.- INDEPENDENCIA Definicin Se dice que dos eventos son A, B son independientes si y slo si Cualquiera de las siguientes proposiciones es verdadera. (1) P(A/B) = P(A) (2) P(B/A) = P(B) (3) P(AB) = P(A)*P(B)
El punto (3) de la definicin anterior nos indica que dos sucesos A , B son independientes cuando la probabilidad conjunta es igual al producto de las probabilidades marginales. La definicin anterior puede ser generalizada de la siguiente forma:
Los eventos E1, E2,.......... En son independientes si y slo si, para cualesquier Subconjunto E i1, E i2,.......... E ik , P(E i1 E i2,.......... E ik ) = P(E i1 ) * P(E i2 ) * ............* P(E ik )
Ejemplo: El circuito siguiente trabaja slo si existe una trayectoria de dispositivos en funcionamiento, de izquierda a derecha. La probabilidad de que cada dispositivo funcione aparece en la figura adjunta. Supngase que los dispositivos fallan de manera independiente .Cul es la probabilidad de que el circuito trabaje?
0.9 0.95 0.9 0.95 0.9

Con el empleo de la hiptesis de independencia, se tiene que: (1 0.13) x (1 0.052) x (0.99) = 0.987
0.99
125
5.17.- TEOREMA DE BAYES En la definicin de probabilidad condicional se tiene que: P(AB) = P(A/B)*P(B) = P(BA) = P(B/A)*P(A) Si slo consideramos los trminos segundo y ltimo de la expresin anterior, entonces
P(A/B) = P(B/A)*P(A) / P(B)
Este es un resultado til pues permite determinar P(A / B) en trminos de P(B / A). TEOREMA DE BAYES:
Si E1 , E2 ,..............E k son K eventos exhaustivos y mutuamente excluyentes, y B es un evento cualesquiera , entonces: P(B/E1)*P(E1) P(E1/B) = -----------------------------------------------------------------P(B/E1)*P(E1) +.....................+ P(B/E k)*P(E k)
Ejercicio de Aplicacin
1. En un depsito hay 3000 cajas de lpices de las marcas A, B, C, D, E. De ellas hay 500 cajas de lpices deterioradas. Las cajas se distinguen de la manera siguiente:
TOTAL DE CAJAS DEFECTUOSAS
MARCA
TOTAL DE CAJAS
A B C D E Total
200 300 1000 800 700 3000
50 40 300 80 30 500
126
Se elige en forma aleatoria una caja y se le encuentra defectuosa. Determinar la probabilidad de que la caja defectuosa sea de la marca A.
Desarrollo
A1 A1 P = B P( A1)P B + P( A2 )P B + P( A3 )P B + P( A4 )P B + P( A5 )P B A1 A2 A3 A4 A5
P( A1)P
200 50 x A1 3000 200 P = B 200 x 50 + 300 x 40 + 1000 x 300 + 800 x 80 + 700 x 30 3000 200 3000 300 3000 1000 3000 800 3000 700
50 A1 300 = 50 = 0,1 P = 500 500 B 3000
Rpta. La probabilidad de que la caja defectuosa sea de la marca A es 0,1. Ejercicio a Desarrollar
Los clientes se encargan de evaluar los diseos preliminares de varios productos. En el pasado, el 95% de los productos con mayor xito en el mercado recibieron buenas evaluaciones, el 60% de los productos con xito moderado recibieron buenas evaluaciones, y el 10% de productos de escaso xito recibieron buenas evaluaciones. Adems, el 40% de los productos han tenido mucho xito, el 35% un xito moderado, y el 25 % una baja aceptacin. a).- Cul es la probabilidad de que un producto obtenga una buena evaluacin? b).- Si un nuevo diseo obtiene una buena evaluacin,Cul es la probabilidad de que se convierta en un producto de gran xito? c).- Si un producto no tiene una buena evaluacin, cul es la probabilidad de que se convierta en un producto de gran xito?
127
VI.- VARIABLES ALEATORIAS En varios de los ejemplos de experimentos aleatorios considerados hasta el momento, el espacio muestral slo es una descripcin de los posibles resultados. En algunos casos las descripciones de los resultados son suficientes, pero en otros es til asociar un nmero en cada resultado del espacio muestral. Ya que el resultado de un experimento no se conoce con anticipacin, sucede lo mismo con el valor de la variable. Definicin Una variable aleatoria es una funcin que asigna un nmero real a cada resultado en el espacio muestral de un experimento aleatorio
Las variables aleatorias por lo general se denotan con una minscula el valor posible, x k
letra mayscula
"X"
con letra
El conjunto de todos los valores posible de la variable aleatoria X, recibe el nombre de Rango de X o Recorrido de X ; X ( ) Las variables aleatorias las podemos clasificar en dos grandes tipos: Discretas y Continuas 6.1.-- Variables Aleatorias DISCRETAS: Cuando realizan un conteo en el espacio muestral. Sus valores numricos son los nmeros enteros. Ejemplos: 1.- Nmero de naranjas fuera de calibre en un cajn de 100 unidades 2.- Nmero de rboles infectados en una plantacin 3.- Se evala un proceso para mejorar dos cualidades en una especie: Coloracin y reduccin del tamao del cuesco. 4.- Nmero de defectos por milln (dpm) 5.- Cantidad de ndulos en un ctodo de cobre, obtenido en un proceso electroltico. Las variables aleatorias discretas pueden tener Rango Finito o Infinito Contable
128
6.1.1- Distribuciones y Funciones de Probabilidad a partir de una tabla descriptiva A menudo, el inters recae en la probabilidad de que una variable aleatoria tome un valor particular: Coloracin Reduccin Tamao Probabilidad aprobado aprobado inaceptable inaceptable aprobado inaceptable aprobado inaceptable 0,64 0,16 0,16 0, 04 Valor de la Variable x 2 1 1 0
Definicin El evento que est formado por todos los resultados para los que X = k se denota como: { X = k } , y la probabilidad de este evento como P (X = k )
La distribucin de probabilidad o distribucin de una variable aleatoria X es una descripcin del conjunto de valores posibles de X (Rango de X), junto con la probabilidad asociada con cada uno de estos valores. A menudo la distribucin de probabilidad de una variable aleatoria es el resumen ms til de un experimento aleatorio. La distribucin de probabilidad de una v. a. puede darse de varias maneras. Por ejemplo como una tabla descriptiva, a travs de una frmula, etc. Definicin
La funcin fx (x) = P(X = x) que va de l conjunto de los valores posibles de la variable aleatoria discreta X al intervalo [ 0 , 1 ] recibe el nombre de funcin de probabilidad. Para una variable aleatoria X , fx (x) satisface las siguientes propiedades 1.- fx (x) = P(X = x) 2.- fx (x) 0 3.- fx (x) = 1 para todo valor de x
129
Ejemplo: Verifique que fx (x) = [ 2! / (x! (2-x)!)] (0,8 Definicin: La funcin de distribucin acumulada denotada por Fx (x) , es de una variable aleatoria discreta X,
x
) ( 0,2 2 - x )
x = 0, 1, 2 es funcin de cuanta
Fx (x) = P(X x) = f (xi )

xi x Para una variable aleatoria discreta X , Fx (x) satisface las siguientes propiedades
1.- Fx (x) = P(X x) = f (x i )

x i x
2.- 0 Fx (x) 1 3.- Si x y , entonces Fx (x) Fy (y )
Ejemplo: La produccin diaria es envasada en lotes que contienen 1000 unidades cada uno. Cada uno de ellos debe contener alrededor de 50 unidades que no cumplen con los requerimientos del cliente. Del lote se escogen tres unidades al azar, sin reemplazo. Sea la variable aleatoria "X, el nmero de partes de la muestra que no cumplen con los requerimientos. a).- Cul es la funcin de probabilidad de X? P(X=0) = (950/1000)*(949/999)*(948/998) = 0,8572 P(X=1) = 3 (950/1000)*(949/999)*(50/998) = 0,1356 P(X=2) = 3 (950/1000)*(50/999)*(49/998) = 0,0070 P(X=3) = (50/100)*(49/999)*(48/998) Valor de la Variable X 0 1 2 3 fi 0,8572 0,1356 0,0070 0,0001 Fi 0,8572 0,9928 0,9998 0,9999 = 0,0001
130
6.1.2.- Valor esperado de una variable aleatoria discreta Definicin
La media o valor esperado de una variable aleatoria discreta X, denotada por x o E(X), es x = E(X) =
f ( xi )
Esta es una medida de tendencia central. Ejemplo: Calcule e interprete el valor esperado para la variable aleatoria anterior 6.1.3.- Varianza de una Variable Aleatoria Definicin La varianza de una variable aleatoria X , denotada por
2 x = E(X - x)2 =
2 x o Var(X) es
(x
x)2 f (xi)
Esta es una medida de variabilidad o dispersin 6.1.4.- Desviacin estndar de una Variable Aleatoria Definicin La desviacin estndar de una variable aleatoria X, denotada por x , es
2 La raz cuadrada de la varianza x
La desviacin estndar cuando es dividida por la esperanza matemtica o promedio aritmtico, genera una estadstica de resumen denominada coeficiente de variacin , que sirve para comparar el grado de homogeneidad entre diversas variables aleatorias. Mientras mayor es el valor de este coeficiente, ms heterognea es la variable. Ejemplo : Calcule la Desviacin Estndar y el Coeficiente de Variacin del ejemplo anterior. Observacin : Debemos destacar que a partir una tabla de distribucin de probabilidades de carcter descriptivo , como las que hemos venido analizando hasta ahora , se obtienen todas las estadsticas de resumen que se estudian en la denominada Estadstica Descriptiva.
131
Ejemplo de Aplicacin Las muestras de cierta materia prima se clasifican de acuerdo con su contenido de humedad (Y) e impurezas (X), redondeado ste al porcentaje ms cercano. Contenido de humedad 3% 1% Impurezas 2% 57 4 a) Cul de las dos variables es ms homognea? x = E(X) =
2 x
4% 14
f ( xi ) = E(Impurezas) = 1
19 61 + 2 = 1.7625 80 80
(x
2 x) 2 f (xi) = (1 1.7625)
19 61 + (2 1.7625) 2 = 0.1811 80 80
0,1811 100% = 24.14 % 1.7625
Entonces el Coeficiente de Variacin para la variable impurezas es de
Utilizando el mismo procedimiento para la variable Contenido de humedad, obtendr: Y = E(Y) =
y
i
f ( yi ) = E(Humedad) = 3
18 62 + 4 = 3.225 80 80
Y2
(y
x) 2 f (yi) = (3 3.225) 2
62 18 = 0,1744 + (4 3.225) 2 80 80
un valor promedio de 3.225 Variacin
y una desviacin estndar de 0.4176. Por lo tanto Coeficiente
de
para sta variable es de
0,1744 100% = 12.94 %. 3.225

Contenido
Comparando los Coeficientes de Variacin de ambas variables, concluimos que el de humedad es la variable ms homognea
132
Ejercicio de Aplicacin Las muestras que tienen un 4% de Humedad necesitan un calentamiento adicional durante su procesamiento, y las que tienen niveles de impureza de 2% requieren de un filtrado adicional. La tabla siguiente contiene los costos, adicionales asociados con estas operaciones extras. Contenido de humedad 3% 1% Impurezas 2% $ 70 $ 100 a) Determine el promedio y la desviacin estndar 6.2.- Variables Aleatorias CONTINUAS: 6.2.1.- Definicin $0 4% $ 10
Se dice que X es una variable aleatoria continua si existe una funcin f, llamada funcin de densidad de probabilidad (fdp) de X, que satisface las siguientes condiciones: 1.- fx (x) 0 para todo x
+
2. -
3.- Para cualquier a, b tal que < a < b < + , tenemos
f ( x) = 1
P(a X b ) = f ( x)dx
a b
133
6.2.2.- Definicin
La funcin de distribucin acumulada (fda) de una variable aleatoria continua X, denotada por Fx (x) , satisface las siguientes propiedades 1.- Fx (x) = P(X x) =
f ( x)dx
Fx (x) Fy (y )
2.- 0 Fx (x) 1 3.- Si x y , entonces
Ejercicios: 1.- La variable continua X tiene la f.d.p satisface -1 < b < 0, calcular P(X > b / X < b/2). f(x) = 3X2 cuando -1 x 0. Si b es un nmero que
2.- Se supone que el dimetro de un cable elctrico, es decir X, es una variable aleatoria continua con fdp f(x) = 6 x (1- x) cuando 0 x 1. a) Verifique que la anterior es una fdp y dibujarla. b) Obtener una expresin para la fda de X y dibujarla c) Determine un nmero b tal que P(X< b) = 2P(X>b) d) Calcular P ( X
1 1 2 / <X ) 2 3 3
6.2.3.- Valor esperado de una variable aleatoria continua Definicin
La media o valor esperado de una variable aleatoria continua X, denotada por

+
o E(X), es
= E(X) =
xf ( x)dx
Esta es una medida de tendencia central.
134
6.2.4.- Varianza de una Variable Aleatoria Continua Definicin La varianza de una variable aleatoria continua X, denotada por
2 x = E(X - x)2 = E(X2) [E(X)]2
2 x o Var(X) es
Esta es una medida de variabilidad o dispersin 6.1.4.- Desviacin estndar de una Variable Aleatoria Continua Definicin La desviacin estndar de una variable aleatoria X, denotada por x , es
2 La raz cuadrada de la varianza x
Ejercitacin: De los dos ejercicios anteriores, calcule el valor esperado, la varianza y el coeficiente de variacin
135
VI.- MODELOS DE PROBABILIDAD Las variables aleatorias generan o inducen modelos de probabilidad. Dado que existen dos tipos de variables aleatorias: Discretas y Continuas, tendremos entonces Modelos de Probabilidad Discretos y Modelos de Probabilidad Continuos. 7.1.- Modelos Tericos de Funciones de Probabilidad de variables aleatorias discretas Es posible modelizar los resultados de muchos sistemas fsicos con experimentos aleatorios y variables aleatorias idnticos o similares. Puede analizarse la distribucin de las variables aleatorias que aparecen en cada uno de estos sistemas comunes, y es factible utilizar los resultados del anlisis en aplicaciones y ejemplos diferentes. En este punto analizaremos varios experimentos aleatorios y variables aleatorias discretas que aparecen con frecuencia en diversas aplicaciones. Se omitir el estudio del espacio muestral del experimento aleatorio, y se describir directamente la distribucin de una variable aleatoria en particular. 7.1.1.- Distribucin Uniforme Discreta Definicin: Una variable aleatoria X es una variable aleatoria discreta Uniforme si cada uno de los "n" valores que estn en el rango De sta , x1, x2 , ............x n tienen la misma probabilidad . Entonces: f X (x i ) = 1/n Propiedades: Supngase que X es una v.a discreta uniforme sobre los enteros consecutivos a, a+1 , a+2 , , ............, b con a b . La media o promedio de X es x = E ( X) = ( b + a ) / 2 La desviacin estndar de X es x =
(b a + 1) 2 1 12
Si todos los valores del rango de la variable aleatoria se multiplican por una constante "k" (sin cambiar ninguna de las probabilidades) , entonces la media y la desviacin estndar de X quedan multiplicadas por la misma constante. Ejemplo: Se mide el espesor de la cscara ( recubrimiento) de un fruto y se toman varias mediciones , en dcimas de mm. Supngase que las mediciones estn distribuidas de manera uniforme, con valores 1.5 , 1.6 , 1.7, 1.8, 1.9 . Para este proceso, calcule la media y la desviacin estndar del espesor de la cscara.
136
Desarrollo: Los datos originales los multiplicaremos por "10" y haremos uso de la propiedad descrita en un prrafo anterior. Es decir : 15 , 16 , 17 , 18 , 19 El promedio de los nuevos datos es igual a 17 . El promedio de los datos originales es 1,7. La desviacin estndar de los nuevos datos es x =
(19 15 + 1) 2 1 =2 12
La desviacin estndar de los datos originales es igual a 0,2 Para hacer clculos de probabilidad, grficos, etc. relacionados con esta funcin de distribucin, utilizando Satagraphics , debe de realizar el siguiente procedimiento: Posicionar en cursor en Descripcin Tendr la siguiente pantalla Fig. 75 Distribuciones Distribuciones de Probabilidad
Fig.- 76
137
De esta ventana seleccione " Uniforme Discreta" , y luego active aceptar .Desde la pantalla en que lo situ la aceptacin, posicionando el cursor del mouse en la ventana " Opciones Tabulares " podr , proceder a llenar los campos solicitados en la siguiente ventana Fig. 77
1.- Resumen del Anlisis: Permite definir la funcin a utilizar y agregar otras. Para ello vaya opciones de ventana.
a"
2.- Distribucin Acumulada: Permite calcular probabilidades para valores de variable aleatoria especficos. Para ello vaya primero a opciones de anlisis " donde debe llenar los campos que solicitan los parmetros de la distribucin. Seguidamente vaya a opciones de ventana, para entregar los valores de la variable aleatoria para los cuales se desea realizar el clculo de probabilidades. 3.- Inversa de la Funcin de Distribucin Acumulada : Permite calcular valores de la variable aleatoria , dada una probabilidad . Para ello vaya a " opciones de ventana 7.1.2.- Distribucin Binomial La base de esta distribucin son los ensayos Bernoulli , que es un experimento aleatorio que tiene slo dos resultados posibles , denotados por "xito" (p ) y "fracaso" (q) . Definicin Un . experimento binomial es un experimento aleatorio que consiste de "n" ensayos tipo Bernoulli repetidos, que posee las siguientes propiedades: 1.- Los ensayos son independientes 2.- Cada ensayo tiene slo dos resultados posibles , denominados "xito" (p) y " Fracaso" (q = 1 - p ) 3.- La probabilidad de xito en cada ensayo, permanece constante
138
La variable aleatoria X , es igual al nmero de ensayos donde el resultado es un xito , tiene una distribucin binomial con parmetros p (valor entre cero y uno) y n = 1 , 2 , 3 , ........... La funcin de probabilidad de X es
X n! n-x fX (x ; p , n ) = x!(n x)! p (1- p)

La funcin de probabilidad acumulada es :
x = 0 ,1 , 2 , .n
P(X k ) =
j !(n j )! p
j =0
j =k
n!
(1 p ) n j
Ejercicio: La probabilidad de que cada muestra de agua esta contaminada con una cierta "sustancia rara" es de un 10%. Suponga que las muestras son independientes con respecto a la presencia de dicha sustancia. Se toman 20 muestras en oportunidades diferentes. a) Calcule la probabilidad de exactamente dos muestras estn contaminadas. P(X = 2) =
20! 2 20 - 2 0.1 (1- 0.1) 2 ! ( 20 2 )!
= 190 0.01 0.150095 = 0.2852
b) Calcule la probabilidad de que hayan entre 2 y 5 muestras inclusive , contaminadas P(X = 2 ) + P ( X = 3 ) + P ( X = 3 ) = P( 2 X 5 ) = 0.2852 + 0.1901 + 0.0898 + 0.0319 = 0.597 c) Calcule la probabilidad de que hayan tres o ms muestras contaminadas. P ( X 3 ) = 1 - P( X 2 ) = 1 - [ P ( X = 0 ) + P ( X = 1 ) + P ( X = 2 ) ] = El valor esperado de una Variable Aleatoria Binomial es E(X) = np. La Varianza de una Variable Aleatoria Binomial es V(X) = 2 =npq El procedimiento usando Statgraphics es a travs de las pantallas Fig. 75, Fig. 76 (seleccione la Opcin Binomial ). Luego tendr una pantallas como la Fig. 77, Se define esta distribucin de probabilidad , obteniendo la siguiente pantalla , ingresando por "Distribucin acumulada"., luego " opciones de anlisis ( permite caracterizar la distribucin definiendo sus parmetros) y finalmente opciones de ventana " (permite ingresar los valores de variable aleatoria para los cuales se calcula la probabilidad de ocurrir)
j!(20 j )! 0.1 (1 0.1)

j j =2
j =5
20!
20 j
139
Fig. 78
Fig. 79
En la ventana "Probabilidad de Evento" debe ingresar el valor de la probabilidad de xito "p" en cada ensayo. En la ventana " Ensayos " deber ingresar el nmero " n " de ensayos o pruebas a realizar. 7.1.3.- Distribucin Hipergeomtrica. La Distribucin Binomial se basa en el supuesto de que el tamao N de la Poblacin es Infinito y de que la muestra aleatoria se toma con reemplazo , de manera de que las observaciones posibles sean independientes entre s. La probabilidad de xito en cada ensayo o prueba permanece as invariable para toda observacin sucesiva. Pero cuando la poblacin es de tamao finito conocido , "N" , y la muestra aleatoria se toma sin reemplazo, la probabilidad de xito , "p", cambiar para cada nueva observacin. En tales circunstancias , se tendr una distribucin de probabilidad que se llama Distribucin Hipergeomtrica.
140
Si se sacan "n" elementos sin reemplazo de una Poblacin o Lote que contiene N1 elementos de una clase y N2 elementos de otra clase, y estas dos clases son mutuamente excluyentes y colectivamente exhaustivas , entonces:
P( X = k ; n; N1 ; N 2 ) =
(C ) (C ) (C )
N1 k N2 nk N n
N 1 + N 2 = N , tamao de la poblacin
Representa la probabilidad de tener exactamente k objetos en la muestra de tamao n , que provienen de la clase N1. Las expresiones entre los parntesis representan las combinaciones posibles de obtener, desde el punto de vista del anlisis combinatorio. El valor esperado de una Variable Aleatoria Hipergeomtrica es: La Varianza de una Variable Aleatoria Hipergeomtrica es E(X) = np V(x) = 2 = npq
( N n) N
Ejemplo: Un embarque de sustancias qumicas llega en 20 depsitos, de los cuales hay cuatro que no cumplen con normativas vigentes. Si se eligen tres depsitos para hacer una inspeccin de la pureza del producto, a).- Cul es la probabilidad de que la muestra contenga un depsito que no cumple la normativa?
16 C14C2 C320
P (X = 1) = P ( X = 1; 3; 16; 4) =
= 0.4211
b).- Cul es la probabilidad de que al menos un depsito de los que no cumplen la normativa est en la muestra? P( X 1 ) = 1 - P ( X = 0 ) = 1 - 0.4912 = 0.5088 El procedimiento usando Statgraphics es a travs de las pantallas Fig. 75, Fig. 76 (seleccione la Opcin Hipergeomtrica). Luego tendr pantallas como las Fig. 77 , Fig. 78 y 79. Se define esta distribucin de probabilidad , obteniendo la siguiente pantalla , ingresando por "Distribucin Acumulada"., luego " opciones de anlisis " y finalmente opciones de ventana
141
Fig.- 80
En la ventana "Probabilidad de Evento" debe ingresar el valor de la probabilidad de xito "p" en cada ensayo. En la ventana " Ensayos " deber ingresar el nmero " n " de ensayos o pruebas a realizar En la ventana "Tamao de la Poblacin ", debe ingresar el tamao de la poblacin " N = N 1 + N2 7.1.4.- Distribucin de Poisson Este modelo es aplicable a muchos procesos en los que hay un "recuento" por unidad de tiempo, espacio o rea , volumen . Por ejemplo el nmero de defectos por unidad observada ; el nmero de vehculos que pasan por un lugar en una cierta unidad de tiempo; el nmero de partes por milln en una muestra de As en una muestra de agua; el nmero promedio de personas que un cajero atiende cada 15 minutos; el nmero de partes defectuosas por lote embarcado desde la fbrica para ensamblaje; El nmero de defectos de aislamiento del alambre elctrico por cada diez metros. Todos los procesos anteriores se caracterizan por el nmero de xitos esperados por unidad de tiempo , espacio , volumen, etc. Su funcin de cuanta es
P(X = k) =
k e
k!
Donde es el parmetro que expresa el nmero esperado ( o promedio) por unidad de tiempo , espacio , etc. " e " es un constante , cuyo valor aproximado es de 2,7183
La expresin anterior permite calcular exactamente k xitos.
" la
probabilidad de que en la unidad analizada hayan
142
Ejemplo : La contaminacin es un problema en la fabricacin de discos de almacenamiento ptico . El nmero de partculas contaminantes que aparecen en un disco ptico tiene una distribucin Poisson , y el nmero promedio de partculas por centmetro cuadrado de superficie del medio de almacenamiento es 0,1. El rea de un disco bajo estudio es de 100 centmetros cuadrados. a).- Cul es la probabilidad de encontrar 12 partculas en el rea del disco? El nmero esperado de partculas en un rea de 100 cm2 es igual a 100*0,1 = 10 partculas / cm2 Este es el valor de en la distribucin de Poisson. Entonces:
P ( X = 12; = 10) =
1012 e 10 = 0,095 12!
b).- Cul es la probabilidad de encontrar entre 7 y 12 partculas en el rea de l disco?

k =12
P (7 X 12) =
10 k e 10 = P(X=7) + P(X=8)+ P(X=9)+ P(X=10)+P(X=11)+P(X=12)= k! k =7
0,0901 + 0,1126 + 0,1251 + 0,1251 + 0,1137 + 0,0948 = 0,6614 c).- Cul es la probabilidad de encontrar 3 o ms partculas en el rea del disco ? P(X 3 ) = 1 - P( X 2) = 1 - [ P(X=0) + P(X=1) + P(X=2) ] = 1 - [0,000045 + 0,000454 + 0,002270] = 0,99723 El valor esperado de una Variable Aleatoria Poisson es E(X) = La Varianza de una Variable Aleatoria Poisson es = V(x)= 2 = En algunos casos es posible calcular probabilidades de una variable aleatoria binomial , a travs de la Distribucin de Poisson. Ello ocurre cuando el tamao de la muestra "n" es grande y el valor de La probabilidad de xito en cada ensayo "p" es pequeo . Entonces se calcula = np . La aproximacin es aconsejable cuando = np 5 . El procedimiento usando Statgraphics es a travs de las pantallas Fig. 75 , Fig. 76 (seleccione la Opcin Poisson). Luego tendr pantallas como las Fig. 77 , Fig. 78. Se define esta distribucin de probabilidad , obteniendo la siguiente pantalla , ingresando por "Distribucin Acumulada"., luego " opciones de Anlisis "
143
Fig. 81
En el campo media de la ventana de la figura anterior , debe ingresar el valor de 7.2.- Modelos de Probabilidad de variable aleatoria continua 7.2.1 Distribucin de Probabilidades Normal Existen muchos modelos de probabilidad de variable aleatoria continua. Uno de los modelos es la Distribucin Normal de Probabilidades, que ocupa un lugar destacado en la Inferencia Estadstica. La importancia de la Distribucin Normal se puede resumir en estas consideraciones esenciales: 1. Numerosas variables observadas en la naturaleza se ajustan a este modelo de probabilidad. 2. Se ha encontrado que ciertos componentes , partes y montajes de maquinarias tienen 3. distribucin normal, en cuanto a las medidas de su fiabilidad. 4. La distribucin muestral de muchos estadgrafos muestrales, como el promedio aritmtico por ejemplo, tiene una distribucin aproximadamente normal e independientemente de la configuracin de la distribucin de la poblacin. Esto hace que en determinado momento se prefiera tomar muestras de un tamao relativamente grande, para invocar con ello la normalidad estadstica. 5. La funcin normal es una excelente aproximacin a otras varias distribuciones muestrales. Por ejemplo , la Binomial , Poisson se aproximan a la normal al aumentar "n" Su Funcin de densidad es la expresin:
f ( X = x; ; 2 ) =
1 2 2
( x )2 2 2
La forma grfica de esta distribucin es como la de una campana, por lo que tambin se le conoce con el nombre de Campana de Gauss.
144
Distribucin Normal Estndar

0,4
Promedio; Desv. Est 0,1
Probabilidad
0,3 0,2 0,1 0 -5 -3 -1 1 3 5
La forma grafica de la distribucin depende de sus dos parmetros: El promedio (medida de tendencia central) y la varianza 2 (medida de variabilidad). Existen varias formas graficas segn sean las combinaciones que se tengan entre sus dos parmetros: 1.- Igual promedio, distinta varianza. 2.- Distinto promedio, igual varianza. 3.- Distintos promedios, distintas varianzas. La Distribucin Normal Tpica, representa todas las variables aleatorias normales. Se logra estandarizar cualquier variable realizando la siguiente transformacin, denominado puntaje tpico o estndar. Z=
xi
2 =1. Sus parmetros quedan como E(Z) = = 0 y V(Z) = z Este valor de Z vara aproximadamente entre -5 y +5 , segn se ve en la figura a anterior.
Para el calculo de probabilidades, se utiliza una tabla denominada Distribucin Normal Tpica, que contiene valores de probabilidad acumulada (ver al final del texto de este curso). Ello evita tener que resolver una integral definida para calcular la probabilidad de que la variable aleatoria se encuentre dentro de un cierto intervalo dado.
145
Ejemplo : En una Planta de E.W , se obtienen ctodos de cobre con un peso promedio de 45 Kgs y una desviacin estndar de 1,5 Kgs. Suponiendo que el peso de los ctodos se comporta como una distribucin normal, a) Si se elige un ctodo al azar de una cosecha, cul es la probabilidad de que su peso est entre 44 y 47 Kgs ? P( 44 X 47 ) = P(
44 45 X 45 47 45 ) = P (-0,67 Z 1,33) = 1,5 1,5 1,5
b) Si se elige un ctodo al azar de una cosecha, cul es la probabilidad de que su peso sea inferior a 43 Kgs ?. P( X 43 ) = P(
X 45 43 45 ) = P(Z -1,33 ) = 1,5 1,5
c) Si se elige un ctodo al azar de una cosecha, cul es la probabilidad de que su peso sea superior a los 48 kgs ? P ( X > 48 ) = P(
X 45 48 45 ) = P ( Z 2) = 1 - P(Z 2) = 1,5 1,5
El procedimiento usando Statgraphics es a travs de las pantallas Fig. 75 , Fig. 76(seleccione la Opcin Normal). Luego tendr pantallas como las Fig. 77 , Fig. 78 Se define esta distribucin de probabilidad , obteniendo la siguiente pantalla , ingresando por "Distribucin Acumulada "., luego " Opciones de Anlisis " Fig. 82
En el campo media de la ventana de la figura anterior , debe ingresar el valor del promedio aritmtico de la variable ( X ). Hay espacio para trabajar con cinco distribuciones normales de forma simultnea.
146
El icono Opciones Tabulares permite la opcin de los siguientes clculos estadsticos: Funcin de Distribucin Acumulada: Permite calcular probabilidades para valores de variable aleatoria especficos. Para ello vaya a " opciones de ventana". CDF Inverso (Inversa de la Funcin de Distribucin Acumulada: Permite calcular valores de la variable aleatoria, dada una probabilidad. Para ello vaya a " opciones de ventana. El icono 0pciones Grficas permite la opcin de los siguientes grficos estadsticos:. Funcion de Densidad Funcin de distribucin Acumulada Funcin de Sobrevivencia (Inversa de la CDF) Fig. 83
6.2.1.1.- Aproximacin a la Distribucin Normal de las Distribuciones Binomial y Poisson. Aproximacin de la Distribucin Binomial a la Normal
Si X es una variable aleatoria binomial , entonces Z=
X np np(1 p )
es de manera aproximada, una variable aleatoria normal estndar
147
Ejemplo: En proceso productivo , se sabe que aproximadamente el 5 % de las unidades obtenidas tienen contenidos de Pb , que sobrepasan una normativa internacional. El Cliente decide realizar una inspeccin al azar de 150 unidades del producto. a).- Si el cliente, de acuerdo con el fabricante, tienen establecido por contrato de que en muestras de ese tamao , deben haber a lo ms 8 unidades que sobrepasen la normativa , Cul es la probabilidad de que el embarque sea aceptado ? np = 150 * (0,05) = 7,5 np(1 - p) = 150*(0,05)*(0,95) = 7,125
Dado que se est calculando un valor de probabilidad para una variable discreta , por medio de una funcin continua como es la distribucin normal utilizando la tabla estndar, P( X 8 ) la debemos remplazar por P ( X < 8,5 ) [ A esto se le denomina correccin de la continuidad, en media unidad de medida ] P ( X 8) = P( X < 8,5 ) = (
X 8,5 7,125
8,5 7,5 7,125
) = P(Z 0,37 ) =
b).- Cul es la probabilidad de que el nmero de unidades fuera de especificacin est entre 5 y 10, inclusive ? P( 5 X 10 ) = P (
4,5 7,5 7,125
X 7,5 7,125
10,5 7,5 7,125
) = P ( -1,12 Z 1,12 ) =
c).- De acuerdo con el plan de muestreo , cual es el nmero mximo de unidades que sobrepasan la normativa que debe contener la muestra, para aceptar el embarque con 95 % de probabilidad ? Aproximacin de la Distribucin de Poisson a la Normal
Si X es una variable aleatoria Poisson con E( X ) = y V( X ) = , entonces Z=
es de manera aproximada, una variable aleatoria Normal Estndar
Ejemplo: Suponga que el nmero de partculas de asbesto en una muestra de un centmetro cuadrado de polvo es una variable aleatoria Poisson con promedio = 100. a).- Cul es la probabilidad de que en 10 cm2 de polvo haya ms de 950 partculas de asbesto ? P ( X > 950 ) = P ( Z
950,5 1000 1000
) = P ( Z - 1,57 ) =
148
b).- Cul es la probabilidad de que en 10 cm2 de polvo haya entre 950 y 1100 partculas de asbesto, inclusive ? P ( 949,5 X 1100,5) = c).-Qu cantidad de partculas de asbesto habr en 10 cm2 de polvo , el 90% central de las veces ? 6.2.2.- La distribucin Exponencial : Anteriormente vimos una distribucin que modeliza el comportamiento discreto de fenmenos que ocurren por unidad de tiempo , espacio, rea, etc. , denominada distribucin de Poisson. La distancia ( tiempo ) entre la ocurrencia de estos fenmenos ( tiempo entre fallos) , es una variable aleatoria continua que a menudo es de inters , sobre todo en estudios que dicen relacin con la fiabilidad o confiabilidad de partes o sistemas , y proporciona una valiosa ayuda en la planificacin de la mantencin o de la mantencin preventiva. Definicin : Se dice que una variable aleatoria continua X que toma valores no negativa tiene una distribucin exponencial con parmetro (positivo) si su funcin de densidad de probabilidad est dada por :
e
f ( x) =
si x > 0
0 en cualquier otra parte Por lo tanto:
f ( x )dx
=1
Fig. 83
Distribucin Exponencial
0.1 0.08 0.06 0.04 0.02 0 0 10 20 30 40 50 60 Mean 10
149
Propiedades de la Distribucin Exponencial : 1.- El valor esperado de X o promedio de la variable es igual a 1 E ( X ) = xf ( x )dx =
2.- La varianza de X es V ( X ) = E ( x 2 ) [E ( x )]2 =
1 2
Es por ello , que en trminos prcticos , la de estimacin de estos parmetros se hace a partir de los datos registrados , calculando su promedio aritmtico . Entonces la estimacin de es
1 x
y de aqu tambin podemos estimar la varianza de la distribucin, y de esta forma podemos
realizar clculos de probabilidades. 3.- Carencia de memoria
P ( X > s + t ) e ( s + t ) = e t = P( X > s) e s Expresa la probabilidad de que una componente que lleva funcionando un tiempo s, dure o funcione un tiempo adicional t.
La expresin
P( X > s + t / X > s) =
La propiedad de la carencia de memoria no es sorprendente si se considera el desarrollo de un proceso Poisson., en el cual se supone que el intervalo o unidad puede subdividirse en intervalos independientes ms pequeos (o ampliarse a intervalos mayores). La distribucin exponencial se emplea frecuentemente en estudios de confiabilidad, como modelo para el tiempo transcurrido hasta el fallo de un dispositivo. Por ejemplo, el tiempo de vida media de una ampolleta puede modelarse como una variable aleatoria exponencial, con una media de 1000 hrs (por ejemplo). La propiedad de carencia de memoria de la distribucin exponencial implica que la ampolleta no se desgasta. Esto es, sin importar cuanto tiempo haya funcionando, la probabilidad de que falle dentro de las cincuenta prximas horas , es la misma que la probabilidad de fallar dentro de las primeras cincuenta horas. Sin embargo la probabilidad de que un dispositivo sufra desgaste mecnico debido a su funcionamiento, como un rodamiento o poln de correa transportadora por ejemplo, puede modelarse mejor con una distribucin tal que P ( L < t + t / L > t ) aumente a medida que se incrementa t. Este tipo de situaciones o de comportamientos es reflejado de mejor forma por otra distribucin de variable aleatoria continua, denominada distribucin de Weibull.
x = t + t e x dx
P ( L < t + t / L > t ) =
x =t e t
150
El procedimiento usando Statgraphics es a travs de las pantallas Fig. 75, Fig. 76 (seleccione la Opcin Exponencial). Luego tendr pantallas como las Fig. 77, Fig. 78. ingrese por "Distribucin acumulada". y , luego " opciones de Anlisis
151
VIII.- INFERENCIA ESTADSTICA PARAMETRICA 8.1.- Definiciones Preliminares El campo de la inferencia estadstica est formado por los mtodos utilizados para tomar decisiones o para obtener conclusiones sobre una Poblacin , Lote , Proceso. Estos mtodos utilizan la informacin contenida en una muestra de la Poblacin , Lote, Proceso para obtener conclusiones. La inferencia estadstica la podemos dividir en tres grandes reas: 1).- Estimacin de parmetros 2).- Prueba de hiptesis 3).- Pruebas de bondad del ajuste de un modelo terico, a un conjunto de datos empricos. De lo anterior, podemos desprender de que la calidad de la informacin obtenida, como tambin la acertividad de la decisin tomada, dependen esencialmente de la muestra. (Que es de donde obtenemos los datos). Poblacin, Lote, Proceso
Est formado por la totalidad de las observaciones en las cuales se tiene cierto inters En muchos problemas estadsticos, es necesario utilizar una muestra de observaciones tomadas de la poblacin de inters con objeto de obtener conclusiones acerca de ella Muestra Es un subconjunto de observaciones colectadas bajo rigurosos mtodos de seleccin, que permiten asegurar la representatividad de la muestra, respecto de la Poblacin. Para que las inferencias sean vlidas, la muestra debe ser representativa de la poblacin. Un mecanismo de seleccin que asegura la representatividad es la aleatorizacin. En consecuencia la seleccin de una muestra es un experimento aleatorio , y cada observacin de la muestra es el valor observado de una variable aleatoria . Las observaciones en la poblacin determinan la distribucin de probabilidad de la variable aleatoria. La calidad de las medida(s) o valor(es) obtenidos de las muestras dependen , entre otros factores , de los equipos de medicin ( exactitud , precisin , capacidad, etc.) . Una muestra representativa , evita que se produzca una informacin sesgada.
Las variables aleatorias ( X1 , X2 ,............., Xn) constituyen una muestra aleatoria de tamao "n" si : 1.- Las Xi son variables aleatorias independientes 2.- Todas las Xi tienen la misma distribucin de probabilidad
152
8.2.- Estimacin Estimador, Estadstica. Un Estimador Estadstica es cualquier funcin de las observaciones contenidas u obtenidas a partir de una muestra aleatoria.
Estimacin Puntual Una estimacin puntual de algn parmetro de la poblacin es un valor numrico
obtenido con los datos muestrales
Propiedades de los estimadores: 1.- Insesgado: Un estimador debe arrojar, en promedio, valores muy prximos al verdadero Valor del parmetro. 2.- Mnima Varianza: Si se consideran todos los estimadores insesgados de del parmetro ,el que tiene la menor varianza recibe el nombre de estimador insesgado de varianza Mnima. 3.- Consistentes: A medida de que el tamao de la muestra aumenta, (n estimador tiende a coincidir con el parmetro. N), el
4.- Eficientes: Si se utilizan dos estadgrafos o estimadores del mismo parmetro , aquel cuya distribucin muestral tenga menor error estndar , es un estimador ms eficaz que otro. 5.- Suficiente: Un estimador suficiente del parmetro , es aquel que agota toda la informacin pertinente sobre de que se pueda disponer en la muestra. Por ejemplo , el promedio ( desconocido) de la Poblacin , puede ser estimado a travs del promedio aritmtico de la muestra , X ; tambin puede ser estimado por la Mediana de la muestra, ~ ~ ~ X . Pero X tiene menor varianza que X .( Es decir , X es ms eficiente que X ) Uno de los mejores mtodos para obtener un estimador puntual de un parmetro es el mtodo de Mxima Verosimilitud. Tal como su nombre lo seala, el estimador ser el valor del parmetro que maximiza la funcin de verosimilitud. (No ser expuesto en el presente desarrollo, pero puede ser revisado en Textos de Estadstica Matemtica o de Probabilidades y Estadstica)
153
7.3.- Distribuciones de muestreo La distribucin de probabilidad de un estimador o estadstica recibe el nombre de Distribucin de muestreo
Por ejemplo, la distribucin de probabilidad del promedio aritmtico X , se conoce como distribucin de muestreo (muestral) de la media. La distribucin de muestreo de una estadstica depende de la distribucin de la poblacin, del tamao de muestra y del mtodo utilizado para seleccionar la muestra. Teorema del Lmite Central Si X1 , X2 , X3,..........., Xn es una muestra aleatoria de tamao " n " tomada de una poblacin (finita o infinita ) , con promedio " " y varianza finita " 2 " , si X es la media muestral , entonces la forma lmite de la distribucin del promedio X es :
Z=
2
n
Cuando n
, es la Distribucin Normal Estndar
Error Estndar
El error estndar de un estimador o estadstica es la desviacin estndar de su distribucin de muestreo . Si el error estndar involucra parmetros desconocidos cuyos valores pueden estimarse , la sustitucin de estas estimaciones en el error estndar da como resultado un error estndar estimado
Por ejemplo el promedio aritmtico X , tiene un error estndar de
2
n S2 n
Pero en muchas oportunidades el parmetro 2 debe ser estimado por la varianza muestral , obtenindose entonces un error estndar estimado igual a
El error estndar da alguna idea sobre la precisin de la estimacin
154
8.4.- Prueba de Hiptesis e intervalo de confianza En muchos problemas de Ingeniera, Ciencias Naturales, Ciencias Sociales, Administracin y Negocios , etc . requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de Hiptesis, y el procedimiento de toma de decisin sobre la hiptesis se conoce como Prueba de Hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la Ingeniera , pueden formularse como problemas de prueba de hiptesis . Es conveniente considerar la prueba de hiptesis estadsticas como la etapa de anlisis de datos de un experimento comparativo, en el que el ingeniero est interesado, por ejemplo, en mejorar un rendimiento promedio en un proceso, despus de haber hecho una innovacin en el mismo. La finalidad es probar hiptesis con respecto a los parmetros de las dos situaciones. Una hiptesis estadstica es una proposicin sobre los parmetros de una o ms Poblaciones, Lotes, Procesos, etc.
En la prueba de hiptesis intervienen siempre dos hiptesis denominadas como: H0 : conocida como hiptesis nula o hiptesis de prueba. H1 : denominada hiptesis alternativa La estructura general de una Prueba de Hiptesis, la podemos resumir en el siguiente cuadro H0 : = 0 v/s H1 : f 0 Hiptesis alternativa unilateral derecha H0 : = 0 v/s H1 : < 0 Hiptesis alternativa unilateral izquierda H0 : = 0 v/s H1 : 0 Hiptesis alternativa bilateral
Los procedimientos de pruebas de hiptesis dependen del empleo de la informacin que obtiene al procesar los datos contenidos en una muestra aleatoria de la poblacin de inters. Es por esto que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre , a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Dado que estamos trabajando con informacin muestral para aceptar o rechazar la hiptesis de prueba, es que debemos asumir que podemos cometer alguno de estos dos tipos de errores denominados: Error Tipo I , Error Tipo II
155
El Error Tipo I se define como el rechazo de la Hiptesis nula H0 cuando sta es verdadera. Este error generalmente se designa por y flucta 0 < 0,1. En muchos experimentos industriales se usa = 0,05 , y se denomina nivel de significancia. Este es el tipo de Error con el que usualmente se realiza la prueba de Hiptesis El Error Tipo II, se define como la probabilidad de aceptar la hiptesis nula H0 cuando sta es falsa. Este error generalmente se designa por y flucta entre 0 < 0,1
La Potencia de una prueba estadstica es la probabilidad de rechazar la hiptesis nula H0 , cuando la hiptesis alternativa es verdadera (con probabilidad 1 ). Es en realidad su poder de discriminar correctamente.
Al utilizar una muestra para obtener conclusiones sobre una poblacin existe el riesgo de llegar a una conclusin incorrecta. Cuando se toma una decisin referente a una hiptesis basada en la teora de la probabilidad, sta puede ser: Decisin Correcta :
Se acepta una hiptesis cuando es verdadera. Se rechaza una hiptesis cuando no es verdadera.
Decisin Incorrecta Error Tipo I ( ).- Se rechaza un hiptesis que es verdadera, es decir, se rechaza la Hiptesis Nula (H 0 ) cuando en realidad es cierta. Error Tipo II ( ).- Se acepta una hiptesis que no es verdadera, es decir, no se rechaza la Hiptesis Nula (H 0 ) cuando es falsa y se debiera rechazar. Para mayor claridad observamos el siguiente cuadro: Decisin Condicin H 0 es (V) H 0 es (F) Decisin Correcta 1- Error de Tipo II Error de Tipo I ACEPTAR RECHAZAR
Decisin Correcta 1-
156
De estos dos errores el ms frecuente es , pero el ms difcil de controlar; de ah que el ms usado en la prctica es .
La regin crtica o de rechazo es la medida del resultado del proceso de una muestra es mayor o igual que un valor fijado (Valor Crtico), entonces se rechaza la hiptesis nula (H0); como tambin se rechaza en el caso que la medida sea menor que un valor fijado.
REGIN DE ACEPTACIN
REGIN DE RECHAZO
REGIN DE RECHAZO
REGIN DE ACEPTACIN
El nivel de significacin () es la mxima probabilidad de cometer un error de Tipo I especificado en una prueba de hiptesis. El nivel de significacin debe ser especificado antes de que una prueba sea hecha, de otra manera, el resultado obtenido en la prueba puede influir en la decisin. Los niveles de significacin ms utilizados son: = 0,05 y = 0,01 Al emplear un nivel de significacin del 5% tenemos la confianza del 95% de que hemos tomado una decisin correcta, aunque pudimos estar equivocados en un 5%. El error de Tipo II ( ) se puede determinar solamente respecto a un valor especfico incluido en el rango de la Hiptesis Alternativa (H 1 ).
157
8.4.1.- Etapas bsicas a considerar en la prueba de hiptesis : A continuacin se enunciarn un conjunto secuenciados de procedimientos a tener en consideracin, para prueba de hiptesis en el caso de muchos problemas prcticos. 1.- Del contexto del problema, identificar el parmetro de inters. 2.- Redactar la hiptesis nula, H0. 3.- Redactar una apropiada hiptesis alternativa, H1. 4.- Seleccionar un nivel de significancia , para probar la hiptesis H0. 5.- Establecer y calcular un estadstico de prueba apropiado. 6.- Establecer la Regin de Rechazo para el estadstico de prueba, que est sealada por la hiptesis alternativa (<, >, ). 7.- Calcular todas las cantidades o estimadores a partir de los datos muestrales, para sustituirlas en la expresin del estadstico de prueba, obtener el valor correspondiente. 8.- Decidir si debe o no rechazarse H0 y expresar o redactar esto, en el contexto del problema. 8.4.2.- Aplicaciones de la Distribucin Normal en la Prueba de Hiptesis y la construccin de intervalos de confianza. En forma muy general, podemos decir que la distribucin normal se aplica en temas relacionados con la inferencia estadstica cuando la Variable en estudio tiene un comportamiento que es modelizado por esta distribucin, se conoce el valor del parmetro denominado varianza , o el tamao de la muestra es suficientemente grande , como para invocar que el estadgrafo muestral tiene un comportamiento normal. 8.4.2.1.- Prueba de hiptesis e intervalo de confianza para el promedio H0: = 0 H1 : < 0 H1 : > 0 H1 : 0 Estadstico de Prueba
Zobs =
X 0
2
n
158
Para rechazar H0 a favor de H1, se debe cumplir que el valor del Estadstico de prueba caiga en la zona de rechazo indicada por la hiptesis alternativa.
Intervalo de confianza para
Tamao de la Muestra
X - Z(1 -
/2)
X + Z(1 -
/2
n=
(Z + Z ) 2 2 ( - 0 ) 2
Para prueba unilateral
n=
(Z / 2 + Z ) 2 2 ( - 0 ) 2
Para prueba bilateral
Uso de valores de P en la prueba de Hiptesis Una manera de notificar los resultados de una prueba de hiptesis es establecer que la hiptesis nula fue o no rechazada con un valor especificado de o nivel de significancia. Para evitar dificultades respecto del manejo del valor , en la prctica ha sido adoptado por la totalidad de los softwares de aplicacin estadstica, el enfoque del valor P, que aparece casi siempre con La denominacin de p value . Este valor es el nivel de significancia ms pequeo que conduce al rechazo de la hiptesis nula H0. Para utilizar Statgraphics en la prueba de hiptesis acerca del promedio en la poblacin, cuando usted ha procesado los datos y dispone del promedio y de la desviacin estndar, se utiliza el siguiente procedimiento: 1.- Ponga el cursor en el botn describe de la pantalla principal Contraste de Hiptesis . Tendr el siguiente par de pantalla Fig . 84 y luego seleccione
159
Fig. 85
1.- En la pantalla anterior, en el campo de los parmetros, debe media normal 2.- En la ventana Hiptesis Nula , deber ingresar el valor de Hiptesis a probar 0 3.- En la ventana Media de la muestra deber ingresar el valor del promedio de la muestra 4.- En la ventana Des. Tpica de la muestra , deber ingresar el valor de la desviacin estndar de la muestra. 5.- En la ventana Tamao de la Muestra, deber ingresar el tamao de la muestra Ejemplo: Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un combustible slido. Una de las caractersticas importantes de este producto es la rapidez de combustin. Las especificaciones requieren que la rapidez promedio de combustin sea de a lo menos 50 cm/ seg. Se sabe que la desviacin estndar de esta rapidez es = 2 cm / sg. El experimentador decide especificar una probabilidad para el error tipo I ( ) = 0, 05. Selecciona una muestra aleatoria de tamao 16, y obtiene en la muestra una rapidez promedio muestral de combustin de 51,3 A qu conclusiones debe llegar? Con los datos anteriores, llene la pantalla de la Fig. 85 y obtendr una pantalla como la siguiente:
160
Fig. 86
Colocando el cursor en el sector izquierdo de la figura anterior , y activando el sector derecho del mouse , tendr acceso a Opciones de Anlisis, desde donde podr definir la hiptesis alternativa H 1 y el error tipo I ( ).: Luego aplique 0K y tendr :
El intervalo de confianza para la rapidez promedio de combustin del producto. La decisin acerca de la prueba de hiptesis La curva de potencia de la prueba o test
8.4.2.2.- Prueba de hiptesis e intervalo de confianza para la diferencia entre promedios Supngase que se tienen dos poblaciones de inters. La primera tiene un promedio desconocido 1 y varianza conocida 12 ; mientras que la segunda poblacin tiene un promedio
2 desconocido 2 y varianza conocida 2 . El inters est en probar la hiptesis de que los dos promedios poblaciones son iguales ( en este caso = 0 ) o que su diferencia es igual a un valor > 0.
Debemos suponer que ambas poblaciones tienen un comportamiento normal, y que en caso de que no lo fuesen se aplican las condiciones del Teorema del Lmite Central, enunciado anteriormente. Se toma una muestra aleatoria de tamao n1 de la primera poblacin , y otra muestra aleatoria de tamao n2 de la segunda poblacin. Ambas muestras son independientes entre s. La prueba estadstica est sustentada en el hecho de que la distribucin de la diferencia entre los promedios muestrales se distribuye: ( X 1 X 2 ) ~ Normal (1 - 2 ,
12
n1
2 2
n2
161
H0 : 1 - 2
Estadstico de Prueba
H1 : 1 - 2 <
H1: 1 - 2
>
H1: 1 - 2
Zobs =
(X1 X 2 )
12
n1
2 2
n2
Intervalo de confianza
Tamao de la muestra
( X1 X 2 ) Z 1 -
/2
12
n1
2 2
n2
2 ( Z + Z ) 2 ( 12 + 2 )
(1 2 ) 2
prueba unilateral
2 ( Z / 2 + Z ) 2 ( 12 + 2 )
(1 2 ) 2
prueba bilateral
Para utilizar Statgraphics en la prueba de hiptesis acerca de la diferencia entre los promedios de dos poblaciones, cuando usted ha procesado los datos y dispone de los promedios y de las desviaciones estndar de cada muestra, se utiliza el siguiente procedimiento:
1.- Ponga el cursor en el botn comparacin de la pantalla principal, luego muestras y Contraste de hiptesis . Tendr el siguiente par de pantallas
seleccione Dos
162
Fig. 87
Estando dentro de este procedimiento deber llenar los distintos campos que tiene la siguiente pantalla, y que dicen relacin con la informacin muestral que usted posee y el tipo de prueba de hiptesis que necesita realizar Fig. 88
Si usted dispone de los datos originales colectados por su sistema de medicin , para dos muestras independientes ,entonces deber acceder a la siguiente pantalla , llenando los respectivos campos solicitados por el Software Stagraphics.
163
Fig. 89
Habiendo ingresado sus columnas de datos o variables, ellos son procesados y se entregan diversos tipos de resultados cuantitativos como grficos explicativos Fig. 90
164
8.4.2.3.- Prueba de hiptesis e intervalo de confianza acerca una proporcin " p ". En muchos problemas de ingeniera , se tiene inters en una variable aleatoria que sigue o se comporta como una distribucin Bernoulli. Por ejemplo , considrese un proceso productivo que fabrica artculos que son clasificados como aceptables o defectuosos ; o bien un proceso de monitoreo que controla una variable especfica mediante una lectura muestral , y la muestra se clasifica como contaminada ( + ) o no contaminada (- ). El parmetro binomial " p " representa la proporcin de artculos ( o muestras ) defectuosos (contaminados) producidos. H0 : p = p0 H1 : p < p0 H1 : p > p0 H1 : p p0 Estadstico de prueba Z0bs =
p0 ) (p q p n
es la proporcin de unidades con la caracterstica buscada. Entonces X = n * p es la El valor p cantidad de unidades muestrales con la caracterstica buscada. El valor p0 es la proporcin que hipotticamente existe en la poblacin. El valor " n p0 " representa entonces el valor esperado de unidades con la caracterstica buscada, en la muestra de tamao "n.
Intervalo de Confianza para p de nivel (1 - ) Tamao de la muestra
Z 1 / 2 p
(1 p ) p n
Z n=
p 0 (1 p 0 ) + Z p p0
p (1 p )
2
prueba bilateral
Z / 2 p0 (1 p 0 ) + Z n= p p0
p(1 p) prueba unilateral
Para utilizar Statgraphics en la prueba de hiptesis acerca de la proporcin en la poblacin, cuando usted ha procesado los datos y dispone de la proporcin muestral, el tamao de la muestra, se utiliza el siguiente procedimiento: 1.- Ponga el cursor en el botn descripcin de la pantalla principal y luego seleccione Contraste de Hiptesis . Luego active aceptar
165
2.- Tendr una pantalla igual a la de la figura 85 , donde deber llenar los diferentes campos:
En la pantalla anterior ,en el campo de los parmetros, debe seleccionar Proporcin Binomial, En la ventana Hiptesis Nula deber ingresar el valor de Hiptesis a probar p 0 En la ventana proporcin muestraldeber ingresar el valor de la proporcin en la Muestra. En la ventana Tamao de la Muestra , deber ingresar el tamao de la muestra Luego pulse Aceptar Fig. 91
Ver aparecer una pantalla como la de la Figura 92. Colocando el cursor en el sector izquierdo de la figura anterior , y activando el sector derecho del mouse , tendr acceso a Opciones de Anlisis, desde donde podr definir la hiptesis alternativa H 1 y el error tipo I ( ).: Luego aplique Aceptar y tendr :
166
Fig. 92
El intervalo de confianza para la verdadera proporcin poblacional. La decisin acerca de la prueba de hiptesis La curva de potencia de la prueba o test
8.4.2.4.- Prueba de hiptesis acerca de la diferencia entre dos proporciones " p1 y p2 ". Las pruebas de hiptesis del punto 6.4.2.2 pueden extenderse al caso donde existen dos Parmetros binomiales de inters (por ejemplo p1 y p2) y se desea probar que son iguales o que difieren en una cantidad . Esta prueba de hiptesis, para asegurar la convergencia a la distribucin normal de los parmetros muestrales, necesita que los tamaos de las respectivas muestras tomadas independientemente en cada una de las poblaciones sean de tamao grande (preferentemente superior o igual a 100).
1 = Los estimadores de las proporciones poblacionales son p

distribuciones aproximadamente normales. Para probar la hiptesis H0, se debe calcular =
X1 n1
2 = , p
X2 y que tienen n2
X1 + X 2 , donde X1 y X2 representan las n1 + n 2
cantidades de unidades, en cada una de las muestras, que poseen la caracterstica en estudio.
H0 : p 1 - p 2 =
Estadstico de prueba
H1: p1 - p2 <
H1 : p1 - p2 >
H1 : p1 - p2
ZObs =
1 p 2) (p
(1 )(
1 1 + ) n1 n2
167
Intervalo de confianza de nivel (1 - )
Tamao de la muestra
1 p 2 ) Z1 /2 (p
(1 )(
1 1 + n1 n2
(Z n=
( p1 + p 2 )(q1 + q 2 ) / 2 + Z ( p1 p 2 ) 2
p1 q1 + p 2 q 2
La frmula que permite calcular el tamao muestral est dada en el caso de realizar una prueba de hiptesis con alternativa unilateral. En el caso de que se desee realizar una prueba bilateral ( ), entonces es necesario remplazar Z por Z/2 Para utilizar Statgraphics en la prueba de hiptesis acerca de la diferencia entre las proporciones de dos poblaciones, cuando usted ha procesado los datos y dispone de las proporciones de cada muestra, se utiliza el siguiente procedimiento: 1.- Ponga el cursor en el botn compare de la pantalla principal, luego seleccione Dos muestras y Contraste de Hiptesis Tendr el par de pantallas indicadas como Fig. 87, Fig. 88 Si el inters del investigador estuviese en probar si la cantidad esperada de unidades, X, que tienen una cierta caracterstica cuando se extrae de esa poblacin, lote, o proceso una muestra de tamao "n, entonces la estructura de la prueba de hiptesis sera: H0 : np =n p0 = X0 H1 : n p < X0 H1 : n p > X0 H1: np X0 Estadstico de prueba
Z0bs =
( X np 0 ) np 0 (1 p 0 )
8.4.3.- Aplicaciones de la Distribucin t - Student en la Prueba de Hiptesis y la construccin de intervalos de confianza. Cuando se prueban hiptesis a cerca del promedio de una poblacin cuando 2 es desconocida, es posible utilizar los procedimientos antes descritos, siempre y cuando el tamao de la muestra sea grande. Sin embargo, cuando la muestra es pequea y 2 es desconocida, debe plantearse una hiptesis sobre la forma de la distribucin subyacente con la finalidad de obtener un procedimiento de prueba. En muchos casos, una hiptesis razonable es que la distribucin que modeliza el comportamiento de los datos, es normal. Pero en el caso de muestras pequeas y varianza desconocida, se ha desarrollado una distribucin denominada t de Student Tambin se origina como el cuociente de dos distribuciones, donde una de ellas es la distribucin normal. De hecho, la distribucin t de Student tiene una forma muy parecida a la Normal. (Tabla al final del texto).
168
Muchas de las poblaciones que se encuentran en la prctica , quedan bien aproximadas por la distribucin normal, razn por la cual esta hiptesis conduce a un procedimiento de prueba de gran aplicabilidad.. De hecho, un alejamiento moderado de la normalidad estadstica tiene poco efecto sobre la validez de la prueba. Cuando la hiptesis no es razonable, entonces puede especificarse otra distribucin (Exponencial, Weibull , log normal , etc.) y usar algn mtodo general para la construccin de pruebas de hiptesis con la finalidad de obtener un procedimiento vlido , o tambin pueden utilizarse pruebas no- paramtricas que son vlidas para cualquier distribucin estadstica. 8.4.3.1.- Prueba de hiptesis e intervalo de confianza para el promedio Supngase que la poblacin tiene una distribucin normal con media y varianza 2 , con ambos parmetros desconocidos. Se desea probar la hiptesis de que es igual a una constante 0 . Necesitamos la informacin muestral del promedio aritmtico X y la varianza muestral S2 . H0 : = 0 H1 : < 0 H0 : > 0 H0 : 0 Estadstico de prueba TObs
=
Intervalo de confianza
( X u0 ) 2 S n
X T1 / 2,
2 S n
T1- /2, es un valor obtenido de una tabla que contiene la distribucin t - student y donde = n 1. Este smbolo nos indica los grados de libertad de la distribucin, los cuales estn indicados en la fila de la tabla. Es igual al nmero de datos muestrales menos 1. La expresin 1- /2, representa la columna que identifica el nivel de confianza con el cual se desea trabajar. Para rechazar la hiptesis H0 , a favor de H1 , se debe cumplir que el valor del estadstico de prueba caiga en la regin de rechazo indicada por la hiptesis alternativa H1
Adems, recordemos que
2 = S
(X
i =1
i =n
X )2
;
n 1
S2 =
(X
i =1
i =n
X )2
Para utilizar Statgraphics en la prueba de hiptesis acerca del promedio ,cuando usted ha procesado los datos y dispone del promedio y la desviacin estndar muestral ,se utiliza el siguiente procedimiento : 1.- Ponga el cursor en el botn describe de la pantalla principal y luego seleccione Contraste de Hiptesis . Tendr el siguiente par de pantalla como lo indican la Fig. 84 y Fig. 85 .
169
8.4.3.2.- Prueba de hiptesis e intervalo de confianza para los promedio de dos distribuciones muestras independientes Ahora se considerar una prueba de hiptesis sobre la diferencia de los promedio 1 - 2 = , 2 son desconocidas pero iguales , de dos distribuciones normales donde las varianza 12 y 2
2 y S 2 . Las muestras estimadas a travs de sus respectivas varianzas muestrales S 1 2 obtenidas de cada poblacin son independientes entre si. Tal como se indic en la prueba homnima en puntos anteriores, se requiere la hiptesis de normalidad para desarrollar el procedimiento de prueba, pero los alejamientos o distanciamientos moderados de la normalidad estadstica no tendrn efectos adversos sobre el procedimiento (Concepto de prueba robusta).
H0 : 1 - 2 Estadstico de Prueba
H1 : 1 - 2 <
H1: 1 - 2
>
H1: 1 - 2
Tobs =
(X1 X 2 ) 2 + (n 1) S 2 1 (n1 1) S 1 1 2 2 + n n n1 + n2 2 2 1
El valor del Estadstico de prueba se compara con valores obtenidos de una Tabla Estadstica de la distribucin t-Student , adjunta al final del texto, segn se la hiptesis alternativa H1 que se est utilizando. Los grados de libertad, son iguales al tamao de la muestra menos 2. El intervalo de confianza de nivel (1- ), para la diferencia entre los promedios poblacionales 1 - 2, est dado por
( X 1 X 2 ) T(1 / 2);
2 + (n 1) S 2 (n1 1) S 1 2 2 n1 + n2 2
1 1 n + n 2 1
Los grados de libertad para la distribucin son = n1 + n2 2 Para realizar esta prueba de hiptesis, utilizando statgraphics, se debe realizar un procedimiento como lo indican las pantallas de las Figuras 87 a 89 Ejemplo: Dos proveedores fabrican un engranaje plstico utilizado en una impresora lser. Una caracterstica importante de estos engranajes es la resistencia al impacto. la cual se mide en pies-libras. Una muestra aleatoria de 10 engranajes suministrados por el proveedor "A" y de 15 engranajes suministrados por el proveedor "B, entregan los siguientes resultados:
170
Proveedor A B
Tamao Muestra 10 15
Promedio 290 321
Desv. Estndar 12 15
a) Existe evidencia que apoye la afirmacin de que los engranajes del proveedor "B" tienen una mayor resistencia promedio al impacto ?. Utilice = 0,05. b) Los datos apoyan la afirmacin de que la resistencia promedio al impacto de los engranajes del proveedor "B" es al menos 20 pies-libra mayor que la del proveedor "A? c) Construya un intervalo de confiabilidad del 95 % ,para la diferencia promedio entre las resistencias de los engranajes suministrados por ambos proveedores. 8.4.3.3.- Prueba de hiptesis e intervalo de confianza para los promedio de dos distribuciones, muestras dependientes. En el caso las muestras obtenidas de cada poblacin son dependientes entre si , como ejemplo , cuando la misma muestra es sometida a anlisis por laboratorios diferentes que utilizan la misma metodologa ; la misma unidad muestreada es sometida a una medicin pre y post ; puede ser tambin cuando las observaciones sobre las dos poblaciones de inters se recopilan por pares , tomadas bajo condiciones homogneas , pero ests pueden cambiar de un par a otro . Esta prueba recibe el nombre de prueba " t pareada . Se calcula la diferencia entre cada par de observaciones di = X i - Yi desde i = 1 , 2.........n
Con los valores de di , se obtiene su promedio aritmtico d = para remplazarlos en el estadstico de prueba H0 : 1 - 2 H1 : 1 - 2 < H1: 1 - 2 H1: 1 - 2
di
i =1
i=n
2 = , S d
(d
i =1
i =n
d )2
n 1
Estadstico de Prueba
>
TObs =
(d ) 2 S
d
n
El valor del Estadstico de prueba se compara con valores obtenidos de una Tabla Estadstica de la distribucin t-Student , adjunta al final del texto, segn se la hiptesis alternativa H1 que se est utilizando. Los grados de libertad , son iguales al tamao de la muestra menos 1. El intervalo de confianza de nivel (1- ) , para la diferencia entre los promedios poblacionales 1 - 2 , est dado por
d T1 / 2
2 S d 1 - 2 d + T1 / 2 n
2 S d n
171
Ejemplo: Quince hombres adultos trabajadores de una Empresa Minera de la II Regin, cuyas edades fluctan entre los 35 y 50 aos , participaron en un estudio aerbico para evaluar el efecto de la dieta y el ejercicio sobre los niveles de colesterol en la sangre . El colesterol total fue medido al inicio del estudio en cada trabajador, y tres meses despus de participar en el estudio y de haber cambiado la alimentacin a una dieta baja en grasas, se obtuvieron los siguientes resultados: Nivel de Colesterol Total en la Sangre Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Antes 265 240 258 295 251 245 287 314 260 279 283 240 238 225 247 Despus 229 231 227 240 238 241 234 256 247 239 246 218 219 226 233 a).- Estos datos apoyan la afirmacin de que la dieta baja en grasas y el ejercicio aerbico son de gran valor en la disminucin de los niveles de colesterol total en la sangre? b).- Construya un intervalo de confianza del 95%, para establecer la reduccin promedio conseguida en el estudio, por los trabajadores Para utilizar Statgraphics en la prueba de esta hiptesis, se utiliza el siguiente procedimiento: 1.- Ponga el cursor en el botn Comparacin de la pantalla principal. Luego seleccione Dos Muestras. Finalmente seleccione " Comparicin de Muestras Pareadas. 2.- Llene los dos campos que se presentan en la pantalla de dilogo. 3.- Seleccionando desde " Opciones Tabulares", usted tendr acceso a Probar la Hiptesis formulada y el respectivo intervalo de confianza para la diferencia promedio 8.4.4.- Aplicaciones de la Distribucin Chi-Cuadrado. La distribucin de probabilidad Chi-cuadrado, o distribucin 2 , fue descrita por primera vez por Karl Pearson alrededor del ao 1900. Es una variable aleatoria y que a la vez se utiliza como estadgrafo de contraste o de prueba, al igual que las distribuciones Normal, t de Stdudent. Tiene amplias aplicaciones y variadas utilizaciones, las que entre las ms frecuentes se cuentan: o o o Prueba de hiptesis e intervalos de confianza para la varianza de la poblacin Prueba de Independencia en tablas de contingencia o de asociacin Prueba de la Bondad de Ajuste
172
8.4.4.1.- Prueba de hiptesis e intervalos de confianza para la varianza de una sola poblacin. En algunas oportunidades se necesitan pruebas sobre la varianza o la desviacin estndar de una poblacin (dispersin) o distribucin. Supngase que se desea probar la hiptesis de la varianza de una poblacin normal 2 es igual aun valor especfico.
2 Por ejemplo, 0 . De una muestra aleatoria de tamao "n" extrada de la poblacin, se calcula
2 el valor S
2 H0 : 2 = 0 2 H1 : 2 < 0 2 H1 : 2 > 0 2 H1 : 2 0
Estadstico de prueba
2 = Obs
2 (n 1) S
02
nS2
02
El valor del Estadstico de prueba se compara con valores obtenidos de una Tabla Estadstica de la distribucin Chi-cuadrado , adjunta al final del texto, segn se la hiptesis alternativa H1 que se est utilizando. Los grados de libertad, al igual que en la distribucin t Student , son iguales al tamao de la muestra menos 1. Un intervalo de confianza de nivel ( 1 - ) para la varianza de la poblacin est dado por la expresin
2 (n 1) S
12 / 2
Ejemplo:
2 (n 1) S
2 /2
La desviacin estndar de cierto proceso de produccin es de 4 pulgadas. Se sospecha que la varianza se ha hecho demasiado grande (a aumentado ). Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 50 , 57 , 52 , 54 , 58 , 59 , 58 , 56 , 55 La prueba de hiptesis, de forma simblica, tiene la siguiente estructura: H0 : 2 = 4
v / s H1 : 2 > 4 a un nivel de significancia = 0,05
Para probar esta hiptesis utilizando statgraphics, debemos calcular previamente la desviacin estndar de los datos y realizar los siguientes pasos.
173
1.- Posicionar el cursor en Descripcin. Hiptesis
Luego seleccionar en la ventana, Contraste de
2.- Deber llenar los campos de la pantalla que aparecer, y en el campo Parmetro seleccione Desv. Tpica Normal . Tambin debe llenar los otros campos: Hiptesis nula; Desv. Tpica de la muestra, tamao de la muestra. Finalmente pulsar Aceptar 3.- Una vez que se ha accedido al procedimiento, pulsando el sector derecho del mouse podr seleccionar Opciones de Anlisis y definir la estructura de la hiptesis H1. y el nivel de significancia . Saldr un mensaje acerca de la decisin que se debe adoptar y el intervalo de confianza para la desviacin estndar. Observacin Debemos tener en consideracin que en la mayora de las veces la preocupacin fundamental est centrada en conocer el comportamiento de la desviacin estndar, como medida de variabilidad. Por eso es que Statgraphics dedica esta ventana a tal medida de variabilidad. Adems el intervalo de confianza para la desviacin estndar tambin se obtiene cuando se procesan datos numricos, una sola variable al seleccionar desde el icono Opciones de tabulacin, la ventana "Intervalo de confianza
8.4.4.2.- Prueba de Independencia en tablas de contingencia o de asociacin En muchas ocasiones, los "n" elementos de una muestra tomada de una poblacin pueden clasificarse de forma conjunta de acuerdo con dos criterios o variables diferentes. Sea estas variables " R " y " C. Es decir, podemos observar en cada elemento dos variables, que generalmente tiene como respuesta una caracterstica cualitativa o atributo. La tabla estadstica que se genera se denomina tabla de contingencia o de asociacin, que tiene " i " filas y " j " columnas Resulta de inters saber si existe algn grado de dependencia o de asociacin entre los niveles de clasificacin de las variables. Por ejemplo ,se desea averiguar si hay alguna asociacin estadsticamente significativa entre "Nivel de Formacin Acadmica "y el "Rendimiento Laboral". Si existe alguna asociacin estadsticamente significativa entre el " Ausentismo Laboral " y la " Edad " , etc. La hiptesis nula a probar es la de que las Variables " R " y " C " son independientes. Esto es de que no hay asociacin o relacin entre las dos variables. La hiptesis alternativa es la negacin de la hiptesis nula . Bajo el contexto de la hiptesis H 0 , es decir de independencia entre las variables , es de esperar que la Probabilidad Conjunta entre las variables se igual al producto de las probabilidades Marginales de cada una de ellas, es decir P ( Ri , Cj ) = P ( Ri ) x P ( Cj) Los valores de las frecuencias conjuntas en cada una de las casillas, se comparan con los valores esperados para cada casilla.
174
Los valores esperados para cada casilla se calculan multiplicando los totales en cada fila por los totales en cada columna y luego este producto se divide por el total " n " de la tabla
) se obtiene multiplicando Por ejemplo el valor esperado conjunto en la columna 2 , fila 3 ( f 23 el total de fila 2 por el total en la columna 3 . Luego dividir por el total de datos
Es decir ,
= f 2 f 3 f 23 n
0
Se probar la hiptesis H respectiva frecuencia esperada. El estadstico de prueba es :
comparando cada frecuencia conjunta observada con su
2 ( j 1)( k 1)
)2 ( fij f ij = f j =1 k =1
J K ij
(Estadstico de Prueba)
Aqu el contraste es unilateral y el valor del estadstico de prueba se compara con el valor obtenido de una tabla de Distribucin Chi-cuadrado con grados de libertad igual al producto (nmero de filas - 1)x( nmero de columnas - 1 ) , para un nivel de confianza especfico 7.4.4.3.- Prueba de la Bondad de Ajuste El procedimiento de prueba requiere de una muestra aleatoria de tamao " n " proveniente de la poblacin la cual tiene una distribucin de probabilidad desconocida. Estas "n" observaciones se ubican en los " k " intervalos reales, cada uno de ellos conteniendo una cantidad "f i. Seguidamente se representan grficamente en un histograma de frecuencia. Se supone o propone una distribucin de probabilidad, bajo la cual se calculan las frecuencias esperadas para cada uno de los intervalos, ". las que se denotan por " f i Hiptesis nula Ho es: " Los datos muestrales se distribuyen segn la distribucin propuesta" Hiptesis Alternativa H distribucin propuesta.
1
es " Los datos muestrales no se ajustan o no provienen de la
El estadstico de prueba es
2 Observado
)2 ( fi f i = f i =1
i =k i
La prueba de Bondad del Ajuste
es slo una de varios procedimientos utilizados para tal

2
efecto. Cuando se trabaja con variables aleatorias continuas, la prueba chi-cuadrada ( ) tal vez no sea el mejor procedimiento, pero est ampliamente difundida su utilizacin.
175
Desde el desarrollo de aspecto tericos de la estadstica matemtica, se demuestra que si la 2 poblacin sigue o se distribuye segn el modelo de probabilidad propuesto, el valor de Observado tiene de manera aproximada una distribucin Chi-cuadrada con " k p 1 " grados de libertad, donde k representa la cantidad de intervalos utilizados; p es el nmero de parmetros estimados a partir de los datos muestrales. La aproximacin a la distribucin puede mejorar si el tamao de la muestra aumenta. 2 > que el valor entregado por la La hiptesis nula Ho es rechazada cuando el valor de Observado con un nivel de confianza " 1 y k p 1 " grados de libertad. Existe una tcnica grfica para probar si Ho se cumple. Esto se realiza por medio de la "grafica de probabilidad. Si el modelo de probabilidad propuesto ajusta a los datos, entonces el grfico de probabilidad mostrar que los datos tendern a alinearse en torno a una lnea recta. tabla Observaciones: Este procedimiento de prueba est muy relacionado con la "magnitud o cantidad" de las frecuencias esperadas. Si estas frecuencias son muy pequeas, entonces el estadstico de prueba 2 no reflejar cabalmente el alejamiento entre lo observado y lo esperado, sino slo la Observado pequea magnitud de las frecuencias esperadas. No existe un acuerdo respecto de cual sera la cantidad mnima a aceptar como frecuencia esperada, pero en general los valores 3, 4 y 5 son los que ms se utilizan como mnimos. Algunos autores sugieren que la frecuencia esperada puede se tan pequea como 1 o 2, siempre y cuando que muchas de ellas en la tabla de distribucin de los datos resulten ser mayores que 5. Si una frecuencia esperada en un intervalo es pequea, entonces pueden juntarse con la frecuencia esperada del intervalo adyacente. Las frecuencias observadas correspondientes tambin se combinan, por lo que entonces el N "k " de intervalos tambin disminuye. Tambin se debe destacar entonces de que no es necesario de que los intervalos tengan la misma longitud o ancho. 7.4.4.4.- Desarrollo de Ejercicios de Aplicacin. Supngase, que se desea averiguar si hay alguna asociacin significativa entre el nivel de formacin acadmica y el rendimiento laboral
Rendimiento Excelente Bueno Regular
Enseanza HumanistaCientfica 10 30 10
Enseanza Tcnica Profesional 40 30 30
Tcnica Universitaria 10 20 20
En primer lugar se debe construir la tabla con las frecuencias esperadas Rendimiento Excelente Bueno Regular TOTAL Enseanza Humanista-Cientfica Enseanza Tcnica Profesional Tcnica Universitaria TOTAL
15 =(50 X60)/200 20=(50 X80)/200 15=(50 X60)/200 50
30=(100 X60)/200 40=(100 X80)/200 30=(100 X60)/200 100
15=(50 X60)/200 20=(50 X80)/200 15=(50 X60)/200 50
60 80 60 200
176
El Estadstico de Prueba es
2 Obs =
(10 15) 2 (40 30) 2 (10 15) 2 (20 15) 2 + + + ..........+ = 17,5 15 30 15 15
En la tabla de distribucin
del 95 % y con grados de libertad = (nmero de filas - 1) x( nmero de columnas - 1) = 2 x 2 = 4 el valor es de 9,48773. Por lo tanto se debe rechazar la hiptesis nula de que no existe relacin significativa entre la formacin acadmica de los empleados y su rendimiento laboral El Coeficiente de Contingencia es una medida del grado de interrelacin, asociacin o dependencia de las clasificaciones en una tabla de contingencia que se calcula de la siguiente forma
al final del texto, encontramos que para un nivel de confianza
C.C =
2 Obs +N
2 Obs
Donde N es el Total de datos
Cuanto mayor es el valor del C.C , mayor es el grado de asociacin entre las variables En este caso el C.C =
17.5 = 0,0897 17.5 + 200
Este coeficiente vara entre cero y uno. Para tablas de contingencia con "i" filas y "j" columnas, el mayor valor que puede tomar dicho coeficiente es
(k 1) donde k = mnimo{ i, j}. k
La Correlacin de Atributos es una medida del grado de dependencia, asociacin o interrelacin entre los niveles de medicin (atributos o clasificaciones) de las variables que definen la tabla. Un coeficiente de esta naturaleza es el Coeficiente V de Cramer`s V=
2 Obs
N (k 1) 17.5 200 (3 1)
donde k = mnimo { i , j}.
En este ejemplo el V =
= 0,2092
177
En el "Resumen de procedimiento del botn " Opciones Tabulares " de Statgraphics, se encuentran los siguientes coeficientes aplicados a tablas de Contingencia Summary Statistics With Rows With Columns Statistic Symmetric Dependent Dependent -----------------------------------------------------Lambda 0,0455 0,0833 0,0000 Uncertainty Coeff. 0,0405 0,0396 0,0415 Somer's D 0,0778 0,0800 0,0758 Eta 0,1581 0,1708 -----------------------------------------------------Statistic Value P-Value Df -----------------------------------------------------Contingency Coeff. 0,2837 Cramer's V 0,2092 Conditional Gamma 0,1190 Pearson's R 0,0913 0,0993 198 Kendall's Tau b 0,0778 0,2201 Kendall's Tau c 0,0750 -----------------------------------------------------Algunas explicaciones cualitativas son necesarias para entender estos coeficientes: Lambda : Vara entre Cero y Uno. (Valores cercanos a cero indican que no hay asociacin entre las variables. Valores prximos a Uno , indican una variable est relacionada o puede predecir a la otra. Uncertainty Coeff , Pearson's R : Muestran el grado de relacin lineal entre las dos variables Somer's D : Para casos simtricos y asimtricos ( Con filas o columnas como variable dependiente), muestra una medida simtrica de asociacin para las variables las cuales tienen mediciones en escala ordinal . Eta : Es una medicin aproximada de la asociacin entre dos variables, cuando la variable dependiente tiene un escala de intervalos y la variable independiente tiene escala nominal o ordinal. Este coeficiente es similar al coeficiente de correlacin de Pearson; sin embargo, es asimtrico y no asume una relacin lineal entre las variables Contingency Coeff: Es una medida del grado o fuerza de la dependencia entre dos caractersticas . Cramer's V , Conditional Gamma, son medidas de asociacin basadas en la distribucin
2.
Kendall's Tau b y c, medidas relativas al grado de acuerdo, concordancia o desacuerdo entre las dos variables.
178
Para utilizar Statgraphics en este procedimiento, se deber tomar la siguiente ruta: 1.- Crear un archivo colocando cuatro columnas, en este caso, que contenga: Rendimiento, y los tipos de formacin acadmica 2.- Luego seleccione Descripcin Datos Cualitativos Tabulacin cruzada. Llene los diferentes campos de la pantalla que tendr frente a usted. Para utilizar Statgraphics en este procedimiento, se deber tomar la siguiente ruta: 1.- Crear un archivo colocando cuatro columnas, en este caso, que contenga: Rendimiento, y los tipos de formacin acadmica Fig. 92
2.- Seleccionar Descripcin
Datos Cualitativos Fig.- 93
Tablas de Contingencia
179
3.- Llenar los campos respectivos Fig.- 94
4.- Utilizando los botones "Tabular Options " y " Graphical Options" tendr acceso a: Con Tabular Options podr seleccionar "Chi-Square Test", que permite probar la hiptesis Ho de Independencia. Tambin puede seleccionar "Summary Statistics", que le permitir disponer de un conjunto de indicadores del grado de asociacin entre las variables. Con Graphical Options tendr acceso a los grficos respectivos
2.- En un proceso de embalaje de manzanas de calidad 1 , que se exportan a la Comunidad Econmica Europea , se realiza un muestre en 60 cajas . Se observan la totalidad de manzanas envasadas y se cuentan cuantas de ellas resultan "disconformes " con la definicin de calidad 1 y por lo tanto se les considera defectuosa. Nmero de Defectos Frecuencia Observada 0 32 1 15 2 9 3 4
La cantidad de manzanas defectuosas por cajas se distribuye o proviene de una distribucin de Poisson ? Ho : La cantidad de manzanas defectuosas por cajas se distribuye o proviene de una distribucin de Poisson H 1 : La cantidad de manzanas defectuosas por cajas NO se distribuye o NO proviene de una distribucin de Poisson
180
Dado que el parmetro de la distribucin de Poisson se estima a travs del promedio de los datos muestrales entonces = 0.75 Manzanas defectuosas por caja. Con este valor se determinan las probabilidades esperadas en cada intervalo y que multiplicado por el total de cajas n = 60 , se obtiene la respectiva frecuencia esperada en el intervalo . a continuacin se detalla el procedimiento a seguir. P (X = 0) =
0,75 0 e 0, 75 = 0.472 0!
= 0,472 60 = 28,32 f 1 = 0,354 60 = 21,24 f 2

= 0,133 60 = 7,98 f 3
P (X = 1) =
0,751 e 0,75 = 0,354 1!
0,75 2 e 0, 75 = 0,133 P (X = 2) = 2!
P (X 3) = 1 - P (X=0) - P(X=1) - P(X=2) = 0,041
= 0,041 60 = 2,46 f 4
Tenemos entonces que Nmero de Defectos Frecuencia Observada f i Frecuencia Esperada 0 32 28,32 1 15 21,24 2 9 7,98 3 o ms 4 2,46
f i
Y por lo tanto
2 Observado
)2 ( fi f i = = 2,94 f i =1
i =k i
El valor de tabla Chi-cuadrado, con nivel de confianza del 95 % y grados de libertad igual a 31- 1 = 1 es de 3,84. Como el valor de Chi-cuadrado observado es menor que el valor de tabla, entonces concluimos de que no es posible rechazar la hiptesis nula Ho, con cual podemos afirmar con 95 % de confianza que la cantidad de manzanas defectuosas por cajas se comporta segn el modelo de probabilidad Poisson. Cuando se trabaja con Stagraphics , el tema de Bondad de Ajuste se hace con los datos colectados originalmente , es decir, sin tabular. En este caso se debe proceder de la forma como lo indica la figura siguiente:
181
Fig.- 95
Luego se despliega una pantalla con una variada cantidad de modelos de probabilidad, tantos discretos o continuos , los cuales se pueden ajustar a los datos. 8.4.4.5.- Ejercicios de Aplicacin Propuestos 1.- Se realiz una encuesta para evaluar la eficacia de una nueva vacuna contra la gripe y el resfro, que fue aplicada en una ciudad, en el perodo de otoo La vacuna se proporcion de forma gratuita en una secuencia de dos inyecciones en un perodo de dos semanas a quienes desearan aprovecharla. Algunas personas recibieron las dos inyecciones , otras se presentaron solamente a la primera inyeccin y otras no recibieron ninguna inyeccin. Una encuesta aplicada a 1000 personas de la ciudad al inicio del perodo de verano, proporcion la siguiente informacin. Ninguna inyeccin 24 289 313 Una inyeccin 9 100 109 Dos inyecciones 13 565 578 Total 46 954 1000
Gripe No gripe Total
Presentan los datos suficiente evidencia para indicar una dependencia entre la clasificacin segn la vacunacin y la ocurrencia o no de la gripe? 2.- Una compaa opera cuatro mquinas en tres turnos al da. De los registros de produccin , se obtienen los datos siguientes sobre el nmero de fallas. Mquinas TURNO 1 2 3 A 41 31 15 B 20 11 17 C 12 9 16 D 16 14 10
Pruebe la hiptesis ( con = 0,05 ) de que el nmero de fallas es independiente del turno.
182
3.- Un estudio que se realiz con una muestra de 81 personas referente a la relacin entre la cantidad de violencia vista en la televisin y la edad del televidente entreg los siguientes resultados. E D A D Grado de violencia vista en televisin Poca violencia Mucha violencia 16 8 18 34 35 12 15 54 55 o ms 21 7
Indican los datos que ver violencia en la televisin depende de la edad del televidente? Use =0,05 4.- El nmero de llamadas que se reciben en un tablero de central telefnica desde la 8:01 a las 8:01 de la maana durante un perodo de 100 das es el siguiente Nmero de llamadas Frecuencia 0 3 1 10 2 25 3 30 4 15 5 12 6 5 7 0 Total 100
A un nivel de significancia =0,05 , pruebe la hiptesis de la frecuencia observada proviene de : a).- Una distribucin de Poisson b) .- Una distribucin Binomial 5.- La estatura de 205 empleados en una industria presenta la siguiente distribucin de frecuencia Estatura ( cm ) 150 155 160 165 170 175 180 185 155 160 165 170 175 180 185 190 Frecuencia Observada 9 20 45 55 43 17 11 5
A un nivel de significancia =0,05. Pruebe la hiptesis de la frecuencia observada proviene de una distribucin Normal:
183

Probab Il I Dad Vay Mode Los

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Probab Il I Dad Vay Mode Los

Transféré par

Droits d'auteur :

Formats disponibles

V.

CAPITULO: INTRODUCCION A LA TEORIA DE LA PROBABILIDAD

Sistema Fsico Mediciones Modelo Anlisis

5.4.- ESPACIO MUESTRAL DISCRETO: Definicin

Cuando est formado por un conjunto finito o infinito contable de resultados

5.5.- SUCESO O EVENTO ALEATORIO Definicin

Es cualquier SUBCONJUNTO del Espacio Muestral asociado a un Experimento Aleatorio.

Resumen de operaciones conjuntistas: a) b) c) d) e) f) g) ( E` )` = E (A B) C = (A C) ( B C) (A B) C = (A C) ( B C) (A B)` = A` B` (A B)` = A` B` A B = B A A B = B A

Cantidad 1 500 50 20 10 5 1 585

Proporcin 0,9464 0,0315 0,0126 0,0063 0,0032 1,0000

a). Cul es la probabilidad de qu un ctodo no contenga defectos?

1500 1585 = 0,9064

b). Cul es la probabilidad de que un ctodo tenga 1 o 3 defectos? P (X = 1 ) + P ( X = 3 ) =

50 10 + = 0,0315 + 0,0063 = 0,0378 1585 1585

c).-Cul es la probabilidad de que un ctodo tenga entre 1 y 3 defectos?

P (1 x 3) = P( x = 1) + P ( x = 2 ) + P( x = 3) P (1 x 3) = 50 20 10 + + 1585 1585 1585

P (1 x 3) = 0,0315 + 0,0126 + 0,0063 P (1 x 3) = 0,0504

Si A y B son eventos mutuamente excluyentes, entonces P(A B) = P(A) + P(B)

5.13.- PROBABILIDAD CONDICIONAL:

El problema anterior presentado en un diagrama de rbol Molcula 1 presente no Molcula 2 presente si

0.2 P(F/alta) 0.1 0.02 P(F`/alta) 0.9 0.18

0.5 P(F`/baja) 0.999 0.4995

P(F) = P(F/E1)*P(E1) + P(F/E2)*P(E2) + P(F/E3)*P(E3) = 0.0235

0.9 0.95 0.9 0.95 0.9

P(A/B) = P(B/A)*P(A) / P(B)

200 300 1000 800 700 3000

50 A1 300 = 50 = 0,1 P = 500 500 B 3000

Fx (x) = P(X x) = f (xi )

1.- Fx (x) = P(X x) = f (x i )

2.- 0 Fx (x) 1 3.- Si x y , entonces Fx (x) Fy (y )

6.1.2.- Valor esperado de una variable aleatoria discreta Definicin

Entonces el Coeficiente de Variacin para la variable impurezas es de

Utilizando el mismo procedimiento para la variable Contenido de humedad, obtendr: Y = E(Y) =

un valor promedio de 3.225 Variacin

y una desviacin estndar de 0.4176. Por lo tanto Coeficiente

para sta variable es de

0,1744 100% = 12.94 %. 3.225

3.- Para cualquier a, b tal que < a < b < + , tenemos

2.- 0 Fx (x) 1 3.- Si x y , entonces

6.2.3.- Valor esperado de una variable aleatoria continua Definicin

La media o valor esperado de una variable aleatoria continua X, denotada por

Esta es una medida de tendencia central.

X n! n-x fX (x ; p , n ) = x!(n x)! p (1- p)

20! 2 20 - 2 0.1 (1- 0.1) 2 ! ( 20 2 )!

= 190 0.01 0.150095 = 0.2852

j!(20 j )! 0.1 (1 0.1)

La expresin anterior permite calcular exactamente k xitos.

probabilidad de que en la unidad analizada hayan

1012 e 10 = 0,095 12!

b).- Cul es la probabilidad de encontrar entre 7 y 12 partculas en el rea de l disco?

10 k e 10 = P(X=7) + P(X=8)+ P(X=9)+ P(X=10)+P(X=11)+P(X=12)= k! k =7

Distribucin Normal Estndar

0,3 0,2 0,1 0 -5 -3 -1 1 3 5

44 45 X 45 47 45 ) = P (-0,67 Z 1,33) = 1,5 1,5 1,5

X 45 43 45 ) = P(Z -1,33 ) = 1,5 1,5

X 45 48 45 ) = P ( Z 2) = 1 - P(Z 2) = 1,5 1,5

Si X es una variable aleatoria binomial , entonces Z=

es de manera aproximada, una variable aleatoria normal estndar

8,5 7,5 7,125

4,5 7,5 7,125

10,5 7,5 7,125

Si X es una variable aleatoria Poisson con E( X ) = y V( X ) = , entonces Z=

es de manera aproximada, una variable aleatoria Normal Estndar

P(F) = P(F/E1)P(E1) + P(F/E2)P(E2) + P(F/E3)*P(E3) = 0.0235