Académique Documents
Professionnel Documents
Culture Documents
Carrera: Contabilidad Pblica y Auditora. Modalidad: Encuentros Presenciales. Asignatura: Estadstica II. Encuentros Presenciales: 6. Turnos: Fin de semana (quincenal).
II ao FASCICULO DE ESTADISTICA II
OBJETIVOS
1. Desarrollar la habilidad de traducir el lenguaje estadstico a problemas propios del perfil ocupacional de su carrera.
2. Desarrollar la habilidad de aplicar las tcnicas del muestreo y las pruebas de hiptesis como elemento fundamental en la toma de decisiones.
3. Desarrollar habilidad operativa en teora de conjuntos como herramienta indispensable para el clculo de probabilidades.
Contenido: 1. Teora de conjunto. 2. Tcnicas de conteo. 3. Espacio muestral, acontecimientos. 4. Probabilidad clsica. - Axiomas bsicos de probabilidad. - Teoremas de probabilidad. 5. Probabilidad condicional. 6. Teorema de Bayes. 7. Independencia de eventos 8. Variable aleatoria discreta y, continua. - Media, varianza y desviacin tpica de una variable aleatoria. I. TEORIA DE CONJUNTOS Conjunto: Aun cuando ste resulta ser un concepto matemtico primitivo, podemos decir que conjunto es la coleccin de seres u objetos que tienen una o ms caractersticas comunes. Ejemplos de conjuntos: Ejemplo 1. Conjunto: vocales La coleccin sera: a, e, i, o, u. La caracterstica comn es: que al pronunciar stas letras articulamos un sonido que
Ejercicios
Dar 5 ejemplos de conjuntos, sealando las caractersticas comunes de la coleccin de seres u objetos. Intntelo! Diga que s puede! Elementos de un conjunto: Son todos y cada uno de los seres u objetos que forman el conjunto. Nomenclatura: Los conjuntos se representan con letras maysculas y, los elementos, con letras minsculas. Se utiliza llave para encerrar los elementos de un conjunto. Ejemplo. Sean los dgitos, elementos del conjunto D. D = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Relacin de pertenencia: Para indicar que un elemento forma parte de un conjunto, se utiliza el smbolo , se lee: pertenece a. As, al escribir u {vocales}; se lee: u pertenece al conjunto de las vocales. Advertencia!: El smbolo , slo se utiliza en la relacin de elemento con conjunto, nunca entre elementos entre conjuntos. Para indicar que un elemento no pertenece a un conjunto, se utiliza el smbolo .
Subconjunto: Un conjunto B, es subconjunto de otro conjunto A, cuando todo elemento de B es elemento de A. Se representa B A Nota: para indicar que cierto conjunto, no es subconjunto de otro, se utiliza el smbolo . Ejemplo 1. Sean los conjuntos M = {a, b, c}, N = {a, b, c, d} M N: M es subconjunto de N. Observe que todos los elementos del conjunto M, tambin se encuentran en el conjunto N. Ejemplo 2. Sean los conjuntos V = {x/x es vocal}, A = {alfabeto} V es subconjunto de A, por que todas las vocales pertenecen al alfabeto.
Tipos de conjuntos:
Conjunto vaco: Son aquellos conjuntos que no poseen elemento alguno. Ejemplo 1. A = {satlites naturales de Mercurio} El conjunto A es vaco. El planeta Mercurio no posee satlites naturales. Ejemplo 2. B = {x N/ x < 0} Todos lo nmeros naturales son mayores que cero; por lo tanto, el conjunto B no posee ningn elemento. Observacin: Para indicar que un conjunto es vaco, se puede utilizar cualquiera de las siguientes notaciones {}. Conjunto unitario: Son aquellos conjuntos que poseen un nico elemento. Ejemplo 1. F = {satlites naturales de la Tierra} El conjunto F est compuesto por un nico elemento. Cul es ese elemento? Ejemplo 2. G = {x/x es un estado con extensin menor a 1 km2} G = {Vaticano} Conjunto infinito: Son aquellos conjuntos de los que no podemos nombrar un ltimo elemento. Cules seran los conjuntos finitos? Ejemplifique. Conjunto Universal (U): Tambin conocido como conjunto referencia o lleno, es el conjunto que contiene a todos los conjuntos que se generan de cierta situacin o circunstancia. Cualquiera de los siguientes conjuntos puede considerarse lleno, dependiendo de la situacin: 5
Ejemplo 1. Encuentre la unin entre los conjuntos X = {30, 31, 32} y Y = {50, 51, 52, 53} X Y = {30, 31, 32, 50, 51, 52, 53} Ejemplo 2. A = {hmero, cbito, radio} y B = {carpo, metacarpo} A B = {esqueleto del brazo} Ejemplo 3. C = {flagelo, membrana, pared celular} y L = {ADN, ribosoma} C L = {clula procarionte} Nota: Los elementos repetidos se consideran como uno solo. Interseccin de conjuntos: Dados los conjuntos A y B, se llama interseccin de los conjuntos A y B al conjunto formado por los elementos del conjunto A que tambin pertenecen al conjunto B. Se expresa A B Ejemplos. Encuentre la interseccin entre los conjuntos:
Ejercicios
8
2. Dados los conjuntos: A = {1, 2, 3, 4, 5} B = {1, 2, 3} C = {4, 5, 6} D = {1, 2, 3,, 10} E = {3, 4, 5,} F={} a) b) c) d) e) f) g) h) Es B un subconjunto de A?, De C? Justifique. Cules de los conjuntos dados son finitos? Justifique. Enumerar los elementos de A B. Qu conjunto es B C? Es F un subconjunto de C? Justifique. Puede, la unin de dos conjuntos no vacos, ser un conjunto vaco?Justifique. 4 A? Es cierto que 2 E? Cul es el cardinal de F? Y de E?
3. Dados los conjuntos: A = {1, 2, 3, 4} B = {5, 6, 7, 8} C = {1, 2, 3,, 20} D = {2, 4, 6,} E={} F = {5, 8, 7, 6} a) b) c) d) Cules de los conjuntos son infinitos? Cul es la cardinalidad del conjunto B? En E? Mencionar la caracterstica comn de los elementos del conjunto D? Nombrar los 4 elementos mayores del conjunto C. 9
nk
Ejemplo 1. Supongamos que una moneda (cinco, escudo) se ha lanzado al aire 10 veces. Calculemos el nmero de diferentes resultados que podemos obtener. Solucin: Existen dos posibles eventos en un lanzamiento, que la moneda caiga escudo o cinco. Como el experimento se repite 10 veces, el nmero de resultados posibles es:
210 = 1024
Ejemplo 2. Si un dado se lanza dos veces. Cuntos posibles resultados existen? Solucin: Hay seis posibles eventos en el lanzamiento de un dado y, el experimento se repite dos veces; as, el nmero de posibles resultados es:
62 = 36
Esto lo podemos observar al realizar un diagrama de rbol.
Tcnica 2. Si hay n1 eventos del primer intento, n2 eventos del segundo intento, ni eventos
del i-simo intento, entonces el nmero de resultados posibles es:
n n
1
ni
Ejemplo 1. Un urbanista de una nueva subdivisin ofrece a los interesados en la primera compra de una casa la posibilidad de seleccionar el estilo de la fachada entre Tudor (semejante al gtico), Rstico, Colonial y Tradicional y; una sola planta, dos plantas o desnivel. De cuntas maneras diferentes puede, un comprador, ordenar una de estas casas?
11
Pr = n! / (n -r)!
12
Suponga que queremos ordenar dos de las cinco vocales, sin repeticin. Los resultados son: ae ea ia oa ai ei ie oe ao eo io oi au eu iu ou ua ue ui uo Realice usted el clculo correspondiente y observar que tambin obtiene 20 formas de ordenar. Ahora, suponga que deseamos ordenar dos de las cinco vocales, con repeticin; los resultados son: aa ae ai ao au uu ua ue ui uo Usando la frmula de la permutacin, cuando existen repeticiones, nos arrojara el mismo resultado: 25 maneras de ordenar. Ejemplo 1. De cuntas formas diferentes se pueden realizar una primera, segunda, tercera o cuarta seleccin entre 12 empresas arrendadoras de equipos para construccin? ee ea ei eo eu ii ia ie io iu oo oa oe oi ou
13
r=4
Ejemplo 2. Un mecanismo electrnico de control requiere de 5 chips de memoria idnticos. De cuntas maneras puede ensamblarse este mecanismo colocando los cinco chips en las cinco posiciones del controlador. Solucin: Como podemos ver n = 5 y r = 5 Por tanto, 5P5 = 5! / (5 - 5)! = 120 La moraleja de este ejemplo es que el factorial de cero, es uno (0! = 1).
Tcnica 5. El nmero de formas para seleccionar r objetos -sin considerar el ordenentre n objetos (sin repeticin), es:
n
Cr = n! / [(n - r)!r!]
A C se le conoce como combinacin. n y r, tienen el mismo significado descrito anteriormente. Cuando hay repeticiones se utiliza la expresin C = (n+1)!/{[(n+1) - r]!r!} Suponga que se desea seleccionar dos de las cinco vocales, sin repeticin. Los resultados sern: ae ai ei ao eo io au eu iu ou
Utilice usted la frmula para verificar que slo hay diez maneras de seleccionar. Ahora, suponga que seleccionamos dos de las cinco vocales, con repeticin. Los resultados se presentan a continuacin: aa ae ai ao au 14
Ejemplo 1. De cuntas maneras diferentes pueden seleccionarse 3 de 20 asistentes de contabilidad para colaborar en una auditora? Solucin: Para n = 20 y r=3
20
C3 = 20! / (3!(20 - 3)!) = 1140 El 1140 representa el nmero total de maneras en las que se pueden seleccionar los ayudantes de contabilidad, sin importar el orden en el cual se haga la seleccin. Ejemplo 2. Se precisa la realizacin de un estudio de eficiencia para probar si los libros contables de 15 instituciones estatales estn bien ordenados, completos y tienen los elementos requeridos por hacienda. De cuntas maneras pueden seleccionarse 5 de las 15 instituciones, para la investigacin? Solucin: n = 15 y r=5
15
Ejercicios
Nadie dijo que esto sera totalmente fcil, pero cules son las cosas fciles de la vida? A continuar con la lucha! 1. Entre 7 personas, de cuntos modos puede seleccionarse un comit de 4 personas? 2. Cuntos nmeros distintos de 4 cifras (sin repeticiones) se pueden formar con los nmeros 1, 2, 3, 4, 5, 6, 7, 8, 9? Con repeticiones? 3. Se lanza un dado 4 veces. Cuntos posibles resultados existen? 4. De cuntas formas se pueden ordenar los caracteres del alfabeto britnico? 5. De cuntas maneras se pueden ordenar los nombres de los compaeros de clase? 6. Cuntas combinaciones (con repeticiones) distintas de 3 cifras se pueden formar con los nmeros 4, 5, 6, 7, 8 y 9?
15
Espacio muestral:
Es la coleccin de todos los posibles resultados de un experimento aleatorio y lo denotaremos por S. Este se puede representar de lista o diagrama de rbol. Suceso o eventos: Es cualquier subconjunto del espacio muestral S. Se dice que ha ocurrido el suceso A cuando al efectuar una prueba del experimento aleatorio obtenemos como resultado uno de los puntos muestrales que componen el suceso A. En caso contrario diremos que no se presenta el evento A. Ejemplo 1. Si se lanza un dado al aire, los resultados que pueden obtenerse son: 1, 2, 3, 4, 5 y 6. Luego el espacio muestral es S = {1, 2, 3, 4, 5, 6} De este espacio muestral podemos extraer algunos sucesos: El suceso, caer un nmero par, es: A = {2, 4, 6} El suceso, caer un nmero impar, es B = {1, 3, 5} El evento, caer mltiplo de tres, es C = {3, 6} Ejemplo 2. El espacio muestral asociado al experimento aleatorio de lanzar una moneda de un crdoba, es: S = {e, 1}. De este espacio muestral, son sucesos todos los subconjuntos de S; es decir: , {e}, {1}, s. Sucesos simples: Es el formado por un slo punto muestral (un valor posible del experimento). Ejemplo. Sea el espacio muestral S = {1, 2, 3, 4, 5, 6} Los sucesos simples seran A = {1}, B = {2}, etc. Sucesos compuestos: Son los sucesos formados por dos ms puntos muestrales.
16
n(A) / n(S)
n(S) es el nmero total de veces que se repite el experimento (cardinalidad del espacio muestral). n(A) es el nmero de veces que aparece el resultado (cardinalidad del evento). n(A)/n(S) es la frecuencia relativa. Axiomas de probabilidad: 1. P(S) = 1 Este axioma dice que si un suceso ocurre con certeza, entonces la probabilidad de ese suceso es uno. 2. 0 P(A) 1 Este axioma nos indica que la probabilidad de cualquier suceso nunca es negativa. 3. P() = 0 Este axioma se refiere a que si un suceso es imposible, su probabilidad es cero. 4. P(X1) + P(X2) + P(X3) + + P(Xi) = 1 Este axioma nos dice que cuando los eventos son igualmente verosmiles, la suma de las probabilidades es 1. Propiedades de las probabilidades: 1. P(A) = 1 - P(A) La probabilidad de que no ocurra un evento; es igual a 1, menos la probabilidad de que ste ocurra. 2. Si A y B son dos sucesos mutuamente excluyentes, entonces 17
19
Probabilidad condicional:
La probabilidad condicional de un evento A ya que ha ocurrido un evento B, se define de la siguiente forma: P(A/B) = P(A B) / P(B) P(B) 0 Regla de la multiplicacin: A menudo la expresin anterior se utiliza en una versin un poco distinta y se le conoce como regla general de la multiplicacin. P(A B) = P(B) P(A/B) Ejemplo 1. Sean A y B sucesos tales que P(A) = 1/2, P(B) = 1/3 y P(A B) = 1/4 Encuentre P(A/B) y P(B/A). Solucin: De la definicin de probabilidad condicional, vemos que: P(A/B) = 1/4 1/3 = Esto significa que la probabilidad de que ocurra el suceso A dado que el suceso B ya ocurri, es del 75%. Ahora, la probabilidad de que ocurra B dado que ya ocurri A, es: P(B/A) = = 1/2 Lo cual muestra una probabilidad del 50%. Ejemplo 2.
21
Ejercicios
Hay hombres que luchan un da y son buenos, hay otros que luchan un ao y son mejores, hay quienes luchan muchos aos y son muy buenos; pero hay los que luchan toda la vida esos son los imprescindibles! 1. Una organizacin de investigacin del consumidor ha estudiado los servicios dentro del periodo de garanta que ofrecen los 50 distribuidores de automviles nuevos en cierta ciudad y sus hallazgos se resumen a continuacin:
Tiempo en el negocio Brindan un buen servicio dentro del perodo de garanta. Dan mal servicio dentro del periodo de garanta
16 10
4 20
Si una persona selecciona aleatoriamente uno de los distribuidores de autos nuevos. Cul es la probabilidad de que a. elegir uno que ofrezca un buen servicio de garanta? b. encuentre alguno que ofrezca un buen servicio de garanta, dado que ha estado en el negocio por ms de 9 aos? c. obtenga un mal servicio en el perodo de garanta, dado que el distribuidor tiene menos de 10 aos en el negocio? d. elija uno que brinde un buen servicio de garanta y tenga menos de 10 aos en el negocio? 2. Si la probabilidad de que un sistema de comunicacin tenga alta fidelidad es 0.81 y la probabilidad de que tenga alta fidelidad y alta selectividad es 0.18. Cul es la probabilidad de que un sistema tenga alta selectividad dado que tiene alta fidelidad
22
Al seleccionar una de las personas al azar. Cul es la probabilidad de qu: a. use automvil, dado que es del rea rural? b. use transporte pblico, dado que es citadino? 4. Una casa vendedora de ropa mediante pedidos por correo, comercializa dos lneas de produccin, una relativamente cara y otra econmica. Un registro de 1000 pedidos produjo la frecuencia de los pedidos por lneas de productos y por el sexo de los clientes, como se detalla en la tabla siguiente. Suponga que se selecciona uno solo de los pedidos. Calcular la probabilidad de que: a. el consumidor sea mujer? b. el pedido sea para la lnea de produccin 1 y que el consumidor sea mujer? c. el consumidor sea hombre o el pedido sea para la lnea 2? 5. En una encuesta de mercadeo para un gran almacn, se clasific a los clientes de la tienda segn el sexo y su residencia, la informacin se resume en la siguiente tabla: Residencia Suburbio Se selecciona un consumidor Masculino 170 40 al azar. Encuentre Femenino 70 120 probabilidad de
la
que:
a. el consumidor resida en la ciudad o sea mujer? b. el consumidor resida en los suburbios o sea hombre? c. sea citadino dado que es mujer? 6. Se extrae dos cartas de un mazo comn. Cul es la probabilidad de que: a. ambas sean ases? b. las dos sea ases negros? c. ambas sean cartas altas (as, rey, reina, jota y diez)? Sugerencia: Utilice la regla de la multiplicacin. Adems, tome en cuenta (en el primer inciso) que la segunda as est condicionada por que ya se sac una as. Si logra hacer el primer inciso, el resto tiene un tratamiento similar.
23
a. Cul es la probabilidad de seleccionar a alguien que tenga como rea de inters enfermera, dado que es mujer? b. Cul es la probabilidad de seleccionar a un estudiante cuya rea de inters sea Psicologa, dado que es hombre? c. Cul es la probabilidad de que sea hombre o tenga como rea de inters Contabilidad? d. Cul es la probabilidad de que sea mujer y sea de Psicologa?
VI. TEOREMA DE BAYES Teorema de Bayes. El teorema de Bayes permite calcular la probabilidad de un evento A i cualquiera, perteneciente a una familia de eventos exhaustivos y mutuamente excluyentes, si sabemos que ha ocurrido un evento B del espacio muestral. Siempre que P(Ai) y P(B/Ai) sean conocidos. Este teorema se expresa P(Ai/B) = P(B/Ai) P(Ai)
P(B/A ) P(A )
i i
La expresin P(B/Ai) P(Ai) se conoce como el teorema de probabilidad total. Ejemplos 1. En una universidad de la capital, en que slo hay estudiantes de arquitectura, ciencias y letras; terminan la carrera, el 5% de arquitectura, el 10% de ciencias y el 20% de letras. Se sabe que el 20% estudian arquitectura, el 30% ciencias y el 50% letras. Eligiendo un estudiante al azar, hallar lo siguiente: 24
a. Podemos dar respuesta al inciso a este inciso utilizando la regla de la multiplicacin; es decir P(A T) = P(A) P(T/A) = (0,20)(0.05) = 0.01 Esto implica que la probabilidad de que el estudiante escogido sea de arquitectura y haya terminado la carrera, es del 1%. b. Para calcular la probabilidad establecida utilizamos el teorema de Bayes P(A/T) = . P(T/A) P(A) . P(T/A) P(A) + P(T/C) P(C) + P(T/L) P(L) P(A/T) = 0.05 0.2 / (0.05 0.2 + 0.1 0.3 + 0.2 0.5) = 1/14. Cul es el significado de dicho clculo? Ejemplo 2. A medida que ciertos artculos llegan al final de una lnea de produccin, un inspector elige aquellos que sern sometidos a una inspeccin completa. 10% de todos los artculos producidos son defectuosos. Sesenta por ciento de todos los artculos defectuosos y 20% de todos los artculos buenos son sometidos a una inspeccin completa. Dado que un artculo es sometido a una inspeccin completa, cul es la probabilidad de que sea defectuoso? Solucin: Sea D: El artculo producido es defectuoso. D; El artculo producido no es defectuoso. I: El artculo es sometido a una inspeccin completa. As, P(D) = 0.10, P(D) = 0.90, P(I/D) = 0.60 y P(I/D) = 0.20
25
Ejercicios
Es probable que se sienta agotado(a) y no desee avanzar ms, reglese la oportunidad de alcanzar la cima, aun cuando parece no poder ms!
26
27
28
Ejercicios
1. Se arrojan honestamente tres monedas de un crdoba y se define: A: las dos primeras son escudo. B: la ltima moneda es escudo. C: las tres monedas salen escudo. a. Son A y B, independientes? Justifique. b. Son A y C, independientes? Justifique. c. Calcule p(A B) 2. Cierto mecanismo electrnico tiene dos luces y conoce que se encienden o se apagan con las siguientes frecuencias relativas a largo plazo: Luz 2 Si No Luz 1 Si 0.15 0.45 No 0.10 0.30 Por ejemplo, esa tabla significa que ambas luces estaban simultneamente apagadas en un 30% del tiempo. a. Encuentre la probabilidad de ambas luces estn encendidas. b. Encuentre la probabilidad de que luz 1 est encendida y luz 2 apagana.
La utilidad de la variable aleatoria es que el espacio muestral original se reduce a un espacio muestral ms pequeo y conveniente, de naturaleza numrica. Adems, el espacio de muestra original se introduce para permitir el clculo de la distribucin de probabilidades para el nuevo espacio; una vez cumplido este objetivo, se olvida el antiguo espacio difcil de manejar. Por lo tanto, es fcil responder a las interrogantes relativas a este nuevo espacio. Importante: Todos los teoremas acerca de variables aleatorias discretas son igualmente vlidos para variables aleatorias continuas, donde las integrales reemplazan a la suma. Para evitar una duplicacin onerosa, solamente trato lo concerniente a la variable aleatoria discreta. Por ejemplo: Cul es la probabilidad de un varn o menos? Para responder a esta interrogante, simplemente sumamos las probabilidades que hay en el nuevo espacio muestral, es decir: P(X 1) = p(0) + p(1) = 1/8 + 3/8 = 1/2 Si se hubiera utilizado el espacio muestral original, tambin se podramos haber encontrado la respuesta; pero sera ms difcil encontrarla. Intente usted alcanzar el mismo resultado, utilizando el espacio muestral original. 30
Media, Varianza y desviacin tpica de una variable aleatoria discreta . A la media x, la varianza S2 y la desviacin tpica S de la muestra se pueden calcular a partir de la distribucin de frecuencias. Es natural que se calculen los valores anlogos a partir de la distribucin de probabilidad y que se denominen media , varianza 2 y desviacin tpica de la distribucin de la probabilidad p(x), o de la variable aleatoria X misma. Incluso, se las puede llamar , 2 y , de la poblacin. Media de poblacin = x p(x)
Varianza 2 = (x - )2 p(x) El clculo de la varianza puede simplificarse mediante la expresin 2 = x2 p(x) - 2 Ejemplo. Dada la siguiente distribucin de probabilidad. Calcule su media y varianza poblacional. x P(x) 1 1/10 2 2/10 3 3/10 4 4/10 Solucin: Construimos una tabla para facilitar la observacin de los clculos x p(x) x p(x) (x - )2 1 2 3 4 1/10 2/10 3/10 4/10 1 1/10 4/10 9/10 16/10 3 4 1 0 1
Ejercicios
nimo! No es el momento de flaquear. 1. A un importador le ofrecen un cargamento de mquinas por C$ 140 000 y las probabilidades de que las venda en C$ 180 000, C$ 170 000, o C$ 150 000 son: 0.32, 0.55 31
a. Cul es la cantidad media para el nmero de repeticiones? b. Determine la desviacin estndar. 3. El director de admisin de una universidad, estim, como sigue, la admisin de estudiantes para el semestre de verano con base en pasadas experiencias Admisiones Probabilidad 1000 35% 1200 25% 1500 15% 1800 15% 2000 10% a. Cul es el nmero de estudiantes admitidos para el semestre de verano? b. Evale la desviacin estndar. 4. Un individuo, vende automviles nuevos para una empresa. Generalmente negocia el mayor nmero de autos los sbados. Ha establecido la siguiente distribucin de probabilidades para el nmero de autos que espera vender en un sbado particular. Autos vendidos 0 1 2 3 4 a. En un sbado comn, cuntos autos espera vender? b. Cul es la desviacin tpica? 5. Al planificar una familia de 4 nios, encuentre la distribucin de probabilidad de: 32 Probabilidad 0.10 0.20 0.30 0.30 0.10
-(1/2)z
33
z En el grfico anterior podemos ver que el mximo se alcanza en z = 0. La frmula anterior confirma tal argumento: a medida que nos vamos ms hacia la derecha o izquierda de 0, z 2 aumenta en el exponente negativo; en consecuencia p(z) disminuye, y se acerca a cero en ambos extremos. Adems, esta curva es simtrica: dado que z aparece solamente en forma cuadrtica (-z genera la misma probabilidad en p(z) que +z). Esto establece la forma de esta curva normal estndar. Utilizando el clculo integral podemos demostrar que z = 0 y z = 1
Por sta razn, que z se denomina variable normal estndar. La probabilidad (rea bajo la curva) comprendida por la curva normal por encima de cualquier valor especificado tambin requiere del manejo del clculo integral para una evaluacin exacta, pero se puede representar grficamente sin dificultad. La evaluacin de las integrales est en la Tabla I del apndice. Cmo utilizar la tabla I? Ejemplo 1. Digamos que nos piden calcular la siguiente probabilidad P(z 0.6). Solucin: Nos ubicamos en el valor correspondiente 0.6 de la tabla I, como le corresponde 0.2743; podemos decir que P(z 0.6) = 0.2743 Ejemplo 2. Supongamos que se necesitamos establecer p(0.6 z 1.3) Solucin: Si hacemos un anlisis de las desigualdades en la campana de Gauss, fcilmente nos daremos cuenta que P(0.6 z 1.3) = p(z 0.6) - p(z 1.3) = 0.2743 - 0.0968 = 0.1775 Ejemplo 3. Supongamos que necesitamos determinar p(-1 z 2).
34
Ejercicios
A trabajar! La recompensa se ver en el futuro. 1. Si z es una variable normal estndar, utilice la tabla I para evaluar a. p(-1 z 1) b. p(- z 1.64) c. p(-2.33 z +) d. p(-2 z)
35
4. Suponga que se elige al azar un tornillo de una lnea de produccin y que ste tiene una longitud X que es una variable aleatoria normal con 10 cm y desviacin estndar 0.2 cm. Cul es la probabilidad de que su longitud est entre 9.9 y 10.1 cm? 5. Suponga que la poblacin de las estaturas de los hombres estn normalmente distribuidas con una media de 68 in, y con una desviacin estndar de 3 in: Encuentre la proporcin de hombres que: a. tienen ms de 6 ft; b. tienen menos de 5 ft y 6 in; c. estn entre 5 ft 6 in y 6 ft. 6. Sea h una variable aleatoria distribuida normalmente con media 26.7 y desviacin tpica 3.4. Halle la probabilidad que un valor individual de h, seleccionado aleatoriamente, se encuentra en los intervalos siguientes: a. entre 26.7 y 31.7 b. entre 20.0 y 24.0 c. entre 28.0 y 30.0 d. entre 20.0 y 30.0 7. Las lecturas del colesterol (en mg/dl) correspondientes a personas adultas de un grupo de edad particular, estn distribuidas normalmente con media 210 y desviacin tpica 15. Qu porcentaje de esta poblacin tiene lecturas: a. mayores que 250? b. Mayores que 150? 8. La vida til de de una lmpara fluorescente, utilizada en invernaderos, est distribuida normalmente con media de 600 horas y desviacin estndar de 40 horas. Determine la probabilidad de que: a. Una lmpara elegida al azar tenga una vida til entre 620 y 680 h. b. Tal lmpara dure ms de 740 h. 36
II. DISTRIBUCION BINOMIAL Existen diversos tipos de variable aleatoria discreta. Slo estudiaremos un tipo: el binomial. El ejemplo clsico de variable binomial es el siguiente: S = cantidad de escudos en n lanzamientos de una moneda (de un crdoba). Para generalizar nos referiremos a n intentos independientes, cada uno de los cuales resulta en xito o fracaso, con probabilidades respectivas de p y q (q = 1 - p). Entonces, el nmero de xitos S se denomina variable aleatoria binomial. Ahora deduciremos una frmula sencilla para la distribucin de probabilidad p(s). Como ejemplo, consideremos el caso especial en el que se calcula que ser probable obtener 3 caras al arrojar 5 veces una moneda sesgada, tal como muestra el siguiente espacio muestral:
EEEEE EEEEU EEEUE EEUEE EEUUU EUEEE EEUUE UEEEU EEEUU EEUEU EUEEU EUEUE EUUEE UEEUE UEUEE UUEEE EUEUU EUUEU EUUUE EUUUU UEEEE UEEUU UEUEU UEUUE UEUUU UUEEU Conjunto de resultados 5 ensayos n ensayos E E EE E E E E....E U . . . . E E EE U.U U . . . . . . . . U UU E E EE . . . . . . . . . .
S=3
S=s
37
Concentrmonos en el evento tres caras (S = 3), y desarrollamos todos los resultados comprendidos por l. En cada uno de ellos, E aparece tres veces y U dos. Dado que la probabilidad de E es p y de U es (1 - p), Por ejemplo, la secuencia EEEUU 3 2 Tiene probabilidad p p p (1 - p) (1 - p) = p3 (1 - p)2 entonces, en general, la secuencia E EE U UU s veces (n - s) veces tiene probabilidad p p p (1-p) (1-p) (1-p) = ps (1 - p)n-s
donde esta multiplicacin simple se justifica por la independencia de los intentos. Adems, cabe notar que todos los otros resultados en este evento tienen la misma probabilidad. Ahora slo resta determinar cuntas secuencias de este tipo (resultados) estn incluidas en el evento analizado. Esto corresponde precisamente a la cantidad de formas en las que se pueden ubicar los tres escudos y los dos unos. Lo cual podemos hacer por medio de una combinacin y la expresin que define una distribucin binomial queda determinada por: p(s) = nCs ps (1 - p)n-s Ahora calculemos la probabilidad de obtener s = 3 caras en n = 5 lanzamientos. Primero calculamos 5C3 = 10 y ya vimos que p3 (1 - p)2 = (1/2)3 (1/2)2 = 1/32 As, la probabilidad es: p(3) = p(X = 3) = 10 1/32 = 10/32. Este resultado podamos obtenerlo usando la tabla II del apndice, basta conocer n y s = x, para observa que nos da el mismo 0.3125. Es conveniente utilizar esta tabla cada vez que sea posible para evitar tediosos clculos, aunque su uso es opcional. Media y varianza de una distribucin binomial. La media la podemos calcular por medio de la expresin =np La varianza la podemos calcular, utilizando la expresin 2 = n p q
38
Ejercicios
III DISTRIBUCION DE POISSON La distribucin de Poisson es una distribucin de probabilidad que en muchas ocasiones prcticas es muy importante. Un proceso de Poisson no slo representa nmeros de fenmenos discretos, sino que el modelo de Poisson se usa para proporcionar aproximaciones a la distribucin binomial. Como ejemplos de fenmenos que dan distribucin de Poisson, son: Nmero de llegadas de carros, en el da, en un peaje. Nmero de manchas en una yarda cuadrada de tela. Nmero de accidentes industriales por unidad de tiempo. La distribucin de probabilidad para una variable aleatoria de Poisson est dada por:
39
IV. DISTRIBUCION DE LA T DE student Supondremos que las poblaciones originales son normales; de otro modo la distribucin t slo sera aproximadamente vlida. Al calcular una media de poblacin con una media muestral x, por lo general el estadgrafo no dispone de informacin acerca de la desviacin estndar de poblacin . Por lo tanto, se debe usar la desviacin estndar muestral s.
40
41
Para un tamao de muestra general n, se tiene el intervalo de confianza del 95% para la media de poblacin: = x t0.025 s/n Donde t0.025 es el valor crtico t que deje 2.5% de probabilidad en el extremo superior, con n - 1 grados de libertad. Si el tamao de la muestra es grande, la normal es una aproximacin bastante exacta de t. En la prctica, la distribucin t slo se utiliza para pequeas muestras cuando se desconoce , en los otros casos se emplea la normal. A medida que disminuye el tamao de la muestra n, el valor estimado pierde precisin. Esto se hace evidente cuando observamos el divisor n por que ste se hace ms pequeo.
Ejercicios
Quin dijo miedo?! 1. Diecisis estaciones meteorolgicas de un estado -de lugares escogidos al azar- miden las precipitaciones. En 1967 se registr un promedio de 10 pulg. y una desviacin estndar de 1.5 pulg. Para la precipitacin media del estado construya un intervalo de confianza del 95%. 2. Se control la velocidad promedio de 110 km/h de 100 automviles en una autopista (desviacin estndar de 6 kilmetros por hora). Construya un intervalo de confianza del 95% para la velocidad media de todos los autos en dicha autopista.
42
V. DISTRIBUCION JI CUADRADA Ahora analizaremos otro ejemplo de intervalo de confianza; este ejemplo es importante, no tanto por su valor prctico, sino por los conocimientos que aporta. Sea una distribucin normal N(, 2) donde se desconocen tanto como 2. hasta ahora, la variancia de muestra y poblacin se calcularon como medio para determinar un intervalo de confianza para la media muestral. Suponga que la atencin recae en y no en . Por ejemplo, se podra preguntar: Qu varianza tiene la balanza de pagos de Japn? El propsito de esta pregunta es obtener alguna indicacin de los requerimientos del Japn en cuanto a reservas de moneda extranjera. Tambin se puede preguntar: Cul es la varianza del ingreso agrcola?, para evaluar una poltica de estabilizacin del Japn, de ser necesaria. Para calcular la varianza se supondr que la poblacin est normalmente distribuida. Para saber cmo est distribuido el indicador s2 entorno a 2, generalmente se utiliza la definicin de la variable denominada ji cuadrada C2 = s2/2
Es evidente que cuando s2/2, esta razn es 1; de modo que la pregunta ahora sera Cmo est distribuida C2 en torno a 1? Los valores crticos se presentan en la tabla IV del apndice, tabulados de acuerdo a d.f. = n - 1, como la t de student. Para usar la tabla de C 2 ajustada se utiliza
C2 = x2 / d.f. Donde x2 es la ji-cuadrada ordinaria. Como tanto el numerador como el denominador son positivos en C 2; por lo tanto, la variable C2 tambin lo es, con su distribucin situada a la derecha de cero. Advierta que la distribucin es asimtrica hacia la derecha en valores de muestra pequea. Sin embargo, a medida que se agranda n, este sesgo desaparece y la distribucin de C2 se aproxima a la normalidad. Dado que s2 es un estimador no sesgado de 2, el valor esperado de cada una de eestas distribuciones C2 es 1. Adems, a medida que aumenta el tamao de la muestra, C 2 se encuentra cada vez ms cerca de 1, indicando que s 2 se convierte cada vez ms en un estimador preciso de 2.
43
Ejercicios
1. Si una muestra de 25 puntajes de cociente intelectual de cierta poblacin tiene s 2 = 120, construya un intervalo de confianza del 95% para la poblacin 2. 2. Se tomaron muestras independientes de dos cursos y se registraron las siguientes calificaciones: Muestra 1 Muestra 2 75 52 70 60 60 42 75 58 Construya un intervalo de confianza del 95% para: a) La primera muestra del problema. b) La segunda muestra del problema. c) La muestra combinada (utilice s2 promedio y d.f. = n1 + n2 - 2)
44
I. INTRODUCCION En las unidades anteriores analizamos la probabilidad y las variables aleatorias, de modo que ahora estamos en condiciones de resolver la cuestin deductiva bsica en Estadstica: Qu podemos esperar de una muestra aleatoria extrada de una poblacin? Ya hemos visto algunos ejemplos de muestreo: la encuesta de votantes -cuya muestra se extrae de la poblacin de todos los votantes-, la muestra de focos extrada de una poblacin total de focos, una muestra de estatura de hombres tomada de la poblacin total, una muestra de 2 fichas de un recipiente con fichas. Existen diversas formas de llevar a cabo el proceso fsico del muestreo aleatorio. Por ejemplo, suponga que se quiere extraer una muestra aleatoria de una poblacin de estudiantes en el aula. 1. El mtodo ms grfico consiste en registrar a cada persona en una ficha de cartn, mezclar todas estas fichas en un recipiente grande y luego extraer la muestra. 2. Un mtodo ms prctico es el de asignar un nmero a cada persona y posteriormente extraer una muestra aleatoria de nmeros. Observacin importante: En poblacin grande, como en el caso de millones de personas, el hecho de que reemplacemos o no cada ficha antes de extraer la siguiente, prcticamente no establece ninguna diferencia. Despus de todo, qu es una ficha en un milln? Sustancialmente, no modifica las frecuencias relativas, p(x). Sin embargo, en poblaciones pequeas, el reemplazo de cada ficha muestreada es una cuestin importante.
Suma muestral
45
Como S es la suma de variables aleatorias, tambin ser una variable aleatoria. Cmo flucta? En particular, cul es su media y cul su varianza? Como ya conocemos las propiedades de las funciones, podemos decir que: E(S) = E(X1) + E(X2) + + E(Xn) Utilizo E (valor esperado) para evitar confusin. Como el valor esperado de cada Xi es , tal que: E(S) = + ++ E(S) = n La varianza de S se puede determinar anlogamente, por que todos sus componentes variables son independientes, podemos decir que: var(S) = var(X1) + var(X2) + + var(Xn) var(S) = 2 + 2 ++ 2 var(S) = n2 s = n Esta es una deduccin importante: hemos inferido el comportamiento de una suma muestral a partir del conocimiento de la poblacin original. Por ejemplo, suponga una muestra de n = 4 observaciones que se extrae de una poblacin de estaturas
Densidad de probabilidad = 3.2
=69
78
altura (pulg.)
46
La media muestral
A partir de lo anterior es fcil deducir la media muestral: X = (1/n) (X1 + X2 ++Xn) Por definicin X = (1/n) S As obtenemos lo que se conoce como esperanza matemtica E(X) = (1/n)E(S) = (1/n) (n) E(X) = Esperanza matemtica
Cuestin que ya habamos advertido con anticipacin y, que ya se vea venir. Anlogamente se obtiene la varianza, tambin conocido como error estndar var(X) = (1/n)2 var(S) var(X) = (1/n)2 n2 var(X) = 2/n x = /n Error estndar de la media
Por ejemplo, consideremos una vez ms la muestra de cuatro observaciones extrada de una poblacin de estaturas representada en el grfico de la pgina anterior. La media muestral X oscila alrededor de: E(X) = Con desviacin estndar x = /2 Teorema del lmite central A medida que aumenta el tamao de la muestra n, la distribucin de la media, X, de una muestra aleatoria extrada de prcticamente cualquier poblacin se aproxima a la distribucin normal (con media y desviacin estndar /n).
47
Ejercicios
1. En cierto edificio de oficinas, la poblacin de empleados tiene pesos distribuidos en torno a una media de 150 lb, con una desviacin estndar de 20 lb. Un grupo de 25 empleados, escogidos al azar, utiliza el ascensor todas las maanas. Encuentre la media y la varianza de: a) El peso total S. b) El peso promedio. 2. Un recipiente contiene seis fichas numeradas del 1 al 6. Se extrae con reemplazo una muestra de 2 fichas. a) Calcule la distribucin de S = X1 + X2 tabulando la distribucin conjunta de X1 y X2. b) Determine la media y la varianza de S
48
Intervalo de confianza
Ya sabemos que la media y varianza de poblacin, y 2, son constantes (a pesar que generalmente son desconocidos) y reciben el nombre de parmetros de poblacin. Por el contrario, la media muestral X y la varianza muestral s 2 son variables aleatorias que cambian de muestra a muestra con cierta distribucin de probabilidad. De acuerdo al teorema del lmite central X N (, 2/n). Partamos del siguiente ejemplo: suponga que se quiere estimar la estatura promedio de los hombres en una gran universidad de la capital. Esta media de poblacin es un parmetro fijo, pero desconocido. Se calcula tomando una muestra de 25 hombres, por ejemplo. Suponga que la media muestral X resulta de 68 pulgadas. Gracias a la teora del muestreo sabemos que, a menos que seamos muy afortunados, este valor estimado X no estar totalmente ajustado, sino que ms bien ser un poco ms alto o un poco bajo (X est distribuida en torno a ). Si se quiere tener confianza en la correccin de la inferencia, no se puede pretender que sea precisamente igual a la X observada; debemos hacer una concesin -conocida como intervalo de confianza- en la siguiente forma: = X error de muestreo En primer trmino hay que decidir qu grado de confianza buscamos para la correccin de nuestro valor estimado de intervalo; ciertamente, se espera que ese valor incluya a , lo usual es elegir un intervalo de confianza del 95%. Esto implica que nos queda fuera un 2.5% (0.025) por el extremo superior de la distribucin normal. Considerando la distribucin t de student, el error estndar de la media y la tabla III (observe que tambin lo verifica la tabla I). Formulamos: p( - 1.96/n < X < + 1.96/n) = 95%
49
Ejercicios
Querer, es poder. 1. Se seleccionaron al azar 40 calificaciones de las obtenidas por un grupo numeroso de estudiantes de Estadstica 71 49 78 58 74 83 64 86 65 58 55 64 72 65 87 56 64 68 56 45 42 60 50 73 62 76 71 54 62 86 58 86 58 74 57 70 82 53 75 73
Construya un intervalo de confianza del 95% para la calificacin promedio de la totalidad del curso. 2. Los tiempos de reaccin de 150 conductores escogidos al azar tienen una media de 0.83 segundos y una desviacin estndar de 0.20 segundos. Encuentre un intervalo de confianza para el tiempo medio de reaccin de la poblacin total de conductores. 3. para el ejercicio 1 de la pg. 42 (el que trata sobre las estaciones meteorolgicas). Construya un intervalo de confianza del 99%. 4. Un antroplogo midi (en pulgadas) las estaturas de una muestra aleatoria de 100 hombres de cierta poblacin y, estableci que la media y varianza muestrales eran 71 y 9, respectivamente. a) Encuentre un intervalo de confianza del 95% para la estatura media de la poblacin total. b) Determine un intervalo de confianza del 99%.
50
Diferencia de dos medias (1 - 2), muestras independientes Se supondr que, como ocurre con frecuencia, auque las dos poblaciones pueden tener medias diferentes, tienen una varianza comn. Cuando se conoce 2, la expresin del intervalo de confianza de la pgina anterior es adecuada; cuando es desconocida hay que calcularla. La estimacin apropiada consiste en sumar todas las desviaciones cuadrticas de ambas muestras y despus dividirlas entre los grados de libertad (n 1 - 1) + (n2 - 1), a efecto de obtener un estimador no sesgado que se denomina varianza muestral conjunta: 1 [(X1i - X1)2 + (X2i - X2)2] Las sumatorias van hasta n1 y n2, respectivamente. (n1+n2-2) Donde X1i (o X2i) es la i-sima observacin en la primera (o segunda) muestra. Adems, la sustitucin de por sp en la expresin del intervalo de confianza para la diferencia de medias, requiere el uso de la distribucin t, y obtenemos S2p = Intervalo de confianza del 95% para la diferencia de medias 1 - 2 = (X1 - X2) t0.025 sp (1/n1 + 1/n2) Donde t0.025 es el valor crtico con d.f. = n1 + n2 - 2.
51
S2p = 1 (398 + 186) = 584/5 = 117 (4+3-2) d.f. = 5 Sustituyendo en la frmula de muestras independientes, se obtiene el intervalo de confianza del 95% para la diferencia entre las dos medias del curso, (1 - 2) = (74 - 60) 2.57117 (1/4 + 1/3) = 14 21.1 El valor 2.57 se obtiene de la tabla III. En esta forma se ve que la gran diferencia en las medias muestrales queda oscurecida por una tolerancia de error de muestreo an ms grande; sobre todo, esa tolerancia es la consecuencia de la pequeez de la muestra. Este procedimiento no slo requiere que la varianza de las calificaciones sea la misma en los dos cursos, sino tambin que las
muestras se hayan extrado de forma independiente . Por ejemplo, no se puede muestrear un par de individuos que estudien juntos, uno de cada grupo, puesto que podran tener hbitos de estudio muy semejantes y, quiz, sus exmenes fueran muy parecidos
Diferencia de dos medias (1 - 2), muestras apareadas Ahora supongamos que muestreamos dos grupos de estudiantes en un mismo grupo de la UML-San Carlos. En el caso de comparar las calificaciones obtenidas en los trimestres de invierno y verano, supngase que se desea recurrir dos veces a los mismos estudiantes en ambas muestras; entonces, no cabe la aplicacin de la frmula de la pgina anterior que requiere que las muestras sean independientes. El primer paso lgico es determinar de qu manera cambi cada estudiante; es decir, hay que calcular la diferencia D = X1 - X2 para cada uno (o lo que conduce a la misma conclusin X2 - X1). Una vez que se hayan calculado estas diferencias se pueden descartar los datos originales que ya cumplieron con su finalidad. Se procede a tratar la diferencia D como una muestra nica y se analiza tl como se hace con cualquier muestra nica (como la
52
(D - D) -4 -2 5 1 0
Ejercicios
1. Antes y despus de cierto tratamiento, se mide la capacidad respiratoria de cinco personas elegidas al azar y se obtienen los datos que se consignan a continuacin. Sea X (y Y) la capacidad media de toda la poblacin antes (y despus) del tratamiento. Construya un intervalo de confianza del 95% para (Y - X) Capacidad respiratoria Antes (X) Despus (Y) Persona A 2750 2850 B 2360 2380 C 2950 2930 D 2830 2860 E 2250 2320
53
Diferencia de proporciones a) Muestras grandes Para comenzar, una proporcin muestral P(S/n, suma muestral vs el tamao de la muestra), es una media muestral X disfrazada que se extrae de una poblacin en el que la variable aleatoria tiene dos posibles resultados 1 (es, existe, etc.) o 0 (no es, no existe, etc.). Un ejemplo de este tipo de variable es X: cantidad de votos emitidos a favor del FSLN De esto podemos decir que se vota a favor o en contra; as, la variable toma los siguientes valores X = 0 si no es FSLN = 1 si es FSLN Por ejemplo, si se observa 4 Sandinistas en una muestra de 10, entonces: P = X = 1/10 (1 + 1 + 0 + 0 + 0 + 1 + 0 + 1 + 0 + 0) = 4/10. Anlogamente, la proporcin de poblacin es la media disfrazada en el mismo tipo de poblacin. Por lo tanto, para construir un valor estimado de intervalo para una proporcin podemos transformar la expresin obtenida en el intervalo de confianza (pg. 49). As, con una muestra grande se tiene el intervalo de confianza del 95% para Intervalo de confianza del 95% para la proporcin, n grande = P z0.025P (1 - P)/n Donde z0.025 es el valor crtico que deja 2.5% de probabilidad en el extremo superior.
54
Ejercicios
1. En una encuesta realizada en 1970 sobre 1063 estudiantes universitarios, en USA, se determin que el 49% de los entrevistados pensaba que se producira un cambio en Estados Unidos en los siguientes 25 aos; adems, afirmaban que ese cambio se realizara pacficamente y no por medio de una revolucin. a) Construya un intervalo de confianza del 95% para la proporcin de poblacin . b) Repita (a) suponiendo que se observ la misma proporcin muestral de 0.49en una muestra de 100. Compare. 2. Como respuesta a la pregunta de la encuesta anterior, el 50% de los estudiantes de 18 aos de edad o menos dio la misma respuesta que el 69% de aquellos de 24 aos y mayores a ella. a) Si se supone que se muestrearon 300 estudiantes en cada grupo, cul es el intervalo de confianza para la diferencia en las proporciones de poblacin? b) Suponga que se observaron las mismas muestras P 1 y P2 en una muestra de 500 del grupo (18 aos o menos) y otra de 100 del segundo grupo (24 aos y ms). Construya otra vez un intervalo de confianza del 99% para la diferencia de las proporciones de poblacin.
55
III. HIPOTESIS De nuevo tomemos el ejemplo concerniente a las calificaciones obtenidas por estudiantes (analizado en los datos apareados, pg.52). En este ejemplo, el intervalo de confianza para la diferencia entre los promedios obtenidos en los trimestres de verano e invierno aproximadamente era: = 14 6 es decir, 8 < < 20 Esto significa que calculamos , con 95% de confianza, entre 8 y 20. Las hiptesis se hacen a travs de intervalos de confianza, los cuales debern indicar cules valores deben ser rechazados y cuales aceptados (los que aceptaremos sern los que estn en el intervalo de confianza). Por lo tanto: Un intervalo de confianza se puede considerar como el conjunto de las hiptesis aceptables. De particular inters es el valor = 0. Como representa la falta de diferencia (entre las calificaciones promedio), se denomina hiptesis nula Ho. Esa hiptesis se encuentra fuera del intervalo de confianza ( = 14 6), por lo tanto se rechaza. Al rechazarla se establece que efectivamente existe una diferencia entre las calificaciones correspondientes a los cursos de invierno y verano; en consecuencia, estos resultados se califican como estadsticamente significativos . La significacin estadstica implica que se recabaron datos suficientes para afirmar la existencia efectiva de una diferencia. No se pretende que dicha diferencia sea necesariamente importante. Por ejemplo, en otra prueba fundada en muestras muy grandes
56
Ejercicios
Para cada uno de los siguientes ejercicios, establezca si los resultados son estadsticamente significativos al nivel de confianza del 95% (nivel de significacin del 5%) 1. Para determinar la efectividad de cierta vitamina se obtuvieron los siguientes resultados: Aumentos de peso en dos grupos de ratas Grupo de control Grupo tratado 12 18 19 16 14 23 20 23 Suponga que 1 = 2 y construya un intervalo de confianza del 95% para el efecto de la vitamina, 2 - 1. 2. Para medir el efecto de un tratamiento de fumigacin area en contra de cierto insecto, se seleccionaron al azar 300 rboles de un monte. Se midi cada rbol antes y despus del tratamiento y entonces fueron clasificados en las cuatro clulas de la siguiente tabla. Despus Antes No infectado Infectado
No infectado 220 3 Infectado 32 45 Si x es la proporcin infectada en la poblacin de rboles antes del tratamiento y y despus del tratamiento, encuentre un intervalo de confianza del 95% para (y - x) el cambio en las tasas de infeccin (sugerencia: para cada uno de los 300 rboles, sea X una variable de conteo que sirva para medir si un rbol est o no infectado antes del tratamiento y, Y una variable de conteo que sirva para hacer la medicin despus del tratamiento. Por lo tanto, se pueden registrar los datos como en la siguiente tabla Tabla. Detalle de la tabla anterior, rbol por rbol X Y rbol # 1 1 0 2 0 0 3 0 0 57
Advirtase que los rboles n 2, 3 se encontrarn entre los 220 rboles clasificados en la clula superior izquierda de la tabla; los rboles n 1,4 se encontraran entre los 32 clasificados en la clula inferior izquierda, etc. Al estar comparando podemos utilizar la diferencia promedio entre las poblaciones) 3. Supongamos que para ingresar a la UML se requiera tener una entrevista con la sede de Nueva Guinea o sede San Carlos. A fin de probar que ambas sedes manejan las mismas normas, la universidad somete a 100 candidatos a una entrevista con ambas sedes. Adems, se trata de una muestra, extrada al azar, de la poblacin grande de todos los candidatos. El siguiente cuadro de frecuencia sintetiza el resultado Sede N/G Aceptado Rechazado Totales Sede S/C Aceptado 48 5 53 Rechazado 12 35 47 Totales 60 40 100 A primera vista, parece que la sede S/C tiene normas ms estrictas por que su tasa de rechazo en la muestra es 47%, mientras que la correspondiente a la sede N/G slo es 40%. a) Haga otro anlisis. Pruebas de hiptesis Todas las estrategias estudiadas hasta el momento nos permiten hacer pruebas de hiptesis. Consideremos en forma de resumen algunos complementos sobre este tipo de pruebas. Para ello consideremos la siguiente situacin: Mediante un proceso de manufactura, durante muchos aos, se produjeron tubos para televisores, con una vida media = 1200 horas, y una desviacin estndar = 300 horas. Se somete a prueba un nuevo proceso sobre una muestra de 100 tubos; el proceso da un nuevo promedio muestral de 1245 horas (se supone que la desviacin estndar permanece invariable) Tiene la media muestral significacin estadstica (es decir, difiere notablemente del valor Ho de 1200) a un nivel de confianza de: 1. 95% 2. 90% 3. 50% 4. 80% 5. 90% Solucin: Har el numeral 3, (el resto queda de tarea) Primero encontrar la media de poblacin para el nuevo proceso, con un intervalo de confianza 50%, por medio de la expresin 58
Valor (t0.25 = 0.678) que era evidente y como la muestra en grande podemos aproximar s. As, podemos comparar los valores 1. 1= 1225 1 = 25 0.678 300/10 5 < 1 < 45 2. 2= 1265 2 = 65 0.678 300/10 45 < 2 < 85 Como podemos ver, la media de muestra no tiene una significacin estadstica en un intervalo de confianza del 50%, por que su diferencia con la media de poblacin no se encuentra en ninguno de los intervalos. Observemos el grfico siguiente
Ho o = 1200 X observada = 1245
1225
1265
59
60
Si H1 es verdadera
1240 H1 X
Figura. Si Ho es verdadera, entonces es igual a la probabilidad de error cuando se rechaza la hiptesis verdadera Ho. Si Ho es falsa (es decir, H1 es verdadera), es igual a la probabilidad de error cuando se acepte la hiptesis falsa Ho. El valor crtico para esta prueba de significacin del 5% es X = 1249, calculado al observar la tabla I que un valor de z de 1.64 corta un extremo de 5% de la distribucin normal; es decir, z crtico = (x - )/(/n ) = 1.64 Despejando la media de muestra, obtenemos Xcrtico = 1249 En el ejemplo, la X observada, igual a 1245, permite considerar que Ho es aceptable (Para formular de nuevo esto debemos recordar que el valor de probabilidad es una medida de la credibilidad de Ho: si la credibilidad desciende por debajo de , entonces se rechaza Ho). En resumen, existe otra forma de analizar este procedimiento de prueba. Si se obtiene una X observada mayor a 1249, caben dos explicaciones: 1. Ho es verdadera, pero se tuvo muy mala suerte y una muestra X improbable. (Se naci para perder; incluso, cuando se apuesta 19 a 1 en nuestro favor se pierde. Ja, j aja.) 2. Despus de todo, Ho no es verdadera; de ah que no debe causar sorpresa que X observada sea tan grande. Errores de tipo I y II En el proceso de toma de decisin estudiado antes se corre el riesgo de cometer dos distintos tipos de error. El primero: rechazar errneamente la verdadera H o. El rechazo de Ho verdadera se denomina error de tipo I; su probabilidad es , el nivel de significacin de la prueba. Ahora bien, supngase que la hiptesis nula es falsa (es decir, es verdadera la alternativa H1). Entonces, estamos en un sistema diferente; la distribucin de X en torno a H 1 -bastante 61
Ejercicios
Ya hemos avanzado mucho, slo son unos pasos ms y 1. Complete los espacios en blanco. Considere el problema con el que se enfrenta un operador de radar cuya tarea es detectar aviones enemigos. Cuando aparece algo irregular en la pantalla debe decidir entre: Ho: todo est en orden; slo hay una pequea interferencia en la pantalla. H1: habr un ataque. En este caso, el error de tipo es una falsa alarma y error de tipo es una alarma omitida. A fin de reducir tanto como , el equipo electrnico se construy lo ms sensible y digno de confianza que fuera posible. 2. Una cafetera expende un promedio de 320 tazas de caf diarias, con una desviacin estndar de 40. Despus de hacer propaganda se comprob que se haban vendido 350 tazas durante 7 das. a. Influy la propaganda en el negocio? Calcule el valor de probabilidad. b. Si el propietario de la cafetera especifica que el error de tipo I de la prueba (nivel de significacin) tiene que ser 5%, rechazara la hiptesis de que el negocio no se modific? 3. Los registros informan que en una muestra aleatoria de 100 horas una mquina produjo un promedio horario de 678 artculos con una desviacin estndar de 25. Despus de instalar un dispositivo de control, la mquina produjo un promedio de 674 artculos por hora, con una desviacin estndar de 5, en una muestra aleatoria de 500 horas. Al sealar la disminucin de 4 artculos por hora en la media muestral, el gerente sostuvo que el dispositivo de control reduca la produccin. Por el contrario, el gremio afirm que esa disminucin era mera fluctuacin estadstica. Para resumir objetivamente la evidencia acerca del cambio verdadero o no de la produccin, calcule el valor de probabilidad.
Pruebas bilaterales de la hiptesis Como ejemplo, supongamos lo siguiente: una firma ha estado produciendo focos con una vida promedio de 800 horas. Ahora, desea probar una nuevo tipo de foco. Una muestra de 25 focos nuevos tiene una vida media X de 810 horas, con una desviacin estndar s = 30 horas. Puesto que es desconocida y la muestra es pequea, se debera emplear la distribucin t en lugar de la normal. Hay dos alternativas: Probar la hiptesis
62
t observada = |x - o| < t0.025 s/n o es aceptable. Esta condicin puede formularse de nuevo: H o es aceptable al nivel de significacin del 5% si o - t0.025s/n < X < o + t0.025 s/n Compruebe usted sta ltima expresin. Dada la muestra s, junto con la hiptesis o, esta condicin se convierte en Ho es aceptable si 788 < X < 812 Como la X observada (810) queda dentro de este intervalo, o es aceptable. 2. Alternativamente, la muestra podra utilizarse para construir un intervalo de confianza para . Al utilizar el mismo nivel de confianza del 95%, este intervalo de confianza es, sabemos que es = X t0.025 s/n 798 < < 822 Lo que muestro en la siguiente figura, donde comparo la prueba de hiptesis bilateral con el intervalo de confianza (usamos una muestra con media de muestra 810 y desviacin estndar de muestra 30)
Si X est en este mbito, aceptar o
a)
798 800
Valor hipottico o
810
valor observado X
Intervalo de confianza
b)
798 810 822 o
Para resumir la figura anterior se dira que en la prueba de hiptesis expuesta en el panel (a), la X observada = 810 queda en la regin requerida para aceptar a o. Al mismo tiempo, en el panel (b), o cae dentro del intervalo de confianza. Este es el punto clave: o ser una hiptesis aceptable si y slo si cae dentro de este intervalo de confianza. Esto resulta claro a partir del diagrama, dado que el intervalo 63
a)
800
Valor hipottico o
810.3
valor observado X
Intervalo de confianza
b)
799.7 810 o
Ejercicios
Nada es bueno o malo, salvo por comparacin. 1. Tres fuentes distintas afirman que el ingreso promedio de determinada profesin es de C$ 7200, C$ 6400 y C$ 6400, respectivamente. A partir de una muestra de 16
64
IV. ANALISIS DE VARIANZA Ya hicimos inferencia acerca de una media de poblacin y comparamos dos medias. Mediante el uso de tcnicas llamadas anlisis de variacin ahora compararemos r medias. Anlisis de varianza de un factor Suponga que se compara tres mquinas. Debido a que estas tres mquinas son manejadas por hombres la produccin por ahora est sujeta a una fluctuacin aleatoria. Con la esperanza de promediar y reducir as el efecto de esta fluctuacin, se extrajo una muestra aleatoria de 5 horas de cada una de las mquinas. Tabla. Produccin de tres mquinas Nmero de muestra Muestra de la mquina i Xi i=1 48.4 49.7 48.7 48.5 47.7 48.6 =2 56.1 56.3 56.9 57.6 55.1 56.4 =3 52.1 51.1 51.6 52.1 51.1 51.6 Promedio x = x = 52.2 Prueba de hiptesis De las numerosas preguntas que podran plantearse, una de las ms sencillas sera: Son las mquinas realmente distintas? O sea, son distintas las medias muestrales de la tabla debido a diferencias de las medias de la poblacin fundamental i (donde i representa el funcionamiento de la mquina durante el perodo de vida de la mquina)? O pueden atribuirse exclusivamente esas diferencias en Xi a las fluctuaciones aleatorias? Para ejemplificar supongamos que se extrajo de tres muestras similares, pero ahora de una sla mquina Tabla. Tres muestras de la produccin de una mquina 65
i=1 =2 =3
Valores muestrales 53.0 52.0 51.8 52.3 52.9 53.6 51.8 52.3 52.8
Como era de esperarse, las fluctuaciones estadsticas de muestra ocasionan pequeas diferencias en Xi, aunque en este caso las i son idnticas. La prueba de no diferencia en las medias de poblacin es, como de costumbre, la hiptesis nula, Ho: 1 = 2 = 3 Una prueba convincente de esta hiptesis antes que nada requiere una medida numrica del grado en que difieren las medias muestrales. Por lo tanto, se toman las tres medias muestrales que aparecen en la ltima columna del cuadro en la pgina anterior y se calcula su varianza. Usamos la frmula de la varianza para muestra -no olvidemos que se calcula la varianza de las medias muestrales, y no las varianzas de todos los valores de la tabla- se tiene: s x = 1/(r-1) (X - X)2 la sumatoria va desde la primera, hasta la r-sima muestra. = (1/2)[(48.6 - 52.2)2 + (56.4 - 52.2)2 + (51.6 - 52.2)2] = 15.5 Donde r es la cantidad de medias muestrales y
2
X = (1/r) Xi = 52.2 Sin embargo, s2x no proporciona toda la informacin. Por ejemplo, analice los datos del cuadro siguiente Tabla. Muestra de la produccin de tres mquinas Mquina Produccin de muestra de la mquina i Xi i=1 54.6 45.7 56.7 37.7 48.3 48.8 =2 53.4 57.5 54.3 52.3 64.5 56.4 =3 56.7 44.7 50.6 56.5 49.5 51.6 x = 52.2 Al calcular la varianza de las medias obtenemos el mismo valor de la primera tabla, pero en este caso se trata de mquinas cuyo funcionamiento es irregular y que producen grandes fluctuaciones aleatorias en cada hilera. Cmo se puede medir esta fluctuacin? Intuitivamente, parecera que esa fluctuacin se interpreta como la extensin (o varianza) de los valores observados dentro de la muestra. Entonces se calcula la varianza dentro cada una de las muestras en la primera tabla. Y obtenemos: S21 = 0.52; S22 = 0.87 y S23 = 0.25
66
Ejercicios
1. Doce parcelas de terreno se dividen aleatoriamente en tres grupos. El primero se toma como grupo de control y los otros dos grupos se tratan con los fertilizantes A y B. Se observa que la produccin es: Control, C 60 64 65 55 A 75 70 66 69 B 74 78 72 68 a. Calcule la razn de varianza. b. Tienen los dos fertilizantes efectos diferentes? 2. Se extrajo una muestra aleatoria de 4 trabajadores, cada uno de ellos de industrias distintas, con su ingreso anual (en cientos de pesos) registrado de la siguiente manera: Industria A Industria B 66 58 62 56 65 53 63 61
a. Calcule el valor de probabilidad para la hiptesis nula (no hay diferencia entre las industrias); use primero una prueba t y luego una prueba F. b. Son exactamente equivalentes las pruebas t y F?
67
BIBLIOGRAFIA Wonnacott, Thomas H.; Wonnacott, Ronald J. Introduccin a la Estadstica. 1990. Editorial LIMUSA, Mxico. Hoel, Paul G. Estadstica Elemental. Segunda edicin. 1965. Compaa Editorial Continental, Mxico. Enciclopedia temtica: Gran Consultor Estudiantil.2001. Educar Cultural y Recreativa S.A. Colombia. Genet B, William. Estadstica, Probabilidad y su Tratamiento Metodolgico. MINEDPASEN BM, crdito 3978-NI; 2009. Nicaragua.
68