Vous êtes sur la page 1sur 30

UNIVERSIDAD DE ORIENTE NUCLEO BOLIVAR ESCUELA CS.

DE LA TIERRA DEPARTAMENTO DE INGENIERIA INDUSTRIAL

Profesor: Integrantes: Gabriel Matos. Jennifer Mario 19.369.918 Daniela Fermin 21.578.222 Marileidys Ortega 21.236004 Mariant Marcano 20.263.899

HIPOTESIS ESTADISTICAS
Cuando se trata de tomar una decisin es til hacer suposiciones o conjeturas acerca de la poblacin de que se trata. A estas suposiciones, que pueden ser o no ciertas, se les llama hiptesis estadstica. Estas hiptesis estadsticas son por lo general afirmaciones acerca de las distribuciones de probabilidad de las poblaciones. La aplicacin de clculos probabilsticos permite determinar a partir de que valores debemos rechazar una hiptesis garantizando que la probabilidad de cometer un error es un valor conocido. Las hiptesis pueden clasificarse en dos grupos segn: a) Especifiquen un valor concreto o un intervalo para los parmetros del modelo. b) Determinen el tipo de distribucin de probabilidad que ha generado los datos. Un ejemplo del primer grupo es la hiptesis de que la media de que una variable es y del segundo que la distribucin de probabilidad es la distribucin normal, aunque la metodologa para realizar el contraste de hiptesis es anlogo en ambos casos, distinguir ambos tipos de hiptesis respecto a un parmetro son en realidad problemas de estimacin que tienen que tienen una respuesta complementaria dando un intervalo de confianza para dicho parmetro, sin embargo las hiptesis respecto a la forma de la distribucin se suele utilizar para validar un modelo estadstico. Para un fenmeno aleatorio que se est estudiando.

HIPOTESIS NULA.
En muchas ocasiones se formula una hiptesis estadstica con la nica finalidad de refutarla o anularla. Por ejemplo, si se quiere decir si una moneda est cargada o no, se formula la hiptesis de que no est cargada (es decir, p=, donde p es la probabilidad de cara). Tambin, si se quiere decidir si un mtodo es mejor que otro, se formula la hiptesis de que no hay diferencia entre las dos (es decir, que cualquier diferencia que se observe se debe solo a las fluctuaciones del muestreo de una misma poblacin). A estas hiptesis se les llama hiptesis nula y se denota H0. El nombre de nula indica que H0 representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad y puede entenderse por tanto en el sentido de neutra. La hiptesis de H0 nunca se considera probada aunque si puede ser rechazada por los datos.

HIPOTESIS ALTERNATIVA.
A toda hiptesis que difiere de la hiptesis dada se le llama hiptesis alternativa. Por ejemplo, si una hiptesis es p=0.5, la hiptesis alternativa puede ser p=0.7, p0.5 o p>0.5. La hiptesis alternativa a la hiptesis nula se denota H1. En los casos en los que no se especifica H1 en forma explcita se puede considerar que queda definida implcitamente como H0 es falsa, sin embargo existen casos en los que

H1 no es la simple negacin de H0 cabria realizar otra hiptesis que para el caso no se considera relevante, un test o prueba de hiptesis se entiende en el enfoque moderno como una funcin de la muestra corrientemente basada en un estadstico.

PRUEBAS ESPECIALES
Cuando las muestras son grandes, las distribuciones mustrales de muchos estadsticos tienen una distribucin normal (o por lo menos aproximadamente normal), y en estas pruebas se puede emplear la correspondiente puntuacin z y los resultados son validos para poblaciones infinitas o para muestreo con reposicin en poblaciones finitas estos resultados requieren modificacin. 1. Media. Aqu

S = X , la media muestral;
x

s = _ = , la media x

poblacional, y s = _ =

N , donde es la desviacin estndar

poblacional y N el tamao de la muestra. La puntuacin z est dada por:

x z= N

2. Proporciones. Aqu S = P, la proporcin de xitos en una muestra;

s = p = p donde p es la proporcin poblacional de xitos y N es el


tamao de la muestra, o proporcin de xito de la poblacin,

s = p = pq / N , donde q = 1 p . La puntuacin z est dada por:


z= P p pq n

En el caso de P = X N , donde X= cantidad de xitos obtenidos realmente en una muestra, la puntuacin z se transforma en

z=
Es decir x = Np, x = =

X Np Npq

Npq y S = X

PRUEBAS PARA DIFERENCIAS MUESTRALES

a. DIFERENCIA ENTRE MEDIAS: Sean X y X 2 las medias mustrales 1

___

___

de muestras grandes de tamaos N1 yN2 obtenidas de poblaciones


cuyas medias son 1 y 2 y cuyas desviaciones estndar son 1 y 2, respectivamente. Considrese la hiptesis nula que no hay diferencia entre las dos medias poblacionales (es decir, 1 =2), lo cual es equivalente a decir que las muestras se han tomado de dos poblaciones que tienen la misma media, lahipotesis alternativa o complementaria (H1: 12). Entonces z viene dado por:

Z=
Donde:

x1 x2 ( 1 2 )

( x1 x2 )

( x1 x2 )

( 1 ) 2 ( 2 )2 = + n1 n2

Se puede constatar la hiptesis nula frente a la hiptesis alternativa, o la significacin de una diferencia observada a un nivel de significancia apropiada. b. DIFERENCIA DE PROPORCIONES: si se tienen las proporciones mustrales P1 y P2 obtenidas en grandes muestras de tamao N1 y N2, tomados de respectivas poblaciones que tienen proporciones P1 y P2 puede considerarse la hiptesis nula de que no hay diferencia entre los parmetros de las poblaciones (P1 = P2) y por tanto que las muestras se han tomado de una misma poblacin entonces Z viene dada por:

z=
Donde

P P2 (P P2 ) 1 1 ( P P2 ) 1

( P P2 ) = 1

1 1 pq + n1 n2 (n P ) + (n2 + P2 ) P= 1 1 n1 + n2

Se puede contrastar las diferencias observadas a un nivel de significacin apropiado, y en consecuencia contrastar la hiptesis nula. FORMULACION GENERAL DE UNA HIPOTESIS. Cuando tenemos que elegir entre dos hiptesis; hiptesis nula (H 0) o hiptesis alternativa (H1), podemos encontrar las siguientes situaciones

Decisin falsa Aceptar H0 tipo II Rechazar H0 error

H 0 es verdadera No hay error Error tipo I

H 0 es Error No hay

Si se rechaza una hiptesis que debera aceptarse se dice que se comete un error tipo I. Si por otro lado, se acepta una hiptesis que debera rechazarse, se comete un error tipo II. En cualquiera de los dos casos ha habido una decisin errnea o se ha hecho un juicio errneo. Para que las reglas de decisin (o pruebas de hiptesis) sean buenas, deben disearse de manera que se minimicen los errores de decisin. Esto no es sencillo, ya que para cualquier tamao dado de muestra, al tratar de disminuir un tipo de error suele incrementarse el otro tipo de error. En la prctica, un tipo de error puede ser ms importante que otro y habr que sacrificar uno con objeto de limitar al ms notable. La nica manera de reducir los dos tipos de error es aumentando el tamao de la muestra, lo que no siempre es posible. Ejemplos 1) Encontrar la probabilidad de obtener entre 40 y 60 caras inclusive en 100 lanzamientos de una moneda que no est cargada. Solucin: De acuerdo con la probabilidad binomial, la probabilidad buscada es

100 40

1 1 2 2

40

60

100 + 41

1 1 2 2

41

59

100 1 1 + ... + 60 2 2

60

40

Como tanto Np=100(1/2) como Nq=100(1/2) son mayores que 5, para evaluar esta suma puede emplearse la aproximacin normal a la distribucin binomial. La media y la desviacin estndar de la cantidad de caras en 100 lanzamientos estn dadas por

1 = Np = 100 = 50 2

1 1 = Npq = (100) = 5 2 2

En una escala continua entre 40 y 60 caras corresponden a entre 39.5 y 60.5 caras. Por lo tanto, se tiene 39.5 en unidades estndar =

39.5 50 = 2.10 5

60.5 en unidades estndar =

60.5 50 = 2.10 5

Probabilidad buscada= rea bajo la curva normal entre Z=-2.10 y Z=2.10 = 2(rea entre Z=0 y Z=2.10)=2(0.4821)=0.9642

Planteamiento del Contraste de hiptesis: El nombre de nula proviene de que H0 representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad. Nula debe entenderse en el sentido de neutra . La hiptesis H0 nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hiptesis de que todos los elementos de una poblacin tienen el mismo valor de una variable puede ser rechazada encontrando un elemento que no lo contenga, pero no puede ser demostrada ms que estudiando todos los elementos de la poblacin, tarea que puede ser imposible. De igual manera, la hiptesis de que la media de una poblacin es diez puede ser rechazada fcilmente si la media verdadera est muy lejos de diez analizando una muestra suficientemente grande. Sin embargo, no puede ser demostrada mediante muestreo, ya que es posible que la media difiera de diez en un valor pequeo imperceptible en el muestreo). Por esta razn no afirmamos que aceptamos H0, sino que no podemos rechazarla. La hiptesis H0 se elige normalmente de acuerdo con el principio de simplicidad cientfica. Este principio establece que solamente debemos abandonar un modelo simple a favor de otro ms complejo cuando la evidencia a favor de este ltimo sea fuerte. Si rechazamos H0, estamos implcitamente aceptando la hiptesis alternativa, Ha, que puede ser simplemente la negacin de Ha. En algunos casos queremos decidir entre dos hiptesis simples y Ha est perfectamente determinada. Sin embargo, el caso ms frecuente es que H0 sea simple, del tipo y Ha se tome de una de las siguientes formas: Desconocemos antes de realizar el contraste en que direccin puede ser falsa H0. Entonces Ha es simplemente la negacin de. Decimos entonces que el contraste es bilateral. Conocemos la direccin en que H0 puede ser falsa. Es decir, si H0 es falsa, en ese caso forzosamente (o bien). Por ejemplo, se introduce una medida en una poblacin que, si tiene efectos, puede mejorar una variable pero es imposible que pueda empeorarla. Tenemos entonces un contraste unilateral.

Se denomina hiptesis nula Ho, a la hiptesis que se desea contrastar. El hombre de nula indica que Ho representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad y puede entenderse, por tanto, en el sentido de neutra. La hiptesis Ho nunca se considera probada, aunque puede ser rechazado por los datos. Por ejemplo, la hiptesis de que dos poblaciones tienen la misma media puede ser rechazada fcilmente cuando ambas difieren mucho,

analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser demostrada mediante muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad lo suficientemente pequea para que no pueda ser detectada, aunque la muestra sea muy grande. A partir de una muestra de la poblacin en estudio, se extrae un estadstico ( esto es, un valor que es funcin de la muestra) cuya distribucin de probabilidad est relacionada con la hiptesis en estudio y sea conocida. Se toma entonces el conjunto de valores que es ms improbable bajo la hiptesis como regin de rechazo, esto es, el conjunto de valores para el que consideramos que, si el valor del estadstico obtenido entra dentro del, rechazaremos la hiptesis. La probabilidad de que se obtenga un valor del estadstico que entre en la regin de rechazo aun siendo cierta la hiptesis puede calcularse. De esta manera, se puede escoger de dicha regin de tal forma que la probabilidad de cometer este error sea suficientemente pequea. El enfoque actual considera siempre una hiptesis alternativa a la hiptesis nula. De manera explicita o implcita, la hiptesis nula, a la que se denota habitualmente por Ho, se enfrenta a otra hiptesis que denominaremos hiptesis alternativa y que se denota H1. En los casos en los que no se especifica H1 de manera explicita podemos considerar que ha quedado definida implcitamente como Ho es falsa. Si por ejemplo deseamos comprobar la hiptesis de que dos distribuciones tiene n la misma media, estamos implcitamente considerando como hiptesis alternativa ambas poblaciones tienen distinta media. Podemos, sin embargo considerar casos en los que H1 no es la simple negacin de Ho. Cabria realizar otras hiptesis, pero a los efectos del estudio que se pretende realizar, no se consideran relevantes. Un test de hiptesis se entiende, en el enfoque moderno, como una funcin de la muestra, corrientemente basada en un estadstico. Supongamos que se tiene la muestra X=(X1,X2,.Xn) de una poblacin en estudio y que se han formulado hiptesis sobre un parmetro relacionado con la distribucin estadstica de la poblacin. Supongamos que se dispone de un estadstico t(X) cuya distribucin con respecto a , F (t) se conoce. Supongamos, tambin que las hiptesis nula y alternativa tienen la siguiente formulacin:

Un contraste, prueba o test para dichas hiptesis seria una funcin de la muestra de la siguiente forma:

Donde (X) = 1 significa que debemos rechazar la hiptesis nula, Ho (aceptarH1) y (X) = 0, que debemos aceptar Ho (o que no hay evidencia estadstica contra Ho). A se le denomina regin de rechazo. En esencia, para construir el test deseado, hasta con escoger el estadstico del contraste t(X) y la regin de rechazo . Se escoge de tal manera que la probabilidad de que t(X) caiga en su interior sea baja cuando se da Ho.

Estadstico de la prueba Los datos se deben sintetiza en un estadstica de la prueba. Dicho estadstico se calcula para ver si es razonablemente compatible con la hiptesis nula. Cuando se prueba una proporcin el estadstico de la prueba es muy simple: se cuenta el nmero de xitos en la muestra para encontrar el estadstico. En las pruebas de hiptesis es necesario trazar una lnea entre los valores del estadstico de la prueba que son relativamente probables dada la hiptesis nula y los valores que no lo son. En qu valor del estadstico de la prueba comenzamos a decir que los datos apoyan a la hiptesis alternativa? Para contestar a esta pregunta se requiere conocer la distribucin muestral del estadstico de la prueba. Los valores del estadstico de la prueba que son sumamente improbables bajo la hiptesis nula (tal como los determina la distribucin muestral) forman una regin de rechazo para la prueba estadstica.

Regin de rechazo Llamaremos regin de rechazo C asociada al contraste de hiptesis, al conjunto de valores muestrales bajo los cuales se rechaza la hiptesis nula. Fijada la regin de rechazo automticamente se tiene la regla de decisin. Si nuestra muestra pertenece a la regin de rechazo rechazamos H0 y si no, la aceptamos. Precisamente el objetivo de la teora de los contrastes o test de hiptesis es determinar para cada contraste cal es la regin de rechazo ptima en base a criterios que se especificarn.

Nivel de significacin Para realizar un contraste de hiptesis se define normalmente una medida de discrepancia, entre los datos muestrales y la hiptesis nula H0. Intuitivamente la discrepancia debe depender de la diferencia entre el valor del parmetro especificado por H0 y el valor del estimador calculado en la muestra. Para obtener una medida de discrepancia que no dependa de las unidades de medida de la variable podemos dividir esta diferencia por su valor promedio, que es el error tpico de estimacin del parmetro. Por tanto, la medida de discrepancia ms habitual es: Hay que decidir que discrepancias consideramos inadmisibles bajo H0, es decir, cual es la mxima diferencia entre el estimador y el parmetro que estamos dispuestos a considerar compatible con H0. Esta decisin depende de: La distribucin de la medida de discrepancia cuando es cierta H0. Como veremos, la medida de discrepancia tiene generalmente una distribucin normal, de media cero y desviacin tpica uno, cuando H0 es cierta. Que el contraste sea unilateral o bilateral. Para contrastes unilaterales interesan las discrepancias en una direccin, mientras que para los bilaterales interesan en ambas.

Una vez decidido que tipo de discrepancias llevan a rechazar H0, (que depender slo de si el contraste es unilateral o bilateral) hay que determinar cual es la discrepancia mxima admisible, lo que depender de la distribucin de la medida de discrepancia cuando es cierta H0. Llamaremos p-valor del contraste, a la probabilidad de obtener una discrepancia mayor que la observada. Rechazaremos H0 cuando el p-valor sea pequeo (menor de 0,05 o 0,01)

Contraste de hiptesis: En contraste de hiptesis mediante distribucin normal se supone que bajo cierta hiptesis la distribucin de muestreo de un estadstico X es una distribucin normal con media X y desviacin tpica X. As la distribucin de la variable tipificada z, es la distribucin normal canonca, y est dada por:

Por ejemplo, si se tiene un 95% de confianza de que la hiptesis es verdadera, el valor de z para un estadstico muestral X estar entre 1,96 y -1,96. El area restante equivalente al 5% del rea bajo la curva normal, representa la posibilidad de equivocarse al rechazar la hiptesis (de cometer un error Tipo I), entonces se platean las siguientes reglas de decisin: Rechazar la hiptesis al nivel de significacin de 0,05, si el valor de z para el estadstico X esta fuera del rango -1,96 a 1,96. Eso equivale a decir que el estadstico muestral observado es significativo al nivel 0,05. Aceptar la hiptesis en caso contrario. Dado que Z juega un papel, tan importante en el contraste de hiptesis, se le llama: un estadstico de contraste. Supongamos que estamos en un contexto paramtrico. Es decir, x1 , x2 ...... xn es un muestreo aleatorio simple de f siendo un parmetro desconocido. Llamaremos al espacio paramtrico, es decir, el conjunto de los valores posibles para. En los contrastes de hiptesis, lo que interesa es determinar si podemos admitir que no debemos admitir que donde y constituyen una particin de. Ambas hiptesis se tratan de forma diferente. A la primera se le conoce como hiptesis nula. A la segunda como hiptesis alternativa. Se suele simbolizar: La hiptesis nula no se considera probada pero es la que mantendremos a menos que los datos evidencien lo contrario. Luego el problema en general es si admitimos o no H0 Los contrastes de hiptesis mediante distribucin normal pueden ser: a) Contrastes de dos colas: si en la prueba se est interesado en los valores extremos del estadstico X, o en su correspondiente valor de Z a ambos lados de la media; tambin llamado contraste bilateral. b) Contrastes de una cola: si se esta interesado tan solo en valores extremos a un lado de la media, es decir, en una de las dos colas de la distribucin, tambin llamado contraste

unilateral. En este caso, la regin crtica o de significacin esta situada a un lado de la distribucin, con rea igual al nivel de significacin. Para grandes muestras, las distribuciones de muestreo de muchos estadsticos son distribuciones normales y los contrastes anteriores pueden aplicarse a los Z correspondientes; y los resultados son validos para poblaciones infinitas o para muestreos con reposicin. Pero para muestreos sin reposicin en poblaciones finitas, esos resultados requieren modificacin:

Medias: con el estadstico X=

o media muestral; x= o media de la poblacin; y

donde es la desviacin tpica de la poblacin y N el tamao de la muestra. El valor de Z viene dado por:

Proporciones: Si al estadstico X=P o proporcin de xitos en una muestra; x'= p o proporcin de xitos de la poblacin y N el tamao de la muestra; y x:= dado por: con q = 1- p. El valor de Z viene

En los caso; donde P = por:

, cuando X es el nmero real de xitos en una muestra, z est dado

Pueden realizarse tambin Pruebas de Hiptesis de dos muestras, es decir, contrastes de hiptesis mediante diferencias muestrales para:

l y 2 de grandes muestras de tamaos N1 y N2, tomadas de poblaciones con respectivas medias 1 y 2, Y desviaciones tpicas 1
a) Diferencias de medias: si se tienen las medias muestrales y 2. Puede considerarse como hiptesis nula que No hay diferencia entre las medias de las poblaciones (1 =2, que sera lo mismo que afirmar que las muestras se han tomado de dos ) poblaciones que tienen la misma media. Entonces Z viene dada por

Se puede contrastar la hiptesis nula frente a hiptesis alternatvas (o la significacin de una diferencia observada) a un nivel de significacin apropiado.

b)Diferencias de proporciones: si se tienen las proporciones rnuestrales P1 y P2 obtenidas en grandes muestras de tamaos N1 Y N2 tomadas de respectvas poblaciones que tienen proporciones p1 Y p2. Puede considerarse la hipotesis nula de que no hay diferencia entre los parmetros de las poblaciones {p1=p2}, y por tanto, que las muestras se han tornado de una misma poblacin. Entonces Z viene dada por:

Con

Donde

Se puede contrastar las diferencias observadas a un nivel de significacin apropiado, y en consecuencia, contrastar la hiptesis nula.

Errores en el contraste Errores de tipo I y de tipo II. Una vez realizado el contraste de hiptesis, se habr optado por una de las dos hiptesis, Ho o H 1, y la decisin escogida coincidir o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro:

Ha es cierta Se escogi Ho Se escogi H1 No hay error Error de tipo I( )

H1 es cierta Error de tipo II ( ) No hay error

Al contrastar una cierta hiptesis, la mxima probabilidad de cometer un error Tipo l se llama nivel de significacin del contraste, y suele especificarse antes de tomar la muestra, de manera que los resultados obtenidos no influyan en la eleccin del a emplear. Es frecuente utilizar niveles de significacin de 5% o 1 %. Si por ejemplo se escoge un nivel, de significacin de 5% al disear una regla de decisin, entonces hay unas 5 oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse aceptado; es decir, que se tiene un 95% de confianza de que se ha adoptado la decisin correcta. En tal caso se dice que la hiptesis ha sido rechazada al nivel de significacin. 0,05 lo que significa que la hiptesis tiene un 5% de probabilidad de ser falsa. Y se denota por la probabilidad de cometer el error de tipo II.

Potencia de un Contraste En este caso, se denomina Potencia del contraste al valor 1 - , eso es, a la probabilidad de escoger cuando esta es cierta P(escoger H1 / H1 es cierta) = 1- Cuando es necesario disear un contraste de hiptesis, seria deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeas como fuera posible. Sin embargo, con una muestra de tamao prefijado disminuir la probabilidad del error de tipo 1, , conduce a incrementar la probabilidad del error de tipo II, . El recurso para aumentar la potencia del contraste, esto es, disminuir , probabilidad de error de tipo ll, es aumentar el tamao muestral, lo que en la prctica conlleva un incremento de los costes del estudio que se quiere realizar. El concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo I, es preferible. Si se trata de contrastar dos hiptesis sencillas sobre un parmetro desconocido, , del tipo:

Se trata de escoger entre todos los contrastes posibles con prefijado aquel que tiene mayor potencia, esto es, menor probabilidad de incurrir en el error de tipo II. En este caso el Lema de Neyman-Pearson garantiza la existencia de un contraste de mxima potencia y determina como construirlo.

Hiptesis Compuesta En el caso de que las hiptesis sean compuestas, esto es, que no se limiten a especificar un nico posible valor del parmetro, sino que sean del tipo:

Donde 0 y 1 son conjuntos de varios posibles valores, las probabilidades y ya no estn unvocamente determinadas, sino que tomarn diferentes valores segn los distintos valores posibles de (x). En este caso se dice que un centraste tiene tamao si

esto es, si la mxima probabilidad de cometer un error de tipo I cuando la hiptesis nula es cierta es . En estas circunstancias, se puede considerar como una funcin de , puesto que para cada posible valor de en la hiptesis alternativa se tendra tendra probabilidad distinta de cometer un error de tipo II. Se define entonces

( ) = P ( (X) = 1) v
Y la funcin de potencia del contraste es entonces Pot ( )= 1 - ( ) v
1

Esto es, la probabilidad de discriminar que la hiptesis alternativa es cierta para cada valor posible de dentro de los valores de esta misma hiptesis. Se dice que un contraste es uniformemente ms potente de tamao cuando, para todo valor 1 Pot( ) es mayor o igual que el de cualquier otro contraste del mismo tamao. En resumen, se trata de un contraste que garantiza la mxima potencia para todos los valores de en la hiptesis alternativa.

Es claro que el caso del contraste uniformemente ms potente para hiptesis compuestas exige el cumplimiento de condiciones ms exigentes que en el caso del contraste ms potente para hiptesis simples. Por ello, no existe un equivalente al Lema de Neyman-Pearson para el caso general. Sin embargo, s existen muchas condiciones en las que, cumplindose determinadas propiedades de las distribuciones de probabilidad implicada y para ciertos tipos de hiptesis, se puede extender el Lema para obtener el contraste uniformemente ms potente del tamao que se desee.

Potencia de un Contraste Error Tipo I y Error Tipo II

Enunciado:
Una compaa produce sogas con una tensin media de ruptura de 300lb, y desviacin tpica de 24lb. Se espera que un nuevo proceso de fabricacin haga crecer la media. Con 1% de nivel de significancia y una muestra de 64 sogas, cul es la probabilidad de aceptar la hiptesis planteada, cuando de hecho el nuevo proceso ha aumentado la media de tensin de las sogas a 310lb? a) Extraccin de datos: =300 =24 N =64 = 1% = 0,01

b) Formulacin del sistema hipottico

Ho: = 300 H1: > 300

Se formula en relacin al valor de media de tensin de ruptura que .el ejercicio indica se considera que tienen las sogas que salen de ese proceso, porque inicialmente, sin saber que el proceso generaba una media de tensin de ruptura de 310 lb, simplemente se deseaba probar si ocurra lo esperado con el nuevo proceso, es decir, si aumentaba ese

valor de 300 lb, motivo por el cual empleamos el smbolo > en la formulacin de la hiptesis alternativa.

c) Diagramacin de las reglas de decisin: Se elabora la Curva de Dist. Normal. Evaluando primero la forma como se plantea la hiptesis alternativa, (que smbolo se utiliza). En este caso H1 se plantea con un signo de >, por lo tanto se concluye que realizaremos un contraste de hiptesis de una sla cola, de cola derecha, que es con la que podemos probar la existencia de una media muestral mayor a 300 (mayores valores al que indica la suposicin). Adems debemos conocer cul es el valor del rea de significancia, o probabilidad de cometer el error tipo 1, que el ejercicio nos dice es de 0,01. Como se trata de un contraste unilateral, todo ese % de rea estar en un solo lado de la campana, para nuestro caso, del lado derecho.

Y as queda definida de forma grfica la regla de decisin.

=300

z= +2,33

49%, rea de Aceptacin rechazo

1%, rea de

El valor de z para el lmite entre el rea de aceptacin y rechazo se ubica en la tabla de distribucin Normal, atendiendo al 49% de rea de aceptacin que simplemente resulta de restar al 50% que representa la media cola el 1 % de significancia. Determinando a travs de su tabla el valor correspondiente de z para un rea de 0,4900 (interpolando si es necesario).

d) Diagramando : Como el ejercicio no pide realizar un contraste especfico, sino determinar cul es la probabilidad de que la hiptesis planteada a travs del contraste sea aceptada (que el proceso genere ms de 300 lb como tensin media de ruptura) an cuando en realidad la media de tesin de ruptura con el nuevo proceso es 310 lb. Entonces el proceso a continuacin va a tomar como base la grfica anterior, sobre la cual graficaremos ahora la ubicacin del verdadero valor de la variable en estudio (310 lb), de manera que podamos determinar cul es el rea bajo las dos curvas que an estando dentro del rea de aceptacin original (la que determinamos en en paso c) representa la posibilidad de que se acepte una hiptesis incorrecta ya que el valor real es 310. Para conocer dnde estar ubicado el valor real que podra tener la variable debemos comparar este valor real con el valor supuesto inicialmente (300), y as sabrn si la nueva grfica se ubicar a la derecha o a la izquierda de la primera.

=300 =310

rea de aceptacin

rea de rechazo ( =1%)

El rea buscada es la que est bajo la segunda curva creada donde el valor medio de tensin de ruptura de las sogas (media de poblacin) es 310 lb (lo que nos dice el ejercicio que sucede en realidad), pero se encuentra dentro del rea de aceptacin del grfico de contraste. Ya que se trata de ese % de rea o probabilidad de que se Acepte (porque cae dentro del rea de aceptacin de la primera grfica) una hiptesis que realmente debera rechazarse por cuanto la media es 3.10. A ese % de rea se le conoce como , y es la probabilidad de aceptar una hiptesis que realmente debera rechazarse. Podemos calcular su valor exacto para cualquier valor real que tomase la variable en estudio, como en este caso lo hacemos para la situacin en que su valor real sea 310.

e) Calculando el valor de : Ya conociendo dentro del grfico de reglas de decisin cul es el valor en unidades estndar z que equivale al lmite entre el rea de aceptacin y rechazo, podemos conocer a qu valor real de la variable correspondera ese z. A tras de la misma ecuacin de clculo de z para muestras:

Donde la desviacin de muestra hay que calcularla a partir de la desviacin de poblacin conocida por estudios anteriores, y tomando en cuenta el tamao' de muestra que se tendra disponible (64 sogas). El valor de media de la muestra es el valor de variable que representa el z cannico a calcular, y el valor de media de la poblacin es el que conocemos como valor hipottico para la poblacin. En el presente caso sabemos cul es el valor de z (2,33) pero necesitamos conocer para que X es ese valor de z, por lo tanto despejamos de la ecuacin anterior a X: X= H o + Z. x = 300 + ( ) = 306,99

Este X calculado es parte de la regla de decisin para el contraste. Es decir, si la media de tensin de ruptura de la muestra es menor a 306,99 lb se debe aceptar la hiptesis alternativa formulada, pero si la tensin media de ruptura es mayor a 306,99 lb debe rechazarse la hiptesis alternativa. Ahora conociendo en valores nominales cul es el x que define el inicio de rea de rechazo, podemos buscar dentro del segundo grfico elaborado suponiendo que la media real en el nuevo proceso es de 310 lb como indica el problema, cul es el z que corresponde a ese valor de X. Es decir que ahora vamos a aplicar la ecuacin anterior pero para hallar z, conociendo x, y adems ahora utilizando como valor supuesto, el valor medio que est representado en esa segunda grfica (310 lb):

De esta manera hemos relacionado los dos grficos a travs de un valor que comparten, y que es el punto dnde inicia el rea de rechazo de nuestras reglas de decisin (grfico inicial). Qu buscamos? Encontrar cul es el rea de la segunda curva que existe dentro del rea de aceptacin de la primera, porque slo ser all donde existe posibilidad de que an siendo la media igual a 310, se acepte la hiptesis formulada en torno al valor 300. Si ya conocemos que para el segundo grfico el punto de inicio del rea de rechazo de nuestras reglas de decisin equivale a z= -1 , entonces podemos conocer cul es el % de rea bajo esa segunda curva que existe hacia la derecha y hacia la izquierda de ese lmite. Como siempre haciendo uso de la tabla de Distribucin Normal.

Z= -1 %?

= 300 =310

rea de Rechazo ( =1%)

El rea buscada para la segunda curva la encontramos dentro de la tabla de distribucin, ubicando e l valor z que conocemos (para esa segunda curva). Para el valor z= -1 , que sera el mismo de z=+1 porque es una distr ibucin simtrica tenemos que el valor de rea desde el centro de la campana es : 0,3413 Pero el valor de no es esa rea, ya que esta cae en el rea de rechazo de nuestras reglas de decisin , y lo que nos interesa es el rea de la segunda curva que cae dentro del rea de aceptacin de nuestras reglas de decisin. Como sabemos que cada media cola equivale a 50% de probabilidad, entonces = 0,5000 - 0,34 13 = 0,1587

Es decir que la probabilidad de que se acepte la hiptesis alternativa formulada an cuando lo real es que el proceso genera otra media de tensin de ruptura que es igual a 310 lb, es de 15,87%. Para cada posible valor real de nuestra variable en estudio se puede elaborar este mismo anlisis, encontrando por cada valor real que pudiera tener la variable, un valor de diferente. De all surge entonces lo que se conoce como medicin de la potencia de un contraste.

Potencia de un contraste Para estudiar la funcin potencial, o la potencia de un contraste debemos hacer el anlisis anterior completo para diversos valores que pudiera tomar nuestra variable en la realidad, de manera que generemos un conjunto de pares de datos. Recordando siempre, que la Potencia es una medida de la probabilidad de que s se rechace una hiptesis cuando esta deba rechazarse, ya que es una medida complementaria a : P= 1- Por lo tanto determinando el de una prueba para cada posible valor real de la variable (en este caso la variable es la media de tensin de ruptura de soga), tendremos un conjunto de pares datos como sigue en el ejemplo:
1 290 P1 300 P2 310 P3 320 P4

Si se manejan ya el conjunto de pares de datos, habiendo determinado para cada posible valor real la potencia de nuestra prueba de hiptesis, entonces se elabora la grfica de potencia de contraste:

En este tipo de grfica se refleja la relacin entre la probabilidad de rechazar cuando debe rechazarse para cualquier valor real que tome la variable. Mientras mayor es el pico de la grfica ms conveniente es usar nuestro test de hiptesis, ya que la probabilidad de no cometer el error tipo II es elevada. EJERCICIOS 1.- Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas por este mtodo y esta muestra tendr una duracin media de 2320 horas. Se puede aceptar la hiptesis de validez del nuevo proceso de fabricacin con un riesgo igual o menor al 5%? Enunciamos las hiptesis nula y alternativa: H0 : = 2400 H1 : 2400 Zona de aceptacin = 0.05 z = 1.96.

Determinamos el intervalo de confianza para la media:

Verificacin. Valor obtenido de la media de la muestra: 2320 . Decisin Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

2.-El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin. Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media 300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviacin tpica: Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significacin del 1%? Enunciamos las hiptesis nula y alternativa: H0 : 300 H1 : < 300 Zona de aceptacin = 0.01 z = 2.33. Determinamos el intervalo de confianza:

Verificacin. = 290 Decisin Rechazamos la hiptesis nula H0. Con un nivel de significacin del 1%.

3.- Se cree que el nivel medio de protrombina en una poblacin normal es de 20 mg/100 ml de plasma con una desviacin tpica de 4 miligramos/100 ml. Para comprobarlo, se toma una muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la hiptesis, con un nivel de significacin del 5%?

Enunciamos las hiptesis nula y alternativa: H0 : =20 mg/100 ml H1 : 20 mg/100 ml Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z/2 = 1.96. Determinamos el intervalo de confianza para la media:

Verificacin. Valor obtenido de la media de la muestra: 18.5. Decisin Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

PRUEBAS ESPECIALES
Cuando las muestras son grandes, las distribuciones mustrales de muchos estadsticos tienen una distribucin normal (o por lo menos aproximadamente normal), y en estas pruebas se puede emplear la correspondiente puntuacin z y los resultados son validos para poblaciones infinitas o para muestreo con reposicin en poblaciones finitas estos resultados requieren modificacin.
_ 3. Media. Aqu S = X , la media muestral; s = x = , la media

poblacional, y s = _ =
x

N , donde es la desviacin

estndar poblacional y N el tamao de la muestra. La puntuacin z est dada por:

x z= N

4. Proporciones. Aqu S = P, la proporcin de xitos en una muestra; s = p = p donde p es la proporcin poblacional de

xitos y N es el tamao de la muestra, o proporcin de xito de la poblacin, s = p = est dada por:

pq / N , donde q = 1 p . La puntuacin z P p pq n

z=

En el caso de P = X N , donde X= cantidad de xitos obtenidos realmente en una muestra, la puntuacin z se transforma en

z=
Es decir x = Np, x = =

X Np Npq

Npq y S = X

PRUEBAS PARA DIFERENCIAS MUESTRALES


c. DIFERENCIA ENTRE MEDIAS: Sean

X 2 las medias mustrales de muestras grandes de tamaos N1 yN2 X1


obtenidas de poblaciones cuyas medias son 1 y 2 y cuyas desviaciones estndar son 1 y 2, respectivamente. Considrese la hiptesis nula que no hay diferencia entre las dos medias poblacionales (es decir, 1 =2), lo cual es equivalente a decir que las muestras se han tomado de dos poblaciones que tienen la misma media, lahipotesis alternativa o complementaria (H1: 12). Entonces z viene dado por:

___

___

Z=
Donde:

x1 x2 ( 1 2 )

( x1 x2 )

( x1 x2 )

( 1 ) 2 ( 2 )2 = + n1 n2

Se puede constatar la hiptesis nula frente a la hiptesis alternativa, o la significacin de una diferencia observada a un nivel de significancia apropiada. d. DIFERENCIA DE PROPORCIONES: si se tienen las proporciones mustrales P1 y P2 obtenidas en grandes muestras de tamao N1 y

N2, tomados de respectivas poblaciones que tienen proporciones P1 y P2 puede considerarse la hiptesis nula de que no hay diferencia entre los parmetros de las poblaciones (P1 = P2) y por tanto que las muestras se han tomado de una misma poblacin entonces Z viene dada por:

z=
Donde

P P2 (P P2 ) 1 1 ( P P2 ) 1

( P P2 ) = 1

1 1 pq + n1 n2 (n P ) + (n2 + P2 ) P= 1 1 n1 + n2

Se puede contrastar las diferencias observadas a un nivel de significacin apropiado, y en consecuencia contrastar la hiptesis nula. FORMULACION GENERAL DE UNA HIPOTESIS. Cuando tenemos que elegir entre dos hiptesis; hiptesis nula (H0) o hiptesis alternativa (H1), podemos encontrar las siguientes situaciones Decisin H0 es falsa Aceptar H0 Error tipo II Rechazar H0 No hay error H 0 es verdadera No hay error Error tipo I

Si se rechaza una hiptesis que debera aceptarse se dice que se comete un error tipo I. Si por otro lado, se acepta una hiptesis que debera rechazarse, se comete un error tipo II. En cualquiera de los dos casos ha habido una decisin errnea o se ha hecho un juicio errneo.

Para que las reglas de decisin (o pruebas de hiptesis) sean buenas, deben disearse de manera que se minimicen los errores de decisin. Esto no es sencillo, ya que para cualquier tamao dado de muestra, al tratar de disminuir un tipo de error suele incrementarse el otro tipo de error. En la prctica, un tipo de error puede ser ms importante que otro y habr que sacrificar uno con objeto de limitar al ms notable. La nica manera de reducir los dos tipos de error es aumentando el tamao de la muestra, lo que no siempre es posible. Ejemplos 2) Encontrar la probabilidad de obtener entre 40 y 60 caras inclusive en 100 lanzamientos de una moneda que no est cargada. Solucin: De acuerdo con la probabilidad binomial, la probabilidad buscada es

100 40

1 1 2 2

40

60

100 + 41

1 1 2 2

41

59

100 1 1 + ... + 60 2 2

60

40

Como tanto Np=100(1/2) como Nq=100(1/2) son mayores que 5, para evaluar esta suma puede emplearse la aproximacin normal a la distribucin binomial. La media y la desviacin estndar de la cantidad de caras en 100 lanzamientos estn dadas por

1 = Np = 100 = 50 2

1 1 = Npq = (100) = 5 2 2

En una escala continua entre 40 y 60 caras corresponden a entre 39.5 y 60.5 caras. Por lo tanto, se tiene 39.5 en unidades estndar = 60.5 en unidades estndar =

39.5 50 = 2.10 5 60.5 50 = 2.10 5

Probabilidad buscada= rea bajo la curva normal entre Z=-2.10 y Z=2.10 = 2(rea entre Z=0 y Z=2.10)=2(0.4821)=0.9642

Distribucin de Probabilidad Puede considerarse como una distribucin de frecuencias tericas o sea una distribucin que describe la forma en que se espera varen los resultados, es decir, que representa una expectativa de que algo suceda por lo que resulta modelos tiles para hacer inferencias y toma de decisiones en condiciones de incertidumbre. Se clasifican en Discretas y Continuas En la Discreta est permitida considerar un nmero limitados de valores. En la Continua la variable que se est considerando puede tomar un valor cualquiera dentro de un intervalo dado. Una variable se define como variable aleatoria si toma diferentes valores como resultado de un experimento aleatorio, es decir, que es una especie de valor o magnitud que cambia de una secuencia a otra sin seguir una secuencia predecible. Distribucin Normal: Es una distribucin de probabilidad continua y est representada grficamente como una curva en forma de campana donde se encuentra representada la probabilidad de que X este entre los valores los valores bajo la curva que contiene 100%.

Caractersticas 1) Se utiliza frecuentemente para estimar el error durante las mediciones. 2) Su condicin bsica esta en tener una media igual a cero y una desviacin estndar igual a 1. 3) Es un tipo de variable y distribucin continua. 4) Su distribucin grafica es de forma acampanada siguiendo la condicin de Gauss. 5) Su expresin viene dada por la siguiente condicin:

Teorema de Lmite Central Si X1, X2Xn es una muestra aleatoria de tamao n tomada de una poblacin finita o infinita con una media poblacional y una varianza.

Caractersticas

1) El promedio de la media aritmtica debe coincidir o aproximarse generalmente con la media de la poblacin. 2) En cualquier universo de datos los parmetros conocidos son: : Media de la muestra. : media de la poblacin. Desviacin Estndar con un numero de datos >30 tiende hacia una distribucin normal conocida como t de Student. 3) Toda Distribucin est sometida a la que se conoce como error de estimacin lo cual tiende a ser igual a cero.

Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre s) se distribuye segn una distribucin normal. Este teorema se aplica tanto a suma de variables discretas como de variables continuas. Los parmetros de la distribucin normal son: Media: n * m (media de la variable individual multiplicada por el nmero de variables independientes) Varianza: n * s2 (varianza de la variable individual multiplicada por el nmero de variables individuales) Veamos ahora un ejemplo:

Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada lanzamiento es una variable independiente que se distribuye segn el modelo de Bernouilli, con media 0,5 y varianza 0,25. Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60 caras. La variable suma de estas 100 variables independientes se distribuye, por tanto, segn una distribucin normal. Media = 100 * 0,5 = 50 Varianza = 100 * 0,25 = 25 Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal tipificada equivalente:

(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin Por lo tanto: P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228 Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60 caras es tan slo del 2,28%.

Distribucin t de Student Es una distribucin de muestreo estadsticos para pequeas muestras aunque sus resultados son validos tanto para pequeas como grandes muestras. La distribucin t de Student se llama as en honor a su descubridor W.S. Gossett. Quien publico su obra bajo el seudnimo Student en 1908 en la ciudad de Irlanda.

Caractersticas 1) Una distribucin t se asemeja a la distribucin Z en que ambas son simtricas alrededor de la media cero. Ambas distribuciones tienen forma de campana.

2) Cuando el tamao de la muestra es muy grande la desviacin de la poblacin puede ser sustituida por la desviacin de la muestra donde la variable aleatoria es representada por:

3) La variable aleatoria para el tamao de muestras n<30 viene dada por:

NOTA: Cuando n=30 se recomienda usar la distribucin normal. 4) Para el estudio del tamao de las muestras se incluye un nuevo parmetro conocido como grados de libertad el cual se refiere al nmero de desviaciones independientes que se utiliza al calcular la desviacin. 5) El nivel de significancia puede ser expresado (1- ).Donde: : Porcentaje de rechazo Distribucin CHI Cuadrado En estadstica, la distribucin (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribucin de probabilidad continua con un parmetro k que representa los grados de libertad de la variable aleatoria

donde Zi son variables aleatorias normales independientes de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as: .

Es conveniente tener en cuenta que la letra griega se transcribe al latn como chi1 y se pronuncia en castellano como ji.2 3 Caractersticas 1) Considera que las varianzas son positivas y depende de las siguientes condiciones: a) Nivel de significancia. b) Grados de libertad.

2) Su distribucin es de forma asimtrica o de una sola cola. 3) Una de sus formas de clculos puede expresarse de la siguiente manera: X2c= 4)Esta prueba es de mucha utilidad cuando se utilizan frecuencias debido a que pueden determinar las desviaciones que existen entre las frecuencias observadas y las frecuencias esperadas tambin pueden estimar el contraste o comparacin entre 2 o ms grupos en relacin a su frecuencia.

Vous aimerez peut-être aussi