Académique Documents
Professionnel Documents
Culture Documents
MXICO
INSTITUTO TECNOLGICO DE
MINATITLN
EJERCICIOS DE TAREA
UNIDAD II: Tecnicas de muestreo y
pruebas de hiptesis.
Equipo.Aguilando Joachn Brenda Shaian
Palacios Alfonso Karen Jahaira
Palomeque Morales Samangtha Lynett
Torres Valencia Gabriela Estefhanie
MUESTREO:
a)IMPORTANCIA DEL MUESTREO
A lo largo del curso se hacen uso de dos tipos de razonamiento: el deductivo y el inductivo. El
primero est relacionado directamente con la teora de probabilidad, y que a partir de las
caractersticas de la poblacin se obtienen las posibles caractersticas de una muestra. El
segundo tipo de razonamiento se relaciona con la denominada inferencia estadstica: utilizar
las caractersticas de un subconjunto de la poblacin (la muestra) para hacer afirmaciones
(inferir) sobre la poblacin en general.
El muestro, como ya se mencion, implica algo de incertidumbre que debe ser aceptada para
poder realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo en
ocasiones demasiado grande :
El error de tipo I, conocido tambin como falso positivo, es el error de rechazar una
hiptesis nula cuando es cierta. Es decir, se concluye que hay una diferencia donde no
existe ninguna.
El error de tipo II, conocido tambin como falso negativo, es el error de no rechazar
una hiptesis nula cuando no es cierta. Es decir, no se concluye que hay una diferencia
cuando de hecho s la hay.
La potencia de una prueba es la probabilidad de rechazar correctamente una hiptesis nula
cuando es falsa. Esta probabilidad es inversamente proporcional a la probabilidad de
cometer un error de tipo II, no rechazar la hiptesis nula cuando es falsa.
Por ejemplo, ANOVA presenta una potencia estadstica alta. Existe una probabilidad menor
de un error de tipo II, al pensar que no hay una relacin cuando s la hay.
ESTIMACIN ESTADSTICA:
Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis
y desviacin
1. Sabemos (por el TCL) que, para valores grandes de n, la media muestra x sigue
una distribucin aproximadamente normal
con media y desviacin estndar.
2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal,
aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos
desviaciones estndar de la media.
Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad de que la
media de la poblacin est contenida en l es de 0,95.
Este tipo de intervalos se llaman intervalos de confianza de un parmetro poblacional. El
nivel de confianza (1 - ) del intervalo es la probabilidad de que ste contenga al parmetro
poblacional. En el ejemplo anterior, el nivel de confianza era del 95% ( = 0,05).
1. Intervalo de confianza para con conocida.
Un vendedor mayorista de partes automotrices necesita una estimacin de la vida media que
puede esperar de los limpiaparabrisas en condiciones normales de manejo. La
administracin de la empresa ya ha determinado que la desviacin estndar de la vida til de
la poblacin es de seis meses. Supongamos que se selecciona una sola muestra aleatoria de
100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21
meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la poblacin
de los limpiaparabrisas. Tenemos X como la distribucin de la vida til en meses de la
poblacin de limpiaparabrisas, no sabemos qu distribucin tiene, al igual que
desconocemos su media.
En este caso s conocemos la desviacin estndar poblacional.
Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la
poblacin de limpiaparabrisas, es decir para
El administrador de una planta industrial generadora de energa desea estimar, por intervalo,
la cantidad de carbn que se consumi por trmino medio semanalmente durante ao
pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400
toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el intervalo de
confianza del 95% para el consumo medio semanal durante el ao pasado? (supongamos
normalidad). Tenemos X como la distribucin de toneladas de carbn consumidas cada
semana del ao pasado por la planta de energa y su media y su desviacin estndar
desconocidas.
Aunque n < 30, suponemos que la media muestral, X, sigue una distribucin normal:
Por lo tanto, la estimacin del error estndar de la proporcin de establecimientos que tiene
claros signos de mala ser 0,057. El intervalo de confianza del 95% para la probabilidad de
xito poblacional p viene dado por:
Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de esta
cadena de comida rpida que tiene mala administracin estar entre 0,20788 y 0,39212.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para
cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de
establecimientos con mala administracin.
EL ERROR
Un mismo estimador ofrece distintos valores para distintas muestras del mismo
tamao extradas de la misma poblacin. Por lo tanto, deberamos tener una medida de la
variabilidad del estimador respecto del parmetro que se trata de estimar. Esta variabilidad
se mide en trminos de la desviacin estndar del estimador, la cual recibe el nombre
de error estndar.
El error estndar de un estimador T de un parmetro
estimador.
como estimador de
PARMETRO
ESTIMADOR
ERROR ESTNDAR
N
=
PRUEBAS DE HIPTESIS:
Una hiptesis es una expresin a manera de conjetura, es decir, una proposicin tentativa en
modo afirmativo acerca de la relacin general o especfica entre dos o ms variables. En la
formulacin de cualquier hiptesis es conveniente observar los dos criterios siguientes:
deben expresar relaciones entre variables; y adems, ser inferencias que permitan probar las
Hiptesis estadstica
Hiptesis nula
Es una hiptesis construida para anular o refutar, con el objetivo de apoyar una hiptesis
alternativa. Cuando se utiliza, la hiptesis nula se presume verdadera hasta que
una prueba estadstica en la forma de una prueba emprica de la hiptesis indique lo
contrario. Si la hiptesis nula no es rechazada, esto no quiere decir que sea verdadera.
Es la hiptesis que debe probarse. Se designa como
ser rechazada.
Hiptesis alternativa
Est formada por todos los valores del estadstico de prueba ubicados a la izquierda del
parmetro cuya probabilidad de ocurrencia es menor a la del nivel de significacin.
Prueba bilateral
La prueba se realiza a la diferencia entre las proporciones de dos poblaciones que se utilizan
con ms frecuencia que aquella en la que su diferencia es cero. Sin embargo, es posible
probar que dicha diferencia es igual a algn otro valor. Pueden llevarse a cabo pruebas tanto
unilaterales como bilaterales.
Cuando la hiptesis nula que va a probarse es p1-p2=0, est suponiendo que las
proporciones de las dos poblaciones son iguales. Se utiliza esto como justificacin para
combinar los resultados de las dos muestras y llegar a una estimacin mancomunada de la
proporcin comn supuesta.
La varianza es importante dado que nos ofrece una mejor visin de dispersin de datos.
Error tipo I
La realidad poblacional tiene slo uno de dos posibles estados: la hiptesis nula es cierta; o
la hiptesis nula es falsa. Si la hiptesis nula es cierta no debe ser rechazada a favor de la
hiptesis alternativa. En el caso en que sea falsa debe ser rechazada a favor de la
alternativa.
Sin embargo, los datos contienen necesariamente elementos de variacin pues
generalmente provienen de una muestra que puede ser o no representativa, los instrumentos
de medicin tienen una precisin limitada y los materiales usados pueden cambiar por
distintos factores tal como la humedad del aire, temperatura, manejo o reaccin con otros
materiales. Una muestra, an tomada cientficamente siempre tendr una pequea
probabilidad de no reflejar la realidad poblacional.
Aun habiendo usado una metodologa cientfica para tomar la mejor muestra posible,
obtenido datos con muy poco error experimental, y tomado una decisin cnsona a los datos
observados, es posible que se cometa el error de tomar la decisin de rechazar la hiptesis
nula an siendo cierta.
Este tipo de error se conoce como error tipo I. La probabilidad de cometer un error tipo I se
puede controlar y reducir, pero slo se puede eliminar si nunca se toma la decisin de
rechazar la hiptesis nula. Esta ltima situacin no es deseable ya que llevara a nunca
descartar premisa alguna, no importa cun irracional sea la misma o cunto los datos
obtenidos contradigan esa premisa. El investigador es conservador cuando selecciona una
probabilidad muy pequea de cometer error tipo I, pues slo rechazar el status quo, la
hiptesis nula, si obtiene evidencia muy contundente en contra de esta hiptesis. La
probabilidad mxima de cometer error tipo I se conoce como la significancia de la prueba y
se denota usualmente por la letra griega alfa. La probabilidad de cometer error tipo I se
escribe de la siguiente manera:
= Proba (Rechazar H0 | H0 es cierta)
Los valores de uso ms comn para la significancia de una prueba son 0.01, 0.05 y 0.10. La
significancia es en ocasiones presentada como un por ciento, tal como 1%, 5% o 10%. Esto
quiere decir que con el fin de adelantar la ciencia, el investigador est dispuesto a permitir
Error tipo II
En el caso en que la hiptesis nula sea falsa, cuando el valor del parmetro es consistente
con la hiptesis alternativa, puede surgir la situacin de que los datos obtenidos llevan al
investigador a no rechazarla, cometiendo entonces un error tipo II. Usualmente no se
controla este tipo de error directamente. El Lema de Neyman-Pearson2 dice que una vez se
decide el nivel de error tipo I aceptable para el problema, la probabilidad de cometer error
tipo II asume su valor mnimo al usar las pruebas estadsticas que se estudian aqu. Este
valor mnimo no es cero e incluso puede ser considerado muy alto por algunos. Es usual
denotar la probabilidad de error tipo II por la letra griega.
Entonces P (error tipo II) = = P( No rechazar H0 | H0 es falsa).
BIBLIOGRAFA