Métodos de muestreo probabilísticos y no probabilísticos en estadística

2.1 Inferencia estadstica.
2.1.1 Concepto.
La inferencia estadstica es el conjunto de mtodos y tcnicas que permiten inducir, a
partir de la informacin emprica proporcionada por una muestra, cual es el comportamiento de
una determinada poblacin con un riesgo de error medible en trminos de probabilidad.
2.2.2 Muestreo.
Seleccin de un conjunto de personas o cosas que se consideran representativos del
grupo al que pertenecen, con la finalidad de estudiar o determinar las caractersticas del grupo.
"para hacer una buena encuesta se necesita antes hacer un buen muestreo"
Tcnica empleada en esta seleccin.
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los

elementos de una poblacin), se selecciona una muestra, entendiendo por tal una parte
representativa de la poblacin. El muestreo es por lo tanto una herramienta de la
investigacin cientfica, cuya funcin bsica es determinar que parte de una poblacin
debe examinarse, con la finalidad de hacer inferencias sobre dicha poblacin. La muestra
debe lograr una representacin adecuada de la poblacin, en la que se reproduzca de la mejor
manera los rasgos esenciales de dicha poblacin que son importantes para la investigacin.
Para que una muestra sea representativa, y por lo tanto til, debe de reflejar las similitudes y
diferencias encontradas en la poblacin, es decir, ejemplificar las caractersticas de sta.
Los errores ms comunes que se pueden cometer son:
1. Hacer conclusiones muy generales a partir de la observacin de slo una parte de la
Poblacin, se denomina Error de Muestreo.
2. Hacer conclusiones hacia una Poblacin mucho ms grande de la que originalmente se
tom la muestra, se denomina Error de Inferencia.
En la estadstica se usa la palabra poblacin para referirse no slo a personas sino a
todos los elementos que han sido escogidos para su estudio y el trmino muestra se usa para
describir una porcin escogida de la poblacin.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos:
Mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos.
I. Muestreo probabilstico:
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Slo estos mtodos
de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por
tanto, los ms recomendables.
Dentro de los mtodos de muestreo probabilsticos encontramos los siguientes tipos:
Muestreo aleatorio simple.
El procedimiento empleado es el siguiente:
1) se asigna un nmero a cada individuo de la poblacin y
2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros
aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen
tantos sujetos como sea necesario para completar el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando
la poblacin que estamos manejando es muy grande.
Muestreo aleatorio sistemtico.

Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin,
pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero
aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los
que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n.
El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo
este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al
elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una
muestra sobre listas de 10 individuos en los que los 5 primeros son varones y las 5 ltimos
mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o
slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. 3.-
Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya
que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la
muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen
gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn
la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con
este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados
adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse
dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la poblacin. (Tamao
geogrfico, sexos, edades,etc). La distribucin de la muestra en funcin de los diferentes
estratos se denomina afijacin, y puede ser de diferentes tipos: Afijacin Simple: A cada estrato
le corresponde igual nmero de elementos mustrales. Afijacin Proporcional: La distribucin se
hace de acuerdo con el peso (tamao) de la poblacin en cada estrato. Afijacin Optima: Se
tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la
proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la
desviacin. 4.- Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora
estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las
unidades mustrales son los elementos de la poblacin. En el muestreo por conglomerados la
unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja
de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son reas geogrficas suele hablarse de "muestreo por reas". El muestreo por
conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el
necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los
elementos pertenecientes a los conglomerados elegidos. II. Mtodos de muestreo no
probabilsticos A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de
que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la poblacin),
pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los
sujetos de la poblacin tienen la misma probabilidad de se elegidos. En general se seleccionan
a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa. En algunas circunstancias los mtodos estadsticos y
epidemiolgicos permiten resolver los problemas de representatividad aun en situaciones de
muestreo no probabilstico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la poblacin. Entre los mtodos de muestreo no
probabilsticos ms utilizados en investigacin encontramos: 1.- Muestreo por cuotas: Tambin
denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o
"adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul. En este tipo
de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas
determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y
residentes en Gijn. Una vez determinada la cuota se eligen los primeros que se encuentren
que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.
2.- Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un
esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra
de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias de voto. Tambin puede ser que
el investigador seleccione directa e intencionadamente los individuos de la poblacin. El caso
ms frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene
fcil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios
alumnos). 3.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc. 4.- Muestreo Discrecional A criterio del investigador los
elementos son elegidos sobre lo que l cree que pueden aportar al estudio.
2.1.3 Estimacin
Introduccin
Tradicionalmente, los problemas de inferencia estadstica se dividen en problemas de

estimacin y pruebas de hiptesis, aunque en realidad todos son problemas de decisin y, por
tanto, se pueden manejar con un enfoque unificado. La diferencia principal entre las dos clases
de problemas es que en los problemas de estimacin debemos determinar el valor de un
parmetro (o los valores de varios parmetros) de un conjunto posible de alternativas, mientras
que en las pruebas de hiptesis debemos decidir si aceptamos o rechazamos un valor
especifico, o un conjunto de valores especficos, de un parmetro (o los de varios parmetros).
Caractersticas de un estimador
Puesto que los estimadores son variables aleatorias, uno de los problemas clave de la
estimacin puntual es estudiar las distribuciones muestrales. Por ejemplo, cuando estimamos la
varianza de una poblacin con base en una muestra aleatoria, difcilmente podemos esperar
que el valor de S 2 que obtenemos ser realmente igual a 2 , pero nos tranquilizara, al menos,
saber si podemos esperar que est cerca. Tambin, debemos decidir si usar una media de la
muestra o una mediana de la muestra para estimar la media de una poblacin, sera importante
saber, entre otras cosas, si X o X es ms probable que nos d un valor que sea en realidad
cercano.
As, se pueden usar diversas propiedades estadsticas de los estimadores, para decidir que
estimador es ms apropiado en una situacin dada, cual nos expone a un riesgo ms pequeo,
cul nos dar la mayor informacin al costo ms bajo, y as sucesivamente.
Las propiedades de los estimadores ms conocidas son insesgabilidad, varianza mnima,
eficiencia, consistencia, suficiencia y robustez.
Estimacin por intervalos
La estimacin puntual es una forma comn para expresar las estimaciones, deja espacio
para muchas preguntas. Por ejemplo, no nos dice en cunta informacin se basa la
informacin, ni nos dice nada sobre el tamao posible del error.
Como en el caso de la estimacin puntual, los mtodos de estimacin de intervalo se juzgan
por sus diversas propiedades estadsticas. Por ejemplo, una propiedad deseable es que la
longitud de un intervalo de confianza de 1 100% sea tan corta como sea posible; otra
propiedad deseable es que la longitud esperada, sea tan pequea como sea posible.
2.1.4 Prueba de hiptesis.

Introduccin
Todo mundo toma decisiones en la vida diaria. Algunas de estas decisiones son de fundamental
importancia y otras son aparentemente insignificantes. Todas las decisiones siguen el mismo patrn
bsico, se ponderan las alternativas; luego, con base en las convicciones y preferencias personales, y cual
sea la evidencia disponible, se llega a una decisin y e emprende la accin idnea. La prueba de hiptesis
estadstica sigue casi el mismo proceso, excepto de implicar informacin estadstica. En esta seccin se
desarrollaran muchos de los conceptos y actitudes de la prueba de hiptesis, a la vez que se consideraran
varias situaciones de toma de decisiones sin emplear la estadstica.
Problemas como cuando un ingeniero tiene que decidir con base en datos muestrales si el verdadero
promedio de vida de cierta clase de neumtico es, por lo menos, 22,000 millas, cuando un agrnomo tiene
que decidir con base en experimentos si una clase de fertilizante produce un rendimiento ms alto de frijol
de soya que otro, y cuando un fabricante de productos farmacuticos tiene que decidir con base en
muestras si 90 por ciento de todos los pacientes que reciben un nuevo medicamento se recuperarn de
cierta enfermedad, se pueden traducir al lenguaje de las pruebas estadsticas de hiptesis.
En el primer caso podramos decir que el ingeniero tiene que probar la hiptesis de que , el
parmetro de una poblacin exponencial, es por lo menos 22,000; en el segundo caso podramos decir que
el agrnomo tiene que decidir si 1 2 , donde 1 y 2 son las medias de dos poblaciones normales; y en
el tercer caso podramos decir que el fabricante tiene que decidir si , el parmetro de una poblacin
binomial, es igual a 0.90. En cada caso se debe suponer, por supuesto, que la distribucin escogida
describe correctamente las condiciones experimentales; esto es, la distribucin proporciona el modelo
estadstico correcto.
Una Hiptesis estadstica es una afirmacin o conjetura acerca de la distribucin de una o ms
variables aleatorias. Si una hiptesis estadstica especifica completamente la distribucin, se conoce como
Hiptesis simple; si no, se conoce como Hiptesis compuesta.
Una hiptesis simple debe, por consiguiente, especificar no solo la forma funcional de la
distribucin subyacente, sino tambin los valores de todos los parmetros. As, en el ejemplo que trata de
la efectividad del nuevo medicamento, la hiptesis = 0.90 es simple, suponiendo, claro est, que
especificamos el tamao de la muestra y que la poblacin es binomial. Sin embargo, en el primero de los
ejemplos anteriores la hiptesis es compuesta ya que 22,000 no asigna un valor especfico al
parmetro .
Para poder construir un criterio apropiado para probar hiptesis estadsticas, es necesario que
tambin formulemos Hiptesis alternativas. Para ilustrar esto, supongamos que seguimos el ejemplo que
trata de la vida de los neumticos, podramos formular la hiptesis alternativa de que el parmetro de la
poblacin exponencial es menos de 22,000; en el ejemplo que trata con las dos clases de fertilizantes,
podramos formular la hiptesis alternativa 1 = 2 ; y en el ejemplo que trata del nuevo medicamento,
podramos formular la hiptesis alternativa de que el parmetro de la poblacin binomial dada es solo
0.60, que es la tasa de recuperacin de la enfermedad sin el nuevo medicamento.
Frecuentemente, los estadsticos formulan como sus hiptesis exactamente lo contrario de lo que
quieren demostrar. Por ejemplo, si queremos demostrar que los estudiantes de una escuela tienen un
promedio de IQ ms alto que los de otra escuela, podramos formular la hiptesis de que no hay
diferencia: la hiptesis 1 = 2 . Con esta hiptesis sabemos qu esperar, pero este no sera el caso si
formulamos la hiptesis 1 > 2 , a menos que especifiquemos la diferencia real entre 1 2 .
De igual forma, si queremos demostrar que una clase de mineral tiene un porcentaje ms alto de
contenido de Uranio que otra, podramos formular la hiptesis de que los dos porcentajes son iguales; y si
queremos demostrar que hay una mayor variabilidad en la calidad de un producto de la que hay en la
calidad de otro, podramos formular la hiptesis de que no hay diferencia; esto es, 1 2 . En vista de las
suposiciones de no hay diferencia, hiptesis como stas nos llevan al trmino Hiptesis nula, pero hoy
en da este trmino si es vlido para cualquier hiptesis que quisiramos probar.
Confiabilidad y Significancia
Confiabilidad: Cuando hablamos de confiabilidad, hablamos de nivel de confianza y lo expresamos como
porcentaje. Por ejemplo, establezca con un nivel de confianza del 95 %, que la proporcin de productos
defectuosos, no pasa de 30, .
Significancia: Cuando hablamos de significancia, hablamos de nivel de significancia y lo expresamos
como una fraccin. Por ejemplo, de acuerdo a la evidencia mostrada, podemos decir, con un nivel de
significancia de 0.05, que los datos muestreados, tienen una distribucin normal
Errores tipo I y tipo II
1. El rechazo de la hiptesis nula cuando es verdadera se llama Error de tipo I: la

probabilidad de cometer un error de tipo I se denota con .
2. La aceptacin de la hiptesis nula cuando es falsa se llama Error de tipo II; la
probabilidad de cometer un error de tipo II se denota con .
Antes de seguir adelante, necesitamos ver los cuatro posibles resultados que podran manifestarse de que
la hiptesis nula sea verdadera o falsa, y de que la decisin sea rechazar H 0 o no rechazar H 0 .
Cuatro posibles resultados en una prueba de hiptesis

Decisin estadstica H0 H0
basada en la informacin
es verdadera es falsa
No se rechaza H 0 Decisin correcta cuya Se comete el Error tipo II

probabilidad es 1 con probabilidad
Se rechaza H 0 Se comete el Error tipo I Decisin correcta cuya

con probabilidad probabilidad es 1
Ejemplo: En una fbrica, el supervisor ha percibido que el nivel del caf en los envases
Pag. 315-321
Potencia de la prueba
Cuando se toma una decisin, sera bueno siempre tomar la decisin correcta. Esto, sin embargo, no
es posible en estadstica porque tomamos nuestras decisiones con base en informacin muestral. Lo mejor
que podemos esperar es controlar la probabilidad con la que ocurre un error. Ya dijimos que la
probabilidad asignada al error tipo I es . La probabilidad del error tipo II es .
Para controlar estos errores asignamos una pequea probabilidad a cada uno de ellos. Los valores de
probabilidad para y que se usan con ms frecuencia son 0.01 y 0.05 La probabilidad asignada a cada
error depende de su gravedad; cuando ms grave sea el error, menos dispuestos estamos a hacer que
ocurra, y, por tanto, se asignar un probabilidad ms pequea. y son probabilidades de errores, cada
una bajo condiciones separadas, y no se pueden combinar. En consecuencia, no es posible determinar una
sola probabilidad para tomar una decisin incorrecta. Del mismo modo, las dos decisiones correctas estn
claramente separadas y cada una tiene su propia probabilidad; 1 es la probabilidad de una decisin
correcta cuando la hiptesis nula es verdadera; y 1 es la probabilidad de una decisin correcta cuando
la hiptesis nula es falsa. 1 Recibe el nombre de potencia de la prueba estadstica, porque es la
medida de la capacidad de una prueba de hiptesis para rechazar una hiptesis nula falsa, una
caracterstica muy importante.
La prueba de una hiptesis estadstica es la aplicacin de un conjunto explcito de reglas para decidir
si aceptamos la hiptesis nula o la rechazamos en favor de la hiptesis alternativa. Suponga, por ejemplo,
que un estadstico desea probar la hiptesis nula 0 contra la hiptesis alternativa 1 . Para tomar
una decisin, generar datos muestrales por medio de un experimento y despus calcular el valor de un
estadstico de prueba, que le dir qu accin tomar para cada resultado posible del espacio muestral. El
procedimiento de prueba, por consiguiente, divide los valores posibles del estadstico de prueba en dos
regiones: una regin de aceptacin para H0 y una regin de rechazo para H0.
Es costumbre referirse a la regin de rechazo para H0 como la regin critica de la prueba, y a la
probabilidad de obtener un valor del estadstico de prueba dentro de la regin critica, cuando H0 es verdad,
como el tamao de la regin critica. As, el tamao de una regin critica es justamente la probabilidad
de cometer un error de tipo I. sta probabilidad tambin se llama el nivel de significancia de la prueba.
Ejercicio: Con respecto al fabricante del nuevo medicamento, suponga que ste quiere probar la
hiptesis nula 0.90 contra la hiptesis alternativa 0.60 Su estadstico de prueba es x , el nmero
de xitos observados (recuperaciones) en 20 intentos, y aceptar la hiptesis nula s x 14 ; de otra
manera la rechazar. Encuentre y .
Solucin:
La regin de aceptacin para la hiptesis nula es x 15,16,17,18,19 y 20 y, correspondientemente, la
regin de rechazo (o regin crtica) es x 1, 2, 3,......14
Por consiguiente, de la tabla I:
P x 14; 0.90 0.0114
y
P x 14; 0.60 0.1255
Conclusin: Como > se comete un Error tipo II, por tanto rechazamos la hiptesis nula.
Utilizando el software Minitab, las grficas de las probabilidades quedan as:
Grfica de distribucin Grfica de distribucin

Normal, Media=10, Desv.Est.=1 Normal, Media=10, Desv.Est.=1
0.4 0.4
0.3 0.3
Densidad
Densidad
0.2 0.2
0.1 0.1
0.1256
0.0114
0.0 0.0
10 12.3 8.85 10
X X
=DISTR.BINOM.N (14, 20,0.9, 1)=0.0114 =1-DISTR.BINOM.N (14, 20,0.6, 1)=0.1256
Un buen procedimiento de prueba es aquel donde ambas y son pequeas, de ese modo
nos da una buena oportunidad de tomar la decisin correcta. La probabilidad de un error tipo II en el
ejemplo es ms bien alta, pero esta se puede reducir al cambiar en forma apropiada la regin critica. Por
ejemplo, si usamos la regin de aceptacin x 15 en este ejemplo de manera que la regin critica sea
x 15 , se puede comprobar con facilidad que esto hara 0.0433 y 0.0509 . As, aunque se ha
reducido la probabilidad de un error de tipo II, se ha vuelto ms grande la probabilidad de un error de tipo
I.
La nica forma en que podemos reducir las probabilidades de ambos tipos de errores es aumentar el
tamao de la muestra, pero mientras n se mantenga fija, esta relacin inversa entre las probabilidades de
errores de tipo I y de tipo II es tpica de los procedimientos de decisin estadsticos. En otras palabras, si
la probabilidad de un tipo de error se reduce, la del otro tipo de error aumenta.
2.1.5 Mtodo clsico de estimacin puntual.
Estimacin puntual
Cuando usamos el valor de una estadstica para estimar un parmetro de poblacin,
llamamos a esto estimacin puntual, y nos referimos al valor de la estadstica como un
estimador puntual del parmetro. Por ejemplo, si usamos el valor de X para estimar la media
de una poblacin, una proporcin muestral observada para estimar el parmetro de una
poblacin binomial, o un valor de S 2 para estimar una varianza de poblacin, en cada caso
usamos una estimacin puntual del parmetro en cuestin. Estas estimaciones se llaman
estimadores puntuales porque en cada caso un nmero nico, o un punto nico en el eje real,
se usa para estimar el parmetro.
Correspondientemente, nos referimos a las estadsticas mismas como estimadores
puntuales. Por ejemplo, X se puede usar como un estimador puntual de , en cuyo caso x
es un punto estimado de este parmetro. En forma similar, S 2 se puede usar como un

estimador puntual de 2 , en cuyo caso s 2 es un estimador puntual de este parmetro. Aqu
usamos la palabra puntual para distinguir entre estimadores y estimaciones.
2.1.6 Estimador insesgado.
Se dice que un estimador es insesgado si la media de la distribucin del estimador es

igual a la del parmetro.
Estimadores insesgados son la Media muestral (estimador de la media de la poblacin) y
la Varianza muestral (estimador de la Varianza poblacional)

2.2 Intervalos de confianza.
Intervalo de confianza para la media
Para ilustrar cmo se puede evaluar el tamao posible de los errores en la estimacin
puntual, supongamos que la media de una muestra aleatoria se va a usar para estimar la media
de una poblacin normal con varianza conocida 2 .
Teorema 1: Si , la media de una muestra aleatoria de tamao n de una
poblacin normal con la varianza conocida 2 , se va a usar como un estimador
de la media de la poblacin, la probabilidad es 1 de que el error ser menor
que

z
2 n
Ejemplo: Un equipo de expertos en eficiencia intenta usar la media de una muestra aleatoria de
tamao n 150 para estimar el promedio de la aptitud mecnica de los trabajadores de una
lnea de ensamble en una industria grande. Si basados en la experiencia, los expertos en
eficiencia pueden suponer que 6.2 para esos datos, Qu pueden afirmar con probabilidad
de 0.99 acerca del error mximo de su estimacin?
Solucin:
Sustituimos n 150 , 6.2 y z 2.575 en la expresin para el error mximo, y obtenemos

2
6.2
2.575 1.30 , as, los expertos en eficiencia pueden afirmar con probabilidad de 0.99 que
150
su error ser menor que 1.30
Intervalo de confianza para , con conocida
Como x es un estimador suficiente de la media de una poblacin normal con varianza

conocida 2 , lo utilizaremos para obtener un intervalo de confianza de de una poblacin de
este tipo.
Teorema 2: Si x es el valor de la media de una muestra aleatoria de tamao n de una poblacin

normal con la varianza conocida 2 , entonces

x z z
2 n 2 n
Es un intervalo de confianza de 1 100% para la media de la poblacin.
Ejemplo: Si una muestra aleatoria de tamao n 20 de una poblacin normal con la varianza
2 225 tiene la media x 64.3 , construya un intervalo de confianza del 95% para la media de
la poblacin .
Solucin:
Sustituimos n 20 , 15 , x 64.3 y z0.025 1.96 en la frmula del intervalo de confianza, y
obtenemos
15 15
64.3 1.96 64.3 1.96
20 20
57.7 70.9
Intervalo de confianza para , con desconocida y muestra pequea
Cuando estamos tratando con una muestra aleatoria de una poblacin normal, n 30 y
es desconocida, no podemos usar la frmula anterior, debemos usar
Teorema 3: Si x y s son los valores de la media y la desviacin estndar de una muestra aleatoria
de tamao n de una poblacin normal con la varianza 2 desconocida, entonces
s s
x t , n 1
x t , n1
2 n 2 n
Es un intervalo con 1 100% de confianza para la media de la poblacin.
Ejemplo: Un fabricante de pinturas quiere determinar el tiempo promedio de secado de una

pintura de muros interiores. Si para 12 reas de prueba del mismo tamao ha obtenido una
media de tiempo de secado de 66.3 minutos y una desviacin estndar de 8.4 minutos,
construya un intervalo de confianza del 95% para la media verdadera .
Solucin:
Al sustituir x 66.3 , s 8.4 y t0.025, 11 2.201 , el intervalo de confianza del 95% para se
vuelve
8.4 8.4
66.3 2.201 66.3 2.201
12 12
61.0 71.6
Esto significa que podemos afirmar con 95% de confianza que el intervalo de 61.0 minutos a
71.6 minutos contiene el verdadero promedio del tiempo de secado de la pintura.
Intervalo de confianza para la diferencia de medias
Para muestras aleatorias independientes de poblaciones normales
Z
X 1 X 2 1 2
12
22
n1 n2
Tiene la distribucin normal estndar. Si sustituimos esta expresin por Z en

P Z Z Z
2 2
1 nos da la siguiente frmula para el intervalo de confianza para 1 2
Teorema 4: Si X 1 y X 2 son los valores de las medias de muestras aleatorias independientes de

tamao n1 y n2 de poblaciones normales con las varianzas conocidas 12 y 22 , entonces
12 22 12 22
X X Z 2
*
n1

n2
1 2 X X Z *
2 n1

n2
Es un intervalo de confianza del 1 100% para la diferencia entre las dos medias de las poblaciones
Ejemplo:
Construya un intervalo de confianza del 94% para la diferencia entre las vidas medias de dos
clases de focos, dado que una muestra aleatoria de 40 focos de la primera clase dur en
promedio 418 horas de uso continuo y 50 focos de la segunda clase duraron en promedio 402
horas de uso continuo. Las desviaciones estndar de las poblaciones se sabe que son
1 26 y 2 22 .
Solucin:
Para 0.06, Z0.03 1.88 , Por consiguiente, el intervalo de confianza del 94% para 1 2
es
418 402 1.88* 262 1 2 418 402 1.88* 26

2 2 2
22 22
40 50 40 50
6.3 1 2 25.7
Por tanto, estamos 94% seguros de que el intervalo de 6.3 a 25.7 horas contiene la
diferencia real entre las vidas medias de las dos clases de focos. El hecho de que ambos
lmites de confianza son positivos sugiere que en promedio la primera clase de focos es
superior a la segunda.
EJERCICIOS DE LA UNIDAD II
Tema: Intervalos de confianza para la media
11.15 Un estudio del crecimiento anual de ciertos cactus mostro que 64 de ellos, seleccionados
aleatoriamente en una regin desrtica crecieron en promedio 52.80 mm con una desviacin
estndar de 4.5 mm Construya un intervalo de confianza del 99 % para el verdadero promedio de
crecimiento anual de la clase de cactus dada.
11.19 Un experto en eficiencia quiere determinar la cantidad promedio de tiempo que tarda la cuadrilla
de un foso en cambiar un juego de cuatro neumticos a un auto de carreras. Use la frmula
propuesta para calcular el tamao de la muestra (n) que se necesita para que el experto en
eficiencia pueda afirmar con 95% de probabilidad que la media de la muestra diferir de , la
cantidad a ser estimada, en menos de 2.5 segundos. Se sabe por estudios previos que =
12.2 }.
2
= [2 ]

11.21 La longitud de los crneos de 10 esqueletos fsiles de una especie extinta de pjaros tiene una
media de 5.68 cm y una desviacin estndar de 0.29 cm. Suponga que esas mediciones estn
distribuidas normalmente, encuentre un intervalo de confianza del 95 % para la media de la
longitud de los crneos de esta especie de pjaro.
Tema: Intervalos de confianza para la diferencia de medias
11.25 Un estudio de dos clases de equipo de fotocopiado muestra que 61 averas del equipo de la
primera clase se llevaron en promedio 80.7 minutos en ser reparadas con una desviacin estndar
de 19.4 minutos, mientras que 61 averas del equipo de la segunda clase se llevaron en promedio
88.1 minutos en ser reparadas con una desviacin estndar de 18.8 minutos. Encuentre un
intervalo de confianza del 99 % para la diferencia entre los verdaderos promedios del tiempo que
toma reparar las averas de las dos clases de equipo de fotocopiado.
11.27 Las siguientes son las capacidades calricas del carbn de dos minas (en millones de caloras
por tonelada):
Mina A: 8 500 8 330 8 480 7 960 8030
Mina B: 7 710 7 890 7 920 8 270 7 860
Suponga que los datos constituyen muestras aleatorias independientes de poblaciones normales con
varianzas iguales, construya in intervalo de confianza del 99 % para la diferencia entre los promedios
verdaderos de las capacidades calricas del carbn de las dos minas.
3.6 Prueba de hiptesis para la media

En esta seccin examinaremos las pruebas concernientes a la media de una poblacin que se usan
ms ampliamente. Todas las pruebas en esta seccin se basan en la teora de la distribucin normal, se
supone que las muestras provienen de poblaciones normales o que son suficientemente grandes para
justificar las aproximaciones normales.
Suponga que queremos probar la hiptesis nula 0 contra una de las alternativas
0 , 0 y 0 sobre la base de una muestra aleatoria de tamao n de una poblacin normal
con la varianza conocida 2 . Como indicamos anteriormente, los niveles de significancia que ms
comnmente se usan son 0.05 y 0.01 y como hemos visto en ejemplos anteriores: z y z dan
2
z0.05 1.645, z0.01 2.33, z0.025 1.96 y z0.005 2.575
Ejemplo 10: En relacin con el ejemplo 1, el diseo del experimento para contrastar la hiptesis
del supervisor especifica que debe seleccionar una muestra de 16 envases obtenidos al azar de la lnea de
produccin. Si la muestra arrojo una media de X 302.5 gr , a qu decisin se llega con un nivel de
confianza del 95%, suponiendo que la muestra proviene de una poblacin distribuida normalmente, con
varianza 2 9 ?
Solucin:
i. La hiptesis estadstica es: H 0 : 300 H a : 300
ii. Estadstico de prueba: La poblacin de inters X " Contenido de caf en los envases "
est normalmente distribuida, as que no interesa el tamao de la muestra y como se
conoce la varianza de la poblacin 2 9 , entonces el estadstico de prueba es:
X
Z que tiene una distribucin normal estndar.

n
iii. Regla de decisin: Por ser una prueba de cola derecha se tiene que para =0.05, el valor
crtico es: 1 = 0.95 = 1.645. Luego la regla de decisin es:
Rechace H0 si > .
iv. Decisin estadstica: Los datos con los que se cuenta son:
= , = . , = , = .

. .
Con estos datos resulta que = = = = = . , por tanto, la

decisin es: rechcese H0 ya que = 3.333 > 1.645
v. Decisin tcnica: Se presenta la probabilidad de un error tipo I, controlada con el nivel de
significancia ; la decisin estadstica de rechazar H0 implica aceptar Ha, y como la
hiptesis alternativa establece que >300, entonces la decisin tcnica debe ser detener
el proceso de produccin y llamar al personal especializado para que ajuste la mquina
envasadora).
Ejemplo 11: Suponga que por experiencia se sabe que la desviacin estndar del peso de paquetes
de 8 onzas de galletas de cierta pastelera es de 0.16 onzas. Para comprobar si su produccin est bajo
control en un da dado, esto es, comprobar si el peso promedio verdadero de los paquetes es 8 onzas, los
empleados seleccionan una muestra aleatoria de 25 paquetes y encuentran que la media de su peso es x =
8.091 onzas. Puesto que la pastelera pierde dinero cuando > 8 y el cliente pierde cuando < 8, pruebe
la hiptesis nula = 8 contra la hiptesis alternativa 8 al nivel 0.01 de significancia.
Solucin
H0 : 8
H1 : 8
0.01
x 0
Rechace la hiptesis nula si z -2.575 o z 2.575 donde z

n
8.091 8 0.091
Al sustituir x 8.091, 0 8, 0.16 y n 25, obtenemos z 2.8438
0.16 0.0320
25
Puesto que z 2.8438 excede a 2.575, se debe rechazar la hiptesis nula y se deben hacer ajustes
apropiados en el proceso de produccin.
Ejemplo 12: Suponga que 100 neumticos que cierto fabricante produce duraron en promedio 21, 819
millas con una desviacin estndar de 1, 295 millas. Pruebe la hiptesis nula 22, 000 millas contra la
hiptesis alternativa 22, 000 millas en el nivel 0.05 de significancia.
Solucin:
H 0 : 22, 000
1. H1 : 22, 000
0.05
x 0
2. Rechace la hiptesis nula si z 1.645, donde z

n
3. Al sustituir x 21,819, 0 22,000, 1, 295 y n 100, obtenemos
21,819 22, 000 181
z 1.3977
1, 295 12.95
100
4. Puesto que z 1.3977 es mayor que 1.645, no se puede rechazar la hiptesis nula; no hay
evidencia real de que los neumticos no son tan buenos como se supone bajo la hiptesis nula.
3.7 Prueba de hiptesis para la diferencia de medias

Supongamos que estamos tratando con muestras aleatorias independientes de tamao n1 y n2 de
dos poblaciones normales que tienen las medias 1 y 2 y las varianzas conocidas 12 y 22 y que
queremos probar la hiptesis nula 1 2 donde es una constante dada, contra una de las
alternativas 1 2 , 1 2 o 1 2
Aplicando la tcnica de la razn de verosimilitud, llegaremos a una prueba basada en la siguiente

formula:
x x
z 1 2
12 22

n1 n2
Ejemplo 13: Se hace un experimento para determinar si el contenido promedio de nicotina de una
clase de cigarrillos excede al de otra clase en 0.20 miligramos. Si n1 50 cigarrillos de la primera clase
tuvieron un contenido promedio de nicotina de x1 2.61 mg con una desviacin estndar de s1 0.12 mg ,
en tanto que n2 40 cigarrillos de la otra clase tuvieron un contenido promedio de nicotina de
x2 2.38 mg con una desviacin estndar de s2 0.14 mg , pruebe la hiptesis nula 1 2 0.20 contra
la hiptesis alternativa 1 2 0.20 en el nivel 0.05 de significancia. Tome la decisin con base en el
Valor p que corresponde al valor del estadstico de prueba apropiado.
Solucin:
1. H 0 : 1 2 0.20
H 0 : 1 2 0.20
0.05
2. Use la estadistica de prueba z, donde

x x
z 1
12 22

n1 n2
3. Sustituyendo los datos :

2.61 2.38 0.20
z 1.08

2 2
0.12 0.14
50 40
ESTADISTICA Y CONTROL DE CALIDAD
Buscamos este valor en la tabla de la Distribucin normal:

0.07 0.08 0.09
0.9
1.0 0.1401
1.1
Este valor corresponde a una cola, por tanto, Valor p 2 0.1401 0.2802
4. Puesto 0.2802 0.05 , no se puede rechazar la hiptesis nula; es decir que, la diferencia entre
2.61 2.38 0.23 y 0.20 no es significativa. Esto significa que la diferencia bien podra
atribuirse al azar
NOTA: Cuando n1 y n2 son pequeas y 1 y 2 son desconocidas, no se puede usar la prueba

anterior. En tal caso debemos usar
x x
t 1 2 con s 2

n1 1 s12 n2 1 s22
n1 n2 2
p
1 1
sp
n1 n2
Las regiones crticas apropiadas de tamao para probar la hiptesis nula 1 2 , contra
las alternativas 1 2 , 1 2 o 1 2 bajo las suposiciones dadas son,
respectivamente, t t , n1 n2 2
, t t , n1 n2 2 y t t , n1 n2 2 .
2
Ing. Fernando Loera Rivera

Docente Ingeniera industrial
Tecnolgico Nacional de Mxico
ITSU
3.8 Prueba de hiptesis para la proporcin
Si el resultado de un experimento es el nmero de votos que un candidato recibe en una

votacin, el nmero de defectos encontrados en una pieza de tela, el nmero de nios que se
ausentan de la escuela en un da dado,.., nos referimos a estos datos como datos de conteo.
Los modelos apropiados para el anlisis de los datos de conteo son la distribucin binomial, la
distribucin de Poisson, la distribucin multinomial y algunas de las dems distribuciones
discretas que se estudiaron en la materia de PROBABILIDAD Y ESTADSTICA.
En esta seccin presento una de las pruebas ms comunes basada en datos de conteo, una
prueba concerniente al parmetro de la distribucin binomial. As, podramos probar con base
en una muestra si la verdadera proporcin de curaciones de cierta enfermedad es 0.90 o si la
verdadera proporcin de defectos que salen en una lnea de ensamble es 0.02
Ejemplo 14: Si x 4 de n 20 pacientes sufrieron efectos secundarios serios a causa de
un nuevo medicamento, pruebe la hiptesis nula 0.50 contra la hiptesis alternativa
0.50 en el nivel 0.05 de significancia. En este caso es la proporcin verdadera de pacientes
que sufren efectos secundarios serios a causa del nuevo medicamento.
Solucin:
H 0 : 0.50
1. H A : 0.50
0.05
2. Use la estadstica de prueba X, el nmero observado de xitos.
3. x 4 , y puesto que P X 4 0.0059 el Valor p es2 0.0059 0.0118
4. Puesto que el Valor-p es menor que 0.05, se debe rechazar la hiptesis nula; y concluimos que 0.50
Si usamos tamaos grandes de n, podemos usar las siguientes formulas:
x n
z Como una variable aleatoria que tiene la distribucin normal estndar.
n 1

ITSU
De otra manera, podemos probar la hiptesis nula 0 contra las alternativas 0 , 0 o

0 usando respectivamente las regiones criticas
Tamao de muestra Hiptesis nula Hiptesis alternativas Estadstico de

prueba
0 z z
2
n 100 0 0 z z
0 z z
x n 0 1
x n 0
z z
2
n 0 1 0
Y la siguiente formula: o
n 0 1 0
Si usamos la correccin por continuidad, usamos el signo menos cuando x excede a n0 y el

signo de ms cuando x es menor que n0
3.9 Prueba de hiptesis para la diferencia de proporciones
En muchos problemas de investigacin aplicada, debemos decidir si las diferencias

observadas entre proporciones muestrales, o los porcentajes, son significativos o si se pueden
atribuir a la suerte. Por ejemplo, si el 6 por ciento de los pollos congelados en la muestra de un
proveedor falla en cumplir ciertos estndares y solo 4 por ciento en la muestra de otro proveedor
falla en cumplir los estndares, quiz deseamos investigar si la diferencia entre estos dos
porcentajes es significativa.
Para indicar un mtodo general de manejar los problemas de esta clase, suponga que
x1 , x2 , ....., xk son los valores observados de k variables aleatorias independientes
X1 , X 2 ,......., X k que tienen distribuciones binomiales con los parmetros n1 y 1 , n2 y 2 y
nk y k .
Si las n son suficientemente grandes, podemos aproximar las distribuciones de las
variables aleatorias independientes:
X i nii
a) Zi para i 1, 2, ....., k con distribuciones normales estndar,
nii 1 i
xi nii
2
k

2
i 1 ni i 1 i
y , podemos entonces considerar como un valor
de una variable aleatoria que tiene la distribucin ji cuadrada con k grados de

libertad. Para probar la hiptesis nula, 1 2 ..... k 0 (contra la alternativa
ITSU
que al menos una de las no es igual a 0 ), podemos usar as la regin critica
xi ni0
2
k
, donde
2
2 2, k
i 1 ni 0 1 0
b) Cuando no se especifica 0 , esto es, cuando solo nos interesa la hiptesis nula
1 2 ..... k sustituimos por la estimacin ponderada
x1 x2 .... xk
2 2, k 1 , donde
n1 n2 .... nk y la regin crtica se vuelve

2
k xi ni
2
i 1 n 1
i
La prdida de 1 grado de libertad, esto es, el cambio de la regin crtica de 2 2 , k a

2 2, k 1 se debe al hecho de que se sustituye una estimacin por el parmetro
desconocido .
Presento ahora una frmula alternativa para la estadstica ji cuadrada inmediata anterior,
la cual, se presta ms rpidamente a otras aplicaciones. Si arreglamos los datos como en la
tabla siguiente
xitos Fracasos
Muestra 1 x1 n1 x1
Muestra 2 x2 n2 x2
.
Muestra k xk nk xk
Refirmonos a sus elementos como frecuencias de celda observadas f ij , donde el

primer subndice indica el rengln y el segundo subndice indica la columna de esta tabla k x 2.
Bajo la hiptesis nula 1 2 ..... k 0 las frecuencias de celda esperadas para la
primera columna son ni 0 para i 1, 2, ....., k y para las de la segunda columna son ni 1 0 .
Cuando no se conoce sustituimos en su lugar, como antes, la estimacin ponderada , y
0
calculamos las frecuencias de celda esperadas como

ITSU
ei1 ni y e2 ni 1 para i 1, 2, ....., k

El alumno podr como ejercicio demostrar que la estadstica ji cuadrada
2 f e
2
xi ni
2
k k
2 tambin se puede escribir 2
ij ij

i 1 ni 1
i 1 j 1 eij
Ejemplo 15: Determine, con base en los datos muestrales de la siguiente tabla, si la
proporcin verdadera de compradores que favorecen el detergente A sobre el detergente B es la
misma en las tres ciudades:
Nmero que favorece Nmero que favorece

al detergente A al detergente B
Los Angeles 232 168 400
San Diego 260 240 500
Indio 197 203 400
Use el nivel de significancia de 0.05
Solucin:
H 0 : 1 2 3
1. H A : 1 , 2 y 3 no son todas iguales
0.05
2. Rechace la hiptesis nula si 2 0.05,
2
2 5.991 donde
fij eij
2
3 2
2
i 1 j 1 eij
232 260 197 689
3. La estimacin ponderada de es 0.53
400 500 400 1300
Las frecuencias de celda esperadas son:

e11 400 0.53 212 y e12 400 0.47 188
e21 500 0.53 265 y e22 500 0.47 235
e31 400 0.53 212 y e32 400 0.47 188
Y la sustitucin en la frmula para 2 nos da
232 212 260 265 197 212 168 188 240 235 203 188
2 2 2 2 2 2
2
6.48
212 265 212 188 2235 188

ITSU
4. Puesto que 2 6.48 excede a 5.991, se debe rechazar la hiptesis nula; en otras palabras, las
proporciones verdaderas de compradores que favorecen el detergente A sobre el detergente B en las 3
ciudades no son las mismas.
3.10 Prueba de hiptesis para la varianza
Hay varias razones por las que es importante probar las hiptesis concernientes a las
varianzas de las poblaciones. En lo que concierne a las aplicaciones directas, un fabricante que
tiene que cumplir con especificaciones rgidas tendr que efectuar pruebas sobre la variabilidad
de su producto, tal vez un maestro desea saber si ciertas aseveraciones son verdaderas acerca de
la variabilidad que puede esperar en el desempeo de un estudiante, y quiz un farmacutico
tiene que comprobar si la variacin en la potencia de una medicina est dentro de los lmites
permisibles. En lo que concierne a aplicaciones indirectas, las pruebas acerca de las varianzas a
menudo son prerrequisitos para las pruebas concernientes a otros parmetros. Las pruebas que
veremos en esta seccin son:
1. Prueba de la hiptesis nula de que la varianza de una poblacin normal es igual a una
constante dada
2. Prueba de la igualdad de las varianzas de dos poblaciones normales (a la que nos
referiremos en la seccin 3.11)

ITSU
La primera de estas pruebas es esencialmente, dada una muestra aleatoria de tamao n de

una poblacin normal, queremos probar la hiptesis nula 2 02 contra las alternativas 2 02
, 2 02 o 2 02 .
As que podemos escribir las regiones crticas para probar la hiptesis nula contra las dos
alternativas de un lado como 2 2, n1 y 2 12 , n1
Donde 2 n 1 S 2
2
0
Ejemplo 16: Suponga que el espesor de una parte usada de un semiconductor es su dimensin crtica y que las
mediciones del espesor de una muestra aleatoria de 18 de dichas partes tiene la varianza S 0.68 , donde las
2
mediciones son en milsimas de pulgada. El proceso se considera que est bajo control si la variacin del espesor
est dada por una varianza no mayor que 0.36 Suponga que las mediciones constituyen una muestra aleatoria de
una poblacin normal, pruebe la hiptesis nula 2 0.36 contra la hiptesis alternativa 2 0.36 en el nivel
de 0.05 de significancia.
SOLUCION:
H 0 : 2 0.36
1. H A : 2 0.36
0.05
2 2 , n1 , 2
n 1 S 2
2. Rechace la hiptesis nula si donde y
02
2, n1 0.05,17
2
27.587
17 0.68
3. Sustituimos S 2 0.68, 02 0.36 y n 18, y obtenemos 2 32.11
0.36
4. Puesto que 2 32.11 27.587 , la hiptesis nula debe rechazarse y el proceso para la
manufactura de las partes debe ajustarse. Advierta que si hubiera sido 0.01, no se
podra haber rechazado H 0 , puesto que 2 32.11 no excede a 0.01,2
17 33.409 . Esto
sirve para indicar una vez ms que la eleccin del nivel de significancia debe hacerse por
adelantado, para evitar la tentacin de escoger un valor que casualmente satisfaga
nuestros fines.
Ejemplo 17: En una empacadora de leche en polvo se ha observado que queda demasiado
espacio vaco en los botes cuyo contenido neto es de 1000 gr y se decide optimizar el costo de los
botes mediante el ahorro de material para su elaboracin; el proceso natural de compactacin de
la leche envasada debera de darse con una varianza menor que 400 cm3. En una muestra de 15
botes seleccionados al azar se mide la diferencia entre el volumen que ocupa el producto al ser
enlatado y el que ocupa despus de ocurrida la compactacin. La varianza de los 15 datos
muestrales es S2 = 349.7 cm3. A qu decisin llegaran con estos datos?
Solucin:

ITSU
1. Hiptesis estadstica: Si los fabricantes tienen la razn, la hiptesis es:

H 0 : 2 400 H a : 2 400
2. Estadstico de prueba: Como el tamao de la muestra es n = 15, la normalidad de la
poblacin original X = Diferencia en el volumen debe estar garantizada para que el
estadstico de prueba
2 n 1 S 2
tenga una distribucin Chi-cuadrada con 14 gl
02
3. Regla de decisin: Para un nivel de significancia 0.05 y una prueba de cola derecha
se tiene
Se rechaza H0 si 2 0.05,
2
14
Si buscamos en tablas, encontramos que 0.05, 2

14 6.57 mismo valor que nos da el
software Minitab, adems de las regiones de rechazo y aceptacin de H0
Grfica de distribucin
Chicuadrado, df=14
0.09
0.08
0.07
Regin de
0.06
aceptacin de H0
Densidad
0.05
0.04
0.03
0.02
0.01
0.05
0.00
0 6.57
X
Regin de
rechazo de H0
4. Decisin estadstica: Para obtener el estadstico de prueba calculado se tienen los datos
n 15, S 2 349.7, 02 400 , entonces 2

n 1 S 2 14 349.7 12.2395 , por
02 400
tanto, la decisin estadstica es: Se acepta H0 porque 2 12.2395 6.5706 0.05,
2
14
5. Decisin tcnica: Al aceptar H0 nos enfrentamos a la posibilidad de cometer el error tipo

II consistente en no reducir el tamao de los botes cuando en realidad s sea factible
efectuar este proceso de optimizacin de las ganancias por el ahorro de material. Y al no
tener controlada la probabilidad de cometer este error es recomendable investigar la
misma situacin con un tamao de muestra ms grande para reducir la probabilidad de
cometer el error de tipo II.
3.11 Prueba de hiptesis para la relacin de varianzas.
Estas pruebas se emplean cuando el inters se concentra en comparar las varianzas de dos
poblaciones, en particular al seleccionar el estadstico de prueba adecuado en la prueba de
hiptesis para dos medias con varianzas desconocidas, se tiene que decidir si ambas varianzas son

ITSU
iguales, o sea que 12 22 , (en cuyo caso empleamos el estadstico de prueba
t
X 1 X 2 1 2
con S 2

n1 1 S12 n2 1 S 22
) o no lo son, es decir que 2 2 , (en
n1 n2 2
p 1 2
1 1
Sp
n1 n2
cuyo caso aplicamos el estadstico de prueba t

X 1 X 2 1 2
S12 S22

n1 n2
Para tener bases bien fundadas para cimentar esta decisin efectuamos la prueba de
hiptesis para dos varianzas de poblacin en:
Dos colas: H0: 12 22 Ha: 12 22
Cola derecha: H0: 12 22 Ha: 12 22
Cola izquierda: H0: 12 22 Ha: 12 22
S12 12
En general, el estadstico de prueba para esta situacin es: F , sin embargo,
S22 22
cuando la prueba de hiptesis se hace bajo el supuesto de que H0 es cierta, podemos considerar
S12
que 1 2 por lo que dicho estadstico se reduce a F 2
2 2
S2
El valor crtico para una prueba en cola izquierda es F , n 2 1, n1 1 que puede ser obtenido de
1
la igualdad Fn2 1, n1 1, y buscando Fn1 1, n2 1,1 en tablas.
Fn1 1, n2 1, 1
El valor crtico para cola derecha es Fn1 1, n2 1,1 y los valores crticos para la prueba de
dos colas se obtienen con Fn 1, n 1, 1 y Fn 1, n 1, 1
1 2 2 2 1 2
Ejemplo 18: La homogeneizacin del conocimiento es una caracterstica de gran relevancia para
los investigadores. Se est estudiando si entre el mtodo onomatopyico y el del silabario hay
diferencias en la homogeneidad de los resultados de la enseanza de la lectura a los nios que
ingresan a la primaria sin saber leer. Se conformaron dos grupos, cada uno de 25 alumnos
seleccionados al azar y se asign a un grupo tambin seleccionado al azar- un profesor
especialista en el mtodo onomatopyico, siendo el otro grupo atendido por un especialista en el
ITSU
mtodo del silabario. Al fin del ao escolar una prueba estndar de lectura dio los siguientes
resultados:
Mtodo onomatopyico S12 128.4
Mtodo del silabario S12 166.7
Estos datos dan evidencia significativa para afirmar que entre ambos mtodos existe una
diferencia en el grado de homogeneidad del aprendizaje?
Solucin:
1. Hiptesis estadstica: Homogeneidad y heterogeneidad son conceptos que se miden con
la varianza, por eso el planteamiento estadstico es:
H0: 12 22 Ha: 12 22
2. Estadstico de prueba: Los tamaos de muestra n1 n2 25 , sin ser pequeos, no son lo
suficientemente grandes; entonces el requisito es que ambas poblaciones se distribuyan
S12
aproximadamente en forma normal para que el estadstico de prueba F 2 tenga una
S2
distribucin F-Fisher con n1 1 n2 1 24 gl en el numerador y en el denominador.
3. Regla de decisin: Si 0.05 , para una prueba de dos colas los valores crticos que
determinan las regiones de aceptacin y de rechazo de H0 son F24, 24, 0.975 2.27 y
1 1
F24, 24, 0.025 0.4405 , la regla de decisin es:
F24, 24, 0.975 2.27
Se rechaza H0 si FCalc F24, 24, 0.025 0.4405 o si FCalc F24, 24, 0.975 2.27
F, df1=24, df2=24
1.2
1.0
0.8
Densidad
0.6
0.4
0.2
0.025
0.025
0.0
0 0.4405 2.27
X

ITSU
4. Decision estadstica: Con los datos S12 128.4 y S12 166.7 obtenemos el estadstico de
S12 128.4
prueba calculado: F 2 0.7702 , siendo la decisin estadstica
S2 166.7
Aceptar H0 porque F24, 24, 0.025 FCalc F24, 24, 0.975 , esto es, cae en la zona de aceptacin
de H0 es decir, 0.4405 0.7702 2.27
F, df1=24, df2=24
1.2
1.0
0.8
Densidad
0.6
0.4
0.2
0.025
0.025
0.0
0 0.4405 2.27
X
0.7702
5. Decisin tcnica: Aceptando la hiptesis nula H0 quedamos expuestos a cometer el error

tipo II y como no tenemos controlada la probabilidad de cometer este error no podemos
afirmar que no hay diferencias de homogeneidad entre ambos mtodos. Se recomienda
investigar entonces otro tipo de factores que pueden influir en tal diferencia para repetir
el experimento con un mayor nmero de alumnos.

ITSU

Métodos de muestreo probabilísticos y no probabilísticos en estadística

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Métodos de muestreo probabilísticos y no probabilísticos en estadística

Transféré par

Droits d'auteur :

Formats disponibles

2.1 Inferencia estadstica.

Tcnica empleada en esta seleccin.

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los

Muestreo aleatorio sistemtico.

Tradicionalmente, los problemas de inferencia estadstica se dividen en problemas de

2.1.4 Prueba de hiptesis.

Errores tipo I y tipo II

1. El rechazo de la hiptesis nula cuando es verdadera se llama Error de tipo I: la

Cuatro posibles resultados en una prueba de hiptesis

No se rechaza H 0 Decisin correcta cuya Se comete el Error tipo II

Se rechaza H 0 Se comete el Error tipo I Decisin correcta cuya

Utilizando el software Minitab, las grficas de las probabilidades quedan as:

Grfica de distribucin Grfica de distribucin

=DISTR.BINOM.N (14, 20,0.9, 1)=0.0114 =1-DISTR.BINOM.N (14, 20,0.6, 1)=0.1256

2.1.5 Mtodo clsico de estimacin puntual.

es un punto estimado de este parmetro. En forma similar, S 2 se puede usar como un

2.1.6 Estimador insesgado.

Se dice que un estimador es insesgado si la media de la distribucin del estimador es

Sustituimos n 150 , 6.2 y z 2.575 en la expresin para el error mximo, y obtenemos

Intervalo de confianza para , con conocida

Como x es un estimador suficiente de la media de una poblacin normal con varianza

Teorema 2: Si x es el valor de la media de una muestra aleatoria de tamao n de una poblacin

Sustituimos n 20 , 15 , x 64.3 y z0.025 1.96 en la frmula del intervalo de confianza, y

Intervalo de confianza para , con desconocida y muestra pequea

Ejemplo: Un fabricante de pinturas quiere determinar el tiempo promedio de secado de una

Intervalo de confianza para la diferencia de medias

Para muestras aleatorias independientes de poblaciones normales

Tiene la distribucin normal estndar. Si sustituimos esta expresin por Z en

Teorema 4: Si X 1 y X 2 son los valores de las medias de muestras aleatorias independientes de

418 402 1.88* 262 1 2 418 402 1.88* 26

Tema: Intervalos de confianza para la media

Tema: Intervalos de confianza para la diferencia de medias

3.6 Prueba de hiptesis para la media

z0.05 1.645, z0.01 2.33, z0.025 1.96 y z0.005 2.575

3.7 Prueba de hiptesis para la diferencia de medias

Aplicando la tcnica de la razn de verosimilitud, llegaremos a una prueba basada en la siguiente

2. Use la estadistica de prueba z, donde

3. Sustituyendo los datos :

Buscamos este valor en la tabla de la Distribucin normal:

NOTA: Cuando n1 y n2 son pequeas y 1 y 2 son desconocidas, no se puede usar la prueba

Ing. Fernando Loera Rivera

3.8 Prueba de hiptesis para la proporcin

Si el resultado de un experimento es el nmero de votos que un candidato recibe en una

Ing. Fernando Loera Rivera

De otra manera, podemos probar la hiptesis nula 0 contra las alternativas 0 , 0 o

Tamao de muestra Hiptesis nula Hiptesis alternativas Estadstico de

Si usamos la correccin por continuidad, usamos el signo menos cuando x excede a n0 y el

En muchos problemas de investigacin aplicada, debemos decidir si las diferencias

de una variable aleatoria que tiene la distribucin ji cuadrada con k grados de

que al menos una de las no es igual a 0 ), podemos usar as la regin critica

La prdida de 1 grado de libertad, esto es, el cambio de la regin crtica de 2 2 , k a

Refirmonos a sus elementos como frecuencias de celda observadas f ij , donde el

Ing. Fernando Loera Rivera

ei1 ni y e2 ni 1 para i 1, 2, ....., k

Nmero que favorece Nmero que favorece

Use el nivel de significancia de 0.05

Las frecuencias de celda esperadas son:

Y la sustitucin en la frmula para 2 nos da

Ing. Fernando Loera Rivera

3.10 Prueba de hiptesis para la varianza

Ing. Fernando Loera Rivera

La primera de estas pruebas es esencialmente, dada una muestra aleatoria de tamao n de