Ejercicios de Analisis U2

TECNOLGICO NACIONAL DE
MXICO
INSTITUTO TECNOLGICO DE
MINATITLN
EJERCICIOS DE TAREA
UNIDAD II: Tecnicas de muestreo y
pruebas de hiptesis.
Equipo.Aguilando Joachn Brenda Shaian
Palacios Alfonso Karen Jahaira
Palomeque Morales Samangtha Lynett
Torres Valencia Gabriela Estefhanie
Materia.Anlisis de datos experimentales

Docente:
Ing. Patricia del Carmen Rodrguez Ingles
Carrera:
Ingeniera Qumica
Semestre y Grupo:
3er Semestre Av-31M
Fecha de entrega: Minatitln, Ver a 23 de Octubre 2015
TECNOLGICO NACIONAL DE MXICO

INSTITUTO TECNOLGICO DE MINATITLN
10.
Se compara la produccin diaria promedio de dos procesos qumicos. Durante 72 das
se observ la produccin diaria de los dos procesos con los siguientes resultados: x1 = 834,
x2 = 808, s12 = 346, s22 = 302. Proporcionan los datos suficiente evidencia que indique
una diferencia en la produccin media de los dos procesos?
Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

11.
Se supone que una mquina mezcla cacahuates, avellanas, nueces y pepitas en la
relacin 4:3:2:1. Una lata contiene 500 de estos frutos mezclados y se encuentra que 269
son cacahuates, 112 avellanas, 74 nueces y 45 pepitas. En un nivel de significancia del 5 %,
pruebe la hiptesis de que la mquina est mezclando en la relacin 4:3:2:1.

12.
Una compaa opera cuatro mquinas tres turnos al da. De los registros de
produccin, se obtienen los datos siguientes sobre el nmero de fallas:
13.
Mquina
Turno
A
B
C
D
1
41
20
12
16
2
31
11
9
14
3
15
17
16
10
Pruebe la hiptesis de que el nmero de fallas es independiente del turno. Utilice un valor P
en su decisin.

A) TAREA DE INVESTIGACIN
MUESTREO:
a)IMPORTANCIA DEL MUESTREO
A lo largo del curso se hacen uso de dos tipos de razonamiento: el deductivo y el inductivo. El
primero est relacionado directamente con la teora de probabilidad, y que a partir de las
caractersticas de la poblacin se obtienen las posibles caractersticas de una muestra. El
segundo tipo de razonamiento se relaciona con la denominada inferencia estadstica: utilizar
las caractersticas de un subconjunto de la poblacin (la muestra) para hacer afirmaciones
(inferir) sobre la poblacin en general.
El muestro, como ya se mencion, implica algo de incertidumbre que debe ser aceptada para
poder realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo en
ocasiones demasiado grande :
Recursos limitados. Es decir, no existen los recursos humanos, materiales o

econmicos para realizar el estudio sobre el total de la poblacin. Es como cuando se
compra un aparato, un automvil usado (por ejemplo), que se prueba unos minutos (el
encendido, una carrerita, etc.) para ver si funciona correctamente y luego se adquiere,
pero no se espera a probarlo toda la vida (encendindolo y apagndolo o,
simplemente, dejndolo encendida) antes de realizar la adquisicin.
Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el
estudio paleontolgico de los dinosaurios (el T. Rex por ejemplo) sera muy bueno
contar con, al menos, muchos restos fsiles y as realizar tales investigaciones; sin
embargo, se cuenta slo con una docena de esqueletos fosilizados (casi todos
incompletos) de esas criaturas en todo el mundo.
Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la poblacin
llevara a la destruccin misma de la poblacin. Por ejemplo, si se quisiese saber el
conteo exacto de hemoglobina de una persona habra que extraerle toda la sangre.
El muestreo puede ser ms exacto. Esto es en el caso en el que el estudio sobre la
poblacin total puede causar errores por su tamao o, en el caso de los censos, que
sea necesario utilizar personal no lo suficientemente capacitado; mientras que, por
otro lado, el estudio sobre una muestra podra ser realizada con menos personal pero
ms capacitado.
b) TIPOS DE MUESTREO
Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en

general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y
mtodos de muestreo no probabilsticos.

I. Muestreo probabilstico
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas
las posibles muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Slo
estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra
extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo
probabilsticos encontramos los siguientes tipos:
1.- Muestreo aleatorio simple:
El procedimiento empleado es el siguiente:
1) se asigna un nmero a cada individuo de la poblacin y 2) a travs de algn medio
mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea
necesario para completar el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy grande.
2.- Muestreo aleatorio sistemtico:
Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin,
pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero
aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los
que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k=
N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la
poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que
estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros
son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con
k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una
representacin de los dos sexos.
3.- Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar
categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a
alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de inters estarn representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn
parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes,

pues exige un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos,
edades,...). La distribucin de la muestra en funcin de los diferentes estratos se denomina
afijacin, y puede ser de diferentes tipos:
Afijacin Simple:
A cada estrato le corresponde igual nmero de elementos mustrales.
Afijacin Proporcional:
La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato.
Afijacin Optima:
Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la
proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la
desviacin.
4.- Muestreo aleatorio por conglomerados:
Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los
elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la
poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas geogrficas
suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en
seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar
el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes
a los conglomerados elegidos.
II. Mtodos de muestreo no probabilsticos
A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente
costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven
para realizar generalizaciones (estimaciones inferenciales sobre la poblacin), pues no se
tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la
poblacin tienen la misma probabilidad de se elegidos. En general se seleccionan a los
sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa. En algunas circunstancias los mtodos estadsticos y
epidemiolgicos permiten resolver los problemas de representatividad aun en situaciones de
muestreo no probabilstico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la poblacin.

Entre los mtodos de muestreo no probabilsticos ms utilizados en investigacin
encontramos:
1.- Muestreo por cuotas:
Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de
un buen conocimiento de los estratos de la poblacin y/o de los individuos ms
"representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad
de aqul. En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de
individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40
aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se eligen los
primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho
en las encuestas de opinin.
2.- Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es
muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto. Tambin puede ser que el investigador
seleccione directa e intencionadamente los individuos de la poblacin. El caso ms frecuente
de este procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso
(los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).
3.- Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de
enfermos, etc.
4.- Muestreo Discrecional
A criterio del investigador los elementos son elegidos sobre lo que l cree que pueden
aportar al estudio.
c)TIPOS DE ERROR
Un proceso inductivo (que va de lo particular a lo general) se asocia inevitablemente a la
posibilidad de cometer errores y este es mayor en la medida que la parte observada sea ms
pequea, y sobre todo, cuando dicha parte no refleja o representa la realidad sobre la que
recaen las conclusiones de la inferencia. El error que se comete debido al hecho de que se
sacan conclusiones sobre cierta realidad, a partir de la observacin de slo una parte de ella,
se denomina error de muestreo.

Obtener una buena muestra significa, obtener una versin simplificada de la poblacin, que
reproduzca de algn modo sus rasgos bsicos (una poblacin en miniatura) cuyo propsito
es ahorrar recursos.
Error estndar
El error estndar es la desviacin estndar estimada de un estadstico muestral. Por ejemplo,
el error estndar de la media de una muestra es una estimacin de la desviacin estndar
probable que tendran las medias de un nmero infinito de muestras.
El error estndar ofrece una indicacin de la precisin de la media de la muestra como una
estimacin de la media de la poblacin. Cuanto menor es el error estndar, menor es la
dispersin y mayor es la probabilidad de que las medias muestrales estn prximas a la
media de la poblacin, es decir, hay una probabilidad del 68% de que la media real de la
poblacin est a +/- 1 errores estndar de la media muestral.
1.1 TIPOS DE ERROR Y POTENCIA ESTADSTICA
Hay dos tipos de errores posibles al efectuar un anlisis estadstico.
El error de tipo I, conocido tambin como falso positivo, es el error de rechazar una
hiptesis nula cuando es cierta. Es decir, se concluye que hay una diferencia donde no
existe ninguna.
El error de tipo II, conocido tambin como falso negativo, es el error de no rechazar
una hiptesis nula cuando no es cierta. Es decir, no se concluye que hay una diferencia
cuando de hecho s la hay.
La potencia de una prueba es la probabilidad de rechazar correctamente una hiptesis nula
cuando es falsa. Esta probabilidad es inversamente proporcional a la probabilidad de
cometer un error de tipo II, no rechazar la hiptesis nula cuando es falsa.
Por ejemplo, ANOVA presenta una potencia estadstica alta. Existe una probabilidad menor
de un error de tipo II, al pensar que no hay una relacin cuando s la hay.
ESTIMACIN ESTADSTICA:

En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un
valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados por
una muestra. Por ejemplo, una estimacin de la media de una determinada caracterstica de
una poblacin de tamao N podra ser la media de esa misma caracterstica para una
muestra de tamao n.
Importancia
Estimar puede tener dos significados interesantes. Significa querer e inferir. Desde luego, el
primer significado es ms trascendente. Pero no tiene ningn peso en la estadstica,
disciplina que no se ocupa de los asuntos del amor. El segundo significado es el importante
aqu. Una estimacin estadstica es un proceso mediante el que establecemos qu valor
debe tener un parmetro segn deducciones que realizamos a partir de estadsticos. En
otras palabras, estimar es establecer conclusiones sobre caractersticas poblacionales a
partir de resultados muestrales. Estimar qu va a ocurrir respecto a algo (o qu est
ocurriendo, o qu ocurri), a pesar de ser un elemento muy claramente estadstico, est muy
enraizado en nuestra cotidianidad. Dentro de ello, adems hacemos estimaciones dentro de
un intervalo de posibilidades. Por ejemplo: creo que terminar la tarea en unos 5-6 das. Lo
que hacemos en el terreno del anlisis de datos es aplicar matizaciones tcnicas a este
hbito
Tipos de estimacin:
Estimacin puntual
Una estimacin puntual del valor de un parmetro poblacional desconocido (como puede ser
la media , o la desviacin estndar ), es un nmero que se utiliza para aproximar el
verdadero valor de dicho parmetro poblacional. A fin de realizar tal estimacin, tomaremos
una muestra de la poblacin y calcularemos el parmetro muestral asociado (x para la media,
s para la desviacin estndar, etc.). El valor de este parmetro muestral ser la estimacin
puntual del parmetro poblacional.
Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y
calculan la media de esta muestra, este valor ser un estimador puntual de la media de la
poblacin.
Caractersticas que debe tener un buen estimador
a) Debe ser insesgado: un estimador es insesgado, si en promedio, tiende a tomar valores
que estn por encima del parmetro de la poblacin con la misma frecuencia y la misma
extensin,
con la que tiende a asumir valores por debajo del parmetro de poblacin que se est
estimando.

b) Debe ser eficiente: de varios estimadores insesgados, el ms eficiente es el que tiene el

error estndar ms pequeo.
c) Debe ser consistente: significa que a medida que aumenta el tamao de la muestra, la
estimacin se aproxima al valor del parmetro.
d) Debe ser suficiente: significa que ningn otro estimador puede suministrar ms
informacin sobre el parmetro.
Nivel de Confianza
Probabilidad asociada con una estimacin de intervalo de un parmetro de poblacin. sta
indica qu tan seguro se est de que la estimacin de intervalo incluir al parmetro de la
poblacin. Los niveles de confianza que ms se utilizan son 90%, 95% y 99%.
Intervalo de Confianza
Es el alcance, rango o recorrido de la estimacin que se hace y que tiene designada una
probabilidad de que incluya el valor real del parmetro de la poblacin que se est
estimando.
Lmites de Confianza
Son el lmite inferior y superior de un intervalo de confianza.
Coeficiente de Confianza
Es el nivel de confianza (en valores relativos) que tenemos en que el intervalo contiene el
valor desconocido del parmetro. Por ejemplo, para un nivel de confianza del 90%, el
coeficiente de
confianza es 0,9.
Estimacin por intervalo
Dada una poblacin X, que sigue una distribucin cualquiera con media u
estndar
y desviacin
1. Sabemos (por el TCL) que, para valores grandes de n, la media muestra x sigue
una distribucin aproximadamente normal
con media y desviacin estndar.
2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal,
aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos
desviaciones estndar de la media.

Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad de que la
media de la poblacin est contenida en l es de 0,95.
Este tipo de intervalos se llaman intervalos de confianza de un parmetro poblacional. El
nivel de confianza (1 - ) del intervalo es la probabilidad de que ste contenga al parmetro
poblacional. En el ejemplo anterior, el nivel de confianza era del 95% ( = 0,05).
1. Intervalo de confianza para con conocida.
Un vendedor mayorista de partes automotrices necesita una estimacin de la vida media que
puede esperar de los limpiaparabrisas en condiciones normales de manejo. La
administracin de la empresa ya ha determinado que la desviacin estndar de la vida til de
la poblacin es de seis meses. Supongamos que se selecciona una sola muestra aleatoria de
100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21
meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la poblacin
de los limpiaparabrisas. Tenemos X como la distribucin de la vida til en meses de la
poblacin de limpiaparabrisas, no sabemos qu distribucin tiene, al igual que
desconocemos su media.
En este caso s conocemos la desviacin estndar poblacional.
La media muestral X por el teorema central del lmite se va a aproximar la distribucin

normal:
Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la
poblacin de limpiaparabrisas, es decir para

El error mximo de estimacin es la mitad de la longitud del intervalo, Con una confianza del
95%, la vida media de la poblacin de limpiaparabrisas que vende este mayorista est entre
19,824 meses y 22,176 meses. Si extraemos varias muestras del mismo tamao y
calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van
a incluir a la vida media poblacional en meses de todos los parabrisas que vende este
mayorista.
2. Intervalo de confianza para con desconocida.
El administrador de una planta industrial generadora de energa desea estimar, por intervalo,
la cantidad de carbn que se consumi por trmino medio semanalmente durante ao
pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400
toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el intervalo de
confianza del 95% para el consumo medio semanal durante el ao pasado? (supongamos
normalidad). Tenemos X como la distribucin de toneladas de carbn consumidas cada
semana del ao pasado por la planta de energa y su media y su desviacin estndar
desconocidas.
Aunque n < 30, suponemos que la media muestral, X, sigue una distribucin normal:
Para estimar la desviacin estndar poblacional vamos a utilizar la desviacin

estndar muestral S que es 700 toneladas.
Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladas
de carbn en cada semana del ao pasado, es decir para , ser:
Utilizamos la t-Student porque la desviacin estndar poblacional es desconocida. En las

tablas, 2 2 262 t (10 - 1,0,05) =, 2,262 una t-Student con 10 1 = 9 grados de libertad que
deja su derecha un rea de 0,025. = 0,05 porque el nivel de confianza es de 1 - = 0,95
Con una confianza del 95%, el consumo promedio semanal de carbn durante el ao pasado
por esta planta de energa estar entre 10.899 toneladas y 11.901 toneladas. Si extraemos
varias muestras del mismo tamao y calculamos un intervalo de confianza para cada
muestra, el 95% de todos los intervalos van a incluir al consumo promedio poblacional de
toneladas de carbn por semana durante el ao pasado por la planta de energa.
3. Intervalo de confianza para la probabilidad de xito p en una binomial.

Durante un ao y medio las ventas han estado disminuyendo de manera coherente en los
1.500 establecimientos de una cadena de comida rpida. Una empresa de consultora ha
determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una mala
administracin. Construir un intervalo de confianza del 95% para esta porcin.
A la poblacin de todos los establecimientos de sta cadena de comida rpida le vamos a
llamar X que seguir una binomial con probabilidad de xito, probabilidad de tener signo de
mala administracin, p desconocida. A fin de estimar dicho parmetro, se toma una muestra
de tamao n = 95 y definimos p como la proporcin de xitos en la muestra. En este caso p
es 0,3 y 1-p =0,7.
Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p.

Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la proporcin
de la poblacin tendr la siguiente distribucin:
Por lo tanto, la estimacin del error estndar de la proporcin de establecimientos que tiene
claros signos de mala ser 0,057. El intervalo de confianza del 95% para la probabilidad de
xito poblacional p viene dado por:
Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de esta
cadena de comida rpida que tiene mala administracin estar entre 0,20788 y 0,39212.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para
cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de
establecimientos con mala administracin.
EL ERROR
Un mismo estimador ofrece distintos valores para distintas muestras del mismo
tamao extradas de la misma poblacin. Por lo tanto, deberamos tener una medida de la
variabilidad del estimador respecto del parmetro que se trata de estimar. Esta variabilidad
se mide en trminos de la desviacin estndar del estimador, la cual recibe el nombre
de error estndar.
El error estndar de un estimador T de un parmetro
estimador.
es la desviacin estndar del

As por ejemplo, si tomamos

dado por
como estimador de
, entonces el error estndar est
Error de estimacin es el valor absoluto de la diferencia entre una estimacin

particular y el valor del parmetro.
En realidad, por cada valor estimado del parmetro se tiene un error de estimacin por
lo general diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarn
la mayora de los valores de error de estimacin para un estimador y parmetro dados.
PARMETRO
ESTIMADOR
ERROR ESTNDAR
ESTIMADOR DEL ERROR
N
=
PRUEBAS DE HIPTESIS:
Una hiptesis es una expresin a manera de conjetura, es decir, una proposicin tentativa en
modo afirmativo acerca de la relacin general o especfica entre dos o ms variables. En la
formulacin de cualquier hiptesis es conveniente observar los dos criterios siguientes:
deben expresar relaciones entre variables; y adems, ser inferencias que permitan probar las

relaciones establecidas. Esto indica que toda expresin hipottica estar integrada por dos o
ms variables mensurables y tener una forma explcita del tipo de relacin que se supone
existe entre stas
Es una afirmacin acerca de una o ms poblaciones. En general, la hiptesis se refiere a los
parmetros poblacionales acerca de las cuales se hace la afirmacin. Probar una hiptesis
requiere tomar una decisin cuando se compara la muestra observada con la teora
IMPORTANCIA DE LAS PRUEBAS DE HIPTESIS
El propsito de las pruebas de hiptesis es ayudar al investigador, al mdico o administrador
a tomar una decisin en torno a una poblacin, examinando una muestra de ella.
Observa la naturaleza, formula una teora y la confronta con lo observado. En nuestro
contexto el cientfico plantea una hiptesis respecto a uno o ms parmetros poblacionales:
de que son iguales a valores especificados. En seguida toma una muestra de la poblacin y
compara sus observaciones con la hiptesis. Si las observaciones no concuerdan con la
hiptesis, las rechaza. De lo contrario, concluye que la hiptesis es verdadera o que la
muestra no detect la diferencia entre los valores real e hipottico de los parmetros
poblacionales.
Son las herramientas de trabajo de la teora, esto es, de las teoras se pueden deducir
hiptesis. Estas se pueden demostrarse, es decir, se puede establecer que son
probablemente ciertas o probablemente falsas.
Son un instrumento poderoso para el progreso del conocimiento, porque ayudan a confirmar
o negar una teora en forma independiente de la opinin del investigador.
En algunas ocasiones una hiptesis dada puede ser demasiado amplia para ser probada. Si
es una buena hiptesis podr demostrarse a travs de otras deducidas de ella. Las hiptesis
no se prueban directamente, sino a travs de las inferencias inducidas de ellas. Finalmente
debe enfatizarse que los resultados de toda investigacin deben aplicarse al problema en
particular, a las hiptesis y finalmente a la teora.
La prueba de hiptesis se lleva a cabo en todos los campos en los que la teora se puede
probar como observacin.
TIPOS DE HIPTESIS
Hiptesis estadstica
Se identifica tanto a la hiptesis nula como a la hiptesis alterna. Proposicin o supuesto

sobre los parmetros de una o ms poblaciones. Sus elementos son:
1. Hiptesis nula, H0

2. Hiptesis alternativa, Ha
3. Estadstico de prueba
4. Regin de rechazo
Hiptesis nula
Es una hiptesis construida para anular o refutar, con el objetivo de apoyar una hiptesis
alternativa. Cuando se utiliza, la hiptesis nula se presume verdadera hasta que
una prueba estadstica en la forma de una prueba emprica de la hiptesis indique lo
contrario. Si la hiptesis nula no es rechazada, esto no quiere decir que sea verdadera.
Es la hiptesis que debe probarse. Se designa como
. Se establece con el propsito de
ser rechazada.
Hiptesis alternativa
Es igualmente una afirmacin acerca de la poblacin de origen. Muchas veces, aunque

no siempre, consiste simplemente en negar la afirmacin de H0. La hiptesis alternativa
se designa con el smbolo H1
Pruebas de hiptesis
Pruebas hiptesis unilaterales
La prueba de hiptesis bilateral, llamada as porque la regin de rechazo se divide entre dos
lados o colas de la distribucin de la estadstica de prueba. Una prueba de hiptesis pude ser
unilateral, en cuyo caso toda la regin de rechazo est en una u otra cola de la distribucin.
El que se utilice una prueba unilateral o bilateral depende de la naturaleza de la cuestin
planteada por el investigador.
En caso de que los valores tanto pequeos como grandes causen el rechazo de la hiptesis
nula, lo indicado es utilizar una prueba bilateral. Cuando nicamente valores suficientemente
pequeos o suficientemente grandes causen el rechazo de la hiptesis nula, lo indicado
es utilizar una prueba unilateral.
Prueba unilateral derecha
Est/ formada por

estadstico
de
todos los valores del

prueba ubicados a la

derecha del parmetro cuya probabilidad de ocurrencia es menor a la del nivel de
significacin. Se especifica cuando
Prueba unilateral izquierda
Est formada por todos los valores del estadstico de prueba ubicados a la izquierda del
parmetro cuya probabilidad de ocurrencia es menor a la del nivel de significacin.
Prueba bilateral

La zona de rechazo puede ser dividida en dos partes iguales ubicadas a cada lado del
parmetro. La zona de la derecha y de la izquierda estn formadas por todos los valores del
estadstico de prueba cuya probabilidad de ocurrencia es menor a la mitad de la
probabilidad del nivel de significacin
Prueba de hiptesis diferencia entre las medias de dos poblaciones
La prueba de hiptesis que comprende la diferencia entre la media de dos poblaciones se

utiliza con ms frecuencia para determinar si es razonable o no concluir que las dos son
distintas. En tales casos se prueba una o las dems de las siguientes hiptesis:
(1)
(2)
(3)
Sin embargo, es posible probar la hiptesis de que la diferencia es igual a, mayor o igual que,
o menor o igual que algn valor distinto de cero.
Prueba de hiptesis: proporcin de una sola poblacin
La prueba de hiptesis respecto a las proporciones de una poblacin se realiza casi en la

misma forma que para las medias cuando se satisfacen las condiciones necesarias para

utilizar la curva normal. Pueden efectuarse pruebas unilaterales o bilaterales, dependiendo
de la cuestin que se plantee.
Prueba de hiptesis: diferencia entre las proporciones de dos poblaciones
La prueba se realiza a la diferencia entre las proporciones de dos poblaciones que se utilizan
con ms frecuencia que aquella en la que su diferencia es cero. Sin embargo, es posible
probar que dicha diferencia es igual a algn otro valor. Pueden llevarse a cabo pruebas tanto
unilaterales como bilaterales.
Cuando la hiptesis nula que va a probarse es p1-p2=0, est suponiendo que las
proporciones de las dos poblaciones son iguales. Se utiliza esto como justificacin para
combinar los resultados de las dos muestras y llegar a una estimacin mancomunada de la
proporcin comn supuesta.
Prueba de hiptesis : variancia de una sola poblacin
La varianza es importante dado que nos ofrece una mejor visin de dispersin de datos.
Prueba de hiptesis: razn de las variancias de dos poblaciones
Las decisiones referentes a la comparacin de las variancias de dos poblaciones se basan

en general en la prueba de la razn de las variancias, que es una prueba de la hiptesis nula
de que las variancias de dos poblaciones son iguales. Cuando se prueba la hiptesis de que
las variancias de dos poblaciones son iguales, se est probando la hiptesis de que su razn
es igual a 1.
TIPOS DE ERROR
Luego de disear el experimento, obtener datos y analizarlos, el investigador debe usar los
resultados observados para tomar una decisin sobre sus hiptesis. Si se observa datos
contrarios a la hiptesis nula, la decisin debe ser la de rechazarla a favor de la hiptesis
alternativa. En el caso en que no se haya observado evidencia suficientemente fuerte en
contra de la hiptesis nula, la decisin ser la de no rechazarla. La decisin tomada debe ser
fiel expresin de los datos observados. Idealmente los datos y por lo tanto, la decisin
tomada, deben reflejar y ser cnsonas con la realidad poblacional desconocida. Sin embargo
esto no siempre ocurre, an en el experimento, encuesta o estudio mejor diseado y
realizado. Las medidas que se tomen siempre muestran variabilidad, pues los instrumentos
tienen precisin finita. Adems se introduce variabilidad al tomar una muestral. Por lo tanto,
es posible que por mero accidente aleatorio, la muestra no refleje fielmente la poblacin. Por
estas razones, al tomar cualquier decisin, siempre existe siempre la posibilidad de cometer
algn tipo de error estadstico.

Error tipo I
La realidad poblacional tiene slo uno de dos posibles estados: la hiptesis nula es cierta; o
la hiptesis nula es falsa. Si la hiptesis nula es cierta no debe ser rechazada a favor de la
hiptesis alternativa. En el caso en que sea falsa debe ser rechazada a favor de la
alternativa.
Sin embargo, los datos contienen necesariamente elementos de variacin pues
generalmente provienen de una muestra que puede ser o no representativa, los instrumentos
de medicin tienen una precisin limitada y los materiales usados pueden cambiar por
distintos factores tal como la humedad del aire, temperatura, manejo o reaccin con otros
materiales. Una muestra, an tomada cientficamente siempre tendr una pequea
probabilidad de no reflejar la realidad poblacional.
Aun habiendo usado una metodologa cientfica para tomar la mejor muestra posible,
obtenido datos con muy poco error experimental, y tomado una decisin cnsona a los datos
observados, es posible que se cometa el error de tomar la decisin de rechazar la hiptesis
nula an siendo cierta.
Este tipo de error se conoce como error tipo I. La probabilidad de cometer un error tipo I se
puede controlar y reducir, pero slo se puede eliminar si nunca se toma la decisin de
rechazar la hiptesis nula. Esta ltima situacin no es deseable ya que llevara a nunca
descartar premisa alguna, no importa cun irracional sea la misma o cunto los datos
obtenidos contradigan esa premisa. El investigador es conservador cuando selecciona una
probabilidad muy pequea de cometer error tipo I, pues slo rechazar el status quo, la
hiptesis nula, si obtiene evidencia muy contundente en contra de esta hiptesis. La
probabilidad mxima de cometer error tipo I se conoce como la significancia de la prueba y
se denota usualmente por la letra griega alfa. La probabilidad de cometer error tipo I se
escribe de la siguiente manera:
= Proba (Rechazar H0 | H0 es cierta)
Los valores de uso ms comn para la significancia de una prueba son 0.01, 0.05 y 0.10. La
significancia es en ocasiones presentada como un por ciento, tal como 1%, 5% o 10%. Esto
quiere decir que con el fin de adelantar la ciencia, el investigador est dispuesto a permitir

una probabilidad de 0.01, 0.05, o 0.10 de rechazar la hiptesis nula cuando es cierta, o de
cometer un error tipo I.
El valor de la significancia es seleccionado antes de comenzar a hacer el experimento en una
de varias formas. El valor de puede estar dictado por el uso y costumbre de la disciplina, por
ejemplo, de los artculos que se publican en revistas cientficas. Otra forma de seleccionarlo
es que sencillamente sea impuesto por la persona o compaa para la cual se trabaja y que
son quienes pagan el salario de los investigadores. Finalmente, puede ser seleccionado
tomando en cuenta el costo de cometer un error tipo I. Mientras ms alto el costo, ms
pequea debe ser la probabilidad de cometer error tipo I. El valor usual de en las ciencias
naturales y sociales es de 0.05.
La probabilidad de error tipo I no puede ser igual a cero ya que si se desea = 0, nunca se
podra tomar la decisin de rechazar la hiptesis nula. Siempre que se tome la decisin de
rechazar la hiptesis nula, ya que la decisin se basa en una muestra y no en la poblacin,
existe una probabilidad positiva de cometer un error tipo I.
Error tipo II
En el caso en que la hiptesis nula sea falsa, cuando el valor del parmetro es consistente
con la hiptesis alternativa, puede surgir la situacin de que los datos obtenidos llevan al
investigador a no rechazarla, cometiendo entonces un error tipo II. Usualmente no se
controla este tipo de error directamente. El Lema de Neyman-Pearson2 dice que una vez se
decide el nivel de error tipo I aceptable para el problema, la probabilidad de cometer error
tipo II asume su valor mnimo al usar las pruebas estadsticas que se estudian aqu. Este
valor mnimo no es cero e incluso puede ser considerado muy alto por algunos. Es usual
denotar la probabilidad de error tipo II por la letra griega.
Entonces P (error tipo II) = = P( No rechazar H0 | H0 es falsa).

FRMULAS PARA LAS PRUEBAS DE HIPTESIS
Pruebas para medias, muestras grandes
Pruebas para medias, muestras pequeas

Pruebas para variancias
Prueba para proporciones
BIBLIOGRAFA

http://www.edu-esta.org/materiales/Stats_text/Hyp_Tests.pdf
http://www.andragogy.org/_Cursos/Curso00195/Temario/pdf%20leccion%207/7%20PRUEBA
%20DE%20HIPOTESIS.pdf
http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf
https://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica
http://www.vitutor.net/2/12/estimacion_estadistica.html
http://www.spentamexico.org/v5-n1/5(1)237-255.pdf
Wayne W. Daniel, BIOESTADSTICA. Base para el anlisis de las ciencias de la salud.
Editorial Limusa.

Ejercicios de Analisis U2

Transféré par

Informations du document

Description originale:

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Ejercicios de Analisis U2

Transféré par

Droits d'auteur :

Formats disponibles

TECNOLGICO NACIONAL DE

Materia.Anlisis de datos experimentales

TECNOLGICO NACIONAL DE MXICO

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Recursos limitados. Es decir, no existen los recursos humanos, materiales o

Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

TECNOLGICO NACIONAL DE MXICO

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

TECNOLGICO NACIONAL DE MXICO

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

b) Debe ser eficiente: de varios estimadores insesgados, el ms eficiente es el que tiene el

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

La media muestral X por el teorema central del lmite se va a aproximar la distribucin

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Para estimar la desviacin estndar poblacional vamos a utilizar la desviacin

Utilizamos la t-Student porque la desviacin estndar poblacional es desconocida. En las

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p.

es la desviacin estndar del

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

As por ejemplo, si tomamos

, entonces el error estndar est

Error de estimacin es el valor absoluto de la diferencia entre una estimacin

ESTIMADOR DEL ERROR

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Se identifica tanto a la hiptesis nula como a la hiptesis alterna. Proposicin o supuesto

TECNOLGICO NACIONAL DE MXICO

. Se establece con el propsito de

Es igualmente una afirmacin acerca de la poblacin de origen. Muchas veces, aunque

Prueba unilateral derecha

Est/ formada por

todos los valores del

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Prueba unilateral izquierda

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Prueba de hiptesis diferencia entre las medias de dos poblaciones

La prueba de hiptesis que comprende la diferencia entre la media de dos poblaciones se

Prueba de hiptesis: proporcin de una sola poblacin

La prueba de hiptesis respecto a las proporciones de una poblacin se realiza casi en la

Ejercicios Unidad II: Tcnicas de muestreo y pruebas de Hiptesis

TECNOLGICO NACIONAL DE MXICO

Prueba de hiptesis: diferencia entre las proporciones de dos poblaciones

Prueba de hiptesis : variancia de una sola poblacin

Prueba de hiptesis: razn de las variancias de dos poblaciones

Las decisiones referentes a la comparacin de las variancias de dos poblaciones se basan