Vous êtes sur la page 1sur 41

MUESTREO Y

DISTRIBUCIONES
MUESTRALES
En la actualidad la estadstica esta considerada como
la teora de la informacin, no solo como funcin
descriptiva, sino con el objeto bsico de hacer estimaciones
acerca de los valores estadsticos de la poblacin o en la
comprobacin de hiptesis de las caractersticas
investigadas.
De esto podemos indicar que la estadstica cubre dos
aspectos de gran importancia: En la Estadstica
Descriptiva a travs de la recoleccin, clasificacin,
presentacin, ya sea en forma de cuadros o grficos, la
aplicacin de medidas como promedios, desviaciones, etc.,
y la interpretacin y anlisis de datos a fin de obtener
conclusiones para tomar decisiones. Se realiza un proceso
deductivo de lo general a lo particular.
El segundo aspecto es la Estadstistica Inferencial o
Mtodo Inductivo, el cual mediante investigaciones por
muestreo, logra obtener resultados considerados como
estimadores de los parmetros poblaciones.
Por lo que entonces se podra afirmar categricamente
que la tarea ms importante de la estadstica es la
realizacin de inferencias acerca de una poblacin objetivo
con base en los resultados obtenidos a travs de una
muestra.
1. Una Poblacin es el conjunto de todos los elementos de
inters en un estudio. Por ejemplo, la poblacin de las
tallas de los varones adultos residentes en la provincia
de Lima en un momento determinado o la poblacin de
sucesos muerte o supervivencia) en todos los pacientes
que sufren una enfermedad especfica durante cierto
perodo.

2. Una Muestra es un subconjunto de la poblacin, por lo
general de nmero proporcionalmente pequeo,
seleccionado de forma que sea representativo, hasta
cierto lmite, de la poblacin. E l ejemplo ms conocido
de una encuesta por muestreo es tal vez el sondeo de
opinin pblica, en el que se entrevista a una pequea
proporcin de la poblacin para un objetivo concreto . En
muchas encuestas por muestreo se estudian aspectos de
Contabilidad y Finanzas.

Del elemento se estudian sus caractersticas. Estas se
clasifican en CUALITATIVAS O ATRIBUTOS, expresados
por palabras y se cuantifican mediante el conteo o
recuento; las CUANTITATIVAS O VARIABLES expresadas en
forma numrica que pueden ser medibles o contadas.
MARCO MUESTRAL.- Es un listado actualizado y revisado
de todos los elementos que constituyen la poblacin que va
ha ser objeto de investigacin. Tambin puede ser un mapa
o croquis con las unidades de seleccin plenamente
identificadas.
La poblacin se clasifica en FINITA O INFINITA Cuando se
investigan las caractersticas de todas las unidades que
constituyen la poblacin o Universo nos referimos a una
investigacin total, exhaustiva o Censo.
Factores tales como: Costo, Tiempo, Recursos Humanos,
Poblaciones muy grandes o infinitas, destruccin de la
unidad sometida a control, caractersticas con gran
heterogeneidad, impiden la realizacin del censo. Se
sustituye, entonces, por una investigacin parcial llamada
investigacin muestral.
MUESTREO ALEATORIO.- Realizado bajo ciertas
condiciones y sometido a ciertos requisitos, se constituye
en un procedimiento prctico, econmico y rpido para
generalizar conclusiones obtenidas a travs de una
muestra, aplicables a toda la poblacin de la que forma
parte, dentro de ciertos lmites de confiabilidad,
establecidas de antemano.
Dentro del Muestreo Aleatorio se tienen los siguientes
mtodos:
Muestreo Aleatorio simple o Muestreo Aleatorio Irrestricto
Muestreo Aleatorio Estratificado
Muestreo por Conglomerados
Muestreo por reas o Muestreo Geogrfico
Muestreo por Fases
Muestreo Sistemtico
DEFINICIN
Una muestra probabilstica es una muestra extrada
de una poblacin, de tal manera que todo elemento
de la poblacin tenga una probabilidad conocida de
ser incluida en la muestra.
DEFINICIN
Si se extrae una muestra de tamao n de una poblacin de tamao
N, de tal manera que toda muestra posible de tamao n tenga la
misma probabilidad de ser seleccionada, la muestra recibe el
nombre de muestra aleatoria simple.
La mecnica de extraer una muestra que satisfaga la definicin de una
muestra aleatoria simple se le llama muestreo aleatorio simple.
Una manera de seleccionar una muestra aleatoria simple es usar
una tabla de nmeros aleatorios.
TABLA N O2
VALOR EN DLARES DE 120 CUENTAS POR
COBRAR
NMERO VALOR NMERO VALOR NMERO VALOR NMERO
VALOR
O1 91 31 107 61 87 91
91
02 94 32 94 62 104 92
104
03 115 33 101 63 109 93
109
04 85 34 95 64 93 94
92
05 89 35 80 65 95 95
85
06 107 36 104 66 107 96
108
07 94 37 94 67 88 97
99
08 105 38 102 68 107 98
103
09 94 39 89 69 113 99
81
10 103 40 98 70 95 100
96
11 104 41 106 71 102 101
105
12 105 42 85 72 94 102
91
13 88 43 93 73 99 103
115
14 107 44 103 74 87 104
108
15 90 45 119 75 102 105
102
16 95 46 90 76 105 106
101
17 104 47 82 77 80 107
94
18 93 48 90 78 90 108
93
19 109 49 113 79 108 109
102
20 87 50 104 80 105 110
119
21 92 51 97 81 90 111
96
22 117 52 101 82 115 112
104
23 98 53 90 83 82 113
85
24 89 54 88 84 90 114
108
25 105 55 108 85 102 115
103
26 101 56 95 86 91 116
90
27 81 57 100 87 103 117
105
28 108 58 103 88 107 118
99
29 94 59 108 89 107 119
88
30 104 60 85 90 97 120
103
Tambin existe el MUESTREO NO ALEATORIO,
CIRCUNSTANCIAL O ERRTICO, mtodo cuyos resultados
o estimaciones no son de ninguna manera confiables, dado
que la seleccin de las unidades que conforman la muestra
se realiza en
Forma caprichosa o por conveniencia, primando el juicio
personal del investigador.
Dentro del Muestreo no Aleatorio se tienen los siguientes
mtodos:
Muestreo a Juicio, intencional u opintico
Muestreo por Conveniencia
Muestreo Voluntario
Muestreo por Cuotas.
DISTRIBUCIONES MUESTRALES
Corresponde a una distribucin de todas las muestras que
pueden ser escogidas conforme a un esquema de muestreo
especificado; en general se refiere a un esquema de
muestreo que implique seleccin al azar y a una funcin de
un nmero fijo de variables aleatorias independientes.
ESTIMACIN PUNTUAL
Un estimado puntual es un slo valor numrico basado
en datos de una muestra aleatoria que se utiliza para
estimar el valor de un parmetro poblacional.
La Media

y la Desviacin estndar

de una
poblacin son parmetros, en cambio la media
X
y la
desviacin estndar S de una muestra son valores
estadsticos.
CUADRO N 01: ESTIMADORES PUNTUALES
UTILIZADOS
CON FRECUENCIA.
PARMETRO DE LA POBLACIN ESTIMADOR
Media Aritmtica :

Diferencia de Medias :
2 1

Proporcin : P
Diferencia de Proporciones :
2 1
P P
Varianza :
2

Desviacin Estndar :

Tamao : N
X
2 1
X X
p
2 1

2
S
S
n
x

= Media de todas las medias muestrales


x

= Desviacin estndar de todas las medias


muestrales
= Nmero de Muestras Posibles
( ) ! n n!
!
n
M

,
_

Cuando la Muestra se hace sin reposicin.


n
= Cuando se hace la seleccin con reposicin.
POBLACIN
M
X
2
M
S
n
3
X
2
3
S
n
2
X
2
2
S
n
1
X
2
1
S
n
DISTRIBUCIN MUESTRAL DE
X
Es la distribucin de probabilidad de todos los valores
posibles de la media de la muestra
X
.
FIGURA
N 01
PROCESO ESTADSTICO PARA EMPLEAR
UNA MEDIA DE MUESTRA PARA HACER
INFERENCIAS ACERCA DE UNA MEDIA
POBLACIONAL
TEOREMA: Dada una poblacin, si extraemos todas las
muestras posibles de un mismo tamao,
entonces la media de la distribucin de todas
las medidas muestreadas posibles ser igual a
la media Poblacional y la varianza de todas
las medias mustrales es igual a la varianza
de la poblacin dividida por el tamao
Muestral.
( ) X E
x

Usar esta ecuacin siempre que:
Se selecciona, en la poblacin,
una muestra aleatoria simple
de n individuos.
El resumen de los datos
muestrales proporciona un
valor de la media de muestra
.
POBLACIN
CON
MEDIA
Se usa el valor de
para hacer inferencias
acerca del valor
n

n
2

X
2
X

1) La poblacin sea infinita, o bien
2) La poblacin sea finita y tambin
n/N
0.05
Haciendo uso del factor de Correccin para poblaciones finitas
en la frmula, se tiene:
1 N
n N
n

= cuando
05 . 0 >
N
n
Si no se conoce la desviacin estndar de la poblacin,
puede estimarse el error estndar de la medias utilizando la
desviacin estndar muestral, como estimador de la
desviacin estndar de la poblacin.
n
S
S
n
2
S
S
X
2
X

F.C.P.F:
1 N
n N
n
S
S
X

EJEMPLO: Un auditor en el hospital Carrin toma una


muestra aleatoria de tamao n = 16 de un conjunto
de N = 100 cuentas por cobrar. No se conoce la
desviacin estndar de los montos de las cuentas
por cobrar para el total de las 100 cuentas. Sin
embargo, la desviacin estndar de la muestra es S
= $ 57 dlares.
Determinar el valor del error estndar para
la distribucin Muestral de la media.
Datos:
N = 100
n = 16
S=$ 57
?
X
S
0,16
100
16
N
n

n no es menor que 0,05 N es decir:
16 > 0,05 (100) esto implica que para
calcular
X
S
se tiene que utilizar el factor
de correccin para poblaciones finitas.
99
84
4
57
1 100
16 100
16
57
1 N
n N
n
S
S
X

( ) dlares 13 , 13 9211 , 0 25 , 14 8484 , 0 25 , 14


X X
S S
El error estndar de la media ofrece la base principal para
la inferencia estadstica con respecto a la media de una
poblacin desconocida. Un teorema de la estadstica que
conduce a la utilidad del error estndar de la media es: El
Teorema del Lmite Central.
TEOREMA DEL LIMITE CENTRAL.- Al seleccionar
muestras aleatorias simples de tamao n de una poblacin,
la distribucin muestral de la media de la muestra
x
se
puede aproximar a la forma de una DISTRIBUCIN
NORMAL DE PROBABILIDADES, cuando el tamao de la
muestra es grande, 30 n , entonces:
n
X
n
2

X
Z
X
X

EJEMPLO 1: Un auditor toma una muestra aleatoria de


tamao 36 de una poblacin de 1000 cuentas
por cobrar, el valor promedio de las cuentas por
cobrar de la poblacin es
600 $2
con una
desviacin estndar poblacional de 450 $ ,
Cul es la probabilidad de que la media
muestral sea inferior a $ 2500 dlares?
SOLUCIN:
( ) 600 $2 x E 450 $
75
6
450
36
450
n

X

Como n < 0,05 N; no se necesita el factor de correccin
1.33
75
2600 2500
n /
x
z

( ) 1,33 Z P 75 2600, / 2500 x P


X
<

,
_

( ) 1,33 Z P
= 0,5000 - 0,4082 = 0,0918
EJEMPLO 2: En una poblacin grande de seres humanos,
los ingresos econmicos sigue una distribucin
aproximadamente normal con una media de
185.6 dlares y una desviacin estndar de
0 -1,33
2600 2500
Z
X
( ) X E
( ) x f
0,4082
0,05
12.7 dlares. Cul es la probabilidad de
que una muestra aleatoria de tamao 10
de esta poblacin tenga un promedio de
ingresos mayor que 190 dlares?
SOLUCIN :
= $ 185.8
= $ 12.7
09 . 1
0161 . 4
4 . 4
0161 . 4
6 . 185 190
/

Z
n
u x
Z
)
0161 . 4
6 . 185 190
( ) 190 (

> > Z P x p


) 09 . 1 ( 5 . 0
) 09 . 1 ( )
0161 . 4
4 . 4
(
A
Z P Z P

> >

= 0.5 - 0.36214 = 0.13786

INTERVALOS DE CONFIANZA PARA LA
MEDIA
0 1.09
185.6 190

Z
0.36214
0,05
1)
X X
Z X Z - X +

n

Z X
n

- X + Z
2)
X X
ZS X ZS - X +

n
S
Z X
n
S
- X + Z
Los intervalos de confianza ms utilizados son de 90%, 95%
y 99%
EJEMPLO: En una semana determinada, se elige al azar
una Muestra de 300 pacientes de un nmero muy
grande de ellos que asisten al hospital Daniel
Alcides Carrin . Los pacientes realizan un pago
por admisin y se encuentran que el promedio de
pago es de
1800 S/. X
con una desviacin
estndar muestral de S = S/. 140.
Hallar el pago promedio por admisin para
todos los pacientes con una estimacin por
intervalo que permita tener una confianza
del 95% de que en ese intervalo incluya el
valor de la media Poblacional.
SOLUCIN
300 n
S/.1800 x
S = S/. 140
con 95% Z =
1,96

,
_

+
,
_

300
140
1,96 1800
300
140
1,96 800 1
( ) ( ) 0829 , 8 0829 , 8 1,96 1800 1,96 800 1 +
1815,84 S/. 784,16 1 S/.
DETERMINACIN DEL TAMAO DE
LA MUESTRA
Hasta ahora se ha venido trabajando con el tamao (n)
conocido, pero para determinarlo, es necesario identificar
los siguientes componentes o elementos tcnicos:
a) LA VARIANZA (
2
x

). Corresponde al grado de
variabilidad que presentan las unidades de la
poblacin. Mientras mas grande sea
2
x
, Mayor ser el
tamao de la muestra. El valor de
2
x

. supuestamente,
es conocido, de lo contrario se debe estimar a travs de
una investigacin preliminar. En el caso de
PQ
2
p

, sucede algo similar, pero se tiene la
costumbre de tomar P = 0,50 con la cual se obtiene el
mximo valor posible de "n".
b) NIVEL DE CONFIANZA . Tiene relacin directa con el
tamao de la muestra. Por lo tanto se dir que a mayor
nivel de confianza mayor ser el tamao de la muestra,
los valores de Z se obtienen mediante el uso de tablas.
El nivel de confianza es fijada por el investigador, de
acuerdo a su experiencia.
c) PRECISIN DE LA INVESTIGACIN .- Corresponde al
margen de error que el investigador fija de acuerdo al
conocimiento que tenga acerca del parmetro que
piensa estimar. Se le conoce como ERROR DE
MUESTREO (E) siendo:
n
z
E

N
n N
.
n
z E
d) RECURSOS HUMANOS FINANCIEROS Y TIEMPO.-
No entran dentro de la determinacin tcnica del
tamao de la muestra. Pero es de suma importancia en
el tamao de las investigaciones.
I. PARA POBLACIONES INFINITAS
La frmula para calcular el tamao ptimo en el
muestreo aleatorio simple, en una poblacin infinita se
obtiene as:
n
x
z



x E
ERROR
n
z

de donde:
E
z
n


PARA VARIABLES PARA ATRIBUTOS
2
2 2
2
E
z
E
z
n

,
_

2
2
E
pq z
n

EJEMPLO 1.- La administradora de un hospital desea estimar
la proporcin de bebs nacidos en su hospital.
Si se desea un intervalo de confianza del 95%
para que la verdadera proporcin de error no
exceda del 2%. Si
la poblacin es muy grande. Qu tamao
tendr la muestra que va a tomarse. Si la
administradora estima que la proporcin de error es del 5%?
SOLUCIN:
( ) ( )
( )
456.19
0.02
(0.95) 0.05 1.96
E
PQ Z
n
2
2
2
2

456 n
EJEMPLO 2.- De una remesa de la cual se tom una
muestra de 200 artculos, se encontr
que 20 de ellos eran defectuosos. Con
una confianza del 95%, calcular el error
de la muestra.

SOLUCIN:
( )( )
200
90 . 0 10 . 0
96 . 1 ; ;
2
2
2
2

n
PQ
E
n
PQ z
E
E
PQ z
n
90 0 10 0
200
20
. Q .

% . E 16 4
II. PARA POBLACIONES FINITAS
a) Muestreo por Variables

,
_

N
n N
n
z
E
N
n N
n
z
E
N
n N
n
x
Z
N
n N
n
x
Z
2 2
2
;
1


2 2 2
2 2
+

Z NE
N Z
n tambin :
N Z
E
n
2
2
2

+
,
_

y la mas utilizada es:



N
n
n
n
0
0
1+

Donde:
2
0 2
2 2

,
_




E
z
n
E
z
b) Muestreo por Atributos
( ) PQ Z E N
NPQ Z
n
2 2
2
1 +


N
PQ
Z
E
PQ
n
+
,
_


N
n
n
n
0
0
1+

Siendo 2
2
0
E
PQ Z
n
EJEMPLOS:
1. Se desea realizar una investigacin en el Ministerio de
Transportes sobre el nmero de unidades que se
encuentran en, mal estado en 4000 cajas y la proporcin de
cajas que contienen unidades en mal estado. Se realiza una
encuesta preliminar de 80 cajas con el siguiente resultado,
presentado en una tabla de frecuencia:
Nmero de Unidades defectuosas: 0 1 2 3 4 5
10 12
Nmero de Unidades examinadas: 37 16 8 8 4 2
2 3
Determinar el tamao de muestra con las dos condiciones:
Para ello el investigador debe establecer un error de 6%
para el promedio, del 12% para la proporcin y una
confianza del 95% para ambos casos.
SOLUCION:
A)
73 1 725 1
80
138
96 1 4000 . .
n
f x
x . Z
i i



( )
( )( ) 10 0 73 1 06 0 85 7
80
725 1 80 866
2
2
2
2
. . . E .
.
n
x n f x
S



( ) ( )( )
( ) ( ) ( )
cajas
. . .
. .
n 1720
85 7 96 1 10 0 4000
85 7 4000 96 1
2 2
2

B) 54 0 5375 0
80
43
80
37 80
. .



( ) ( )( )( )
( ) ( ) ( )( )
cajas
. . . .
. . .
n 66
46 0 54 0 96 1 12 0 3999
46 0 54 0 4000 96 1
2 2
2

El tamao ptimo es de 1720, ya que se toma el mayor


valor
2. Se planea realizar una encuesta para determinar qu proporcin de
familias en el Distrito de la Victoria carece de servicios mdicos. Se
cree que la proporcin no puede ser menor que 0.25. Se desea un
intervalo de confianza del 95% con una precisin relativa del 5% .
De qu tamao se debe seleccionar la muestra de familias?
( ) ( )( )
( )
1801 75 1800
02 0
75 0 25 0 96 1
2
2
2
2
.
.
. . .
E
PQ Z
n
Por lo tanto, debe seleccionarse 1801 familias
DISTRIBUCIN MUESTRAL DE
UNA PROPORCIN
En muchos casos dentro el campo de la salud se usa la
proporcin Muestral p para hacer inferencias estadsticas
sobre la proporcin Poblacional P.
DISTRIBUCIN MUESTRAL DE p
La distribucin muestral de p es la distribucin de
probabilidades de todos los valores posibles de la
proporcin muestral p.
Para determinar lo cercano que est la proporcin
muestral p de la proporcin poblacional P,
necesitamos comprender las propiedades de la
distribucin Muestral de p: su valor esperado, su
desviacin estndar y la forma de su distribucin.
VALOR ESPERADO DE p
E(p) = P
P
p

DESVIACIN ESTNDAR DE p: Llamada tambin ERROR
ESTNDAR.
Poblacin finita
( )
n
P 1 P
1 N
n N

Poblacin infinita
( )
n
PQ
n

n
P 1 P

p
p

VARIANTE ESTADSTICA
En muchos casos podemos utilizar la distribucin normal
apara evaluar la distribucin muestral de proporciones,
siendo:
p
p
p

p

P p
n
PQ
P - p
Z


La distribucin muestral de p se puede aproximar con una distribucin
normal de probabilidades, siempre que el tamao de muestra sea
grande. Se puede considerar que el tamao de muestra es grande
cuando se cumplen las dos condiciones siguientes:
5 p n
( ) 5 p - 1 n
Vale la pena observar la simbologa que se utiliza en
la muestra.

i
a a
Total de elementos que presenta la
caracterstica investigada
n
a
n
a
p
i

Proporcin de elementos que presenta


la
caracterstica investigada
n
a n
p 1 q

Proporcin de elementos que no
presenta la
caracterstica investigada
2
p
S : Varianza de una proporcin pq S
2
p

p
S : Desviacin estndar pq S
p

EJEMPLOS
1. Se tiene que el 4% de las piezas producidas por cierta
mquina son defectuosas. Cul es la probabilidad de
que un grupo de 200 piezas, el 3% o ms son
defectuosas?
SOLUCIN
0,04
p


0,03 p

( )( )
0,014
200
0,96 0,04
n
PQ

p

Se desea determinar la
( ) ? 0,03 p P
( )( )
0,71
200
0,96 0,04
0,04 0,03
n
PQ
- p
Z
p


( ) ( ) 0,71 z P 0,03 p P
= 0,5 + A(-0,71)
= 0,5000 + 0,2612 = 0,7612
[ ] 0,03 p P = 76,12 %
Solucin con Correccin
Si se quiere obtener una buena aproximacin a la
distribucin normal, debe hacerse la correccin en la
variable discreta, siendo igual a
2n
1
. Si se va a obtener
0 -0,71
0,04 0,03
Z
p
0,5 0,2612
una rea hacia la derecha, se restar este factor de
correccin; en el caso de que sea a la izquierda, se
sumar ese factor al valor de p.
p
p

-
2n
1
- p
Z

,
_


REA A LA DERECHA
p
p

-
2n
1
p
Z

,
_

REA A LA
IZQUIERDA
( ) 0,03 p P =
( )
1
1
1
1
]
1


,
_

0,014
0,04
200 2
1
p
Z P
=
1
1
1
1
]
1

,
_

0,014
0,04
400
1
0,03
Z P
=
( )
1
]
1

0,014
0,04 0,0025 0,03
Z P
=
1
]
1

0,014
0,04 0,0275
Z P
= [ ] 0,89 Z P =0,5000+A(-
0,89)=0,5000+0,3133
= 0,8133
[ ] 0,03 p P = 81,33 %
0 -0,89
0,04 0,03
Z
p
0,5 0,3133
PRUEBA DE HIPOTESIS
OBJETIVOS DEL TEMA
Conocer el proceso para contrastar hiptesis y
su relacin con el mtodo cientfico.
Diferenciar entre la hiptesis nula y alternativa
Fijar el nivel de significacin
Toma de decisiones, Tipos de error y
Cuantificacin del error.
QU ES UNA HIPTESIS?
Una creencia sobre la POBLACIN,
principalmente sus parmetros:
Media Poblacional (

)
Varianza Poblacional (

2
)
Proporcin Poblacional ( P )
OJO! Si queremos contrastarla debe
establecerse antes del anlisis.
IDENTIFICACIN DE HIPTESIS
Hiptesis Nula H
o
Hiptesis
Alternativa H
1
- La que contrastamos - Niega a H
o
- Los datos pueden refutarla - Los datos pueden
mostrar
evidencia a favor.
- No debera ser rechazada - No debera ser
aceptada sin
sin una buena razn. Una gran evidencia
a favor.
H
o
: P = 50 % =; <=;
>=
H
1
: P

50%

; <
; >
QUIEN ES H
o
?
PROBLEMA: La osteoporosis est relacionada
con el
Gnero?
SOLUCIN
- Traducir a lenguaje estadstico : P = 50%
- Establecer su opuesto P
50%
- Seleccionar la hiptesis nula
HHH
Es necesario indicar que la Inferencia estadstica,
comprende dos partes principales, a saber: la estimacin
de parmetros y la prueba o docimasia de hiptesis,
que es motivo de la presente tarea, con el fin de
desarrollar mtodos y observar su aplicacin a problemas
H
O
: P = 50%
concientes de la vida diaria. La aplicacin est en
muestras grandes y pequeas.
La prueba de hiptesis, denominada tambin prueba de
significacin tiene como objeto principal evaluar
suposiciones o afirmaciones acerca de los valores
estadsticos de la poblacin denominados parmetros. La
palabra docimar, significa probar y se convierte en una
tcnica de ayuda al profesional, investigador o
administrador a tomar una decisin referente a una
poblacin, examinando una muestra de esa poblacin.
HIPOTESIS ESTADISTICA
Es un supuesto acerca de un parmetro o de un valor
estadstico de una poblacin, tambin puede considerarse
como la afirmacin acerca de una caracterstica ideal de
una poblacin sobre la cual hay inseguridad en el momento
de formularla y que a la vez, es expresada de tal forma que
puede ser rechazada.
TIPO DE ERROR
En la decisin de aceptar o rechazar una hiptesis puede
cometerse dos tipo de error.
a) ERROR DE TIPO I: Rechazar una hiptesis nula
verdadera (

).
b) ERROR DE TIPO II: Se comete cuando se acepta una
hiptesis nula falsa.
La probabilidad de cometer un error de tipo II se designa
por

.
Como las pruebas de hiptesis se basan en informacin de
muestra, debemos considerar la posibilidad de cometer
errores. Existen por lo tanto dos posibles decisiones:
Aceptar o rechazar la hiptesis la que, a la vez, puede ser
cierta o falsa.
TABLA N1 ERRORES Y DECISIONES CORRECTAS EN PRUEBA DE
HIPOTESIS
D
E
C
I
S
I
O
N
E
S
ACEPTA
VERDADERA FALSA
DECISIN
CORRECTA
ERROR
TIPO II
RECHAZA
R
ERROR
TIPO I
DECISIN
CORRECTA
HIPTESIS NULA Y ALTERNATIVA
La hiptesis se debe formular en forma correcta o lgica y
debe ser enunciada antes de obtener los datos muestrales.
Son ejemplos de hiptesis estadstica:
a) El promedio de rendimiento que tendrn los alumnos
maestristas en el curso Estadstica Aplicada ser superior
a 16.
b) El 90% de los estudiantes aprobarn la asignatura
c) El 5% de las unidades producidas por una mquina
sern defectuosas
d) El promedio de contenido de colesterol en
adolescentes normales es de 180
Existen dos tipos de hiptesis que se deben
formular:
La hiptesis nula, simbolizada por Ho y la hiptesis
alternativa por Ha.
LA HIPTESIS NULA.- Es aquella por medio de la cual se
hace una afirmacin sobre un parmetro que se va a
contrastar con el resultado muestral. Cuando el fabricante
dice que su producto tiene una duracin de 6000 horas, se
le considera como hiptesis nula, pues es lo que se quiere
probar.
LA HIPTESIS ALTERNATIVA.- Es todo aquella hiptesis
que difiere de la hiptesis nula, es decir ofrece una
alternativa afirmando que la hiptesis nula es falsa. Por
ejemplo se podra decir que la hiptesis alternativa podra
ser:
a) El fabricante ha exagerado la duracin de su producto
(prueba unilateral a la izquierda)
b) El fabricante pudo haber dicho que su producto tiene una
duracin superior a 6000 horas (prueba unilateral a la
derecha)
c) La duracin del producto no es la sealada por el
fabricante (prueba bilateral)
NIVEL DE SIGNIFICACIN Y PUNTOS CRTICOS

Se entiende por nivel de significancia, la mxima
probabilidad de que se especifique, con el fin de hacer
mnimo el primer tipo de error. Generalmente, esta
probabilidad se fija antes de escoger la muestra. El nivel de
significacin se simboliza por alfa (), siendo generalmente
del 1%, 5% 10%; pero se puede usar cualquier nivel,
dependiente del tipo de investigacin.
Cuando se trabaja con un nivel del 10% se considera poco
significativo, cuando se trabaja con un nivel del 5% el
resultado se considera significativo; si se emplea el 1%
el resultado es altamente significativo.
El valor de significacin corresponde a un rea bajo la curva
de probabilidad o normal, denominada regin crtica o de
rechazo, cuando n 30 y la distribucin T
2
para
muestras pequeas (n<30)
PROCEDIMIENTOS A SEGUIR EN LAS PRUEBAS
DE HIPTESIS
Se presenta en primer lugar una sntesis de los pasos a
seguir, luego se amplia para que se tenga una mejor
visin del procedimiento:
1. DATOS
2. SUPOSICIONES
3. FORMULAR LA HIPTESIS NULA Y ALTERNATIVA
4. SELECCIONAR EL NIVEL DE SIGNIFICACIN
5. CONOCER O ESTIMAR LA VARIANZA
6. DETERMINAR LA TCNICA Y LA PRUEBA
ESTADSTICA
7. DETERMINAR LOS VALORES CRITICOS Y SUS
REGIONES DE RECHAZO
8. CALCULAR LA ESTADSTICA DE PRUEBA
9. TOMAR LA DECISIN ESTADSTICA
Ho = Hiptesis Nula
Ha = Hiptesis Alternativa
o a o a o a
o o o o o o
H H H
H H H


> <

: : :
: : :
po p o po p o po p a
po p o po p o po p o
H H H
H H H


> <

: : :
: : :
DISTRIBUCIN NORMAL

x
Z
DISTRIBUCIN DE MEDIAS MUESTRALES
30


n ; Z
n / S
x
o
n /
x
Z
DISTRIBUCIN DE PROPOSICIONES
30 ;

n siendo
n
pq
p p
Z
PRUEBA DE HIPTESIS: DE UNA SOLA MEDIA DE
POBLACIN
Se presentan 3 casos:
CASO 1: MUESTREO A PARTIR DE POBLACIONES
NORMALMENTE DISTRIBUIDA:
VARIANZAS CONOCIDAS
1. Un grupo de investigadores est interesado
en conocer la edad promedio de cierta poblacin. Por
decirlo as, se preguntan lo siguiente: Se pude
concluir que la edad promedio de la poblacin es
menor de 30 aos?
SOLUCIN:
1. Datos. Los datos disponibles para los investigadores
son las edades de una muestra aleatoria simple de 60
individuos, extrada de la poblacin de inters. A partir
de esta muestra se calcula el promedio que es de 27
aos. ( = 27 aos ).
2. Supuestos. Se supone que la muestra de valores
proviene de una poblacin cuyas edades siguen una
distribucin aproximadamente normal y que la
varianza de la poblacin es de 120 (

2
= 120 ).
3. HIPTESIS
H
o
:

= 30
H
1
:

< 30
4. Nivel de significancia:

0,05

n
- X
Z
ESTADSTICO DE PRUEBA

5. Clculo del valor tabular ( t
T
)
Como

= 0.05 y la prueba es unilateral z


T
=
1.645

6. Clculo del valor experimental ( Z
O
) o estadstica de
Prueba

Z
O
=
75 . 7 / 95 . 10
30 27
= - 2.12
7. Determinacin de las regiones crticas

8. Decisin estadstica.
Como Z
O
= 2.12 es < que Z
T
= -1.645 el valor
experimental se sita en la zona de rechazo, entonces
no se puede aceptar la H0.
9. Conclusin. Se concluye que la edad promedio de la
poblacin es menor de 30 aos y se beber actuar de
acuerdo a lo pertinente.

2. Se ha observado que numerosos enfermos
con cncer en el distrito de Ate Vitarte y en
un estudio clnico determinado tienen una
supervivencia media desde el diagnstico de
38.3 meses, con una desviacin estndar de
43.3 meses. Cien pacientes son tratados con
una nueva tcnica y su supervivencia media
es de 46.9 meses. Es este aparente
incremento de la supervivencia media
explicable por una fluctuacin debida al
azar?
1.645-
1.11.
645
R.A
.
Z
=0,5
R.R.
SOLUCIN
1. Datos:

= 38.3 meses

= 43.3 meses X = 46.9


mes.
2. Suposicin: Supongamos que los datos de la muestra
se distribuyen en forma aproximadamente normal.
3. HIPTESIS :
H
o
:

= 38.3 meses
H
1
:

38.3 meses
4. Nivel de significacin:

= 0.05

5. ESTADSTICO DE PRUEBA: La distribucin normal

6. Clculo del valor Tabular ( t
T
) :
Como

= 0.05 y la prueba es bilateral entonces z


T
=
1.96
7. Clculo del valor experimental ( Z
0
)
Z
0
=
100 / 3 . 43
3 . 38 9 . 46
=
33 . 4
6 . 8
= 1.99
8. Determinacin de las regiones crticas



9. Decisin Estadstica :
Como Z
0
= 1.99 > Z
T
= 1.96 Se rechaza la hiptesis
nula y se Acepta la hiptesis alternativa.
1,96 -1,96
Z
0,025

2
0,025

2
R.A.
R.C. R.C.
10. Conclusin
El valor experimental apenas sobrepasa al valor
tabular, por lo tanto , la diferencia es significativa. Esta
diferencia significativa sugiere que es poco probable
que el incremento del tiempo medio de supervivencia se
deba al azar. No sera prudente suponer que el nuevo
tratamiento ha mejorado la supervivencia, por que
algunas caractersticas de los pacientes podran haber
cambiado desde el registro de los primeros datos; por
ejemplo, la enfermedad poda haber sido diagnosticada
previamente. Finalmente lo que se puede afirmar es que
es muy probable que la diferencia no sea un fenmeno
debido al azar.

CASO 2: MUESTREO A PARTIR DE UNA POBLACIN
NORMALMENTE DISTRIBUIDA: VARIANZA
DE LA POBLACIN DESCONOCIDA
1. Se hicieron determinaciones de amilasa en el suero,
en una muestra de 15 sujetos aparentemente
normales. La muestra proporcion una media de 96
unidades/100ml y una desviacin estndar de
35u/100ml. Supngase que se desea saber si puede
concluirse que la media de la poblacin de la cual
provino la muestra de determinaciones de amilasa
en el suero es diferente de 120 unidades /100ml
1. DATOS: Los datos consisten de las determinaciones
de la amilasa en el suero de 15 sujetos
aparentemente normales. La media y la desviacin
estndar calculadas a partir de la muestra son 96 y
35 unidades/100ml respectivamente.
2. SUPOSICIONES: 15 determinaciones constituyen
una muestra aleatoria de una poblacin de
determinaciones que estn normalmente
distribuidas. Se desconoce la varianza de la
poblacin.
3. NIVEL DE SIGNIFICACIN:
0,05
4. HIPTESIS
120 : H
0
120 : H
a
5. ESTADSTICA DE PRUEBA: Como no se conoce la
varianza poblacional la estadstica de prueba es:
n S
- X
t
6. DISTRIBUCIN DE LA ESTADSTICA DE
PRUEBA: La estadstica de prueba esta distribuida
como la T de Student con n 1 grados de libertad si
H
0
es verdadera.
7. REGLA DE DECISIN: Se trata de una prueba
bilateral, se pone
2

a cada cola de la distribucin,


entonces:
0 T 0 T
H acepta Se 2,1448 t t t - Si
a T 0 T
H acepta Se 2,148 t t t Si
8. CALCULO DE LA ESTADISTICA DE PRUEBA
EXPERIMENTAL
2,65
9,04
24
15 35
120 - 96
t
0


9. DECISIN ESTADSTICA: 2.65 Cae dentro de la
regin de rechazo por lo tanto se acepta H
a
y se
rechaza H
o
.
10. DECISIN ADMINISTRATIVA: La conclusin,
basada en estos datos, es que la media de la
poblacin de la cual provino la muestra no es 120
unidades/100ml.
2. 1448
RC
0
0,025 0,025
R.A.
-2,1448
RC
CASO 3: MUESTREO A PARTIR DE UNA
POBLACIN QUE NO ESTA
NORMALMENTE DISTRIBUIDA:
Si la muestra en la cual se basa la prueba de la
hiptesis proviene de una poblacin que no esta
normalmente distribuida, si la muestra es grande, puede
sacarse ventaja del teorema del limite central y usar
n
- X
Z
como la estadstica de prueba. Si no se conoce la
desviacin estndar de la poblacin, la practica comn es
usar la desviacin estndar de la muestra como una
estimacin.
EJEMPLO :
En una encuesta sanitaria de cierta comunidad se
entrevistaron 150 personas. Uno de los detalles de la
informacin obtenida fue el nmero de recetas mdicas que
cada persona habr tenido que pedir durante el ao
anterior. El nmero promedio para las 150 personas fue de
5.8 con una desviacin estndar de 3.1. El investigador
desea saber si estos datos proporcionan evidencia
suficiente como para indicar que la media de la poblacin
es mayor que 5.
EJEMPLO DE APLICACIN:
1. Suponga que la empresa que fabrica bombillas quiere
saber si puede afirmar que sus bombillas tiene una
duracin de 1000 horas. La empresa toma una muestra
aleatoria de 100 bombillas y calcula que el promedio de
duracin es 980 horas y que la desviacin estndar es 80
horas. Utilice un nivel de significacin del 5%.
2. Una empresa quiere saber, con un nivel de confianza
del 95% , si puede afirmar que las cajas de detergente que
vende contienen ms de 500 gramos de detergente. De su
experiencia anterior, la empresa sabe que la cantidad de
de detergente contenido en las cajas sigue una
distribucin normal. La empresa toma una muestra
aleatoria de 25 cajas y calcula que el promedio aritmtico
es 520 gramos y una desviacin estndar de 75 gramos.
Puesto que a la empresa le interesa contratar que el
promedio poblacional es mayor que 500 gramos.

Vous aimerez peut-être aussi