Vous êtes sur la page 1sur 8

N

L.E.

L.A.D.E.

PUBLICACIONES DE 2 CURSO
SECCIN:

L.A.D.E y L.E.

ASIGNATURA: ESTADSTICA II
TEMA:

Tema 3: Teora de muestras

GRUPO:

TODOS

DEPARTAMENTO

DE MTODOS ESTADSTICOS

Curso Acadmico
2004/2005

Facultad de Ciencias Econmicas y Empresariales


Universidad de Zaragoza

Estadstica II

Estadstica II

Estadstica II

NDICE
Q

TEMA 3:

INTRODUCCIN
1. Definiciones
2. Tipos de muestreo

INTRODUCCIN A
LA TEORA DE
MUESTRAS.

ESTADSTICOS
Ejemplos
Media muestral
Varianza y cuasivarianza muestral
DISTRIBUCIONES DE LOS ESTADSTICOS

Cambio de variable
Funcin generatriz de momentos
Muestreo artificial (Mtodo de Montecarlo)
Aproximacin asinttica (T. C. L.)
MuestreoVariables aleatorias continuas

Muestreo

1.

TAMAO DE LA MUESTRA

2.

ANEXO: MUESTREO EN POBLACIONES


FINITAS
MUESTREO ESTRATIFICADO

Estadstica II

Muestreo

Estadstica II

INTRODUCCIN

INTRODUCCIN

Comienzo de la parte inferencial del curso


INFERENCIA: Dados unos valores de una
poblacin, qu se puede decir del modelo?

INFERENCIA ESTADSTICA
(Temas 3, 4, 5, 6 y 7)
Q Nociones bsicas de muestreo
Tema 3
Q Resultados tericos acerca del muestreo
ENFOQUE PARAMTRICO
Q Problema: Dada una poblacin, la existencia de
parmetros (valores poblacionales) desconocidos
Q Soluciones:
Dar un nico valor (Estimacin puntual)
Tema 4
Dar un intervalo (Estimacin por intervalos) Tema 5

Comparar resultados con modelos reales


Obtener conclusiones

Esquema de trabajo:
Partiendo de una poblacin en la que se ha definido
un modelo probabilstico de los estudiados hasta
ahora se desea averiguar alguna caracterstica
(parmetro) desconocida.
Se extrae una muestra de tal poblacin y con los
resultados obtenidos se realizan inferencias sobre
el modelo (valores
del parmetro).
MuestreoVariables
aleatorias continuas

Creencia a priori de que el parmetro tiene algn valor


o rango de valores, y confirmarlo mediante tcnicas
estadsticas
(Test de hiptesis)
MuestreoVariables
aleatorias continuas
Tema 6

ENFOQUE NO PARAMTRICO
Q Otras caractersticas del modelo que es necesario
Tema 7
confirmar (Test no paramtricos)

ENFOQUE PARAMTRICO

Muestreo

Muestreo

Estadstica II

Estadstica II

Estadstica II

INTRODUCCIN

INTRODUCCIN

EJEMPLO INTRODUCTORIO
Una mquina produce piezas que se pueden
clasificar en defectuosas y vlidas; se quiere saber
cul es la proporcin de piezas defectuosas que
produce la mquina
POBLACIN: Conjunto o coleccin de elementos
sobre los cuales se quiere estudiar alguna
caracterstica.
EJEMPLOS
Poblacin finita e infinita
MUESTRA: Solo se realiza el estudio de dicha
caracterstica en una parte de la poblacin. A ese
subconjuntoMuestreoVariables
se le denomina
muestra.
aleatorias
continuas

MUESTREO: Herramienta de la investigacin


cientfica cuya funcin bsica es determinar qu
parte de una poblacin en estudio debe examinarse
con el fin de hacer inferencias sobre dicha
poblacin.
Intentaremos responder a las siguientes cuestiones:

Muestreo

Por qu tomar muestras?


Cmo se toman muestras?
Qu hacer con las muestras?
Qu tipo de variables son las muestras?
Cuntas muestras tomar?

POR QU TOMAR MUESTRAS?


Q Poblaciones infinitas
MuestreoVariables aleatorias continuas
Q Costes de la toma de muestras
Q Destruccin de las unidades estudiadas

Estadstica II

Muestreo

Estadstica II

INTRODUCCIN

TIPOS DE MUESTREO

EJEMPLO INTRODUCTORIO
POBLACIN: Infinitas piezas que produce la
mquina.
MODELO: Una variable aleatoria Bernoulli
X=Pieza defectuosa X Be(p)
MUESTRA: Nmero de piezas que se seleccionan
para comprobar si son defectuosas.
PROBLEMA: No sabemos el porcentaje de piezas
defectuosas, por lo tanto p es el parmetro
desconocido. Queremos hacer inferencias acerca
del verdadero valor de p
NOTA: Nunca se sabe el valor real de p
Solo
es posiblealeatorias
estimarlo
MuestreoVariables
continuas
NOTA: Con la informacin muestral se quiere
conocer toda la pblacin

Muestreo

CMO SE TOMAN MUESTRAS?


TIPOS DE MUESTREO
1) Muestreo aleatorio simple o con reposicin
2) Muestreo sin reposicin
3) Muestreo Sistemtico
4) Muestreo Estratificado
5) Muestreo por conglomerados
6) Otros tipos de muestreo (polietpico, MUM,...)

MuestreoVariables aleatorias continuas

Muestreo

Estadstica II

Estadstica II

Estadstica II

TIPOS DE MUESTREO

TIPOS DE MUESTREO

1) MUESTREO ALEATORIO SIMPLE O CON

2) MUESTREO ALEATORIO SIN REPOSICIN

REPOSICIN (m.a.s.)

Se TOMA un elemento al azar, se ESTUDIA y NO


se DEVUELVE para prximas extracciones

Se TOMA un elemento al azar, se ESTUDIA y se

NO todos los elementos tienen la misma


probabilidad de ser extrados

DEVUELVE antes de extraer el siguiente


Todos los elementos tienen la misma probabilidad

Las extracciones NO son independientes

de ser extrados

EJEMPLOS: Urna sin reposicin (p. finita)


Eleccin de un comit (p. finita)
Una m.a. sin reposicin de tamao n (X1, ..., Xn) es
una v.a. n-dimensional donde todas las Xi:

Las extracciones son independientes


EJEMPLOS: Urna con reposicin (p. finita)
Mquina produce piezas (p. infinita)
Una m.a.s. de tamao n (X1, ..., Xn) es una v.a. ndimensionalMuestreoVariables
donde todasaleatorias
las Xcontinuas
i:

Son dependientes
MuestreoVariables
aleatorias
continuas
Tienen
la misma
distribucin
Su distribucin coincide con la de poblacin

Son independientes
Tienen la misma distribucin
Su distribucin coincide con la de poblacin

Q NOTA: Si la poblacin es grande (infinita) este


muestreo se puede considerar como el anterior

Muestreo

Estadstica II

Muestreo

10

Estadstica II

TIPOS DE MUESTREO

TIPOS DE MUESTREO

3) MUESTREO SISTEMTICO

4) MUESTREO ESTRATIFICADO
Dividir la poblacin en L estratos (subgrupos) t. q:

Para tomar una muestra de tamao n:


Numerar las unidades de la poblacin de 1 hasta N.
Dividir la poblacin en n bloques de k elementos
cada uno k = N / n
Tomar un elemento al azar del primer bloque
(elemento h: 1hk). Repetir de forma sistemtica:
La muestra queda formada por los elementos:
h + ik
i = 0,..., n-1
EJEMPLO: Eleccin de jurados
Q NOTA: Solo pueden tomarse k muestras distintas
MuestreoVariables aleatorias continuas
Q NOTA: Los elementos de la muestra son
dependientes
Q NOTA: NO es vlido si los elementos mantienen
una cierta periodicidad cclica
Muestreo

11

Elementos homogneos dentro del estrato


Estratos heterogneos entre s

Muestra total = Unin de las muestras de cada


estrato. Cada submuestra independiente del resto.
Ventajas:
Permite aplicar tcnicas de seleccin diferentes dentro
de cada estrato
Permite obtener estimaciones separadas en cada estrato
Consigue mayor precisin
Disminuye el tamao de la muestra

Para seleccionar el tamao de cada submuestra:


Afijacin
uniforme aleatorias continuas
MuestreoVariables
Afijacin proporcional (ms usado)
Afijacin de mnima varianza
Afijacin ptima (costes asociados al muestreo)

EJEMPLO: Estudios de mercado


Muestreo

12

Estadstica II

Estadstica II

Estadstica II

TIPOS DE MUESTREO

TIPOS DE MUESTREO

5) MUESTREO POR CONGLOMERADOS

6) OTROS TIPOS DE MUESTREO

Sustituir los elementos de la poblacin por grupos


Cada unidad es ahora un grupo: conglomerado
Se seleccionan los conglomerados y dentro de ellos
se realiza el estudio
EJEMPLO: Centros de enseanza dentro de una
encuesta escolar
Municipios rurales dentro de una encuesta agrcola
NOTA: Cada grupo es heterogneo dentro de l
Los grupos deben ser homogneos entre s
MuestreoVariables aleatorias continuas

MUESTREO EN VARIAS ETAPAS:


Es comn que se necesite utilizar conjuntamente
varias de las tcnicas vistas hasta ahora
MUESTREO DE LA UNIDAD MONETARIA:
Usado en Auditora. Consiste en tomar como
unidades, no los expedientes sino la cantidad
monetaria que cada uno de ellos tiene. As tienen
ms probabilidades de ser seleccionados los
expedientes MuestreoVariables
de mayor cantidad
monetaria.
aleatorias continuas

13

Muestreo

Estadstica II

14

Muestreo

Estadstica II

ESTADSTICOS

ESTADSTICOS

Q Estadstico: Cualquier funcin de la muestra


totalmente especificada, es decir, que no dependa
n

de parmetros desconocidos T:
( x1 ,...,x n ) a T ( x1 ,...,x n )

g(x1, ..., xn / ) =

p(X

= i / p)

i = 0,1

Y=

Y= N de piezas defectuosas

j =1

Distribucin muestral: g(x1, x2, x3 /p) =

Medida de informacin de la muestra


Sirve para inducir valores de parmetros desconocidos
Es una variable aleatoria

Q En general, sea X una poblacin (variable


aleatoria) que tiene un parmetro desconocido ().
Su funcin de densidad / cuanta depende, por lo
tanto, de dicho parmetro f(x / )
Se toma una m.a.s. (X1, ..., Xn). Su distribucin
muestral ser g(x1, ..., xn / ) (por ser una v.a.)
Q Ejemplo: Mquina que produce piezas buenas o
MuestreoVariables aleatorias continuas
defectuosas X = Pieza defectuosa X Be(p) ( = p)
f(x / ) = p(X = i / p) = pi * (1-p)(1-i) i = 0,1

Ejemplo: Muestra de tamao 3 (X1, X2, X3).

1
=
2
3

0
1
3p 2 q

sup oniendo p = 0 , 2
2
3 pq
2
3
3
q
p3

Estadsticos ms usuales:

Media muestral

Q
Q

Varianza muestral

x=

s2 =

0 .008
0 .096
0 .384
0 .512

1
n

1
n

(x

i =1

i =1

x)2

1
Cuasivarianza
muestral
s12 =continuas
MuestreoVariables
aleatorias
(xi x)2
n 1 i=1

Q NOTA: Son los ms usados pero sirve


cualquiera, tambin los momentos muestrales

j =1

Muestreo

15

Muestreo

16

Estadstica II

Estadstica II

Estadstica II

ESTADSTICOS

DISTRIBUCIONES DE LOS
ESTADSTICOS

Estadstico = Variable aleatoria


Suponemos un m.a.s. (X1, ..., Xn) donde E[X] =
Var [X] = 2. Vamos a calcular los momentos de
los estadsticos

Qu tipo de variables aleatorias son los


estadsticos que hemos calculado hasta ahora?

Var [ x ] =

E[ x ] =

Media muestral

Varianza muestral

E[s 2 ] =

Cuasivarianza muestral

E[s12 ] = 2

CASO PARTICULAR: Proporcin XBe(p)

Proporcin muestral

1) Mtodo del cambio de variable


Habitualmente la distribucin muestral no es
reconocida como uno de los modelos que
habitualmente se utilizan.
Una solucin sera realizar un cambio de variable
para que la nueva variable fuera alguna funcin
conocida.
Suele ser unMuestreoVariables
mtodo que
en continuas
la prctica apenas se
aleatorias
utiliza debido a su complejidad.

n 1 2

1
MuestreoVariables aleatorias continuas

E [ p ] = p

p =

Var [ p ] =

x
n
i =1

CMO SABER SU DISTRIBUCIN?

p (1 p )
n

Muestreo

17

Estadstica II

18

Muestreo

Estadstica II

DISTRIBUCIONES DE LOS
ESTADSTICOS

DISTRIBUCIONES DE LOS
ESTADSTICOS
Ejemplo:

2) Mtodo de la funcin generatriz de momentos


Teorema: Si (X1, ..., Xn) son independientes
Funcin generatriz conjunta = Producto de las
funciones generatrices de las marginales

Dado

x=

1 n
xi
n i =1

usando

los

teoremas

M X ( t ) = [M X ( t n )]

anteriores:
Ejemplo:
n

Teorema (Adicin de v. a. independientes)


Funcin generatriz de la suma de n v. a.
independientes = Producto cada una de sus n
funciones generatrices
Este mtodo consiste en calcular la funcin
generatriz de momentos del estadstico y,
recordando que
esta funcin define de forma nica
MuestreoVariables aleatorias continuas
a una v.a., intentar conocer su distribucin.

Dado

Y = nx = x i

anteriores:

i =1

usando

los

teoremas

M Y ( t ) = [M X ( t )]

Ejercicios: Si XN(,) X N( ,

n)

Si X P() Y = nx P(n )

MuestreoVariables aleatorias continuas

Este mtodo sirve nicamente en situaciones muy


especficas por lo que hay que buscar otras
alternativas.
Muestreo

19

Muestreo

20

Estadstica II

Estadstica II

Estadstica II

DISTRIBUCIONES DE LOS
ESTADSTICOS

DISTRIBUCIONES DE LOS
ESTADSTICOS

3) Muestreo artificial
Este mtodo consiste en simular muestras
aleatorias de la poblacin de partida, construir
histogramas de del estadstico objeto del estudio y
a partir de ah obtener aproximadamente su
distribucin.
Para ello se necesita simular variables aleatorias
(Prctica 1 de ordenador)
Q Para cada muestra:
1) Valores de una U(0,1)
2) Utilizar que Y= F(x) U(0,1)
3) Realizar la transformacin inversa X = F-1(Y)
4) Calcular MuestreoVariables
los estadsticos
que
se necesiten
aleatorias
continuas
Q Repetir estos pasos con un nmero elevado de
muestras
Q Realizar los histogramas de todas las muestras

4) Aproximaciones asintticas
En muchos estudios se toman muestras de tamao
elevado. Es conveniente conocer las distribuciones
lmite de algunos estadsticos (n)
Teorema Central del Lmite (T.C.L.)
Dadas Xi i = 1, ..., n variables aleatorias t. q.
Independientes
Idnticamente distribuidas
Media y varianza finitas
E[X] =
n

1)

X
i =1

N(0,1)

Estadstica II

X
N(0,1)
n n

Es decir, la suma
de variables
se puede aproximar a
MuestreoVariables
aleatorias continuas
una distribucin N(,n) y la media muestral se
puede aproximar a una distribucin N(,/ n)
Q Nota: Se usa esta aproximacin cuando n > 30

21

Muestreo

2)

Var [X] = 2 .

22

Muestreo

Estadstica II

TAMAO DE LA MUESTRA

TAMAO DE LA MUESTRA
CASO 2): XN(, )

QU TAMAO DE MUESTRA TOMAR?


Desigualdad de Tchebycheff
Sea X con E[X] = Var [X] = 2 .
p{X < k } 1

1
k2

k > 0

Problema: Establecido el parmetro que se quiere


estimar (media), el grado de precisin (error)
necesario y el nivel de confianza deseado, qu
tamao de muestra debemos tomar?
CASO 1): X v. a. con distribucin desconocida. Se
aplica la desigualdad de Tchebycheff

n)

Q Nota 1: Si para el caso 1) n sale suficientemente


grande, mediante el T.C.L.se pasa al caso 2)
Q Nota 2: El tamao muestral (n) es directamente
proporcional a la varianza de la poblacin y al
nivel de confianza, e inversamente proporcional al
error que estemos dispuestos a cometer.
Q

Nota 3: Caso particular, proporciones XBe(p).

Aplicando el TCL se obtiene p N(p, p(1 p)

Fijado el nivel de confianza se calcula k


MuestreoVariables aleatorias continuas
Se obtiene el tamao mediante
k 2 2
n= 2
e

Muestreo

X N( ,

Fijado el nivel de confianza, mediante las tablas de la


distribucin normal se calcula z/2.
z2 2 2
Se obtiene el tamao mediante
n=
e2

n)

MuestreoVariables
aleatorias continuas
2

n=

z 2 p(1 p)
e2

En caso de no tener ninguna estimacin de p, se


toma el peor de los casos posible y se toma p = 1/2
23

Muestreo

24

Estadstica II

Estadstica II

Estadstica II

TAMAO DE LA MUESTRA

MUESTREO EN
POBLACIONES FINITAS

Nota 4: En caso de desconocer la varianza, sta


se sustituye por una estimacin, habitualmente la
cuasivarianza muestral (s12 )
Q

Q Nota 5: Para el caso de poblaciones finitas se


calcula lo que se denomina la correccin para
poblaciones finitas

n
n=
n
1+
N

Es un muestreo sin reposicin donde E[X] = y


Var [X] = 2 . Las variables Xi estn idnticamente
distribuidas pero son dependientes:
Q Covarianza: Para 2 variables cualesquiera Xi y Xj
Cov ( X 1 , X 2 ) =

Media muestral
Esperanza

donde n es el tamao calculado para el caso de una


poblacin infinita (o para un m.a.s.)
MuestreoVariables aleatorias continuas

x=

2
N 1

1 n
xi
n i =1

E[ x ] =

2
Var [ x ] =
(1 f )
Varianza
MuestreoVariables aleatorias continuas
n
donde f es la fraccin de muestreo (f = n/N)
Ejercicio: Demostrar estas igualdades

25

Muestreo

Muestreo

26

Estadstica II

MUESTREO
ESTRATIFICADO
Sea X poblacin con E[X] = y Var [X] = 2
dividida en L estratos
L
X = Wi X i
Media muestral:
i =1
Wi = proporcin de elementos del estrato i-simo
(Ni/N) Xi = media muestral de dicho estrato
Q Caractersticas de la media muestral
E[ X ] =

Var[ X ] = Wi2
i =1

i2
(1 f i )
ni

i2 = varianza dentro de cada estrato

fi = fraccin de muestreo del estrato i-simo (ni/N)


Q Para la afijacin proporcional nh = Nh * n/N y la
fraccin de muestreo fh = n/N = constante
Q Entonces, la varianza de la media muestral es:
MuestreoVariables
aleatorias
continuas
2
L

Var[ X ] = (1 f ) Wi2
i =1

Tamao muestral:

i
ni

k2
e2

n=

1+

Muestreo

2 2
i i

i =1
L
2

k
Ne 2

2 2
i i

i =1

27

Vous aimerez peut-être aussi