Muestreo Curso 01

TEORÍA Y PRÁCTICA
DEL MUESTREO
Una Primera Aproximación
EXPOSITOR: Ing. César Verano Serruto

ESTADISTICA BASICA
Un brevísimo resumen sobre estadísticos
• Posición
– Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
• Cuantiles, percentiles, cuartiles, deciles,...
• Centralización
– Indican valores con respecto a los que los datos parecen agruparse.
• Media, mediana y moda
• Dispersión
– Indican la mayor o menor concentración de los datos con respecto a
las medidas de centralización.
• Desviación típica, coeficiente de variación, rango, varianza
• Forma
– Asimetría
– Apuntamiento o curtosis
Estadísticos de posición
• Se define el cuantil de orden a como un valor de la variable por debajo
del cual se encuentra una frecuencia acumulada a.
• Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Estadísticos de centralización
Añaden unos cuantos casos particulares a las medidas de posición. En este caso son
medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran
tendencia a agruparse.
• Media Es la media aritmética (promedio) de los valores de una variable. Suma de los
valores dividido por el tamaño muestral.
– Media de 2,2,3,7 es (2+2+3+7)/4=3,5
– Conveniente cuando los datos se concentran simétricamente con respecto a ese
valor. Muy sensible a valores extremos.
– Centro de gravedad de los datos
• Mediana Es un valor que divide a las observaciones en dos grupos con el mismo
número de individuos (percentil 50). Si el número de datos es par, se elige la media
de los dos datos centrales.
– Mediana de 1,2,4,5,6,6,8 es 5
– Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
– Es conveniente cuando los datos son asimétricos. No es sensible a valores
extremos.
• Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
• Moda Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.

Altura mediana
MEDIA ARITMETICA
Media poblacional (  ) :
 =  xi / N
N = Tamaño de la población
xi = Observaciones (datos) de la variable X.
Media muestral ( x ) :
x   xi / n
x = Media muestral
n = Tamaño de la muestra
MEDIANA (Me)
Es el valor que divide al conjunto de datos en dos

partes iguales, donde aproximadamente 50% son
menores y los otros 50% son mayores que ese valor.
Se obtiene:
n = número de observaciones
Si n es impar : Me = X((n+1)/2)
Donde: X ((n+1)/2) = valor de la observación en el lugar (n+1)/2
(valor central)
Si n es par : Me = [X(n/2) + X((n/2) +1)]/2
x(n/2) Valor central x((n/2)+1)

MODA (Mo)
Valor que se repite con más frecuencia en un

conjunto de datos, o
Ejemplo:
Hallar la moda de los siguientes números:
3, 3, 3, 3, 5, 6, 8, 4, 20, 37, 37, 50, 50, 50
En este caso la moda es:

Mo = 3 (se repite cuatro veces)
Variabilidad o dispersión
• Los estudiantes de Bioestadística reciben diferentes calificaciones en la
asignatura (variabilidad). ¿A qué puede deberse?
– Diferencias individuales en el conocimiento de la materia.
• ¿Podría haber otras razones (fuentes de variabilidad)?
• Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
– Dormir poco el día del examen, el croissant estaba envenenado...

• Diferencias individuales en la habilidad para hacer un examen.
– El examen no es una medida perfecta del conocimiento.

• Variabilidad por error de medida.
– En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala
• Variabilidad por azar, aleatoriedad.
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los datos, independientemente de su
causa.
0.05
Mín. P25 P50 P75 Máx.
• Amplitud o Rango (‘range’):
0.04
Diferencia entre observaciónes extremas.
– 2,1,4,3,8,4. El rango es 8-1=7
0.03
– Es muy sensible a los valores extremos.
25% 25% 25% 25%
0.02
Rango intercuartílico
• Rango intercuartílico (‘interquartile range’):
0.01
– Es la distancia entre primer y tercer cuartil. Rango
0.00
• Rango intercuartílico = P75 - P25
– Parecida al rango, pero eliminando las observaciones150más extremas
160 inferiores
170 180 y 190
superiores.
– No es tan sensible a valores extremos.

• Varianza S2 (‘Variance’): Mide el promedio de las
desviaciones (al cuadrado) de las observaciones
con respecto a la media.
1
S   ( xi  x )
2 2
n i
– Es sensible a valores extremos (alejados de la media).
– Sus unidades son el cuadrado de las de la variable. De

interpretación difícil para un principiante.
Desviación típica (‘standard deviation’)
Es la raíz cuadrada de la varianza
S S 2
• Tiene las misma dimensionalidad
(unidades) que la variable. Versión 50
‘estética’ de la varianza.
40
• Cierta distribución que veremos más

adelante (normal o gaussiana) quedará 30
completamente determinada por la

media y la desviación típica. 20
– A una distancia de una desv. típica de la media 10

hay más de la ‘más de la mitad’. Desv. típ. = 568,43
Media = 2023
0 N = 407,00
– A una distancia de dos desv. típica de la media 50
0
90
0
1. 1 2
30 . 70 . 10
0 0 0
2.
0
2
0
3
50 . 90 . 30
0
las tendremos casi todas.
Peso recién nacidos en partos gemelares
Coeficiente de variación
S
Es la razón entre la desviación típica y la media. CV 
– Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
x
– También se la denomina variabilidad relativa.
– Es frecuente mostrarla en porcentajes

• Si la media es 80 y la desviación típica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)
• Es una cantidad adimensional. Interesante para comparar la

variabilidad de diferentes variables.
– Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura.
• No debe usarse cuando la variable presenta valores negativos o donde

el valor 0 sea una cantidad fijada arbitrariamente
– Por ejemplo 0ºC ≠ 0ºF
AMPLITUD O RECORRIDO
Dado un conjunto de valores de cierta variable X,

tales como x1, x2, x3,............, xn, se define amplitud
o recorrido de la variable X, a la diferencia entre
el mayor valor y el menor valor observado, es
decir:
xmax : mayor valor de la variable X.
xmin: menor valor de la variable X.
Recorrido = xmax – x min

DESVIACION MEDIA (DM)
DESVIACION MEDIA POBLACIONAL:
DM = | xi -  |/N
Xi = observación de la variable X (i=1,2,....,N)

= media poblacional
N = Tamaño de la población.
DESVIACION MEDIA MUESTRAL:
DM = | xi - x |/n
x = media muestral
n = tamaño de la muestra
VARIANZA Y DESVIACION ESTANDAR
Varianza y desviación estándar poblacional:

Varianza : 2 =  (Xi - )2/N
Desviación estándar:  =  2
 = Media poblacional
N = Tamaño de la población
Varianza y desviación estándar muestral

Varianza : S2 =  (Xi - x)2 / (n - 1)
Desviación estándar: s =  s2
x = Media muestral
n = Tamaño de la muestra
USOS DE LA DESVIACION ESTANDAR
REGLA EMPIRICA
Tomando como referencia la curva de la Distribución
normal, se espera que de un conjunto de observaciones,
un porcentaje de ellas “caiga”en el intervalo x + ks, donde:
K = 1,2,3,......
Entre x + s se encuentra 68.27% de las observaciones
Entre x + 2s se encuentra 95.45% de las observaciones
68.27%
x-s x x+s
95.45%
x - 2s x x + 2s
USOS DE LA DESVIACION ESTANDAR
EJEMPLO
Se observa que los pagos por energía eléctrica en un
área residencial, para un mes determinado, tienen una
distribución normal. Si se determina que la media de
los consumos es de S/. 8,400, con una desviación
estándar de S/. 2,400, entonces puede concluirse que:
• Aproximadamente el 68% de las cuentas por
consumo de Energía eléctrica se encuentra a no más
de S/. 2,400 de la Media, es decir entre S/. 6,000 y S/.
10,800.
• Aproximadamente, 95% de las cuentas, se
encuentran a no más de S/. 4,800 de la media, es
decir, entre S/. 3,600 y S/. 13,200.
PARTE 1
Introducción
• Encuestas por • Marcos Muestrales

Muestreo • Definición de
• Censos Poblaciones
• Tipos de Muestreos • Definición de
• Plan de Muestreo Unidades
 ¿Qué es una Población?
 Colección de todas la posibles

observaciones de interés (personas,
animales, viviendas, instituciones,
empresas u otros objetos animados o
inanimados con identidad física)
 También conocida como “Población
Objetivo” o “Universo”
 ¿Qué es una muestra?
Población Muestra
 ¿Qué es una muestra?
 Es un subconjunto de la población que

permite brindar información sobre toda la
población
 Siempre origina cierto grado de
incertidumbre o riego
 Obliga a vivir con el “Error Muestral”
 Deseamos que sea representativa de la
población
 ¿Qué es el muestreo?
 Es el acto, proceso o técnica que permite

seleccionar una muestra, o una parte
representativa de la población
 No se interesa en las unidades que están

siendo estudiadas en sí mismas sino en su
combinación o agregación
 ¿Porqué una muestra?
 Bajo costo y menor tiempo para dar
información de toda la población
 Mayor precisión que estudiar a toda la
población
 Mejor calidad
 Poblaciones muy grandes (consideradas
como infinitas)
 Destructiva naturaleza del estudio
(aplicaciones industriales)
 Dispersión geográfica de la población
 ¿Qué es un Estudio o Encuesta
por Muestreo?
 Estrategia que:
- implica la recolección de datos sobre
algunas
o todas las unidades de la población sujeta
a
estudio
- emplea conceptos, métodos y
procedimientos
bien definidos
- resume la información en forma útil.
CRITERIOS PARA ACEPTAR UN METODO
DE MUESTREO
• Posibilidades de selección para cada

unidad
• Fiabilidad mensurable
• Plan de Muestreo Práctico
• Diseño Eficiente
METODOLOGIA MUESTRAL
1. PROGRAMA DE LA ENCUESTA: determinar
Objetivos y finalidad; definir perfectamente las
variables a investigar y el planeamiento y
programación de actividades.
2. DISEÑO MUESTRAL: Documento básico que
debe contener:
a. Elección del método muestral
n
b. Determinación de la fracción de muestreo: f ( )
N
c. Elección de los estimadores, para tal efecto se
tomara en cuenta la definición de PARAMETROS y
ESTIMADORES
Continua Metodología Muestral……………
PARAMETRO Y ESTADISTICO
Parámetro: Es una cantidad numérica calculada sobre una población

Ej.. La altura media de los individuos de un país
La idea es resumir toda la información que hay en la población en

unos pocos números (parámetros).
Estadístico: Ídem (cambiar población por muestra)

Ej.. La altura media de los que estamos en este aula.
Somos una muestra (¿representativa?) de la población.
Si un estadístico se usa para aproximar un parámetro también se

le suele llamar estimador.
Normalmente nos interesa conocer un parámetro, pero por la

dificultad que conlleva estudiar a *TODA* la población, calculamos
un estimador sobre una muestra y “confiamos” en que sean
próximos. Más adelante veremos como elegir muestras para que el
error sea “confiablemente” pequeño.
Continua Metodología Muestral…..
La calidad de un estimador se evalúa por dos propiedades:

1. Debe ser insesgado:
â  Es un estimador
a 
donde:
Es un parámetro
E (aˆ )  a
siendo :
E (aˆ )   aˆ .P(aˆ )





MuestrasPosibles
Entonces un estimador será insesgado cuando: E (aˆ )  a  b

sesgo 
Continua metodología Muestral……
La calidad de un estimador……………….
2. Debe ser consistente

O sea, si la muestra es lo suficientemente
grande se corre poco riesgo de usar
estimaciones muestrales
Continua metodología Muestral………
d. Varianza de los estimadores
Que se define por:
V (aˆ )  Eaˆ  E(aˆ ) 2
V (aˆ )   aˆ  E (aˆ ) .P(muestra)

2
Donde:
 medias V estimador
…………Continua metodología muestral
3. Determinar los métodos de recolección

de información.
4. Elaboración, referido a la crítica
codificación y procesamiento de la
información.
5. Análisis Estadístico
 Distintos Tipos de Muestreo
 Probabilísticos
 No Probabilísticos
 Muestreo Probabilístico
 El método de selección emplea la teoría de

probabilidades.
 Todo elemento de la población tiene
posibilidades de ser seleccionado.
 Permite extender los resultados de la
muestra a toda la población.
 Muestreo Probabilístico (cont.)
 La teoría estadística sustenta al muestreo

probabilístico.
 Esta le dice al muestrista cuántas unidades son
necesarias para representar a la población.
 También, cuanta confianza se puede poner en
los resultados que se van a obtener.
 Muestreo Probabilístico (cont.)
 No existen sesgos de selección.

 Se necesita una base o “Marco” para la
selección de las unidades
 Métodos de Muestreo probabilísticos
 Muestreo simple al azar

 Muestreo sistemático
 Muestreo estratificado
 Muestreo por conglomerados
 Muestreo Proporcional a Tamaño
 Muestreo Multietápico
 Muestreo No Probabilístico
 El método de selección no emplea la

teoría de probabilidades.
 No se conoce las posibilidades de que
una unidad sea seleccionada
 No hay posibilidades de evaluar
“Precisión” en los resultados
 Es fácil de implementar
 Muestreo No Probabilístico (cont.)
 Pocos recursos
 Sin Base o “Marco” para la selección
 No garantiza “representatividad”
 Métodos de Muestreo No
Probabilísticos
 Muestreo de voluntarios
 Muestreo con intención o conveniencia
 Muestreo por cuotas
 Estudio o Encuesta por Muestreo
 Con fines descriptivos
- estima ciertas características o atributos

de
la población (por ej.: ingreso medio, tasa
de
desempleo, consumo total de energía por
rama de actividad, etc.)
 Estudio o encuesta por muestreo
 Con fines analíticos

- prueba hipótesis estadísticas y busca
relaciones entre las características de la
población (por ej.: ¿aumenta o disminuye la
proporción de las familias con casa propia al
aplicar el programa habitacional del
gobierno?)
 ¿Qué es un Censo?
 Es el estudio o la enumeración completa de

todas las unidades de la población
 Posee otro tipo de incertidumbre que el

que origina una muestra, no existe “Error
de Muestreo”
 ¿Cuándo es conveniente un Censo?
 Las poblaciones son pequeñas

 Se dispone de recursos
 Se necesita gran desagregación de
la información
 Brinda la base para la selección de
futuras muestras
 ¿Muestreo vs. Censos?
 No compiten, ambos se necesitan
 Es posible combinarlos en una estrategia

concurrente
 Etapas en la planificación y
ejecución de una encuesta
 Fijar los objetivos. ¿Qué se quiere estudiar

y/o medir, y a través de qué variables?
 Población a cubrir. ¿Cuál es realmente?
 Periodo de referencia. ¿Cuál es la
oportunidad?
 Fijar instrumentos de captación. ¿Qué
variables?,¿entrevista directa, por correo,
telefónica?
ejecución de una encuesta (cont.)
 Determinación de la base que permitirá llegar

a la población
 Capacitación
 Selección de la muestra. ¿Con qué Diseño
Muestral y tamaño de muestra?
 Control calidad de la información. (Edición,
revisión, imputación)
ejecución de una encuesta (cont.)
 Tratamiento por no respuesta

 Estimación
 Cálculo de errores de muestreo
 Análisis de datos y tabulación
 Publicación
 Recomendaciones sobre el uso de los datos
 Qué es un Diseño Muestral?
 Es una estrategia que involucra:
- un método de selección
- un método de estimación
- un método de cálculo de precisión
 ¿Qué es una Población?
 Colección de todas la posibles

observaciones de interés (personas,
animales, viviendas, instituciones,
empresas u otros objetos animados o
inanimados con identidad física)
 También conocida como “Población
Objetivo” o “Universo”
 ¿Qué es un “Marco Muestral”?
 Lista de los elementos o grupo de

elementos
desde la cual la muestra es seleccionada
 - Ej: Guía telefónica, listado de
Hospitales, lista de empresas o locales
productivos, listado de viviendas, etc.
 También forman parte de él: mapas,
direcciones, información auxiliar
 ¿Porqué es tan importante un
“Marco Muestral”?
 De el depende:
- la población que realmente se va a estudiar y

sobre la que se va hacer inferencia.
- el tipo de diseño muestral a emplear.
- del tipo de unidad que se va a muestrear
- de cómo se va a llegar a la población
- el tipo procedimiento de estimación para obtener
los resultados
 Tipos de Marcos
 De lista no jerárquico: marco en donde a

cada unidad del marco esta asociada con
una unidad de la población objetivo (Ej.:
Listado de empresas, listados de viviendas,
guía de teléfonos).
 Tipos de Marcos (cont.)
 De área: marco donde las unidades son
porciones territoriales definidas
geográficamente
 Tipos de Marcos (cont.)
 De grupos jerárquico
- marco con distintos niveles donde sus
unidades son divisibles en unidades que
comprenden un marco en el siguiente nivel
(Ej.: marco compuesto por lista de
localidades, de los Radios en esas
localidades, de manzanas en esos Radios y
de Viviendas en esas Manzanas)
 Distintas Poblaciones de la encuesta
 Población Objetivo: Conjunto finito de

elementos o unidades que serán estudiados
 Población del Marco: conjunto de elementos o

unidades de las cuales se extraerá la muestra
 Distintas Unidades de la encuesta
 Unidad de Muestreo: cada una de las

partes en que es dividida la población del
marco, identificables y distintas
 Unidad de Análisis: unidades de interés
dentro de la encuesta, pueden o no
coincidir con las unidades de muestreo
 Unidades de Información: unidades que
proveen información de las unidades de
análisis
 Problemas de los Marcos
 Sub-cobertura
 Sobre-cobertura
 Duplicación
 Información auxiliar incorrecta
 Información de acceso incorrecta
 Propiedades deseables para un Marco
 Relacionadas a la calidad:
- completo
- estable
- fácil de actualizar
 Propiedades deseables para un Marco
(cont.)
 Relacionadas a la eficiencia:
- inclusión de información auxiliar
exacta y fácil de actualizar
- permita la selección de las unidades
muestrales
- calidad cartográfica
- fácil de procesar y manipular
PARTE 2
Definiciones y Terminología
• Parámetros • Teoría de probabilidades

• Estimador • Probabilidades de
• Estimación inclusión
• Error Muestral • Azar y Mecanismos
Aleatorios
 Qué es un parámetro?
 Es una medida resumen de la variable,

característica o atributo medido sobre la
población objetivo
 Es una magnitud fija y desconocida
 Es descriptivo de la población en cuestión
 Tiene sentido práctico y estadístico
 Parámetros más usuales
 Total: suma de los valores medidos sobre

toda la población de una variable
 Promedio: cociente entre el Total y el
tamaño de la Población
 Proporción: igual al promedio, salvo que la
variable es presencia o ausencia del
atributo en cuestión
 Qué es un estadístico o estimador?
 Es una formulación algebraica del

parámetro aplicable a la muestra
 Qué es una estimación?
 Es el resultado de aplicar el estadístico o

estimador a toda la información que provee la
muestra seleccionada
 Qué es el “error muestral” ?
 Diferencia entre el valor del parámetro y el

estimado
 Es el error que surge por estudiar a una parte
de la población
 Su magnitud es desconocida y por lo tanto
imposible de calcular.
 No está generalmente relacionado con el
tamaño de la población
 Qué es el “error muestral”? (cont.)
 Se sabe que disminuye cuando aumenta el

tamaño de la muestra.
 Si la muestra está seleccionada de forma
probabilística es posible controlar su
magnitud y dar una estimación del mismo.
 Qué es el “error muestral”?
•Muestra 1 •Muestra 2 •Muestra 3 •Muestra ..
•. . .
.
•Promedio muestral
• Parámetro
 La magnitud de esa variación se la denomina Error Muestral, para un

estadístico, un tamaño de muestra y un tipo de diseño dados.
 Qué es el “error muestral”?
A)
B)
Estimación Muestral
Parámetro
Tamaño de muestra de A menor que de B
 El Error Muestral para un estadístico y un tipo de diseño dado disminuye según

aumente el tamaño de la muestra
 Qué son los “errores no muestrales”?
 Otros errores ajenos al muestreo: no

respuesta, codificación, encuestador,
encuestado, lógicos, de concepción, etc.
 No disminuyen cuando el tamaño de la
muestra aumenta
Errores en una Encuesta por
muestreo
Error
de
Cobertura
Error
Error
Muestral
no
Muestral
Población Marco Muestra Muestra

Objetivo Muestral Planeada Actual
 ¿Porqué la Teoría de Probabilidades es
necesaria en el Muestreo?
 El muestreo está sustentado por la teoría

estadística y de las probabilidades
 En la etapa de selección
 En la etapa de proyección de los resultados a
toda la población (inferencia estadística)
 En la etapa de evaluación de la precisión y
confianza en las estimaciones
necesaria en el Muestreo? (cont.)
 Probabilidad:
- Es el grado de “confianza” o “creencia” que un

individuo asigna a la ocurrencia de un evento
basándose en la evidencia que dispone ya sea
cuantitativa o personal !!!!!!
necesaria en el Muestreo? (cont.)
 Probabilidad:
- Es un valor numérico entre 0 y 1

Ej: 0.5 o 1/2 en el caso de una cara (o
seca) en el lanzamiento de una moneda
0.1666 o 1/6 en los dados
 Qué son las Probabilidades de inclusión?
 Probabilidad que tiene una unidad de la

población (del marco!) de pertenecer a una
muestra extraída de la misma.
 Toda unidad del marco tiene una probabilidad
de inclusión fijada por el muestrista de
antemano.
 Qué es un Mecanismo Aleatorio?
 Proceso que emplea un método probabilístico

para determinar sucesos
 o proceso que genera eventos al azar y que
no tiene ni memoria ni conciencia
ej: Bolillero, tablas y software que generan
números al azar
 Qué es un Mecanismo Aleatorio?
(cont.)
 No permite ningún “sesgo” o “manipulación”

del seleccionador
 El muestrista busca uno que respete la
asignación de probabilidades propuesta
 Qué es una Muestra al Azar?
 Es una muestra obtenida a partir de aplicar un

mecanismo aleatorio como proceso de
selección o método probabilístico.
 En toda muestra al azar toda unidad de la
población tienen una probabilidad definida y
conocida de estar incluida.
 De esta forma no existe posibilidades de
“sesgos” (solo el azar) y permite hablar de
“representatividad”.
PARTE 3
Muestro Simple al Azar
• Definición • Tasa y Fracción de

• Probabilidades Muestreo
de inclusión • Selección de una
muestra simple al azar
• Ventajas y
• Estimadores
Desventajas
 Qué es una muestra simple al azar ?
 Es aquella que para un tamaño dado
todas las muestras posibles del marco
tienen la misma posibilidad de ser
seleccionadas.
 Lo que permite que cada miembro de la
población tenga igual chance o
probabilidad de ser incluido en una
muestra.
 Probabilidades de inclusión = iguales para
todos!!!!
 Qué ventajas tiene una muestra simple al
azar ?
 Es bien simple de seleccionar.

 Es adecuada cuando la población es
bien homogénea.
 A más grande su tamaño la ley de los
“Grandes Números” asegura la “represen-
tatividad” de los grandes grupos de la
población.
 Poca dispersión geográfica de la
población
 Qué desventajas tiene una muestra
simple al azar ?
 Cuando la población es muy grande.

 Cuando en la población es homogénea de
a grupos, o cuando la variable en estudio
no está distribuido en forma aleatoria en
la población.
 Si se selecciona en forma manual.
 ¿Qué son la tasa y la fracción de
muestreo?
 Los dos términos refieren a la proporción de

población incluida en la muestra uno en
forma porcentual (tasa de muestreo) y la
otra en términos absolutos (fracción de
muestreo). (o sea, 100 x n/N y n/N)
 ¿Cuál es la probabilidad de inclusión de
una unidad en la muestra?
 La probabilidad de inclusión de una unidad

en la muestra es uniforme para todas y toma
el valor de n/N, o sea la fracción de
muestreo.
 ¿A Cuántos representa de la población
una
unidad seleccionada?
 A N/n individuos de la población, o sea la inversa

de la fracción de muestreo.
 Este es el factor de expansión para una muestra
simple al azar.
 Cómo se estima un promedio, una
proporción y un total bajo MSA?
ˆ ( y1  y2  ...  yn )
Pr omedio : y 
n
(i  Mn en la categ. C )
Pr oporción : pˆ 
n
N
Total : tˆy  ( y1  y2  ...  yn )
n
 Cómo se selecciona una muestra simple al
azar ?
 Con la ayuda de una tabla de números al azar.

 Con una calculadora que genere números al azar.
 Con un software (por ej., EXCEL, SAS, SPSS)
 Cómo evalúa la precisión en el MSA?
 Existen distintos termómetros para

evaluar precisión:
1. Desvío Estándar del estimador
2. Varianza del estimador
3. Coeficiente de Variación del estimador
4. Margen de Error
5. Intervalo de Confianza
6. Error Cuadrático Medio
 Qué es el DE y la Varianza del estimador?
 Son dos números en principio desconocidos
que permiten evaluar la calidad de la
estimación y definir el error muestral
 Si la muestra es probabilística se los puede
estimar a partir de la muestra en sí misma.
 Valores pequeños indican buena precisión
 El DE del estimador se mide en la misma
escala que la variable que se está
investigando
 También son insumos para otras medidas de
precisión
 Cómo se estima el “Error Muestral”?
 A partir del desvío estándar estimado con los

datos de la muestra.
2
1 f  s
n
 Cuando tendremos “buena” precisión?
dispersión
débil
2
1 f  s
n
tasa de tamaño de
muestreo muestra
cercana a 1 grande
 Qué es (1-f)?
 Es la corrección por considerar una población

finita
 Se acerca a 0 cuando n/N  1, o sea, cuando la
una encuesta  censo
 En la práctica (1-f) es cercano a 1.
 Cómo estimamos los errores?
2
s
DEˆ ( yˆ )  (1  f )
n
2
s
DEˆ (tˆ)  N 2 (1  f )
n
pˆ (1  pˆ )
DEˆ ( pˆ )  (1  f )
n 1
 Qué es el CV?
 Es otro número o magnitud que en una
escala mas “popular” nos permite hablar de
la precisión en una estimación.
 Su formulación permite relacionar en forma
relativa al DE y la estimación propiamente
dicha. CV=DE/estimación.
 Este termómetro dice que las cosas andan
bien si el valor de CV es < 0.10 y que la cosa
está muy complicada (con respecto a la
precisión) si supera a 0.25
 Qué son los márgenes de error?
 Son dos números que para un tamaño de

muestra y un estimador dado permiten
fijar el % de muestras (sobre todas las
posibles) que me brindan estimaciones
entre los límites que esos números
definen.
 Qué es el “margen de error” ?
95% de las estimaciones

sobre todas las muestras
posibles
Márgenes de Error
 Tamaño de muestra fijo, bajo un mismo diseño muestral y para un porcentaje de

muestras igual a 95%
 Qué es el “margen de error” ?
 Matemáticamente: es la cantidad de error que

se espera con un tamaño de muestra y un
diseño dado a cierto nivel de confianza.
 La ley de las probabilidades determina por
ejemplo que un estimador las 2/3 partes de
las veces dará estimaciones que estarán más
o menos un DE del valor del parámetro; 19/20
veces estará dentro de los 2 DE; 99% dentro
de los + o - 3 desvíos.
 Qué es el “Nivel de Confianza” ?
 Magnitud que señala el % de muestras sobre

todas las posibles que brindan estimaciones
dentro de los márgenes de error fijados.
 Su magnitud está medida en términos
probabilísticos 0.99, 0.95,.. (99%, 95%, etc..)
 Permite construir los intervalos de confianza
 Qué es el “Nivel de Confianza” ? (cont.)
Nivel de Confianza del 95%
Márgenes de Error
El Nivel de Confianza señala de alguna forma el porcentaje de muestras “buenas”

que
nos permitimos
 Algunas consecuencias
 Bajo un mismo tamaño de muestra, un

mismo diseño muestral y aumentando el
nivel de confianza el margen de error
aumenta !!!.
 O sea a tamaño fijo de muestra si quiero
más nivel de confianza decididamente se
necesita perder precisión.
 Márgenes de Error y Nivel de Confianza
Márgenes de Error
para tamaño A
Márgenes de Error
para tamaño B
Márgenes de Error para un mismo nivel de confianza (95%) pero con tamaños de
muestra distintos
 Cómo se estima el “Margen de Error”
para una muestra con tamaño dado?
 A partir del desvío estándar estimado, una

constante que depende del nivel de
confianza y el tamaño de la muestra. Para el
caso de un nivel de confianza del 95% se
tiene:
s
 1.96
n
 Cómo se estima el “Margen de Error”
para una muestra con tamaño dado?
 Si se está estimando proporciones una

aproximación para el margen de error
siempre con un nivel de confianza del 95%
es:
1
c
n
 Qué es un “Intervalo de confianza” al
95%?
 Es un rango de posibles valores para el

valor del parámetro.
 Ese rango se determina fijando un valor
superior y otro inferior a partir del
margen de error deseado.
S
estimación  1.96
n
 Qué es un “Intervalo de confianza” ?
(cont.)
 Nunca sabremos si el parámetro está o no

dentro de ese rango.
 Sólo se puede decir que el intervalo
construido puede ser con un 95% de
confianza alguno de los que corresponde a
una muestra “buena”!!!!
PARTE 4
Cálculo del Tamaño de una Muestra
• Precisión deseada
• Nivel de Riesgo
• Grado de homogeneidad
 De qué depende el tamaño de una muestra?
 De los recursos y del presupuesto: $$$$.

 Del tipo de población en estudio.
 De la variable a estudiar (continua o atributo).
 Del grado de homogeneidad de ésta en la
población.
 Del diseño muestral empleado.
 Del tipo de estimador a emplear.
 Qué se necesita para determinar el tamaño
de una muestra para un promedio o
proporción?
 De 3 elementos importantes:
1. Margen de error deseado.

2. Nivel de Confianza o el de Riesgo, y
la constante asociada a alguno de ellos.
3. Una magnitud de la dispersión o del grado
de homogeneidad de la variable a estudiar.
 Una vez más el “margen de error” ?
 Es el valor máximo permitido entre la futura

estimación y el valor del parámetro
habiendose señalado un “nivel de confianza”.
 Esta vez lo pone el muestrista....
 Su magnitud está medida en las mismas
unidades que la variable en estudio.
 Manifiesta la precisión deseada para la
estimación.
 Qué es el “Nivel de Riesgo” ?
 Es una magnitud que señala la tolerancia

permitida para que la futura estimación esté
fuera de los márgenes de error fijados.
 Lo pone el muestrista....
 Su magnitud está medida en términos
probabilísticos 0.01, 0.05, ... (1%, 5%, etc..)
 Qué es el “Nivel de Riesgo” ? (cont.)
Nivel de Riesgo del 5%
Márgenes de Error
El Nivel de Riesgo señala de alguna forma el porcentaje de muestras “malas” que

nos
permitimos
 Qué es el “grado de homogeneidad”?
 Es la dispersión de la variable en la
población.
 Es una magnitud que señala cuán
diferentes son las unidades de la
población en la variable de estudio.
 Varianza, desvío estándar, Rango
intercuartil, son elementos que dan idea
de esta magnitud.
 Un dolor de cabeza para el muestrista !!!!!
 Relación entre los elementos que
determinan el tamaño de una muestra
n tamaño
de la muestra
Znivel s Dispersión
Constante
c margen
de error
 Y los costos o sea los $$$$ y los recursos ?
 Recordar que la mayor limitación para

definir un tamaño adecuado para una
muestra generalmente es el dinero que se
tiene para llevar a cabo la encuesta !!
 Cómo razono para calcular el tamaño de
una muestra simple al azar para un
promedio o proporción?
 Qué bueno sería que mí muestra sea una de las “buenas”

o sea que mi estimación esté entre las que componen el 95%
de las estimaciones favorables !!

promedio o proporción? (cont.)
 Para esto fijo el máximo valor (C) para la diferencia

entre mi estimación y el valor del parámetro, y a esto
llamo mi margen de error deseado
C C
O sea, (mi estimación - el parámetro) <= c

promedio o proporción? (cont.)
 Tanto para el caso de un promedio (de edad, de

ingreso, de gasto, de bovinos, de horas frente al
televisor) o bien para una proporción (% de
casados, % de niños en jardín de infantes, % de
fumadores) usualmente se acompaña a la
yc p
estimación con el + - el margen de error
promedio o proporción ? (cont.)
 Pero ojo ! este razonamiento sólo me permite decir

que mi muestra me determinará una estimación con el
margen de error deseado con una confianza del 95%,
o sea que existe un “riesgo” del 5% de que sea una de
las muestras “malas”.
 Recordar que todavía no se seleccionó la muestra y
que el azar anda atrás de esto......!!!
 Sólo puedo hablar en términos probabilísticos y el
riesgo siempre existe ... !!!!
promedio o proporción? (Cont.)
 Si usted quiere más confianza y/o más

precisión tendrá que aumentar el tamaño de
la muestra.
 Pero recuerde que esta crece en forma
vertiginosa cuando uno se pone muy
obsesivo con la precisión y el nivel de
confianza !!!!
 Cómo se calcula el tamaño de una muestra
simple al azar para un promedio o una
proporción ?
 .... a través de las fórmulas mágicas que

tiene el muestrista......
 .... o bien recurriendo a un programa de
cálculo como el SPSS.....
 Qué fórmulas?
 Si se está por estimar un promedio
N
n
N c2
1
Z 2S 2
a
N=Tamaño de la Población
c = Margen de error
Z= Constante asociada al nivel de riesgo (1.64 para el 10%
1.96 para 5%, 2.56 para 1%)
S= Desvío estándar de la variable en estudio
 Qué fórmulas? (cont.)
 Si se está por estimar una proporción
NP(1  P) c
n con D
( N  1) D 2  P(1  P) Za
N=Tamaño de la Población
c = Margen de error
Z= Constante asociada al nivel de riesgo (1.64 para el 10%,
1.96 para el 5%, 2.57 para el 1%)
P= un valor a priori de la proporción a estimar
 Qué fórmulas? (cont.)
 O bien si se está por estimar una proporción

pero no se tiene ni idea de P, un tamaño
adecuado es:
1
n 2
c
n =Tamaño de la muestra
c = Margen de error
NOTACION EN EL M.A.S
POBLACION MUESTRA ESTIMADORES
TOTAL
MEDIA
LIMITES DE CONFIANZA
1. LIMITES DE CONFIANZA PARA ESTIMAR
LA MEDIA POBLACIONAL:
2. LIMITES DE CONFIANZA PARA ESTIMAR

EL TOTAL POBLACIONAL:
TAMAÑO DE LA MUESTRA PARA ESTIMAR
EL TOTAL POBLACIONAL
DESPEJANDO n:
SIENDO:
 Qué pasa si no conozco nada de la
dispersión o desvío estándar?
 Por todos los medios hay que hacer una

estimación del desvío estándar
 Usualmente se realiza una encuesta piloto
para determinar una estimación del mismo.
 O se emplea una estimación que proviene de
otra encuesta anterior
 Y como último recurso se puede emplear
alguna aproximación a la distribución de la
variable bajo estudio.
dispersión o desvío estándar? (cont.)
 Si la distribución de la variable se la puede

suponer RECTANGULAR se puede emplear
como aproximación del desvío a:
desvío estándar ~= 0.29*(max(x)-min(x))
Mín Máx

suponer TRIANGULAR NO SIMÉTRICA se puede
emplear como aproximación del desvío a:
Mín Máx Mín Máx


suponer TRIANGULAR SIMÉTRICA se puede
emplear como aproximación del desvío a:
Mín Máx

suponer NORMAL se puede emplear como
aproximación del desvío a:
desvío estándar ~= (max(x)-min(x))/6
Mín Máx
 Pero ojo hay que tener cuidado !!!
 Sólo hay que emplearlas como último

recurso.
 No son de mucha utilidad si
h=(max(x)-min(x))
es muy grande o no se lo puede estimar
con precisión.
 Si h es muy grande conviene estratificar
a la población y aplicar estas
distribuciones en cada estrato.
 No hay que olvidar !!!!
 Que el tamaño de la muestra depende

también de la variable en estudio; o sea
distintas variables nos arrojan distintos
valores para el tamaño de la muestra.
 Cada variable puede tener distinto error
muestral, distinto margen de error y
distinto intervalo de confianza para un
mismo tamaño de la muestra y un mismo
nivel de confianza.
PARTE 5
OTROS DISEÑOS MUESTRALES
• Muestreo • Muestreo por

Sistemático conglomerados
• Muestreo • Muestreo proporcional
Estratificado a tamaño
 Qué es un muestreo sistemático?
 Es otro muestreo que también le asigna

igual probabilidad de inclusión uniforme
para todos, como el simple al azar.
 Nuevamente esta probabilidad es n/N.
 es conveniente por su simplicidad ya que se
necesita sólo un número aleatorio.
 Fácil de seleccionar en campo o durante el
operativo
 Se logra en general una muestra más
“representativa” de la población.
 Qué es un muestreo sistemático? (cont.)
 No es necesario conocer el tamaño de la

población N si se conoce la fracción de
muestreo.
 Origina muestras bien dispersas desde el
punto de vista geográfico.
 Se emplea generalmente en las últimas
etapas en diseños en varias etapas o más
complejos.
 Cómo se selecciona una muestra sistemática?
 Paso 1: Fijar el tamaño de la muestra, n.

 Paso 2: Determinar un paso o
intervalo,I=N/n.
 Seleccionar un número al azar entre 1 y I;
sea ese número igual a k.
 Seleccionar las unidades k, k+I, k+2I, k+3I,
k+4I,...... Hasta llegar a completar las n
necesarias.
1 2 3 N
 Cómo estimo un total, un promedio y una
proporción? Y los errores?
 Para el total, el promedio y una proporción

utilizamos los mismos estimadores que para
MAS
 El problema surge para los errores
 Cómo estimar entonces el D.E.?
 Si la población está en “orden aleatorio”

podemos usar los estimadores de MAS
 Otra solución es mediante el uso de
arranques aleatorios múltiples
 Métodos de replicaciones
 Qué es un muestreo estratificado?
 Es aquel que emplea la información auxiliar

disponible en el marco muestral para crear
estratos o grupos homogéneos en una
población que se sabe heterogénea.
 Estos grupos se diferencian por tener
distinta distribución física o geográfica, o
tener diferencias en los listados, o
diversidad en la naturaleza de los individuos.
 Como consecuencia la población o universo
queda dividido antes de la selección en sub
universos.
 Porqué se estratifica?
 Para lograr homogeneidad en las sub

poblaciones o estratos y por lo tanto
disminuir la dispersión general de la variable
en estudio.
 Para lograr mayor precisión en los
resultados.
 Para disminuir el tamaño de la muestra.
 Para brindar estimaciones en las sub
poblaciones o estratos más importantes.
 Cuando se requiere incrementar la eficiencia
de la muestra por unidad de costo operativo.
 Cuáles son las dificultades más
importantes
dentro del muestreo estratificado?
 La necesidad de contar con un marco que

tenga información auxiliar.
 Dificultad para crear o formar los
estratos.
 Determinar el número óptimo de estratos.
 Obliga a veces a emplear estimadores no
tan simples como en el caso del MSA o
MS.
 Determinar un tamaño de muestra ya que
por lo general se precisa medidas de
homogeneidad o de dispersión para cada
estrato.
 Qué es un muestreo estratificado simple
al
azar?
 Es aquel que emplea como método de
selección en cada estrato un diseño simple
al azar.
 Y para estimar una combinación ponderada
de las estimaciones en cada estrato; en el
caso de un promedio se lo denomina
promedio ponderado.
 Cómo se estima en un MAE? Y los
errores?
H
 El promedio poblacional Yˆest   Wh yˆ h
h 1
 Estimación del error

H 2
s
DEˆ ( yˆ est )  Wh2 (1  f h ) h
h 1 nh
 Cómo construimos los estratos?
 Cuál es la variable de estratificación de los

estratos?
 Cuántos estratos construimos?
 Cuáles deben ser los límites de los estratos?
 Métodos para determinar los límites de
los estratos
 Dominios mutuamente excluyentes

 Regla de Dalenius-Hodges
 Regla de Ekman
 Regla de Mahalanobis-Hansen-Hurvitz
 Regla de Take all-Take some
 Regla de los cuantiles
 Regla de Dalenius-Hodges
 Paso 1: dividir la población en intervalos
Y: 0,0,...,0,1,1,...,1,...,99,...,99,100,100,...,100
y y
0-5 51-55
6-10 56-60
11-15 61-65
16-20 66-70
21-25 71-75
26-30 76-80
31-35 81-85
36-40 86-90
41-45 91-95
46-50 96-100
 Paso 2: calcula f(y) en cada intervalo
y f (y) y f (y)
0-5 3464 51-55 126
6-10 2516 56-60 107
11-15 2157 61-65 82
16-20 1581 66-70 50
21-25 1142 71-75 39
26-30 746 76-80 25
31-35 512 81-85 16
36-40 376 86-90 19
41-45 265 91-95 2
46-50 207 96-100 3
 Paso 3: se crea una variable con el valor
acumulado de la raiz cuadrada de f(y)
y f ( y) y f ( y)
Acum f ( y) Acum f ( y )
0-5 3464 58.9 51-55 126 340.3
6-10 2516 109.1 56-60 107 350.6
11-15 2157 155.5 61-65 82 359.7
16-20 1581 195.3 66-70 50 366.8
21-25 1142 229.1 71-75 39 373.0
26-30 746 256.4 76-80 25 378.0
31-35 512 279.0 81-85 16 382.0
36-40 376 298.4 86-90 19 386.4
41-45 265 314.7 91-95 2 387.8
46-50 207 329.1 96-100 3 389.5
 Paso 4: se divide el total de Acum f ( y) por el

total de estratos deseados,
k  Acum f ( y) / L
 Paso 5: los puntos de división surgen de calcular
k, 1k, ..., (L-1)k
Cómo se asigna la muestra a cada
estrato?
 Dos son los métodos más importantes:

Asignación Proporcional y Asignación
Óptima.
 Asignación Proporcional: nh=n x Nh/N
 Asignación óptima: nh=n x Nh x sh/T,
donde T es la suma de Nh x sh sobre todos
los estratos construidos.
Ganancia del Muestreo Estratificado sobre
el MAS
 Depende de la heterogeneidad entre los

estratos y homogeneidad dentro de los
estratos
H H
Wh Yh  Y   h h
2 2
W S
PROP
GRMAS  h 1
 1 h 1
S2 S2
Cómo se calcula el tamaño de muestra?
 Más complejo que en MAS

 Se necesita Sh2 para cada estrato
Con asignación proporcional  h h

W S 2
n  1.962 h
c2
Con asignación óptima  h h

(W S ) 2
n  1.962 h
c2
Qué son los muestreos multietápicos (MM)?
 Selecciona una muestra en 2 ó más etapas

sucesivas
 Existen distintos tipos de unidades: UPM,

USM, ... y unidades elementales (UE)
 La probabilidad de selección de la UE es el
producto de las p. de selección de las UM en
cada etapa
Y los muestreos por conglomerados (MC)?
 Un conjunto de unidades muestrales se llama

conglomerado
 El muestreo de conglomerados supone la
selección de dichos grupos
 En MM sólo la última etapa puede tener
conglomerados ó UE, las otras sólo
conglomerados
 Se requieren conglomerados heterogéneos
Cuáles son las ventajas de éstos diseños?
 No es necesario un marco de todas las

unidades elementales
 Permite cubrir grandes áreas a bajo costo
 Descentraliza actividades
Y las desventajas?
 El MC es menos preciso que el MAS (excepto

con conglomerados heterogéneos, poco usual
en la práctica!!!)
 Cuando se tiene un pequeño número de
grandes conglomerados la precisión
disminuye
 Estimadores complejos
Muestreo de conglomerados en 1 etapa
 Se considera una selección usando MAS

Ni
M
Estimador del total: tˆCong1 
m
 T  MT
i 1
i i
2 (1  f I ) 2
ˆ
Estimador del error: DECONG (tˆCong1 )  M
2
st
m
 i i
(T  T ) 2
f  m
st 
2 I M
m 1
Qué es el coeficiente de homogeneidad?
 Mide el efecto de conglomeración o similitud

entre los elementos del conglomerado
 Puede variar entre –(M-1)/(N-M) y 1
2
S
  1 yW
2
S y
Cómo solucionar las “ineficiencias”?
 Seleccionar más conglomerados: aumenta el

costo!!!
 Incorporar estratos o post estratos
 Incorporar distintos niveles de información
auxiliar
Muestreo de conglomerados en 2 etapas
 Controla costos
 Incrementa el número de conglomerados
 En lugar de considerar los Ti, se los estima
utilizando una muestra en los conglomerados
seleccionados
 Se suma otra componente del error, la de la
segunda etapa
Qué es el Muestreo con Probabilidad
Proporcional al Tamaño? (PPT)
 Para mejorar la eficiencia muchas veces se

estratifica
 Pero esto no funciona con unidades con gran
variabilidad
 Cuando las unidades poseen valores grandes
es más adecuado usar probabilidad de
selección que dependa del tamaño
 Se reduce la varianza si el tamaño y la
variable en estudio están relacionadas.
En qué consiste el PPT?
 Seleccionar unidades con probabilidad de

inclusión k proporcional a

N
pk  zk z
k 1 k
 La ponderación será wk= k-1
 Para que sea eficiente los tamaños deben ser

precisos
Selección con o sin reemplazo
 La selección con reemplazo es más facil de

seleccionar y de obtener estimadores
 El PPT sistemático es un método sin

reemplazo las propiedades de un con
reemplazo
Cómo es el PPT sistemático?
 Se define el Intervalo muestral q=Tz/n

 Seleccionar un número al azar q0 de [1,q]
 Los n elementos de la muestra son:
q0, q0+q, q0+2q,..., q0+(n-1)q,
 La probabilidad de inclusión del elemento k

es k=npk
Ejemplo de un muestreo PPT sistemático
 Se quiere estimar el gasto total de las

empresas y se selecciona una muestra de
tamaño 2
Empresa Ventas (miles) Tamaño Rango Gastos

1 50 50 1-50 26000
2 1000 1050 51-1050 470000
3 125 1175 1051-1175 63800
4 300 1475 1176-1475 145000
5 500 1975 1476-1975 230000
6 25 2000 1976-2000 12500
(Cont)
 q=Tz/n=2000/2=1000
 q0=69
 Muestra: 69, 1069. Los elementos
seleccionados son
Empresa yk (Gastos) zk (Ventas) Pk yk/pk 1/n*yk/pk

2 470000 1050 1050/2000 895238 447619
3 63800 125 125/2000 1020800 510400
(Cont)
 La estimación del total es:
1 n yk
YˆHH    447619  510400  958019
n k 1 pk
 La estimación del error es:
2
1 n
 yk 
var(YˆHH )   
n(n  1) k 1  pk
 YHH   3941453961
ˆ

Otras Fuentes de Error en Encuestas
Error Total = Error Muestral + Error No-Muestral

Errores no Muestrales
Errores de no respuesta Errores de Medida
Errores de no-respuesta: miembros de la población a

encuestar no están disponibles ó se niegan a responder.
Errores de Medida: respuesta incorrecta.

Opciones para el Tratamiento de la No-Respuesta
 Ignorarla.
 Prevenirla (reducir el número de no respondentes).
 Sustitución.
 Tomar una sub-muestra de los norespondentes.
 Usar un modelo para predecir valores para los no
respondentes:
A - Ajustar Pesos.
B - Imputar.
Errores de No respuesta
No respuesta Total No respuesta Parcial

(unidad de (ítems de
no respuesta) no respuesta)
ENCUESTAS POR PANEL
 Definición: Una muestra en donde a los individuos se los
interroga al menos 2 veces se la llama panel.
 permiten el estudio de cambios individuales, frecuencias de

cambio, investigar la dinámica de las causas y sus
relaciones.
 permite brindar estimaciones acerca de un cambio bruto
detrás de un cambio neto.
Ej: cálculo de un índice de precios tiene ésta característica: si N

es el número de productos yP el precio del producto i a la fecha
i
t
1 N Pit
o tiempo t, se puede definir al índice It1,t  N 
i Pi
t1 que se lo puede
1 N
Pit
estimar por It1,t  n Pt1 si la muestra es de tamaño n.
ˆ
i i
Iˆt1,t
 Es evidente que, por construcción de , es necesario
constituir un panel de productos para poderlo estimar.

Muestreo Curso 01

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Muestreo Curso 01

Transféré par

Droits d'auteur :

Formats disponibles

TEORÍA Y PRÁCTICA

Una Primera Aproximación

EXPOSITOR: Ing. César Verano Serruto

• Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

• Moda Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.

Es el valor que divide al conjunto de datos en dos

Si n es par : Me = [X(n/2) + X((n/2) +1)]/2

x(n/2) Valor central x((n/2)+1)

Valor que se repite con más frecuencia en un

Hallar la moda de los siguientes números:

3, 3, 3, 3, 5, 6, 8, 4, 20, 37, 37, 50, 50, 50

En este caso la moda es:

– Diferencias individuales en el conocimiento de la materia.

• ¿Podría haber otras razones (fuentes de variabilidad)?

– Dormir poco el día del examen, el croissant estaba envenenado...

– El examen no es una medida perfecta del conocimiento.

• Amplitud o Rango (‘range’):

– No es tan sensible a valores extremos.

– Es sensible a valores extremos (alejados de la media).

– Sus unidades son el cuadrado de las de la variable. De

• Cierta distribución que veremos más

completamente determinada por la

– A una distancia de una desv. típica de la media 10

– Es frecuente mostrarla en porcentajes

• Es una cantidad adimensional. Interesante para comparar la

• No debe usarse cuando la variable presenta valores negativos o donde

Dado un conjunto de valores de cierta variable X,

xmax : mayor valor de la variable X.

xmin: menor valor de la variable X.

Recorrido = xmax – x min

DESVIACION MEDIA POBLACIONAL:

Xi = observación de la variable X (i=1,2,....,N)

DESVIACION MEDIA MUESTRAL:

Varianza y desviación estándar poblacional:

Varianza y desviación estándar muestral

• Encuestas por • Marcos Muestrales

 Colección de todas la posibles

 Es un subconjunto de la población que

 Es el acto, proceso o técnica que permite

 No se interesa en las unidades que están

• Posibilidades de selección para cada

Parámetro: Es una cantidad numérica calculada sobre una población

La idea es resumir toda la información que hay en la población en

Estadístico: Ídem (cambiar población por muestra)

Si un estadístico se usa para aproximar un parámetro también se

Normalmente nos interesa conocer un parámetro, pero por la

La calidad de un estimador se evalúa por dos propiedades:

Entonces un estimador será insesgado cuando: E (aˆ )  a  b

2. Debe ser consistente

d. Varianza de los estimadores

Que se define por:

V (aˆ )  Eaˆ  E(aˆ ) 2

V (aˆ )   aˆ  E (aˆ ) .P(muestra)

3. Determinar los métodos de recolección

 El método de selección emplea la teoría de

 La teoría estadística sustenta al muestreo

 No existen sesgos de selección.

 Muestreo simple al azar

 El método de selección no emplea la

 Con fines descriptivos

- estima ciertas características o atributos

 Con fines analíticos

 Es el estudio o la enumeración completa de