Académique Documents
Professionnel Documents
Culture Documents
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Programa de Capacitacin
en Investigacin Cientfica 2016
MDULO II.
ESTADSTICA PARA LA INVESTIGACIN I
Del 30.04.2016 al 21.05.2016
Pgina 1
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
RESUMEN
El presente trabajo titulado Estadstica para la investigacin tiene como
propsito fundamental presentar a los investigadores en todas las ramas del
quehacer cientfico, la forma como la ciencia estadstica hace ms eficientes los
procesos de investigacin.
Partiendo de una reflexin sobre el concepto de Estadstica, examinamos el
papel que esta disciplina juega en la investigacin cientfica, desde el
planteamiento del problema, la formulacin de la hiptesis, el diseo del tamao
de la muestra, as como las tcnicas estadsticas que resultan tiles en la
investigacin con enfoque cuantitativo y, en particular, en la fase de anlisis
descriptivo de datos. Consideramos tambin que la estadstica puede ser
empleada en otros momentos del proceso de investigacin. Asimismo, se hace
mencin de los softwares estadsticos disponibles para su aplicacin.
Tambin se argumenta cmo el mtodo cientfico encuentra en los mtodos
estadsticos una herramienta fundamental para alcanzar sus objetivos. Y cmo
la estadstica aporta informacin valiosa a los datos obtenidos de un proceso
de investigacin cuantitativa con el fin de obtener conclusiones ms acertadas.
M. Hurtado S.
Pgina 2
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 3
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 4
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 5
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 6
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
c) Recoleccin de datos
La recogida de datos es una tarea en la que aparentemente no parecen
jugar un papel las tcnicas estadsticas. Sin embargo, la Estadstica est
de manera implcita presente si consideramos el modo en que se elaboran
los instrumentos utilizados para la recogida de datos (tests, cuestionarios,
protocolos de observacin, etc.). A esta disciplina corresponde un papel
crucial en la construccin de tales instrumentos, dado que las tcnicas
estadsticas estn en la base de los procedimientos por los cuales se
analizan sus caractersticas tcnicas. Por citar algunos ejemplos, la
determinacin de la fiabilidad y validez de algunos instrumentos se apoya
directamente en coeficientes de correlacin; la aplicacin de tcnicas de
anlisis de componentes principales o anlisis factorial permite explorar o
confirmar la dimensionalidad de los instrumentos; los mtodos para el
anlisis de tems, en la teora clsica de los tests o en la teora de
respuesta al tem, se basan en correlaciones y en la estimacin de
parmetros recurriendo a diferentes procedimientos estadsticos, tales
como los mtodos de mxima verosimilitud o los mtodos de inferencia
bayesiana; tests como el de chi-cuadrado permiten valorar el grado de
ajuste de las respuestas a los tems a modelos logsticos de uno, dos o
tres parmetros.
Al margen de todo el aparato estadstico que se esconde tras la
elaboracin o el anlisis de los instrumentos de recogida de datos, la
Estadstica puede participar indirectamente en la operacin de recogida
proporcionando primeras elaboraciones de los datos en el momento
mismo de su registro. Por ejemplo, cuando tras aplicar un test se registran
los resultados en forma de percentiles, resultantes de la comparacin de
la puntuacin del sujeto con un grupo normativo.
d) Anlisis descriptivo de datos
En los tiempos actuales del desarrollo de la ciencia, es innegable la
importancia de las tcnicas estadsticas en la fase de anlisis de datos.
Existe un consenso generalizado en que la forma ms adecuada de
razonar sobre la base del gran nmero de observaciones exigidas para un
estudio con pretensin generalizante, es la Estadstica.
De acuerdo con el concepto de Estadstica que hemos presentado
anteriormente, a la Estadstica le corresponden las tareas de organizacin,
descripcin, anlisis y presentacin de datos acerca de las muestras
estudiadas, y tambin de generalizacin de los resultados a las
poblaciones de donde las muestras fueron extradas. El anlisis
estadstico de los datos supone una descripcin de stos, el
descubrimiento de regularidades y la inferencia de caractersticas relativas
a conjuntos ms amplios que los directamente estudiados.
e) Estimacin Probabilstica y Prueba de hiptesis
La estadstica nos proporciona herramientas que formalizan y uniforman
nuestros procedimientos para sacar conclusiones. De alguna forma, las
Manuel Hurtado Snchez
Pgina 7
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 8
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 9
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 10
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 11
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 12
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 13
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 14
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 15
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 16
II.
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
EL MTODO ESTADSTICO
Pgina 17
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Conocimiento
Problema
Hiptesis
Conocimiento
Deduccin de consecuencias
verificables
Diseo de
investigacin
Mtodo Estadstico
1. Planeamiento
2. Recopilacin de datos
3. Organizacin y presentacin de datos
4. Anlisis e interpretacin de resultados
5. Obtencin de conclusiones y preparacin del informe
Realidad
Pgina 18
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 19
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Las tasas de mortalidad por cada mil mdicos fueron comparadas para
averiguar, si parecan existir diferencias significativas, desde el punto de
vista estadstico entre quienes murieron por cncer pulmonar segn el
antecedente de si fumaban o no.
Pgina 20
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
muestra cumple con esta condicin, es decir, cuando nos refleja en sus
unidades lo que ocurre en el universo, la llamamos muestra
representativa. Por lo tanto, una muestra representativa contiene las
caractersticas relevantes de la poblacin en las mismas proporciones
en que estn incluidas en tal poblacin. Sus conclusiones son
susceptibles de ser generalizadas al conjunto del universo, aunque para
ello debamos aadir un cierto margen de error en nuestras
proyecciones.
Las muestras pueden ser clasificadas, en una primera divisin en
probabilsticas y no probabilsticas.
En las muestras probabilsticas, la caracterstica fundamental es que
todo elemento del universo tiene una determinada probabilidad de
integrar la muestra, y esa probabilidad puede ser calculada
matemticamente con precisin. En las muestras no probabilsticas
ocurre lo contrario y el investigador no tiene idea del error que puede
estar introduciendo en sus apreciaciones.
3. Marco Muestral
Un marco muestral es una lista de unidades de muestreo de tal forma
que se pueda seleccionar de all, las unidades que constituirn la
muestra. El marco muestral es indispensable, al menos cuando se trata
de realizar un muestreo probabilstico.
Ejemplos:
La gua telefnica
Padrn de empresas pblicas y privadas
Un plano de la ciudad.
El listado de alumnos.
4. Variable: Es una caracterstica que puede tomar diferentes valores;
Tambin se dice que son caractersticas observables, susceptibles de
adoptar distintos valores o ser expresados en distintas categoras.
Clasificacin de variables
A. Por su Naturaleza
A.1. Cualitativas: Expresan una cualidad de la unidad elemental o
de anlisis. Ej. Lugar de procedencia, Lugar de nacimiento, etc.
A.2. Cuantitativas: Expresan una cantidad, la cual puede obtenerse
mediante procesos de conteo o de medicin haciendo uso de algn
instrumento de medida para dicha variable; por lo que a su vez se
pueden subdividir en:
Pgina 21
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 22
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
E. Por la amplitud
E.1. Individuales: Se refieren a las caractersticas de las unidades
elementales, como por ejemplo personas
E.2. Privadas: Se refieren a las caractersticas de las unidades
elementales que voluntariamente permiten su observacin, por
ejemplo: Coeficiente de inteligencia, Nivel de estrs, etc.
E.3. Pblicas. Se refieren a caractersticas que pueden ser
observadas incluso sin el permiso del individuo, por ejemplo: Sexo,
raza, color de cabello, etc.
E.4. Colectivas: son caractersticas que se refieren a colectivos de
unidades elementales. Ejemplo: Tasa de morbilidad en una
poblacin, inflacin, etc.
Pgina 23
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
CONCEPTO
Variable
Categoras de la Variable:
Terica
A:
C:
B:
D:
Definicin
conceptual
OPERACIONALIZACIN
DIMENSIONES
Definicin operacional
de cada dimensin
INDICADORES
.
Cuadro de
categorizaciones de la
variable principal a partir
de los indicadores
Variable
Emprica
DIMENSIN
(Variable terica)
Nivel
Socioeconmico
(NSE):
Es una caracterstica de un
hogar. El hogar obtiene su
NSE a partir de
caractersticas propias del
mismo y el entorno en que
se mueve. La primera
forma la parte econmica
del NSE y la segunda la
parte socio del NSE.
Adems, el NSE incorpora
tanto caractersticas fsicas
de la vivienda que habita el
hogar, como de las
personas que integran al
hogar.
INDICADOR
(Variable Emprica)
I5: Turismo
I6: Ingreso econmico familiar
mensual
Valores o
cualidades
Nmero
Ninguno, Br., Mg.,
Dr.
Gerente, , obrero
eventual o ambulante
Urb. Santa Victoria,
, P.J. El Bosque
Turismo Internacional,
Turismo nacional,
Turismo local,
No hace turismo
En nuevos soles
En nuevos soles
Uso particular del ao
Uso Partic. No del ao
Para trabajo
Pgina 24
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
1. Nivel Alto A1: En esta categora se encuentran las personas que tienen un nivel de
estudios Superior / post-grado, con un promedio en aos de estudios de 17.5. Estas
personas ocupan cargos de Gerentes Generales cuyo ingreso es de $5000. Y tienen
un gasto promedio mensual de $750 en alimentos. En servicios de televisin a control
remoto es al 100% de igual manera en tenencia de telfono y servicios domsticos.
2. Nivel Medio Superior A2: En esta categora se encuentran las personas con un nivel
de estudios Superior Universitarios, con un promedio de aos de estudios de 16.8.
Estas personas ocupan cargos profesionales independientes / dependientes, con un
ingreso familiar mensual ms de $2000, y tienen un gasto promedio mensual de $450
en alimentos, tienen televisin a control remoto, tienen telfono y servicio domstico.
3. Nivel Medio Tpico B1: En esta categora se encuentran las personas con un nivel de
estudios Superior Universitario, con un promedio en aos de estudios de 16.7. Estas
personas ocupan cargos profesionales independientes / dependientes. Con un ingreso
familiar mensual ms de $1000, y tienen un gasto promedio mensual de $280 en
alimentos. En servicios de tenencia de televisin a control remoto es de 92% en
tenencia de telfono es de 96% y en servicios domsticos es de 67%.
4. Nivel Medio Inferior B2: En esta categora se encuentran las personas con un nivel de
estudios Universitario y no Universitario, con un promedio en aos de estudios de 15.1.
Estas personas ocupan cargos especializado/ profesional independiente. Con un
ingreso familiar mensual ms de $780, y tienen un gasto promedio mensual de $235 en
alimentos. En servicios de tenencia de televisin a control remoto es de 82% en
tenencia de telfono es de 92% y en servicios domsticos es de 32%.
5. Nivel Bajo Superior C1: En esta categora se encuentran las personas con un nivel de
estudios Superior no Universitario/ Secundaria, con un promedio en aos de estudios
de 13.1. Estas personas ocupan cargos pequeos Comerciantes/ Trabajo especializado
Con un ingreso familiar mensual ms de $400, y tienen un gasto promedio mensual de
$180 en alimentos. En servicios de tenencia de televisin a control remoto es de 77%
en tenencia de telfono es de 73% y en servicios domsticos es de 8%.
6. Nivel Bajo Inferior C2: En esta categora se encuentran las personas con un nivel de
estudios Secundaria, con un promedio en aos de estudios de 10.6. Estas personas
ocupan cargos pequeos Comerciantes/ Trabajo especializado Con un ingreso familiar
mensual ms de $320, y tienen un gasto promedio mensual de $150 en alimentos. En
servicios de tenencia de televisin a control remoto es de 61% en tenencia de telfono
es de 56% y en servicios domsticos es de 2%.
7. Nivel Muy Bajo D: En esta categora se encuentran las personas con un nivel de
estudios Secundaria/ Primaria, con un promedio en aos de estudios de 8.8. Estas
personas ocupan cargos como Empleado poco especializado/ Obrero con un ingreso
familiar mensual ms de $230, y tienen un gasto promedio mensual de $135 en
alimentos. En servicios de tenencia de televisin a control remoto es de 42% en
tenencia de telfono es de 25% y en servicios domsticos es de 1%.
1
Nivel Bajo Extremo E: En esta categora se encuentran las personas con un nivel de
estudios Primarios, con un promedio en aos de estudios de 6.2. Estas personas
ocupan cargos como Obrero eventual/ Ambulante con un ingreso familiar mensual ms
de $150, y tienen un gasto promedio mensual de $105 en alimentos. En servicios de
tenencia de televisin a control remoto es de 16% en tenencia de telfono es de 7% y
en servicios domsticos es de 0%.
Pgina 25
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
A1
A2
B1
B2
C1
C2
Alto
Medio superior
Medio Tpico
Medio
inferior
Bajo superior
Bajo inferior
Muy Bajo
Bajo Extremo
3.5
6.5
8.8
10.9
21.5
36.1
11.9
% de hogares en Lima
0.8
Metropolitana
Educacin del jefe del Superior
universitaria /
hogar
Postgrado
Superior
universitaria
Superior
universitaria
16.7
Profesional
Independiente /
Dependiente
Superior
universitaria /
no
universitaria
15.1
Trabajador
especializado
/ Profesional
Independiente
Superior no
universitaria /
secundaria
13.1
Pequeo
comerciante /
Trabajador
Especializado
Secundaria
Secundaria
/ Primaria
Primaria /
Secundaria
10.6
8.8
6.2
Pequeo
comerciante /
Trabajador
Especializado
Empleado
poco
especializa
do / Obrero
Obrero eventual
/ ambulante
+ us$ 5,000
+ us$ 2,800
Us$ 1,000
Us$ 780
Us$ 400
Us$ 320
Us$ 230
Us$ 150
Us$ 750
Us$ 450
Us$ 280
Us$ 235
Us$ 180
Us$ 150
Us$ 135
Us$ 105
100%
100%
92%
82%
77%
61%
42%
16%
100%
100%
96%
92%
73%
56%
25%
7%
100%
Del ao
100%
De 1 ao
67%
De 3 aos
32%
De 4 aos
8%
2%
1%
0%
IV.
Tcnicas estadsticas descriptivas
Las tcnicas estadsticas descriptivas permiten conocer, representar y
cuantificar el comportamiento de un conjunto de datos de una o ms
variables.
Datos sin agrupar
Datos agrupados
Tablas de frecuencia y grficos
Medidas de resumen:
Medidas de tendencia central, de dispersin, y de correlacin
Las tcnicas descriptivas parten de una base de datos, tal como se presenta
en la siguiente tabla N 1. El anlisis descriptivo se inicia con la organizacin
de los datos en tablas de frecuencias y su correspondiente representacin
Pgina 26
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Jefe de
hogar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
1.
Chiclayo
=1
Lambayeque= 2
Ferreafe = 3
Cajamarca = 4
Piura
=5
Otros
=6
1
1
6
1
2
1
1
1
1
2
1
1
3
1
1
2
4
1
1
2
1
4
2
1
1
1
3
1
1
2
1
1
2
1
1
5
1
3
1
6
N Personas
por hogar
Edad
(aos)
Peso
(Kgr.)
Cuenta
1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4
3
5
4
3
3
4
5
4
3
5
3
3
4
3
4
6
2
5
2
6
42
39
35
41
50
39
33
30
26
32
35
26
43
40
30
46
47
38
38
45
28
43
37
36
40
32
38
49
54
31
33
44
43
25
31
34
34
36
35
36
66.6
59
69.2
73
66.3
58.6
67.5
66.1
63.1
55.8
69.1
53.9
64.4
72.2
64.4
68.1
73.2
60.5
66.4
61.9
69.1
57.9
62.7
65.7
63.8
71.6
52.4
61.9
58.8
67
63.8
73.4
61.3
61.3
66
69.8
71.1
76.9
67.2
65.9
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Pgina 27
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 28
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
N de jefes de
hogar
25
7
3
2
1
2
40
Proporcin de
jefes de hogar
0.625
0.175
0.075
0.05
0.025
0.050
1
% de jefes de
hogar
62.5
17.5
7.5
5.0
2.5
5.0
100
Total
40
%
Acumulado
de
hogares
5.00
22.50
52.50
77.50
92.50
100.00
N
Acumulado
de
hogares
40
38
31
19
9
3
%
Acumulado
de
hogares
100
95
77.5
47.5
22.5
7.5
100
Pgina 29
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Donde
es en nmero de datos
Donde:
[ ] : Significa que el cociente R es redondeado al menor mayor entero,
m
R 25
C 5
m 5
R 28
C 5.6 6
m 5
R 27
C 5.4 6
m 5
R 25
C 3.571 3.6
m 7
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Mximo
Mnimo
)[
)[
C=5
C=5
)[
C=5
C=5
R=25
Mnimo
)[
)[
C=7
Mximo
)[
C=7
C=7
C=7
m.C=28 > R
m.C R
Mn
2
Mn
m.C R
2
)
)
)
)
Pgina 31
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo Usando los datos de la base que aparece en la tabla N 1, construya una
tabla de frecuencia para la variable edad.
1 Paso: Determinacin del Rango
R = Mximo Mnimo = 54 25 = 29
2 Paso: Clculo del nmero de clases m
Usaremos la regla de Sturges: m 1 3.322 Log (n) 1 3.322 Log (40) 6.32 6
3 Paso: Clculo de la amplitud de clase C.
R 29
C 4.8 5
m 6
Mnimo=25
)[
C=5
ooooooo
C=5
m.C=30 > R=29
Mximo=54
C=5
Mn m.C 25 6 x5 55
Pgina 32
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
%
Acumulado
de jefes
de hogar
N
Acumulado
de jefes
de hogar
%
Acumulado
de jefes
de hogar
[ 25 - 30)
0.10
10
10
40
100
[30 - 35)
10
0.25
25
14
35
36
90
[35 - 40)
12
0.30
30
26
65
26
65
[40 - 45)
0.20
20
34
85
14
35
[45 - 50)
0.10
10
38
95
15
[50 - 55)
0.05
40
100
40
100
Total
2.
Grficos Estadsticos
Pgina 33
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 34
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 35
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
3. Medidas de Resumen
El clculo de las medidas de resumen de una variable constituye la
segunda etapa de un anlisis descriptivo. Su propsito es cuantificar
diversas caractersticas de una variable cuantitativa, tales como las
medidas de posicin, tendencia central, dispersin, deformacin y
correlacin.
Medidas de Posicin:
Moda [Mo]:
La Moda es el dato que ms se repite. Aqu se presentan distintas
situaciones:
Un conjunto de datos no necesariamente tiene que tener una moda,
podra suceder que todos los datos tengan el mismo nmero de
repeticiones, en tal caso no existir moda
Un conjunto de datos podra tener una o ms modas. Si tuviera una sola
moda entonces la distribucin sera unimodal, si tuviera dos modas
entonces sera bimodal y si tuviera ms de una moda, entonces sera
multimodal.
CASO: DATOS ORIGINALES O SIN AGRUPAR
Ejemplo:
Considere los siguientes datos que representan el nmero de personas
por hogar
Nmero de personas por hogar
1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4
3
5
4
3
3
4
5
4
3
5
3
3
4
3
4
6
2
5
2
6
Pgina 36
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 37
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo
Considere los puntajes obtenidos en la prueba de conocimientos por los
261 postulantes a la Academia de Diplomticos del Per en el proceso
de admisin 2015. Los datos se presentan en la siguiente tabla N 5.
Se aprecia aqu que:
Frecuencia modal es igual a 54 ( = 54 )
Intervalo de la clase modal: [11.375 12.500)
Lmite Real Inferior LRI = 11.375
Frecuencia anterior a la modal: = 50
Frecuencia posterior a la modal: = 43
Amplitud de clase C = 12.500 11.375 = 1.125
Con lo cual se obtiene: 1 = 54 50 = 4
2 = 54 43 = 11
Por lo tanto la moda ser obtenida as:
4 1.125
= 11.375 +
= 11.675
4 + 11
Pgina 38
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
N de estudiantes
18
30
20
30
12
Pgina 39
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
40 - 44
45 - 49
Total
fmo = 30
8
2
120
LRI
19 20
19.5
2
C = 24.5 19.5 = 5
1 = 30 18 = 12
2 = 30 20 = 10
M o (1) LRI
1 C
12 5
19.5
19.5 2.727 22.227 aos
1 2
12 10
LRI
29 30
29.5
2
C = 34.5 29.5 = 5
1 = 30 20 = 10
2 = 30 12 = 18
M o (2) LRI
1 C
10 5
29.5
19.5 1.786 31.286 aos
1 2
10 18
Note que en este caso las clases modales o con la ms alta frecuencia absoluta
simple, se encuentran separadas, conteniendo cada una de ellas una moda, por
Manuel Hurtado Snchez
Pgina 40
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo 5. Consideremos ahora que las dos clase con las mximas
frecuencias estn juntas una a continuacin de la otra
Tabla N 3 Edad de estudiantes universitarios de la escuela de Estadstica
UNPRG, a Octubre del 2012.
Edad (aos)
15
20
25
30
35
40
45
19
24
29
34
39
44
49
Total
fmo = 30
N de estudiantes
18
30
30
20
12
8
2
120
LRI
19 20
19.5
2
C = 24.5 19.5 = 5
1 = 30 18 = 12
2 = 30 30 = 0
M o (1) LRI
1 C
12 5
19.5
19.5 5 24.5 aos
1 2
12 0
LRI
24 25
24.5
2
C = 34.5 29.5 = 5
1 = 30 30 = 0
2 = 30 20 = 10
M o (2) LRI
1 C
05
24.5
24.5 0 24.5 aos
1 2
0 10
Pgina 41
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Note que aun cuando en este caso existen dos clases con la ms alta
frecuencia, es decir dos clases modales, sin embargo, la distribucin
es Unimodal, debido a que ambas clases estn una a continuacin de
la otra, en este caso la moda se ubica en el lmite real entre las dos clases
modales.
Mediana[Me]:
Es el dato que ocupa el lugar central en una serie ordenada de datos.
X1 X2 X3 X4 . . . . . . . . . . . . . . . . . . . Xn
50 %
50 %
Me
M e X n 1
Pgina 42
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
2 Paso:
= (9+1) = 5 = 7
2
1
Cuando n es par: M e X n X n 2
2 2
2
2 Paso:
Me
1
1
1
X 10 X 102 X 5 X 6 7 8 7.5
2 2
2
2
2
N i 1 C
2
M e LRI
ni
Donde:
n
= nmero total de datos
n
= Identificador de la clase de la mediana en la columna de las
2
frecuencias absolutas acumuladas menor o igual que
LRI = Lmite real inferior de la clase de la mediana
Manuel Hurtado Snchez
Pgina 43
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
C
ni
= Amplitud de clase
= Frecuencia absoluta simple de la clase de la mediana
Ni1
Demostracin
Para la siguiente Tabla de datos:
Frecuencia
i
Intervalo
absoluta simple:
ni
1
A: [
,
)
n1
2
B: [
,
)
n2
3
C: [
,
)
n3
4
D: [
,
)
n4
5
E: [
,
)
n5
Total
n
Frecuencia absoluta
acumulada menor que:
Ni
N1
N2
N3
N4
N5
= 2
Pgina 44
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
( 2 1 )
= +
(2 1 )
Pgina 45
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
n 80
40 la clase de la mediana ser [16 18]
2 2
LRI
15 16
15.5
2
C 3
ni 27
Ni1 37
80
37 3
9
2
M e 15.5
15.5
15.83
27
27
M e 15.83 Kgrf / cm 2
Pgina 46
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
25%
Q1
25%
Q2
50%
25%
Q3
Me
50%
q2
q3
20%
q4
Pgina 47
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
10%
D1
10%
D2
10%
D3
D4
10%
10%
D5
10%
D6
10%
D7
10%
D8
10%
D9
Pgina 48
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
in
Fi 1 C
100
Pi LRI
fi
Donde:
i n
fi
Fi1 = Frecuencia absoluta acumulada menor igual que hasta la clase anterior a la
clase del percentil i
Pgina 49
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
15 n 15 260948
39142 .2 La clase de P15 es: [5 9]
100
100
LRI
45
4.5
2
C 5
ni 21540
Ni1 21842
15 260948
21842 5
100
P15 4.5
8.52
21540
85%
15%
P15
100
100
LRI
49 50
49.5
2
C 5
ni 13060
Ni1 210938
83 260948
210938 5
100
P83 49.5
51.66
13060
83%
17%
P83
Pgina 50
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
x x2 ... xn
x 1
x
i 1
Pgina 51
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
x n
i i
i 1
n
m
x xi hi
i 1
donde:
hi
ni
n
Xi : 4, 5, 3, 8, 6, 5, 6, 5, 4, 5 .
Notemos que el nmero de microempresas es n = 5
La media aritmtica ser:
=
+ + + + + + + + + +
=
= .
= .
Pgina 52
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Nmero de microempresas: ni
1
2
4
2
1
10
x
i 1
3 1 4 2 5 4 6 2 8 1 51
5.1
10
10
Nmero de empresas: ni
Xi * ni
1
2
4
2
1
3
8
20
12
8
51
Pgina 53
__
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 54
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Algunos vicios
aritmtica:
Se dice por ejemplo que si una persona gana un milln y otra nada, la
"media aritmtica" establece que las dos han ganado medio milln, lo
cual no es verdad. Este argumento parece suficiente para desvirtuar una
disciplina, puesto que: si no sabe hacer algo tan sencillo cmo es
posible que sea capaz de resolver problemas ms complejos?. Veamos
otro ejemplo, Si un soldado que dispara sobre un blanco una vez medio
metro a la derecha y otra medio metro a la izquierda, la media establece
que dicho soldado en promedio ha tenido un acierto en los dos disparos
al blanco, lo cual tampoco es verdad.
Podemos darnos cuenta fcilmente que el clculo de la media es una
operacin estrictamente matemtica y que en un sentido estricto lo que
falla en los ejemplos es la interpretacin de un resultado aritmtico. Una
de las caractersticas de la Estadstica es precisamente analizar la
validez de los resultados. Para que este ejemplo pueda abandonar el
mbito de las matemticas y pasar al terreno de la Estadstica es
necesario que se establezca alguna medida de la representatividad, de
la validez, del resultado que se presenta. Es evidente que la media
aritmtica en estos ejemplos esta afectada por una escasa
representatividad.
Media armnica: Cuando los datos corresponden a velocidades, es decir cuando
expresan cantidad de desplazamiento por unidad de tiempo, la media que
corresponde es la media armnica, la cual viene expresada en las siguientes
frmulas, tanto para datos sin agrupar, como para datos agrupados:
xH
n
n
i 1 xi
xi 0
Pgina 55
xH
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
n
Para datos agrupados en m-clases, xi 0
ni
i 1 xi
m
Note que en esta clase de promedio, todos los valores de la variable deben ser
diferentes de cero.
Ejemplo 1. Durante la primera semana de vigencia del control del lmite de
velocidad de vehculos de transporte pblico, se instala en dos puntos de una
carretera, separados por una distancia de 30 Km, una cmara que registra los
instantes de salida del primer punto y los de llegada al segundo punto de cada
unidad mvil, encontrando las siguientes tiempos en una muestra de 8 vehculos
en minutos. Cul ser la velocidad promedio de este grupo de vehculos?
2 Ley de Newton:
Vehculo
1
2
3
4
5
6
7
8
Total
Velocidad = Espacio/Tiempo
Tiempo
Tiempo
Tiempo
(min. y Seg.)
(minutos)
(horas)
22'30"
18'45"
18'
30'
22'30"
18'
15'
12'
22.50
18.75
18.00
30.00
22.50
18.00
15.00
12.00
0.375
0.3125
0.300
0.500
0.375
0.300
0.250
0.200
2.6125
V (Km / H)
80
96
100
60
80
100
120
150
786
1/V
0.012500
0.010417
0.010000
0.016667
0.012500
0.010000
0.008333
0.006667
0.087083
Concepto Estadstico
Promedio Armnico =
91.866 Km/H
Concepto fsico
Veloc. Media = (Espacio total/Tiempo total)=
Espacio total =
Tiempo Total =
91.866
240 Km
2.6125 Horas
Pgina 56
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
xH
n
n
x
i 1
8
91.866 Km / h
0.087083
V 786
V i
91.25 Km / h
n
8
Podemos apreciar que este resultado no coincide con el concepto fsico, por lo cual
concluimos que en este caso, para obtener la velocidad media, la media aritmtica
falla, y en su lugar se debe utilizar el promedio armnico
Ejemplo 2. Considere que un colectivo de transporte pblico, recorre una distancia
total de 20 Km, que es la distancia que existe entre sus paraderos de dos ciudades
conectadas por la carretera panamericana norte, su recorrido lo hace a diferentes
velocidades, de acuerdo a la zona de desplazamiento: en el primer tramo de 2 Km
se desplaza a una velocidad de 25 Km/H, en el segundo tramo de 4 Km, se
desplaza a una velocidad de 50 Km/H, en el tercer tramo de 10 Km, se desplaza a
una velocidad de 100 Km/H, en el cuarto tramo de 3 Km, se desplaza a una
velocidad de 40 Km/H y en el ltimo tramo de 1 Km, se desplaza a 20 Km/H.
Deseamos conocer cul ser la velocidad promedio.
Tramo
1
2
3
4
5
Total
Longitud (Km)
(ni)
Velocidad
(Vi )
2
4
10
3
1
20
25
50
100
40
20
235
(Km/H)
ni / Vi
(tiempo en Horas)
0.08
0.08
0.1
0.075
0.05
0.385
Pgina 57
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
VH
n
20
51.9481 Km / h
ni 0.385
i 1 Vi
n
51.9481 Km / h
tiempo total utilizado
0.385 Horas
Nota importante:
Si se hubiera utilizado la media aritmtica se hubiera obtenido el siguiente resultado:
V 236
V i
47 Km / h
n
5
Podemos apreciar que este resultado no coincide con el concepto fsico, por lo cual
concluimos que en este caso, para obtener la velocidad media, la media aritmtica
falla, y en su lugar se debe utilizar el promedio armnico
xG n
x
i 1
xG n
x
i 1
ni
i
xi 0
xi 0
Note que en esta clase de promedio, todos los valores de la variable deben ser
diferentes de cero.
Pgina 58
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Para verificar este resultado consideremos que la empresa tiene un capital inicial
de 20000 nuevos soles, entonces este capital con las tasas de crecimiento
indicadas, debe haberse convertido en:
nuevos soles
60 %
n
4
4
Para verificar si este resultado es el correcto, veamos nuevamente si el capital de
la empresa al final del 4 ao, es estimado con esta tasa promedio:
Medidas de dispersin:
Miden el grado discrepancia o de diferencias entre los datos. Una medida de
dispersin siempre debe acompaar a un promedio para asignarle un grado de
importancia a esta medida en su funcin de representar al conjunto de datos.
Desviacin estndar.
Mide el grado de dispersin de los datos respecto al valor promedio en
unidades absolutas.
x X
N
DE( x)
i 1
Pgina 59
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
x x
n
de( x)
i 1
n 1
s2 s
Coeficiente de variacin.
Mide el grado de dispersin relativo de los datos respecto a su valor
promedio. Sirve para comparar el grado de dispersin entre dos o ms
variables.
Coeficiente de variacin poblacional:
CV ( x)
cv( x)
DE( x)
100
X
de( x)
100
x
Nota:
Cuando CV(x) < 33% : Distribucin homognea
Cuando CV(x) 33% : Distribucin heterognea
Coeficiente de Curtosis
Este coeficiente permite medir el grado de elevacin o apuntamiento de la
distribucin con respecto a una distribucin normal estndar.
Al igual que para el caso del coeficiente de asimetra, existen diversas
frmulas para calcular el coeficiente de curtosis:
1. En funcin de los percentiles: k
4
3
4
Donde:
n
( x x)
i 1
Pgina 60
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
n
(x
i 1
x) 4
( x x)
i 1
( xi x)
i 1
Nota:
Cuando K < 0 : Distribucin platicurtica
Cuando K = 0 : Distribucin mesocurtica
Cuando K > 0 : Distribucin leptocurtica
Xi
ni
15 19
20 24
25 29
30 34
17
22
27
32
3
12
16
10
Ni
3
15
31
41
Xi. Ni
(Xi-u)^2*ni
51
264
432
320
396.75
507.00
36.00
122.50
(Xi-u)^3*ni
-4562.625
-3295.5
-54.00
428.75
(Xi-u)^4*ni
52470.1875
21420.75
81.00
1500.625
Pgina 61
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
35 39
40 44
37
42
5
3
46
49
185
126
361.25
546.75
3070.625
7381.125
26100.3125
99645.1875
45 49
47
50
47
342.25
6331.625
117135.0625
9300
318353.125
Total
50
1425
2312.50
Media aritmtica:
x n
i i
i 1
1425
28.5 aos
50
V ( x)
(x
i 1
x) 2 ni
n
2312 .5
46.25 aos2
50
aos
CV ( x)
0.2386 23.86%
x
28.5 aos
CA( x )
3
9300 / 50
186
0.59 0
3
3
6.80074 314.534664
Al ser el coeficiente de asimetra mayor que cero, nos indica que existe
una asimetra positiva, que la mayor cola del polgono de frecuencias
est en el lado derecho
Coeficiente de Curtosis: [k]
Pgina 62
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
4
318353 .125 / 50
3
3
2 2
( )
(46.25)2
6367 .0625
3 2.976 3 0.0234 0
2139 .0625
Pgina 63
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Cuando = 1 indica que existe una inequidad absoluta, es decir que toda la
riqueza est concentrada en una sola clase y el resto de la poblacin no posee
riqueza. Este tambin es un caso extremo que en la prctica no se cumple.
Lo que si se cumple es que 0 < < 1 , las polticas sociales de los gobiernos
procuran que este ndice sea lo ms bajo posible, lo cual indicar que la riqueza
est mejor distribuida en la poblacin, en cambio cuando este valor se acerca a 1
indicar que la mayor cantidad de la riqueza est concentrada en un pequeo
grupo de la poblacin.
IG
p i q i
i 1
k 1
pi
i 1
y de Ig = 1
cuando qi = 0
Curva de Lorenz, es un mtodo grfico de estudiar la concentracin de la riqueza.
Sea una distribucin de rentas (xi, ni) de la que formaremos una tabla con las
siguientes columnas:
1.- Los productos xi ni, que nos indicarn la renta total percibida por los ni rentistas
de renta individual xi .
2.-
4.- La columna total de frecuencias acumuladas relativas, que expresaremos en tanto por ciento y que
representaremos como pi y que vendr dada por la siguiente notacin
pi
Manuel Hurtado Snchez
Ni
100
n
Pgina 64
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
5.- La renta total de todos los rentistas que ser un y que dada en tanto por ciento, la cual
representaremos como qi y que responder a la siguiente notacin:
qi
ui
100
un
xi
ni
x1
n1
x i ni
x 1 n1
x2
n2
x 2 n2
...
...
Xn
nn
i
Ni Ui
N1 U1 p1
Ni
100
n
qi
ui
100
un
pi - qi
q1
p1 - q1
N2 U2 p2
q2
p2 - q2
...
...
...
...
...
...
x n nn
Nn un
Pn
qn
pn - qn
Como podemos ver la ltima columna es la diferencia entre las dos penltimas,
esta diferencia seria 0 para la concentracin mnima ya que pi = qi y por tanto su
diferencia seria cero.
Si esto lo representamos grficamente obtendremos la curva de concentracin
o curva de Lorenz .La manera de representarlo ser, en el eje de las X, los valores
pi en % y en el de las Y los valores de qi en %. Al ser un %, el grfico siempre ser
un cuadrado, y la grfica ser una curva que se unir al cuadrado, por los valores
(0,0), y (100,100), y quedar siempre por debajo de la diagonal.
La manera de interpretarla ser: cuanto ms cerca se site esta curva de la
diagonal, menor concentracin habr, o ms homogeneidad en la distribucin.
Cuanto ms se acerque a los ejes, por la parte inferior del cuadrado, mayor
concentracin.
Los extremos son
Pgina 65
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Li-1 - Li
0 50
50 - 100
100 - 150
150 - 200
200 - 250
250 - 300
300 - 350
350 - 400
400 - 450
450 - 500
marca
xi
ni
Ni
25
75
125
175
225
275
325
375
425
475
23
95
157
205
224
232
246
253
258
260
23
72
62
48
19
8
14
7
5
2
260
xini
un
575
5400
7750
8400
4275
2200
4550
2625
2125
950
38850
575
5975
13725
22125
26400
28600
33150
35775
37900
38850
1,48
15,38
35,33
56,95
67,95
73,62
85,33
92,08
97,55
100,00
8,85
36,54
60,38
78,85
86,15
89,23
94,62
97,31
99,23
100,00
651,15
7,37
21,16
25,06
21,90
18,20
15,61
9,29
5,22
1,68
0,00
125,48
Pgina 66
a)
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
IG
p i q i
i 1
k 1
pi
125,48
0,193 ,
651,15
i 1
Curva de Lorenz
La curva la obtenemos cerca de la diagonal, que indica que hay poca concentracin:
V.
Anlisis Estadstico con dos variables
Cuando analizamos dos o ms variables de manera conjunta, generalmente
estamos interesados en estudiar la relacin que existe entre dichas
variables. En esta ocasin solo presentaremos el anlisis estadstico para
dos variables.
El primer nivel de anlisis estadstico con dos variables consiste en elaborar
tablas de frecuencia de doble entrada. Estas tablas se elaboran cuidado de
mantener el vnculo que existe que ambas variables son observadas en una
misma unidad de anlisis, y los datos originales en este caso son pares
ordenados
(X1, Y1)
(X2, Y2)
(X3, Y3)
..
(Xn, Yn)
Pgina 67
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
(X3, Y3)
(X2, Y2)
..
(Xn, Yn)
SEXO (j)
Total
09.0 - 11.4
Varn
29
Mujer
18
47
11.5 - 13.9
53
24
77
14.0 - 16.4
Total
85
44
129
Pgina 68
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
=
11 = 29 29 . . 09.0 11.4
12 = 18 18 . . 09.0 11.4
22 = 24 24 . . 11.5 13.9
As sucesivamente
. =
= ()
1. = 47 47 . . 09.0 11.4
2. = 77 77 . . 11.5 13.9
As sucesivamente.
. =
()
.1 = 85 85
.2 = 44 44
SEXO
Varn
N de
% de
N de
% de
estudiantes estudiantes estudiantes estudiantes
29
34.1%
18
40.9%
53
62.4%
24
54.5%
3
3.5%
2
4.5%
85
100.0%
44
100.0%
Mujer
Total
N de
estudiantes
47
77
5
129
% de
estudiantes
36.4%
59.7%
3.9%
100.0%
Pgina 69
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Aqu lo que se compara son los perfiles, as podemos leer que hay mayor
proporcin de mujeres en promedios ponderados bajos (09.0 a 11.4), en
cambio en promedios ponderados intermedios (11.5 a 13.9), se observa
mayor proporcin de varones, finalmente en promedios ponderados
sobresalientes (14.0 a 16.4) las proporciones de varones y mujeres son
bastante parecidas. Por lo tanto podemos concluir que el promedio
ponderado si guarda relacin con el sexo, los varones parecen estar en
ventaja sobre las mujeres.
Medidas de correlacin:
Despus de un anlisis descriptivo de cada variable, el siguiente nivel de
anlisis comprende analizar la relacin entre dos variables. Aqu aparecen
diferentes herramientas estadsticas, desde las tablas de contingencia o
tablas cruzadas hasta el clculo de coeficientes de correlacin. Existen
diversos coeficientes de correlacin que han sido construidos para las
diferentes escalas en quede estar medida una variable; sin embargo en esta
ocasin presentaremos solamente el coeficiente de correlacin lineal de
Pearson.
Cov( x, y)
;
x y
Donde:
Covarianza entre X e Y:
para todo:
Cov( x, y)
1 r 1
x x y y
N
x x
Desviacin estndar de X: x
y y
Desviacin estndar de Y: y
Cov( x, y)
x y
xy N
N
Pgina 70
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
x
x n
: Desviacin estndar de x
y
y N
: Desviacin estndar de y
x y
xy N
x x y x
N
N
2
Ejemplo 1.
Pgina 71
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
N de das necesarios
para hacer la obra
x
N de trabajadores
participantes en la obra
y
XY
X^2
Y^2
1
2
3
4
5
6
7
8
9
10
2
3
3
5
6
6
8
8
10
12
8
7
6
6
5
4
3
2
1
0.5
16
21
18
30
30
24
24
16
10
6
4
9
9
25
36
36
64
64
100
144
64
49
36
36
25
16
9
4
1
0.25
63
42.5
195
491
240.25
63 42.5
10
r
0.971
632
42.52
491
240.25
10
10
195
Pgina 72
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo 2.
Se desea estudiar la relacin existente entre la Longitud en metros de un cable
elctrico (X) y el peso en Kgr. del cable (Y)
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Suma
Longitud del
cable (metros)
X
4
6
6
7
7
7
8
9
9
9
11
11
11
13
13
14
15
16
176
XY
X^2
Y^2
20
30
42
42
49
56
64
72
81
90
110
121
132
156
169
196
225
240
1895
16
36
36
49
49
49
64
81
81
81
121
121
121
169
169
196
225
256
1920
25
25
49
36
49
64
64
64
81
100
100
121
144
144
169
196
225
225
1881
176 175
18
r
0.972
2
176
175 2
1920
1881
18
18
1895
Pgina 73
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 74
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
x y
xy
n
x
x
Y X
Coeficiente de determinacin de la ecuacin de regresin lineal simple [ R2]
El coeficiente de determinacin es una medida de adecuacin de la ecuacin de
regresin lineal simple, y expresa el porcentaje de variabilidad de la variable
dependiente (Y) que est siendo explicada por la variable regresora (X) en la
ecuacin de regresin lineal simple. Su clculo se puede obtener elevando al
cuadrado el coeficiente de correlacin lineal de Pearson:
R2 r 2
Podemos notar que
2. Los errores residuales deben tener distribucin normal con media cero y
varianza constante.
3. El coeficiente de determinacin debe ser por lo menos 70%
Pgina 75
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
40
20
25
20
30
50
40
20
50
40
25
50
385
400
395
365
475
440
490
420
560
525
480
510
1. En primer lugar por teora del mrquetin, sabemos que las ventas
dependen de los gastos en publicidad, y al representar los datos de estas
variables en las ltimas 12 semanas en la siguiente grfica, verificamos
que la relacin es del tipo lineal, entonces es aplicable el uso de la
regresin lineal simple.
Pgina 76
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Tabla N __ cuadro de clculos para la regresin lineal simple de Ventas en funcin de los
gastos en publicidad
Gasto semanal en
valor de ventas ($):
Semana (i)
publicidad (X)
(Y)
X.Y
X2
Y2
1
2
3
4
5
6
7
8
9
10
11
12
40
20
25
20
30
50
40
20
50
40
25
50
385
400
395
365
475
440
490
420
560
525
480
510
15400
8000
9875
7300
14250
22000
19600
8400
28000
21000
12000
25500
1600
400
625
400
900
2500
1600
400
2500
1600
625
2500
148225
160000
156025
133225
225625
193600
240100
176400
313600
275625
230400
260100
Suma
410
5445
191325
15650
2512925
x y
xy
n
y
x
n
Y X
410 5 445
191 325
12
3.2208
410 2
15650
12
5445
410
3.2208
12
12
343.71
Y 343.71 3.2208 X
Pgina 77
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
1913255
410 5445
10
410 2
5445 2
15650
2512925
12
12
0.6348
R2
r 2 0.6348 2
0.403 40.3%
El valor nos indica que el 40.3% de la variabilidad de las ventas lo explica los gastos
en publicidad, es decir que se trata de una ecuacin no muy til para realizar
pronsticos de las ventas en funcin de los gastos en publicidad.
V.
a.
Costo reducido.- Si los datos se obtienen nicamente de una pequea fraccin del
total, los gastos son menores que los que se realizaran si se llevara a cabo un censo
completo. En poblaciones muy grandes se pueden obtener resultados lo suficientemente
exactos cuando se analizan muestras que representan slo una pequea fraccin de la
poblacin.
b. Mayor rapidez.Los datos pueden ser recolectados y resumidos ms rpidamente con una muestra
que con una enumeracin completa. Esta es una consideracin vital cuando se
necesita la informacin con urgencia.
Pgina 78
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
UNIDAD DE OBSERVACIN.Son los elementos de la poblacin sobre los cuales se medirn las variables de
inters. sta es la unidad bsica, a veces llamada elemento. En los estudios de
poblaciones humanas la unidad de observacin son los individuos.
Ejemplo: En una investigacin sobre el estado nutricional y el rendimiento escolar de
los nios del nivel primario; la unidad de observacin son los nios del nivel primario.
g. POBLACION.Es el conjunto de todas las unidades de anlisis cuyas caractersticas se van a estimar.
Una poblacin debe definirse en trminos de su contenido, extensin y tiempo
Pgina 79
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
POBLACION MUESTRAL.La poblacin muestral est constituida por una parte o un subconjunto de la poblacin
objetivo. Est determinada y delimitada en el tiempo y en el espacio y de cuyos
elementos en la prctica se obtiene la muestra para realizar el estudio.
i. MUESTRA.Una muestra es un conjunto de unidades, una porcin del total, que nos
representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es ms que eso, una parte del todo que
llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan tiles para llevar a cabo un trabajo
de investigacin. Lo que se busca al emplear una muestra es que, observando
una porcin relativamente reducida de unidades, se obtengan conclusiones
semejantes a las que lograramos si estudiramos el universo total. Cuando una
muestra cumple con esta condicin, es decir, cuando nos refleja en sus unidades
lo que ocurre en el universo, la llamamos muestra representativa. Por lo tanto,
una muestra representativa contiene las caractersticas relevantes de la
poblacin en las mismas proporciones en que estn incluidas en tal poblacin.
Sus conclusiones son susceptibles de ser generalizadas al conjunto del universo,
aunque para ello debamos aadir un cierto margen de error en nuestras
proyecciones.
Las muestras pueden ser clasificadas, en una primera divisin en probabilsticas
y no probabilsticas.
En las muestras probabilsticas, la caracterstica fundamental es que todo
elemento del universo tiene una determinada probabilidad de integrar la muestra,
y esa probabilidad puede ser calculada matemticamente con precisin. En las
muestras no probabilsticas ocurre lo contrario y el investigador no tiene idea del
error que puede estar introduciendo en sus apreciaciones.
j. UNIDAD DE MUESTREO.La unidad de muestreo y la unidad de anlisis son las mismas, pero hay casos
en que no lo son. Una unidad de muestreo puede contener un conjunto de
unidades de observacin o, incluso, un conjunto de unidades de muestreo
correspondientes a una etapa posterior de seleccin.
Ejemplo:
Podramos querer estudiar a las personas, pero no tenemos una lista de todos
los individuos que pertenecen a la poblacin objetivo. En vez de esto, la vivienda
sirven como las unidades de muestreo y las unidades de observacin son los
individuos que viven en una vivienda.
k. MARCO MUESTRAL.-
Pgina 80
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 81
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
3. TIPOS DE MUESTREO
Con Reemplazo
Simple
T
I
Estratificado
Proporcional
Desproporcional
Cruzado
nico
O
S
Sin Reemplazo
Conglomerado
Probabilstico
Una etapa
Dos etapas
Multi etapas
Sistemtico
D
E
Doble
Mltiple
Secuencial
M
U
Casos tpicos.
Conveniencia
No
Probabilstico
Voluntarios
Bola de nieve
E
O
Pgina 82
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
4. MUESTRAS NO ALEATORIAS
Si consideramos que no precisamos cifras exactas sobre la representatividad
estadstica de nuestros resultados, podramos plantearnos el usar una muestra no
aleatoria (o "no probabilstica"), lo que significa que elegiremos a voluntad nuestra.
Podemos considerar que esto puede ayudarnos a obtener los elementos que
necesitamos estudiar directamente y, adems, actuar sin los tediosos procesos de
seleccin aleatoria y verificacin estadstica.
Sin embargo, hay una desventaja: corremos un gran riesgo de obtener demasiado
sesgo en la muestra. No seremos capaces siquiera de advertir la presencia, y menos
an la cantidad, de sesgo si hacemos personalmente la seleccin de la muestra. Y la
presencia de sesgo puede hacer imposible generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o grupo la
seleccin de los elementos.
Estas muestras son bastante tiles en aquellas situaciones en las cuales no es posible
utilizar un muestreo probabilista, es decir cuando no es posible disponer de un marco
muestral para la seleccin de los elementos de la muestra. Su utilizacin est
reservada solo para aquellos investigadores que conocen la estructura de la poblacin
y tienen un criterio suficientemente bueno para conseguir representatividad; incluso si
se dispone de un buen criterio para conseguir representatividad es posible obtener
mayor precisin a ms bajos costos que con un muestreo probabilista.
Entre los tipos comunes de muestras no aleatorias se incluyen,
Muestra de "casos tpicos" o los "mejores" casos es algo bastante tradicional en
historia del arte: estudiar solamente los "grandes maestros". La idea es que stos
representan lo ms autntico de su poca. Tal seleccin deliberada por parte del
investigador tiene no obstante riesgos serios, que se tratan en el punto Delimitar el
objeto de estudio.
Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una reunin,
podra ser designado como muestra. Este es un mtodo fcil y barato, pero el sesgo
suele ser imposible de estimar. El mtodo es popular en las demostraciones de cursos
sobre mtodos, pero raramente usado en la investigacin profesional.
Muestra de voluntarios es creada cuando todos los miembros de la poblacin tienen
la oportunidad de participar en la muestra. Un ejemplo es la respuesta voluntaria de
los clientes que llega a una empresa; igualmente, las respuestas que un investigador
recibe a un anuncio en un peridico pidiendo a la gente sus opiniones.
Una muestra de voluntarios suele ser una alternativa bastante sensata; no obstante, el
investigador debe considerar cuidadosamente los riesgos de sesgo. Hay dos
cuestiones que plantearse:
Manuel Hurtado Snchez
Pgina 83
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Es cierto que todos los miembros de la poblacin bajo muestreo tenan las mismas
oportunidades de ser incluidos en la muestra? Por definicin, los voluntarios difieren
de la media de la poblacin en su mayor actividad. La cuestin crucial entonces es
difieren del resto de la poblacin tambin en otros aspectos?.
Muestra bola de nieve. Cuando se entrevista a miembros de un grupo, podemos pedir
a las personas que nos indiquen otros individuos en ese grupo que estn en la mejor
posicin para dar informacin sobre ese tema; podramos tambin pedirles que nos
indicasen personas que compartan sus puntos de vista y tambin otras que sean de
opinin opuesta. Entonces entrevistaremos a nuevos individuos y continuaremos del
mismo modo hasta que no obtengamos nuevos puntos de vista de nuevos entrevistados.
Este es un buen mtodo por ejemplo para recoger los distintos puntos de vista existentes
en un grupo, pero su inconveniente es que no obtenemos una idea exacta de la
distribucin de las opiniones.
En el momento de disear una muestra no aleatoria, debemos siempre tener en mente
la poblacin. Es representativa la muestra? Son vlidos los resultados en la
poblacin?
Recordemos tambin que no tenemos que incluir elementos que no sean miembros de
la poblacin en nuestra muestra.
Por ejemplo, podramos decidirnos (de forma bastante sensata) por investigar
las preferencias de los clientes de electrodomsticos entrevistando a
vendedores. O podramos estudiar las historias de vida de arrendatarios
mediante un cuestionario a administradores de casas o caseros. La idea es
factible, ya que esta gente habitualmente conoce mucho sobre el tema. Sin
embargo, los "especialistas" no pueden ser tomados como muestra de "no
especialistas". Son dos poblaciones diferentes. No debiramos generalizar los
resultados de "especialistas" a ninguna otra poblacin que no sea la
de "especialistas", cualquiera que sea el campo del que tratemos.
En los ejemplos de arriba, podramos tal vez continuar transformando los resultados a
partir de los especialistas en hiptesis que ms tarde verificaramos con una muestra
apropiada de la poblacin "real" o de no especialistas, que seran en los ejemplos
citados, respectivamente, los consumidores y los arrendatarios. En otras palabras,
podramos usar la entrevista de los especialistas slo como un estudio preliminar.
5. Tamao de Muestras no aleatorias
No hay frmula para determinar el tamao de una muestra no aleatoria. Con
frecuencia, especialmente en investigaciones cualitativas, podemos simplemente
ampliar gradualmente nuestra muestra y analizar los resultados siempre que continen
llegando nuevos casos con informacin relevante o nueva; en cambio, cuando en los
casos nuevos ya no se presenta informacin nueva, podemos concluir que nuestra
Manuel Hurtado Snchez
Pgina 84
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
muestra est saturada, y terminaremos el trabajo de muestreo. Este mtodo es, sin
embargo, muy vulnerable al muestreo sesgado, con lo que tenemos que ser muy
cuidadosos y asegurarnos que no omitimos a ningn grupo de nuestra poblacin.
Antes de decidir el tamao de una muestra no aleatoria, tal vez debamos leer cmo
debe ser evaluada la representatividad de los resultados a partir de una muestra no
aleatoria. De otro modo podramos sufrir una sorpresa bastante desagradable cuando
estemos intentando, demasiado tarde, definir la poblacin en que nuestros resultados
puedan ser declarados vlidos.
6. ERROR DE MUESTREO:
Recordemos que la muestra descansa en el principio de que las partes
representan al todo y, por tal, refleja las caractersticas que definen a la poblacin
de la cual fue extrada, lo cual nos indica que es representativa. Es decir, que
para hacer una generalizacin exacta de una poblacin, es necesario tomar una
muestra representativa. Por lo tanto, la validez de la generalizacin depende de
la validez y tamao de la muestra.
Cuando trabajamos con muestras, generalmente se presentan dos tipos de
errores:
Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan
por causas ajenas a la muestra:
Pgina 85
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 86
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Una muestra aleatoria simple se extrae por seleccin aleatoria empleando los nmeros
aleatorios, este proceso ofrece la oportunidad de que todos los elementos que no han
sido sacados previamente tengan igual probabilidad de pertenecer a la muestra.
Este tipo de muestreo es eficiente en poblaciones pequeas y homogneas, para la
cual se dispone de listas adecuadas (marco muestral) y cuando la dispersin
geogrfica de los elementos muestrales no constituye un problema; as es
relativamente fcil y barato seleccionar las unidades muestrales. El inconveniente en
poblaciones grandes es conseguir una lista completa o exacta de la poblacin (marco
muestral). Otro problema conexo es el costo de determinar el nmero de elementos de
la muestra y recabar informacin a partir de cada elemento (poblaciones heterogneas)
Por ejemplo, la muestra puede contener elementos que se hallan muy dispersos por lo
tanto, para efectuar entrevistas personales se requieren fuertes desembolsos por
concepto de viaje.
Pgina 87
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Z2 2
d2
Z2 2
2
Donde:
n Tamao de muestra
2
d
N =
Valores de Z
Probabilidad de
confianza (1 )
0.90
0.95
0.99
Probabilidad de
significancia: ( )
0.10
0.05
0.01
0.050
0.025
0.005
1.645
1.960
2.576
Pgina 88
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
s2
de poblacin similar
Pgina 89
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
, por lo que la
Mximo Mnimo
0.24Mximo Mnimo
Pgina 90
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
s2
poblacional
2 s2
Z2 2
2
d2
Poblacin N =
400
Confianza (1-)
0.95
Z2 2
2
Pgina 91
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Significancia ()
0.05
(1-/2)
0.975
1.960
Error
1.500
DE(x) = =
6.6
Tamao de muestra n = 63
1.96 2 6.6 2
n
63
1.96 6.6 2
2
1.5
400
1.2.
Z2 pq
2
d2
Z2 pq
2
N
Pgina 92
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Donde:
n Tamao de muestra
N =
Pgina 93
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo
q = 1-p = 0.75
2 .
2
2
2 + 2
Respuesta: Se debe obtener una muestra de n = 200 clientes, los cuales deben
ser seleccionados en forma aleatoria.
Pgina 94
1.3.
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ho : o
1 Caso:
Ha : o
2
Z Z 2
n 2
Donde:
Pgina 95
2 Caso:
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ho : o
Ha : o Ha : o
Z
n
Z 2
2
Donde:
3 Caso:
Ho : 1 2
Ha : 1 2
2
Z Z ( 2 2 )
1
2
2
Pgina 96
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Donde:
4 Caso:
1 2
Ho : 1 2
Ha : 1 2 Ha : 1 2
Z
n
Z ( 12 22 )
2
Donde:
1.4.
1 2
Ho : P Po
Ha : P Po
Z
Po Qo Z pq
n 2
Pgina 97
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Donde:
p Po
1 Po
Qo
proporcin muestral
q 1 p
Ho : P Po
2 Caso:
Ha : P Po
Z
n
Po Qo Z
Ha : P Po
pq
Donde:
Qo
p Po
1 Po
Pgina 98
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
proporcin muestral
q 1 p
3 Caso:
Ho : P1 P2
Ha : P1 P2
p1 p2 p1 p2 / 2
2
p1q1 p2 q2
Donde:
4 Caso:
P1 P2
Ho : P1 P2
Ha : P1 P2 Ha : P1 P2
Z
n
p1 p2 q1 q2 / 2
Z p1q1 p2 q2
Donde:
P1 P2
Pgina 99
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo:
Se desea determinar el tamao de muestra para probar una hiptesis de
comparacin de proporciones. Ho : P1 = P2 contra Ha: P1 < P2, donde:
P1 : Proporcin de complicaciones en intervenciones quirrgicas con protocolo.
P2 : Proporcin de complicaciones en intervenciones quirrgicas sin protocolo.
De acuerdo a la informacin histrica, del Hospital Regional Docente Las
Mercedes de Chiclayo, se conoce que, cuando se sigue el protocolo, la proporcin
de complicaciones quirrgicas es 0.01, y cuando no se sigue el protocolo esta
proporcin es de 0.18. Si deseamos tener una confianza de 0.95 y tambin una
potencia para la prueba de hiptesis de 0.95, Cul deber ser el tamao de
muestra mnimo requerido?
La frmula a utilizar en este caso es:
Z
n
p1 p2 q1 q2 / 2
Z p1q1 p2 q2
q2 = 1- p2 = 0.82
1.645
n
62
Pgina 100
1.5.
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ho : P1 P2
H a : P1 P2
Z
2 pq Z p1q1 p2 q2
Donde:
p1 Casos
p2
Controles
p2 p2
2
q 1 p
p
: Proporcin mancomunada
P1 P2
Ejemplo: Se necesita calcular el tamao de muestra para una investigacin con diseo
de casos y controles, para probar una hiptesis de que la proporcin de partos exitosos
con mtodo de induccin es mayor a la proporcin de partos exitosos cuando no se
usa este tratamiento.
Sea: P1 = Proporcin de induccin exitosa de partos con un tratamiento
P2 = Proporcin de induccin exitosa de partos con un tratamiento
Z
n
2 pq Z
p1q1 p2 q2
p1 p2 2
Pgina 101
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
2 = 0.6
q1 = 1 p1 = 1 0.8 = 0.2
q1 = 1 p1 = 1 0.8 = 0.2
1 +2
2
0.8+0.6
2
= 0.7
= 1 = 1 0.7 = 0.3
i.
Muestreo Aleatorio Estratificado (MAE):
En este tipo de muestreo, la poblacin es dividida en L subpoblaciones o
estratos, de tamaos Nh cada uno de ellos de los cuales se selecciona nh
elementos respectivamente, de modo tal, que en cada estrato, cada uno de
los elementos tengan la misma probabilidad de ser incluidos en la muestra.
Este proceso genera muestras representativas siempre que la variabilidad
en cada subpoblacin no exceda el 33%, aun cuando la poblacin general
dicha variabilidad sea mayor que el 33%.
Pgina 102
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
WS
n
W S
V
2
2
h
nh
Wh Sh
n
2
Wh Sh
N de
Estudiantes
148
152
150
Promedio.
Lenguaje
14.20
13.82
14.75
Desv. Estnd.
Lenguaje
2.25
2.36
2.52
Promedio.
Matemtica
13.94
14.11
14.92
Desv. Estnd.
Matemtica
3.22
2.59
3.05
Pgina 103
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Confianza (1-/2)
= 0.95
Desvo Normal
2 = 1.96
Precisin (3.5% de la media) d = 0.5
Varianza deseada: V=(d/Z)2 = 0.06507944
Calculo del tamao de muestra general para investigar competencias bsicas de
comprensin lectora:
=
( )2
(2.3786)2
=
= 73
2 0.06507944 + 5.6697
+
450
1 1
0.7406
=
73 = 23
2.3786
2 =
2 2
0.7980
=
73 = 24
2.3786
3 =
3 3
0.8400
=
73 = 26
2.3786
N de
Estudiantes
Nh
148
152
150
450
Promedio en
Lenguaje
14.20
13.82
14.75
Desv. Estnd.
Lenguaje Sh
2.25
2.36
2.52
Ponderacin:
Wh
0.329
0.338
0.333
1.000
Wh. Sh
0.7406
0.7980
0.8400
2.3786
Wh.Sh^2
1.6675
1.8854
2.1168
5.6697
muestra del
estrato: nh
23
24
26
73
( )2
(2.9521)2
=
= 103
8.7850
2
+ 0.06507944 + 450
1 1
1.0591
=
103 = 37
2.9521
Pgina 104
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
2 =
2 2
0.8763
=
103 = 31
2.9521
3 =
3 3
1.0167
=
103 = 35
2.9521
Cuadro de clculos del tamao de muestra para investigar competencias bsicas de Matemticas
en tres instituciones Educativas de Chiclayo
Institucin
Educativa
(Estrato h)
N de
Desv. Estnd.
Estudiantes Promedio en Matemticas Ponderacin:
Nh
Matemticas
Sh
Wh
Elvira Garca
148
13.94
3.22
0.329
Magdalena Sofa
152
14.11
2.59
0.338
San Jos
150
14.92
3.05
0.333
Total
450
1.000
Wh. Sh
1.0591
0.8763
1.0167
2.9521
Wh.Sh^2
3.4107
2.2734
3.1008333
8.7850
muestra del
estrato: nh
37
31
35
103
( )
=
+
Donde:
N = Tamao general de la Poblacin
n = Tamao general de muestra
Pgina 105
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Muestra: Se utilizar un muestreo estratificado para estimar la proporcin de estudiantes con calidad
de sueo Deficiente. Las unidades elementales o informantes son cada uno de los estudiantes. Se
elige un nivel de confianza de 0.95 y un nivel de precisin de 0.05
El tamao de muestra se calcula para estimar la proporcin de estudiantes con calidad de sueo
deficiente, mediante un muestreo estratificado con asignacin de Neyman, la cual asigna un tamao
de muestra a los estratos teniendo en cuenta el tamao del estrato y la dispersin interna del estrato.
Suponiendo que los costos de muestreo dentro de cada estrato es el mismo.
Pgina 106
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
P = Proporcin de
estudiantes con
calidad de sueo
deficiente
N = 6120
Administracin
Admi
de empresas
N1 = 1141
Psicologa
Administracin
hotelera
N18 = 301
N2 = 291
d = 0.05
(1-)=0.95
n1 = 69
n18 = 30
n2 = 18
Tamao general de
muestra
n = 413
pst = Estimado
estratificado de P
(Wh ph qh ) 2
n
,
Wh ph qh
V
N
Donde
2
d
V Varianza deseada del estimador de la proporcin
z
Asumimos
Una confianza (1-) de 0.95, para el cual, el desvo normal es Z = 1.96
Una precisin (mximo error de muestreo tolerado) d 0.05
Entonces la varianza deseada debe ser:
2
0.05
V
0.000651
1.96
Los clculos se muestran en la siguiente tabla, con lo cual, el tamao de muestra es:
n
(0.434192) 2
276
0.203828
0.000651
6120
Pgina 107
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
La asignacin de Neyman del tamao de muestra a los estratos se hace con la frmula:
W p q
nh h h h n
Wh ph qh
por razones de conseguir estabilidad para los estimadores por carrera profesional, se corrige el
tamao de muestra a un mnimo de 30, con lo cual se tiene una muestra corregida de 535
estudiantes, tal como se puede apreciar en el siguiente cuadro.
Cuadro N 2 Clculo del tamao de muestra estratificado con asignacin de Neyman para estudiantes de la
USAT matriculados en el semestre acadmico 2011-I.
Matriculados
ESTRATO (h)
(2011-I): Nh
Carrera profesional
N
Wh h
N
Proporcin de
estudiantes con
calidad de
sueo deficiente
qh 1 ph Wh p h q h
Wh ph qh
nh
nh (corr )
ph
ADM. DE EMPRESAS
ADM. HOTELERA Y
DE SERVICIOS
CONTABILIDAD
ECONOMA
EDUCACIN (inicial,
Prim. y Secundaria.)
COMUNICACIN
DERECHO
ARQUITECTURA
ING. CIVIL Y AMB.
ING. DE SIST. Y
COMP.
ING. ENERGTICA
ING. INDUSTRIAL
ING. MECNICA
ELCTRICA
ING. NAVAL
ENFERMERA
MEDICINA
ODONTOLOGA
PSICOLOGA
TOTAL
1131
0.1848
0.3
0.5
0.071574
0.027721
45
45
289
0.0472
0.25
0.5
0.016696
0.005903
11
30
479
177
0.0783
0.0289
0.3
0.3
0.5
0.5
0.030313
0.011201
0.011740
0.004338
19
7
30
30
254
0.0415
0.25
0.5
0.014674
0.005188
30
220
703
234
320
0.0359
0.1149
0.0382
0.0523
0.4
0.4
0.4
0.4
0.5
0.5
0.5
0.5
0.016076
0.051371
0.017099
0.023384
0.007190
0.022974
0.007647
0.010458
10
33
11
15
30
33
30
30
398
0.0650
0.6
0.5
0.035620
0.019510
23
30
9
415
0.0015
0.0678
0.4
0.6
0.5
0.5
0.000658
0.037141
0.000294
0.020343
0
24
9
30
71
0.0116
0.6
0.5
0.006354
0.003480
30
28
589
296
207
300
6120
0.0046
0.0962
0.0484
0.0338
0.0490
1.0000
0.4
0.4
0.7
0.6
0.4
0.5
0.5
0.5
0.5
0.5
0.002046
0.043041
0.028614
0.018526
0.009804
0.434192
0.000915 1
0.019248 27
0.016928 18
0.010147 12
0.009804 6
0.203828 276
28
30
30
30
30
535
pst phWh ,
h1
DE( pst )
18
W
h1
2
h
ph qh N h nh
nh N h 1
Pgina 108
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
2
222
3
525
4
308
5
205
6
191
7
414
8
210
Pgina 109
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
n = 200,
m = 4 y c = 50.
Pasos:
1. Crear una lista de las UPE (conglomerados) y obtener los tamaos
acumulados Di = N1 + N2 + ... + Ni a lo largo de la misma:
Marco muestral de Unidad Primaria Elemental (UPE)
UPE i
Tamao Ni
Tamao acumulado Di
114
114
222
336
525
861
308
1169
205
1374
191
1565
414
1979
210
2189
I
En el ejemplo =
2189
4
N
m
= 547.25 547
Pgina 110
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Z1 =R,
Z2 =R+I,
Z3 = R+2I . Zm = R+(m-1)I
Tamao Ni
114
222
525
308
205
191
414
210
Tamao
acumulado Di
114
336
861
1169
1374
1565
1979
2189
Zi
369
916
1463
2016
b. Combinacin del
Conglomerados
muestreo
Aleatorio
Estratificado
por
Pgina 111
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Ejemplo.
Deseamos estimar la proporcin de viviendas con alta vulnerabilidad
ssmica en la ciudad de Ferreafe, para lo cual se dispone de un plano, el
cual aparece segmentado en 7 zonas aproximadamente homogneas a su
interior, pero que tienen distintos niveles de vulnerabilidad de una zona a
otra. Se conoce el nmero de viviendas por manzana, por cada zona y por
lo tanto el total de viviendas, as mismo se tiene una estimacin a priori de
la proporcin de viviendas en cada zona que tienen alta vulnerabilidad
ssmica. Dichos valores se muestran en el siguiente cuadro.
Sector (h)
1
2
3
4
5
6
7
Total
N de
viviendas
: Nh
425
1482
1292
1621
2105
1286
1187
9398
Proporcin de viviendas
con alta vulnerabilidad
ssmica: ph
0.7
0.8
0.6
0.5
0.6
0.4
0.9
(Wh ph qh ) 2
n
,
Wh ph qh
V
N
Donde
2
d
V Varianza deseada del estimador de la proporcin
z
Asumimos
Una confianza (1-) de 0.95, para el cual, el desvo normal es Z = 1.96
Una precisin (mximo error de muestreo tolerado) d 0.07
Manuel Hurtado Snchez
Pgina 112
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
0.07
V
0.00128
1.96
Los clculos se muestran en la siguiente tabla, con lo cual, el tamao de muestra es:
n
(0.45205) 2
160
0.03435
0.00128
9398
La asignacin de Neyman del tamao de muestra a los estratos se hace con la frmula:
W p q
nh h h h n
Wh ph qh
N de
Sector
viviendas
(h)
: Nh
1
425
2
1482
3
1292
4
1621
5
2105
6
1286
7
1187
Total
9398
Proporcin de viviendas
con alta vulnerabilidad
ssmica: ph
0.7
0.8
0.6
0.5
0.6
0.4
0.9
Wh
0.0452
0.1577
0.1375
0.1725
0.2240
0.1368
0.1263
1
Muestra de muestra de
Mz
qh Wh(phqh)^0.5 Wh^2(phqh) viviendas nh
0.3
0.02072
0.00043
7
1
0.2
0.06308
0.00398
22
3
0.4
0.06735
0.00454
24
3
0.5
0.08624
0.00744
30
4
0.4
0.10973
0.01204
39
5
0.6
0.06704
0.00449
24
3
0.1
0.03789
0.00144
13
2
0.45205
0.03435
160
20
Pgina 113
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Zona 1
LOTE Ni
Zi
1
5
5
2
24
29
3
9
38
4
22
60
5
9
69
6
14
83
7
22 105
8
15 120
9
0 120
10
43 163
11
1 164
12
1 165
13
1 166
14
10 176
15
21 197 192
16
1 198
17
22 220
18
32 252
19
32 284
20
16 300
21
19 319
22
20 339
23
15 354
24
1 355
25
13 368
26
13 381
27
1 382
28
22 404
29
1 405
30
20 425
Total
425
Mz
m=
I=
r=
1
425
192
Zona 2
Mz
LOTE
1
49
2
32
3
37
4
39
5
37
6
24
7
42
8
41
9
33
10
1
11
8
12
44
13
55
14
24
15
24
16
38
17
15
18
19
19
41
20
40
21
7
22
0
23
1
24
3
25
11
26
17
27
28
28
17
29
16
30
18
31
13
32
10
33
16
34
30
35
17
36
36
37
1
38
11
39
33
40
55
41
59
42
48
43
57
44
49
45
43
46
2
47
56
48
21
49
30
50
49
51
42
52
43
Total 1482
m=
I=
r=
Zi
3
494
6
500
994
Ni
49
81
118
157
194
218
260
301
334
335
343
387
442
466
490
528
543
562
603
643
650
650
651
654
665
682
710
727
743
761
774
784
800
830
847
883
884
895
928
983
1042
1090
1147
1196
1239
1241
1297
1318
1348
1397
1439
1482
Zi
6
500
994
Zona 3
Mz
LOTE Ni
1
12
12
2
23
35
3
16
51
4
32
83
5
29
112
6
1
113
7
17
130
8
15
145
9
30
175
10
32
207
11
15
222
12
39
261
13
17
278
14
11
289
15
34
323
16
0
323
17
8
331
18
25
356
19
9
365
20
26
391
21
35
426 402
22
32
458
23
31
489
24
46
535
25
24
559
26
1
560
27
10
570
28
8
578
29
12
590
30 114
704
31
44
748
32
26
774
33
31
805
34
1
806
35
34
840 833
36
31
871
37
24
895
38
54
949
39
21
970
40
28
998
41
35 1033
42
1 1034
43
49 1083
44
7 1090
45
32 1122
46
0 1122
47
11 1133
48
22 1155
49
9 1164
50
17 1181
51
25 1206
52
15 1221
53
31 1252
54
18 1270 1263
55
22 1292
56
0 1292
Total 1292
m=
I=
r=
Zi =
3
431
402
833
1263
Pgina 114
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Zona 4
LOTE Ni
1
35
35
2
36
71
3
19
90
4
0
90
5
23 113
6
30 143
7
47 190
8
39 229
9
36 265
10
12 277
11
0 277
12
10 287
13
10 297
14
15 312
15
41 353
16
50 403
17
47 450
18
30 480
19
21 501
20
33 534
21
41 575
22
45 620
23
37 657
24
45 702
25
35 737
26
39 776
27
32 808
28
32 840
29
23 863
30
12 875
31
8 883
32
38 921
33
3 924
34
31 955
35
49 1004
36
18 1022
37
39 1061
38
43 1104
39
32 1136
40
32 1168
41
30 1198
42
32 1230
43
20 1250
44
32 1282
45
23 1305
46
27 1332
47
41 1373
48
1 1374
49
10 1384
50
16 1400
51
26 1426
52
35 1461
53
22 1483
54
15 1498
55
18 1516
56
17 1533
57
21 1554
58
9 1563
59
17 1580
60
24 1604
61
15 1619
62
2 1621
Total
1621
Zona 5
Mz
m=
I=
r=
Zi =
4
405.3
379
784.3
1190
1595
379
784
1190
1595
LOTE Ni
1
34
34
2
42
76
3
22
98
4
50 148
5
38 186
6
39 225
7
47 272
8
55 327
9
1 328
10
20 348
11
71 419
12
54 473
13
42 515
14
32 547
15
37 584
16
47 631
17
49 680
18
60 740
19
9 749
20
43 792
21
39 831
22
46 877
23
31 908
24
35 943
25
45 988
26
44 1032
27
12 1044
28
23 1067
29
24 1091
30
45 1136
31
36 1172
32
42 1214
33
42 1256
34
47 1303
35
84 1387
36
36 1423
37
41 1464
38
8 1472
39
28 1500
40
38 1538
41
43 1581
42
25 1606
43
1 1607
44
45 1652
45
58 1710
46
2 1712
47
35 1747
48
29 1776
49
7 1783
50
40 1823
51
9 1832
52
36 1868
53
37 1905
54
42 1947
55
43 1990
56
27 2017
57
4 2021
58
31 2052
59
25 2077
60
1 2078
61
24 2102
62
3 2105
Total
2105
Zona 6
Mz
m=
I=
r=
Zi =
5
421
99
520
941
1362
1783
Mz
99
520
941
1362
1783
LOTE Ni
1
34
34 18
2
42
76
3
32 108
4
29 137
5
6 143
6
22 165
7
42 207
8
34 241
9
42 283
10
50 333
11
38 371
12
50 421
13
35 456 447
14
40 496
15
13 509
16
11 520
17
26 546
18
25 571
19
18 589
20
19 608
21
37 645
22
18 663
23
1 664
24
7 671
25
11 682
26
34 716
27
36 752
28
40 792
29
17 809
30
14 823
31
7 830
32
30 860
33
25 885 875
34
30 915
35
0 915
36
42 957
37
48 1005
38
49 1054
39
28 1082
40
10 1092
41
3 1095
42
11 1106
43
17 1123
44
33 1156
45
13 1169
46
35 1204
47
34 1238
48
14 1252
49
33 1285
50
1 1286
Total
1286
m=
I=
r=
Zi
3
428.7
18
446.7
875.3
Zona 7
Mz LOTE Ni
1
30
2
30
3
21
4
17
5
1
6
10
7
9
8
41
9
8
10
49
11
26
12
38
13
18
14
4
15
26
16
21
17
13
18
1
19
26
20
0
21
17
22
14
23
19
24
20
25
18
26
22
27
8
28
19
29
19
30
1
31
18
32
24
33
11
34
17
35
8
36
11
37
12
38
12
39
12
40
12
41
0
42
0
43
16
44
12
45
17
46
26
47
33
48
1
49
1
50
26
51
23
52
28
53
34
54
37
55
19
56
24
57
1
58
24
59
20
60
22
61
28
62
22
63
28
64
31
65
9
66
22
Total
1187
m=
I=
r=
Zi =
30
60
81 76
98
99
109
118
159
167
216
242
280
298
302
328
349
362
363
389
389
406
420
439
459
477 472
499
507
526
545
546
564
588
599
616
624
635
647
659
671
683
683
683
699
711
728
754
787
788
789
815
838
866
900 867
937
956
980
981
1005
1025
1047
1075
1097
1125
1156
1165
1187
3
395.7
76
471.7
867.3 Pgina 115
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
c. Muestreos No Probabilsticos
Si consideramos que no precisamos cifras exactas sobre la
representatividad estadstica de nuestros resultados, podramos
plantearnos el usar una muestra no aleatoria (o "no probabilstica"), lo que
significa que elegiremos a voluntad nuestra. Podemos considerar que esto
puede ayudarnos a obtener los elementos que necesitamos estudiar
directamente y, adems, actuar sin los tediosos procesos de seleccin
aleatoria y verificacin estadstica.
Sin embargo, hay una desventaja: corremos un gran riesgo de obtener
demasiado sesgo en la muestra. No seremos capaces siquiera de advertir
la presencia, y menos an la cantidad, de sesgo si hacemos personalmente
la seleccin de la muestra. Y la presencia de sesgo puede hacer imposible
generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o
grupo la seleccin de los elementos.
Estas muestras son bastante tiles en aquellas situaciones en las cuales no
es posible utilizar un muestreo probabilstico, es decir cuando no es posible
disponer de un marco muestral para la seleccin de los elementos de la
muestra. Su utilizacin est reservada solo para aquellos investigadores
que conocen la estructura de la poblacin y tienen un criterio
suficientemente bueno para conseguir representatividad; incluso si se
dispone de un buen criterio para conseguir representatividad es posible
obtener mayor precisin a ms bajos costos que con un muestreo
probabilstico.
Entre los tipos comunes de muestras no aleatorias se incluyen,
Muestra de "casos tpicos" o los "mejores" casos es algo bastante
tradicional en la historia del arte: estudiar solamente los "grandes maestros".
La idea es que stos representan lo ms autntico de su poca. Tal
seleccin deliberada por parte del investigador tiene no obstante riesgos
serios, que se tratan en el punto De limitar el objeto de estudio.
Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una
reunin, podra ser designado como muestra. Este es un mtodo fcil y
barato, pero el sesgo suele ser imposible de estimar. El mtodo es popular
en las demostraciones de cursos sobre mtodos, pero raramente usado en
la investigacin profesional.
Muestra de voluntarios es creada cuando todos los miembros de la
poblacin tienen la oportunidad de participar en la muestra. Un ejemplo es
la respuesta voluntaria de los clientes que llega a una empresa; igualmente,
las respuestas que un investigador recibe a un anuncio en un peridico
pidiendo a la gente sus opiniones.
Pgina 116
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 117
VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
Pgina 118