Académique Documents
Professionnel Documents
Culture Documents
INDICE
Contenido
Pgina
Resumen...................................
Presentacin
Resumen ejecutivo .
I.
INTROCUCCIN
1.1 Antecedentes..
1.2. Formulacin del problema..
1.3. Objetivos
1.4. Variables....
1.5. Cuadro de operacionalizacin de variables
II.
III.
IV.
V.
METODOLOGA
2.1. Tipo de estudio ...
2.2. Diseo de contrastacin .
2.3. Poblacin y Muestra
2.4. Mtodos, tcnicas e instrumentos de recoleccin de datos .
RESULTADOS
3.1. Demanda de formacin profesional en estudiantes de 5 de secundaria .........
3.2. Oferta de formacin profesional en universidades e institutos ....
3.3. Oferta Laboral en hogares .
3.4. Demanda laboral en empresas e instituciones ..
3.5. Anlisis prospectivo para las carreras objeto de estudio .
CONCLUSIONES.
ANEXOS....
2
4
5
10
11
11
12
13
14
14
16
22
23
55
74
86
92
100
106
Introduccin a la Estadstica
El trmino estadstica tiene, entre otros, dos significados de uso comn. De un lado se entiende
estadstica como dato; y en tal sentido los gobiernos cuentan con institutos que se encargan de
preparar y difundir estadsticas pblicas. Pero, de otro lado, se entiende como una disciplina
cientfica, cuya importancia es cada da mayor.
En realidad siempre han existido estadsticas, en un inicio, de forma muy elemental, como cuando
se utilizaban diversos smbolos utilizando pieles, rocas, palos o cualquier otro objeto, para
representar cuentas de personas, animales o ciertas cosas. En la antigedad los babilonios usaban
pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola; los egipcios
llevaban cuentas sobre la poblacin y las cosechas; el libro bblico de Nmeros presenta el
informe de dos censos de la poblacin de Israel, etc.
El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la
poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media, en
Europa, slo se realizaron algunos censos exhaustivos.
El origen etimolgico de la palabra estadstica no est bien determinado, puesto que existen
distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa
balanza, otros sostienen que deriva del latn STATUS que significa situacin, mientras que
algunos autores afirman que procede del latn STAAT que significa estado. En el caso concreto
de suponer que viene del vocablo estado, es por el hecho que una de las funciones tradicionales
del gobierno central y del estado es llevar registros sobre la situacin de la poblacin,
nacimientos, defunciones, produccin, impuestos y otros hechos contables o de control.
Kennedy- Neville, asevera que La Estadstica es una ciencia que comprende la recopilacin,
tabulacin, anlisis e interpretacin de los datos cuantitativos y cualitativos.
William Gunther establece que La Estadstica es un campo de ensayo en el que se recogen y
analizan datos con el propsito de sacar conclusiones proporciona instrumentos para la toma de
decisiones cuando prevalecen condiciones de incertidumbre.
Proponer ahora una definicin de la Estadstica puede resultar poco significativa porque no se
lograra precisar se esencia, su cobertura y los hechos que estudia esta ciencia. A manera de
informacin, conviene indicar que hace ms de un siglo Gustavo Rumelin sostena que haba por
lo menos 63 definiciones de Estadstica, y que pueden aadir otras si se tiene en cuenta el avance
de esta disciplina.
La funcin principal de la Estadstica es elaborar principios y mtodos que nos ayuden a tomar
decisiones frente a la incertidumbre sostiene Ya Luu Chou, por esta razn, podra definirse la
Estadstica como un mtodo de toma de decisiones frente a la incertidumbre. Y cuyo objetivo
principal de la Estadstica es Reunir una informacin cuantitativa concerniente a individuos,
grupos, serie de hechos, etc. y deducir de ello gracias al anlisis de estos datos, unas previsiones
para el futuro.
La Estadstica como ciencia cumple los aspectos principales del mtodo cientfico, tales como:
Realizacin de experimentos y observaciones;
Obtencin de conclusiones o proposiciones objetivas a partir de los resultados de dichos
experimentos y observaciones,
Formulacin de leyes que simplifiquen la descripcin de un gran nmero de experiencias u
observaciones.
2. Objetivos de la Estadstica
En trminos generales los objetivos de la estadstica pueden ser clasificados o agrupados en tres
grandes captulos: Descripcin, Anlisis y Prediccin.
Descripcin de grandes colecciones de datos empricos, segn la terminologa de R.A. Fisher, este
proceso se conoce con la denominacin de reduccin de datos. La descripcin supone que los
datos que vienen expresados en su forma natural deben ser clasificados y presentados
sistemticamente en cuadros o tablas como una primera reduccin de datos propiamente dicha
se obtiene cuando en comportamiento y caractersticas de los datos se expresan por un conjunto
de indicadores, medidas de resumen o estadgrafos.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos
peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos y
hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
mtodo cientfico, de tal forma que cuando se crearon los estados nacionales y surgi como
fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que
Enrique VII tema por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los
clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que
apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas
semanales de los decesos. Esa costumbre continu muchos aos y en el ao 1632 estos BILLS OF
MORTALITY (CUENTAS DE MORTALIDAD) contenan los nacimientos y fallecimientos por sexo. En
1662 el capitn John Graunt us documentos que abarcaban treinta aos y efecta predicciones
sobre el nmero de personas que moriran de varia enfermedades y sobre las proporciones de
nacimiento de varones y mujeres que cabra esperar.
El trabajo de Graunt, condensado en su obra NATURAL AND POLITICAL OBSERVATIONSMADE
UPON THE BILLS OF MORTALITY (OBSERVACIONES POLTICAS Y NATURALES HECHAS A PARTIR
DE LAS CUENTAS DE MORTALIDAD), fue un esfuerzo innovador en el anlisis estadstico.
En Amrica latina es posible encontrar algunos antecedentes estadsticos en la poca PREcolombina. An cuando los pobladores del tahuantinsuyo no conocan la estadstica como tal,
estaban familiarizados con datos e informes sobre aspectos demogrficos y econmicos.
En el Imperio Incaico exista la costumbre de registrar todos los hechos demogrficos y
socioeconmicos, la cual permiti desarrollar tcnicas de recopilacin y archivo de datos. El Inca y
su esforzada lite cooperadora, conocan por medio de los Quipus el potencial humano y
econmico del Imperio y, en consecuencia, deducan las necesidades que deban satisfacer.
El Quipu consista en un cordn central de lana del que pendan otros cordones unidos por otros,
que se diferenciaban entre s por su grosor, color, nmero y forma de nudos. El nudo dice
Gracilaso de la Vega, expresa el nmero pero no la palabra. La Yupana o Abaco, era el accesorio
del Quipu, y facilitaba el clculo de grandes cantidades. El Quipu Camayoc era el funcionario que
conoca la tcnica del registro por medio de los nudos. En el Cusco se ubicaba la Oficina Central de
los Quipus.
El Quipu sirvi a los antiguos peruanos para levantar los censos de poblacin de cada cierto
nmero de aos. El Imperio Incaico era una sociedad veraz y, por tanto todos los habitantes
estaban acostumbrados a decir la verdad en el acto censal.
Poco tiempo despus el Clculo de Probabilidades toma un gran impulso debido a los trabajos de
los franceses Borel, Frchet y Levy, y de los rusos Tchevyshev (1821-1894), Tchuprov, Markov,
Kintchine y Kolmogorov (nacido en 1903). Entre los ingleses destac el clrigo Toms Bayes.
Cabe destacar el aporte de Adolph Quetelet primer presidente de la ISI (1796-1874) que fue el
primero en aplicar mtodos estadsticos modernos al estudio de conjuntos de datos, razn por la
cual se le reconoce como padre de la Estadstica Moderna.
Durante el siglo XIX y a principios del XX el trabajo estadstico se caracteriza por el estudio de
grandes masas de datos. La idea bsica era la coleccin completa de datos. Pero, a principios del
siglo XX y especficamente alrededor de los aos treinta, se produjo un nuevo giro en el desarrollo
de la Estadstica. Naci la Estadstica Moderna, la Estadstica Inductiva o Inferencia Estadstica, la
Estadstica Analtica. Se espera obtener informacin de cada detalle en particular; actualmente se
buscan mtodos que hagan posibles obtener conclusiones generales a partir de muestras y de
estudios parciales. En la Estadstica moderna, la palabra clave es MUESTRA.
Estos cambios en la teora y prctica estadstica requirieron cada vez ms de las matemticas
superiores, entonces surge la Estadstica Matemtica, cuyos procedimientos caractersticos son el
anlisis de la varianza, el clculo de correlaciones y las pruebas de hiptesis estadsticas.
10
11
o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se seala como
el verdadero precursor de los sondeos.
Ms tarde, Bufn se preocupa de esos problemas antes de dedicarse a la historia natural.
La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus
tres principales representantes son Graunt, Petty y Halley. El penltimo es autor de la famosa
Aritmtica Poltica.
Chaptal, ministro del interior francs, publica en 1801 el primer censo general de poblacin,
desarrolla los estudios industriales, de las producciones y los cambios, hacindose sistemticos
durante las dos terceras partes del siglo XIX.
12
13
14
5. Clasificacin de variables
5.1. Por su Naturaleza
5.1.1. Cualitativas: Expresan una cualidad de la unidad elemental o de anlisis. Ej. Lugar
de procedencia, Lugar de nacimiento, sexo, etc.
5.1.2. Cuantitativas: Expresan una cantidad, la cual puede obtenerse mediante procesos
de conteo o de medicin haciendo uso de algn instrumento de medida para dicha
variable; por lo que a su vez se pueden subdividir en:
5.1.2.1.
5.1.2.2.
Continuas: Expresan cantidades usando los nmeros reales, los cuales son
obtenidos mediante procesos de medicin utilizando algn instrumento de
medida. Ej. Peso de un recin nacido, Tiempo de vida de una lmpara
incandescente, estatura de una persona, etc.
15
5.4.2.Temporales (Series de tiempo). Los valores estn asociados al tiempo en que fueron
registrados de la fuente primaria. Ejemplo: Preferencia electoral actual, ventas
mensuales, etc.
5.5. Por la amplitud
5.5.1. Individuales: Se refieren a las caractersticas de las unidades elementales, como
por ejemplo personas
5.5.1.1. Privadas: Se refieren a las caractersticas de las unidades elementales que
voluntariamente permiten su observacin, por ejemplo: Coeficiente de
inteligencia, Nivel de estrs, etc.
5.5.1.2. Pblicas. Se refieren a caractersticas que pueden ser observadas incluso
sin el permiso del individuo, por ejemplo: Sexo, raza, color de cabello, etc.
5.5.2. Colectivas: son caractersticas que se refieren a colectivos de unidades
elementales, por ejemplo: Tasa de morbilidad en una poblacin, inflacin, etc.
6. Operacionalizacin de variables
Es el proceso mediante el cual se hace medible una variable con un nivel de abstraccin
elevado o que no es directamente medible.
16
DIMENSIN
INDICADOR
(Variable terica)
(Variable Emprica)
del hogar
Es el entorno en que el
NSE:
Es una caracterstica de un
hogar. El hogar obtiene su
NSE a partir de
caractersticas propias del
mismo y el entorno en que
se mueve. La primera
forma la parte econmica
del NSE y la segunda la
parte socio del NSE.
Adems, el NSE incorpora
tanto caractersticas fsicas
de la vivienda que habita el
hogar, como de las
personas que integran al
hogar.
Valores o
cualidades
Nmero
I5: Turismo
Turismo nacional,
Turismo local,
No hace turismo
En nuevos soles
En nuevos soles
Uso particular del ao
I8: Vehculos
1. Nivel Alto A1: En esta categora se encuentran las personas que tienen un nivel de
estudios Superior / post-grado, con un promedio en aos de estudios de 17.5. Estas
personas ocupan cargos de Gerentes Generales cuyo ingreso es de $5000. Y tienen
un gasto promedio mensual de $750 en alimentos. En servicios de televisin a
control remoto es al 100% de igual manera en tenencia de telfono y servicios
domsticos.
2. Nivel Medio Superior A2: En esta categora se encuentran las personas con un nivel
de estudios Superior Universitarios, con un promedio de aos de estudios de 16.8.
Estas personas ocupan cargos profesionales independientes / dependientes.
Con un ingreso familiar mensual ms de $2000, y tienen un gasto promedio
mensual de $450 en alimentos.
En servicios de tenencia de televisin a control remoto es de 100% de igual
manera en tenencia de telfono y servicios domsticos.
17
3. Nivel Medio Tpico B1: En esta categora se encuentran las personas con un nivel
de estudios Superior Universitario, con un promedio en aos de estudios de 16.7.
Estas personas ocupan cargos profesionales independientes / dependientes. Con
un ingreso familiar mensual mas de $1000, y tienen un gasto promedio mensual de
$280 en alimentos. En servicios de tenencia de televisin a control remoto es de
92% en tenencia de telfono es de 96% y en servicios domsticos es de 67%.
4. Nivel Medio Inferior B2: En esta categora se encuentran las personas con un nivel
de estudios Universitario y no Universitario, con un promedio en aos de estudios
de 15.1. Estas personas ocupan cargos especializado/ profesional independiente.
Con un ingreso familiar mensual mas de $780, y tienen un gasto promedio mensual
de $235 en alimentos. En servicios de tenencia de televisin a control remoto es
de 82% en tenencia de telfono es de 92% y en servicios domsticos es de 32%.
5. Nivel Bajo Superior C1: En esta categora se encuentran las personas con un nivel
de estudios Superior no Universitario/ Secundaria, con un promedio en aos de
estudios de 13.1. Estas personas ocupan cargos pequeos Comerciantes/ Trabajo
especializado Con un ingreso familiar mensual mas de $400, y tienen un gasto
promedio mensual de $180 en alimentos. En servicios de tenencia de televisin a
control remoto es de 77% en tenencia de telfono es de 73% y en servicios
domsticos es de 8%.
6. Nivel Bajo Inferior C2: En esta categora se encuentran las personas con un nivel
de estudios Secundaria, con un promedio en aos de estudios de 10.6. Estas
personas ocupan cargos pequeos Comerciantes/ Trabajo especializado Con un
ingreso familiar mensual mas de $320, y tienen un gasto promedio mensual de
$150 en alimentos. En servicios de tenencia de televisin a control remoto es de
61% en tenencia de telfono es de 56% y en servicios domsticos es de 2%.
7. Nivel Muy Bajo D: En esta categora se encuentran las personas con un nivel de
estudios Secundaria/ Primaria, con un promedio en aos de estudios de 8.8. Estas
personas ocupan cargos como Empleado poco especializado/ Obrero con un
ingreso familiar mensual mas de $230, y tienen un gasto promedio mensual de
$135 en alimentos. En servicios de tenencia de televisin a control remoto es de
42% en tenencia de telfono es de 25% y en servicios domsticos es de 1%.
8. Nivel Bajo Extremo E : En esta categora se encuentran las personas con un nivel
de estudios Primarios, con un promedio en aos de estudios de 6.2. Estas personas
ocupan cargos como Obrero eventual/ Ambulante con un ingreso familiar mensual
mas de $150, y tienen un gasto promedio mensual de $105 en alimentos. En
servicios de tenencia de televisin a control remoto es de 16% en tenencia de
telfono es de 7% y en servicios domsticos es de 0%.
A2
B1
18
B2
C1
C2
Caractersticas
dominantes
% de hogares en Lima
Metropolitana
Alto
Medio superior
Medio Tpico
Medio
inferior
Bajo superior
Bajo inferior
Muy Bajo
Bajo Extremo
0.8
3.5
6.5
8.8
10.9
21.5
36.1
11.9
Superior
universitaria /
Postgrado
Superior
universitaria
Superior
universitaria
Superior
universitaria /
no
universitaria
Superior no
universitaria /
secundaria
Secundaria
Secundaria
/ Primaria
Primaria /
Secundaria
17.5
16.8
16.7
15.1
13.1
10.6
8.8
6.2
Profesional
Independiente /
Dependiente
Profesional
Independiente /
Dependiente
Trabajador
especializado
/ Profesional
Independiente
Pequeo
comerciante /
Trabajador
Especializado
Pequeo
comerciante /
Trabajador
Especializado
Empleado
poco
especializa
do / Obrero
Obrero eventual
/ ambulante
+ us$ 5,000
+ us$ 2,800
Us$ 1,000
Us$ 780
Us$ 400
Us$ 320
Us$ 230
Us$ 150
Us$ 750
Us$ 450
Us$ 280
Us$ 235
Us$ 180
Us$ 150
Us$ 135
Us$ 105
100%
100%
92%
82%
77%
61%
42%
16%
100%
100%
96%
92%
73%
56%
25%
7%
8%
2%
1%
0%
100%
100%
67%
32%
Del ao
De 1 ao
De 3 aos
De 4 aos
7. Recoleccin de datos
Es el uso de tcnicas e instrumentos para recopilar informacin acerca de un determinado
tema que es objeto de investigacin. Es una de las tareas ms importantes en la
investigacin, pues de ello depende la calidad de conocimiento que se pueda obtener en
dicha investigacin.
7.1. Etapas de la recoleccin de datos:
a.
b.
c.
Revisin y crtica: Esta etapa se realiza en dos momentos, la primera a cargo del
supervisor de encuestadores, se realiza en el escenario mismo de la recoleccin de
datos y la segunda a cargo del equipo de investigacin y se realiza en el centro de
operaciones de la investigacin. La actividad consiste en revisar que los datos sean
consignados en el instrumento de acuerdo a lo previsto guardando la coherencia
correspondiente a cada informante. Finalmente comprende la codificacin de las
respuestas abiertas si las hubiera.
d.
19
e.
20
Tipos de Observacin: Observar sin ser detectado, observar siendo detectado sin
intervenir, observar e intervenir o interactuar con la persona observada.
Preparacin para la observacin: Determinar y definir aquello que va a observarse.
Estimar el tiempo necesario de observacin. Obtener la autorizacin de la gerencia
para llevar a cabo la observacin. Explicar a las personas que van a ser observadas
lo que se va a hacer y las razones para ello.
Sesin de Grupo. Consiste en reunir a todos los participantes del proyecto para
generar alternativas de solucin ante un determinado problema. La lluvia de ideas
es una de las tcnicas ms utilizada en estos casos en donde cada miembro hace
sus aportaciones y al final se decide por votacin cuales sern las alternativas ms
adecuadas frente al problema planteado.
8. Instrumentos de recoleccin de datos.
De acuerdo al tipo de variable existen instrumentos apropiados para la recoleccin de datos;
as, tenemos que para las variables naturales o fsicas, existen hojas de registro o
instrumentos fsicos para cada caso, por ejemplo, para medir el peso, se puede utilizar una
balanza, para medir una distancia, se puede utilizar el metro, para medir el voltaje del fluido
elctrico, se puede utilizar el voltmetro, etc.; en cambio para variables sociales se suelen
utilizar los cuestionarios, los mismos que deben ser elaborados cuidadosamente para
recolectar adecuadamente los datos que se necesitan.
a. Propiedades de los Cuestionarios: Cada uno de los tems de un cuestionario debe tener las
propiedades de validez y confiabilidad. Validez, significa que el tem debe medir lo que se
pretende medir, y confiabilidad, significa que cada tem debe medir siempre lo mismo
cuanta veces sea utilizado.
b. Partes de un cuestionario:
i. Nombre de la Institucin: a la que pertenece o est adscrito el proyecto de
investigacin, podra ser suficiente con el logo institucional, el cual se suelo colocar
en la parte superior izquierda. A esta misma altura pero al lado derecho se coloca un
espacio para la numeracin correlativa de los cuestionarios N ___ , lo cual permitir
una fcil ubicacin en la base de datos.
ii.
iii.
iv.
v.
21
9.
1
2
3
Superior tcnica
Superior Universitaria .
Post Grado (Ms, o Dr.)..
4
5
6
ii. Preguntas abiertas: Son aquellas en las que se solicita una opinin o que describa una
cierta problemtica. La ventaja de esta clase de preguntas radica en que permite
capturar el sentir de exacto del informante cuando se le pide una opinin, sin embargo
la desventaja est en la gran laboriosidad que implica la identificacin de la o las ideas
principales de las respuestas en el momento de su codificacin, se requiere mucho
esfuerzo, tiempo y capacidad de sntesis, motivo por el cual hay una tendencia a evitar
en lo posible esta clase de preguntas en un cuestionario.
Ejemplo:
Si el establecimiento de salud en el que se hicieron atender, queda fuera de Chiclayo, Cul fue el
principal motivo por el que se traslad o trasladaron a dicha localidad?
iii.
Preguntas Semicerradas: son aquellas preguntas que debiendo haber sido abiertas
se ha hecho un esfuerzo a travs de grupos focales de proponer cierto nmero de
alternativas de solucin, de las cuales la ltima es abierta
Ejemplo
Por qu no se atendi por la enfermedad que present?
Horario inapropiado
Atencin lenta .
Maltrato
Servicio alejado ..
Falta de Medicinas .
b.
22
1
2
3
4
5
No confa en Servicio ..
No hay mdico
No tiene dinero
No era necesario.
Dificult. P Comunic. .
Otro: (especifique)______________
6
7
8
9
10
11
i. Respuesta nica: Slo admiten una nica respuesta, de una lista de alternativas
posibles.
Cul es su estado civil?
Soltero(a)
Casado(a)
Viudo(a).......
4
5
6
Divorciado(a)
Conviviente
Separado..
1
2
3
c.
1
2
3
Agua Potable
Desage
Luz elctrica
4
5
6
Por su graduacin
i. Preguntas valorativas: Se suelen utilizar para asignar valoraciones en una escala
especfica, generalmente entre 0 y 10, acerca del grado de aceptacin o conformidad
con un servicio, de la intencin de acudir o tomar un servicio, o acerca de un
desempeo.
Durante su permanencia en el establecimiento cmo valora el trato general que le
brindaron?. Utilice una escala entre 0 y 10, teniendo en cuenta que:
0
Psimo
10
Excelente
ii.
1
2
3
4
5
23
se suele registrar en formato electrnico como una hoja de Excel o algn software estadstico
como el SPSS.
Ejemplo: A continuacin se presenta una base de datos de 8 variables de respuesta nica
correspondiente a 12 informantes en formato Excel.
Variables: Sexo, Edad, Escuela, ., N de dormitorios
Informante
Depart.
Proced.
1=Lamb.
2=Piura
1=Estad.
3=Cajam.
2=Matem.
4=Amaz.
3=Fsica.
5=Tumbes
4=Comp.
6=SanMart.
5=Ing.Electr. 7=Otros
Escuela
Sexo
N
1=Varn Edad
cuest. 2=Mujer (aos)
1
2
3
4
5
6
7
8
9
10
11
12
2
1
2
1
2
1
2
2
2
1
1
1
20
18
18
18
19
18
18
21
18
21
20
20
2
2
2
1
2
2
2
2
2
2
2
2
2
1
1
3
3
1
1
1
1
1
1
1
Distrito de
residencia
Condicin
N de
Tenencia de
miembros
Vivienda
Nmero de
del hogar
1=Propia
dormitorios
nuclear
2=Alquil.
1=Chiclayo
2=J.L.O.
(padre,
3=La.Victoria
4=Lambayeque madre e
hijos)
5=Otro
1
1
4
4
2
2
2
5
1
4
1
5
5
4
4
7
5
6
4
6
4
3
5
4
3=Cedida
4=Invasin
5=Otra
1
1
1
2
2
1
2
1
1
1
1
1
4
2
5
1
2
3
2
3
6
3
6
3
24
variable. Cada una de las filas se utilizan para definir una variable de
respuesta nica.
25
Varn 1
Mujer 2
26
Note que la primera fila siempre es utilizada para definir la numeracin correlativa
de los cuestionarios por lo que se le suele dar el nombre de nmero. A partir de
la segunda fila se definen los campos para cada una de las variables que
aparecen en el cuestionario.
Al visualizar la otra hoja vista de datos, aparecer la siguiente presentacin:
27
Condiciones de
Estudio:
Se refiere a cada una
de las condiciones de
estudio que tuvieron
en el semestre
acadmico 2013-I
los estudiantes
universitarios de
Lambayeque, en
cuanto a lugar de
procedencia,
caractersticas del
hogar, carga
acadmica, recursos
de apoyo al estudio,
y situacin laboral.
Dimensiones
Informacin general
Caractersticas el
hogar
Carga acadmica
Indicadores
Valores / categora
Sexo
Edad
Escuela Profesional
Dpto. procedencia
Distr. residencia
N de miembros del hogar
Tenencia de la vivienda
N de dormitorios de la vivienda
Servicios de la vivienda
Varn, Mujer
Si, No
N de cursos matriculados
N de cursos aprobados
Nmero
Recursos de apoyo al
estudio
N de textos adquiridos
Fuentes de consulta
Tenencia de computadora
Ocupacin laboral
N de horas de trabajo a la semana
Situacin laboral
Actividad en el trabajo
28
Aos
Estadstica, Fsica,
Lambayeque, Piura, ..
Lambayeque, ..
Nmero
Propia, alquiler, .
Nmero
Luz, Agua, .
Nmero
N ____
Objetivo: Medir la relacin entre el rendimiento acadmico y las condiciones de estudio en estudiantes universitarios
I.
Informacin General
4.
II.
1.
) 5. Ferreafe ( )
4.
5.
2. Desage (
3. Electricidad (
4.Telfono (
5. TV Cable (
6. Internet
III.
2.No ( )
Cuntos textos adquiri para apoyar sus estudios en el semestre 2014-II?: _____
10.
Cul fue su fuente habitual de consulta, para hacer sus trabajos acadmicos en el semestre 2014-II?:
1. Libros propios( ) 2. Biblioteca ( )
3.Internet ( )
4.Otro ( ): _______________
11. Ud. tuvo acceso a usar una PC o Latop personal en su casa en el semestre 2014-II?:
1.Si ( )
2.No
V.
Situacin laboral
( )
12. Ud. realiz alguna ocupacin laboral regular en el semestre 2014-II? (Incluye trabajo remunerado o no
remunerado en algn negocio familiar): 1. Si
2. No ( ) Pase a pregunta 14
13. Cul fue la actividad principal que realiz en su trabajo?:_________________________
VI.
Rendimiento Acadmico
Muchas gracias
Fecha: ____ / ___ / ____
29
Encuestador:______
Ni n j
j 1
30
Ni n j
j i
hi
ni
n
donde
h 1
i 1
hi %
ni
100
n
Hi %
Ni
100
n
Hi %
Ni
100
n
3. Fuente: Expresa el lugar de donde fueron obtenidos los datos, de modo tal
que cualquier persona pueda acudir a la fuente y encontrarlos. Cuando el
investigador que presenta una tabla de frecuencias es el que obtuvo los datos
directamente del informante utilizando sus propios instrumentos, no es
necesario que escriba la fuente, en virtud que l mismo es el autor.
31
Jefe de
hogar
Chic=1
Lamb=2
Ferr=3
Cajam=4
Piura=5
Otros=6
N Personas
por hogar
Edad
(aos)
Peso
(Kgr.)
Cuenta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
1
1
6
1
2
1
1
1
1
2
1
1
3
1
1
2
4
1
1
2
1
4
2
1
1
1
3
1
1
2
1
1
2
1
1
5
1
3
1
6
1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4
3
5
4
3
3
4
5
4
3
5
3
3
4
3
4
6
2
5
2
6
42
39
35
41
50
39
33
30
26
32
35
26
43
40
30
46
47
38
38
45
28
43
37
36
40
32
38
49
54
31
33
44
43
25
31
34
34
36
35
36
66.6
59
69.2
73
66.3
58.6
67.5
66.1
63.1
55.8
69.1
53.9
64.4
72.2
64.4
68.1
73.2
60.5
66.4
61.9
69.1
57.9
62.7
65.7
63.8
71.6
52.4
61.9
58.8
67
63.8
73.4
61.3
61.3
66
69.8
71.1
76.9
67.2
65.9
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
32
33
i 1
n 40
h
i 1
h % 100
i 1
A continuacin se presenta los pasos para hacer esta tabla con ayuda
del Excel
34
35
36
Lugar de
N de
procedencia hogares
Chiclayo
25
Lambayeque
7
Ferreafe
3
Cajamarca
2
Piura
1
Otros
2
Total
40
Proporcin de
hogares
0.625
0.175
0.075
0.05
0.025
0.05
1
% de
hogares
62.5
17.5
7.5
5.0
2.5
5.0
100
37
N de hogares
II
=2
IIIII II
=7
IIIII IIIII II
= 12
IIIII IIIII
= 10
IIIII I
= 6
III
= 3
= 40
Total
40
100
38
%
Acumulado
de
hogares
5.00
22.50
52.50
77.50
92.50
100.00
N
Acumulado
de
hogares
40
38
31
19
9
3
%
Acumulado
de
hogares
100
95
77.5
47.5
22.5
7.5
n
i 1
n 40
h
i 1
donde hi
ni
n
h % 100
i 1
donde
hi %
ni
100
n
39
n
j 1
Ni
Nm n
donde
h % H %
j 1
o tambin
Ni
100 H i % y H m % 100
Nm
n
j i
Ni
donde
N1 n
N m nm
40
h % H %
j i
H1 % 100%
o tambin
Ni
100 H i % y
Nm
H m % h1 %
La elaboracin de este tipo de tablas con ayuda del Excel es similar que para el
caso de variables cualitativas, solo que en este caso se completa con las
frecuencias acumuladas.
Segundo caso: Cuando la variable tiene muchos valores diferentes. En este
caso las clases estn constituidas por intervalos, para lo cual se siguen los
siguientes pasos:
1 Paso: Determinar el Rango
R = Mximo Mnimo
2 Paso: Elegir o calcular el nmero de clases m
Este nmero depende del nmero de observaciones, en algunos
casos se desea construir una tabla de modo tal que sirva para hacer
comparaciones con otros estudios, en tal caso el nmero de clases
queda determinado por la amplitud de clase deseada para hacer
dichas comparaciones. Si ste no fuera el caso, se adoptar algunas
frmulas para obtener este nmero de clases, a continuacin se
presentan algunas:
m 1 3.322 Log (n) . (1) regla de Sturges
m Log (n) (2)
m n (3)
Donde
es en nmero de datos
41
R
C
m
Donde:
[ ] : Significa que el cociente R es redondeado al menor mayor
m
R 28
C 5.6 6
m 5
R 27
C 5.4 6
m 5
R 25
C 3.571 3.6
m 7
42
)
)
)
)
43
Total
40
%
Acumulado
de jefes
de hogar
10
N
Acumulado
de jefes
de hogar
40
%
Acumulado
de jefes
de hogar
100
30
55
85
95
100
36
28
18
6
2
90
70
45
15
5
100
Note en esta tabla que la Variable Edad del jefe del hogar, aparece en el
ttulo de la tabla y en el encabezamiento.
Frecuencias absolutas simples (ni): Nmero de jefes de hogar, aparecen en
la segunda columna, as tenemos que: n1 = 4, significa que existen 4
jefes de hogar con edades comprendidas entre 25 y 30 aos, n2 = 8,
significa que existen 8 hogares con edades comprendidas entre 30 y 35
aos, as sucesivamente. Finalmente el nmero total de datos est dado
por la suma de todas las frecuencias absolutas simples, que en este
44
n
i 1
n 40
i 1
donde hi
ni
n
h % 100
i 1
donde
hi %
ni
100
n
n
j 1
Ni
donde
Nm n
45
h % H %
j
j 1
o tambin
Ni
100 H i % y H m % 100
Nm
n
j i
Ni
N1 n
donde
N m nm
h % H %
j i
o tambin N i 100 H i %
H1 % 100%
Nm
H m % h1 %
46
Tallo
7
8
9
10
11
12
13
14
15
16
17
Hojas
6
7
7
5
5
1
4
2
4
3
8
1
8
0
1
9
7
0
5
0
3
3
5
1
7
4
5
8
3
3
4
3
3
4
0
1
5
1
0
5
6
6
8
0
2
9
8 6 8 0 8
8 7 9
1 0 6
47
Frecuencia
1
1
1
2
3
3
6
8
12
10
10
18
19
20
21
22
23
24
13.2.
0
9
7
8
1
7
5
3
6
1
6 1 4 1 0
0 9 3 4
0 8
7
6
4
1
3
1
1
80
Grfico de barras:
Est constituido como su nombre lo indica por barras separadas, las
mismas que pueden ser horizontales o verticales con ancho arbitrario,
pero con una longitud proporcional a la frecuencia representada. Se
recomienda su utilizacin para variables cualitativas, de preferencia se
recomienda tambin ordenar las categoras, segn su frecuencia, de
mayor a menor, de modo que facilite su interpretacin. Si la variable
cualitativa tiene pocas categoras se pueden utilizar barras verticales (o
columnas), y si tiene muchas categoras, entonces se recomienda
utilizar barras horizontales, por la facilidad para colocar el nombre de
cada categora. A continuacin se presenta el grfico para la tabla N 2
de la variable Lugar de procedencia de los jefes de hogar.
48
49
13.6.
Ojivas de frecuencias
Se utiliza para representar frecuencias acumuladas menor y mayor que
y su mayor utilidad est en que permite encontrar cualquier percentil, a
travs de la extrapolacin.
50
3.7.
51
Laboratorio 1
1. Considere que se desea determinar el nivel de satisfaccin de los estudiantes
de Ing. Industrial por las clases que reciben en su Universidad. Para medir la
satisfaccin considere las siguiente dimensiones: Aspectos tangibles, como son
por ejemplo las aulas y los laboratorios y las bibliotecas, cumplimiento de
obligaciones del profesor y estudiante, nivel acadmico de las clases y exhibido
por el profesor, metodologa de profesor en el aula y actitud del profesor hacia
los estudiantes. Proponga un cuestionario para medir esta satisfaccin en los
estudiantes. Sugerencia, Utilice una escala de Lickert.
2. El gerente de ventas de una tienda de prendas de vestir desea saber cul ser
la demanda de pantalones en el prximo mes, as como las tallas que ms
demanda tendrn. Si el gerente dispone de un registro del total de las ventas
realizadas por la tienda durante los 10 meses anteriores y usa esta informacin
como una muestra para predecir las ventas del prximo mes, Cul es la
poblacin?
52
de escala a usar:
Caso
Poblacin
Unidad
estadstica
Variable
Escala
de
medida
a. Estado civil?
b. Satisfaccin por un servicio de lavado de carros?
c. Tamao familiar de un hogar nuclear?
d. Servicios que dispone una vivienda?
7. Un profesor propone a sus alumnos del curso de aritmtica, una prueba de 10
ejercicios de clculo de sumas. Si alguno de los ejercicios presenta, al
resolverlo, algn error de clculo, el profesor califica la pregunta con 0, de otro
modo la califica con 1.
53
Marca de clase
..
6
..
14
..
Frec. relativa
0.10
0.55
0.10
0.25
0.9
10. Entre todos los estudiantes de la asignatura aplicar el cuestionario que aparece
como ejemplo en la pg. 29 aplicar a todos los estudiantes. La informacin
diligenciada en los cuestionarios deben ser digitados en una base de datos en
formato Excel y agregarlo a la base que contiene la misma informacin de otros
grupos de estudiantes universitarios de Lambayeque, (en archivo Excel adjunto
a este material) con la cual deben elaborar todas las tablas y grficos que
corresponda a un anlisis descriptivo. Con las tablas de frecuencia de variables
cuantitativas elabore todas las clases de frecuencia y construya un grfico para
cada tabla. Finalmente presente sus resultados con un anlisis descriptivo para
cada variable, se acuerdo a la siguiente gua:
a. Elabore la distribucin del Departamento de procedencia segn
universidad
b. Elabore la distribucin del Distrito de residencia segn universidad
c. A partir de la fecha de nacimiento, calcule la edad de los estudiantes
expresado en aos con dos decimales.
d. Categorice la edad calculada en aos exactos en intervalos quinquenales
[15.00 19.99], [20.00 24.99], [25.00 29.99], as sucesivamente.
54
55
1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4
3
5
4
3
3
4
5
4
3
5
3
3
4
3
4
6
2
5
2
6
56
57
1
1 + 2
Donde:
=
=
1 =
2 =
=
=
=
Ejemplo
Considere los puntajes obtenidos en la prueba de conocimientos por
los 261 postulantes a la Academia de Diplomticos del Per en el
proceso de admisin 2015. Los datos se presentan en la siguiente
tabla N 5.
Se aprecia aqu que:
Frecuencia modal es igual a 54 ( = 54 )
Intervalo de la clase modal: [11.375 12.500)
Lmite Real Inferior LRI = 11.375
Frecuencia anterior a la modal: = 50
58
59
4 1.125
= 11.675
4 + 11
fmo = 30
N de estudiantes
18
30
20
30
12
8
2
120
LRI
19 20
19.5
2
C = 24.5 19.5 = 5
1 = 30 18 = 12
2 = 30 20 = 10
M o (1) LRI
1 C
12 5
19.5
19.5 2.727 22.227 aos
1 2
12 10
LRI
29 30
29.5
2
C = 34.5 29.5 = 5
1 = 30 20 = 10
2 = 30 12 = 18
M o (2) LRI
1 C
10 5
29.5
19.5 1.786 31.286 aos
1 2
10 18
60
Note que en este caso las clases modales o con la ms alta frecuencia
absoluta simple, se encuentran separadas, conteniendo cada una de ellas
una moda, por lo que a esta clase de distribuciones de les conoce como
Distribuciones Bimodales
Ejemplo 5. Consideremos ahora que las dos clase con las mximas
frecuencias estn juntas una a continuacin de la otra
Tabla N 3 Edad de estudiantes universitarios de la escuela de Estadstica
UNPRG, a Octubre del 2012.
Edad (aos)
15
20
25
30
35
40
45
19
24
29
34
39
44
49
Total
fmo = 30
N de estudiantes
18
30
30
20
12
8
2
120
LRI
19 20
19.5
2
C = 24.5 19.5 = 5
1 = 30 18 = 12
2 = 30 30 = 0
M o (1) LRI
1 C
12 5
19.5
19.5 5 24.5 aos
1 2
12 0
61
LRI
24 25
24.5
2
C = 34.5 29.5 = 5
1 = 30 30 = 0
2 = 30 20 = 10
M o (2) LRI
1 C
05
24.5
24.5 0 24.5 aos
1 2
0 10
Note que aun cuando en este caso existen dos clases con la ms alta
frecuencia, es decir dos clases modales, sin embargo, la
distribucin es Unimodal, debido a que ambas clases estn una
a continuacin de la otra, en este caso la moda se ubica en el lmite
real entre las dos clases modales.
13.6.1.
Cuantiles de orden j: Son medidas de orden que
dividen a una serie ordenada de datos en j-partes iguales,
para todo j = {2, 4, 5, 10, 100}. Segn el valor que tome j, el
cuantil toma un nombre especfico:
Si j = 2 entonces Cuantil (2) = Mediana
Si j = 4 entonces Cuantil (4) = Cuartil
Si j = 5 entonces Cuantil (5) = quintil
Si j = 10 entonces Cuantil (10) = Decil
Si j = 100 entonces Cuantil (100) = Percentil
62
M e X n 1
Cuando n es impar:
2 Paso:
= (9+1) = 5 = 7
2
63
1
M
Cuando n es par:
e
n
n2
2 2
2
2 Paso:
Me
1
1
1
X 10 X 102 X 5 X 6 7 8 7.5
2 2
2
2
2
N i1 C
2
M e LRI
ni
Donde:
n
n
= Identificador de la clase de la mediana en la columna de las
2
frecuencias absolutas acumuladas menor o igual que
LRI
Amplitud de clase
ni
64
Ni 1
Demostracin
Para la siguiente Tabla de datos:
i
1
2
3
4
5
Intervalo
A: [
B: [
C: [
D: [
E: [
Total
,
,
,
,
,
)
)
)
)
)
Frecuencia
absoluta simple:
ni
n1
n2
n3
n4
n5
n
Frecuencia absoluta
acumulada menor que:
Ni
N1
N2
N3
N4
N5
= 2
( 1 )
= 2
= +
65
(2 1 )
66
n 80
40 la clase de la mediana ser [16 18]
2 2
LRI
15 16
15.5
2
C 3
ni 27
Ni1 37
80
37 3
9
2
M e 15.5
15.5
15.83
27
27
M e 15.83 Kgrf / cm 2
67
68
in
N i 1 C
4
para todo i =1, 2, 3
Qi LRI
ni
Donde:
in
ni
69
Para el Cuartil 1: Q1
i = 1
1 n 1 260948
65237 La clase de Q1 es: [10 14]
4
4
LRI
9 10
9.5
2
C 5
ni 24977
Ni1 43382
1 260948
43382 5
Q1 9.5
13.875
24977
Q1 13.875 aos
25%
75%
Q1
i = 2
2 n 1 n 1 260948
130474 La clase de Q2 es: [25 29],
2
4 2
LRI
24 25
24.5
2
C 5
ni 21269
Ni1 120076
2 260948
120076 5
Q2 24.5
26.94
21269
Q2 26.94 aos
50%
Q2
70
Para el Cuartil 3: Q3
i = 3
3 n 3 260948
195711 La clase de Q3 es: [40 44]
4
4
LRI
39 40
39.5
2
C 5
f i 16693
Fi1 179456
3 260948
179456 5
Q3 39.5
44.369
16693
Q3 44.369 aos
75%
Q3
71
in
N i 1 C
5
para todo i =1, 2, 3,4
qi LRI
ni
Donde:
in
ni
= Amplitud de clase
= Frecuencia absoluta simple de la clase del quintil i.
72
Para el quintil 1: q1
i = 1
1 n 1 260948
52189 .6 La clase de q1 es: [10 14]
5
5
LRI
9 10
9.5
2
C 5
ni 24977
Ni1 43382
1 260948
43382 5
q1 9.5
11.263
24977
q1 11.263 aos
20%
q1
73
80%
Para el quintil 2: q2
i = 2
2 n 2 260948
104379 .2 La clase de q2 es: [20 24],
5
5
LRI
19 24
19.5
2
C 5
ni 25111
Ni1 94965
2 260948
94965 5
q2 19.5
21.37
25111
q2 21.37 aos
40%
60%
q2
Para el quintil 3: q3
i = 3
3 n 3 260948
156568 .8 La clase de q3 es: [30 34]
5
5
LRI
29 30
29.5
2
C 5
fi 19805
Fi1 141345
3 260948
14134 5
q3 29.5
33.34
19805
74
q3 33.34 aos
60%
40%
q3
Para el quintil 4: q4
i = 4
4 n 4 260948
208758 .4 La clase de q4 es: [45 49]
5
5
LRI
44 45
44.5
2
C 5
ni 14789
Ni1 196149
4 260948
196149 5
q4 44.5
48.763
14789
q4 48.763 aos
80%
20%
q4
75
76
in
N i 1 C
10
para todo i =1, 2, , 9
Di LRI
ni
Donde:
in
ni
77
Para el Decil 1: D1
i = 1
1 n 1 260948
26094 .8 La clase de D1 es: [5 9]
10
10
LRI
45
4.5
2
C 5
ni 21540
Ni1 21842
1 260948
21842 5
10
D1 4.5
5.49
21540
D1 5.49 aos
10%
90%
D1
Para el decil 4: D4
i = 4
4 n 4 260948
104379 .2 La clase de q2 es: [2024], equivalente al
10
10
quintil 2
LRI
19 24
19.5
2
C 5
ni 25111
Ni1 94965
4 260948
94965 5
10
D4 19.5
21.37
25111
D4 21.37 aos
40%
60%
D2
78
Para el Decil 6: D6
i = 6
6 n 6 260948
156568 .8 La clase de D6 es: [30 34]
10
10
LRI
29 30
29.5
2
C 5
ni 19805
Ni1 141345
6 260948
14134 5
10
D6 29.5
33.34
19805
D6 33.34 aos
60%
40%
D6
Para el Decil 8: D8
i = 8
8 n 8 260948
208758 .4 La clase de D8 es: [45 49]
10
10
LRI
44 45
44.5
2
C 5
fi 14789
Fi1 196149
8 260948
196149 5
10
D8 44.5
48.763
14789
D8 48.763 aos
80%
20%
D8
79
80
in
Fi 1 C
100
Pi LRI
fi
Donde:
i n
fi
Fi1 = Frecuencia absoluta acumulada menor igual que hasta la clase anterior a
la clase del percentil i
81
15 n 15 260948
39142 .2 La clase de P15 es: [5 9]
100
100
LRI
45
4.5
2
C 5
ni 21540
Ni1 21842
15 260948
21842 5
100
P15 4.5
8.52
21540
P15 8.52 aos
85%
15%
P15
100
100
LRI
49 50
49.5
2
C 5
ni 13060
Ni1 210938
83 260948
210938 5
100
P83 49.5
51.66
13060
P83 51.66 aos
83%
17%
P83
82
x x2 ... xn
x 1
x
i 1
x n
i i
i 1
n
83
x xi hi
donde:
i 1
hi
ni
n
+ + + + + + + + + +
=
= .
= .
84
Nmero de microempresas: ni
1
2
4
2
1
10
x
i 1
3 1 4 2 5 4 6 2 8 1 51
5.1
10
10
Nmero de empresas: ni
Xi * ni
1
2
4
2
1
3
8
20
12
8
51
3
4
5
6
8
Total
85
= 15.8
86
Propiedades:
La media aritmtica tiene cuatro propiedades importantes.
1) La media de una constante es la misma constante. () =
87
4 ,
Media
12 ,
8,
10 ,
6, 8,
6,
8,
14
8 4 ... 14 84
8.4 4.2 2 x 2
10
10
6,
4 ,
Media
8,
6,
7,
5,
6,
5,
6,
6 4 8 6 ... 9 62
6.2 4.2 2 x 2
10
10
88
( xi x ) ( xi a ) 2
i 1
Prueba:
Sea a
i 1
x ,
n
La a minimizar sera:
(x
i 1
( x
i 1
a) 2
a ) 2 xi x x a
n
i 1
x
n
i 1
i x x a
xi x x a 2xi x x a
n
i 1
n
xi x x a 2xi x x a
i 1
xi x x a 2x a xi x
n
i 1
i 1
i 1
xi x nx a
n
i 1
>0
n
x
i 1
a xi x
2
L.Q.Q.D.
i 1
<
+ (-2)2 + + (3)2
(0)
<
<
20
+ + (9)
89
13.6.2.
Media armnica
xH
xH
n
n
i 1 xi
xi 0
n
Para datos agrupados en m-clases, xi 0
ni
i 1 xi
m
0,01176471
0,01111111
0,01250000
0,01052632
0,01000000
0,01149425
0,01136364
0,01190476
0,01086957
0,01086957
85
90
80
95
100
87
88
84
92
92
0,11240391
xH
n
n
x
i 1
10
88.96 Km / h
0.11240391
90
Ejemplo 2
Un auto recorre una distancia total de 16 Km. el primer tramo de 2 Km
lo recorre a una velocidad de 20 km/h, el segundo tramo de 5 Km lo
recorre a una velocidad de 80 Km/h, el tercer tramo de 8 Km, lo recorre
a una velocidad de 100 Km/h y el ltimo tramo de 1 Km, lo recorre a
una velocidad de 25 Km/h. Calcular la velocidad promedio de dicho
vehculo.
Tramo (Km)
ni
Vi:
Velocidad (Km/h)
2
5
8
1
20
80
100
25
ni/vi
0.1
0.0625
0.08
0.04
0.2825
xH
13.6.3.
n
16
56.64 Km / h
n
ni 0.2825
i 1 xi
Media geomtrica
xG n
x
i 1
xG n
x
i 1
ni
i
91
Ejemplo
Durante cuatro aos consecutivos una pequea empresa aument su
capital en 20%, 50%, 80% y 90%. Calcular la tasa promedio de
aumento del capital.
Los coeficientes de crecimiento de cada ao sern: Xi: 1.2, 1.5, 1.8
y 1.9 respectivamente, con lo cual se obtiene el promedio geomtrico
de dichos coeficientes:
=4
= =
=1
13.7.1.
Rango:
R X mximo X mnimo
13.7.2.
Varianza.
92
x
N
i 1
X ni
2
x X n
N
i 1
N 1
S2
S2
i 1
N 1
N N
i 1
N N 1
N 2
S2
N 1
v( x)
N 2
N 1
lmiteN S 2 2
x
n
Varianza muestral:
xi X 2 ni
i 1
x ni
2
n 1
s2
Desviacin estndar
93
x X
N
DE( x)
i 1
x X
N
DE( x)
i 1
N 1
S2 S
x x
n
de( x)
13.7.4.
i 1
n 1
s2 s
=1| |
=
=1| |
=
13.7.6.
Coeficiente de variacin
94
DE( x)
100
X
de( x)
100
x
13.8.
Medidas de deformacin.
CA( x)
x Mo
3( x Me)
Q3 Q1 2Q2
Q3 Q1
3
3
Donde:
n
( x x)
i 1
n
n
95
2 2
( x x)
i 1
( x x)
i 1
Nota:
( xi x)
i 1
13.8.2.
Coeficiente de Curtosis
4
3
4
Donde:
n
96
( x x)
i 1
(x
i 1
x) 4
( x x)
i 1
( xi x)
i 1
Nota:
Cuando K < 0 : Distribucin platicurtica
Cuando K = 0 : Distribucin mesocurtica
Cuando K > 0 : Distribucin leptocurtica
xi
ni
15 19
20 24
25 29
30 34
35 39
40 44
17
22
27
32
37
42
3
12
16
10
5
3
45 49
47
Total
50
Ni
Xi. Ni
(Xi-u)^2*ni
3
15
31
41
46
49
51
264
432
320
185
126
396.75
507.00
36.00
122.50
361.25
546.75
-4562.625
-3295.5
-54.00
428.75
3070.625
7381.125
52470.1875
21420.75
81.00
1500.625
26100.3125
99645.1875
50
47
342.25
6331.625
117135.0625
9300
318353.125
1425
97
2312.50
(Xi-u)^3*ni
(Xi-u)^4*ni
Media aritmtica:
x n
i i
i 1
1425
28.5 aos
50
V ( x)
(x
i 1
x) 2 ni
n
2312 .5
46.25 aos2
50
aos
CV ( x)
0.2386 23.86%
x
28.5 aos
CA( x )
3
9300 / 50
186
0.59 0
3
3
6.80074 314.534664
4
318353 .125 / 50
3
3
2 2
( )
(46.25)2
6367 .0625
3 2.976 3 0.0234 0
2139 .0625
98
99
1
=1 ( )
=
1
=1
Este ndice tomara los valores de IG = 0 cuando pi = qi
concentracin mnima
y de Ig = 1 cuando qi = 0
100
5.- La renta total de todos los rentistas que ser un y que dada en tanto
por ciento, la cual representaremos como qi y que responder a la
siguiente notacin:
100
100
xi
x1
ni
n1
xi ni
x1 n1
Ni Ui
N1 U1 p1
x2
n2
x2 n2
N2
U2
...
...
...
...
xn
nn
xn nn
Nn
Ni
100
n
qi
ui
100
un
pi - qi
q1
p1 - q1
p2
q2
p2 - q2
...
...
...
...
un
pn
qn
pn - qn
101
Li-1 - Li
0 - 50
50 - 100
100 - 150
150 - 200
200 - 250
250 - 300
300 - 350
350 - 400
400 - 450
450 - 500
marca
xi
ni
Ni
25
75
125
175
225
275
325
375
425
475
23
95
157
205
224
232
246
253
258
260
23
72
62
48
19
8
14
7
5
2
260
xini
un
575
5400
7750
8400
4275
2200
4550
2625
2125
950
38850
575
5975
13725
22125
26400
28600
33150
35775
37900
38850
1,48
15,38
35,33
56,95
67,95
73,62
85,33
92,08
97,55
100,00
8,85
36,54
60,38
78,85
86,15
89,23
94,62
97,31
99,23
100,00
651,15
7,37
21,16
25,06
21,90
18,20
15,61
9,29
5,22
1,68
0,00
125,48
IG
p i q i
i 1
k 1
pi
125,48
0,193 ,
651,15
i 1
b)
Curva de Lorenz
La curva la obtenemos cerca de la diagonal, que indica que hay
poca concentracin:
102
2. Nmeros ndices
El nmero ndice es una medida estadstica diseada para mostrar los cambios
de una variable o un grupo de variables relacionadas, con respecto al tiempo,
situacin geogrfica u otra caracterstica
a) Precios relativos
Un precio relativo es el ejemplo ms sencillo de nmero ndice. Es la razn
del precio de un bien determinado, en un perodo dado, a un precio en otro
perodo, llamado perodo base o perodo de referencia. Si po y pn denotan
los precios del bien durante el perodo base y el perodo considerado,
respectivamente, entonces, debemos tener que:
2009
2005
2005
2009
2.5
3.0
= 83 13%
103
c) Valor relativo
Si p es el precio de un bien durante un perodo y q es la cantidad o
volumen producido, vendido, etc., durante este perodo. Entonces pq se
llama valor total. As, si son vendidos 1000 tarros de leche a S/. 3.00 nuevos
soles cada uno, el valor total ser (3.00)(1000) = S/. 3000
Si po y qo denotan el precio y la cantidad de un bien durante un perodo
base, mientras que pn y qn denotan el precio y la cantidad correspondiente
durante el perodo dado, los valores totales durante estos perodos vienen
dados por Vo y Vn respectivamente y se define
=
= ( )( )
15
= 125%
12
2005
18
= 120%
15
2005
2006
104
P2006
2003
= P2006
2005
P2005
2004
P2004
2003
18 15 12
= 225%
15 12 8
P2003
2005
P2003
2006
= P2003
2004
= P2003
2004
P2004
2005
P2004
2005
P2005
12 15
= 187.5 %
8 12
2006
12 15 18
= 225%
8 12 15
105
0
0 0
2003
2004
2005
2006
2007
2008
Precio medio
14.95
14.94
15.10
15.65
16.28
16.53
106
2003
2004
2005
2006
2007
2008
Precio medio
14.95
14.94
15.10
15.65
16.28
16.53
Precio relativo
(2006=100.0)
9.55
95.5
96.5
100.0
104.0
105.6
(2003 2005) =
Se divide cada precio de la tabla inicial por S/. 15.00, entonces los precios
relativos expresados como porcentajes son:
Ao
2003
2004
2005
2006
2007
2008
Precio medio
14.95
14.94
15.10
15.65
16.28
16.53
99.7
99.6
100.7
104.3
108.5
110.2
Precio relativo
Precio promedio del 2003-2005=15.0
= 100
62.2
59.7
117.7
115.5
115.5
35.4
38.9
77.93
74.39
82.79
(2008)
(2001)
4.13+59.7+38.9
3.95+61.5+34.8
102.73
100.25
= 1.025 102.5%
107
(X1, Y1)
(X2, Y2)
(X3, Y3)
..
(Xn, Yn)
(X2, Y2)
(X3, Y3)
..
(Xn, Yn)
108
SEXO (j)
Total
09.0 - 11.4
Varn
29
Mujer
18
47
11.5 - 13.9
53
24
77
14.0 - 16.4
Total
85
44
129
=
11 = 29 29 . . 09.0 11.4
12 = 18 18 . . 09.0 11.4
22 = 24 24 . . 11.5 13.9
As sucesivamente
. =
= ()
1. = 47 47 . . 09.0 11.4
2. = 77 77 . . 11.5 13.9
As sucesivamente.
. =
()
.1 = 85 85
109
.2 = 44 44
SEXO
Varn
N de
estudiantes
29
53
3
85
Total
Mujer
% de
N de
% de
estudiantes estudiantes estudiantes
34.1%
18
40.9%
62.4%
24
54.5%
3.5%
2
4.5%
100.0%
44
100.0%
N de
estudiantes
47
77
5
129
% de
estudiantes
36.4%
59.7%
3.9%
100.0%
Aqu lo que se compara son los perfiles, as podemos leer que hay mayor
proporcin de mujeres en promedios ponderados bajos (09.0 a 11.4), en
cambio en promedios ponderados intermedios (11.5 a 13.9), se observa
mayor proporcin de varones, finalmente en promedios ponderados
sobresalientes (14.0 a 16.4) las proporciones de varones y mujeres son
bastante parecidas. Por lo tanto podemos concluir que el promedio
ponderado si guarda relacin con el sexo, los varones parecen estar en
ventaja sobre las mujeres.
Medidas de correlacin:
Despus de un anlisis descriptivo de cada variable, el siguiente nivel de
anlisis comprende analizar la relacin entre dos variables. Aqu
110
Cov( x, y)
;
x y
para todo:
1 r 1
Cov( x, y)
x x y y
Donde:
Covarianza entre X e Y:
x x
Desviacin estndar de X: x
y y
Desviacin estndar de Y: y
Cov( x, y)
x y
xy N
N
x
x n
: Desviacin estndar de x
111
y
y N
: Desviacin estndar de y
x y
xy N
x x y x
N
N
2
Ejemplo 1.
Se desea estudiar la relacin existente entre el tiempo (en das) utilizado
para realizar una obra de construccin de un canal (Y) y el nmero de
trabajadores participantes en ella (X)
112
N de das necesarios
para hacer la obra
x
N de trabajadores
participantes en la obra
y
XY
X^2
Y^2
1
2
3
4
5
6
7
8
9
10
2
3
3
5
6
6
8
8
10
12
8
7
6
6
5
4
3
2
1
0.5
16
21
18
30
30
24
24
16
10
6
4
9
9
25
36
36
64
64
100
144
64
49
36
36
25
16
9
4
1
0.25
63
42.5
195
491
240.25
63 42.5
10
r
0.971
2
63
42.52
491
240.25
10
10
195
113
Ejemplo 2.
Se desea estudiar la relacin existente entre la Longitud en metros de un cable
elctrico (X) y el peso en Kgr. del cable (Y)
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Suma
Longitud del
cable (metros)
X
4
6
6
7
7
7
8
9
9
9
11
11
11
13
13
14
15
16
176
XY
X^2
Y^2
20
30
42
42
49
56
64
72
81
90
110
121
132
156
169
196
225
240
1895
16
36
36
49
49
49
64
81
81
81
121
121
121
169
169
196
225
256
1920
25
25
49
36
49
64
64
64
81
100
100
121
144
144
169
196
225
225
1881
176 175
18
r
0.972
2
176
175 2
1920
1881
18
18
1895
114
115
xy
x
x y
x
Y X
Coeficiente de determinacin de la ecuacin de regresin lineal simple [
R2] El coeficiente de determinacin es una medida de adecuacin de la
ecuacin de regresin lineal simple, y expresa el porcentaje de variabilidad de
la variable dependiente (Y) que est siendo explicada por la variable regresora
(X) en la ecuacin de regresin lineal simple. Su clculo se puede obtener
elevando al cuadrado el coeficiente de correlacin lineal de Pearson:
R2 r 2
Podemos notar que
116
2. Los errores residuales deben tener distribucin normal con media cero y
varianza constante.
3. El coeficiente de determinacin debe ser por lo menos 70%
40
20
25
20
30
50
40
20
50
40
25
50
385
400
395
365
475
440
490
420
560
525
480
510
1. En primer lugar por teora del mrquetin, sabemos que las ventas
dependen de los gastos en publicidad, y al representar los datos de
estas variables en las ltimas 12 semanas en la siguiente grfica,
verificamos que la relacin es del tipo lineal, entonces es aplicable el
uso de la regresin lineal simple.
117
40
20
25
20
30
50
40
20
50
40
25
50
385
400
395
365
475
440
490
420
560
525
480
510
15400
8000
9875
7300
14250
22000
19600
8400
28000
21000
12000
25500
1600
400
625
400
900
2500
1600
400
2500
1600
625
2500
148225
160000
156025
133225
225625
193600
240100
176400
313600
275625
230400
260100
Suma
410
5445
191325
15650
2512925
x y
xy
n
410 5 445
191 325
12
3.2208
410 2
15650
12
5445
410
3.2208
12
12
118
343.71
Y X
Y 343.71 3.2208 X
1913255
410 5445
10
410 2
5445 2
15650
2512925
12
12
0.6348
R2
r 2 0.6348 2
0.403 40.3%
El valor nos indica que el 40.3% de la variabilidad de las ventas lo explica los gastos
en publicidad, es decir que se trata de una ecuacin no muy til para realizar
pronsticos de las ventas en funcin de los gastos en publicidad.
4. MUESTREO
1. MUESTREO: El Muestreo es parte de la Estadstica. En su formulacin ms
general, puede decirse que su funcin bsica es determinar qu parte de una
realidad en estudio a la que suele llamarse poblacin debe examinarse con la
finalidad de hacer inferencia sobre el todo de la poblacin de la que procede.
119
2. VENTAJAS DEL MUESTREO.a. COSTO REDUCIDO.- Si los datos se obtienen nicamente de una
pequea fraccin del total, los gastos son menores que los que se
realizaran si se llevara a cabo un censo completo. En poblaciones
muy grandes se pueden obtener resultados lo suficientemente
exactos cuando se analizan muestras que representan slo una
pequea fraccin de la poblacin.
b. MAYOR RAPIDEZ.Los datos pueden ser recolectados y resumidos ms rpidamente con una muestra
que con una enumeracin completa. Esta es una consideracin vital cuando se
necesita la informacin con urgencia.
c. MAS POSIBILIDADES.Para obtener la informacin en ciertos tipos de encuestas, se utilizan los servicios
de personal altamente calificado o equipo muy especializado de disponibilidad
limitada. Por lo tanto, en estos casos el censo completo es impracticable y como
alternativa a la obtencin de datos por muestreo, solo existe la de no obtenerlos.
De ah que las encuestas basadas en el muestreo tengan ms posibilidades y
flexibilidad respecto a la informacin que puede obtenerse.
UNIDAD DE OBSERVACIN.Son los elementos de la poblacin sobre los cuales se medirn las variables de
inters. sta es la unidad bsica, a veces llamada elemento. En los estudios de
poblaciones humanas la unidad de observacin son los individuos.
Ejemplo: En una investigacin sobre el estado nutricional y el rendimiento escolar
de los nios del nivel primario; la unidad de observacin son los nios del nivel
primario.
120
i. MUESTRA.Una muestra es un conjunto de unidades, una porcin del total, que nos
representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es ms que eso, una parte del todo
que llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan tiles para llevar a cabo un
trabajo de investigacin. Lo que se busca al emplear una muestra es que,
observando una porcin relativamente reducida de unidades, se obtengan
conclusiones semejantes a las que lograramos si estudiramos el universo
total. Cuando una muestra cumple con esta condicin, es decir, cuando nos
refleja en sus unidades lo que ocurre en el universo, la llamamos muestra
representativa. Por lo tanto, una muestra representativa contiene las
caractersticas relevantes de la poblacin en las mismas proporciones en que
estn incluidas en tal poblacin. Sus conclusiones son susceptibles de ser
generalizadas al conjunto del universo, aunque para ello debamos aadir un
cierto margen de error en nuestras proyecciones.
Las muestras pueden ser clasificadas, en una primera divisin en
probabilsticas y no probabilsticas.
En las muestras probabilsticas, la caracterstica fundamental es que todo
elemento del universo tiene una determinada probabilidad de integrar la
muestra, y esa probabilidad puede ser calculada matemticamente con
precisin. En las muestras no probabilsticas ocurre lo contrario y el
investigador no tiene idea del error que puede estar introduciendo en sus
apreciaciones.
j. UNIDAD DE MUESTREO.-
121
La unidad de muestreo y la unidad de anlisis son las mismas, pero hay casos
en que no lo son. Una unidad de muestreo puede contener un conjunto de
unidades de observacin o, incluso, un conjunto de unidades de muestreo
correspondientes a una etapa posterior de seleccin.
Ejemplo:
Podramos querer estudiar a las personas, pero no tenemos una lista de todos
los individuos que pertenecen a la poblacin objetivo. En vez de esto, la
vivienda sirven como las unidades de muestreo y las unidades de observacin
son los individuos que viven en una vivienda.
k. MARCO MUESTRAL.-
122
3. TIPOS DE MUESTREO
Con Reemplazo
Simple
T
I
Estratificado
Proporcional
Desproporcional
Cruzado
nico
O
S
Sin Reemplazo
Conglomerado
Probabilstico
Una etapa
Dos etapas
Multi etapas
Sistemtico
D
E
Doble
Mltiple
Secuencial
M
U
Casos tpicos.
Conveniencia
No
Probabilstico
Voluntarios
Bola de nieve
E
O
123
4. MUESTRAS NO ALEATORIAS
Si consideramos que no precisamos cifras exactas sobre la representatividad
estadstica de nuestros resultados, podramos plantearnos el usar una muestra no
aleatoria (o "no probabilstica"), lo que significa que elegiremos a voluntad nuestra.
Podemos considerar que esto puede ayudarnos a obtener los elementos que
necesitamos estudiar directamente y, adems, actuar sin los tediosos procesos de
seleccin aleatoria y verificacin estadstica.
Sin embargo, hay una desventaja: corremos un gran riesgo de obtener demasiado
sesgo en la muestra. No seremos capaces siquiera de advertir la presencia, y
menos an la cantidad, de sesgo si hacemos personalmente la seleccin de la
muestra. Y la presencia de sesgo puede hacer imposible generalizar nuestros
resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o grupo la
seleccin de los elementos.
Estas muestras son bastante tiles en aquellas situaciones en las cuales no es
posible utilizar un muestreo probabilista, es decir cuando no es posible disponer de
un marco muestral para la seleccin de los elementos de la muestra. Su utilizacin
est reservada solo para aquellos investigadores que conocen la estructura de la
poblacin y tienen un criterio suficientemente bueno para conseguir
representatividad; incluso si se dispone de un buen criterio para conseguir
representatividad es posible obtener mayor precisin a ms bajos costos que con
un muestreo probabilista.
Entre los tipos comunes de muestras no aleatorias se incluyen,
Muestra de "casos tpicos" o los "mejores" casos es algo bastante tradicional en
historia del arte: estudiar solamente los "grandes maestros". La idea es que stos
representan lo ms autntico de su poca. Tal seleccin deliberada por parte del
investigador tiene no obstante riesgos serios, que se tratan en el punto Delimitar el
objeto de estudio.
Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una
reunin, podra ser designado como muestra. Este es un mtodo fcil y barato,
pero el sesgo suele ser imposible de estimar. El mtodo es popular en las
demostraciones de cursos sobre mtodos, pero raramente usado en la
investigacin profesional.
Muestra de voluntarios es creada cuando todos los miembros de la poblacin
tienen la oportunidad de participar en la muestra. Un ejemplo es la respuesta
voluntaria de los clientes que llega a una empresa; igualmente, las respuestas que
un investigador recibe a un anuncio en un peridico pidiendo a la gente sus
opiniones.
124
Una muestra de voluntarios suele ser una alternativa bastante sensata; no obstante,
el investigador debe considerar cuidadosamente los riesgos de sesgo. Hay dos
cuestiones que plantearse:
Es cierto que todos los miembros de la poblacin bajo muestreo tenan las mismas
oportunidades de ser incluidos en la muestra? Por definicin, los voluntarios
difieren de la media de la poblacin en su mayor actividad. La cuestin crucial
entonces es difieren del resto de la poblacin tambin en otros aspectos?.
Muestra bola de nieve. Cuando se entrevista a miembros de un grupo, podemos
pedir a las personas que nos indiquen otros individuos en ese grupo que estn en la
mejor posicin para dar informacin sobre ese tema; podramos tambin pedirles
que nos indicasen personas que compartan sus puntos de vista y tambin otras que
sean de opinin opuesta. Entonces entrevistaremos a nuevos individuos y
continuaremos del mismo modo hasta que no obtengamos nuevos puntos de vista
de nuevos entrevistados. Este es un buen mtodo por ejemplo para recoger los
distintos puntos de vista existentes en un grupo, pero su inconveniente es que no
obtenemos una idea exacta de la distribucin de las opiniones.
En el momento de disear una muestra no aleatoria, debemos siempre tener en
mente la poblacin. Es representativa la muestra? Son vlidos los resultados en
la poblacin?
Recordemos tambin que no tenemos que incluir elementos que no sean miembros
de la poblacin en nuestra muestra.
125
6. ERROR DE MUESTREO:
Recordemos que la muestra descansa en el principio de que las partes
representan al todo y, por tal, refleja las caractersticas que definen a la
poblacin de la cual fue extrada, lo cual nos indica que es representativa. Es
decir, que para hacer una generalizacin exacta de una poblacin, es
necesario tomar una muestra representativa. Por lo tanto, la validez de la
generalizacin depende de la validez y tamao de la muestra.
Cuando trabajamos con muestras, generalmente se presentan dos tipos de
errores:
Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan
por causas ajenas a la muestra:
Situaciones inadecuadas: se presentan, por ejemplo, cuando el encuestador tiene
126
127
combinacin de
reposicin.
Una muestra aleatoria simple se extrae por seleccin aleatoria empleando los
nmeros aleatorios, este proceso ofrece la oportunidad de que todos los elementos
que no han sido sacados previamente tengan igual probabilidad de pertenecer a la
muestra.
128
Z2 2
2
d2
Z2 2
2
Donde:
n Tamao de muestra
2
d
N =
Valores de Z
Probabilidad de
confianza (1 )
0.90
0.95
0.99
Probabilidad de
significancia: ( )
0.10
0.05
0.01
129
0.050
0.025
0.005
1.645
1.960
2.576
s2
de poblacin similar
130
Mximo Mnimo
2
0.24Mximo Mnimo
s2
varianza poblacional
2 s2
131
Z2 2
d
2
Poblacin N =
Confianza (1-)
Significancia ()
(1-/2)
Z
Error
DE(x) = =
Z2 2
2
400
0.95
0.05
0.975
1.960
1.500
6.6
Tamao de muestra n = 63
1.96 2 6.6 2
n
63
1.96 6.6 2
2
1.5
400
132
1.2.
Z2 pq
d
2
Z2 pq
2
Donde:
n Tamao de muestra
Z
N =
133
Ejemplo
Se desea determinar el tamao de muestra para estimar la proporcin de
mujeres P con infeccin vaginal entre las que acuden al servicio de
Obstetricia del Hospital Regional Docente Las Mercedes de Chiclayo:
134
Z2 pq
d2
Z2 pq
2
0
.
3
0
.
7
0.05 2
668
1.3.
Ho : o
1 Caso:
Ha : o
2
Z Z 2
n 2
Donde:
135
2 Caso:
Ho : o
Ha : o
Z
n
Ha : o
Z 2
2
Donde:
136
3 Caso:
Ho : 1 2
Ha : 1 2
2
Z Z ( 2 2 )
1
2
2
Donde:
4 Caso:
1 2
Ho : 1 2
Ha : 1 2
Z
n
Ha : 1 2
Z ( 12 22 )
2
Donde:
1 2
137
1.4.
Ho : P Po
1 Caso:
Ha : P Po
Z
Po Qo Z pq
n 2
Donde:
Qo
p Po
1 Po
proporcin muestral
q 1 p
2 Caso:
Ho : P Po
Ha : P Po
Z
n
Po Qo Z
138
Ha : P Po
pq
Donde:
p Po
1 Po
Qo
proporcin muestral
q 1 p
3 Caso:
Ho : P1 P2
Ha : P1 P2
n 2
p1 p2 p1 p2 / 2
2
p1q1 p2 q2
Donde:
P1 P2
139
4 Caso:
Ho : P1 P2
Ha : P1 P2
Z
n
Ha : P1 P2
p1 p2 q1 q2 / 2
Z p1q1 p2 q2
Donde:
P1 P2
Ejemplo:
Se desea determinar el tamao de muestra para probar una hiptesis de
comparacin de proporciones. Ho : P1 = P2 contra Ha: P1 < P2, donde:
P1 : Proporcin de complicaciones en intervenciones quirrgicas con protocolo.
P2 : Proporcin de complicaciones en intervenciones quirrgicas sin protocolo.
De acuerdo a la informacin histrica, del Hospital Regional Docente Las
Mercedes de Chiclayo, se conoce que, cuando se sigue el protocolo, la
proporcin de complicaciones quirrgicas es 0.01, y cuando no se sigue el
protocolo esta proporcin es de 0.18. Si deseamos tener una confianza de
0.95 y tambin una potencia para la prueba de hiptesis de 0.95, Cul deber
ser el tamao de muestra mnimo requerido?
La frmula a utilizar en este caso es:
Z
n
p1 p2 q1 q2 / 2
Z p1q1 p2 q2
140
q2 = 1- p2 = 0.82
1.645
n
62
1.5.
Ho : P1 P2
H a : P1 P2
Z
2 pq Z p1q1 p2 q2
Donde:
p1 Casos
p2
Controles
p2 p2
2
: Proporcin mancomunada
141
q 1 p
P1 P2
Z
n
2 pq Z
p1q1 p2 q2
p1 p2 2
(Caso)
2 = 0.6
q1 = 1 p1 = 1 0.8 = 0.2
q1 = 1 p1 = 1 0.8 = 0.2
1 +2
2
0.8+0.6
2
= 0.7
= 1 = 1 0.7 = 0.3
142
4.1.1.
W S
W S
V
h
2
h
143
nh
Wh Sh
n
Wh Sh2
Ejemplo:
Institucin Educativa
Elvira Garca
Magdalena Sofa
San Jos
Promedio.
Lenguaje
14.20
13.82
14.75
Desv. Estnd.
Lenguaje
2.25
2.36
2.52
Promedio.
Matemtica
13.94
14.11
14.92
Desv. Estnd.
Matemtica
3.22
2.59
3.05
= 0.95
= 1.96
2
d = 0.5
1 1
0.7406
=
73 = 23
2.3786
144
2 =
2 2
0.7980
=
73 = 24
2.3786
3 =
3 3
0.8400
=
73 = 26
2.3786
N de
Estudiantes
Nh
148
152
150
450
Promedio en
Lenguaje
14.20
13.82
14.75
Desv. Estnd.
Lenguaje Sh
2.25
2.36
2.52
Ponderacin:
Wh
0.329
0.338
0.333
1.000
Wh. Sh
0.7406
0.7980
0.8400
2.3786
Wh.Sh^2
1.6675
1.8854
2.1168
5.6697
muestra del
estrato: nh
23
24
26
73
( )2
(2.9521)2
=
= 103
2 0.06507944 + 8.7850
+
450
1 1
1.0591
=
103 = 37
2.9521
2 =
2 2
0.8763
=
103 = 31
2.9521
3 =
3 3
1.0167
=
103 = 35
2.9521
Cuadro de clculos del tamao de muestra para investigar competencias bsicas de Matemticas
en tres instituciones Educativas de Chiclayo
Institucin
Educativa
(Estrato h)
Elvira Garca
N de
Desv. Estnd.
Estudiantes Promedio en Matemticas Ponderacin:
Nh
Matemticas
Sh
Wh
148
13.94
3.22
0.329
145
Wh. Sh
1.0591
Wh.Sh^2
3.4107
muestra del
estrato: nh
37
Magdalena Sofa
San Jos
Total
152
150
450
14.11
14.92
2.59
3.05
0.338
0.333
1.000
0.8763
1.0167
2.9521
2.2734
3.1008333
8.7850
31
35
103
( )
=
+
Donde:
N = Tamao general de la Poblacin
n = Tamao general de muestra
146
P = Proporcin de
estudiantes con
calidad de sueo
deficiente
N = 6120
Administracin
Admi
de empresas
N1 = 1141
Psicologa
Administracin
hotelera
N18 = 301
N2 = 291
d = 0.05
(1-)=0.95
n1 = 69
n18 = 30
n2 = 18
Tamao general de
muestra
n = 413
Tamao general de muestra:
n
Donde
(Wh ph qh ) 2
,
Wh ph qh
V
N
d
V Varianza deseada del estimador de la proporcin
z
Asumimos
Una confianza (1-) de 0.95, para el cual, el desvo normal es Z = 1.96
Una precisin (mximo error de muestreo tolerado) d 0.05
147
pst = Estimado
estratificado de P
0.05
V
0.000651
1.96
Los clculos se muestran en la siguiente tabla, con lo cual, el tamao de muestra es:
n
(0.434192) 2
276
0.203828
0.000651
6120
La asignacin de Neyman del tamao de muestra a los estratos se hace con la frmula:
nh
Wh ph qh
ph qh
por razones de conseguir estabilidad para los estimadores por carrera profesional, se corrige el
tamao de muestra a un mnimo de 30, con lo cual se tiene una muestra corregida de 535
estudiantes, tal como se puede apreciar en el siguiente cuadro.
Cuadro N 2 Clculo del tamao de muestra estratificado con asignacin de Neyman para estudiantes
de la USAT matriculados en el semestre acadmico 2011-I.
Matriculados
ESTRATO (h)
(2011-I): Nh
Carrera profesional
N
Wh h
N
Proporcin de
estudiantes con
calidad de
sueo deficiente
qh 1 ph
Wh p h q h
Wh ph qh
nh
nh (corr )
ph
ADM. DE EMPRESAS
ADM. HOTELERA Y
DE SERVICIOS
CONTABILIDAD
ECONOMA
EDUCACIN (inicial,
Prim. y Secundaria.)
COMUNICACIN
DERECHO
ARQUITECTURA
ING. CIVIL Y AMB.
ING. DE SIST. Y
COMP.
ING. ENERGTICA
ING. INDUSTRIAL
ING. MECNICA
ELCTRICA
ING. NAVAL
ENFERMERA
MEDICINA
ODONTOLOGA
PSICOLOGA
TOTAL
1131
0.1848
0.3
0.5
0.071574
0.027721
45
45
289
0.0472
0.25
0.5
0.016696
0.005903
11
30
479
177
0.0783
0.0289
0.3
0.3
0.5
0.5
0.030313
0.011201
0.011740
0.004338
19
7
30
30
254
0.0415
0.25
0.5
0.014674
0.005188
30
220
703
234
320
0.0359
0.1149
0.0382
0.0523
0.4
0.4
0.4
0.4
0.5
0.5
0.5
0.5
0.016076
0.051371
0.017099
0.023384
0.007190
0.022974
0.007647
0.010458
10
33
11
15
30
33
30
30
398
0.0650
0.6
0.5
0.035620
0.019510
23
30
9
415
0.0015
0.0678
0.4
0.6
0.5
0.5
0.000658
0.037141
0.000294
0.020343
0
24
9
30
71
0.0116
0.6
0.5
0.006354
0.003480
30
28
589
296
207
300
6120
0.0046
0.0962
0.0484
0.0338
0.0490
1.0000
0.4
0.4
0.7
0.6
0.4
0.5
0.5
0.5
0.5
0.5
0.002046
0.043041
0.028614
0.018526
0.009804
0.434192
0.000915 1
0.019248 27
0.016928 18
0.010147 12
0.009804 6
0.203828 276
148
28
30
30
30
30
535
18
pst phWh ,
h1
4.1.2.
DE( pst )
18
W
h1
2
h
ph qh N h nh
nh N h 1
149
Manzana: 1
8
Tamao : 114
210
222
525
308
205
6
191
7
414
n = 200,
m = 4 y c = 50.
Pasos:
1. Crear una lista de las UPE (conglomerados) y obtener los tamaos
acumulados Di = N1 + N2 + ... + Ni a lo largo de la misma:
Tamao Ni
Tamao acumulado Di
114
114
222
336
525
861
308
1169
205
1374
191
1565
414
1979
210
2189
En el ejemplo =
2189
4
= 547.25 547
150
N
m
Z2 =R+I,
Z3 = R+2I . Zm = R+(m-1)I
Tamao Ni
114
222
525
308
205
191
414
210
Tamao
acumulado Di
114
336
861
1169
1374
1565
1979
2189
Zi
369
916
1463
2016
4.2.
Muestreos No Probabilsticos
151
c = 50
152
153
154
155