Vous êtes sur la page 1sur 147

Estadstica Aplicada a la Investigacin Pg.

UNIVERSIDAD NACIONAL DEL ALTIPLANO-PUNO

ESCUELA DE POST GRADO

CURSO: ESTADSTICA

D.Sc. Percy Huata Panca


percyhp@hotmail.com

C.U. septiembre de 2015 .

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 2

Segunda Edicin: Setiembre del 2015.

Estadstica aplicada a la investigacin, son exclusivamente derechos de los autores,


prohibida la reproduccin.

AUTOR:

PERCY HUATA PANCA


Doctoris Scientiae en Economa y Gestin
Magister Scientiae en Informtica
Ingeniero Estadstico
DOCENTE DE LA FINESI-UNA-PUNO
Email : percyhp@hotmail.com
percyhp@gmail.com

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 3

CAPTULO I

CONCEPTOS BSICOS DE LA ESTADSTICA

1.1. DEFINICIONES DE ESTADISTICA

La estadstica es una ciencia terica que forma parte de las ciencias matemticas,
al aplicarla a otras disciplinas se tienen que cumplir ciertas condiciones para que
su uso sea correcto. Sus leyes y frmulas se basan en poblaciones numricas, en
general, bien definidas aunque sean casi siempre infinitas, adems, sus elementos
suelen ser nmeros sin errores de medida. Al aplicar los principios estadsticos a
disciplinas distintas de las matemticas hay que tener en cuenta que las
poblaciones casi nunca son infinitas y que los valores, en muchos casos, suelen
proceder de medidas realizadas sobre magnitudes que no se pueden evaluar con
mucha exactitud. Si no se tienen en cuenta las diferencias entre estadstica
matemtica y aplicada se pueden cometer errores muy importantes.

La estadstica se puede dividir en dos partes principales: la estadstica descriptiva y


la inferencial (analtica).

La estadstica descriptiva, tiene como objetivo representar y resumir los


resultados. Una vez terminado un trabajo de investigacin se dispone de muchos
datos, miles en muchas condiciones, que no se utilizaran eficientemente si no se
aplican tcnicas que los resuman. Las tcnicas descriptivas dependen del tipo de
variables y de los objetivos del trabajo realizado, en general, condensan la
informacin obtenida en tablas, grficos y parmetros que la resumen y permiten
entenderla rpidamente.

La estadstica analtica, tambin denominada inferencial, estudia los elementos de


una muestra y a partir de ellos infiere propiedades a la poblacin muestreada. Su
objetivo es el viejo sueo empirista: conocer el todo estudiando solo una parte,
evidentemente con un margen de error.

Ruiz (2004) La Estadstica es la ciencia cuyo objetivo es reunir una informacin


cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de
ello gracias al anlisis de estos datos unos significados precisos o unas previsiones
para el futuro.

La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin,


presentacin, anlisis e interpretacin de datos numricos con el fin de realizar
una toma de decisin ms efectiva. Otros autores tienen definiciones de la

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 4

Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para


Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo
de los colectivos; otros la definen como la expresin cuantitativa del
conocimiento dispuesta en forma adecuada para el escrutinio y anlisis.

La ms aceptada, sin embargo, es la de Mnguez, que define la Estadstica como


La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos
sociales para medir su intensidad, deducir las leyes que los rigen y hacer su
prediccin prxima.

Los estudiantes confunden comnmente los dems trminos asociados con las
Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra
tiene tres significados: la palabra estadstica, en primer trmino se usa para
referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto
de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el
trmino estadstico, en singular y en masculino, se refiere a una medida derivada
de una muestra.

1.2. HISTORIA DE LA ESTADISTICA

Alvarez (2007) La estadstica moderna surge de la confluencia de dos disciplinas


que evolucionaron de manera independiente: la aritmtica de estado
(estadsticas) y el clculo de probabilidades.

La mayora de civilizaciones antiguas recogan datos sobre los impuestos


recaudados, el nmero de soldados reclutados, bajas en batallas, censos, etc. En el
siglo XVII John Graunt fue el primero en realizar tablas de mortalidad y estudios
demogrficos. Achenwald fue el primero en denominar Estadstica, hasta entonces
denominada aritmtica de estado.

El clculo de probabilidades se desarroll debido a los juegos de azar. En los siglos


XVI y XVII hombres de ciencia tan importantes como Galileo, Fermat y Pascal,
dedicaron mucho tiempo al clculo de probabilidades con objeto de resolver
problemas planteados por los juegos de azar. La frmula clsica del clculo de
probabilidades la probabilidad de que ocurra un determinado suceso es igual al
nmero de casos favorables al suceso, dividido por el nmero de casos totales que
pueden ocurrir es debida a Pascal.

En los siglos XVII y XVIII Newton revoluciono la ciencia e introdujo junto a Leibniz
el clculo infinitesimal y la modelizacin matemtica de los fenmenos fsicos,
como consecuencia de ello se puso de manifiesto la necesidad de la exactitud de
las medidas y el desarrollo del clculo de errores.

En el siglo XVIII De Moivre comprob que la distribucin binomial poda


aproximarse a la normal cuando el nmero de casos era grande. Este autor junto a
Laplace fueron de los primeros en aplicar el clculo de probabilidades a los datos

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 5

demogrficos, contribuyendo a unificar la estadstica y el clculo de probabilidades


en una sola disciplina. Una figura muy importante en el campo de clculo de
probabilidades, aunque paso desapercibido en su tiempo, fue Bayes, autor del
teorema que lleva su nombre.

En el siglo XIX una de las figuras ms relevantes en el campo de fsica y de la


estadstica fue Gauss. ste cientfico hiso magnficos estudios sobre la curva
normal, a la cual tambin se le conoce como curva de Gauss, aunque ya era
conocida antes de que ste importante matemtico hiciera sus estudios, tambin
realizo profundos anlisis sobre la teora de los errores, y desde el punto de vista
prctico la aplic a la astronoma. Otras figuras relevantes de siglo XIX en el
campo de la estadstica fueron Newcomb, que realizo importantes estudios en
relacin a la estimacin de parmetros, K. Pearson, que trabaj, entre otros
temas, sobre correlacin y regresin entre variables.

En el siglo XX, junto a Pearson , que hiso sus trabajos entre el siglo XIX y el XX, en
autor ms importante fue Fisher, el cual dedico gran parte de su tiempo al anlisis
de modelos matemticos multivariantes; entre otras aportaciones invento el
anlisis discriminante. ES Pearson, Wald y Neyman desarrollaron la teora del
contraste de hiptesis.

Las modernas teoras fsicas como la mecnica estadstica y la mecnica cuntica


han estimulado un gran auge de la estadstica, debido a que es la principal
herramienta utilizada para interpretar resultados experimentales y para el
desarrollo terico de estas disciplinas.

A partir de 1970 la estadstica ha cobrado una gran dimensin entre otras razones
por la generalizacin del uso de los ordenadores, lo que ha permitido utilizar
tcnicas estadsticas que, aunque conocidas desde hace tiempo, se aplicaban en
pocas ocasiones debido a la dificultad de los clculos. En la actualidad la
estadstica es una disciplina en alza; la sociologa, la psicologa, la utilizacin
creciente de encuestas, la generalizacin del control de calidad, la aplicacin a las
ciencias de la salud, las nuevas teoras fsicas, etc., son algunas de las razones que
han motivado una gran demanda de estudios estadsticos.

Dentro del campo de la bioestadstica uno de los primeros en aplicarla a


problemas biomdicos fue el ya citado J. Graund que realiz las primeras tablas de
mortalidad, conocidas. Galton primo de Darwin es considerados el padre de la
bioestadstica, el cual junto a K. Pearson y Fisher establecieron las bases de la
bioestadstica moderna.

Ruiz (2004) Los comienzos de la estadstica pueden ser hallados en el antiguo


Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo,
prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo al
historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el
objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss
II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 6

antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos


estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey David por
otra parte, orden a Joab, general del ejrcito hacer un censo de Israel con la
finalidad desconocer el nmero de la poblacin.

Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos
efectuaron censos peridicamente con fines tributarios, sociales (divisin de
tierras) y militares (clculo de recursos y hombres disponibles). La investigacin
histrica revela que se realizaron 69 censos para calcularlos impuestos,
determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los
romanos, maestros de la organizacin poltica, quienes mejor supieron emplear
los recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin
y sus funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de
las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo
suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.

Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy
pocas operaciones Estadsticas, con la notable excepcin de las relaciones de
tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por
Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos
censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el
Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la
propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer
compendio estadstico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra,


trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi
olvidados durante la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols
Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes,
hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se
crearon los Estados Nacionales y surgi como fuerza el comercio internacional
exista ya un mtodo capaz de aplicarse a los datos econmicos.

Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al


temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en
Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y
matrimonios.

Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno


ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre
continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad)
contenan los nacimientos y fallecimientos por sexo. En 1662, el capitn John
Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 7

el nmero de personas que moriran de varias enfermedades y sobre las


proporciones de nacimientos de varones y mujeres que cabra esperar. El trabajo
de Graunt, condensado en su obra Natural and Political Observations Made upon
the Bills of Mortality (Observaciones Polticas y Naturales. Hechas a partir de las
Cuentas de Mortalidad), fue un esfuerzo innovador en el anlisis estadstico.

Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de


los recursos nacionales, comprensiva de datos sobre organizacin poltica,
instrucciones sociales, comercio y podero militar. Durante el siglo XVII aport
indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y
ampli los campos de la inferencia y la teora Estadstica.

Los eruditos del siglo XVII demostraron especial inters por la Estadstica
Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba,
decreca o permaneca esttica. En los tiempos modernos tales mtodos fueron
resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y
el potencial humano de sus respectivos pases. El primer empleo de los datos
estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de
Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se
propuso destruir la antigua creencia popular de que en los aos terminados en
siete mora ms gente que en los restantes, y para lograrlo hurg pacientemente
en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de
defuncin pudo demostrar que en tales aos no fallecan ms personas que en los
dems. Los procedimientos de Neumann fueron conocidos por el astrnomo
ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al
estudio de la vida humana. Sus clculos sirvieron de base para las tablas de
mortalidad que hoy utilizan todas las compaas de seguros.

Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No
obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin
a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes
problemas cientficos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la


palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y
con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del
gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el
trmino latino status, que significa estado o situacin; Esta etimologa aumenta el
valor intrnseco de la palabra, por cuanto la estadstica revela el sentido
cuantitativo de las ms variadas situaciones.

Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este
interpret la teora de la probabilidad para su uso en las ciencias sociales y
resolver la aplicacin del principio de promedios y de la variabilidad a los
fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de
todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 8

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos


matemticos fundamentales para la teora Estadstica; la teora de los errores de
observacin, aportada por Laplace y Gauss; y la teora de los mnimos cuadrados
desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis
Gaston ide el mtodo Conocido por Correlacin, que tena por objeto medir la
influencia relativa de los factores sobre las variables. De aqu parti el desarrollo
del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la
ciencia biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que
efectuaron amplios estudios sobre la medida de las relaciones.

Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior


desarrollo del clculo de probabilidades, particularmente en la rama denominada
indeterminismo o relatividad, se ha demostrado que el determinismo fue
reconocido en la Fsica como resultado de las investigaciones atmicas y que este
principio se juzga aplicable tanto a las ciencias sociales como a las fsicas.

1.3. CLASIFICACIN DE LA ESTADSTICA.

La estadstica se clasifica de acuerdo a las dos funciones que realiza:

Estadstica Descriptiva. Es aquella parte de la Estadstica que describe y analiza


una poblacin, sin pretender sacar conclusiones de tipo general. Trata de la
recopilacin, clasificacin, presentacin y descripcin de los datos.

Estadstica Inferencial. Es aquella parte de la Estadstica, cuyo propsito es inferir


o inducir leyes de comportamiento de una poblacin, a partir del estudio de una
muestra o una poblacin. Para una toma de decisiones adecuadas y correctas.

1.4. POBLACIN Y MUESTRA.

Poblacin.
Es un conjunto relativamente grande y completo de individuos, elementos,
objetos o unidades que poseen al menos una caracterstica comn y observable.
La poblacin puede ser finita o infinita. Si la poblacin es infinita ser imposible
tener una informacin completa sobre ella, o si la poblacin es finita pero
numerosa y no sea posible estudiar todos y cada uno de sus elementos, es
necesario tomar una muestra. Ejm:

Un conjunto de personas, tales como: Los estudiantes matriculados en una


Universidad del Per en el presente ao acadmico.

Un conjunto de trabajadores de una organizacin gubernamental: tales como:


todos los trabajadores de la Municipalidad Provincial de Puno.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 9

Muestra.
Una muestra es un procedimiento mediante el cual se extraen algunos elementos
de una poblacin, y a travs de ella estimas los parmetros caractersticos de la
poblacin, todos los elementos de la poblacin deben tener la misma oportunidad
de ser elegidos (mediante un proceso aleatorio).

Existen dos mtodos muestrales: no probabilstico y probabilstico, el no


probabilstico comprende una eleccin a criterio o por conveniencia, y el muestreo
probabilstico se halla utilizando frmulas y se aplica para elegir una muestra
apropiada, existen tcnicas o tipos de muestreo como son: El Muestreo Aleatorio
Simple, Muestreo Aleatorio Estratificado, Muestreo Sistemtico y Muestreo por
conglomerados.

Ejemplo:
Si la Poblacin consiste en el total de estudiantes matriculados en una Universidad
del Per en el presente ao acadmico, una muestra sera una eleccin de algunos
estudiantes de todos los semestres y de todas las Escuelas Profesionales.

1.5. OBSERVACIONES.

Estadsticamente son los datos que se recolectan para un estudio.

Unidades de Observacin.
Constituyen los elementos o cosas o elementos observados.

Ejemplo: Si se toma datos acerca del rendimiento acadmico de los estudiantes


de una Escuela Profesional, matriculados en el presente ao acadmico,
entonces el rendimiento acadmico de cada uno de los alumnos
constituyen las observaciones.

Variables.
Alvarez (2007) Los valores de las variables son las luces que vamos a ver
entre las tinieblas de nuestro desconocimiento, su adecuada eleccin y su
correcta medida ayudaran a poner un poco de claridad en el inmenso
ocano de nuestra ignorancia.

Una variable expresa los valores para cada elemento del estudio de una
magnitud. Las variables pueden ser simples o complejas; el valor de las
variables simples se obtiene mediante una medida directa, por ejemplo la
glucemia basal, la tensin arterial sistlica, etc.; las variables complejas se
suelen obtener a partir de varias variables simples, ejemplos: la calidad de
vida, la ansiedad, el grado de invalidez, etc.

Los valores de las variables, los datos, en general, son el principal soporte
de las conclusiones de un estudio o trabajo de investigacin. Para que las
conclusiones tengan valor cientfico es fundamental que los datos sean lo

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 10

ms objetivos posible. Al leer o escribir un trabajo cientfico lo primero que


debe tenerse en cuenta es el origen de los datos y su consistencia,
objetividad. No es infrecuente observar trabajos basados en datos poco
objetivos de los que se obtienen resultados que se consideran solamente
afectados por los errores estadsticos, obviando los errores de medida, y a
partir de los cuales se hacen conclusiones consideradas casi exactas.

Se definen las variables, como magnitudes o valores que tienden a sufrir


modificaciones o cambios dentro de un dominio determinado.

Es decir, las caractersticas que varan de individuo a individuo o de objeto


a objeto se llaman variables; mientras que las que permanecen
inalterables, se llaman: constantes.

Generalmente, las variables se designan con las ultimas letras del


abecedario: X, Y, Z; y los valores que asume las variables con letras
minsculas acompaadas con subndices como: x1, x2, ....., xn.

Ejemplo: En una Universidad del Per, se lleva a cabo un estudio para


determinar la situacin ocupacional de sus egresados de la Escuela
Profesional de Contabilidad.

En relacin a este estudio, identifique las propiedades siguientes como


constantes o variables: Sexo, Ingresos anuales, Profesin, Nmero de aos
de experiencia y Nivel jerrquico ocupacional

PORPIEDADES ES JUSTIFICCION

a) Sexo VARIABLE Todos los egresados(as) son de


ambos sexos.

b) Ingresos VARIABLE Cada egresado(a) tiene


Mensuales diferente nivel de ingresos.

c) Profesin CONSTANTE Todos los egresados(as) son


Licenciados(as) en Contabilidad.

d) Nmero de VARIABLE Cada Licenciado(a) en


Aos de Contabilidad tiene diferente
Experiencia tiempo de experiencia.

e) Nivel VARIABLE Cada Licenciado(a) en


Jerrquico Contabilidad tiene nivel
Ocupacional jerrquico diferente.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 11

Supongamos que hemos encuestado a tres (03)


Licenciados(as) en Contabilidad del estudio anterior, y cada
una de ellos nos proporciona la siguiente informacin:

Ingresos Mensuales:
Licenciado en Contabilidad 1 = S/. 3800,00
Licenciado en Contabilidad 2 = S/. 2920,00
Licenciado en Contabilidad 3 = S/. 1480,00

Aos de Experiencia:
Licenciado en Contabilidad 1 = 8 aos
Licenciado en Contabilidad 2 = 3 aos
Licenciado en Contabilidad 3 = 1 ao

Nivel jerrquico Ocupacional:


Licenciado en Contabilidad 1 = Jefe (a) de
Departamento
Licenciado en Contabilidad 2 = Coordinador(a)
Licenciado en Contabilidad 3 = Auxiliar

Luego tenemos:

VARIABLE VALORES DE LA VARIABLE


(Dominio de Variacin)
LITERAL SIMBOLICA
X1 = S/. 3800,00
Ingresos X X2 = S/. 2920,00
Mensuales X3 = S/. 1480,00

y1 = 8 aos
Aos de Y y2 = 3 aos
Experiencia y3 = 1 ao

Nivel z1 = Jefe(a) de
Jerrquico Z Departamento
Ocupacional. z2 = Coordinador(a)
z3 = Auxiliar

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 12

1.6. CLASIFICACIN DE LAS VARIABLES.

PRIMER CRITERIO:

A) POR SU GENERALIDAD O NIVEL DE ABSTRACCIN.

a. Tericas.
Son aquellas variables que necesitan definirse operacionalmente;
porque sus cualidades o caractersticas no son fcilmente observables
ni medibles.
Ejemplo: Desarrollo econmico, estrato socioeconmico, rendimiento
acadmico, hbitos de consumo, etc.

b. Intermedias.
Son variables que permiten especificar a las variables tericas, con el
fin de hacerlas observables y medibles.

c. Empricas.
Son aquellas variables que no necesitan definirse operacionalmente;
porque sus valores se identifican en forma inmediata y son fcilmente
medibles.
Ejemplo: Edad, sexo, peso, talla, etc.

VARIABLE VARIABLES VARIABLES


TERICA INTERMEDIAS EMPRICAS
ESTUDIANTES UNIVERSITARIOS
RENDIMIENTO ACADMICO de

ALTA : 17 20
CALIFICACIONES MEDIA : 11 16
BAJA : 00 10

ASISTENCIA A ALTA : 81%100%


CLASES MEDIA : 61% 80%
BAJA : menos 61%

PRCTICAS PRE EFICIENTE : 17 - 20


PROFESIONALES REGULAR : 11 - 16
DEFICIENTE : 00 10

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 13

SEGUNDO CRITERIO:

B) POR SU RELACIN CAUSAL.

a. Independientes
Generalmente se simbolizan estas variables con la letra mayscula X; y
son aquellas que no dependen de ninguna variable dentro de un
contexto determinado.
Indica: causa, antecedente, fundamento.

b. Dependientes
Generalmente se simbolizan estas variables con la letra mayscula Y; y
son aquellas que dependen de otra y otras variables dentro de un
contexto determinado.
Indica: efecto, consecuente, resultado.

Ejemplo:
El escaso fomento de la educacin financiera en la poblacin,
X
genera mayor desequilibrio econmico en las familias.
Y

En este ejemplo las variables son:

Educacin financiera = X (Variable independiente)


Desequilibrio econmico = Y (Variable dependiente)

TERCER CRITERIO:

C) POR SU NATURALEZA.

Clasificacin de mucha utilidad para fines estadsticos.

a. Variables Cualitativas.

Son aquellas cuyo dominio de variacin son objeto de clasificacin. Se


clasifican en:

Cualitativa Nominal.

Son aquellas cuyo dominio de variacin son objeto de


clasificacin y no admiten un orden en particular.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 14

Ejemplo:

DOMINIO DE
VARIABLE
VARIACIN

- Masculino
GENERO
- Femenino

- Puno
- Juliaca
- Ilave
PROCEDENCIA
- Azngaro
DEL
- Yunguyo
ESTUDIANTE
- Arequipa
UNIVERSITARIO
- Cusco
-

Cualitativa Ordinal.

Son aquellas cuyo dominio de variacin son objeto de clasificacin y


admiten un orden.

Ejemplo:

DOMINIO DE
VARIABLE
VARIACIN

- Analfabeto
NIVEL DE - Primaria
INSTRUCCIN - Secundaria
- Superior

NIVEL - Bajo
SOCIO- - Medio
ECONMICO - Alto

- Bachiller
- Magister
GRADO ACADMICO
- Doctor
- Post Doctorado

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 15

b. Variables Cuantitativas.

Son aquellas cuyos valores del dominio de variacin son contados o


medidos. Se clasifican en:

Cuantitativa Discreta.
Cuando los valores del dominio de variacin son contados; y por
lo tanto slo pueden asumir valores enteros.

Ejemplo:
DOMINIO DE
VARIABLE
VARIACIN

- 112 nios
NMERO DE
NACIDOS VIVOS - 10 nios

- 50 alumnos
NMERO DE ALUMNOS - 46 alumnos
- 35 alumnos

Cuantitativa Contina.

Cuando los valores del dominio de variacin son susceptibles de


ser medidos, los cuales asumen valores decimales.

Ejemplo:

VARIABLE DOMINIO DE VARIACIN

- 56,50 Kg.
PESO
- 59,75 Kg.
- 96,50 Kg.

INGRESO - S/. 2708.50


ECONOMICO - S/. 4987.75
- S/. 6793.25

- 28,5 C
TEMPERATURA
- 32,6 C
- 25,3 C

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 16

CAPTULO II

MTODOS ESTADSTICOS

DEFINICIN.

Los mtodos estadsticos son un conjunto de procedimientos que se aplican en


una secuencia lgica con el fin de recopilar, organizar, presentar, analizar e
interpretar datos cualitativos o cuantitativos de fenmenos sujetos a
variaciones.

ETAPAS DEL MTODO ESTADSTICO

El mtodo estadstico, parte de la observacin de un fenmeno, y como no


puede siempre mantener las mismas condiciones predeterminadas o a
voluntad del investigador, deja que acten libremente, pero se registran las
diferentes observaciones y se analizan sus variaciones. Para el planeamiento de
una investigacin, por norma general, se siguen las siguientes etapas:

1. Planteamiento del problema.


2. Fijacin de los objetivos.
3. Formulacin de la hiptesis.
4. Definicin de la unidad de observacin y de la unidad de medida.
5. Determinacin de la poblacin y de la muestra.
6. La recoleccin.
7. Crtica, clasificacin y ordenacin.
8. Tabulacin.
9. Presentacin.
10. Anlisis.
11. Publicacin.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 17

1. PLANTEAMIENTO DEL PROBLEMA


Al abordar una investigacin se debe tener bien definido qu se va a
investigar y por qu se pretende estudiar algo. Es decir, se debe
establecer una delimitacin clara, concreta e inteligible sobre el o los
fenmenos que se pretenden estudiar, para lo cual se deben tener en
cuenta, entre otras cosas, la revisin bibliogrfica del tema, para ver su
accesibilidad y consultar los resultados obtenidos por investigaciones
similares, someter nuestras proposiciones bsicas a un anlisis lgico;
es decir, se debe hacer una ubicacin histrica y terica del problema.

2. FIJACIN DE LOS OBJETIVOS


Luego de tener claro lo que se pretende investigar, Debemos
presupuestar hasta dnde queremos llegar; en otras palabras, debemos
fijar cules son nuestras metas y objetivos. Estos deben plantearse de
tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo
plazo, as como entre los objetivos generales y los especficos.

3. FORMULACIN DE LAS HIPTESIS


Una hiptesis es ante todo, una explicacin provisional de los hechos
objeto de estudio, y su formulacin depende del conocimiento que el
investigador posea sobre la poblacin investigada. Una hiptesis
estadstica debe ser susceptible de decimar, esto es, debe poderse
probar para su aceptacin o rechazo .Una hiptesis que se formula
acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa
por Ho; a su hiptesis contraria se le llama Hiptesis Alternativa(H1).

4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD


DEMEDIDA
La Unidad de Observacin, entendida como cada uno de los elementos
constituyentes de la poblacin estudiada, debe definirse previamente,
resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a
las que se les har la medicin. La unidad de observacin puede estar
constituida por uno o varios individuos u objetos y denominarse
respectivamente simple o compleja. El criterio sobre la unidad de
medicin debe ser previamente definido y unificado por todo el equipo
de investigacin. Si se trata de medidas de longitud, volumen, peso,
etc., debe establecerse bajo qu unidad se tomarn las observaciones
ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad
de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la informacin.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 18

5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA


Estadsticamente, la poblacin se define como un conjunto de
individuos o de objetos que poseen una o varias caractersticas
comunes. No se refiere esta definicin nicamente a los seres vivientes;
una poblacin puede estar constituida por los habitantes de un pas o
por los peces de un estanque, as como por los establecimientos
comerciales de un barrio o las unidades de vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas
e infinitas. Aqu el trmino infinito no est siendo tomado con el rigor
semntico de la palabra; por ejemplo, los peces dentro de un estanque
son un conjunto finito; sin embargo, en trminos estadsticos, puede ser
considerado como infinito. Muestra es un subconjunto de la poblacin a
la cual se le efecta la medicin con el fin de estudiar las propiedades
del conjunto del cual es obtenida. En la prctica, estudiar todos y cada
uno de los elementos que conforman la poblacin no es aconsejable, ya
sea por la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se est
midiendo, por ser demasiado grande el nmero de sus componentes o
no se pueden controlar; por eso se recurre al anlisis de los elementos
de una muestra con el fin de hacer inferencias respecto al total de la
poblacin. Existen diversos mtodos para calcular el tamao de la
muestra y tambin para tomar los elementos que la conforman, pero
no es el objetivo de este curso estudiarlos. Diremos solamente que la
muestra debe ser representativa de la poblacin y sus elementos
escogidos al azar para asegurar la objetividad de la investigacin.

6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin
de la informacin, la cual ha de partir, a menos que se tenga
experiencia con muestras anlogo, de una o varias muestras piloto en
las cuales se pondrn a prueba los cuestionarios y se obtendr una
aproximacin de la variabilidad de la poblacin, con el fin de calcular el
tamao exacto de la muestra que conduzca a una estimacin de los
parmetros con la precisin establecida. El establecimiento de las
fuentes y cauces de informacin, as como la cantidad y complejidad de
las preguntas, de acuerdo con los objetivos de la investigacin son
decisiones que se han de tomar teniendo en cuenta la disponibilidad de
los recursos financieros, humanos y de tiempo y las limitaciones que se
tengan en la zona geogrfica, el grado de desarrollo, la ausencia de
tcnica, etc. Es, entonces, descubrir dnde est la informacin y cmo y
a qu "costo" se puede conseguir; es determinar si la encuesta se debe
aplicar por telfono, por correo, o si se necesitan agentes directos que
recojan la informacin; establecer su nmero ptimo y preparar su
entrenamiento adecuado.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 19

7. CRITICA, CLASIFICACIN Y ORDENACIN


Despus de haber reunido toda la informacin pertinente, se necesita la
depuracin de los datos recogidos. Para hacer la crtica de una informacin,
es fundamental el conocimiento de la poblacin por parte de quien depura
para poder detectar falsedades en las respuestas, incomprensin a las
preguntas, respuestas al margen, amn de todas las posibles causas de
nulidad de una -pregunta o nulidad de todo un cuestionario.
Separado el material de "desecho" con la informacin depurada se procede
a establecer las clasificaciones respectivas y con la ayuda de hojas de
trabajo, en las que se establecen los cruces necesarios entre las preguntas,
se ordenan las respuestas y se preparan los modelos de tabulacin de las
diferentes variables que intervienen en la investigacin. El avance
tecnolgico y la popularizacin de los computadores hacen que estas
tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.

8. LA TABULACIN
Una Tabla es un resumen de informacin respecto a una o ms variables,
que ofrece claridad al lector sobre lo que se pretende describir; para su fcil
interpretacin una tabla debe tener por lo menos: Un ttulo adecuado el
cual debe ser claro y conciso. La Tabla propiamente dicha con los
correspondientes subttulos internos y la cuantificacin de los diferentes
tems de las variables, y las notas de pie de cuadro que hagan claridad
sobre situaciones especiales de la tabla, u otorguen los crditos a la fuente
de la informacin.

9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en
la forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero
se debe tener cuidado con las variables que se van a presentar y la forma
de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin. Adems la eleccin
de determinada tabla o grfico para mostrar los resultados, debe hacerse
no slo en funcin de las variables que relaciona, sino del lector a quien va
dirigido el informe.

10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que
convierten las especulaciones de primera mano en aseveraciones cuya
confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma
de una decisin. Es el anlisis donde se cristaliza la investigacin. Esta es la
fase de la determinacin de los parmetros y estadsticos mustrales para
las estimaciones e inferencias respecto a la poblacin, el ajuste de modelos
y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar
las conclusiones definitivas.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 20

11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay
otros estudiosos del mismo problema a quienes se les puede SISTEMAS DE
aportar informacin, conocimientos y otros puntos de vista acerca de l
(12).

CENSO

Es una investigacin que cubre a todos los miembros o elementos de una


poblacin dada; un censo completo es a menudo innecesario, antieconmico y
una molestia para el pblico y tambin que es menos efectivo que una
encuesta, para recoger ciertos tipos de informacin. Peridicamente se
levantan diferentes tipos de censos en todo el mundo, entre los ms conocidos
estn; el censo de poblacin y vivienda, censos agropecuarios, censos a las
empresas mercantiles y manufactureras, etc. Proporcionan datos muy
importantes sobre poblacin. Vivienda, empleos poblacin econmicamente
activa, uso de la tierra, tamao de las fincas, ganadera, etc., etc.

ENCUESTA

Es una investigacin en la cual la informacin se obtiene de una fraccin de la


poblacin llamada muestra; la encuesta por muestreo disfruta de cinco
ventajas que la hacen atractiva frente al censo, aun en los casos donde a este
se le considera prcticamente exclusivo, como son los estudios sobre poblacin
y estos son:

1. La realizacin de una encuesta resulta menos costosa que el censo.

2. La encuesta permite mayor rapidez en la recopilacin y anlisis de los


datos. Ya que en censo requiere de meses de intenso trabajo para la
publicacin de los datos.

3. El nmero de entrevistadores utilizado en la encuesta es mucho menor


y por consiguiente es posible ofrecerles una capacitacin ms eficaz y
una supervisin ms cuidadosa.

4. El resultado ser de una mejor calificacin y la mayor capacitacin del


personal de campo de la encuesta.

5. La encuesta por muestreo es menos notoria que el censo y no


constituye una pesadumbre para l pblico.

6. El censo proporciona datos hasta un nivel de subdivisiones geogrficas


muy pequeas.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 21

ETAPAS DE UNA ENCUESTA POR MUESTREO

La planeacin: constituye el establecimiento de los objetivos de la


investigacin y la creacin de la estrategia general para obtener y
analizar los datos, incluye adems, la elaboracin de presupuestos,
revisin de literatura, definicin de objetivos especficos, etc.

La elaboracin de un diseo de investigacin: El diseo de la muestra


est relacionado estrechamente con la planeacin y por lo regular
ocurre en forma simultnea, consiste en una programacin preparada
de antemano con el objetivo de recolectar y analizar la informacin
necesaria para satisfacer los objetivos del estudio, al costo ms bajo
posible.

Diseo de la muestra (muestreo): Es el proceso de seleccionar ciertos


elementos de la poblacin; En esta etapa, el investigador debe definir
con claridad y cuidado la poblacin que se va a estudiar y la
generalizacin de los datos de la muestra que dicha poblacin
permitir.

Diseo del cuestionario: Es el proceso de adaptar los diferentes


objetivos del estudio a preguntas que permitan obtener la informacin
necesaria. Esta etapa incluye la formulacin del tipo de pregunta,
numero de estas, secuencia y los medios para mantener motivada a la
persona encuestada. Sus principales objetivos son:

1-Obtener informacin aplicable a los propsitos de la encuesta o


investigacin.
2-Recopilar las informaciones con el mximo de responsabilidad,
validez y con precisin.

El trabajo de campo: En esta etapa de la investigacin se incluye el


reclutamiento de entrevistadores, supervisores y otro personal de
campo. Adems, incluye la capacitacin del personal de campo,
preparacin de instrucciones escritas para los entrevistadores sobre el
uso del cuestionario, la recopilacin de los datos en el campo y el
control de calidad de las entrevistas, etc.

La verificacin y la codificacin: estos dos son procesos afines


diseados con el propsito de transcribir la informacin registrada en
los cuestionarios a una forma adecuada para el anlisis estadstico. El
objetivo bsico de la verificacin el eliminar las respuestas incompletas
o inconsistentes, como tambin los errores en el uso del cuestionario.
La codificacin es un proceso tcnico que consiste en convertir datos
cualitativos en datos numricos que puedan ser almacenados, contados
o tabulados con rapidez y facilidad.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 22

La preparacin para el anlisis: Esta etapa incluye un conjunto de


actividades, como: digitacin de los datos, chequeos rutinarios para
determinar la compatibilidad de las respuestas, plan de tabulacin de
los datos. La digitacin es el procedimiento utilizado para el
almacenamiento de la informacin y constituye el primer paso despus
de la codificacin para registrar los datos, de manera tal que puedan ser
fcilmente recuperados y tabulados.

Anlisis y preparacin del informe: Consiste en la presentacin e


interpretacin de tablas simples y de mltiples entradas de los datos
recopilados en la investigacin. El objetivo de esta etapa es
proporcionar un resumen de los datos, capaz de satisfacer los
propsitos de la investigacin, lo ms breve y comprensible posible.

Puede incluir tablas de porcentajes, medidas de tendencia central, medidas de


asociacin, pruebas de hiptesis, estimaciones, etc. Es importante tener
presente tres aspectos bsicos en su planeacin. Estos son: el estilo en que se
va a escribir, la mecnica de presentacin del material y la organizacin de los
temas del informe.

Ejemplo:

Se desea recabar informacin de una institucin o empresa pblica o


privada sobre el estado fsico y lgico de las computadoras y las
necesidades o problemas que tiene el operador o trabajador y los
usuarios o clientes de la institucin o empresa, con el fin de brindar un
servicio eficiente y de calidad a los operadores o trabajadores y los
usuarios o clientes de la institucin o empresa.

Para ello se puede elaborar 2 encuestas: una dirigida a los operadores o


trabajadores de la institucin y la otra los usuarios o clientes de la
institucin.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 23

CAPTULO III

DISTRIBUCIN DE FRECUENCIAS.

Es un proceso de la Estadstica Descriptiva que comprende la agrupacin de


datos en categoras mutuamente excluyentes en la que se indica el nmero de
observaciones en cada categora. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente en
cada clase, todo ello presentado en tablas.

Ejemplo 01. A continuacin se dan las remuneraciones semanales en Soles de


50 empleados de una Empresa textilera. Cuyas remuneraciones son las
siguientes:

196 177 184 192 180 150 179 197 200 180
242 255 205 228 196 230 170 216 175 196
226 230 218 235 197 210 217 205 200 191
203 190 221 173 185 225 190 201 174 180
218 208 200 191 187 195 201 200 204 194

Al observar los datos podemos apreciar su variabilidad y tambin el desorden


en que se encuentran, esto hace difcil el anlisis lo cual no permite destacar
los hechos ms importantes para obtener conclusiones acertadas que ayuden
en la interpretacin. De all se hace necesario ordenar los datos en una tabla de
distribucin de frecuencias.

Para elaborar una tabla de distribucin de frecuencias, se debe seguir los


siguientes pasos:

a) Clculo del recorrido o rango (R).

El rango se define como la distancia entre el dato mximo y el dato mnimo.


Se halla restado el dato mayor (Xmax) con el dato menor (Xmin):

R = Xmax - Xmin

Para los datos dados anteriormente se tiene:


R= Xmax - Xmin = 255- 150 = 105

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 24

b) Determinacin del nmero de intervalos de clases (K).

El nmero de clases, es el nmero de categoras o intervalos en el que se va


a dividir la informacin.
El nmero de clases se puede fijar arbitrariamente, dependiendo del
nmero de datos que se tenga.

Sin embargo, existe tambin otra forma de determinar el nmero de clases


con bastante aproximacin, la cual se le conoce con el nombre de REGLA
DE STURGES y cuyo clculo responde a la siguiente frmula:

K = 1 + 3,322 Log. ( n )

Para los datos dados anteriormente se tiene:

K = 1 + 3.322 Log(50)
K = 1 + 3.322 (1,698970004)
K = 6.643978354
K = 6, 7 u 8 Intervalos

Elegimos los 3 enteros prximos al resultado. Esto significa que la


informacin se puede dividir en 6,7 u 8 intervalos de clase, o simplemente
clases.

c) Determinacin de la amplitud o ancho de intervalo (C).

Llamado tambin ancho de clase, la amplitud es el rango de cada intervalo


de clase. Un intervalo se forma por dos lmites que definen una clase.
R
C
K

El valor de la amplitud del intervalo, depender de la cantidad de decimales


que tengan los datos en general; es decir, si los datos no tienen decimales,
entonces el valor de la amplitud se redondea a un valor entero, pero si los
datos tienen decimales, entonces la amplitud se redondea a un nmero
que tenga la misma cantidad de decimales que los datos.

Para los datos dados anteriormente se tiene:

C1= 105/6 = 17.5


C2= 105/7 = 15
C3= 105/8 = 13.125

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 25

Finalmente decidimos que usaremos K=7 intervalos con un ancho de


clases C=15. POR LA SIGUIENTE RAZON: descartamos C3 porque en su
redondeo se pierde decimales (esto conlleva a que el lmite superior del
ltimo intervalo se reducira y no habra lugar para asignar el valor
mximo del conjunto de datos). El ancho de clase C1, tiene redondeo
favorable pero C2 es entero igual a los datos originales, es por ello que
elegimos este ancho de clase con su respectivo nmero de intervalos
(K=7).

Nota: en el caso de que dos o tres anchos de clase tuviesen redondeo


favorable, de ellos debemos elegir al que tenga menor diferencia en su
redondeo (para que el lmite superior del ltimo intervalo no se exceda
mucho)

d) Formacin de los intervalos de clase (Ii)

Formar los intervalos de clase, significa hallar los lmites inferior y superior
de cada intervalo de clase; y para ello se parte del dato menor (Xmin = 150) y
se le suma la amplitud del intervalo (C = 15), de la siguiente manera:

Primera Clase:
Intervalo Primera Clase:
150 + 15 = 165
[150 165)
Limite
Limite Amplitud
Superior
Inferior

Luego 150 constituye el lmite inferior y 165 el lmite superior.

El procedimiento se sigue con las dems clases hasta la ltima clase; de tal
forma que se obtiene lo siguiente:

Nmero de
Intervalos [ Ii )
1 [ 150 -165 )
2 [ 165 -180 )
3 [ 180 -195 )
4 [ 195 -210 )
5 [ 210 -225 )
6 [ 225 -240 )
7 [ 240 -255 ]

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 26

Una forma prctica de determinar los intervalos de clase, consiste en hallar


primero todos los lmites inferiores de cada clase, sumndoles la amplitud del
intervalo.

Los intervalos de frecuencias son cerrados por la izquierda y abiertos por la


derecha esto implica que el valor del lmite inferior es considerado dentro de
este intervalo por estar denotado por [ = intervalo cerrado, pero el valor del
lmite superior no se considera dentro del intervalo porque esta denotado por
) = intervalo abierto, en su lugar se considera a los valores menores al lmite
superior.

Nota: Los intervalos no siempre van a tener la misma amplitud. De acuerdo a la


investigacin y a la necesidad de presentar la informacin para su anlisis
correspondiente, es posible tener tres tipos de intervalos:

Intervalos de Intervalos de
Intervalos abiertos
amplitud igual diferente amplitud
Grandes grupos de Peso de pacientes
Edad (aos)
edad (aos) en (Kg.)
[ 16 20 ) [ 0 15) Menor de 55
[ 20 24 ) [15 64) [55 60)
[ 24 28 ) [64 85) [60 65)
[ 28 32 ) [65 70)
[ 32 36 ] 70 y ms

e) Frecuencia absoluta (fi)


Es el nmero de veces que se repiten los valores dentro de los diferentes
intervalos en que se ha dividido la informacin.

Para obtener la frecuencia absoluta de cada clase, se efecta la tabulacin


o conteo.
[ Ii ) Tabulacin fi
[ 150 -165 ) / 1
[ 165 -180 ) ///// / 6
[ 180 -195 ) ///// ///// // 12
[ 195 -210 ) ///// ///// ///// // 17
[ 210 -225 ) ///// / 6
[ 225 -240 ) ///// / 6
[ 240 -255 ] // 2
TOTALES 50

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 27

f) Frecuencia absoluta acumulada (Fi)


Se obtiene sumando y acumulando los valores absolutos clase por clase en
orden ascendente.

En la 1ra. clase : F1 = f1
En la 2da. clase : F2 = f1 + f2
En la 3ra. clase : F3 = f1 + f2 + f3
. . . . .
En la clase i : Fi = f1 + f2 + f3 + ... + fi

[ Ii ) fi Fi
[ 150 -165 ) 1 1
[ 165 -180 ) 6 7
[ 180 -195 ) 12 19
[ 195 -210 ) 17 36
[ 210 -225 ) 6 42
[ 225 -240 ) 6 48
[ 240 -255 ] 2 50
TOTALES 50

g) Frecuencia relativa (hi)


Es el valor que resulta al dividir cada una de las frecuencias absolutas entre
el total de datos. As:

f1
En la 1ra. clase: h1 =
n
f
En la 2da. clase: h2 = 2
n

En
fi general:
hi =
n

[ Ii ) fi Fi hi
[ 150 -165 ) 1 1 0.02
[ 165 -180 ) 6 7 0.12
[ 180 -195 ) 12 19 0.24
[ 195 -210 ) 17 36 0.34
[ 210 -225 ) 6 42 0.12
[ 225 -240 ) 6 48 0.12
[ 240 -255 ] 2 50 0.04
TOTALES 50 1

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 28

h) Frecuencia relativa acumulada (Hi)


Se obtiene sumando y acumulando los valores de las frecuencias relativas
clase por clase en orden ascendente.

En la 1ra. clase: H1 = h1
En la 2da. clase : H2 = h1 + h2
En la 3ra. clase: H3 = h1 + h2 + h3
. . . . .
. . . . .
En la clase i : Hi = h1 + h2 + h3 + ... + hi

Nota: Por lo general a las frecuencias relativas las multiplicamos por 100, con el
fin de obtener los valores expresados en porcentaje.

[ Ii ) fi Fi hi Hi
[ 150 -165 ) 1 1 0.02 0.02
[ 165 -180 ) 6 7 0.12 0.14
[ 180 -195 ) 12 19 0.24 0.38
[ 195 -210 ) 17 36 0.34 0.72
[ 210 -225 ) 6 42 0.12 0.84
[ 225 -240 ) 6 48 0.12 0.96
[ 240 -255 ] 2 50 0.04 1.00
TOTALES 50 1

i) Frecuencia relativa porcentual (hi %)


Es el resultado del producto de hi * 100%, cuyas interpretaciones
corresponden a valores porcentuales.

[ Ii ) fi Fi hi Hi hi %
[ 150 -165 ) 1 1 0.02 0.02 2
[ 165 -180 ) 6 7 0.12 0.14 12
[ 180 -195 ) 12 19 0.24 0.38 24
[ 195 -210 ) 17 36 0.34 0.72 34
[ 210 -225 ) 6 42 0.12 0.84 12
[ 225 -240 ) 6 48 0.12 0.96 12
[ 240 -255 ] 2 50 0.04 1.00 4
TOTALES 50 1 100

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 29

j) Frecuencia relativa acumulada porcentual (Hi %)


Es el resultado del producto de Hi * 100%, cuyas interpretaciones
corresponden a valores porcentuales.

[ Ii ) fi Fi hi Hi hi % Hi %
[ 150 -165 ) 1 1 0.02 0.02 2 2
[ 165 -180 ) 6 7 0.12 0.14 12 14
[ 180 -195 ) 12 19 0.24 0.38 24 38
[ 195 -210 ) 17 36 0.34 0.72 34 72
[ 210 -225 ) 6 42 0.12 0.84 12 84
[ 225 -240 ) 6 48 0.12 0.96 12 96
[ 240 -255 ] 2 50 0.04 1.00 4 100
TOTALES 50 1 100

k) Punto medio o marca de clase (Xi)


Se define como la semisuma de los lmites inferior y superior de cada
intervalo de clase.

Lmite Inferior Lmite Superior


Xi =
2

FINALMENTE EL CUADRO DE DISTRIBUCION DE FRECUENCIAS QUEDARA DE LA


SIGUIENTE FORMA:

[ Ii ) Xi fi Fi hi Hi hi % Hi %
[ 150 -165 ) 157.5 1 1 0.02 0.02 2 2
[ 165 -180 ) 172.5 6 7 0.12 0.14 12 14
[ 180 -195 ) 187.5 12 19 0.24 0.38 24 38
[ 195 -210 ) 202.5 17 36 0.34 0.72 34 72
[ 210 -225 ) 217.5 6 42 0.12 0.84 12 84
[ 225 -240 ) 232.5 6 48 0.12 0.96 12 96
[ 240 -255 ] 247.5 2 50 0.04 1.00 4 100
TOTALES 50 1 100

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 30

Propiedades y Relaciones de las Frecuencias

1) Las frecuencias absolutas son cantidades enteras positivas nunca


negativas ni nmeros decimales (puede ser cero en algunos casos).

2) Las frecuencias relativas se pueden expresar en tanto por uno (nmeros


decimales mayores o iguales que cero, pero menores o iguales que 1);
tambin pueden expresarse en porcentajes. Es decir:

0 hi 1

0% hi % 100%

3) La suma de las frecuencias absolutas de todas las clases es igual al


nmero total de datos.
k

f
i 1
i n

4) La suma de las frecuencias relativas es igual a 1,00 100%.


k

h
i 1
i 1

h % 100%
i 1
i

5) La frecuencia absoluta acumulada (Fk) de la ltima clase es igual al


nmero total de datos Fk = n.

6) La frecuencia relativa acumulada de la ltima clase es igual a 1 100%.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 31

INTERPRETACIONES (DEL CUADRO DE DISTRIBUCION DE FRECUENCIAS):

Interpretar f3 :
f3 = 12 : Significa que 12 de los 50 empleados textiles tienen ingresos
semanales de 180 a menos de 195 Nuevos Soles.

Interpretar f6 :
f6 = 6 : Significa que 6 de los 50 empleados textiles tienen ingresos
semanales de 225 a menos de 240 Nuevos Soles

Interpretar F3 :
F3 = 19 : Significa que 19 de los 50 empleados textiles tienen ingresos
semanales de 150 a menos de 195 Nuevos Soles.

Interpretar F6 :
F6 = 48 : Significa que 48 de los 50 empleados textiles tienen ingresos
semanales de 150 a menos de 240 Nuevos Soles

Interpretar h3 %:
h3 = 24% : Significa que 24% de los 50 empleados textiles tienen
ingresos semanales de 180 a menos de 195 Nuevos Soles.

Interpretar h4 %:
h4% = 34 : Significa que 34% de los 50 empleados textiles tienen
ingresos semanales de 195 a menos de 210 Nuevos Soles.

Interpretar h6 %:
h6% = 12 : Significa que 12% de los 50 empleados textiles tienen
ingresos semanales de 225 a menos de 240 Nuevos Soles.

Interpretar H3 %:
H3% = 38% : Significa que 38% de los 50 empleados textiles tienen
ingresos semanales de 150 a menos de 195 Nuevos Soles.

Interpretar H6 %:
H6% = 96% : Significa que 96% de los 50 empleados textiles tienen
ingresos semanales de 150 a menos de 240 Nuevos Soles.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 32

Ejemplo 02. A continuacin se dan las estaturas (en centmetros) de una


muestra de 50 estudiantes que estn matriculados en el curso de
Estadstica y son las siguientes:

150 156 159 163 164 166 167 169 171 173
152 157 160 163 164 166 168 169 171 174
154 158 161 164 164 166 168 170 172 176
155 158 162 164 165 167 169 170 172 178
156 159 163 164 165 167 169 170 173 184

a) Clculo del rango o recorrido (R).

El rango se define como la distancia entre el dato mximo y el dato


mnimo. Se halla restado el dato mayor (Xmax) con el dato menor (Xmin):

R = Xmax - Xmin

Para los datos dados anteriormente se tiene:


R= (Xmax = 184) - (Xmin = 150) = 34

b) Determinacin del nmero de intervalos de clases (K).


K = 1 + 3,322 Log. ( n )

Para los datos dados anteriormente se tiene:

K = 1 + 3.322 Log(50)
K = 1 + 3.322 (1,698970004)
K = 6.643978354
K = 6, 7 u 8 Intervalos

Elegimos los 3 enteros prximos al resultado. Esto significa que la


informacin se puede dividir en 6,7 u 8 intervalos de clase, o
simplemente clases.

c) Determinacin de la amplitud o ancho de intervalo (C).

Llamado tambin ancho de clase, la amplitud es el rango de cada


intervalo de clase. Un intervalo se forma por dos lmites que definen
una clase.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 33

R
C
K

C1= 34/6 = 5,6666666 = 6


C2= 34/7 = 4,857143 = 5
C3= 34/8 = 4,25 = 4

Finalmente decidimos que usaremos K=7 intervalos con un ancho de


clases C=5. POR LA SIGUIENTE RAZON: descartamos C3 porque en su
redondeo se pierde decimales (esto conlleva a que el lmite superior del
ltimo intervalo se reducira y no habra lugar para asignar el valor
mximo del conjunto de datos). El ancho de clase C1, tiene redondeo
favorable en una diferencia mayor al C2 (esto conlleva a que el lmite
superior de la ltima clase se extienda en ms unidades) mientras que
C2 tambin se redondea a C=5 pero en su diferencia es menor al de C1
(es en todo caso el ms adecuado porque el lmite superior de la ltima
clase se extender en un nmero menor de unidades).

d) Formacin de los intervalos de clase ( Ii )


e) Frecuencia absoluta (fi)
f) Frecuencia absoluta acumulada (Fi)
g) Frecuencia relativa (hi)
h) Frecuencia relativa acumulada (Hi)
i) Frecuencia relativa porcentual (hi %)
j) Frecuencia relativa acumulada porcentual (Hi %)
k) Punto medio o marca de clase (Xi)

El cuadro de distribucin de frecuencias de las estaturas (en centmetros)


de una muestra de 50 estudiantes que estn matriculados en el curso de
estadstica quedara de la siguiente forma:

[ Ii ) Xi fi Fi hi Hi hi % Hi %
[ 150 - 155 ) 152,5 3 3 0,06 0,06 6 6
[ 155 - 160 ) 157,5 8 11 0,16 0,22 16 22
[ 160 - 165 ) 162,5 12 23 0,24 0,46 24 46
[ 165 - 170 ) 167,5 14 37 0,28 0,74 28 74
[ 170 - 175 ) 172,5 10 47 0,2 0,94 20 94
[ 175 - 180 ) 177,5 2 49 0,04 0,98 4 98
[ 180 - 185 ] 182,5 1 50 0,02 1 2 100
TOTALES 50 1 100

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 34

INTERPRETACIONES:

Interpretar f4 :
f4 = 14 : Significa que 14 de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 165 cm.
a menos de 170 cm.

Interpretar F3 :
F3 = 23 : Significa que 23 de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 150 cm.
a menos de 165 cm.

Interpretar F5 :
F5 = 47 : Significa que 47 de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 150 cm.
a menos de 175 cm.

Interpretar h3 %:
h3% = 24% : Significa que 24% de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 160 cm.
a menos de 165 cm.

Interpretar h6 %:
h6% = 4% : Significa que solo el 4% de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 175 cm.
a menos de 180 cm.

Interpretar H3 %:
H3% = 46% : Significa que 46% de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 150 cm.
a menos de 165 cm.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 35

GRAFICAS ESTADISTICAS

HISTOGRAMA DE FRECUENCIAS
Son grficas de rectngulos cuyas bases representan los Intervalos de Clase
y las alturas las Frecuencias Absolutas o Relativas. (Ii , ni), (Ii , fi), (Ii , hi)
Este grfico nos permite comparar frecuencias.

LAS HISTOGRAMAS PARA LOS EJEMPLOS ANTERIORES SERIAN:

POLIGNO DE FRECUENCIAS

Es una poligonal construida uniendo los puntos (Xi, fi) o (Xi, hi) mediante
segmentos de rectas. Los polgonos de frecuencia nos permite comparar
varias distribuciones superpuestas cuando todas ellas estn expresadas en
la misma escala y en lo posible tienen los mismos lmites de clase.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 36

LOS POLIGONOS DE FRECUENTCIAS PARA LOS EJEMPLOS ANTERIORES SERIAN:

OJIVA
Es una grfica construida con los puntos cuyas abscisas son los lmites superiores
de las clases y las ordenadas son las frecuencias absolutas acumuladas o relativas
acumuladas o las porcentuales. Se aade una clase con frecuencia cero antes de la
primera clase.

LAS OJIVAS PARA LOS EJEMPLOS ANTERIORES SERIAN:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 37

GRAFICAS DE SECTORES ANGULARES O DIAGRAMAS CIRCULARES.

Las cantidades porcentuales se transforman a grados sexagesimales


mediante la relacin:
f i * 360
i hi * 360
n
Donde :
i : es el ngulo que tomara cada intervalo de frecuencias
fi : es la frecuencia absoluta
n : es el nmero de datos
hi : es la frecuencia relativa.

LAS GRAFICAS DE SECTORES ANGULARES O DIAGRAMAS CIRCULARES PARA


LOS EJEMPLOS ANTERIORES SERIAN:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 38

PICTOGRAMA

Son grficas de figuras, imgenes o esquemas relacionadas a los datos,


cuyas bases representan los Intervalos de Clase y las alturas las Frecuencias
Absolutas o Relativas. (Ii , ni), (Ii , fi), (Ii , hi) Este grfico tambin permite
comparar frecuencias.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 39

CAPTULO IV

MEDIDAS DE TENDENCIA CENTRAL y DE POSICION

INTRODUCCIN

Los datos organizados en una distribucin de frecuencias, destacan sus


caractersticas ms esenciales, como marcas de clases, tipo de distribucin
(asimtrica, simtrica, normal, etc.).

Sin embargo los indicadores que describen a los datos en forma ms


precisa, deben calcularse. Estos indicadores resumen los datos de medidas
descriptivas que se refiere a la centralizacin o posicin, a la dispersin o
variacin, a la asimetra, y a la curtosis de los datos.

Las medidas de posicin reflejan la tendencia central y la localizacin de los


datos. Las de tendencia central, denominados tambin promedios, ubican
el centro de los datos, entre ellos tenemos.

a) Promedio aritmtico.
b) Promedio aritmtico ponderado.
c) Promedio geomtrico.
d) Promedio armnico.
e) Promedio cuadrtico.
f) Promedio cbico.
g) Moda
h) Mediana.

MEDIDAS DE POSICIN

i) Cuartiles.
j) Quintiles
k) Deciles
l) Percentiles.

Las de localizacin indican el lugar de los datos ms frecuentes (moda) o de


los menos frecuentes a partir de los cuartiles.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 40

4.1. PROMEDIO ARITMTICO.

El promedio aritmtico, a veces denominado simplemente media, puede


definirse como la clase que determina el centro de gravedad del conjunto,
es la suma de los valores observados de la variable, dividido por el nmero
de observaciones. Es una medida solamente aplicable a mediciones de
variables por intervalos o de razn.

Caractersticas.

a) En el valor del promedio aritmtico influyen todos los componentes


de la distribucin.
b) El promedio aritmtico es seriamente afectada por los valores
extremos.
c) La suma de las desviaciones medidas desde el promedio aritmtico
es cero.
d) La suma de los cuadrados de las desviaciones del promedio
aritmtico es menor que aquellas computadas con respecto a
cualquier otra tendencia central.
e) Puede ser manejada algebraicamente.

Ventajas.

a) El promedio aritmtico es, en s, la medida ms fcil de entender y


la ms comnmente usada. Es un valor tal que si se calculara para
un grupo en el cual todos los elementos fueran iguales, cada uno de
ellos sera igual a su promedio aritmtico, de donde podemos
deducir que el promedio aritmtico de n elementos es un nuevo
elemento formado, tomando una parte igual a 1/n de cada uno de
los elementos originales.
b) Esta medida se define en forma rgida por una ecuacin
matemtica muy fcil de entender y algunas veces, se puede
obtener cuando no es posible calcular otros tipos de medidas de
tendencia central y an en el caso de no conocer los valores
individuales de la serie.
c) El promedio aritmtico es extraordinariamente estable en el
muestreo.
d) Es altamente sensible a cualquier cambio en los datos de la
distribucin.
e) Es excepcionalmente adaptable cuando se trata de hacer clculos
matemticos posteriores con l.

Desventajas.

a) Es muy sensible a los valores muy grandes o muy pequeos,


especialmente a los primeros, y la inclusin de tales datos extremos

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 41

en la distribucin que se est estudiando, puede dar un promedio


aritmtico que no sea realmente el representante tpico del grupo.
b) Cuando una distribucin es marcadamente asimtrica en tal forma
que el promedio aritmtico, la mediana y la moda difieren en forma
apreciable, debe considerarse siempre de que el promedio
aritmtico pueda no ser el valor nico representativo de la serie.
c) Cuando la distribucin tiene forma de U; es decir, parablica, este
corresponde a los valores menos comunes en la serie y por tanto,
puede dar una idea irreal de la distribucin.

4.1.1. Promedio aritmtico para datos no agrupados o dispersos.

Sea X una variable aleatoria con valores X1, X2,....Xn; entonces la media
aritmtica o promedio est dado por:

X i
X i 1

Ejemplo: Considere las notas de 7 estudiantes del curso de Estadstica:


12, 14, 15, 16, 13, 15, 12; hallar el promedio aritmtico.

Solucin: n=7

X1 = 12 X5 = 13
X2 = 14 X6 = 15
X3 = 15 X7 = 12
X4 = 16

Aplicando la frmula del promedio aritmtico se tiene:


n

X i
X 1 X 2 X 3 ... X 7
X i 1

n 7

12 14 15 16 13 15 12 97
X 13,8571429
7 7

El promedio de notas de los 7 estudiantes del curso de Estadstica es de


aproximadamente 13.86.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 42

4.1.2. Promedio aritmtico para datos agrupados

Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con
sus respectivas frecuencias absolutas f1, f2, ... , fk; entonces la media
aritmtica o promedio est dado por:

fX i i
X i 1
n

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50


estudiantes que estn matriculados en el curso de Estadstica

[ Li - Ls > Xi fi fiXi
[150 - 155) 152,5 3 457,5
[155 - 160) 157,5 8 1260,0
[160 - 165) 162,5 12 1950,0
[165 - 170) 167,5 14 2345,0
[170 - 175) 172,5 10 1725,0
[175 - 180) 177,5 2 355,0
[180 - 185] 182,5 1 182,5
Total 50 8275,0

Solucin:

K = 7 (7 intervalos de clase)
n = 50

f X i i
f1 X 1 f 2 X 2 f 3 X 3 ... f 7 X 7
X i 1

50 50
(3)(152,5) (8)(157,5) ... (1)(182,5) 8275
X 165,5
50 50

El promedio de estatura de los 50 estudiantes que estn matriculados en el


curso de Estadstica, es 165,5 centmetros.

4.2. PROMEDIO ARITMTICO PONDERADO.

El promedio aritmtico ponderado permite calcular un promedio que toma


en cuenta la importancia o el peso que tiene cada valor sobre el total. De
ah que en tal caso la denominacin de promedio aritmtico ponderado.
Tericamente, todos los promedios aritmticos son ponderados. Si no se
dan pesos especficos a todos y cada uno de los valores de la serie, asume

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 43

que cada observacin tiene el mismo peso y se asigna implcitamente un


peso de 1, y se les llama a menudo promedio aritmtico simple o promedio
aritmtico no ponderado. Para datos agrupados en clases, las frecuencias
de clase pueden ser consideradas como una serie de pesos para los
distintos puntos medios (o marcas de clase) en el clculo del promedio
aritmtico.

Para este tipo de promedio se utiliza la siguiente frmula:

n1 X1 n2 X 2 ... nk X k
X
n1 n2 ... nk
Donde:
k : nmero de grupos o categoras

4.3. PROMEDIO GEOMTRICO.

El promedio geomtrico ( X G ) de n valores positivos X1, X2,....Xn es el valor que se


define como la raz n-sima del producto de estos n valores.

El promedio geomtrico se utiliza para promediar tiempos que siguen una


tendencia exponencial, razones (a/b), ndices (a/b en %) proporciones (a/(a+b)),
tasas de cambio (a-b)/b), entre otros.

Ventajas

a) Se define rgidamente por una frmula matemtica.


b) Se utiliza cuando se quiere dar importancia a valores pequeos de la
variable.
c) Es sensible a cualquier cambio en los valores de la distribucin.
d) Su valor no es influenciable por los datos extremos, como sucede con los
otros promedios.
e) Es indispensable cuando se desea sacar el promedio de una serie de
valores que estn en progresin o aproximadamente geomtrica.

Desventajas

a) La primera de todas, es la complicacin de su clculo.


b) Si cualquier dato de la serie original es 0, el promedio geomtrico toma el
valor 0.
c) Si un valor de la serie es negativo, el promedio aritmtico puede ser
negativo o imaginario, cuando el nmero de datos es par, tericamente
tiene dos valores: uno positivo y el otro negativo.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 44

4.3.1 Promedio geomtrico para datos no agrupados

X G n ( X 1 )( X 2 )...( X n )

4.3.2 Promedio geomtrico para datos agrupados.

X G n ( X1 1 )( X 2 2 )...( X k k )
f f f

4.4. PROMEDIO ARMNICO.

Es otro estadgrafo de posicin. El promedio armnico ( X H ) se usa especialmente


cuando van a promediarse relaciones que son inversamente proporcionales como
es el tiempo en relacin a la velocidad, tipos de relaciones o tasas: tasas de
crecimiento, de mortalidad, etc.

Ventajas

a) Se usa preferencialmente para calcular la velocidad media.


b) De gran utilidad cuando la variable est dada en forma de tasas.
c) Con las relaciones formadas por una variable y una constante en el
promedio, el factor que es constante en la relacin o el factor que es la
variable en ella. El promedio armnico es nico para el segundo caso.

Desventajas

a) El promedio armnico est rgidamente definido por una frmula


matemticamente, su valor depende de cada uno de los datos de la
distribucin y el resultado puede ser usado en clculos posteriores.

4.4.1. Promedio armnico para datos no agrupados.

Sea X una variable aleatoria con valores X1, X2,....Xn; entonces el promedio
armnico est dado por:
n
XH n
1
i 1 X i

4.4.2. Promedio armnico para datos agrupados.

Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con sus
respectivas frecuencias absolutas f1, f2, ... , fk; entonces la media aritmtica o
promedio est dado por:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 45

n
XH k
fi
X
i 1 i

4.5. PROMEDIO CUADRTICO.

Se define como la raz cuadrada de la media de los cuadrados de la variable. Es


aplicable tanto para datos agrupados como para los datos no agrupados. Su
utilizacin es poco frecuente.

Ventajas

a) En algunos problemas de probabilidad, es tericamente recomendable


trabajar con el cuadrado de las cifras, donde es importante la media
cuadrtica.

Desventajas

a) El promedio est definido rgidamente por una frmula matemtica.


b) Se deja influenciar mucho por valores extremos, especialmente por los
grandes.

4.5.1. Promedio cuadrtico para datos no agrupados.

Sea X una variable aleatoria con valores X1, X2,....Xn; entonces el promedio
cuadrtico est dado por:
n

X i
2

Xc i 1
n

Ejemplo: Considere las notas de 7 estudiantes del curso de Estadstica: 12, 14,
15, 16, 13, 15, 12; hallar el promedio aritmtico.

X i
2
122 142 ... 122 1359
Xc i 1
13.93351561
n 7 7

4.5.2. Promedio cuadrtico para datos agrupados.

Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con sus
respectivas frecuencias absolutas f1, f2, ... , fk; entonces el promedio cuadrtico
est dado por:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 46
k

X 2
i i f
Xc i 1
n

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50


estudiantes que estn matriculados en el curso de Estadstica.

[ Li - Ls > Xi fi X2i * fi
[150 - 155) 152.5 3 69768.8
[155 - 160) 157.5 8 198450.0
[160 - 165) 162.5 12 316875.0
[165 - 170) 167.5 14 392787.5
[170 - 175) 172.5 10 297562.5
[175 - 180) 177.5 2 63012.5
[180 - 185] 182.5 1 33306.3
Total 50 1371762.5

X 2
i i f
152.52 * 3 157.52 * 8 ... 182.52 *1
Xc i 1

n 50

X 2
i i f
1371762 .5
Xc i 1
165.6358959
n 50

4.6. PROMEDIO CBICO.

Como la anterior, pertenece a los estadgrafos de posicin, siendo una medida


poco conocida y por tanto de uso limitado. Se define como la raz cbica del
promedio aritmtico de los cubos de los valores de la variable.

4.6.1. Promedio cbico para datos no agrupados.

Sea X una variable aleatoria con valores X1, X2,....Xn; entonces el promedio
cbico est dado por:

3
X i
3

X cubico i 1
n

Ejemplo: Considere las notas de 7 estudiantes del curso de Estadstica:


12, 14, 15, 16, 13, 15, 12; hallar el promedio aritmtico.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 47
n

3
X i
3
123 143 ... 123 3 19243
Xc i 1
3 14.00849824
n 7 7

4.6.2. Promedio cbico para datos agrupados.

Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con
sus respectivas frecuencias absolutas f1, f2, ... , fk; entonces el promedio
cbico est dado por:
k

3
X 3
i i f
X cbico i 1
n

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50


estudiantes que estn matriculados en el curso de Estadstica.

[ Li - Ls > Xi fi X3i * fi
[150 - 155) 152.5 3 10639734.4
[155 - 160) 157.5 8 31255875.0
[160 - 165) 162.5 12 51492187.5
[165 - 170) 167.5 14 65791906.3
[170 - 175) 172.5 10 51329531.3
[175 - 180) 177.5 2 11184718.8
[180 - 185] 182.5 1 6078390.6
Total 50 227772343.8

3
X 3
i fi
152.53 * 3 157.53 * 8 ... 182.53 *1
Xc i 1
3
n 50

3
X 3
i i f
227772343 ,8
Xc i 1
3 165.7716762
n 50

4.7. LA MODA.

La moda ( X ), tambin es una medida de tendencia central, la moda de una serie
de datos es el valor, que se define como la observacin (dato) que ms veces se
repite (categora o puntuacin que ms se repite).

La moda se usa cuando se requiere sealar el valor ms comn de una serie de


datos. La moda es una medida menos importante que la mediana debido a su
ambigedad. La moda no siempre existe y si existe, no siempre es nica.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 48

Si el conjunto de datos tiene una sola moda se llama unimodal, si tiene dos modas
se llama bimodal. En general, si tiene ms de dos modas, se llama multimodal.
Se utiliza en cualquier nivel de medicin.

Ventajas

a) El hecho de que la moda indica el punto de mayor concentracin, lo hace


tal vez, la mejor medida de tendencia central. Cuando una distribucin es
muy asimtrica, claramente se ve que la moda es el ms representativo del
grupo, y en algunos casos, si la moda y el promedio aritmtico son
significativamente diferentes de su valor, es preferible usar la moda.
b) En series polimodales, la moda permite dividir la distribucin con fines de
estratificacin.

Desventajas

a) La moda es fcil de calcular en una serie agrupada y las probabilidades de


su clculo no son de mucha confianza.
b) La moda es muy inestable en el muestreo.
c) La moda no puede ser usada fcilmente en procesos algebraicos
posteriores.
d) La moda no es sensible a cambio de valores de la distribucin, a menos
tales cambios afecten su propio valor.
e) No es recomendable en la variable continua cuando la amplitud en los
intervalos es diferente.

4.7.1. Moda para datos no agrupados.

Ejemplo: Las siguientes edades corresponden a 10 estudiantes que llevan el


curso de Estadstica.

18, 20, 18, 23, 19, 17, 19, 18, 20, 22, 18, determine la moda.

Solucin: Contando el nmero de ocurrencias de cada dato tenemos:

VALORES OCURRENCIAS
17 1
18 4
19 2
20 2
22 1
23 1

La moda para la edad de los estudiantes que llevan el curso de Estadstica es


de 18 aos.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 49

4.7.2. Moda para datos agrupados.

Cuando los datos estn tabulados: la clase que contiene mayor frecuencia ser
la que contiene a la moda, y se le llama clase modal.

1
Mo Li [ ]C
(1 2 )

Donde:
1 fi fi1
2 fi fi1

Li: Es el lmite inferior del intervalo modal.


fi: Es la frecuencia absoluta donde se encuentra la moda.
fi-1
: Es la frecuencia absoluta anterior donde se encuentra la moda.
fi+1
: Es la frecuencia absoluta posterior donde se encuentra la
moda.
C : Es la amplitud del intervalo modal.

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50


estudiantes que estn matriculados en el curso de Estadstica.

[ Li - Ls > Xi fi
[150 - 155) 152,5 3
[155 - 160) 157,5 8
[160 - 165) 162,5 12
[165 - 170) 167,5 14
[170 - 175) 172,5 10
[175 - 180) 177,5 2
[180 - 185] 182,5 1
Total 50

Solucin:

Primeramente se identifica donde se encuentra la clase modal, para nuestro


ejemplo, la moda (mayor frecuencia) se encuentra en la clase 4 (f4 = 14).

( fi fi1 )
X Li C
( fi fi1 ) ( fi fi1 )


X 165 14 12
5
(14 12) (14 10)

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 50

X 165 2
5
(2) (4)

X 166.66666 167

La moda en la estatura de los 50 estudiantes que estn matriculados en el


curso de Estadstica es de 167 centmetros.

4.8. MEDIANA.

La mediana ( X~ ) es el valor que divide a la distribucin por la mitad. Esto es, la


mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por
encima de la mediana.

La mediana refleja la posicin intermedia de la distribucin y cuando las


observaciones se han ordenado por su magnitud creciente o decreciente. La
mediana es una medida de tendencia central propia de los niveles de medicin
ordinal. Por intervalos y de razn.

Ventajas

a) La mediana tiene una definicin rgida y el concepto que envuelve es tan


claro, que cualquiera puede entenderlo aun no siendo familiar el trmino.
b) Si los datos estn ordenados en un cuadro de frecuencia, esta medida es
fcil de calcular y por otro lado, los datos extremos no tienen ninguna
influencia en ella.
c) Tiene menos estabilidad en el muestreo que el promedio aritmtico, pero
es ms estable que otras medidas.
d) Hay situaciones en que la nica medida de tendencia central que puede
calcularse en la mediana, tal como sucede en el caso de una distribucin
cuyos intervalos extremos no estn definidos.

Desventajas

a) No es tan conocido como el promedio aritmtico.


b) Es necesario ordenar los datos para poderla calcular.
c) La mediana no se adapta a clculos posteriores aritmticos, por cuanto que
si obtenemos las medianas de diferentes grupos, no podemos obtener una
mediana de los grupos reunidos.
d) La mediana no es sensible a cambios de valores de los elementos que
componen la distribucin.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 51

4.8.1. Mediana para datos no agrupados.

Si n valores de alguna variable cuantitativa X son ordenados en forma


creciente (ascendente), obteniendo la serie ordenada:

X1 X2 .......... X i ......... Xn

Entonces su mediana, est dada por:

~
Me X X ( n1) / 2 Si n es un nmero impar.
~ X X ( n 2 ) / 2
Me X n / 2 Si n es un nmero par.
2

Ejemplo:

a) Si n es impar; determinar la mediana de las siguientes edades: 20, 24,


18, 19, 23, 21, 19.

i) Ordenamos las edades en forma ascendente (creciente)

18 19 19 20 21 23 24
X1 X2 X3 X4 X5 X6 X7

ii) Ubicamos la mediana, para n impar:

~
Me X X ( n1) / 2 X (71) / 2 X 8 / 2 X 4

Entonces la ubicacin X4 corresponde a X4 = 20, la cual es la mediana de


las edades.

b) Si n es par; determinar la mediana de las siguientes edades: 25, 18, 28,


22, 20, 27, 21, 26.

i) Ordenamos las edades en forma ascendente (creciente)

18 20 21 22 25 26 27 28
X1 X 2 X3 X4 X5 X6 X7 X8

ii) Ubicamos la mediana, para n par:

X~ X ( n ) / 2 X (8 / 2) X 8 / 2 X 4 22

~
Me X X ( n2) / 2 X (82) / 2 X 10/ 2 X 5 25

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 52

Luego la mediana es:

~ X X (n2) / 2 22 25 47
Me X n / 2 23,5
2 2 2

Entonces, la mediana de las edades es de 23,5 aos.

4.8.2. Mediana para datos agrupados.

a) Si los valores de una variables discreta se tabulan en una distribucin de la


forma, dato-frecuencia, el clculo de la mediana se hace siguiendo el
procedimiento anterior.

b) Si los valores de una variable (discreta o continua) se tabulan en una


distribucin de frecuencias por intervalos, la mediana se determina
aproximadamente por interpolacin a partir de la distribucin de
frecuencias acumuladas.

c) Para frecuencias relativas.

~ n / 2 Fi 1
Me X Li C
f i
Donde:

Li : es el lmite inferior de la mediana.


n : es el nmero de datos observados.
Fi-1 : es la frecuencia acumulada absoluta del intervalo
inmediatamente inferior al intervalo de la mediana.
fi : es la frecuencia absoluta del intervalo de la mediana.
C : es la amplitud del intervalo de la mediana.

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50


estudiantes que estn matriculados en el curso de Estadstica.

[Li - Ls> Xi fi Fi
[150 - 155) 152.5 3 3
[155 - 160) 157.5 8 11
[160 - 165) 162.5 12 23
[165 - 170) 167.5 14 37
[170 - 175) 172.5 10 47
[175 - 180) 177.5 2 49
[180 - 185] 182.5 1 50
Total 50

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 53

Solucin:

a) Primero se halla la clase mediana considerando: n/2 = 50/2 = 25 este


valor resultante se busca en la Fi, si no se encuentra considerar el
primero que lo supere, en este caso corresponde a 37 del intervalo 4 (I i
= I4), (i = 4).

b) Entonces: fi = f4 = 14,
Fi-1 = F4-1 = F3 = 23,
Li = L4 = 165

c) Se reemplaza estos valores en la frmula de la mediana para datos


agrupados.

~ n / 2 Fi 1
Me X Li ( )C
fi
~ 50 / 2 23
Me X 165 5 165.7142857 166
14
Considere la estatura (en centmetros) de una muestra de

La mediana de la estatura de los estudiantes que estn matriculados en el


curso de Estadstica es de 166 centmetros.

4.9. MEDIDAS DE POSICIN (CUANTILES)

Como una consecuencia del estudio de la mediana, es fcil ampliar este concepto
a otros estadgrafos que dividen a los datos en otras proporciones y no slo en
mitades como lo hacen la mediana. Estas medidas se llaman cuantiles y estos
valores a menudo se expresan en porcentajes.

Se denomina cuantiles a los valores que dividen a los datos ordenados en 4, 5, 10


100 partes iguales (cuando la distribucin contiene un nmero alto de intervalos
o de marcas de clase), entre las cuales tenemos:

a) Cuartiles
b) Quintiles
c) Deciles
d) Percentiles.

4.9.1. CUARTILES.

Los cuartiles ( Qi ) son valores que dividen a un conjunto de datos ordenados en


forma ascendente o descendente en cuatro partes iguales, y se denota por Qi ,
donde i = 1, 2, 3.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 54

La frmula del cuartil est dado del siguiente modo:

n(i)
Fi 1
Qi Li 4 C , i 1,2,3
fi


donde:

Li : es el lmite inferior del cuartil.


n : es el nmero de datos observados.
Fi-1 : es la frecuencia acumulada absoluta del intervalo
inmediatamente inferior al intervalo del cuartil.
fi : es la frecuencia absoluta del intervalo del cuartil.
C : es la amplitud del intervalo del cuartil.

Primer Cuartil: Q1
Es el valor que supera a no ms de un cuarto de las observaciones y es superado
por no ms de tres cuartos de ellas. Es decir, es el valor que deja 25% de las
observaciones menores o iguales a l y el 75% superiores a l.

Segundo Cuartil: Q2
Es el valor que supera a no ms de la mitad de las observaciones y es superado
~
por la otra parte. Coincide con la mediana; es decir, Q2 = X

Tercer Cuartil: Q3
Es el valor que supera a no ms de las tres cuartas partes de las observaciones y
superado por no ms de un cuarto de ellas. Es decir deja el 75 % de los datos
inferiores o iguales a l y el 25% de stas superiores a l.

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes


que estn matriculados en el curso de Estadstica.

Encuentre el primero, segundo y tercer cuartil.

SOLUCIN

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 55

PRIMER CUARTIL:
La clase cuartil 1 seria: 50(1)/4=12,5 Buscamos este valor en Fi o el primero que
lo supere, en este caso corresponde al intervalo 3 ( I3)

En este caso i = 1

n(1) / 4 Fi 1
Q1 Li C
fi

50(1) / 4 11
Q1 160 5
12

12,5 11
Q1 160 5 160,625
12

Interpretacin:

El 25 % de los estudiantes tienen estaturas menores o iguales a 160,625


centmetros y el 75 % de los estudiantes tienen estaturas mayores a 160,625
centmetros.

SEGUNDO CUARTIL:
La clase cuartil 2 seria: 50(2)/4 = 25 Buscamos este valor en Fi o el primero que
lo supere, en este caso corresponde al intervalo 4 ( I4 )

El segundo cuartil, es exactamente igual a la mediana: Q2 = Me = 165.7142857,


porque tambin representa el 50% de la distribucin.

En este caso i = 2

n(2) / 4 Fi1
Q2 Li C
f i

50(2) / 4 23
Q2 165 5
14

25 23
Q2 165 5 165,714
14

Interpretacin:

El 50 % de los estudiantes tienen estaturas menores o iguales a 165,714


centmetros y el 50 % de los estudiantes tienen estaturas mayores a 165,714
centmetros.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 56

TERCER CUARTIL:
La clase cuartil 3 seria: 50(3)/4=37,5 Buscamos este valor en Fi o el primero que
lo supere, en este caso corresponde al intervalo 5 ( I5)

En este caso i = 3

n(3) / 4 Fi 1
Q3 Li C
f i

50(3) / 4 37
Q3 170 5 170,25
10

Interpretacin:

El 75 % de los estudiantes tienen estaturas menores o iguales a 170,25


centmetros y el 25 % de los estudiantes tienen estaturas mayores a 170,25
centmetros.

4.9.2. QUINTILES.

Los quintiles (Qu) son valores que dividen a la muestra ordenada en forma
ascendente (o descendente) en 5 partes iguales y se denota por Qui i =1,2,3,4.

n(i)
Fi 1
Qui Li 5 C, i 1,2,3,4
fi

donde:

Li : es el lmite inferior del quintil.


n : es el nmero de datos observados.
Fi-1 : es la frecuencia acumulada absoluta del intervalo
inmediatamente inferior al intervalo del quintil.
fi : es la frecuencia absoluta del intervalo del quintil.
C : es la amplitud del intervalo del quintil.

Primer Quintil: Qu1

Es el valor que supera a no ms del 20% de las observaciones y es superado por no


ms del 80% de ellas, es equivalente a decir que Qu1 es el valor que deja 20% de
las observaciones menores o iguales a l y el 80% superiores a l.

Segundo Quintil: Qu2

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 57

Es el valor que supera a no ms del 40% de las observaciones y es superado por no


ms del 60% de ellas, es equivalente a decir que Qu2 es el valor que deja 40% de
las observaciones menores o iguales a l y el 60% superiores a l.

Tercer Quintil: Qu3

Es el valor que supera a no ms del 60% de las observaciones y es superado por no


ms del 40% de ellas, es equivalente a decir que Qu3 es el valor que deja 60% de
las observaciones menores o iguales a l y el 40% superiores a l.

Cuarto Quintil: Qu4

Es el valor que supera a no ms del 80% de las observaciones y es superado por no


ms del 20% de ellas, es equivalente a decir que Qu4 es el valor que deja 80% de
las observaciones menores o iguales a l y el 20% superiores a l.

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes


que estn matriculados en el curso de Estadstica.

Encuentre el primero, segundo y tercer quintil.

SOLUCIN

PRIMER QUINTIL:

La clase quintil 1 seria: 50(1)/5=10 Buscamos este valor en Fi o el primero que lo


supere, en este caso corresponde al intervalo 2 ( I2)
En este caso i = 1

n(1) / 5 Fi 1
Qu1 Li C
fi

50(1) / 5 3
Qu1 155 5
8

10 3
Qu1 155 5 159,375
8

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 58

Interpretacin:

El 20 % de los estudiantes tienen estaturas menores o iguales a 159,375


centmetros y el 80 % de los estudiantes tienen estaturas mayores a 159,375
centmetros.

SEGUNDO QUINTIL:
La clase quintil 2 seria: 50(2)/5=20 Buscamos este valor en Fi o el primero que lo
supere, en este caso corresponde al intervalo 3 ( I3)
En este caso i = 2

n(2) / 5 Fi 1
Qu2 Li C
f i

50(2) / 5 11
Qu2 160 5
12

20 11
Qu2 160 5 163,75
12

Interpretacin:

El 40 % de los estudiantes tienen estaturas menores o iguales a 163,75


centmetros y el 60 % de los estudiantes tienen estaturas mayores a 163,75
centmetros.

TERCER QUINTIL:
La clase quintil 3 seria: 50(5)/5=10 Buscamos este valor en Fi o el primero que lo
supere, en este caso corresponde al intervalo 4 ( I4)
En este caso i = 3

n(3) / 5 Fi 1
Qu3 Li C
f i

50(3) / 5 23
Qu3 165 5
14

30 23
Qu3 165 5 167,5
14

Interpretacin:

El 60 % de los estudiantes tienen estaturas menores o iguales a 167,5 centmetros


y el 40 % de los estudiantes tienen estaturas mayores a 167,5 centmetros.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 59

4.9.3. DECILES.

Los deciles (D) se determinan en forma similar a los cuartiles. As, cuando los datos
no estn agrupados primero se ordena en forma ascendente o descendente las
observaciones. Luego, se localiza la posicin deseada, que puede estar
comprendida en el intervalo de 1a 9 inclusive. El conjunto de datos se divide en 10
partes iguales del siguiente modo:

D1 D2 D9
10% 20% 90%

La frmula est dada del siguiente modo:

n(i)
Fi 1
Di Li 10 C, i 1,2,3,4,.....,9
fi


donde:
Li : es el lmite inferior del decil.
n : es el nmero de datos observados.
Fi-1 : es la frecuencia acumulada absoluta del intervalo
inmediatamente inferior al intervalo del decil.
fi : es la frecuencia absoluta del intervalo del decil.
C : es la amplitud del intervalo del decil.

Primer Decil: D1
Es el valor que supera a no ms del 10% de las observaciones y es superado por no
ms del 90% de ellas, es equivalente a decir que D1 es el valor que deja 10% de las
observaciones menores o iguales a l y el 90% superiores a l.

Segundo Decil: D2
Es el valor que supera a no ms del 20% de las observaciones y es superado por no
ms del 80% de ellas, es equivalente a decir que D2 es el valor que deja 20% de las
observaciones menores o iguales a l y el 80% superiores a l.

Noveno Decil: D9
Es el valor que supera a no ms del 90% de las observaciones y es superado por no
ms del 10% de ellas, es equivalente a decir que D9 es el valor que deja 90% de las
observaciones menores o iguales a l y el 10% superiores a l.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 60

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes


que estn matriculados en el curso de Estadstica.

Encuentre el primer decil.


Solucin:

PRIMER DECIL:
La clase decil 1 seria: 50(1)/10=5 Buscamos este valor en Fi o el primero que lo
supere, en este caso corresponde al intervalo 2 ( I2)
En este caso i = 3

En este caso i = 1
n(1) / 10 Fi 1
D1 Li C
f i
50(1) / 10 3
D1 155 5 156,25
8

Interpretacin:

El 10 % de los estudiantes tienen estaturas menores o iguales a 156,25


centmetros y el 90 % de los estudiantes tienen estaturas mayores a 156,25
centmetros.

4.9.4. PERCENTILES.

Los percentiles (P) son valores que dividen a la muestra ordenada en forma
ascendente (o descendente) en 100 partes iguales, y se denota por P i , i =
1,2,3,....99.

La frmula est dada del siguiente modo:

n(i)
Fi 1
Pi Li 100 C, i 1,2,3,4,.....,99
fi


donde:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 61

Li : es el lmite inferior del percentil.


n : es el nmero de datos observados.
Fi-1 : es la frecuencia acumulada absoluta del intervalo
inmediatamente inferior al intervalo del percentil.
fi : es la frecuencia absoluta del intervalo del percentil.
C : es la amplitud del intervalo del percentil.

Primer Percentil: P1
Es el valor que supera a no ms del 1% de las observaciones y es superado por no
ms del 99% de ellas, es equivalente a decir que P1 es el valor que deja 1% de las
observaciones menores o iguales a l y el 99% superiores a l.

Octavo Percentil: P8
Es el valor que supera a no ms del 8% de las observaciones y es superado por no
ms del 92% de ellas, es equivalente a decir que P8 es el valor que deja 8% de las
observaciones menores o iguales a l y el 92% superiores a l.

El percentil 25, es igual al primer cuartil: P25 = Q1.


El percentil 50, es igual a la mediana: P50 = Mediana
El percentil 50, es igual al segundo cuartil: P50 = Q2
El percentil 75, es igual al tercer cuartil: P75 = Q3.

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes


que estn matriculados en el curso de Estadstica.

Encuentre el percentil 90.


Solucin:

PERCENTIL 90:
La clase percentil 90 seria: 50(90)/100=45 Buscamos este valor en Fi o el
primero que lo supere, en este caso corresponde al intervalo 5 ( I5 )

En este caso i = 90

n(90) / 100 Fi 1
p90 Li C
fi

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 62

50(90) / 100 37
P90 170 5
10

45 37
P90 170 5 174
10

Interpretacin:

El 90 % de los estudiantes tienen estaturas menores o iguales a 174 centmetros y


el 10 % de los estudiantes tienen estaturas mayores a 174 centmetros.

PERCENTIL 10:
La clase percentil 10 seria: 50(10)/100=45 Buscamos este valor en Fi o el
primero que lo supere, en este caso corresponde al intervalo 2 ( I2 )

En este caso i = 10

n(10) / 100 Fi 1
p10 Li C
f i

50(10) / 100 3
P10 155 5
8

53
P10 155 5 156,25
8

Interpretacin:

El 10 % de los estudiantes tienen estaturas menores o iguales a 156,25


centmetros y el 90 % de los estudiantes tienen estaturas mayores a 156,25
centmetros. (Este resultado es exactamente igual al Decil 1).

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 63

CAPTULO V

MEDIDAS DE DISPERSIN
Las medidas de dispersin o variabilidad son valores que miden el grado de
dispersin de los datos con respecto a un valor central, que generalmente es la
media aritmtica.

Es necesario una medida del grado de dispersin o variacin con respecto


al centro, con la finalidad de ampliar la descripcin de los datos o de comparar dos
o ms series de datos.

Es necesario una medida del grado de asimetra o deformacin en ambos


lados del centro de una serie de datos, con el fin de describir la forma de la
distribucin de los datos. Esta medida se denomina ndice de asimetra.

Es necesario una medida que nos permita comparar el apuntamiento o


curtosis de distribuciones simtricas normales. Esta medida se denomina ndice de
apuntamiento.

Las principales medidas de dispersin son:

El rango o recorrido.
Desviacin Media
El rango intercuartil.
El rango semiintercuartil.
La varianza.
La desviacin estndar.
Coeficiente de variacin.

5.1. RANGO O RECORRIDO.

El rango de variacin o recorrido R, de una serie de datos, es la diferencia entre


sus valores extremos (valor mximo menos valor mnimo).
R = Valor mximo Valor mnimo

El rango es una medida de dispersin muy fcilmente calculable, pero es


muy inestable, ya que depende nicamente de los dos valores extremos. Su valor
puede cambiar grandemente si se agrega un solo dato. Por tanto su uso es muy
limitado.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 64

Ejemplo: Para las siguientes edades de 7 estudiantes: 21, 34, 20, 19, 20, 22, 18,
calcular el rango:

Solucin:
En este caso se tiene: Valor mximo = 34 Valor mnimo = 18
Entonces el rango ser: R = Valor mximoValor mnimo = 34 18 = 16

Significa que las edades de los 7 estudiantes varan en 16 aos considerando esta
desde la mnima a la mxima edad

El empleo del rango como medida de cooperacin de variacin puede estar


justificado cuando se precise rpidamente de una medida de dispersin y no haya
tiempo de calcular alguna de las otras formas.

5.2. DESVIACIN MEDIA

La desviacin media es la media de las diferencias en valor absoluto de los valores


a la media.

DESVIACION MEDIA PARA DATOS DISPERSOS O NO AGRUPADOS O NO


CLASIFICADOS:

Ejemplo: Para las siguientes edades de 7 estudiantes: 21, 34, 20, 19, 20, 22, 18,
calcular la desviacin media (Dm):

Promedio = 154 / 7 = 22

x x i
21 22 34 22 ... 18 22
Dm i 1
3,4285714 _ aos
n 7

En las edades de los 7 estudiantes, existe una variacin de 3,43 aos con respecto
al promedio.

DESVIACIN MEDIA PARA DATOS AGRUPADOS O CLASIFICADOS:

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes


que estn matriculados en el curso de Estadstica.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 65

[Li - Ls> Xi fi fi*|Xi-Xprom|


[150 - 155) 152,5 3 39
[155 - 160) 157,5 8 64
[160 - 165) 162,5 12 36
[165 - 170) 167,5 14 28
[170 - 175) 172,5 10 70
[175 - 180) 177,5 2 24
[180 - 185] 182,5 1 17
Total 50 278

Sabemos que:
X 165.5cm.

f i xi x
278
Dm i 1
5,56cm.
n 50

Para el ejemplo de las estaturas (en centmetros) de una muestra de 50


estudiantes que estn matriculados en el curso de Estadstica, existe una variacin
de 5,56 cm. con respecto al promedio.

Este valor estadstico no es de mucha utilidad en estadstica debido a que no es


fcil manipular dicha funcin al no ser derivable.

Siendo ms formales, la desviacin media debera llamarse desviacin absoluta


respecto a la media, para evitar confusiones con otra medida de dispersin, la
desviacin absoluta respecto a la mediana, DM, cuya frmula es la misma,
sustituyendo la media aritmtica ( )por la mediana. Pero tal precisin no es
relevante, porque la desviacin absoluta respecto a la mediana es de uso todava
menos frecuente.

5.3. RANGO INTERCUARTIL.

El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y primero. Esto
es: RI = Q3
Q1
Para el ejemplo de las estaturas (en centmetros) de una muestra de 50
estudiantes que estn matriculados en el curso de Estadstica:

RI = 170.25 - 160.625 = 9.625

El rango intercuartil es una medida que excluye el 25% ms alto y el 25% ms


bajo, dando un rango dentro del cual se encuentra el 50% central de los datos
observados y a diferencia del rango total se encuentra afectada por los valores
extremos.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 66

Si el rango intercuartil es muy pequeo entonces describe alta uniformidad o


pequea variacin de los valores centrales.

5.4. RANGO SEMIINTERCUARTIL.

El rango semiintercuartil, RSI, est dado por el rango intercuartil dividido por 2.

Q3 Q1
RSI
2
Para el ejemplo de las tallas de estudiantes:

RSI = 9.625 / 2 = 4.8125

El rango semiintercuartil se puede asociar con la mediana y se puede expresar en


funcin de ella. Si una distribucin es normal, los cuartiles Q1 y Q3 son
equivalentes a la mediana.

NOTA: Si la distribucin es muy asimtrica, el rango semiintercuartil es preferible a


la desviacin estndar como medida de la dispersin.

5.5. VARIANZA.

La varianza, es una medida que cuantifica el grado de dispersin o de variacin de


los valores de una variable cuantitativa con respecto a su media aritmtica. Si los
valores tienden a concentrarse alrededor de su promedio, la varianza ser muy
pequea. Si los valores tienden a distribuirse lejos del promedio, la varianza ser
muy grande.

5.5.1. Varianza para datos dispersos o no agrupados o no clasificados:

Varianza Poblacional: 2
N

N N
( X i ) 2
(X i )2 X i
2
i 1

N

2 i 1
i 1

N N

Varianza Muestral: S 2
n

n n
( X i ) 2
(X i X )2 X i
2
i 1
n
S
2 i 1
i 1
n 1 n 1

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 67

Desviacin Estndar.

Desviacin Estndar Poblacional:


N

N N (X ) i
2

(X i ) 2
X i
2
i 1
N
i 1
i 1
N N

Desviacin Estndar Muestral: S

n n
( X i ) 2
(X
i 1
i X )2 X
i 1
i
2
i 1

n
S
n 1 n 1

CASO I: DATOS DISPERSOS O NO CLASIFICADOS O NO AGRUPADOS:

Ejm: Dada las siguientes calificaciones obtenidas por 7 estudiantes en el Curso de


Estadstica: 14, 13, 12, 11, 12, 16 y 13. Hallar la varianza y la desviacin estandart.

SOLUCION:
Xi (Xi-Xprm)2 Xi2
14 1 196
13 0 169
Hallamos es promedio:
12 1 144 91
11 4 121 X 13
7
12 1 144
16 9 256
13 0 169
91 16 1199

Varianza:
n

(X i X )2
16
S2 i 1
2.66666667
n 1 7 1

n
( X i ) 2
X i
2
i 1
n
1199
912
7 2.66666667
S2 i 1

n 1 7 1

En las calificaciones obtenidas por los 7 estudiantes en el Curso de Estadstica,


existe una variacin de 2.67 puntos2 con respecto al promedio.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 68

Desviacin Estandart:

S S 2 2.66666667 1.632993162

En las calificaciones obtenidas por los 7 estudiantes en el Curso de Estadstica,


existe una variacin de 1.63 puntos con respecto al promedio.

S 1.632993162
C.V . (100%) (100%) 12.56%
X 13
En las calificaciones obtenidas por los 7 estudiantes en el Curso de Estadstica,
existe una variacin de 12.56% con respecto al promedio.

5.5.2. Varianza para datos tabulados o agrupados

Varianza Poblacional: 2

k k
( f i X i ) 2
f (X i i )2 f X i i
2
i 1
N

2 i 1
i 1
N N

Varianza Muestral: S 2
k

k k
( X i f i ) 2
f (X
i 1
i i X )2 X
i 1
i
2
fi i 1

n
S2
n 1 n 1

Desviacin Estndar.

Desviacin Estndar Poblacional:


k

k k
( f i X i ) 2
f (X i i )2 X i
2
fi i 1
N
i 1
i 1
N N

Desviacin Estndar Muestral: S


k

k k
( f i X i ) 2
f (X i i X )2 f X i i
2
i 1
n
S i 1
i 1
n 1 n 1

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 69

Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes


matriculados en el curso de Estadstica.

[Li - Ls> Xi fi fi* Xi fi*Xi2


[150 - 155) 152.5 3 457.5 69768.75
[155 - 160) 157.5 8 1260 198450
[160 - 165) 162.5 12 1950 316875
[165 - 170) 167.5 14 2345 392787.5
[170 - 175) 172.5 10 1725 297562.5
[175 - 180) 177.5 2 355 63012.5
[180 - 185] 182.5 1 182.5 33306.25
Total 50 8275 1371762.5

Hallar la varianza muestral y desviacin estndar

a) Varianza Muestral:
k

k
( f i X i ) 2
fX i i
2
i 1
n
1371762 ,5
(8275) 2
50 45,918cm2
S2 i 1

n 1 50 1

En las estaturas de los 50 estudiantes matriculados en el curso de Estadstica,


existe una variacin de 45,918 cm2 con respecto al promedio.

b) Desviacin Estndar Muestral:

S S 2 45,91836735 6,776309272 6,78 cm

En las estaturas de los 50 estudiantes matriculados en el curso de Estadstica,


existe una variacin de 6,78 cm. con respecto al promedio.

5.6. COEFICIENTE DE VARIACIN.

El coeficiente de variacin CV, es una medida de dispersin relativa (libre de


unidades de medida), que se define como la desviacin estndar dividido por el
promedio aritmtico.


a) Coeficiente de Variacin Poblacional: C.V . (100%)

S
b) Coeficiente de Variacin Muestral: C.V . (100%)
X

El coeficiente de variacin es una medida muy til para comparar la variabilidad de


dos o ms series de datos que tengan distintas unidades de medida y/o distintos
promedios aritmticos.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 70

Ejemplo 1:
Para el ejemplo de las estaturas de los 50 estudiantes matriculados en el curso de
Estadstica, Hallaremos el coeficiente de variabilidad directamente porque ya se
hall la desviacin estandart y el promedio.

Considerando:

Desviacin estandart: S=6,776309272 cm

Promedio aritmtico: X = 165.5 cm

S 6,776309272
C.V . (100%) (100%) 4,0967%
X 165.5

Concluimos que en las estaturas de los 50 estudiantes matriculados en el curso de


Estadstica, existe una variabilidad o variacin de 4.0967% 4%, con respecto al
promedio de las estaturas.

Ejemplo 2:
Considere las edades (en aos) de los siguientes estudiantes considerando dos
grupos separados por el gnero:

Varones: Mujeres:
20 23 19 27 21 19 25 23 19 22 18 27 24 18 21
177 149
X 22.125 X 21.28571429
8 7

3975 (177 2 / 8) 3239 (149 2 / 7)


S2 S2
8 1 7 1
S 8.410714285
2
S 2 11.238095238

S 2.90012315 S 3.352326839

2.90012315
c.v. (100%) 13.11% c.v.
3.352326839
(100%) 15.75%
22.125 21.28571429

En estos resultados podemos observar que las edades de los varones son ms
homogneos que el de las mujeres porque el coeficiente de variacin de los
varones es menor que el coeficiente de variacin de las mujeres.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 71

5.7. MEDIDAS DE FORMA DE LA DISTRIBUCIN.

En trabajos propios de algunas disciplinas, surge con frecuencia la necesidad de


calcular una medida que muestre las direcciones de la dispersin de los datos con
respecto a su centro y que completan la descripcin de las distribuciones de
frecuencias. Estas caractersticas se llaman: Asimetra (que significa no tener
simetra) y curtosis o apuntamiento. Las medidas de dispersin slo indican la
magnitud de las variaciones, pero no dan informacin acerca de la direccin de las
variaciones.

a) MEDIDAS DE ASIMETRA.

El concepto de asimetra de una distribucin indica la deformacin horizontal de


las distribuciones de frecuencias. Una distribucin es asimtrica, cuando su curva
(polgono) de frecuencia es simtrica respecto al eje vertical. Es decir, si se le
puede doblar a lo largo del eje vertical de manera que coincidan los dos lados.

Asimetra Positiva: Se dir que una distribucin de frecuencia unimodal presenta


asimetra positiva o a la derecha, si tiene ramificacin extendida hacia la derecha o
hacia valores grandes de la variable. En este caso la media aritmtica es mayor
que la moda. La mediana por el hecho de dividir el conjunto de observaciones en
dos partes iguales, quedar comprendida entre ambas.

Asimetra Negativa: Se dir que una distribucin de frecuencia unimodal presenta


asimetra negativa o a izquierda, si tiene una ramificacin ms extendida hacia la
izquierda o hacia valores pequeos de la variable. La media aritmtica es menor
que la moda. La mediana por la misma razn anterior permanecer en el centro.

Asimetra Negativa Asimtrica Asimetra Positiva

Coeficiente de Asimetra:

a) El coeficiente de asimetra cuartlico o de BOWLEY, est dado en funciones de


los cuartiles:

Q3 2Q2 Q1
CA.
Q3 Q1
Considerando.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 72

i) La distribucin es asimtrica (Promedio = Mediana = Moda), Si CA=0.


ii) La distribucin es asimtrica positiva
(Promedio > Mediana > Moda), si CA > 0.
iii) La distribucin es asimtrica negativa
(Promedio < Mediana < Moda), si CA < 0.

Ejemplo. Para el ejemplo de las estaturas (en centmetros) de una muestra de 50


estudiantes matriculados en el curso de Estadstica. Hallamos directamente el C.A.
porque anteriormente ya se hall los Cuartiles 1 , 2 y 3

Q3 2Q2 Q1 170.25 2(165.714) 160.625


CA. 0.05745455
Q3 Q1 170.25 160.625

Encontrado este valor del CA=-0,05745455, podemos decir que la distribucin


para las estaturas de la muestra de 50 estudiantes matriculados en el curso de
Estadstica es asimtrica negativa.

Por otro lado tomando en cuenta el considerando iii) La distribucin es asimtrica


negativa si: (Promedio < Mediana < Moda),

Este considerando se comprueba con los resultados obtenidos anteriormente del


mismo ejemplo de las estaturas de la muestra de 50 estudiantes matriculados en
el curso de Estadstica siendo:

X prom=165.5 < Me=165.7142857 < Mo=166.6666,

El coeficiente de asimetra en funcin de los percentiles (10, 90), est dado


por :

P90 2P50 P10


CA.
P90 P10

b) NDICE DE CURTOSIS O APUNTAMIENTO.

Se entiende por curtosis, a la medida de deformacin vertical de una distribucin


de frecuencias, es decir la medida de apuntamiento o achatamiento de una
distribucin.

La idea de apuntamiento de una distribucin con la frecuencia de dichos valores


en la distribucin de frecuencias indica la mayor o menor altura del mximo
central, con respecto a la altura de la curva normal con media y desviacin tpica
que la distribucin que se estudia.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 73

CURTOSIS EN FUNCIN DE CUANTILES.

El coeficiente est dado por:

Q3 Q1
K
2( P90 P10 )

Considerando la siguiente constante:

i) si K = 0.263, la distribucin es normal o mesocrtica.


ii) si K < 0.263, la distribucin es achatada o leptocrtica.
iii) si K > 0.263, la distribucin es platicrtica.

Al igual que el caso de los coeficientes de asimetra de una distribucin, los que
representan a la curtosis o apuntamiento se utilizan para ayudar a describir las
caractersticas de una distribucin y no precisamente como medidas, ya que a
veces el valor de la curtosis se contradice con la realidad por estar relacionado con
la distribucin normal.

Ejemplo. Para el ejemplo de las estaturas (en centmetros) de una muestra de 50


estudiantes matriculados en el curso de Estadstica. Hallamos directamente K.
porque anteriormente ya se hall los Cuartiles (1 y 3), percentiles (90 y 10).

Q3 Q1 170,25 160,625
K 0,271126
2( P90 P10 ) 2(174 156,25)

Encontrado este valor de K=0,271126, es mayor a 0.263, podemos decir que la


distribucin para las estaturas de la muestra de 50 estudiantes matriculados en el
curso de Estadstica es Platicurtica.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 74

EJERCICIOS PRCTICOS 01

1. A continuacin se dan los gastos en servicios pblicos de 40 tiendas comerciales del


cercado de la ciudad de Puno.

209 190 197 205 193 163 192 210 213 193
255 268 218 241 209 243 183 229 188 209
239 243 231 248 210 223 230 218 213 204
231 221 213 204 200 208 214 213 217 207

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f2, F3, h1%, H4%
d) Hallar promedio aritmtico, Me, Moda, Desviacin Estndar y Coeficiente de
variacin.

2. Los siguientes datos son registros de las velocidades de transmisiones en nano


segundos de 35 instrucciones informticas registradas desde su ingreso por un dispositivo
de entrada hasta recibir una respuesta.
1.0 1.4 1.5 0.7 1.1 0.7 0.5 1.1 1.8 1.2
1.2 1.3 0.5 0.1 0.8 1.5 1.6 0.7 1.7 0.2
0.9 0.8 1.0 1.1 1.3 0.8 0.7 0.9 0.9 1.0
1.5 1.4 0.7 0.3 0.8

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f3, F2, h3%, H3%
e) Hallar una media apropiada de transmisin, varianza, coeficiente de variacin,
coeficiente de asimetra y coeficiente de curtosis

3. Dada la siguiente Distribucin Simtrica verificar que la Media Aritmtica, Mediana y


Moda son iguales. Elabore su histograma ojiva y su grafico circular.

[Ii Ii+1> fi
[0 2> 2
[2 4> 4
[4 6> 6
[6 8> 4
[8 10] 2

4. Calcula las medidas de tendencia central y dispersin de los siguientes datos:


a) 2, 5/2, 10/3, 5, 10
b) 1.6, 2.4, 3.0, 4.0, 5.6, 4.2

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 75

5. Dada la siguiente Distribucin calcular todas las medidas de tendencia central, medidas
de dispersin y los grficos tratados.

[Ii Ii+1> fi
[20 30> 2
[30 40> 10
[40 55> 8
[55 65> 6
[65 85] 2

6. Un investigador realiza un estudio en la ciudad de Puno, acerca del nmero de horas


semanales que dedican los estudiantes universitarios a ver televisin. Una muestra de 35
estudiantes, arroj los siguientes resultados:

10 19 25 19 26 20 19
16 19 27 27 25 20 28
23 22 17 12 20 23 18
15 21 23 26 14 22 24
18 25 23 24 21 26 24

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f2, F3, h1%, H4%
d) Hallar promedio aritmtico, Me, Media armnica, Media geomtrica, Moda,
coeficiente de asimetra y coeficiente de curtosis.

7. Los siguientes datos son los pesos medidos en Kg. de 30 estudiantes de la carrera
profesional de Contabilidad
75,8 69,3 96,2 86,3 99,8
84,6 72,2 74,1 76,0 86,5
70,2 61,8 58,4 69,2 68,4
68,3 75,0 67,3 82,2 72,1
59,4 65,5 76,4 76,5 81,0
65,0 86,2 68,3 65,9 69,0

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f2, F3, h1%, H4%
d) Hallar promedio aritmtico, Mediana y Moda

8. Los siguientes datos se refieren al nmero de libros de Estadstica consultados por 50


estudiantes para rendir el examen parcial de la asignatura:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 76

2 0 4 4 1 4 0 3 2 0
0 1 1 1 0 1 2 4 0 1
1 5 2 2 5 3 4 0 4 0
0 0 3 0 1 4 2 1 2 0
3 1 3 1 2 0 5 6 3 2

a) Hacer un cuadro de distribucin de frecuencias.


b) Qu porcentaje de alumnos no consultaron ningn libro para el examen parcial?
c) Qu porcentaje de alumnos consult entre 5 y 6 libros?
d) Presente los datos en cuadros y grficos estadsticos.

9. Los siguientes datos que se presentan en una tabla incompleta de distribucin de


frecuencias, corresponden a las calificaciones de un grupo de estudiantes en la asignatura
de Estadstica:

I Ii fi Fi hi (%) Hi (%)
1 [ ) 12 20
2 [ 05 ) 60
3 [ 09 ) 70
4 [ ) 85
5 [ ]

Se sabe que la amplitud del intervalo es igual en todas las clases, completar los datos
que faltan en la tabla de frecuencias y realizar interpretaciones para f2, F3, h1%, H4%.

10. Se tiene una distribucin de frecuencias con 4 intervalos de amplitud constante para
50 datos.

i Ii fi Fi hi Hi
1 [ 3) 0,08
2 [ 5) 0,40
3 [ ) 12
4 [ 9] 0,36

Se pide completar la tabla de frecuencias y realizar interpretaciones para f3, F2, h2%,
H3%.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 77

EJERCICIOS PRCTICOS 02

1. A continuacin se dan los gastos en servicios pblicos de 44 tiendas comerciales del


cercado de la ciudad de Puno.

216 197 204 212 200 170 199 198 217 220 200
262 275 225 248 216 250 190 190 236 195 216
246 250 238 255 217 230 237 221 225 220 211
238 228 220 211 207 215 221 232 220 224 214

a. Elaborar la Tabla de Distribucin de Frecuencia


b. Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
c. Interpretar: f2, F3, h1%, H4%

2. A continuacin se dan resultados sobre los puntajes de coeficientes de inteligencia de


40 estudiantes universitarios:
105 104 103 102 100 100 99 97
106 109 109 110 110 111 111 112
116 115 115 115 115 114 114 113
117 117 117 117 119 122 122 127
147 143 137 137 132 131 131 129

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
c) Interpretar: f2, F3, h1%, H4%

3. Un investigador realiza un estudio en la ciudad de Puno, acerca del nmero de horas


semanales que dedican los estudiantes universitarios a ver televisin. Una muestra de 45
estudiantes, arroj los siguientes resultados:
17 26 32 26 33 27 26 30 21
23 26 34 34 32 27 35 32 24
30 29 24 19 27 30 25 29 25
22 28 30 33 21 29 31 21 21
25 32 30 31 28 33 31 28 23

a. Elaborar la Tabla de Distribucin de Frecuencia


b. Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
c. Interpretar: f1, F2, h3%, H3%

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 78

4. Se someti a una evaluacin a 40 estudiantes de una escuela profesional de Turismo


sobre conceptos bsicos del rea, obtenindose los siguientes resultados entre 0 20.

8 11 14 17 7 12 13 14
9 7 11 11 11 13 12 15
12 15 10 12 12 13 15 11
13 12 15 11 13 15 14 9
14 13 8 9 7 11 15 16

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
c) Interpretar: f1, F2, h3%, H3%

5. A continuacin se presentan las calificaciones finales de 42 estudiantes de


Contabilidad, que llevaron el Curso de Estadstica, durante el 2do. Semestre Acadmico:

11 12 16 14 14 15 12
12 10 13 12 12 17 13
13 12 14 12 13 13 13
15 16 11 16 12 12 12
18 15 15 17 11 12 12
14 14 13 16 14 14 13

a. Elaborar la Tabla de Distribucin de Frecuencia


b. Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
c. Interpretar: f4, F3, h2%, H3%

6. Los siguientes datos son los pesos medidos en Kg. de 42 estudiantes varones de la
carrera profesional de Contabilidad

75,1 68,5 95,4 85,5 98,4 86,2 94,9


83,8 71,4 73,3 75,2 85,7 75,9 86,4
69,4 62,1 57,6 68,4 67,6 69,1 68,3
67,5 74,2 66,5 81,4 71,3 82,1 74,3
58,6 64,7 75,6 75,7 80,2 76,4 80,9
64,2 85,4 67,5 65,1 68,2 65,8 68,9

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f2, F3, h1%, H4%

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 79

7. Los siguientes datos son registros de las velocidades de transmisiones en nano


segundos de 35 instrucciones informticas registradas desde su ingreso por un
dispositivo de entrada hasta recibir una respuesta.

1.0 1.4 1.5 0.7 1.1 0.7 0.5 1.1 1.8 1.2 1.2 1.3 0.5 0.1 0.8 1.5 1.6 0.7 1.7
0.2 0.9 0.8 1.0 1.1 1.3 0.8 0.7 0.9 0.9 1.0 1.5 1.4 0.7 0.3 0.8

a) Elaborar la Tabla de Distribucin de Frecuencia


b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f1, F3, h3%, H4%

8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:

Altura(cm.) [170 - 175) [175 - 180) [180 - 185) [185 - 190) [190 - 195) [195 - 200)
N de jugadores 3 5 6 10 7 4

a) Completar la tabla de distribucin de frecuencias.


b) Hacer el histograma la ojiva y grafico por sectores.
c) interpretar Interpretar: f2, F3, h1%, H4%

9. Un contador observa que de 60 tributantes el nmero de infracciones tributarias


cometidas son como sigue:

infracciones fi Hi
[0-1) 0.25
[1-2) 0.20
[2-3)
[3-4) 0.15
[4-5] 0.05
TOTAL
a) Completar la tabla de distribucin de frecuencias
b) Hacer el histograma la ojiva y grafico por sectores.
c) interpretar Interpretar: f2, F3, h1%, H4%

10. Un contador observa que de 100 tributantes el nmero de infracciones tributarias


cometidas son como sigue:

infracciones fi hi
[0-1) 0.15
[1-2) 0.30
[2-3)
[3-4) 0.20
[4-5] 0.05
TOTAL

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 80

a) Completar la tabla de distribucin de frecuencias


b) Hacer el histograma la ojiva y grafico por sectores.
c) interpretar Interpretar: f5, F3, h1%, H4%

11. Se realiz un diagnstico a 40 personas sobre un tipo de malestar los cuales se


encuentran en los siguientes rangos de edades:

[Ii) fi
[ 5 - 10 ) 3 a) Completar la tabla de distribucin de
[ 10 - 15 ) 9 frecuencias
[ 15 - 20 ) 15 b) Hacer el histograma la ojiva y grafico por
sectores.
[ 20 - 25 ) 8
c) interpretar Interpretar: f1, F4, h3%, H2%
[ 25 - 30 ) 5
Total 40

12. Se realiz un diagnstico a 45 personas sobre un tipo de malestar los cuales se


encuentran en los siguientes rangos de edades:

[Ii) fi
[ 5 - 10 ) 4 a) Completar la tabla de distribucin de
[ 10 - 15 ) 11 frecuencias
b) Hacer el histograma la ojiva y grafico
[ 15 - 20 ) 15
por sectores.
[ 20 - 25 ) 9 c) interpretar Interpretar: f2, F3, h2%, H4%
[ 25 - 30 ) 6
Total 45

13. Los siguientes datos corresponden a calificaciones obtenidas en una evaluacin final
en el curso de ESTADISTICA conformada por 45 estudiantes del II Semestre de
Contabilidad, con h2 y h5 borrados, tambin se conoce que la frecuencia f5 es el doble de
f 2.

[ Ii) Xi fi Fi hi Hi hi % Hi %
[08 - 10) 0.155556
[10 - 12)
[12 - 14) 0.2
[14 - 16) 0.222222
[16 - 18)
[18 - 20] 0.088889
TOTAL

a) Completar la tabla de distribucin de frecuencias


b) Hacer el histograma, polgono de frecuencias, la ojiva y grafico por sectores.
c) interpretar Interpretar: f5, F3, h1%, H4%

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 81

14. Se conocen las siguientes calificaciones de un grupo de 45 estudiantes Universitarios.


Los anchos de intervalos son constantes(o iguales) Completar y Calcular lo que se indica

[ Ii ) Xi fi Fi hi Hi hi % Hi %
[ - )
[ - ) 5 12
[ 12 - ) 0.2
[ - )
[ - ) 10
[ - 20 ] 0.089
TOTALES
a) Completar la tabla de distribucin de frecuencias
b) Hacer el histograma, polgono de frecuencias, la ojiva y grafico por sectores.
c) interpretar Interpretar: f2, F3, h3%, H2%

15. Los siguientes datos son registros de las velocidades de transmisiones elctricas en
nano segundos de 45 sentencias ingresadas por un dispositivo de entrada hasta recibir
una respuesta.

1.0 0.9 0.7 0.8 1.2 1.5 0.5 1.5 1.2


1.7 0.7 1.1 1.8 0.9 0.1 0.6 0.3 0.6
1.4 0.8 0.5 0.7 1.3 1.4 0.7 1.6 0.1
0.2 1.1 1.3 1.2 1.0 0.8 0.9 0.8 0.3
1.5 1.0 1.1 0.9 0.5 0.7 0.7 0.7 1.8
a) Construir la tabla de distribucin de frecuencias
b) Hacer el histograma, polgono de frecuencias, la ojiva y grafico por sectores.
c) interpretar Interpretar: f2, F3, h3%, H2%

16. Los siguientes datos corresponden al nmero dietas especiales por semana aplicados
a una muestra de 51 estudiantes que muestran debilidad mental.
7 8 6 7 1 7 6 1 7 3 7 1 1 2 5 4 2
3 4 5 7 1 5 7 4 8 3 6 6 7 8 7 2 3
8 5 2 6 1 2 6 3 2 1 6 1 9 2 4 5 4

a) Construir la tabla de distribucin de frecuencias


b) Hacer el histograma, polgono de frecuencias, la ojiva y grafico por sectores.
c) interpretar Interpretar: f3, F1, h2%, H3%

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 82

CAPTULO VI

MUESTREO

El muestreo es el procedimiento mediante el cual se extraen algunos elementos de una


poblacin total y solo de esa parte de la poblacin consideramos muestra.

Por lo tanto, la MUESTRA es un conjunto de unidades, casos o eventos que son tomadas o
extradas de una poblacin las que poseen algunas caractersticas comunes o similares, de
acuerdo al problema de investigacin.

MTODOS MUSTRALES:

A) MUESTREO PROBABILISTICO:
Es un proceso muestral donde cada elemento de la poblacin tiene una
probabilidad conocida de ser incluida dentro de la muestra. Los elementos
mustrales tendrn valores muy parecidos a los de la poblacin de manera que las
mediciones de la muestra no darn estimados ptimos de la poblacin.

En una muestra probabilstica se debe considerar dos casos:

a) Determinar el tamao de la muestra, bajo una frmula segn el tipo de


muestreo a aplicar.
b) Seleccionar los elementos mustrales de tal manera que todos tengan
la misma probabilidad de ser elegidos.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 83

Las muestras probabilsticas tienen mucha ventaja principalmente por que pueden
medirse y controlar el tamao de error, nivel de significancia y/o nivel de
confianza.

B) MUESTREO NO PROBABILISTICO:
Es un proceso por el cual no se puede asignar objetivamente probabilidades a los
elementos seleccionados y por consiguiente no se puede determinar la precisin
de los resultados mustrales en trminos de probabilidad entre los cuales
tenemos:

i) Muestreo a criterio o Juicio: Es proceso por el cual la seleccin depende


del juicio humano y no de una rigurosa aplicacin de la teora de
probabilidades.

ii) Muestreo por Cuotas: Es el proceso del muestreo a juicio en que los
sesgos que sufren los mtodos no probabilsticos de seleccin no se
controlan hasta cierto punto por la estratificacin y establecimiento de
cuotas de seleccin. Se divide la poblacin en grupos o estratos segn las
exigencias del estudio, generalmente: Edad, sexo, condicin social, etc.

iii) Cuestionario por correo: Se emplea por ser de bajo costo y fcil de
administracin, la principal obsesin a este muestreo es el sesgo causado
por el no retorno del cuestionario, estudios de opinin de mercado an
se emplean estos tipos de muestreo aunque su uso tiende a disminuir
por sus imprecisiones.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 84

TIPOS DE MUESTREO

a). Muestreo Aleatorio Simple.


Consiste en elegir una serie de elementos de la poblacin considerando
que cada uno de ellos tiene igual probabilidad de ser elegido al conformar
la muestra.

Este tipo de muestreo es de gran utilidad cuando se requiere extraer una


muestra de una poblacin, por su fcil aplicacin.

FORMAR DE ELECCION DE ELEMENTOS MUESTRALES


Con reemplazo: Todas las unidades de la poblacin tienen la
probabilidad de ser seleccionadas para tomar parte de la muestra,
formalmente coincide con el muestreo de poblaciones infinitas. Una
vez extrada la informacin se devuelve el elemento a la poblacin y
la extraccin del siguiente elemento es independiente al resultado
anterior. El nmero de formas para elegir la muestra est dado por
(Nn) formas diferentes.

Sin reemplazo: Toda las unidades de la poblacin tienen la misma


probabilidad de ser extrada para la poblacin si es finita, la
probabilidad de que salgan un elemento depender de lo que
fueron separados independientemente para formar parte de la
muestra y dejar por tanto pertenecer a la poblacin. El nmero de
N
formas para elegir la muestra est dado por: formas
n
diferentes.

b). Muestreo Estratificado.


Basndose en alguna caracterstica, se divide la poblacin en grupos de
unidades llamados estratos. Siempre con unidades de caractersticas

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 85

homogneas. Luego, cada uno de ellos se selecciona al azar una muestra


de tamao adecuado; as, la unin de estos conjuntos de unidades
conforman la muestra de tamao n. Por ejemplo, dividir la poblacin
Universitaria en Facultades o Escuelas Profesionales, por niveles o
semestres de estudio, gnero, etc. Segn el enfoque de la investigacin

c). Muestreo Sistemtico.


Es el procedimiento de seleccin del k-simo elemento de la poblacin con
un comienzo aleatorio. Este mtodo usual por su simplicidad se prefiere
frente al muestreo estratificado si la poblacin puede ponerse en orden.
Con el muestreo sistemtico se logra mayor eficiencia si las unidades se
hallan tienen mayor uniformidad que las unidades que se encuentran
alejados entre s.

d). Muestreo aleatorio por conglomerados:


En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la poblacin que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., cuando los
conglomerados son reas geogrficas suele hablarse de "muestreo por
reas". El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto nmero de conglomerados (el necesario para
alcanzar el tamao muestral establecido) y en investigar despus todos los
elementos pertenecientes a los conglomerados elegidos.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 86

A) TIPO DE MUESTREO: MUESTREO ALEATORIO SIMPLE (MAS)

Llamado tambin irrestricto aleatorio, es un proceso de seleccin al azar de


unidades para obtener una muestra que tiene una cierta probabilidad de
ocurrencia. Esta probabilidad de propiedades especficas a los valores obtenidos
en la muestra que sirven para estimar los parmetros.

El muestreo aleatorio simple es el esquema ms simple de muestreo y en rigor es


el que sirve de base para todos los dems.

Consiste en extraer un nmero n (tamao de la muestra) unidades de muestreo de


una poblacin de tamao N.

La seleccin de estas unidades de muestreo se va extrayendo aleatoriamente una


a una las unidades de la poblacin. La mejor manera de lograr esta condicin de
aleatoriedad es la seleccin de la muestra mediante el uso de las tablas de
nmeros aleatorios.

DETERMINACIN DEL TAMAO DE MUESTRA


CASO I: VARIABLES CUALITATIVAS (PARA PROPORCIONES)

P : proporciones favorable a la investigacin


Q : proporciones desfavorable a la investigacin.
e : error para la proporcin.
E : Error muestral.
: Nivel de significancia
1- : nivel de confianza
Z : Valor de la distribucin normal para un

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 87

Se determina el tamao de la muestra inicial o preliminar no= Tamao de la


muestra inicial. Aplicando un muestreo sin reemplazo, para un tamao de
poblacin relativamente grande o desconocida.

( Z ) 2 ( P)(Q)
i) n0
(E)2

ii) Si (n0/N) Entonces se corrige el tamao de la muestra utilizando la


frmula de iii). En caso contrario la muestra final queda como n0
n0
iii) n
(n 1)
1 0
N

Ejemplo 1: (Cuando existe investigacin preliminar)

SE CONSIDERA LOS VALORES DE LA PROPORCION FAVORABLE (P) Y PROPORCION


DESFAVORABLE (Q), A LOS OBTENIDOS DEL ESTUDIO PRELIMINAR

Se desea determinar el tamao de muestra adecuado, para el trabajo de


investigacin denominado: Preferencia por estudios superiores en Ciencias
Contables y Administrativas y su relacin con el Rendimiento Acadmico en
estudiantes de la I.E.S. G.U.E. San Carlos Puno 2014, se sabe que la poblacin
estudiantil es de 1643. Por estudios referenciales realizados sobre el tema similar
en otra Institucin Educativa, se obtuvo que la preferencia es en una proporcin
de 30%, determine el tamao de muestra con un nivel de significancia del 5% y un
error del 15% para la proporcin.

SECCIONES
GRADO A B C D E F G H I J K L M TOTAL
Primero 30 30 32 31 32 23 25 26 26 24 29 26 30 364
Segundo 30 32 29 30 24 26 26 26 24 24 27 28 26 352
Tercero 28 26 26 26 31 29 26 26 30 24 23 22 317
Cuarto 29 32 25 29 29 25 27 26 24 25 20 20 311
Quinto 27 28 30 25 23 30 27 20 24 22 24 19 299

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 88

Gran total 1643

Solucin:
N = 1643
P = 0.30 = 30% Datos indispensables para la investigacin
Q = 0.70 = 70%
= 0.05 (5% de nivel de significancia 95% de nivel de confianza)
Z/2 = Z0.05/2 = 1.96
e = 15 % = 0.15 = error para la proporcin P
E = e * P = 0.15 (0.30) = 0.045 = 4.5% error muestral.

( Z ) 2 ( P)(Q) (1.96) 2 (0.3)(0.7)


i) n0 = = 398.38815
(E)2 (0.045) 2
n0 = 398

ii) Si (n0/N) Entonces se corrige el tamao de la muestra


Si (398/1643)= 0.2422398 = 0.05 Entonces se corrige.

n0 398
iii) n = = 320,546=321
(n0 1) (398 1)
1 1
N 1643

Finalmente el tamao de muestra para la investigacin Preferencia por estudios


superiores en Ciencias Contables y Administrativas y su relacin con el
Rendimiento Acadmico en estudiantes de la I.E.S. G.U.E. San Carlos Puno 2014
es de 321 estudiantes de educacin secundaria, con un nivel de confianza de 95%

Ejemplo 2: (Cuando realizamos una encuesta piloto)

SE CONSIDERA LOS VALORES DE LA PROPORCION FAVORABLE (P) Y PROPORCION


DESFAVORABLE (Q), LOS OBTENIDOS DE LA MUESTRA PILOTO

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 89

Se desea determinar el tamao de muestra para un nivel de significancia del 1% y


un error de 18% para la proporcin. De una poblacin de 625 personas que tienen
al menos un proceso judicial de tipo penal en el Distrito Judicial de Puno, se desea
estudiar la proporcin sobre el conocimiento referencial de esta poblacin en
litigio de la aplicacin del nuevo cdigo procesal penal en dichas personas. No se
tiene estudios referenciales, para lo cual se toma una muestra piloto de 15
personas, (que representa 15/625=0,025 = 2,5%, para una muestra piloto se
recomienda que la proporcin debe ser de 1% al 5% del tamao de la poblacin),
cuyos resultados se muestran de la siguiente forma:

Personas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Conoce el nuevo
No Si Si No No No Si No No Si No No Si Si No
cdigo procesal penal

Solucin:
Si = 6 P = 6/15 = 0.40
No = 9 Q = 9/15 = 0.60
= 1% = 0.01
N = 625
Z/2 = Z0.01/2 = 2.575
e = 18 % = 0.18 = error para la proporcin P
E = e * P = 0.18 (P) = 0.18 (0.40) = 0.072 = 7.2% de error muestral.

( Z ) 2 ( P)(Q) (2.575) 2 (0.4)(0.6)


i) n0 = = 306.9733796
(E)2 (0.072) 2
n0 = 307

ii) Si (307/625 = 0.4912) = 0.01 Entonces se corrige.

n0 307
iv) n = = 206.096 = 206
(n0 1) (307 1)
1 1
N 625

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 90

El tamao de muestra es de 206 personas que tienen al menos un proceso judicial


de tipo penal en el Distrito Judicial de Puno, para estudiar la proporcin sobre el
conocimiento de la aplicacin del nuevo cdigo procesal penal con un nivel de
confianza de 99%

Ejemplo 3: (Cuando la investigacin es nueva Asumimos P = 0.50 y Q = 0.50)

SE ASUME LOS VALORES DE LA PROPORCION FAVORABLE (P=0.5) Y PROPORCION


DESFAVORABLE (Q=0.5), PROPORCION EQUILIBRADA PARA AMBOS CASOS.

Se desea determinar el tamao de muestra adecuado, para investigar la


preferencia de consumo de productos embolsados de estudiantes de la Escuela
Profesional de Contabilidad, se sabe que la poblacin estudiantil es de 500. No se
tiene estudios referenciales. Determinar el tamao de muestra con un nivel de
significancia del 10% y 12% de error para la proporcin

Solucin:
P = 0.50
Q = 0.50
N = 500, = 10% = 0.10
Z/2 = Z0.10/2 = 1.645
e = 12 %
E = e * P = 0.12 (P) = 0.12 (0.50) = 0.06

( Z ) 2 ( P)(Q) (1.645) 2 (0.5)(0.5)


i) n0 = = 187.9184028
(E)2 (0.06) 2
n0 = 188

ii) Si (188/500) = 0.376 = 0.10 Entonces se corrige.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 91

n0 188
iii) n = = 136.8267831=137
(n0 1) (188 1)
1 1
N 500

El tamao de muestra es de 137 estudiantes para determinar si cuenta o no con


vivienda propia, con un nivel de confianza de 90%.

TAMAO DE MUESTRA PARA VARIABLES CUALITATIVAS SEGN SIERRA BRAVO:


El tamao de la muestra se determina de la siguiente forma:

PARA POBLACIONES INFINITAS (> a 100,000)


CASO I: Criterio 2 (95.5% de confianza Z = 2)
4 PQ
n
E2

CASO II: Criterio 3 (99.7% de confianza Z = 3)


9 PQ
n
E2

PARA POBLACIONES FINITAS (< a 100,000)


CASO I: Criterio 2 (95.5% de confianza Z = 2)
4 NPQ
n
E ( N 1) 4PQ
2

CASO II: Criterio 3 (99.7% de confianza Z = 3)


9 NPQ
n
E ( N 1) 9PQ
2

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 92

CASO II: VARIABLES CUANTITATIVAS

a) CUANDO SE TIENE ESTUDIOS PRELIMINARES.

Z 2 2
i) n0
E2
ii) Si (n0/N) Entonces se corrige.
n0
iii) n
(n 1)
1 0
N

Ejemplo 4:
Se desea realizar una evaluacin sobre conocimientos generales de CONTABILIDAD
FINANCIERA, a estudiantes del rea de Contabilidad, conformado por 315 estudiantes,
por estudios referenciales se sabe que una evaluacin similar del ao anterior, la nota
promedio obtenido por los estudiantes fue de 13,5 y su varianza 17,5. Determine el
tamao de la muestra para la investigacin con un nivel de confianza del 95% y un error
del 8% para el promedio.
Solucin:
N = 315
= 13,5 Datos indispensables para la investigacin
2 = 17,5
= 0.05 (5% de nivel de significancia = 95% de nivel de confianza)
Z/2 = Z0.05/2 = 1.96
e = 8 % = 0.08
E = e () = 0.08 (13,5) = 1.08

Z 2 2 (1.96) 2 (17.5)
i) n0 = = 57,63717421 = 58
E2 (1.08) 2

ii) Si (58/315) = 0.1841 = 0.05 Entonces se corrige.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 93

n0 58
iii) n = = 49,11290323 = 49
(n0 1) (58 1)
1 1
N 315

El tamao de muestra es de 49 estudiantes del rea de contabilidad que deben ser


evaluados sobre conocimientos generales de Contabilidad Financiera, con un nivel de
confianza de 95%.

b) CUANDO REALIZAMOS UNA ENCUESTA PILOTO.

Ejemplo 5:
Se desea determinar el nivel de rendimiento de un examen pre universitario, conformado
por 1800 postulantes, no se tiene estudios referenciales sobre el caso. Determine el
tamao de la muestra para la investigacin con un nivel de confianza del 90% y un error
para el 5% del promedio. Para lo cual se toma una muestra piloto de 20 resultados.

2600 2700 2100 3500 2800 3300 2300 2700 2500 2400
2500 3400 2400 2100 2400 2900 3000 2500 2400 3000

Solucin:
N = 1800
= 2675 Resultado de la
muestra piloto.
2 = 161973,684
= 0.10 (10% de nivel de significancia = 90% de nivel de confianza)
Z/2 = Z0.10/2 = 1.645
e = 5 % = 0.05
E = e * = 0.05(2675) = 133,75

Z 2 2 (1,645) 2 (161973,684)
n0 24,50127491 25
E2 133,75 2
Si (25/1800) = 0.01388888889< = 0.10, Entonces ya no se corrige, el tamao de la
muestra es ptimo.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 94

El tamao de muestra es de 25 postulantes que deben ser evaluados para determinar el


nivel de rendimiento, con un nivel de confianza de 90%

TAMAO DE MUESTRA PARA VARIABLES CUANTITATIVAS SEGN SIERRA BRAVO:


El tamao de la muestra se determina de la siguiente forma:

PARA POBLACIONES INFINITAS (> a 100,000)

CASO I: Criterio 2 (95.5% de confianza Z = 2)

4 2
n
E2

CASO II: Criterio 3 (99.7% de confianza Z = 3)

9 2
n
E2

PARA POBLACIONES FINITAS (< a 100,000)

CASO I: Criterio 2 (95.5% de confianza Z = 2)

4 N 2
n
4E 2 N 2

CASO II: Criterio 3 (99.7% de confianza Z = 3)

9 N 2
n
9E 2 N 2

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 95

B) TIPO DE MUESTREO: MUESTREO ALEATORIO ESTRATIFICADO (MAE)

Denominado tambin muestreo aleatorio restringido o muestreo aleatorio


condicionado. Es un mtodo de muestreo probabilstico en la que se divide la
poblacin en estudio con base con algunos variables en diferentes clases o grupos
para luego realizar el muestreo en cada grupo.

Este muestreo es ms eficiente que el MAS en especial cuando las


caractersticas especficos es de una variabilidad lo cual implica un tamao
muestral relativamente grande en comparacin a lo obtenido mediante el MAS. En
una muestra aleatorio estratificado la poblacin a investigar se divide en grupos
relativamente homogneos con relacin a la caracterstica en estudio, estos
grupos se denominan estratos donde la unidad investigada presenta una
caracterstica tal que slo permite pertenecer a un solo estrato.

Es necesario entender que cada estrato se constituye en un dominio de


estudio, los estratos pueden o no estar compuestos del mismo nmero de
unidades por esta razn la operacin del muestreo puede variar de un estrato a
otro.

Para aplicar el muestreo estratificado se requiere de dos etapas:

1. Dividir la poblacin en grupos mutuamente excluyentes y exhaustivos,


esto indica que se debe asignar cada elemento de la poblacin en un
solo grupo y que ningn elemento debe quedar eliminado.

2. Despus de estratificar la poblacin aplicar muestreo probabilstico en


cada grupo.

La idea principal del muestreo estratificado es medir el grado de precisin


muestral o al menos controlar las variables extradas que pueden aumentar el

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 96

error muestral. Es muy importante identificar las variables de la base de


estratificacin si no existe informacin para identificar estas variables, se puede
aplicar un estudio piloto exploratorio para conocer dichas variables de
estratificacin.

VARIABLES DE ESTRATIFICACION.

CUALITATIVO: Sexo, condicin social, estado civil, nivel de tasa de consumo,


tamao de una empresa (pequeo, mediano y grande), utilidades de una empresa
(baja, regular y alta).

CUANTITATIVOS: Peso, talla, monto de ingreso, egreso, utilidad, renta, impuesto,


tasa de inters, capitalizacin, o todo lo que se pueda registrar como dato
numrico entero, real o fraccionario.

AFIJACIN
Cuando se tiene tamao de muestra n llamamos afijacin de la muestra a la
asignacin del tamao correspondiente a cada estrato de tal forma que frente a
un costo total de la investigacin, la Barina muestral sea minimizada, Los criterios
de afijacin ms utilizada son:

AFIJACION IGUAL: Llamado tambin afijacin simple en la que se asigna a


todo los estratos el mismo nmero de unidades para lo cual basta con
dividir el tamao de muestra por el nmero de estratos Esta asignacin no
tiene en cuenta el equilibrio de la muestra y es poco usado salvo que se
quiere un nmero suficiente en todo los estratos.

n
nh
L

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 97

AFIJACION PROPORCIONAL: Consiste en determinar el tamao de cada


estrato de modo que su porcentaje dentro de la muestra coincida con el
porcentaje que represente en estrato poblacional correspondiente
respecto a la poblacin total, se realiza aplicando simplemente los
porcentajes de cada estrato en la poblacin del tamao global de la
muestra, esto indica que cuanto mayor sea un estrato mayor ser la
muestra asignado al mismo.

N
nh h n
N

AFIJACION OPTIMA: Es el ms completo que los anteriores (solo para datos


cuantitativos) y se centra en la necesidad de que los distintos estratos
deben tener la misma representatividad y variacin. Consiste en
multiplicar, cuando se conoce los desviaciones tpicas de cada estrato de la
poblacin el porcentaje de cada estrato en la poblacin por su desviacin
tpica, adems se puede tener en cuenta el costo de la investigacin para
luego asignar proporcin limite a estratos producto, el tamao global de la
muestra se actualiza especialmente cuando su empleo deduce de una
manera sensible considerando la varianza por estratos.

La afijacin optima si bien no respeta el coeficiente de elevacin


(cantidad de unidades mustrales representadas por cada uno de los
componentes de la muestra), proporciona unos estratos en las que la
dispersin de la informacin es constante para toda la muestra.

n( N h )( S h )
nh L

N S
h 1
h h

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 98

Ejemplo 1: (CASO DE VARIABLES CUALITATIVAS):

Si se tiene 805 personas de un sector de la Ciudad, del cual se pretende estudiar el


rechazo o preferencia del consumo de bebidas gaseosas, para ello se considera tres
grupos (nios, jvenes y adultos), hallar el tamao de la muestra para un nivel de
confianza del 95% y un error del 18% para la proporcin y luego asignar el tamao de
muestra para cada estrato. Los valores de Ph y Qh son tomados de un estudio preliminar
(hallados de un barrio de la ciudad de Juliaca) y se toma como antecedente o referencia
para este ejemplo.

Personas Nh Ph Qh Wh
Nios 345 0.18 0.82 345/805
Jvenes 262 0.27 0.73 262/805
Adultos 198 0.38 0.62 198/805
Total 805
FUENTE: Resultados de un estudio similar al planteado en un barrio de Juliaca

Ph : Proporcin de rechazo del consumo de bebidas gaseosas


Qh : Proporcin de preferencia de consumo de bebidas gaseosas

= 0.05 entonces Z = 1.96


e = 18% = 0.18
E = e ( PG) = 0.18 (0.258484472) = 0.0465272=4.65%

Calculando la proporcin general.


L

N h Ph
345(0.18) 262(0.27) 198(0.38)
PG h 1
= = 0.258484472
N 805

Primera aproximacin:
L
Z 2 (Wh Ph Qh )
i) n0 h 1
=
E2

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 99

345 262 198


(1.96) 2 (0.18)(0.82) (0.27)(0.73) (0.38)(0.62)
n0 805 805 805
2
(0.0465272 )

(1.96) 2 0.18535528
n0 328.929765 5 329
(0.0465272 ) 2

ii) Condicin para su correccin o no de la muestra inicial.

Si (329/805) = 0.408695652 = 0.05

Entonces se corrige aplicando la misma frmula de correccin.

n0 329
n 233.755516 3 234
(n0 1) (329 1)
1 1
N 805

Finalmente la muestra para el presente estudio ser 234, con un 95 % de


nivel de confianza o =0.05 nivel de significancia.

DETERMINAMOS LA AFIJACION UTILIZANDO SUS RESPECTIVAS FORMULAS:


n
Afijacin igual: nh
L

Afijacin proporcional: N
n h h n (Wh )n
N

AFIJACION
Igual Proporcional (Recomendado)
Estratos Nh nh nh
Nios 345 234/3 = 78 (345/805)*234 = 100
Jvenes 262 234/3 = 78 (262/805)*234 = 76
Adultos 198 234/3 = 78 (198/805)*234 = 58
TOTAL 805 234 234

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 100

CASO II: VARIABLES CUANTITATIVOS


Z2
Primera aproximacin:
n0
E2
Wh (Sh2 )
L

N h Xh
Promedio General: XG H 1
N

Ejemplo 2 (CASO DE VARIABLES CUANTITATIVAS):

En el Gobierno Regional de Puno, se desea investigar el nivel de la capacidad laboral de


265 profesionales distribuidos en las cinco principales especialidades, en una
investigacin similar en Arequipa se obtuvo las siguientes calificaciones promedio con sus
respectivas varianzas, los que se muestran en la siguiente tabla, determine el tamao de
muestra para cada estrato (con los 3 tipos de afijaciones), con un nivel de confianza del
95% y un error del 6% para el promedio.

Especialidades Nh X S2h

Funcionarios 62 11.25 12.5


rea Administracin y Contabilidad 83 14.5 12.25
rea Ingenieras 72 14.75 14.5
rea Biomdicas 27 14.25 9.5
rea Sociales 21 13.5 16.5
TOTAL 265

= 0.05 entonces Z =1.96


e = 6% = 0.06

Calculando el Promedio general:


L

N h Xh
62 * 11.25 83 * 14.5 72 * 14.75 27 * 14.25 21 * 13.5
X G H 1 13.7028302
N 265

E = e ( X G) = 0.06 ( X G) = 0.06 (13.7028302) = 0.82216981

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 101

CALCULANDO LA PRIMERA APROXIMACIN:


Especialidades Nh X S2h Wh Wh*S2h

Funcionarios 62 11.25 12.5 0.233962264 2.924528302

rea Administracin y Contabilidad 83 14.5 12.25 0.313207547 3.836792453

rea Ingenieras 72 14.75 14.5 0.271698113 3.939622642

rea Biomdicas 27 14.25 9.5 0.101886792 0.967924528

rea Sociales 21 13.5 16.5 0.079245283 1.30754717


TOTALES 265 12.97641509

Z2
i) n0 2 Wh (Sh2 )
E
(1.96) 2
ii) n0 (12.9764150 9) 73.7469086 74
(0.82216981 1) 2

Condicin para la correccin:


ii) Si (74/265) = 0.278290221 = 0.05 Entonces se corrige.
74
n 58.0177514 8 58
(74 1)
1
265
iii) n = 58

DETERMINAMOS LA AFIJACION UTILIZANDO SUS RESPECTIVAS FORMULAS:


AFIJACION IGUAL AFIJACION PROPORCIONAL AFIJACION PTIMA
n n( N h )( Sh )
nh N nh
L nh h n N h Sh
N

CALCULOS PREVIOS:
Especialidades Nh S2h Wh Sh Nh * S h

Funcionarios 62 12.5 0.233962264 3.535533906 219.2031022

rea Administracin y Contabilidad 83 12.25 0.313207547 3.5 290.5

rea Ingenieras 72 14.5 0.271698113 3.807886553 274.1678318

rea Biomdicas 27 9.5 0.101886792 3.082207001 83.21958904

rea Sociales 21 16.5 0.079245283 4.062019202 85.30240325


TOTALES 265 952.3929263

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 102

AFIJACIONES
Afijaciones (nh)

Igual Proporcional ptima


Especialidades Nh
nh
n N n( N h )( Sh )
nh h n nh
L N N h Sh
Funcionarios 62 58/5=11.6 = 12 13.56981132 = 14 13.34930109 = 13
rea Administracin y
83
Contabilidad 58/5=11.6 = 12 18.16603774 = 18 17.69122758 = 18
72
rea Ingenieras 58/5=11.6 = 12 15.75849057 = 16 16.69661104 = 17
27
rea Biomdicas 58/5=11.6 = 12 5.909433962 = 6 5.068009255 = 5
21
rea Sociales 58/5=11.6 = 12 4.596226415 = 5 5.194851045 = 5
TOTALES 265 60 59 58

Finalmente las afijaciones (igual y proporcional) no coinciden con la muestra final de


n=58, sin embargo la afijacin ptima coincide exactamente a este tamao de muestra,
entonces la afijacin ptima es la ms adecuada para aplicar el muestreo aleatorio
estratificado.

Ejemplo 3 (CASO DE VARIABLES CUANTITATIVAS):


Se tiene calificaciones promedio con sus varianzas respectivas, sobre estudiantes de una
misma escuela profesional pero de tres semestres diferentes, los que se muestran en la
siguiente tabla, determine el tamao de muestra para cada estrato con un nivel de
significancia = 0.05 y un error del 9% para el promedio.

Con la informacin del problema anterior, hallar el tamao de muestra para cada estrato


SEMESTRE Nh Sh2 Wh
X
PRIMERO 200 15.3 16.16 200/550
TERCERO 150 14.5 14.56 150/550
QUINTO 200 13.8 15.48 200/550
Totales 550

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 103

= 0.05 entonces Z =1.96


L

N h Xh
200(15.3) 150(14.5) 200(13.8)
XG H 1
= = 14.5363633636
N 550

E = 0.09 ( X g) = 0.09 (14.5363) = 1.308272727

Z2
i) n0 2
E
Wh(S 2
h)

(1.96) 2
n0 (200 / 550(16.16) 150 / 550(14.56) 200 / 550(15.48)) 34.7363748
(1.3083) 2
n0 = 35

ii) Condicin para la correccin o no de la muestra inicial:


Si (35/550) = 0.06363636 = 0.05 Entonces se corrige.
n0 35
n = = 32.9623288
(n0 1) (35 1)
1 1
N 550
iii) n = 33

LAS AFIJACIONES SERAN DE LA SIGUIENTE MANERA:

SEMESTRE Nh Afijacin Afijacin Afijacin


simple nh proporcional nh ptima nh
PRIMERO 200 11 12 12
TERCERO 150 11 09 09
QUINTO 200 11 12 12
Totales 550 33 33 33

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 104

Ejemplo 4 (CASO DE VARIABLES CUANTITATIVAS):


Se desea estudiar sobre el rendimiento acadmico de la Escuela Profesional de Ingeniera
Econmica de los estudios realizados en el ao acadmico 2009. Los resultados de la tabla
mostrada son tomados como referencia de estudio. Determine el tamao de muestra
para un nivel de confianza del 90% y un error de 6% para el promedio, realizar afijacin
en las 3 formas.


Nivel Nh X Sh2 Wh

Primero 189 12.33 15.75 189/519


Segundo 120 13.13 16.25 120/519
Tercero 96 13.33 13.25 96/519
Cuarto 71 13.75 14.75 71/519
Quinto 43 14.25 17.25 43/519
Totales 519

= 0.10 entonces Z =1.645


e = 0.06 = 6%
L

N h Xh
189(12.33) 120(13.13) ... 43(14.25)
XG H 1
= = 13.05327553
N 519

E = 0.06 ( X g) = 0.06 (13.05327553) = 0.7831965

Z2
i) n0
E2
Wh(S 2
h)

(1.645) 2
n0 (189 / 519(15.75) 120 / 519(16.25) ... 43 / 519(18.25)) =
(0.7831965 ) 2

n0 = 67.89650187 = 68

ii) Condicin para la correccin o no de la muestra inicial:


Si (68/519) = 0.13 = 0.10 Entonces se corrige.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 105

n0 68
n = = 60.2252557
(n0 1) (68 1)
1 1
N 519
iii) n = 60

LAS AFIJACIONES SERAN DE LA SIGUIENTE MANERA:

SEMESTRE Nh Afijacin Afijacin Afijacin


simple nh proporcional nh ptima nh
Primero 189 12 22 22
Segundo 120 12 14 14
Tercero 96 12 11 11
Cuarto 71 12 08 08
Quinto 43 12 05 05
TOTALES 519 60 60 60

n N n( N h )( S h )
nh nh h n nh
N
L
L
N S
n 1
h h

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 106

Ejemplo 5: CASO (MUESTRA PILOTO) DATOS CUANTITATIVOS


Se desea realizar un estudio sobre el nivel de desnutricin de nios de 6, 7, 8, 9, 10, 11,
12 meses registrados en el HMNB se tiene un total de 716 ficha registradas durante el
presente ao. Determinar el tamao de muestra para un nivel de confianza del 95 % y un
error del 2% para el promedio, luego realizar la afijacin de las tres formas, considerando
que no se tiene ninguna investigacin similar en dicho Centro de Salud.

DATOS PARA LA MUESTRA PILOTO

Estrato 6 meses 7 meses 8 meses 9 meses 10 meses 11 meses 12meses


Nro.Obs.. 5 6 5 4 6 5 5
1 7.80 8.30 8.80 9.20 9.50 9.90 10.20
2 7.93 7.50 9.40 9.45 10.15 8.10 11.45
3 8.35 8.75 9.25 7.50 10.05 10.50 9.90
4 8.40 7.45 7.95 9.80 9.80 10.25 10.36
5 6.00 6.15 6.65 10.20 9.82 9.56
6 8.90 8.15

Promedio 7.696 7.84166667 8.41 8.9875 9.64166667 9.714 10.294


Varianza 0.96633 1.05741667 1.28675 1.043958333 0.60141667 0.88898 0.51088

Meses
Nh X Sh2 Wh Wh X Nh Wh S2h

6 108 7.696 0.96633 108/716 0.15083799 831.168 0.14575927


7 120 7.8416667 1.057416667 120/716 0.16759777 941 0.17722067
8 98 8.41 1.28675 98/716 0.13687151 824.18 0.17611941
9 76 8.9875 1.043958333 76/716 0.10614525 683.05 0.11081122
10 127 9.6416667 0.601416667 127/716 0.1773743 1224.491667 0.10667586
11 91 9.714 0.88898 91/716 0.12709497 883.974 0.11298489
12 96 10.294 0.51088 96/716 0.13407821 988.224 0.06849788
totales 716 1 6376.087667 0.8980692

= 0.05 entonces Z =1.96

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 107
L

Nh X h 108(7.696) 120(7.842) ... 96(10.294)


XG H 1
= = 8.90515057
N 716


e=2%=0.02; E=0.02( X g)=0.02(8.9015057) = 0.178103007

Z2
i) n0
E2
Wh(S 2
h )

(1.96) 2
(108 / 716)(0.966333) (120 / 716)(0.05741) ... (96 / 716)(0.51088)
(0.178103 ) 2

n0 = 108.762565 = n0 = 109

ii) Si(109/716) =0.1522347 > =0.05 Entonces se corrige


n0 109
n = = 94.71359223 = 95
(n0 1) (109 1)
1 1
N 716

LAS AFIJACIONES SERAN DE LA SIGUIENTE MANERA:


Meses Nh Afijacin Afijacin Afijacin
simple nh proporcional nh ptima nh

6 108 14 14 15 Afijacin n
igual
nh
7 120 14 16 17 L

8 98 14 13 16
N
9 76 14 10 11 Afijacin nh h n
proporcional N
10 127 14 17 14
11 91 14 12 12 n( N h )( S h )
Afijacin
nh L
12 96 14 13 10 ptima N S
n 1
h h

Totales 716 98 95 95

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 108

CAPTULO V

PRUEBAS DE HIPTESIS

DIFERENCIA DE DOS MEDIAS MUESTRALES

Es una prueba estadstica aplicado a datos cuantitativos. La prueba de hiptesis que


involucra las diferencias entre las medias de dos muestras se utiliza con ms frecuencia
para determinar si es razonable o no concluir que las dos son distintas entre si. Se utiliza
la distribucin T (T-Student) cuando n<32, y Z (Distribucin Normal) cuando n>=32.

EJEMPLO 1. De una muestra de 10 estudiantes se considera las siguientes calificaciones


obtenidas de una evaluacin (prueba de entrada) sobre conocimientos bsicos sobre el
uso y aplicacin del Plan Contable y luego de una capacitacin se volvi a evaluar (prueba
de salida). Determinar si existe diferencia en la prueba de entrada y salida para un nivel
de confianza del 95% (=0.05 nivel de significancia). Para as comprobar si la capacitacin
tuvo xito o no.
PRUEBA
Nro. Dato
ENTRADA SALIDA
1 11 13
2 7 14
3 10 15
4 7 7
5 11 13
6 7 12
7 11 13
8 8 11
9 11 12
10 9 11
Promedio 9.2 12.1
Varianza 3.288888889 4.766666667

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 109

1. PLANTEAMIENTO DE HIPOTESIS
Ho : Promedio Prueba de entrada = Promedio Prueba de
Ho : A = B Salida (Hiptesis nula).
H1 : Promedio Prueba de entrada Promedio Prueba de
H1 : A B Salida (Hiptesis alterna).

2. FIJAR EL NIVEL DE SIGNIFICANCIA ( )


Se puede tomar diferentes niveles de significancia dependiendo con qu nivel de
confianza se concluir, el ms utilizado es = 0.05 (95 % de nivel de confianza)

3. REGLA DE DECISION UTILIZANDO (Tc= T calculada y Tt= T tabulada o de tabla)


si Tc > Tt Se rechaza la Ho y se Acepta la H1

4. CALCULO DE Tc SEGN LA FORMULA

XA XB 9.2 12.1
Tc 3.23109888
S A2 S B2 3.288888888 4.766666666


n A nB 10 10

Para este caso buscamos el valor de (Tt) T tabulada o T de tabla con


(n=nA+nB=10+10=20) n-2 = 20 - 2 = 18 g.l. (Grados de libertad) y ( = 0.05 5%
Nivel de significancia).
Luego: Tt = T [18,0.05] = 2.1009 (18 g.l. y =0.05 95% de nivel de confianza)

5. DECISION: Como Tc = 3.231 > Tt =2.1009 , Entones Se rechaza la H0 y se Acepta la


H1, esto implica que SI EXISTE diferencia significativa entre estas dos
evaluaciones, es decir que la capacitacin tuvo un efecto positivo, para un
nivel de significancia de 0,05 o para un nivel de confianza del 95%.

NOTA: Si el caso fuera que Tc < Tt , Ocurre lo contrario es decir que se Aceptara la
hiptesis nula y se rechazara la hiptesis alterna, generalmente este caso no
debe ocurrir en una investigacin porque no estaramos demostrando la
hiptesis alterna, lo que implicara que la investigacin que se realiz no es
beneficiosa ni satisfactoria para nuestros objetivos.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 110

EJEMPLO 2. : De una muestra de 72(Puno) y 80(Juliaca) establecimientos comerciales se


obtuvo informacin sobre las utilidades netas semanales, con esta informacin
determinar si existe o no diferencia significativa entre estos establecimientos
entre Puno y Juliaca para un nivel de confianza de 95%.

Para este caso en el contraste de las hiptesis se usa la prueba estadstica de la


distribucin normal (Z) porque n>=32.

Utilidades en cientos de S/. Utilidades en cientos de S/.


Nro. Nro.
Establec.Com. Establec.Com. Establec.Com. Establec.Com.
Tienda PUNO JULIACA Tienda PUNO JULIACA

1 62 79 42 49 80
2 60 79 43 55 59
3 62 63 44 52 62
4 50 70 45 62 60
5 49 71 46 59 72
6 45 60 47 58 70
7 59 65 48 57 81
8 53 58 49 63 71
9 51 64 50 52 77
10 50 75 51 60 67
11 53 85 52 59 62
12 55 74 53 61 70
13 55 70 54 64 60
14 60 58 55 47 81
15 49 62 56 64 62
16 53 67 57 47 79
17 61 67 58 64 74
18 54 73 59 59 61
19 48 79 60 48 67
20 51 64 61 50 65
21 57 82 62 64 79
22 61 65 63 59 77
23 58 83 64 59 67
24 51 66 65 53 67
25 56 64 66 51 76
26 45 85 67 63 60
27 60 62 68 58 64
28 53 69 69 53 74
29 48 65 70 60 72

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 111

30 49 75 71 51 84
31 53 68 72 51 84
32 60 80 73 70
33 64 63 74 66
34 63 58 75 82
35 50 60 76 72
36 59 81 77 62
37 54 70 78 58
38 50 65 79 76
39 51 69 80 85
40 51 70 Prom. 55.2916667 70.0375
41 56 65 Var. 29.0827465 62.390981

1. PLANTEAMIENTO DE HIPOTESIS
Ho : Promedio de las utilidades netas semanales en cientos de soles de los
Ho : A = B
establecimientos comerciales de Puno = Promedio de las utilidades netas
semanales en cientos de soles de los establecimientos comerciales de
Juliaca (Hiptesis nula)
H1 : Promedio de las utilidades netas semanales en cientos de soles de los

H1 : A B establecimientos comerciales de Puno Promedio de las utilidades netas


semanales en cientos de soles de los establecimientos comerciales de
Juliaca (Hiptesis alterna)

2. FIJAR EL NIVEL DE SIGNIFICANCIA ( )

Se puede tomar niveles de significancia dependiendo con qu nivel de confianza se


concluir, los ms utilizados son:
= 0.05 de nivel de significancia (95 % de nivel de confianza)
= 0.10 de nivel de significancia (90 % de nivel de confianza)
= 0.01 de nivel de significancia (99 % de nivel de confianza)
En funcin a este valor ( = 0.05) se busca en la tabla estadstica el valor de Zt = 1,96

3. REGLA DE DECISION UTILIZANDO


(Zc= Z calculada y Zt= Z tabulada o de tabla)

Si Zc > Zt Se rechaza la Ho (Hiptesis nula) y se Acepta la H1 (Hiptesis Alterna)

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 112

4. CALCULO DE Zc SEGN LA FORMULA

XA XB 55.2916667 70.0375
Zc 13.552753
S A2 S B2 29.0827465 62.390981


n A nB 72 80

BUSQUEDA DE Zt DE TABLA CON nivel de significancia


si = 0.05 ==> Zt = Z0.05 = 1.96 (95% de nivel de confianza)
si = 0.10 ==> Zt = Z0.10 = 1.645 (90% de nivel de confianza)
si = 0.01 ==> Zt = Z0.01 = 2.575 (99% de nivel de confianza)

5. DECISION:
Como Zc = 13.552753 > Zt =1.96 , Se rechaza la Ho y se Acepta la H1, ENTONCES significa
que SI EXISTE diferencia significativa entre Promedio de las utilidades netas
semanales en cientos de soles de los establecimientos comerciales de Puno con
el Promedio de las utilidades netas semanales en cientos de soles de los
establecimientos comerciales de Juliaca para un nivel de significancia 0.05; 0.10 y
0,01 un nivel de confianza del 95%, 90% y 99 % respectivamente.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 113

CORRELACIN DE PEARSON

Este indicador es utilizado para medir la relacin existente entre dos variables cuantitativas en
estudio. Se utiliza la distribucin T (T-Student) cuando n<32, y Z (Distribucin
Normal) cuando n>=32. Los pasos a seguir para este tipo de pruebas de hiptesis son los
siguientes:

PRUEBA de HIPTESIS.
Las hiptesis son planteadas del siguiente modo:

H0: 0 No existe grado de correlacin o dependencia entre las variables en estudio

H1: 0 Existe algn grado de correlacin o dependencia entre las variables en estudio

NIVEL de SIGNIFICANCIA.
Se usar un nivel significancia entre el 1 % y el 10 %, cuando no se precisa este nivel,
se asume un nivel de significancia del 5 % (Es el ms recomendado y es equivalente a
un 95% de nivel de confianza) , es decir = 0,05 y una Tt (T tabulada o de tabla) con n-
2 grados de libertad. (n es el nmero de datos sumado de las dos variables es decir
n=nA+nB)

PRUEBA ESTADSTICA.
Se usar la distribucin Tt con n-2 grados de libertad.

n n
X i Yi
X iYi i 1 i 1
n

n
r i 1
2 2

n
n

Xi Yi
i 1 i 1
n n

X
i 1
i
2

n
Y
i 1
i
2

r
n2 Zc
Tc r 1 r 2
1 r2
n2

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 114

Donde:
Tc : T calculada.
n : Tamao de muestra.
r : Coeficiente de correlacin.
Y : Variable dependiente.
X : Variable independiente.

REGLA DE DECISIN.
Si Tc > Tt. entonces se rechazar H0; Si Zc > Zt. entonces se rechazar H0,

CONCLUSIN.
Se compara el valor Tc (T calculado) es mayor que T (T tabulada o de tabla) se
rechaza la Ho y se acepta H1, esto significa que Existe algn grado de
correlacin o dependencia entre las variables en estudio.

Ejemplo 1:
Se tiene los siguientes resultados de la investigacin: FUNCIONALIDAD
FAMILIAR Y AUTOESTIMA EN LOS ESTUDIANTES DEL INSTITUTO SUPERIOR
PEDAGOGICO PUBLICO PUNO 2014, con una muestra de 10 estudiantes,
determinar si existe o no algn grado de correlacin o dependencia entre estas
dos variables en estudio para un nivel de significancias de 0.05

PRUEBA
FUNCIONALIDAD AUTOESTIMA
Xi * Yi Xi Yi
FAMILIAR ( Xi ) ( Yi )
1 14 10 140 196 100
2 12 11 132 144 121
3 16 14 224 256 196
4 14 12 168 196 144
5 13 11 143 169 121
6 14 10 140 196 100
7 17 13 221 289 169
8 19 16 304 361 256
9 13 10 130 169 100
10 12 12 144 144 144
144 119 1746 2120 1451

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 115

1. PRUEBA de HIPTESIS.
H0: 0 No existe grado de correlacin o dependencia entre la autoestima y la
funcionalidad familiar. (HIPTESIS NULA)
H1: 0 Existe algn grado de correlacin o dependencia entre la autoestima y
la funcionalidad familiar. (HIPTESIS ALTERNA)
2. NIVEL de SIGNIFICANCIA.
= 0,05 (5%) nivel de significancia del equivalente a un 95% de nivel de confianza

3. PRUEBA ESTADSTICA.
Se usar la distribucin Tt (T tabulada o T de tabla) con n-2 grados de libertad.
Tt (18 G.L., =0.05) = 2.1009
n
n n
n X iYi X i Yi
r i 1 i 1 i 1
2 2
n
n n
n
n X i2 X i n Yi 2 Yi
i 1 i 1 i 1 i 1

10(1746 ) (144)(119)
r 0.80514353
10(2120 ) 144 2 10(1451) 119 2

n2 20 2
Tc r 0.80514353 5.75965238
1 r 2
1 0.80514353 2

4. REGLA DE DECISIN.
Si Tc > Tt. entonces se rechazar H0,

5. CONCLUSIN.
Como Tc = 5.75965238, es mayor que Tt = 2.1009, se rechaza la H0 (Hiptesis
Nula) y se acepta H1 (Hiptesis Alterna), esto significa que Existe algn grado
de correlacin o dependencia entre la autoestima y la funcionalidad familiar,
para un nivel de confianza de 95% con un nivel de significancia 5% 0.05.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 116

Ejemplo 2. Realizar una prueba de hiptesis y determinar si existe o no RELACION


entre la variable Y que representa (Ventas miles de S/.) y X (N pedidos de material de
escritorio) de una entidad pblica, para un nivel de confianza del 95%

pedido (X) venta (Y) Xi * Yi Xi Yi


1 110 1870 205700 12100 3496900
2 139 2201 305939 19321 4844401
3 150 2550 382500 22500 6502500
4 133 2261 300713 17689 5112121
5 117 1234 144378 13689 1522756
6 135 2295 309825 18225 5267025
7 155 2635 408425 24025 6943225
8 153 2601 397953 23409 6765201
9 153 1920 293760 23409 3686400
10 135 2740 369900 18225 7507600
11 105 1785 187425 11025 3186225
12 138 2346 323748 19044 5503716
1623 26438 3630266 222661 60338070

1. PRUEBA de HIPTESIS.
H0: 0 No existe grado de relacin entre las ventas y el pedido de material de
escritorio de una entidad pblica. (HIPTESIS NULA)
H1: 0 Existe algn grado de relacin entre las ventas y el pedido de material
de escritorio de una entidad pblica. (HIPTESIS ALTERNA)

2. NIVEL de SIGNIFICANCIA.
= 0,05 (5%) nivel de significancia del equivalente a un 95% de nivel de confianza

3. PRUEBA ESTADSTICA.
Se usar la distribucin Tt (T tabulada o T de tabla) con n-2 grados de libertad.
Tt (22 G.L., =0.05) = 2.0739
n
n n
n X iYi X i Yi
r i 1 i 1 i 1
2 2
n
n n
n
n X i
2
Xi n Yi Yi
2

i 1 i 1 i 1 i 1

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 117

12(3630266 ) (1623)(26438 )
r 0.671868211
12(222661) 1623 2
12(60338070 ) 26438 2

n2 24 2
Tc r 0.671868211 4.254712907
1 r 2
1 0.671868211 2

4. REGLA DE DECISIN.
Si Tc > Tt. entonces se rechazar H0,

5. CONCLUSIN.
Como Tc = 4.254712907, es mayor que Tt = 2.0739, se rechaza la H0 (Hiptesis
Nula) y se acepta H1 (Hiptesis Alterna), esto significa que Existe algn grado
de relacin o dependencia entre las ventas y los pedido de material de
escritorio de una entidad pblica, para un nivel de confianza de 95% con un
nivel de significancia 5% 0.05.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 118
Ejemplo 3: Dada la siguiente informacin determinar si existe influencia significativa entre la
ACTITUD DOCENTE Y LA IMPLEMENTACIN DEL PROYECTO CURRICULAR REGIONAL en la IES
Industrial 32 Puno 2014

IMPLEMENTACION del
IMPLEMENTACION del
ACTITUD DOCENTE ACTITUD DOCENTE

MOTIVACIONAL

MOTIVACIONAL
CONDUCTUAL

CONDUCTUAL
AFECTIVA

AFECTIVA
P.C.R.

P.C.R.
TOTAL

TOTAL
1 12 12 12 36 26 35 8 13 10 31 25
2 12 13 9 34 30 36 7 10 7 24 22
3 8 9 5 22 21 37 4 4 3 11 15
4 8 12 9 29 26 38 7 5 2 14 10
5 5 9 9 23 27 39 11 13 11 35 24
6 8 8 9 25 22 40 12 12 10 34 27
7 14 16 10 40 33 41 8 10 9 27 23
8 12 15 10 37 29 42 12 12 9 33 24
9 8 8 5 21 16 43 12 12 9 33 25
10 8 7 9 24 18 44 6 9 8 23 20
11 8 9 6 23 19 45 10 10 8 28 22
12 12 14 12 38 34 46 8 10 6 24 26
13 14 14 11 39 29 47 14 14 9 37 32
14 10 10 8 28 27 48 10 13 9 32 25
15 3 5 8 16 19 49 12 16 11 39 28
16 4 5 6 15 13 50 9 11 11 31 18
17 6 5 5 16 14 51 10 11 10 31 25
18 10 10 9 29 23 52 6 10 9 25 27
19 13 14 9 36 30 53 13 12 9 34 28
20 10 12 7 29 28 54 10 9 8 27 21
21 8 9 7 24 25 55 10 6 7 23 17
22 13 16 12 41 36 56 7 8 7 22 16
23 10 10 9 29 23 57 9 10 7 26 27
24 13 11 10 34 26 58 12 12 9 33 31
25 6 9 5 20 20 59 12 12 11 35 28
26 12 13 9 34 22 60 4 6 4 14 15
27 10 9 7 26 21 61 11 12 11 34 31
28 10 11 9 30 27 62 9 10 7 26 16
29 12 12 10 34 30 63 9 10 7 26 27
30 4 1 3 8 9 64 12 12 9 33 31
31 9 7 3 19 13 65 12 12 11 35 28
32 8 9 9 26 25 66 10 10 4 24 18
33 4 8 7 19 19 67 11 12 11 34 31
34 14 11 10 35 29

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 119

1. PRUEBA de HIPTESIS.
H0: 0 No Existe influencia significativa entre la ACTITUD DOCENTE Y LA
IMPLEMENTACIN DEL PROYECTO CURRICULAR REGIONAL en la IES
Industrial 32 Puno 2013.
Ha: 0 Si Existe influencia significativa entre la ACTITUD DOCENTE Y LA
IMPLEMENTACIN DEL PROYECTO CURRICULAR REGIONAL en la IES
Industrial 32 Puno 2013.

2. NIVEL de SIGNIFICANCIA.
Se us un nivel de significancia = 0,05. Que es equivalente a 95% de nivel de
confianza. Cuyo valor de tabla de la Distribucin Normal es Zt = 1.96

4. PRUEBA ESTADSTICA.
Se calcul el coeficiente de correlacin mediante la siguiente formula con los
datos del anexo 01:

n n
X i Yi
X iYi i 1 i 1
n

n
r i 1
2 2
n n
Xi Yi
i 1 i 1
n n

X
i 1
i
2

n
Y
i 1
i
2

r = 0,856659868747961
Donde:
n : Tamao de muestra.
r : Coeficiente de correlacin.

Y : Variable dependiente.
X : Variable independiente.

Para contrastar las hiptesis se us la distribucin Normal: para la Zt con n-2


grados de libertad (Extrada de la tabla estadstica). Y la Zc se calcula con la
siguiente frmula:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 120

r
Zc
1 r 2
n2

Zc = 19,0785477731842
Donde:
Zc : Z calculada.
n : Tamao de muestra.
r : Coeficiente de correlacin.

5. REGLA DE DECISIN.
Si Zc > Zt. Entonces se rechazar H0,
Como Zc = 19,07855 > Zt = 1.96, Entonces se Rechaza la H0., Es decir que Si Existe
influencia significativa entre la ACTITUD DOCENTE Y LA IMPLEMENTACIN DEL
PROYECTO CURRICULAR REGIONAL en la IES Industrial 32 Puno 2013, Para un
nivel de significancia = 0,05 para un 95% de nivel de confianza.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 121

PRUEBA DE DIFERENCIA DE 2 A MAS TRATAMIENTOS (F de Fisher)

1) PLANTEAMIENTO DE HIPOTESIS
H0: (No existe diferencia entre las variables en estudio).
H1: (Existe diferencia entre las variables en estudio).

2) NIVEL DE SIGNIFICANCIA
= 0,05 nivel de significancia (1-=1-0,05=0,95==> 95% de nivel de confianza)

3) REGLA DE INFERENCIA:
si Fc > F[t-1,t(r-1)], Se rechaza la Ho
t=2 = NRO DE VARIABLES , r=NRO DATOS
4) ANDEVA (Anlisis de Varianza)
G.L. S.C. C.M. Fc.
Grados de Suma de Cuadrados F-Fisher

Fuentes de Variabilidad libertad cuadrados medios Calculado

Entre Tratamientos t-1 A A/(t-1) = E E/F

Dentro Trat.(Err.Exp) t(r-1) B B/(t(r-1)) = F


TOTAL tr-1 A+B

SC.trat.
2 2
X i. X 2 .. X i.
SC.Error X 2
ij
r rt r

X 2 ..
SC.tot X 2ij
rt Opcional
SC error = SC tot - SC trat
CM trat = SC trat / GL trat
CM error = SC error / GL error
Fc = CM trat / CM error

5) DECISION
Si se comprueba que el valor Fc (F calculado), es mayor que Ft (F tabulada o de tabla) se
rechaza la H0 (Hiptesis Nula) y se acepta H1 (Hiptesis Alterna), esto significa que Existe
diferencia entre las variables en estudio. En caso contrario se acepta la Ho (Hiptesis Nula) lo
que significara que No Existe diferencia entre las variables en estudio. Todo ello con un nivel
de confianza de 95%, 90% 99%, segn el (nivel de significancia) utilizado.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 122

Ejemplo:
SE TIENE LOS SIGUIENTES RESULTADOS DE UNA EVALUACION APLICADA A 10 ESTUDIANTES
SOBRE CULTURA GENERAL(Evaluacin de entrada) Y LUEGO DE UNA CAPACITACION
(Evaluacin de salida), DETEMINAR SI EXISTE O NO DIFERENCIA SIGNIFICTIVA ENTRE ESTAS
PRUEBAS EN ESTUDIO para un nivel de significancia DE 0.05

PRUEBA
ENTRADA SALIDA
Xi Yi
(Xi) (Yi)
10 14 100 196
11 12 121 144
14 16 196 256
12 14 144 196
11 13 121 169
10 14 100 196
13 17 169 289
16 19 256 361
10 13 100 169
12 12 144 144
119 144 1451 2120

X.. = 119+144=263 t= 2
X2ij = 1451+2120=3571 r = 10

1) PLANTEAMIENTO DE HIPOTESIS

H0: No existe diferencia entre la Evaluacin de entrada y la Evaluacin de salida.


H1: Si existe diferencia entre la Evaluacin de entrada y la Evaluacin de salida.

2) NIVEL DE SIGNIFICANCIA
= 0,05 de nivel de significancia (95% de nivel de confianza)
= 0,01 de nivel de significancia (99% de nivel de confianza)
= 0,10 de nivel de significancia (90% de nivel de confianza)

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 123

3) REGLA DE INFERENCIA:
si Fc > F[t-1,t(r-1)], Se rechaza la Ho

F tabulada (de tabla)


F[1,18],0.05 = 4,413863
F[1,18],0.01 = 8,285497

4) ANLISIS DE VARIANZA

SC.trat.
2
X i. X 2 .. X 2 ..
SC.tot X ij 2

r rt rt

119 2 144 2 263 2 263 2


SC.trat. 31.25 SC.tot 3571 112.55
10 10(2) 10(2)

ANDEVA
Fuentes de Variabilidad G.L. S.C. C.M. Fc.
Entre Tratamientos 1 31.25 31.25 6.918819188
Dentro Trat.(Err.Exp) 18 81.3 4.516666667
TOTAL 19 112.55

5) DECISION:
Como Fc =6.919 > Ft, 0,05 = 4,414 Entonces, Se rechaza la H0, para un nivel de sig. 0,05, aceptndose H1,
es decir que EXISTE diferencia entre la PRUEBA DE ENTRADA Y LA PRUEBA DE SALIDA, para nivel de
confianza del 95%, Sin embargo como Fc=6.919 < Ft, 0,01 = 8,2855 NO EXISTE diferencia entre la
autoestima y la funcionalidad familiar para un nivel de confianza del 99%

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 124

Ejemplo: Supongamos que una compaa manufacturera ha comprado 03 mquinas


(A1, A2 y A3) de produccin de diferentes marcas se desea determinar si una de ellas es
ms rpida que las otras al producir un cierto bien. Se observa los resultados de 5 hrs.
de produccin en forma aleatoria para cada mquina y se obtiene los siguientes
resultados, Probar si existe diferencias entre las 3 mquinas para un nivel de
significancia = 0.05

REPETICIONES
Tratamientos 1 2 3 4 5 Xi. Prom.Xi Sum Xi.^2 Xi.2
A1 25 30 36 38 31 160 32 5226 25600
A2 31 39 38 42 35 185 37 6915 34225
A3 24 30 28 25 28 135 27 3669 18225
SUM 480 15810 78050

1. Planteamiento de hiptesis:
Ho (Hiptesis nula) : A1 = A2 = A3
H1 (Hiptesis alterna) : al menos alguno es diferente

2. Nivel de significancia:
= 0,05 nivel de significancia 95% de nivel de confianza

3. Prueba Estadstica:
Se establece el punto y la regin crtica o regin de rechazo o aceptacin
Si Fc > F[t-1,t(r-1)], Se rechaza la Ho
F[2,12],0.05 = 3.88529

SC.trat.
X 2
i.

X 2 .. 160 2 185 2 135 2 480 2
250
r rt 5 5(3)

X 2 .. 480 2
SC.tot X 2
ij 15810 450
rt 5(3)

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 125

t= 3
ANVA (Anlisis de varianza) r= 5
Fuentes de Variabilidad G.L. S.C. C.M. Fc.
Entre Tratamientos t-1 2 250 125 7.5
Dentro Trat.(Error Exp.) t(r-1) 12 200 16.6666667
TOTAL tr-1 14 450

SC error = SC tot - SC trat


CM trat = SC trat / GL trat
CM error = SC error / GL error
Fc = CM trat / CM error

5. DECISION
Como Fc = 7.5 > Ft =3.88529, Se rechaza la Hiptesis Nula(Ho) y se acepta la Hiptesis alterna (H1)
Esto implica que al menos alguna marca de las maquinas tiene diferente produccin
despus de 5 hrs. para un nivel de significancia 0,05 un nivel de confianza del 95%

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 126

LA DISTRIBUCIN JI-CUADRADO

La distribucin ji-cuadrado tiene muchas aplicaciones en inferencia estadstica, por


ejemplo en la denominada prueba utilizada como prueba de independencia y como
prueba de bondad de ajuste y en la estimacin de varianzas. Tambin est involucrada
en el problema de estimar la media de una poblacin normalmente distribuida y en el
problema de estimar la pendiente de una recta de regresin lineal, a travs de su
papel en la distribucin t de Student, y participa en todos los problemas de anlisis de
varianza, por su papel en la distribucin F de Snedecor, que es la distribucin del
cociente de dos variables aleatorias de distribucin ji-cuadrado e independientes.

La distribucin Ji cuadrada se utiliza para establecer la relacin de dos variables


cualitativas

Ejemplo 1. De una muestra de 185 profesionales del rea de Administracin y


Contabilidad del Municipio de Lima, Se desea saber si la especialidad y/o desempeo
en el rea de (Financiera, Tributaria y Gubernamental) est relacionado con el gnero
(varones y mujeres). La tabla de contingencia presenta las siguientes frecuencias
observadas. Hacer la prueba de hiptesis para un nivel de confianza del 95%.

ESPECIALIADAD Y/O DESEMPEO Total


GENERO Financiera Tributaria Gubernamental
Varones 47 38 29 114
Mujeres 41 21 9 71
Total 88 59 38 185

Si la especialidad y/o desempeo en el rea de (Financiera, Tributaria y


Gubernamental) no est relacionado con el gnero se espera el mismo porcentaje de
Varones que de mujeres en cada especialidad y/o desempeo en el rea de
(Financiera, Tributaria y Gubernamental). La tabla de frecuencias esperadas es:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 127

Financiera Tributaria Gubernamental Total


Varones (88)(114)/185 (59)(114)/185 (38)(114)/185 114
Mujeres (88)(71)/185 (59)(71)/185 (38)(71)/185 71
Total 88 59 38 185

Financiera Tributaria Gubernamental Total


Varones 54.227027 36.3568 23.4162 114
Mujeres 33.772973 22.6432 14.5838 71
Total 88 59 38 185

(Es importante observar que los totales no cambian). La frecuencia esperada se


encuentra en la segunda tabla.

Es posible decir que mientras ms cercanas sean las frecuencias observadas (f o) a las
frecuencias esperadas, ms seguro se puede estar de que el gnero y la especialidad
y/o desempeo en el rea (Financiera, Tributaria y Gubernamental) son
independientes uno del otro. En otras palabras, es posible esperar los mismos
porcentajes de Varones que de mujeres en cada nivel de la especialidad y/o
desempeo en el rea. La frmula que indica cuanto se parecen las frecuencias
esperadas a las observadas es la estadstica x2.

( fo fe )2
La frmula para hallar la Chi cuadrada (X2) calculada es: x
2
c
fe

fo fe fo - fe (fo - fe)2 (fo - fe)2/fe


47 54.2270 -7.2270 52.2299 0.9632
38 36.3568 1.6432 2.7002 0.0743
29 23.4162 5.5838 31.1786 1.3315
41 33.7730 7.2270 52.2299 1.5465
21 22.6432 -1.6432 2.7002 0.1193
9 14.5838 -5.5838 31.1786 2.1379
185 185 Ji-cuadrada ==> 6.172590369

LUEGO DECIMOS QUE : X2 (Calculada) = 6.172590369

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 128

Para determinar si esta estadstica es demasiado grande se utiliza la tabla de la


distribucin. Si cae en la zona de rechazo, la conclusin es que las dos variables estn
relacionadas

X2 (TABULADA) = X2(n-1)(m-1),0.05= X2(3-1)(2-1),0.05= X22, 0.05=5.9915

PRUEBA DE HIPOTESIS PARA LA JI CUADRADA


1) Prueba de Hiptesis:
Ho: No hay relacin o asociacin entre el gnero y el aprovechamiento en
matemticas en la poblacin.

H1: SI hay relacin o asociacin entre el gnero y el aprovechamiento en


matemticas en la poblacin.

2) Nivel de significacin ; = 0.05 (5% de nivel de significancia) equivalente a 95%


de nivel de confianza.

3) Prueba estadstica:
Se utiliza la prueba X2 (Chi cuadrada) de independencia con (n-1)(m-1) grados de
libertad donde n es el nmero de columnas y m el nmero de filas. Valores crticos
para las zonas de rechazo y de no rechazo. En este caso X 2 para = 0.05 y 2 g.l., el
valor crtico es 5.9915.

4) Decisin:

Como X2C =6.172590369 X2t =5.9915, Entonces se rechaza Ho (hiptesis nula). Esto
significa que el genero est RELACIONADO con el aprovechamiento en matemticas
para un nivel de significancia de =0.05 ( 95% de nivel de confianza).

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 129

REGRESIN LINEAL

La palabra Regresin proviene del latn regresio: regreso, vuelta, retroceso.

En nuestro entorno encontramos muchos eventos que estn relacionados


entre s, en trminos de dos o ms variables, como por ejemplo: la
metodologa de enseanza influye en el nivel de rendimiento acadmico del
alumno.

Los datos univariantes se presentan cuando en una poblacin o muestra se


mide slo una variable en cada uno de los individuos o sujetos que integran el
conjunto bajo estudio. Los datos bivariantes se presentan cuando en una
poblacin o muestra se miden simultneamente dos variables en cada uno de
los individuos o sujetos que integran el conjunto o subconjunto bajo estudio.
Algunos ejemplos de datos variantes son: la estatura y el peso de varones
adultos, el coeficiente de inteligencia y el rendimiento acadmico de los
alumnos.

Como ejemplo de datos bivariantes tenemos:


POSIBLES RELACIONES BIVARIANTES
Variable 1 (X) Variable 2 (Y)
Horas de estudio Rendimiento acadmico
Edad Peso
Clima Produccin de quinua
Habilidad verbal Calificacin en un examen
Nmero de hijos en la familia Consumo familiar
Coeficiente de inteligencia Rendimiento acadmico
Nmero de hermanos Consumo familiar
Estado emocional Aprendizaje
Alimentacin Rendimiento fsico
Dilogo con los padres Personalidad del nio

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 130

Regresin Lineal Simple.


El anlisis de regresin se encarga de descubrir la relacin funcional entre dos
o ms variables. Cuando se estudian solamente dos variables la metodologa a
utilizar se conoce como anlisis de regresin simple, en tanto que si se trata
de tres o ms variables el anlisis regresional es mltiple. El anlisis de
regresin puede ser lineal o no lineal.

Anlisis de regresin lineal.


Es la relacin que existe entre dos variables, la misma que est definida en una
funcin expresada en trminos de una ecuacin de una lnea recta, tal como se
muestra en el siguiente grfico:

Anlisis de regresin no lineal.


Es la relacin que existe entre dos variables, la misma que est definida por
una ecuacin polinomial de grado avanzado. Estas ecuaciones no lineales
producen curvas cuadrticas, hiperblicas, parablicas, cbicas, etc., tal
como se muestra en el siguiente grfico:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 131

Modelo Regresional.

La variable Y se conoce como la variable dependiente, endgena o predicha, en


tanto que la variable X es llamada variable independiente, exgena o
predictora. La magnitud de Y depende de la magnitud de X, y por lo tanto
puede predecirse en base al valor que asuma la variable independiente.

El anlisis regresional permite expresar la relacin entre las variables X y Y


mediante una ecuacin matemtica.

El modelo matemtico poblacional est representado por:


Yi X i i
Donde:
: Parmetro poblacional, intercepto
: Parmetro poblacional, pendiente de la recta
Yi : Variable dependiente
Xi : Variable independiente
i : Error poblacional

El modelo matemtico muestral est representado por: Yi X i ei

Donde:
: Estimador muestral, intercepto

: Estimador muestral, pendiente de la recta


Yi : Variable dependiente
Xi : Variable independiente
ei : Error muestral

El modelo estimado de la recta de regresin muestral se define del siguiente

modo: Yi X i

Donde: ei Yi Yi

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 132

En la expresin anterior y son los coeficientes de regresin, son valores


desconocidos que debern ser determinados matemticamente. Cuando se
estiman los valores de los coeficientes de regresin, es posible calcular los
valores predictivos de Y para determinados valores de X, mediante la
sustitucin apropiada en la ecuacin de regresin muestral.

Esta ecuacin de regresin sera el medio de prediccin que se usara para


predecir los valores de Y correspondientes a los valores de X. Grficamente se
representa del siguiente modo:

Para estudiar la regresin de Y en X contamos con el modelo de regresin


lineal simple que se basa en los siguientes supuestos.

a) La variable independiente X tiene valores que son preestablecidos por el


equipo de investigadores. Esto implica que solamente Y, la variable
dependiente, es una variable aleatoria y que X no vara aleatoriamente sino
que est bajo el control de los investigadores.

b) El valor de la variable aleatoria Y depende en cierto grado del valor de la


variable independiente X.

c) La relacin que media entre X e Y se puede describir adecuadamente


mediante una ecuacin lineal cuya representacin geomtrica es una lnea
recta. Los valores paramtricos de la variable Y son funcin de la variable X.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 133

En el estudio de modelos de regresin se presentan dos casos:

1. Recta ascendente (creciente)


En este tipo de modelo de regresin, se observa que ambas variables
tienen una relacin directa, es decir si una variable aumenta la otra
tambin aumenta y si una variable disminuye la otra tambin disminuye.

Como por ejemplo:


X : Horas dedicadas al estudio
Y : Rendimiento acadmico

La grfica tiene la siguiente forma:

Este grfico se puede entender del siguiente modo: Mientras el alumno le


dedique menos horas al estudio, su rendimiento ser deficiente; pero si el
alumno le dedica ms horas al estudio, su rendimiento ser satisfactorio o
mejor.

2. Recta descendente (decreciente)


En este tipo de modelo de regresin, se observa que ambas variables
tienen una relacin inversa, es decir si una variable aumenta la otra
disminuye y si una variable disminuye la otra aumenta.

Como por ejemplo:

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 134

X : Horas dedicadas al vicio


Y : Rendimiento acadmico
La grfica tiene la siguiente forma:

Este grfico se puede entender del siguiente modo: Mientras el alumno le


dedique menos horas al vicio, su rendimiento ser satisfactorio; pero si el
alumno le dedica ms horas al vicio, su rendimiento ser deficiente o
peor.

Determinacin de la ecuacin de regresin.


La regresin entre dos variables cuantitativas debe ser definida usando mtodos
que ofrezcan mayor precisin que la ofrecida mediante la utilizacin de los
diagramas de dispersin.

Los estimadores del modelo de regresin son los siguientes:

n n n
n X iYi X i Yi
i 1 i 1 i 1
2
n
n
n X X i
i
2

i 1 i 1

Y X

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 135

Ejemplo 01:
Los siguientes datos muestran los gastos invertidos en publicidad
(en miles de soles) (Xi) y las ventas obtenidas (en cientos) de vehculos (Yi) de
7 tiendas sucursales del Per. Hallar el modelo de regresin lineal y Estimar
la venta de vehculos para cuando una Empresa invierta S/.8000 y S/.10000
en gastos de publicidad.

Nro. Gastos.(X) Venta de(Y)


1 4 2,5
2 5 3,2
3 7 7,5
4 9 8,4
5 12 10,2
6 15 14,5
7 18 19,8

a) Estimando el modelo de regresin lineal.


Para encontrar el modelo se realizar los siguientes clculos:
Nro. X Y Xi*Yi Xi Y.est (Yest. - Yprom.) (Yi - Yprom.)
1 4 2,5 10 16 2,51358885 48,01475907 48,20326531
2 5 3,2 16 25 3,668466899 33,34358269 38,97326531
3 7 7,5 52,5 49 5,978222997 12,00368977 3,774693878
4 9 8,4 75,6 81 8,287979094 1,333743308 1,08755102
5 12 10,2 122,4 144 11,75261324 5,33497323 0,573265306
6 15 14,5 217,5 225 15,21724739 33,34358269 25,57469388
7 18 19,8 356,4 324 18,68188153 85,35957168 107,2704082
Tot. 70 66,1 850,4 864 66,1 218,7339024 225,4571429
Prom. 10 9,44285714

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 136

Calculando el estimador tenemos:


n n n
n X iYi X i Yi
i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i1

7(850,4) (70)(66,1)
1,15487805
7(864) (70)2

Calculando el estimador tenemos:

Y X
66,1 70
(1.154778049 ) 2.105923345
7 7
Entonces la ecuacin de regresin lineal es:

i = -2.105923345 + 1,154878049 Xi

Este modelo nos servir para hacer las predicciones de las ventas obtenidas (en
cientos de soles) de vehculos (Y) para los diferentes gastos invertidos (en miles de
soles) (X).

Al interpretar estos resultados es conveniente recordar que la razn esencial que


motiv el clculo de la ecuacin de regresin es poder usar esta para establecer
estimados o proyecciones de los valores de la variable dependiente Y. As por
ejemplo podra interesarnos predecir el valor de Y asociado con un valor particular
de X.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 137

Estimar la venta de vehculos para cuando una Empresa invierta S/.8000 y


S/.10000. en gastos de publicidad..

Para responder a esta pregunta, se requiere la sustitucin del valor de X = 8 y 10


respectivamente en los trminos de la ecuacin de regresin.

i = -2.105923345 + 1,154878049 Xi

8 = -2.105923345 + 1,154878049 (8) = 7,133101045


10 = -2.105923345 + 1,154878049 (10) = 9,442857143

Se estima que la venta de vehculos para cuando una Empresa invierta S/.8000 en
gastos de publicidad, obtendr una venta de 713 vehculos, con un coeficiente de
determinacin de 97,02%

Se estima que la venta de vehculos para cuando una Empresa invierta S/.10000 en
gastos de publicidad, obtendr una venta de 944 vehculos, con un coeficiente de
determinacin de 97,02%

NOTA:
Para realizar la prediccin, es necesario cumplir las siguientes condiciones:
El coeficiente de correlacin(r =(R2)1/2), sea mayor o igual a 0,80.
El error estndar del estimador que sea cercano a cero.
Que se cumplan los supuestos del anlisis de regresin.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 138

Coeficiente de Determinacin (R2).

R2 nos indica la cantidad de mejoramiento en trminos de reduccin del error


total gracias al uso de la recta de regresin y se dice que mide la bondad de
ajuste. R2 Representa la reduccin relativa de la suma de cuadrados total gracias
al uso de la recta de regresin. Por Ejemplo si: R2 = 0,80 significa que hubo con una
reduccin del 80% de la suma de cuadrados total. Si R2 =1 indica que la reduccin
de la suma de cuadrados del error total fue del 100%. Lo que nos dice que el error

Yi - Yi = 0, para todo i y que todos los puntos estn sobre la recta de regresin.

En las siguientes grficas se muestra diferentes valores del coeficiente de


determinacin:

R2 = 1 0,8 R2 < 1

0,5 R2 < 0,8 0,3 R2 < 0,5

0 < R2 < 0,3 R2 = 0

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 139

y
n
2
i Y
suma _ de _ cuadrados _ de _ error _ exp licado
R2 i 1

y
n
2 suma _ de _ cuadrados _ de _ error _ total
i Y
i 1

Donde : 0 R2 1

De nuestro ejemplo:

y
n
2
i Y
218,733902 4
R2 i 1
0,970179519 97,02%
y
n
2 225,457142 9
i Y
i 1

Observamos que hay una bondad de ajuste (de la recta de regresin con los datos
originales) del 97,02% lo que implica que el ajuste es muy bueno.

Ejemplo 02.
Los siguientes datos corresponden al tiempo de estudio en hrs. (Xi) empleado
semanalmente por 10 estudiantes y el reflejo de sus respectivas calificaciones (Yi)
obtenidas en una Escuela Profesional de la Universidad. Hallar el modelo lineal y
estimar para cuando se estudie 5 y 15 hrs., Cules seran las calificaciones que
pueden obtener?

Nro. Hrs.(X) Calific.(y)


1 6 10
2 6 10
3 7 10
4 7 10
5 8 12
6 9 12
7 9 13
8 12 14
9 12 16
10 14 18
Tot. 90 125
Prom. 9 12,5

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 140

Procediendo con los clculos:


Nro. Hrs.(X) Calific.(y) Xi * Yi Xi Y.est (Yest. - Yprom.) (Yi - Yprom.)
1 6 10 60 36 9,585714286 8,493061224 6,25
2 6 10 60 36 9,585714286 8,493061224 6,25
3 7 10 70 49 10,55714286 3,774693878 6,25
4 7 10 70 49 10,55714286 3,774693878 6,25
5 8 12 96 64 11,52857143 0,943673469 0,25
6 9 12 108 81 12,5 0 0,25
7 9 13 117 81 12,5 0 0,25
8 12 14 168 144 15,41428571 8,493061224 2,25
9 12 16 192 144 15,41428571 8,493061224 12,25
10 14 18 252 196 17,35714286 23,59183673 30,25
Tot. 90 125 1193 880 125 66,05714286 70,5

Calculando el estimador tenemos:


n n n
n X iYi X i Yi
i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i1

10(1193) (90)(125)
0,971428571
10(880) (90) 2

Calculando el estimador tenemos:

Y X
12,5 (0,971428571 )(9) 3,75714285 7

Entonces la ecuacin de regresin lineal es:


i = 3,757142857 + 0,971428571 Xi

Este modelo nos servir para hacer las predicciones para las calificaciones que
puedan obtener (Y) segn el tiempo de estudio empleado semanalmente (X).

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 141

Y
n 2
Coeficiente de Determinacin: i Y
i 1
R2 0,93698075
Y Y
n
2
i
i 1

Estimar la calificacin de los estudiantes para cuando el estudiante emplee 5 y 15


hrs. De estudio

Para responder a esta pregunta, se requiere la sustitucin del valor de X i = 5 y 15


respectivamente en los trminos de la ecuacin de regresin.
i = 3,757142857 + 0,971428571 Xi

5 = 3,757142857 + 0,971428571 (5) = 8,614285714


15 = 3,757142857 + 0,971428571 (15) = 18,32857143

Se estima que, cuando un estudiante emplea solo 5 horas de estudio


semanalmente obtendra una calificacin aproximada de 8,61, con un coeficiente
de determinacin de 93,70%

Se estima que, cuando un estudiante emplea solo 15 horas de estudio


semanalmente obtendra una calificacin aproximada de 18,33, con un coeficiente
e determinacin de 93,70%.

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 142

TABLA ESTADISTICA: Distribucin t-student (dos colas)


Para (nivel de significancia) para un nivel de confianza del (1- )100%.

= nivel de significancia = nivel de significancia


g.l. 0,1 0,05 0,025 0,01 g.l. 0,1 0,05 0,025 0,01
1 6,314 12,706 33,821 63,656 51 1,6753 2,0076 2,3095 2,6757
2 2,92 4,3027 6,2054 9,925 52 1,6747 2,0066 2,3082 2,6737
3 2,3534 3,1824 4,1765 5,8408 53 1,6741 2,0057 2,3069 2,6718
4 2,1318 2,7765 3,4954 4,6041 54 1,6736 2,0049 2,3056 2,67
5 2,015 2,5706 3,1634 4,0321 55 1,673 2,004 2,3044 2,6682
6 1,9432 2,4469 2,9687 3,7074 56 1,6725 2,0032 2,3033 2,6665
7 1,8946 2,3646 2,8412 3,4995 57 1,672 2,0025 2,3022 2,6649
8 1,8595 2,306 2,7515 3,3554 58 1,6716 2,0017 2,3011 2,6633
9 1,8331 2,2622 2,685 3,2498 59 1,6711 2,001 2,3 2,6618
10 1,8125 2,2281 2,6338 3,1693 60 1,6706 2,0003 2,299 2,6603
11 1,7959 2,201 2,5931 3,1058 61 1,6702 1,9996 2,2981 2,6589
12 1,7823 2,1788 2,56 3,0545 62 1,6698 1,999 2,2971 2,6575
13 1,7709 2,1604 2,5326 3,0123 63 1,6694 1,9983 2,2962 2,6561
14 1,7613 2,1448 2,5096 2,9768 64 1,669 1,9977 2,2954 2,6549
15 1,7531 2,1315 2,4899 2,9467 65 1,6686 1,9971 2,2945 2,6536
16 1,7459 2,1199 2,4729 2,9208 66 1,6683 1,9966 2,2937 2,6524
17 1,7396 2,1098 2,4581 2,8982 67 1,6679 1,996 2,2929 2,6512
18 1,7341 2,1009 2,445 2,8784 68 1,6676 1,9955 2,2921 2,6501
19 1,7291 2,093 2,4334 2,8609 69 1,6672 1,9949 2,2914 2,649
20 1,7247 2,086 2,4231 2,8453 70 1,6669 1,9944 2,2906 2,6479
21 1,7207 2,0796 2,4138 2,8314 71 1,6666 1,9939 2,2899 2,6469
22 1,7171 2,0739 2,4055 2,8188 72 1,6663 1,9935 2,2892 2,6458
23 1,7139 2,0687 2,3979 2,8073 73 1,666 1,993 2,2886 2,6449
24 1,7109 2,0639 2,391 2,797 74 1,6657 1,9925 2,2879 2,6439
25 1,7081 2,0595 2,3846 2,7874 75 1,6654 1,9921 2,2873 2,643
26 1,7056 2,0555 2,3788 2,7787 76 1,6652 1,9917 2,2867 2,6421
27 1,7033 2,0518 2,3734 2,7707 77 1,6649 1,9913 2,2861 2,6412
28 1,7011 2,0484 2,3685 2,7633 78 1,6646 1,9908 2,2855 2,6403
29 1,6991 2,0452 2,3638 2,7564 79 1,6644 1,9905 2,2849 2,6395
30 1,6973 2,0423 2,3596 2,75 80 1,6641 1,9901 2,2844 2,6387
31 1,6955 2,0395 2,3556 2,744 81 1,6639 1,9897 2,2838 2,6379
32 1,6939 2,0369 2,3518 2,7385 82 1,6636 1,9893 2,2833 2,6371
33 1,6924 2,0345 2,3483 2,7333 83 1,6634 1,989 2,2828 2,6364
34 1,6909 2,0322 2,3451 2,7284 84 1,6632 1,9886 2,2823 2,6356
35 1,6896 2,0301 2,342 2,7238 85 1,663 1,9883 2,2818 2,6349
36 1,6883 2,0281 2,3391 2,7195 86 1,6628 1,9879 2,2813 2,6342
37 1,6871 2,0262 2,3363 2,7154 87 1,6626 1,9876 2,2809 2,6335
38 1,686 2,0244 2,3337 2,7116 88 1,6624 1,9873 2,2804 2,6329
39 1,6849 2,0227 2,3313 2,7079 89 1,6622 1,987 2,28 2,6322
40 1,6839 2,0211 2,3289 2,7045 90 1,662 1,9867 2,2795 2,6316
41 1,6829 2,0195 2,3267 2,7012 91 1,6618 1,9864 2,2791 2,6309
42 1,682 2,0181 2,3246 2,6981 92 1,6616 1,9861 2,2787 2,6303
43 1,6811 2,0167 2,3226 2,6951 93 1,6614 1,9858 2,2783 2,6297
44 1,6802 2,0154 2,3207 2,6923 94 1,6612 1,9855 2,2779 2,6291
45 1,6794 2,0141 2,3189 2,6896 95 1,6611 1,9852 2,2775 2,6286
46 1,6787 2,0129 2,3172 2,687 96 1,6609 1,985 2,2771 2,628
47 1,6779 2,0117 2,3155 2,6846 97 1,6607 1,9847 2,2767 2,6275
48 1,6772 2,0106 2,3139 2,6822 98 1,6606 1,9845 2,2764 2,6269
49 1,6766 2,0096 2,3124 2,68 99 1,6604 1,9842 2,276 2,6264
50 1,6759 2,0086 2,3109 2,6778 100 1,6602 1,984 2,2757 2,6259

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 143
TABLA ESTADSTICA DE LA DISTRIBUCIN CHI CUADRADO

Ejemplo: si tenemos una tabla de contingencia de 2 filas y 5 columnas entonces los grados de libertad
serian (2-1)(5-1)=1*4=4 g.l. Entonces el dato de la Chi Cuadrada Calculada con un =0.05 y 4 g.l. Es = 9,4877
Nivel de significancia Nivel de significancia
gl 0.10 0.05 0.025 0.01 0.005 gl 0.10 0.05 0.025 0.01 0.005
1 2.7055 3.8415 5.0239 6.6349 7.8794 51 64.2954 68.6693 72.616 77.386 80.7465
2 4.6052 5.9915 7.3778 9.2104 10.5965 52 65.4224 69.8322 73.8099 78.6156 82.0006
3 6.2514 7.8147 9.3484 11.3449 12.8381 53 66.5482 70.9934 75.0019 79.8434 83.2525
4 7.7794 9.4877 11.1433 13.2767 14.8602 54 67.6728 72.1532 76.1921 81.0688 84.5018
5 9.2363 11.0705 12.8325 15.0863 16.7496 55 68.7962 73.3115 77.3804 82.292 85.7491
6 10.6446 12.5916 14.4494 16.8119 18.5475 56 69.9185 74.4683 78.5671 83.5136 86.994
7 12.017 14.0671 16.0128 18.4753 20.2777 57 71.0397 75.6237 79.7522 84.7327 88.2366
8 13.3616 15.5073 17.5345 20.0902 21.9549 58 72.1598 76.7778 80.9356 85.9501 89.477
9 14.6837 16.919 19.0228 21.666 23.5893 59 73.2789 77.9305 82.1174 87.1658 90.7153
10 15.9872 18.307 20.4832 23.2093 25.1881 60 74.397 79.082 83.2977 88.3794 91.9518
11 17.275 19.6752 21.92 24.725 26.7569 61 75.5141 80.2321 84.4764 89.5912 93.1862
12 18.5493 21.0261 23.3367 26.217 28.2997 62 76.6302 81.381 85.6537 90.8015 94.4185
13 19.8119 22.362 24.7356 27.6882 29.8193 63 77.7454 82.5287 86.8296 92.0099 95.6492
14 21.0641 23.6848 26.1189 29.1412 31.3194 64 78.8597 83.6752 88.004 93.2167 96.8779
15 22.3071 24.9958 27.4884 30.578 32.8015 65 79.973 84.8206 89.1772 94.422 98.1049
16 23.5418 26.2962 28.8453 31.9999 34.2671 66 81.0855 85.9649 90.3488 95.6256 99.3303
17 24.769 27.5871 30.191 33.4087 35.7184 67 82.1971 87.108 91.5193 96.8277 100.5538
18 25.9894 28.8693 31.5264 34.8052 37.1564 68 83.3079 88.2502 92.6885 98.0283 101.7757
19 27.2036 30.1435 32.8523 36.1908 38.5821 69 84.4179 89.3912 93.8565 99.2274 102.9961
20 28.412 31.4104 34.1696 37.5663 39.9969 70 85.527 90.5313 95.0231 100.4251 104.2148
21 29.6151 32.6706 35.4789 38.9322 41.4009 71 86.6354 91.6703 96.1887 101.6214 105.4323
22 30.8133 33.9245 36.7807 40.2894 42.7957 72 87.7431 92.8083 97.353 102.8163 106.6473
23 32.0069 35.1725 38.0756 41.6383 44.1814 73 88.8499 93.9453 98.5162 104.0098 107.8619
24 33.1962 36.415 39.3641 42.9798 45.5584 74 89.9561 95.0815 99.6784 105.2019 109.0742
25 34.3816 37.6525 40.6465 44.314 46.928 75 91.0615 96.2167 100.8393 106.3929 110.2854
26 35.5632 38.8851 41.9231 45.6416 48.2898 76 92.1662 97.351 101.9992 107.5824 111.4954
27 36.7412 40.1133 43.1945 46.9628 49.645 77 93.2702 98.4844 103.1581 108.7709 112.7037
28 37.9159 41.3372 44.4608 48.2782 50.9936 78 94.3735 99.617 104.3159 109.9582 113.9107
29 39.0875 42.5569 45.7223 49.5878 52.3355 79 95.4762 100.7486 105.4727 111.144 115.1163
30 40.256 43.773 46.9792 50.8922 53.6719 80 96.5782 101.8795 106.6285 112.3288 116.3209
31 41.4217 44.9853 48.2319 52.1914 55.0025 81 97.6796 103.0095 107.7834 113.5123 117.524
32 42.5847 46.1942 49.4804 53.4857 56.328 82 98.7803 104.1387 108.9373 114.6948 118.7261
33 43.7452 47.3999 50.7251 54.7754 57.6483 83 99.8805 105.2672 110.0902 115.8762 119.927
34 44.9032 48.6024 51.966 56.0609 58.9637 84 100.98 106.3949 111.2422 117.0566 121.1262
35 46.0588 49.8018 53.2033 57.342 60.2746 85 102.0789 107.5217 112.3933 118.2356 122.3244
36 47.2122 50.9985 54.4373 58.6192 61.5811 86 103.1773 108.6479 113.5436 119.4137 123.5218
37 48.3634 52.1923 55.668 59.8926 62.8832 87 104.275 109.7733 114.6929 120.5909 124.7176
38 49.5126 53.3835 56.8955 61.162 64.1812 88 105.3723 110.898 115.8415 121.7672 125.9123
39 50.6598 54.5722 58.1201 62.4281 65.4753 89 106.4689 112.022 116.989 122.9422 127.106
40 51.805 55.7585 59.3417 63.6908 66.766 90 107.565 113.1452 118.1359 124.1162 128.2987
41 52.9485 56.9424 60.5606 64.95 68.0526 91 108.6606 114.2679 119.282 125.2893 129.4902
42 54.0902 58.124 61.7767 66.2063 69.336 92 109.7556 115.3898 120.427 126.4616 130.6812
43 55.2302 59.3035 62.9903 67.4593 70.6157 93 110.8501 116.511 121.5714 127.633 131.8705
44 56.3685 60.4809 64.2014 68.7096 71.8923 94 111.9442 117.6317 122.7152 128.8032 133.0589
45 57.5053 61.6562 65.4101 69.9569 73.166 95 113.0377 118.7516 123.858 129.9725 134.2466
46 58.6405 62.8296 66.6165 71.2015 74.4367 96 114.1307 119.8709 125.0001 131.1411 135.4327
47 59.7743 64.0011 67.8206 72.4432 75.7039 97 115.2232 120.9897 126.1414 132.3089 136.6188
48 60.9066 65.1708 69.0226 73.6826 76.9689 98 116.3153 122.1077 127.2821 133.4756 137.803
49 62.0375 66.3387 70.2224 74.9194 78.2306 99 117.4069 123.2252 128.4219 134.6415 138.9869
50 63.1671 67.5048 71.4202 76.1538 79.4898 100 118.498 124.3421 129.5613 135.8069 140.169

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 144

Distribucin F de FISHER, Para =0.05(nivel de significancia) para un nivel de confianza del 95%.
= 0,05 grados de libertad del numerador
G.L.denom. 1 2 3 4 5 6 7 8 9 10 20 60 100 10000
1 161,446 199,499 215,707 224,583 230,160 233,988 236,767 238,884 240,543 241,882 248,016 252,196 253,043 254,302
2 18,5128 19,0000 19,1642 19,2467 19,2963 19,3295 19,3531 19,3709 19,3847 19,3959 19,4457 19,4791 19,4857 19,4957
3 10,1280 9,5521 9,2766 9,1172 9,0134 8,9407 8,8867 8,8452 8,8123 8,7855 8,6602 8,5720 8,5539 8,5267
4 7,7086 6,9443 6,5914 6,3882 6,2561 6,1631 6,0942 6,0410 5,9988 5,9644 5,8025 5,6878 5,6640 5,6284
5 6,6079 5,7861 5,4094 5,1922 5,0503 4,9503 4,8759 4,8183 4,7725 4,7351 4,5581 4,4314 4,4051 4,3654
6 5,9874 5,1432 4,7571 4,5337 4,3874 4,2839 4,2067 4,1468 4,0990 4,0600 3,8742 3,7398 3,7117 3,6693
7 5,5915 4,7374 4,3468 4,1203 3,9715 3,8660 3,7871 3,7257 3,6767 3,6365 3,4445 3,3043 3,2749 3,2302
8 5,3176 4,4590 4,0662 3,8379 3,6875 3,5806 3,5005 3,4381 3,3881 3,3472 3,1503 3,0053 2,9747 2,9281
9 5,1174 4,2565 3,8625 3,6331 3,4817 3,3738 3,2927 3,2296 3,1789 3,1373 2,9365 2,7872 2,7556 2,7072
10 4,9646 4,1028 3,7083 3,4780 3,3258 3,2172 3,1355 3,0717 3,0204 2,9782 2,7740 2,6211 2,5884 2,5384
11 4,8443 3,9823 3,5874 3,3567 3,2039 3,0946 3,0123 2,9480 2,8962 2,8536 2,6464 2,4901 2,4566 2,4050
12 4,7472 3,8853 3,4903 3,2592 3,1059 2,9961 2,9134 2,8486 2,7964 2,7534 2,5436 2,3842 2,3498 2,2967
13 4,6672 3,8056 3,4105 3,1791 3,0254 2,9153 2,8321 2,7669 2,7144 2,6710 2,4589 2,2966 2,2614 2,2070
14 4,6001 3,7389 3,3439 3,1122 2,9582 2,8477 2,7642 2,6987 2,6458 2,6022 2,3879 2,2229 2,1870 2,1313
15 4,5431 3,6823 3,2874 3,0556 2,9013 2,7905 2,7066 2,6408 2,5876 2,5437 2,3275 2,1601 2,1234 2,0664
16 4,4940 3,6337 3,2389 3,0069 2,8524 2,7413 2,6572 2,5911 2,5377 2,4935 2,2756 2,1058 2,0685 2,0102
17 4,4513 3,5915 3,1968 2,9647 2,8100 2,6987 2,6143 2,5480 2,4943 2,4499 2,2304 2,0584 2,0204 1,9610
18 4,4139 3,5546 3,1599 2,9277 2,7729 2,6613 2,5767 2,5102 2,4563 2,4117 2,1906 2,0166 1,9780 1,9175
19 4,3808 3,5219 3,1274 2,8951 2,7401 2,6283 2,5435 2,4768 2,4227 2,3779 2,1555 1,9795 1,9403 1,8787
20 4,3513 3,4928 3,0984 2,8661 2,7109 2,5990 2,5140 2,4471 2,3928 2,3479 2,1242 1,9464 1,9066 1,8438
21 4,3248 3,4668 3,0725 2,8401 2,6848 2,5727 2,4876 2,4205 2,3661 2,3210 2,0960 1,9165 1,8761 1,8124
22 4,3009 3,4434 3,0491 2,8167 2,6613 2,5491 2,4638 2,3965 2,3419 2,2967 2,0707 1,8894 1,8486 1,7838
23 4,2793 3,4221 3,0280 2,7955 2,6400 2,5277 2,4422 2,3748 2,3201 2,2747 2,0476 1,8648 1,8234 1,7577
24 4,2597 3,4028 3,0088 2,7763 2,6207 2,5082 2,4226 2,3551 2,3002 2,2547 2,0267 1,8424 1,8005 1,7338
25 4,2417 3,3852 2,9912 2,7587 2,6030 2,4904 2,4047 2,3371 2,2821 2,2365 2,0075 1,8217 1,7794 1,7117
26 4,2252 3,3690 2,9752 2,7426 2,5868 2,4741 2,3883 2,3205 2,2655 2,2197 1,9898 1,8027 1,7599 1,6913
27 4,2100 3,3541 2,9603 2,7278 2,5719 2,4591 2,3732 2,3053 2,2501 2,2043 1,9736 1,7851 1,7419 1,6724
28 4,1960 3,3404 2,9467 2,7141 2,5581 2,4453 2,3593 2,2913 2,2360 2,1900 1,9586 1,7689 1,7251 1,6548
29 4,1830 3,3277 2,9340 2,7014 2,5454 2,4324 2,3463 2,2782 2,2229 2,1768 1,9446 1,7537 1,7096 1,6384
30 4,1709 3,3158 2,9223 2,6896 2,5336 2,4205 2,3343 2,2662 2,2107 2,1646 1,9317 1,7396 1,6950 1,6230
40 4,0847 3,2317 2,8387 2,6060 2,4495 2,3359 2,2490 2,1802 2,1240 2,0773 1,8389 1,6373 1,5892 1,5098
50 4,0343 3,1826 2,7900 2,5572 2,4004 2,2864 2,1992 2,1299 2,0733 2,0261 1,7841 1,5757 1,5249 1,4392
60 4,0012 3,1504 2,7581 2,5252 2,3683 2,2541 2,1665 2,0970 2,0401 1,9926 1,7480 1,5343 1,4814 1,3903
70 3,9778 3,1277 2,7355 2,5027 2,3456 2,2312 2,1435 2,0737 2,0166 1,9689 1,7223 1,5046 1,4498 1,3540
80 3,9604 3,1108 2,7188 2,4859 2,3287 2,2142 2,1263 2,0564 1,9991 1,9512 1,7032 1,4821 1,4259 1,3259
90 3,9469 3,0977 2,7058 2,4729 2,3157 2,2011 2,1131 2,0430 1,9856 1,9376 1,6883 1,4645 1,4070 1,3032
100 3,9362 3,0873 2,6955 2,4626 2,3053 2,1906 2,1025 2,0323 1,9748 1,9267 1,6764 1,4504 1,3917 1,2845
200 3,8884 3,0411 2,6498 2,4168 2,2592 2,1441 2,0556 1,9849 1,9269 1,8783 1,6233 1,3856 1,3206 1,1903
300 3,8726 3,0258 2,6347 2,4017 2,2441 2,1288 2,0402 1,9693 1,9112 1,8623 1,6057 1,3634 1,2958 1,1521
400 3,8648 3,0183 2,6272 2,3943 2,2366 2,1212 2,0325 1,9616 1,9033 1,8544 1,5969 1,3522 1,2831 1,1303
500 3,8601 3,0138 2,6227 2,3898 2,2320 2,1167 2,0279 1,9569 1,8986 1,8496 1,5916 1,3455 1,2753 1,1159
600 3,8570 3,0107 2,6198 2,3868 2,2290 2,1137 2,0248 1,9538 1,8955 1,8465 1,5881 1,3410 1,2701 1,1055
700 3,8548 3,0086 2,6176 2,3847 2,2269 2,1115 2,0226 1,9516 1,8932 1,8442 1,5856 1,3377 1,2664 1,0976
800 3,8531 3,0070 2,6160 2,3831 2,2253 2,1099 2,0210 1,9500 1,8916 1,8425 1,5837 1,3353 1,2635 1,0912
900 3,8518 3,0057 2,6148 2,3818 2,2240 2,1086 2,0197 1,9487 1,8903 1,8412 1,5822 1,3334 1,2613 1,0861
1000 3,8508 3,0047 2,6138 2,3808 2,2231 2,1076 2,0187 1,9476 1,8892 1,8402 1,5811 1,3318 1,2596 1,0818
1500 3,8477 3,0017 2,6108 2,3779 2,2201 2,1046 2,0157 1,9446 1,8861 1,8370 1,5775 1,3273 1,2542 1,0675
2000 3,8461 3,0002 2,6094 2,3764 2,2186 2,1031 2,0142 1,9430 1,8846 1,8354 1,5758 1,3250 1,2516 1,0593
10000 3,8424 2,9966 2,6058 2,3728 2,2150 2,0995 2,0105 1,9393 1,8808 1,8316 1,5716 1,3194 1,2451 1,0334

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 145
Distribucin F de FISHER, Para =0.01(nivel de significancia) = nivel de confianza del 99%.
= 0,01 grados de libertad del numerador
G.L.denom. 1 2 3 4 5 6 7 8 9 10 20 60 100 10000
1 4052,18 4999,34 5403,53 5624,26 5763,96 5858,95 5928,33 5980,95 6022,40 6055,93 6208,66 6312,97 6333,92 6365,59
2 98,5019 99,0003 99,1640 99,2513 99,3023 99,3314 99,3568 99,3750 99,3896 99,3969 99,4478 99,4842 99,4914 99,4987
3 34,1161 30,8164 29,4567 28,7100 28,2371 27,9106 27,6714 27,4895 27,3449 27,2285 26,6900 26,3162 26,2407 26,1261
4 21,1976 17,9998 16,6942 15,9771 15,5219 15,2068 14,9757 14,7988 14,6592 14,5460 14,0194 13,6522 13,5769 13,4642
5 16,2581 13,2741 12,0599 11,3919 10,9671 10,6722 10,4556 10,2893 10,1577 10,0511 9,5527 9,2020 9,1300 9,0215
6 13,7452 10,9249 9,7796 9,1484 8,7459 8,4660 8,2600 8,1017 7,9760 7,8742 7,3958 7,0568 6,9867 6,8811
7 12,2463 9,5465 8,4513 7,8467 7,4604 7,1914 6,9929 6,8401 6,7188 6,6201 6,1555 5,8236 5,7546 5,6506
8 11,2586 8,6491 7,5910 7,0061 6,6318 6,3707 6,1776 6,0288 5,9106 5,8143 5,3591 5,0316 4,9633 4,8599
9 10,5615 8,0215 6,9920 6,4221 6,0569 5,8018 5,6128 5,4671 5,3511 5,2565 4,8080 4,4831 4,4150 4,3116
10 10,0442 7,5595 6,5523 5,9944 5,6364 5,3858 5,2001 5,0567 4,9424 4,8491 4,4054 4,0819 4,0137 3,9100
11 9,6461 7,2057 6,2167 5,6683 5,3160 5,0692 4,8860 4,7445 4,6315 4,5393 4,0990 3,7761 3,7077 3,6035
12 9,3303 6,9266 5,9525 5,4119 5,0644 4,8205 4,6395 4,4994 4,3875 4,2961 3,8584 3,5355 3,4668 3,3619
13 9,0738 6,7009 5,7394 5,2053 4,8616 4,6203 4,4410 4,3021 4,1911 4,1003 3,6646 3,3413 3,2723 3,1665
14 8,8617 6,5149 5,5639 5,0354 4,6950 4,4558 4,2779 4,1400 4,0297 3,9394 3,5052 3,1813 3,1118 3,0051
15 8,6832 6,3588 5,4170 4,8932 4,5556 4,3183 4,1416 4,0044 3,8948 3,8049 3,3719 3,0471 2,9772 2,8695
16 8,5309 6,2263 5,2922 4,7726 4,4374 4,2016 4,0259 3,8896 3,7804 3,6909 3,2587 2,9330 2,8627 2,7539
17 8,3998 6,1121 5,1850 4,6689 4,3360 4,1015 3,9267 3,7909 3,6823 3,5931 3,1615 2,8348 2,7639 2,6542
18 8,2855 6,0129 5,0919 4,5790 4,2479 4,0146 3,8406 3,7054 3,5971 3,5081 3,0771 2,7493 2,6779 2,5671
19 8,1850 5,9259 5,0103 4,5002 4,1708 3,9386 3,7653 3,6305 3,5225 3,4338 3,0031 2,6742 2,6023 2,4905
20 8,0960 5,8490 4,9382 4,4307 4,1027 3,8714 3,6987 3,5644 3,4567 3,3682 2,9377 2,6077 2,5353 2,4224
21 8,0166 5,7804 4,8740 4,3688 4,0421 3,8117 3,6396 3,5056 3,3982 3,3098 2,8795 2,5484 2,4755 2,3615
22 7,9453 5,7190 4,8166 4,3134 3,9880 3,7583 3,5866 3,4530 3,3458 3,2576 2,8274 2,4951 2,4218 2,3067
23 7,8811 5,6637 4,7648 4,2635 3,9392 3,7102 3,5390 3,4057 3,2986 3,2106 2,7805 2,4471 2,3732 2,2571
24 7,8229 5,6136 4,7181 4,2185 3,8951 3,6667 3,4959 3,3629 3,2560 3,1681 2,7380 2,4035 2,3291 2,2119
25 7,7698 5,5680 4,6755 4,1774 3,8550 3,6272 3,4568 3,3239 3,2172 3,1294 2,6993 2,3637 2,2888 2,1706
26 7,7213 5,5263 4,6365 4,1400 3,8183 3,5911 3,4210 3,2884 3,1818 3,0941 2,6640 2,3273 2,2519 2,1327
27 7,6767 5,4881 4,6009 4,1056 3,7847 3,5580 3,3882 3,2558 3,1494 3,0618 2,6316 2,2938 2,2180 2,0978
28 7,6357 5,4529 4,5681 4,0740 3,7539 3,5276 3,3581 3,2259 3,1195 3,0320 2,6018 2,2629 2,1867 2,0655
29 7,5977 5,4205 4,5378 4,0449 3,7254 3,4995 3,3303 3,1982 3,0920 3,0045 2,5742 2,2344 2,1577 2,0355
30 7,5624 5,3903 4,5097 4,0179 3,6990 3,4735 3,3045 3,1726 3,0665 2,9791 2,5487 2,2079 2,1307 2,0075
40 7,3142 5,1785 4,3126 3,8283 3,5138 3,2910 3,1238 2,9930 2,8876 2,8005 2,3689 2,0194 1,9383 1,8061
50 7,1706 5,0566 4,1994 3,7195 3,4077 3,1864 3,0202 2,8900 2,7850 2,6981 2,2652 1,9090 1,8248 1,6847
60 7,0771 4,9774 4,1259 3,6491 3,3389 3,1187 2,9530 2,8233 2,7185 2,6318 2,1978 1,8363 1,7493 1,6023
70 7,0114 4,9218 4,0744 3,5997 3,2907 3,0712 2,9060 2,7765 2,6719 2,5852 2,1504 1,7846 1,6954 1,5422
80 6,9626 4,8807 4,0363 3,5631 3,2551 3,0361 2,8713 2,7420 2,6374 2,5508 2,1153 1,7459 1,6548 1,4960
90 6,9251 4,8491 4,0069 3,5350 3,2276 3,0091 2,8445 2,7154 2,6109 2,5243 2,0882 1,7158 1,6231 1,4593
100 6,8953 4,8239 3,9837 3,5127 3,2059 2,9877 2,8233 2,6943 2,5898 2,5033 2,0666 1,6918 1,5977 1,4292
200 6,7633 4,7128 3,8810 3,4143 3,1100 2,8933 2,7298 2,6012 2,4971 2,4106 1,9713 1,5833 1,4811 1,2812
300 6,7201 4,6766 3,8475 3,3822 3,0787 2,8625 2,6993 2,5709 2,4668 2,3804 1,9401 1,5468 1,4410 1,2228
400 6,6987 4,6586 3,8309 3,3664 3,0632 2,8472 2,6842 2,5559 2,4518 2,3654 1,9245 1,5285 1,4207 1,1900
500 6,6858 4,6479 3,8210 3,3569 3,0540 2,8381 2,6751 2,5469 2,4429 2,3565 1,9152 1,5174 1,4084 1,1684
600 6,6773 4,6407 3,8144 3,3506 3,0478 2,8321 2,6691 2,5409 2,4369 2,3505 1,9091 1,5101 1,4001 1,1529
700 6,6713 4,6356 3,8097 3,3460 3,0434 2,8278 2,6648 2,5367 2,4327 2,3463 1,9047 1,5048 1,3942 1,1411
800 6,6667 4,6318 3,8062 3,3427 3,0402 2,8245 2,6617 2,5335 2,4295 2,3431 1,9013 1,5008 1,3897 1,1318
900 6,6631 4,6288 3,8034 3,3401 3,0376 2,8220 2,6592 2,5310 2,4270 2,3406 1,8988 1,4978 1,3863 1,1242
1000 6,6603 4,6264 3,8012 3,3380 3,0356 2,8200 2,6572 2,5290 2,4250 2,3386 1,8967 1,4953 1,3835 1,1178
1500 6,6518 4,6193 3,7947 3,3317 3,0294 2,8140 2,6512 2,5231 2,4191 2,3327 1,8906 1,4879 1,3751 1,0969
2000 6,6476 4,6158 3,7914 3,3286 3,0264 2,8110 2,6482 2,5201 2,4162 2,3298 1,8875 1,4842 1,3708 1,0850
10000 6,6374 4,6073 3,7836 3,3210 3,0191 2,8038 2,6411 2,5130 2,4091 2,3227 1,8802 1,4752 1,3606 1,0476

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 146

DISTRIBUCION NORMAL
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-4 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.0001 0.0001 0.0001 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.0002 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.0003 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.0004 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.0006 0.00058 0.00056 0.00054 0.00052 0.0005
-3.1 0.00097 0.00094 0.0009 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.001
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.0024 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.0028 0.00272 0.00264
-2.6 0.00466 0.00453 0.0044 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.0057 0.00554 0.00539 0.00523 0.00508 0.00494 0.0048
-2.4 0.0082 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.0099 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.0139 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.0116 0.0113 0.01101
-2.1 0.01786 0.01743 0.017 0.01659 0.01618 0.01578 0.01539 0.015 0.01463 0.01426
-2 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.0197 0.01923 0.01876 0.01831
-1.9 0.02872 0.02807 0.02743 0.0268 0.02619 0.02559 0.025 0.02442 0.02385 0.0233
-1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
-1.7 0.04457 0.04363 0.04272 0.04182 0.04093 0.04006 0.0392 0.03836 0.03754 0.03673
-1.6 0.0548 0.0537 0.05262 0.05155 0.0505 0.04947 0.04846 0.04746 0.04648 0.04551
-1.5 0.06681 0.06552 0.06426 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.4 0.08076 0.07927 0.0778 0.07636 0.07493 0.07353 0.07215 0.07078 0.06944 0.06811
-1.3 0.0968 0.0951 0.09342 0.09176 0.09012 0.08851 0.08692 0.08534 0.08379 0.08226
-1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09853
-1.1 0.13567 0.1335 0.13136 0.12924 0.12714 0.12507 0.12302 0.121 0.119 0.11702
-1 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.9 0.18406 0.18141 0.17879 0.17619 0.17361 0.17106 0.16853 0.16602 0.16354 0.16109
-0.8 0.21186 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.7 0.24196 0.23885 0.23576 0.2327 0.22965 0.22663 0.22363 0.22065 0.2177 0.21476
-0.6 0.27425 0.27093 0.26763 0.26435 0.26109 0.25785 0.25463 0.25143 0.24825 0.2451
-0.5 0.30854 0.30503 0.30153 0.29806 0.2946 0.29116 0.28774 0.28434 0.28096 0.2776
-0.4 0.34458 0.3409 0.33724 0.3336 0.32997 0.32636 0.32276 0.31918 0.31561 0.31207
-0.3 0.38209 0.37828 0.37448 0.3707 0.36693 0.36317 0.35942 0.35569 0.35197 0.34827
-0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129 0.39743 0.39358 0.38974 0.38591
-0.1 0.46017 0.4562 0.45224 0.44828 0.44433 0.44038 0.43644 0.43251 0.42858 0.42465
0 0.5 0.49601 0.49202 0.48803 0.48405 0.48006 0.47608 0.4721 0.46812 0.46414

D.Sc. Percy Huata Panca


Estadstica Aplicada a la Investigacin Pg. 147

DISTRIBUCION NORMAL
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.5 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.5279 0.53188 0.53586
0.1 0.53983 0.5438 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.6293 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.6591 0.66276 0.6664 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.7054 0.70884 0.71226 0.71566 0.71904 0.7224
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.7549
0.7 0.75804 0.76115 0.76424 0.7673 0.77035 0.77337 0.77637 0.77935 0.7823 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.8665 0.86864 0.87076 0.87286 0.87493 0.87698 0.879 0.881 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.9032 0.9049 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.9222 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.9452 0.9463 0.94738 0.94845 0.9495 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.9608 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.9732 0.97381 0.97441 0.975 0.97558 0.97615 0.9767
2 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.9803 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.983 0.98341 0.98382 0.98422 0.98461 0.985 0.98537 0.98574
2.2 0.9861 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.9884 0.9887 0.98899
2.3 0.98928 0.98956 0.98983 0.9901 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.9918 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.9943 0.99446 0.99461 0.99477 0.99492 0.99506 0.9952
2.6 0.99534 0.99547 0.9956 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.9972 0.99728 0.99736
2.8 0.99744 0.99752 0.9976 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.999
3.1 0.99903 0.99906 0.9991 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.9994 0.99942 0.99944 0.99946 0.99948 0.9995
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.9996 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.9997 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.9998 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.9999 0.9999 0.9999 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4 0.99997 0.99997 0.99997 0.99997 0.99997 0.99997 0.99998 0.99998 0.99998 0.99998

D.Sc. Percy Huata Panca

Vous aimerez peut-être aussi