Estadistica,, PDF

Estadstica Aplicada a la Investigacin Pg.
UNIVERSIDAD NACIONAL DEL ALTIPLANO-PUNO
ESCUELA DE POST GRADO
CURSO: ESTADSTICA
D.Sc. Percy Huata Panca

percyhp@hotmail.com
C.U. septiembre de 2015 .

Estadstica Aplicada a la Investigacin Pg. 2
Segunda Edicin: Setiembre del 2015.
Estadstica aplicada a la investigacin, son exclusivamente derechos de los autores,

prohibida la reproduccin.
AUTOR:
PERCY HUATA PANCA

Doctoris Scientiae en Economa y Gestin
Magister Scientiae en Informtica
Ingeniero Estadstico
DOCENTE DE LA FINESI-UNA-PUNO
Email : percyhp@hotmail.com
percyhp@gmail.com

CAPTULO I
CONCEPTOS BSICOS DE LA ESTADSTICA
1.1. DEFINICIONES DE ESTADISTICA
La estadstica es una ciencia terica que forma parte de las ciencias matemticas,
al aplicarla a otras disciplinas se tienen que cumplir ciertas condiciones para que
su uso sea correcto. Sus leyes y frmulas se basan en poblaciones numricas, en
general, bien definidas aunque sean casi siempre infinitas, adems, sus elementos
suelen ser nmeros sin errores de medida. Al aplicar los principios estadsticos a
disciplinas distintas de las matemticas hay que tener en cuenta que las
poblaciones casi nunca son infinitas y que los valores, en muchos casos, suelen
proceder de medidas realizadas sobre magnitudes que no se pueden evaluar con
mucha exactitud. Si no se tienen en cuenta las diferencias entre estadstica
matemtica y aplicada se pueden cometer errores muy importantes.
La estadstica se puede dividir en dos partes principales: la estadstica descriptiva y

la inferencial (analtica).
La estadstica descriptiva, tiene como objetivo representar y resumir los

resultados. Una vez terminado un trabajo de investigacin se dispone de muchos
datos, miles en muchas condiciones, que no se utilizaran eficientemente si no se
aplican tcnicas que los resuman. Las tcnicas descriptivas dependen del tipo de
variables y de los objetivos del trabajo realizado, en general, condensan la
informacin obtenida en tablas, grficos y parmetros que la resumen y permiten
entenderla rpidamente.
La estadstica analtica, tambin denominada inferencial, estudia los elementos de

una muestra y a partir de ellos infiere propiedades a la poblacin muestreada. Su
objetivo es el viejo sueo empirista: conocer el todo estudiando solo una parte,
evidentemente con un margen de error.
Ruiz (2004) La Estadstica es la ciencia cuyo objetivo es reunir una informacin

cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de
ello gracias al anlisis de estos datos unos significados precisos o unas previsiones
para el futuro.
La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin,

presentacin, anlisis e interpretacin de datos numricos con el fin de realizar
una toma de decisin ms efectiva. Otros autores tienen definiciones de la

Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para

Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo
de los colectivos; otros la definen como la expresin cuantitativa del
conocimiento dispuesta en forma adecuada para el escrutinio y anlisis.
La ms aceptada, sin embargo, es la de Mnguez, que define la Estadstica como

La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos
sociales para medir su intensidad, deducir las leyes que los rigen y hacer su
prediccin prxima.
Los estudiantes confunden comnmente los dems trminos asociados con las
Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra
tiene tres significados: la palabra estadstica, en primer trmino se usa para
referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto
de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el
trmino estadstico, en singular y en masculino, se refiere a una medida derivada
de una muestra.
1.2. HISTORIA DE LA ESTADISTICA
Alvarez (2007) La estadstica moderna surge de la confluencia de dos disciplinas

que evolucionaron de manera independiente: la aritmtica de estado
(estadsticas) y el clculo de probabilidades.
La mayora de civilizaciones antiguas recogan datos sobre los impuestos

recaudados, el nmero de soldados reclutados, bajas en batallas, censos, etc. En el
siglo XVII John Graunt fue el primero en realizar tablas de mortalidad y estudios
demogrficos. Achenwald fue el primero en denominar Estadstica, hasta entonces
denominada aritmtica de estado.
El clculo de probabilidades se desarroll debido a los juegos de azar. En los siglos

XVI y XVII hombres de ciencia tan importantes como Galileo, Fermat y Pascal,
dedicaron mucho tiempo al clculo de probabilidades con objeto de resolver
problemas planteados por los juegos de azar. La frmula clsica del clculo de
probabilidades la probabilidad de que ocurra un determinado suceso es igual al
nmero de casos favorables al suceso, dividido por el nmero de casos totales que
pueden ocurrir es debida a Pascal.
En los siglos XVII y XVIII Newton revoluciono la ciencia e introdujo junto a Leibniz
el clculo infinitesimal y la modelizacin matemtica de los fenmenos fsicos,
como consecuencia de ello se puso de manifiesto la necesidad de la exactitud de
las medidas y el desarrollo del clculo de errores.
En el siglo XVIII De Moivre comprob que la distribucin binomial poda

aproximarse a la normal cuando el nmero de casos era grande. Este autor junto a
Laplace fueron de los primeros en aplicar el clculo de probabilidades a los datos

demogrficos, contribuyendo a unificar la estadstica y el clculo de probabilidades

en una sola disciplina. Una figura muy importante en el campo de clculo de
probabilidades, aunque paso desapercibido en su tiempo, fue Bayes, autor del
teorema que lleva su nombre.
En el siglo XIX una de las figuras ms relevantes en el campo de fsica y de la

estadstica fue Gauss. ste cientfico hiso magnficos estudios sobre la curva
normal, a la cual tambin se le conoce como curva de Gauss, aunque ya era
conocida antes de que ste importante matemtico hiciera sus estudios, tambin
realizo profundos anlisis sobre la teora de los errores, y desde el punto de vista
prctico la aplic a la astronoma. Otras figuras relevantes de siglo XIX en el
campo de la estadstica fueron Newcomb, que realizo importantes estudios en
relacin a la estimacin de parmetros, K. Pearson, que trabaj, entre otros
temas, sobre correlacin y regresin entre variables.
En el siglo XX, junto a Pearson , que hiso sus trabajos entre el siglo XIX y el XX, en
autor ms importante fue Fisher, el cual dedico gran parte de su tiempo al anlisis
de modelos matemticos multivariantes; entre otras aportaciones invento el
anlisis discriminante. ES Pearson, Wald y Neyman desarrollaron la teora del
contraste de hiptesis.
Las modernas teoras fsicas como la mecnica estadstica y la mecnica cuntica

han estimulado un gran auge de la estadstica, debido a que es la principal
herramienta utilizada para interpretar resultados experimentales y para el
desarrollo terico de estas disciplinas.
A partir de 1970 la estadstica ha cobrado una gran dimensin entre otras razones
por la generalizacin del uso de los ordenadores, lo que ha permitido utilizar
tcnicas estadsticas que, aunque conocidas desde hace tiempo, se aplicaban en
pocas ocasiones debido a la dificultad de los clculos. En la actualidad la
estadstica es una disciplina en alza; la sociologa, la psicologa, la utilizacin
creciente de encuestas, la generalizacin del control de calidad, la aplicacin a las
ciencias de la salud, las nuevas teoras fsicas, etc., son algunas de las razones que
han motivado una gran demanda de estudios estadsticos.
Dentro del campo de la bioestadstica uno de los primeros en aplicarla a

problemas biomdicos fue el ya citado J. Graund que realiz las primeras tablas de
mortalidad, conocidas. Galton primo de Darwin es considerados el padre de la
bioestadstica, el cual junto a K. Pearson y Fisher establecieron las bases de la
bioestadstica moderna.
Ruiz (2004) Los comienzos de la estadstica pueden ser hallados en el antiguo

Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo,
prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo al
historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el
objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss
II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el

antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos

estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey David por
otra parte, orden a Joab, general del ejrcito hacer un censo de Israel con la
finalidad desconocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos
efectuaron censos peridicamente con fines tributarios, sociales (divisin de
tierras) y militares (clculo de recursos y hombres disponibles). La investigacin
histrica revela que se realizaron 69 censos para calcularlos impuestos,
determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los
romanos, maestros de la organizacin poltica, quienes mejor supieron emplear
los recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin
y sus funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de
las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo
suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.
Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy
pocas operaciones Estadsticas, con la notable excepcin de las relaciones de
tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por
Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos
censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el
Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la
propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer
compendio estadstico de Inglaterra.
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra,

trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi
olvidados durante la Edad Media.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols
Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes,
hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se
crearon los Estados Nacionales y surgi como fuerza el comercio internacional
exista ya un mtodo capaz de aplicarse a los datos econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al

temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en
Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y
matrimonios.
Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno

ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre
continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad)
contenan los nacimientos y fallecimientos por sexo. En 1662, el capitn John
Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre

el nmero de personas que moriran de varias enfermedades y sobre las

proporciones de nacimientos de varones y mujeres que cabra esperar. El trabajo
de Graunt, condensado en su obra Natural and Political Observations Made upon
the Bills of Mortality (Observaciones Polticas y Naturales. Hechas a partir de las
Cuentas de Mortalidad), fue un esfuerzo innovador en el anlisis estadstico.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de

los recursos nacionales, comprensiva de datos sobre organizacin poltica,
instrucciones sociales, comercio y podero militar. Durante el siglo XVII aport
indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y
ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica
Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba,
decreca o permaneca esttica. En los tiempos modernos tales mtodos fueron
resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y
el potencial humano de sus respectivos pases. El primer empleo de los datos
estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de
Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se
propuso destruir la antigua creencia popular de que en los aos terminados en
siete mora ms gente que en los restantes, y para lograrlo hurg pacientemente
en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de
defuncin pudo demostrar que en tales aos no fallecan ms personas que en los
dems. Los procedimientos de Neumann fueron conocidos por el astrnomo
ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al
estudio de la vida humana. Sus clculos sirvieron de base para las tablas de
mortalidad que hoy utilizan todas las compaas de seguros.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No
obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin
a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes
problemas cientficos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la

palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y
con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del
gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el
trmino latino status, que significa estado o situacin; Esta etimologa aumenta el
valor intrnseco de la palabra, por cuanto la estadstica revela el sentido
cuantitativo de las ms variadas situaciones.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este
interpret la teora de la probabilidad para su uso en las ciencias sociales y
resolver la aplicacin del principio de promedios y de la variabilidad a los
fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de
todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia.

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos

matemticos fundamentales para la teora Estadstica; la teora de los errores de
observacin, aportada por Laplace y Gauss; y la teora de los mnimos cuadrados
desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis
Gaston ide el mtodo Conocido por Correlacin, que tena por objeto medir la
influencia relativa de los factores sobre las variables. De aqu parti el desarrollo
del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la
ciencia biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que
efectuaron amplios estudios sobre la medida de las relaciones.
Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior

desarrollo del clculo de probabilidades, particularmente en la rama denominada
indeterminismo o relatividad, se ha demostrado que el determinismo fue
reconocido en la Fsica como resultado de las investigaciones atmicas y que este
principio se juzga aplicable tanto a las ciencias sociales como a las fsicas.
1.3. CLASIFICACIN DE LA ESTADSTICA.
La estadstica se clasifica de acuerdo a las dos funciones que realiza:
Estadstica Descriptiva. Es aquella parte de la Estadstica que describe y analiza

una poblacin, sin pretender sacar conclusiones de tipo general. Trata de la
recopilacin, clasificacin, presentacin y descripcin de los datos.
Estadstica Inferencial. Es aquella parte de la Estadstica, cuyo propsito es inferir

o inducir leyes de comportamiento de una poblacin, a partir del estudio de una
muestra o una poblacin. Para una toma de decisiones adecuadas y correctas.
1.4. POBLACIN Y MUESTRA.
Poblacin.
Es un conjunto relativamente grande y completo de individuos, elementos,
objetos o unidades que poseen al menos una caracterstica comn y observable.
La poblacin puede ser finita o infinita. Si la poblacin es infinita ser imposible
tener una informacin completa sobre ella, o si la poblacin es finita pero
numerosa y no sea posible estudiar todos y cada uno de sus elementos, es
necesario tomar una muestra. Ejm:
Un conjunto de personas, tales como: Los estudiantes matriculados en una

Universidad del Per en el presente ao acadmico.
Un conjunto de trabajadores de una organizacin gubernamental: tales como:

todos los trabajadores de la Municipalidad Provincial de Puno.

Muestra.
Una muestra es un procedimiento mediante el cual se extraen algunos elementos
de una poblacin, y a travs de ella estimas los parmetros caractersticos de la
poblacin, todos los elementos de la poblacin deben tener la misma oportunidad
de ser elegidos (mediante un proceso aleatorio).
Existen dos mtodos muestrales: no probabilstico y probabilstico, el no

probabilstico comprende una eleccin a criterio o por conveniencia, y el muestreo
probabilstico se halla utilizando frmulas y se aplica para elegir una muestra
apropiada, existen tcnicas o tipos de muestreo como son: El Muestreo Aleatorio
Simple, Muestreo Aleatorio Estratificado, Muestreo Sistemtico y Muestreo por
conglomerados.
Ejemplo:
Si la Poblacin consiste en el total de estudiantes matriculados en una Universidad
del Per en el presente ao acadmico, una muestra sera una eleccin de algunos
estudiantes de todos los semestres y de todas las Escuelas Profesionales.
1.5. OBSERVACIONES.
Estadsticamente son los datos que se recolectan para un estudio.
Unidades de Observacin.
Constituyen los elementos o cosas o elementos observados.
Ejemplo: Si se toma datos acerca del rendimiento acadmico de los estudiantes

de una Escuela Profesional, matriculados en el presente ao acadmico,
entonces el rendimiento acadmico de cada uno de los alumnos
constituyen las observaciones.
Variables.
Alvarez (2007) Los valores de las variables son las luces que vamos a ver
entre las tinieblas de nuestro desconocimiento, su adecuada eleccin y su
correcta medida ayudaran a poner un poco de claridad en el inmenso
ocano de nuestra ignorancia.
Una variable expresa los valores para cada elemento del estudio de una
magnitud. Las variables pueden ser simples o complejas; el valor de las
variables simples se obtiene mediante una medida directa, por ejemplo la
glucemia basal, la tensin arterial sistlica, etc.; las variables complejas se
suelen obtener a partir de varias variables simples, ejemplos: la calidad de
vida, la ansiedad, el grado de invalidez, etc.
Los valores de las variables, los datos, en general, son el principal soporte
de las conclusiones de un estudio o trabajo de investigacin. Para que las
conclusiones tengan valor cientfico es fundamental que los datos sean lo

ms objetivos posible. Al leer o escribir un trabajo cientfico lo primero que

debe tenerse en cuenta es el origen de los datos y su consistencia,
objetividad. No es infrecuente observar trabajos basados en datos poco
objetivos de los que se obtienen resultados que se consideran solamente
afectados por los errores estadsticos, obviando los errores de medida, y a
partir de los cuales se hacen conclusiones consideradas casi exactas.
Se definen las variables, como magnitudes o valores que tienden a sufrir

modificaciones o cambios dentro de un dominio determinado.
Es decir, las caractersticas que varan de individuo a individuo o de objeto

a objeto se llaman variables; mientras que las que permanecen
inalterables, se llaman: constantes.
Generalmente, las variables se designan con las ultimas letras del

abecedario: X, Y, Z; y los valores que asume las variables con letras
minsculas acompaadas con subndices como: x1, x2, ....., xn.
Ejemplo: En una Universidad del Per, se lleva a cabo un estudio para

determinar la situacin ocupacional de sus egresados de la Escuela
Profesional de Contabilidad.
En relacin a este estudio, identifique las propiedades siguientes como

constantes o variables: Sexo, Ingresos anuales, Profesin, Nmero de aos
de experiencia y Nivel jerrquico ocupacional
PORPIEDADES ES JUSTIFICCION
a) Sexo VARIABLE Todos los egresados(as) son de

ambos sexos.
b) Ingresos VARIABLE Cada egresado(a) tiene

Mensuales diferente nivel de ingresos.
c) Profesin CONSTANTE Todos los egresados(as) son

Licenciados(as) en Contabilidad.
d) Nmero de VARIABLE Cada Licenciado(a) en

Aos de Contabilidad tiene diferente
Experiencia tiempo de experiencia.
e) Nivel VARIABLE Cada Licenciado(a) en

Jerrquico Contabilidad tiene nivel
Ocupacional jerrquico diferente.

Supongamos que hemos encuestado a tres (03)

Licenciados(as) en Contabilidad del estudio anterior, y cada
una de ellos nos proporciona la siguiente informacin:
Ingresos Mensuales:
Licenciado en Contabilidad 1 = S/. 3800,00
Aos de Experiencia:
Licenciado en Contabilidad 1 = 8 aos
Licenciado en Contabilidad 2 = 3 aos
Licenciado en Contabilidad 3 = 1 ao
Nivel jerrquico Ocupacional:

Licenciado en Contabilidad 1 = Jefe (a) de
Departamento
Licenciado en Contabilidad 2 = Coordinador(a)
Licenciado en Contabilidad 3 = Auxiliar
Luego tenemos:
VARIABLE VALORES DE LA VARIABLE

(Dominio de Variacin)
LITERAL SIMBOLICA
X1 = S/. 3800,00
Ingresos X X2 = S/. 2920,00
Mensuales X3 = S/. 1480,00
y1 = 8 aos
Aos de Y y2 = 3 aos
Experiencia y3 = 1 ao
Nivel z1 = Jefe(a) de
Jerrquico Z Departamento
Ocupacional. z2 = Coordinador(a)
z3 = Auxiliar

1.6. CLASIFICACIN DE LAS VARIABLES.
PRIMER CRITERIO:
A) POR SU GENERALIDAD O NIVEL DE ABSTRACCIN.
a. Tericas.
Son aquellas variables que necesitan definirse operacionalmente;
porque sus cualidades o caractersticas no son fcilmente observables
ni medibles.
Ejemplo: Desarrollo econmico, estrato socioeconmico, rendimiento
acadmico, hbitos de consumo, etc.
b. Intermedias.
Son variables que permiten especificar a las variables tericas, con el
fin de hacerlas observables y medibles.
c. Empricas.
Son aquellas variables que no necesitan definirse operacionalmente;
porque sus valores se identifican en forma inmediata y son fcilmente
medibles.
Ejemplo: Edad, sexo, peso, talla, etc.
VARIABLE VARIABLES VARIABLES

TERICA INTERMEDIAS EMPRICAS
ESTUDIANTES UNIVERSITARIOS
RENDIMIENTO ACADMICO de
ALTA : 17 20
CALIFICACIONES MEDIA : 11 16
BAJA : 00 10
ASISTENCIA A ALTA : 81%100%

CLASES MEDIA : 61% 80%
BAJA : menos 61%
PRCTICAS PRE EFICIENTE : 17 - 20

PROFESIONALES REGULAR : 11 - 16
DEFICIENTE : 00 10

SEGUNDO CRITERIO:
B) POR SU RELACIN CAUSAL.
a. Independientes
Generalmente se simbolizan estas variables con la letra mayscula X; y
son aquellas que no dependen de ninguna variable dentro de un
contexto determinado.
Indica: causa, antecedente, fundamento.
b. Dependientes
Generalmente se simbolizan estas variables con la letra mayscula Y; y
son aquellas que dependen de otra y otras variables dentro de un
contexto determinado.
Indica: efecto, consecuente, resultado.
Ejemplo:
El escaso fomento de la educacin financiera en la poblacin,
X
genera mayor desequilibrio econmico en las familias.
Y
En este ejemplo las variables son:
Educacin financiera = X (Variable independiente)

Desequilibrio econmico = Y (Variable dependiente)
TERCER CRITERIO:
C) POR SU NATURALEZA.
Clasificacin de mucha utilidad para fines estadsticos.
a. Variables Cualitativas.
Son aquellas cuyo dominio de variacin son objeto de clasificacin. Se

clasifican en:
Cualitativa Nominal.
Son aquellas cuyo dominio de variacin son objeto de

clasificacin y no admiten un orden en particular.

Ejemplo:
DOMINIO DE
VARIABLE
VARIACIN
- Masculino
GENERO
- Femenino
- Puno
- Juliaca
- Ilave
PROCEDENCIA
- Azngaro
DEL
- Yunguyo
ESTUDIANTE
- Arequipa
UNIVERSITARIO
- Cusco
-
Cualitativa Ordinal.
Son aquellas cuyo dominio de variacin son objeto de clasificacin y

admiten un orden.
Ejemplo:
DOMINIO DE
VARIABLE
VARIACIN
- Analfabeto
NIVEL DE - Primaria
INSTRUCCIN - Secundaria
- Superior
NIVEL - Bajo
SOCIO- - Medio
ECONMICO - Alto
- Bachiller
- Magister
GRADO ACADMICO
- Doctor
- Post Doctorado

b. Variables Cuantitativas.
Son aquellas cuyos valores del dominio de variacin son contados o

medidos. Se clasifican en:
Cuantitativa Discreta.
Cuando los valores del dominio de variacin son contados; y por
lo tanto slo pueden asumir valores enteros.
Ejemplo:
DOMINIO DE
VARIABLE
VARIACIN
- 112 nios
NMERO DE
NACIDOS VIVOS - 10 nios
- 50 alumnos
NMERO DE ALUMNOS - 46 alumnos
- 35 alumnos
Cuantitativa Contina.
Cuando los valores del dominio de variacin son susceptibles de

ser medidos, los cuales asumen valores decimales.
Ejemplo:
VARIABLE DOMINIO DE VARIACIN
- 56,50 Kg.
PESO
- 59,75 Kg.
- 96,50 Kg.
INGRESO - S/. 2708.50

ECONOMICO - S/. 4987.75
- S/. 6793.25
- 28,5 C
TEMPERATURA
- 32,6 C
- 25,3 C

CAPTULO II
MTODOS ESTADSTICOS
DEFINICIN.
Los mtodos estadsticos son un conjunto de procedimientos que se aplican en

una secuencia lgica con el fin de recopilar, organizar, presentar, analizar e
interpretar datos cualitativos o cuantitativos de fenmenos sujetos a
variaciones.
ETAPAS DEL MTODO ESTADSTICO
El mtodo estadstico, parte de la observacin de un fenmeno, y como no

puede siempre mantener las mismas condiciones predeterminadas o a
voluntad del investigador, deja que acten libremente, pero se registran las
diferentes observaciones y se analizan sus variaciones. Para el planeamiento de
una investigacin, por norma general, se siguen las siguientes etapas:
1. Planteamiento del problema.

2. Fijacin de los objetivos.
3. Formulacin de la hiptesis.
4. Definicin de la unidad de observacin y de la unidad de medida.
5. Determinacin de la poblacin y de la muestra.
6. La recoleccin.
7. Crtica, clasificacin y ordenacin.
8. Tabulacin.
9. Presentacin.
10. Anlisis.
11. Publicacin.

1. PLANTEAMIENTO DEL PROBLEMA

Al abordar una investigacin se debe tener bien definido qu se va a
investigar y por qu se pretende estudiar algo. Es decir, se debe
establecer una delimitacin clara, concreta e inteligible sobre el o los
fenmenos que se pretenden estudiar, para lo cual se deben tener en
cuenta, entre otras cosas, la revisin bibliogrfica del tema, para ver su
accesibilidad y consultar los resultados obtenidos por investigaciones
similares, someter nuestras proposiciones bsicas a un anlisis lgico;
es decir, se debe hacer una ubicacin histrica y terica del problema.
2. FIJACIN DE LOS OBJETIVOS

Luego de tener claro lo que se pretende investigar, Debemos
presupuestar hasta dnde queremos llegar; en otras palabras, debemos
fijar cules son nuestras metas y objetivos. Estos deben plantearse de
tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo
plazo, as como entre los objetivos generales y los especficos.
3. FORMULACIN DE LAS HIPTESIS

Una hiptesis es ante todo, una explicacin provisional de los hechos
objeto de estudio, y su formulacin depende del conocimiento que el
investigador posea sobre la poblacin investigada. Una hiptesis
estadstica debe ser susceptible de decimar, esto es, debe poderse
probar para su aceptacin o rechazo .Una hiptesis que se formula
acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa
por Ho; a su hiptesis contraria se le llama Hiptesis Alternativa(H1).
4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD

DEMEDIDA
La Unidad de Observacin, entendida como cada uno de los elementos
constituyentes de la poblacin estudiada, debe definirse previamente,
resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a
las que se les har la medicin. La unidad de observacin puede estar
constituida por uno o varios individuos u objetos y denominarse
respectivamente simple o compleja. El criterio sobre la unidad de
medicin debe ser previamente definido y unificado por todo el equipo
de investigacin. Si se trata de medidas de longitud, volumen, peso,
etc., debe establecerse bajo qu unidad se tomarn las observaciones
ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad
de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la informacin.

5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA

Estadsticamente, la poblacin se define como un conjunto de
individuos o de objetos que poseen una o varias caractersticas
comunes. No se refiere esta definicin nicamente a los seres vivientes;
una poblacin puede estar constituida por los habitantes de un pas o
por los peces de un estanque, as como por los establecimientos
comerciales de un barrio o las unidades de vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas
e infinitas. Aqu el trmino infinito no est siendo tomado con el rigor
semntico de la palabra; por ejemplo, los peces dentro de un estanque
son un conjunto finito; sin embargo, en trminos estadsticos, puede ser
considerado como infinito. Muestra es un subconjunto de la poblacin a
la cual se le efecta la medicin con el fin de estudiar las propiedades
del conjunto del cual es obtenida. En la prctica, estudiar todos y cada
uno de los elementos que conforman la poblacin no es aconsejable, ya
sea por la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se est
midiendo, por ser demasiado grande el nmero de sus componentes o
no se pueden controlar; por eso se recurre al anlisis de los elementos
de una muestra con el fin de hacer inferencias respecto al total de la
poblacin. Existen diversos mtodos para calcular el tamao de la
muestra y tambin para tomar los elementos que la conforman, pero
no es el objetivo de este curso estudiarlos. Diremos solamente que la
muestra debe ser representativa de la poblacin y sus elementos
escogidos al azar para asegurar la objetividad de la investigacin.
6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin
de la informacin, la cual ha de partir, a menos que se tenga
experiencia con muestras anlogo, de una o varias muestras piloto en
las cuales se pondrn a prueba los cuestionarios y se obtendr una
aproximacin de la variabilidad de la poblacin, con el fin de calcular el
tamao exacto de la muestra que conduzca a una estimacin de los
parmetros con la precisin establecida. El establecimiento de las
fuentes y cauces de informacin, as como la cantidad y complejidad de
las preguntas, de acuerdo con los objetivos de la investigacin son
decisiones que se han de tomar teniendo en cuenta la disponibilidad de
los recursos financieros, humanos y de tiempo y las limitaciones que se
tengan en la zona geogrfica, el grado de desarrollo, la ausencia de
tcnica, etc. Es, entonces, descubrir dnde est la informacin y cmo y
a qu "costo" se puede conseguir; es determinar si la encuesta se debe
aplicar por telfono, por correo, o si se necesitan agentes directos que
recojan la informacin; establecer su nmero ptimo y preparar su
entrenamiento adecuado.

7. CRITICA, CLASIFICACIN Y ORDENACIN

Despus de haber reunido toda la informacin pertinente, se necesita la
depuracin de los datos recogidos. Para hacer la crtica de una informacin,
es fundamental el conocimiento de la poblacin por parte de quien depura
para poder detectar falsedades en las respuestas, incomprensin a las
preguntas, respuestas al margen, amn de todas las posibles causas de
nulidad de una -pregunta o nulidad de todo un cuestionario.
Separado el material de "desecho" con la informacin depurada se procede
a establecer las clasificaciones respectivas y con la ayuda de hojas de
trabajo, en las que se establecen los cruces necesarios entre las preguntas,
se ordenan las respuestas y se preparan los modelos de tabulacin de las
diferentes variables que intervienen en la investigacin. El avance
tecnolgico y la popularizacin de los computadores hacen que estas
tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.
8. LA TABULACIN
Una Tabla es un resumen de informacin respecto a una o ms variables,
que ofrece claridad al lector sobre lo que se pretende describir; para su fcil
interpretacin una tabla debe tener por lo menos: Un ttulo adecuado el
cual debe ser claro y conciso. La Tabla propiamente dicha con los
correspondientes subttulos internos y la cuantificacin de los diferentes
tems de las variables, y las notas de pie de cuadro que hagan claridad
sobre situaciones especiales de la tabla, u otorguen los crditos a la fuente
de la informacin.
9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en
la forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero
se debe tener cuidado con las variables que se van a presentar y la forma
de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin. Adems la eleccin
de determinada tabla o grfico para mostrar los resultados, debe hacerse
no slo en funcin de las variables que relaciona, sino del lector a quien va
dirigido el informe.
10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que
convierten las especulaciones de primera mano en aseveraciones cuya
confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma
de una decisin. Es el anlisis donde se cristaliza la investigacin. Esta es la
fase de la determinacin de los parmetros y estadsticos mustrales para
las estimaciones e inferencias respecto a la poblacin, el ajuste de modelos
y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar
las conclusiones definitivas.

11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay
otros estudiosos del mismo problema a quienes se les puede SISTEMAS DE
aportar informacin, conocimientos y otros puntos de vista acerca de l
(12).
CENSO
Es una investigacin que cubre a todos los miembros o elementos de una

poblacin dada; un censo completo es a menudo innecesario, antieconmico y
una molestia para el pblico y tambin que es menos efectivo que una
encuesta, para recoger ciertos tipos de informacin. Peridicamente se
levantan diferentes tipos de censos en todo el mundo, entre los ms conocidos
estn; el censo de poblacin y vivienda, censos agropecuarios, censos a las
empresas mercantiles y manufactureras, etc. Proporcionan datos muy
importantes sobre poblacin. Vivienda, empleos poblacin econmicamente
activa, uso de la tierra, tamao de las fincas, ganadera, etc., etc.
ENCUESTA
Es una investigacin en la cual la informacin se obtiene de una fraccin de la

poblacin llamada muestra; la encuesta por muestreo disfruta de cinco
ventajas que la hacen atractiva frente al censo, aun en los casos donde a este
se le considera prcticamente exclusivo, como son los estudios sobre poblacin
y estos son:
1. La realizacin de una encuesta resulta menos costosa que el censo.
2. La encuesta permite mayor rapidez en la recopilacin y anlisis de los

datos. Ya que en censo requiere de meses de intenso trabajo para la
publicacin de los datos.
3. El nmero de entrevistadores utilizado en la encuesta es mucho menor

y por consiguiente es posible ofrecerles una capacitacin ms eficaz y
una supervisin ms cuidadosa.
4. El resultado ser de una mejor calificacin y la mayor capacitacin del

personal de campo de la encuesta.
5. La encuesta por muestreo es menos notoria que el censo y no

constituye una pesadumbre para l pblico.
6. El censo proporciona datos hasta un nivel de subdivisiones geogrficas

muy pequeas.

ETAPAS DE UNA ENCUESTA POR MUESTREO
La planeacin: constituye el establecimiento de los objetivos de la

investigacin y la creacin de la estrategia general para obtener y
analizar los datos, incluye adems, la elaboracin de presupuestos,
revisin de literatura, definicin de objetivos especficos, etc.
La elaboracin de un diseo de investigacin: El diseo de la muestra

est relacionado estrechamente con la planeacin y por lo regular
ocurre en forma simultnea, consiste en una programacin preparada
de antemano con el objetivo de recolectar y analizar la informacin
necesaria para satisfacer los objetivos del estudio, al costo ms bajo
posible.
Diseo de la muestra (muestreo): Es el proceso de seleccionar ciertos

elementos de la poblacin; En esta etapa, el investigador debe definir
con claridad y cuidado la poblacin que se va a estudiar y la
generalizacin de los datos de la muestra que dicha poblacin
permitir.
Diseo del cuestionario: Es el proceso de adaptar los diferentes

objetivos del estudio a preguntas que permitan obtener la informacin
necesaria. Esta etapa incluye la formulacin del tipo de pregunta,
numero de estas, secuencia y los medios para mantener motivada a la
persona encuestada. Sus principales objetivos son:
1-Obtener informacin aplicable a los propsitos de la encuesta o

investigacin.
2-Recopilar las informaciones con el mximo de responsabilidad,
validez y con precisin.
El trabajo de campo: En esta etapa de la investigacin se incluye el

reclutamiento de entrevistadores, supervisores y otro personal de
campo. Adems, incluye la capacitacin del personal de campo,
preparacin de instrucciones escritas para los entrevistadores sobre el
uso del cuestionario, la recopilacin de los datos en el campo y el
control de calidad de las entrevistas, etc.
La verificacin y la codificacin: estos dos son procesos afines

diseados con el propsito de transcribir la informacin registrada en
los cuestionarios a una forma adecuada para el anlisis estadstico. El
objetivo bsico de la verificacin el eliminar las respuestas incompletas
o inconsistentes, como tambin los errores en el uso del cuestionario.
La codificacin es un proceso tcnico que consiste en convertir datos
cualitativos en datos numricos que puedan ser almacenados, contados
o tabulados con rapidez y facilidad.

La preparacin para el anlisis: Esta etapa incluye un conjunto de

actividades, como: digitacin de los datos, chequeos rutinarios para
determinar la compatibilidad de las respuestas, plan de tabulacin de
los datos. La digitacin es el procedimiento utilizado para el
almacenamiento de la informacin y constituye el primer paso despus
de la codificacin para registrar los datos, de manera tal que puedan ser
fcilmente recuperados y tabulados.
Anlisis y preparacin del informe: Consiste en la presentacin e

interpretacin de tablas simples y de mltiples entradas de los datos
recopilados en la investigacin. El objetivo de esta etapa es
proporcionar un resumen de los datos, capaz de satisfacer los
propsitos de la investigacin, lo ms breve y comprensible posible.
Puede incluir tablas de porcentajes, medidas de tendencia central, medidas de

asociacin, pruebas de hiptesis, estimaciones, etc. Es importante tener
presente tres aspectos bsicos en su planeacin. Estos son: el estilo en que se
va a escribir, la mecnica de presentacin del material y la organizacin de los
temas del informe.
Ejemplo:
Se desea recabar informacin de una institucin o empresa pblica o

privada sobre el estado fsico y lgico de las computadoras y las
necesidades o problemas que tiene el operador o trabajador y los
usuarios o clientes de la institucin o empresa, con el fin de brindar un
servicio eficiente y de calidad a los operadores o trabajadores y los
usuarios o clientes de la institucin o empresa.
Para ello se puede elaborar 2 encuestas: una dirigida a los operadores o

trabajadores de la institucin y la otra los usuarios o clientes de la
institucin.

CAPTULO III
DISTRIBUCIN DE FRECUENCIAS.
Es un proceso de la Estadstica Descriptiva que comprende la agrupacin de

datos en categoras mutuamente excluyentes en la que se indica el nmero de
observaciones en cada categora. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente en
cada clase, todo ello presentado en tablas.
Ejemplo 01. A continuacin se dan las remuneraciones semanales en Soles de

50 empleados de una Empresa textilera. Cuyas remuneraciones son las
siguientes:
196 177 184 192 180 150 179 197 200 180
242 255 205 228 196 230 170 216 175 196
226 230 218 235 197 210 217 205 200 191
203 190 221 173 185 225 190 201 174 180
218 208 200 191 187 195 201 200 204 194
Al observar los datos podemos apreciar su variabilidad y tambin el desorden

en que se encuentran, esto hace difcil el anlisis lo cual no permite destacar
los hechos ms importantes para obtener conclusiones acertadas que ayuden
en la interpretacin. De all se hace necesario ordenar los datos en una tabla de
distribucin de frecuencias.
Para elaborar una tabla de distribucin de frecuencias, se debe seguir los

siguientes pasos:
a) Clculo del recorrido o rango (R).
El rango se define como la distancia entre el dato mximo y el dato mnimo.

Se halla restado el dato mayor (Xmax) con el dato menor (Xmin):
R = Xmax - Xmin
Para los datos dados anteriormente se tiene:

R= Xmax - Xmin = 255- 150 = 105

b) Determinacin del nmero de intervalos de clases (K).
El nmero de clases, es el nmero de categoras o intervalos en el que se va

a dividir la informacin.
El nmero de clases se puede fijar arbitrariamente, dependiendo del
nmero de datos que se tenga.
Sin embargo, existe tambin otra forma de determinar el nmero de clases

con bastante aproximacin, la cual se le conoce con el nombre de REGLA
DE STURGES y cuyo clculo responde a la siguiente frmula:
K = 1 + 3,322 Log. ( n )
K = 1 + 3.322 Log(50)
K = 1 + 3.322 (1,698970004)
K = 6.643978354
K = 6, 7 u 8 Intervalos
Elegimos los 3 enteros prximos al resultado. Esto significa que la

informacin se puede dividir en 6,7 u 8 intervalos de clase, o simplemente
clases.
c) Determinacin de la amplitud o ancho de intervalo (C).
Llamado tambin ancho de clase, la amplitud es el rango de cada intervalo

de clase. Un intervalo se forma por dos lmites que definen una clase.
R
C
K
El valor de la amplitud del intervalo, depender de la cantidad de decimales

que tengan los datos en general; es decir, si los datos no tienen decimales,
entonces el valor de la amplitud se redondea a un valor entero, pero si los
datos tienen decimales, entonces la amplitud se redondea a un nmero
que tenga la misma cantidad de decimales que los datos.
C1= 105/6 = 17.5

C2= 105/7 = 15
C3= 105/8 = 13.125

Finalmente decidimos que usaremos K=7 intervalos con un ancho de

clases C=15. POR LA SIGUIENTE RAZON: descartamos C3 porque en su
redondeo se pierde decimales (esto conlleva a que el lmite superior del
ltimo intervalo se reducira y no habra lugar para asignar el valor
mximo del conjunto de datos). El ancho de clase C1, tiene redondeo
favorable pero C2 es entero igual a los datos originales, es por ello que
elegimos este ancho de clase con su respectivo nmero de intervalos
(K=7).
Nota: en el caso de que dos o tres anchos de clase tuviesen redondeo

favorable, de ellos debemos elegir al que tenga menor diferencia en su
redondeo (para que el lmite superior del ltimo intervalo no se exceda
mucho)
d) Formacin de los intervalos de clase (Ii)
Formar los intervalos de clase, significa hallar los lmites inferior y superior
de cada intervalo de clase; y para ello se parte del dato menor (Xmin = 150) y
se le suma la amplitud del intervalo (C = 15), de la siguiente manera:
Primera Clase:
Intervalo Primera Clase:
150 + 15 = 165
[150 165)
Limite
Limite Amplitud
Superior
Inferior
Luego 150 constituye el lmite inferior y 165 el lmite superior.
El procedimiento se sigue con las dems clases hasta la ltima clase; de tal
forma que se obtiene lo siguiente:
Nmero de
Intervalos [ Ii )
1 [ 150 -165 )
2 [ 165 -180 )
3 [ 180 -195 )
4 [ 195 -210 )
5 [ 210 -225 )
6 [ 225 -240 )
7 [ 240 -255 ]

Una forma prctica de determinar los intervalos de clase, consiste en hallar

primero todos los lmites inferiores de cada clase, sumndoles la amplitud del
intervalo.
Los intervalos de frecuencias son cerrados por la izquierda y abiertos por la

derecha esto implica que el valor del lmite inferior es considerado dentro de
este intervalo por estar denotado por [ = intervalo cerrado, pero el valor del
lmite superior no se considera dentro del intervalo porque esta denotado por
) = intervalo abierto, en su lugar se considera a los valores menores al lmite
superior.
Nota: Los intervalos no siempre van a tener la misma amplitud. De acuerdo a la

investigacin y a la necesidad de presentar la informacin para su anlisis
correspondiente, es posible tener tres tipos de intervalos:
Intervalos de Intervalos de
Intervalos abiertos
amplitud igual diferente amplitud
Grandes grupos de Peso de pacientes
Edad (aos)
edad (aos) en (Kg.)
[ 16 20 ) [ 0 15) Menor de 55
[ 20 24 ) [15 64) [55 60)
[ 24 28 ) [64 85) [60 65)
[ 28 32 ) [65 70)
[ 32 36 ] 70 y ms
e) Frecuencia absoluta (fi)

Es el nmero de veces que se repiten los valores dentro de los diferentes
intervalos en que se ha dividido la informacin.
Para obtener la frecuencia absoluta de cada clase, se efecta la tabulacin

o conteo.
[ Ii ) Tabulacin fi
[ 150 -165 ) / 1
[ 165 -180 ) ///// / 6
[ 180 -195 ) ///// ///// // 12
[ 195 -210 ) ///// ///// ///// // 17
[ 210 -225 ) ///// / 6
[ 225 -240 ) ///// / 6
[ 240 -255 ] // 2
TOTALES 50

f) Frecuencia absoluta acumulada (Fi)

Se obtiene sumando y acumulando los valores absolutos clase por clase en
orden ascendente.
En la 1ra. clase : F1 = f1
En la 2da. clase : F2 = f1 + f2
En la 3ra. clase : F3 = f1 + f2 + f3
. . . . .
En la clase i : Fi = f1 + f2 + f3 + ... + fi
[ Ii ) fi Fi
[ 150 -165 ) 1 1
[ 165 -180 ) 6 7
[ 180 -195 ) 12 19
[ 195 -210 ) 17 36
[ 210 -225 ) 6 42
[ 225 -240 ) 6 48
[ 240 -255 ] 2 50
TOTALES 50
g) Frecuencia relativa (hi)

Es el valor que resulta al dividir cada una de las frecuencias absolutas entre
el total de datos. As:
f1
En la 1ra. clase: h1 =
n
f
En la 2da. clase: h2 = 2
n
En
fi general:
hi =
n
[ Ii ) fi Fi hi
[ 150 -165 ) 1 1 0.02
[ 165 -180 ) 6 7 0.12
[ 180 -195 ) 12 19 0.24
[ 195 -210 ) 17 36 0.34
[ 210 -225 ) 6 42 0.12
[ 225 -240 ) 6 48 0.12
[ 240 -255 ] 2 50 0.04
TOTALES 50 1

h) Frecuencia relativa acumulada (Hi)

Se obtiene sumando y acumulando los valores de las frecuencias relativas
clase por clase en orden ascendente.
En la 1ra. clase: H1 = h1
En la 2da. clase : H2 = h1 + h2
En la 3ra. clase: H3 = h1 + h2 + h3
. . . . .
. . . . .
En la clase i : Hi = h1 + h2 + h3 + ... + hi
Nota: Por lo general a las frecuencias relativas las multiplicamos por 100, con el
fin de obtener los valores expresados en porcentaje.
[ Ii ) fi Fi hi Hi
[ 150 -165 ) 1 1 0.02 0.02
[ 165 -180 ) 6 7 0.12 0.14
[ 180 -195 ) 12 19 0.24 0.38
[ 195 -210 ) 17 36 0.34 0.72
[ 210 -225 ) 6 42 0.12 0.84
[ 225 -240 ) 6 48 0.12 0.96
[ 240 -255 ] 2 50 0.04 1.00
TOTALES 50 1
i) Frecuencia relativa porcentual (hi %)

Es el resultado del producto de hi * 100%, cuyas interpretaciones
corresponden a valores porcentuales.
[ Ii ) fi Fi hi Hi hi %
[ 150 -165 ) 1 1 0.02 0.02 2
[ 165 -180 ) 6 7 0.12 0.14 12
[ 180 -195 ) 12 19 0.24 0.38 24
[ 195 -210 ) 17 36 0.34 0.72 34
[ 210 -225 ) 6 42 0.12 0.84 12
[ 225 -240 ) 6 48 0.12 0.96 12
[ 240 -255 ] 2 50 0.04 1.00 4
TOTALES 50 1 100

j) Frecuencia relativa acumulada porcentual (Hi %)

Es el resultado del producto de Hi * 100%, cuyas interpretaciones
corresponden a valores porcentuales.
[ Ii ) fi Fi hi Hi hi % Hi %
[ 150 -165 ) 1 1 0.02 0.02 2 2
[ 165 -180 ) 6 7 0.12 0.14 12 14
[ 180 -195 ) 12 19 0.24 0.38 24 38
[ 195 -210 ) 17 36 0.34 0.72 34 72
[ 210 -225 ) 6 42 0.12 0.84 12 84
[ 225 -240 ) 6 48 0.12 0.96 12 96
[ 240 -255 ] 2 50 0.04 1.00 4 100
TOTALES 50 1 100
k) Punto medio o marca de clase (Xi)

Se define como la semisuma de los lmites inferior y superior de cada
intervalo de clase.
Lmite Inferior Lmite Superior

Xi =
2
FINALMENTE EL CUADRO DE DISTRIBUCION DE FRECUENCIAS QUEDARA DE LA

SIGUIENTE FORMA:
[ Ii ) Xi fi Fi hi Hi hi % Hi %
[ 150 -165 ) 157.5 1 1 0.02 0.02 2 2
[ 165 -180 ) 172.5 6 7 0.12 0.14 12 14
[ 180 -195 ) 187.5 12 19 0.24 0.38 24 38
[ 195 -210 ) 202.5 17 36 0.34 0.72 34 72
[ 210 -225 ) 217.5 6 42 0.12 0.84 12 84
[ 225 -240 ) 232.5 6 48 0.12 0.96 12 96
[ 240 -255 ] 247.5 2 50 0.04 1.00 4 100
TOTALES 50 1 100

Propiedades y Relaciones de las Frecuencias
1) Las frecuencias absolutas son cantidades enteras positivas nunca

negativas ni nmeros decimales (puede ser cero en algunos casos).
2) Las frecuencias relativas se pueden expresar en tanto por uno (nmeros

decimales mayores o iguales que cero, pero menores o iguales que 1);
tambin pueden expresarse en porcentajes. Es decir:
0 hi 1
0% hi % 100%
3) La suma de las frecuencias absolutas de todas las clases es igual al

nmero total de datos.
k
f
i 1
i n
4) La suma de las frecuencias relativas es igual a 1,00 100%.

k
h
i 1
i 1
h % 100%
i 1
i
5) La frecuencia absoluta acumulada (Fk) de la ltima clase es igual al

nmero total de datos Fk = n.
6) La frecuencia relativa acumulada de la ltima clase es igual a 1 100%.

INTERPRETACIONES (DEL CUADRO DE DISTRIBUCION DE FRECUENCIAS):
Interpretar f3 :
f3 = 12 : Significa que 12 de los 50 empleados textiles tienen ingresos
semanales de 180 a menos de 195 Nuevos Soles.
Interpretar f6 :
f6 = 6 : Significa que 6 de los 50 empleados textiles tienen ingresos
semanales de 225 a menos de 240 Nuevos Soles
Interpretar F3 :
F3 = 19 : Significa que 19 de los 50 empleados textiles tienen ingresos
semanales de 150 a menos de 195 Nuevos Soles.
Interpretar F6 :
F6 = 48 : Significa que 48 de los 50 empleados textiles tienen ingresos
semanales de 150 a menos de 240 Nuevos Soles
Interpretar h3 %:
h3 = 24% : Significa que 24% de los 50 empleados textiles tienen
ingresos semanales de 180 a menos de 195 Nuevos Soles.
Interpretar h4 %:
h4% = 34 : Significa que 34% de los 50 empleados textiles tienen
Interpretar h6 %:
h6% = 12 : Significa que 12% de los 50 empleados textiles tienen
Interpretar H3 %:
H3% = 38% : Significa que 38% de los 50 empleados textiles tienen
Interpretar H6 %:
H6% = 96% : Significa que 96% de los 50 empleados textiles tienen

Ejemplo 02. A continuacin se dan las estaturas (en centmetros) de una

muestra de 50 estudiantes que estn matriculados en el curso de
Estadstica y son las siguientes:
150 156 159 163 164 166 167 169 171 173
152 157 160 163 164 166 168 169 171 174
154 158 161 164 164 166 168 170 172 176
155 158 162 164 165 167 169 170 172 178
156 159 163 164 165 167 169 170 173 184
a) Clculo del rango o recorrido (R).
El rango se define como la distancia entre el dato mximo y el dato

mnimo. Se halla restado el dato mayor (Xmax) con el dato menor (Xmin):
R = Xmax - Xmin

R= (Xmax = 184) - (Xmin = 150) = 34
b) Determinacin del nmero de intervalos de clases (K).

K = 1 + 3,322 Log. ( n )
K = 1 + 3.322 Log(50)
K = 1 + 3.322 (1,698970004)
K = 6.643978354
K = 6, 7 u 8 Intervalos
Elegimos los 3 enteros prximos al resultado. Esto significa que la

informacin se puede dividir en 6,7 u 8 intervalos de clase, o
simplemente clases.
c) Determinacin de la amplitud o ancho de intervalo (C).
Llamado tambin ancho de clase, la amplitud es el rango de cada

intervalo de clase. Un intervalo se forma por dos lmites que definen
una clase.

R
C
K
C1= 34/6 = 5,6666666 = 6

C2= 34/7 = 4,857143 = 5
C3= 34/8 = 4,25 = 4
Finalmente decidimos que usaremos K=7 intervalos con un ancho de

clases C=5. POR LA SIGUIENTE RAZON: descartamos C3 porque en su
redondeo se pierde decimales (esto conlleva a que el lmite superior del
ltimo intervalo se reducira y no habra lugar para asignar el valor
mximo del conjunto de datos). El ancho de clase C1, tiene redondeo
favorable en una diferencia mayor al C2 (esto conlleva a que el lmite
superior de la ltima clase se extienda en ms unidades) mientras que
C2 tambin se redondea a C=5 pero en su diferencia es menor al de C1
(es en todo caso el ms adecuado porque el lmite superior de la ltima
clase se extender en un nmero menor de unidades).
d) Formacin de los intervalos de clase ( Ii )

e) Frecuencia absoluta (fi)
f) Frecuencia absoluta acumulada (Fi)
g) Frecuencia relativa (hi)
h) Frecuencia relativa acumulada (Hi)
i) Frecuencia relativa porcentual (hi %)
j) Frecuencia relativa acumulada porcentual (Hi %)
k) Punto medio o marca de clase (Xi)
El cuadro de distribucin de frecuencias de las estaturas (en centmetros)

de una muestra de 50 estudiantes que estn matriculados en el curso de
estadstica quedara de la siguiente forma:
[ 150 - 155 ) 152,5 3 3 0,06 0,06 6 6
[ 155 - 160 ) 157,5 8 11 0,16 0,22 16 22
[ 160 - 165 ) 162,5 12 23 0,24 0,46 24 46
[ 165 - 170 ) 167,5 14 37 0,28 0,74 28 74
[ 170 - 175 ) 172,5 10 47 0,2 0,94 20 94
[ 175 - 180 ) 177,5 2 49 0,04 0,98 4 98
[ 180 - 185 ] 182,5 1 50 0,02 1 2 100
TOTALES 50 1 100

INTERPRETACIONES:
Interpretar f4 :
f4 = 14 : Significa que 14 de los 50 estudiantes que estn
matriculados en el curso de Estadstica tienen estaturas de 165 cm.
a menos de 170 cm.
Interpretar F3 :
F3 = 23 : Significa que 23 de los 50 estudiantes que estn
a menos de 165 cm.
Interpretar F5 :
F5 = 47 : Significa que 47 de los 50 estudiantes que estn
a menos de 175 cm.
Interpretar h3 %:
h3% = 24% : Significa que 24% de los 50 estudiantes que estn
a menos de 165 cm.
Interpretar h6 %:
h6% = 4% : Significa que solo el 4% de los 50 estudiantes que estn
a menos de 180 cm.
Interpretar H3 %:
H3% = 46% : Significa que 46% de los 50 estudiantes que estn
a menos de 165 cm.

GRAFICAS ESTADISTICAS
HISTOGRAMA DE FRECUENCIAS
Son grficas de rectngulos cuyas bases representan los Intervalos de Clase
y las alturas las Frecuencias Absolutas o Relativas. (Ii , ni), (Ii , fi), (Ii , hi)
Este grfico nos permite comparar frecuencias.
LAS HISTOGRAMAS PARA LOS EJEMPLOS ANTERIORES SERIAN:
POLIGNO DE FRECUENCIAS
Es una poligonal construida uniendo los puntos (Xi, fi) o (Xi, hi) mediante
segmentos de rectas. Los polgonos de frecuencia nos permite comparar
varias distribuciones superpuestas cuando todas ellas estn expresadas en
la misma escala y en lo posible tienen los mismos lmites de clase.

LOS POLIGONOS DE FRECUENTCIAS PARA LOS EJEMPLOS ANTERIORES SERIAN:
OJIVA
Es una grfica construida con los puntos cuyas abscisas son los lmites superiores
de las clases y las ordenadas son las frecuencias absolutas acumuladas o relativas
acumuladas o las porcentuales. Se aade una clase con frecuencia cero antes de la
primera clase.
LAS OJIVAS PARA LOS EJEMPLOS ANTERIORES SERIAN:

GRAFICAS DE SECTORES ANGULARES O DIAGRAMAS CIRCULARES.
Las cantidades porcentuales se transforman a grados sexagesimales

mediante la relacin:
f i * 360
i hi * 360
n
Donde :
i : es el ngulo que tomara cada intervalo de frecuencias
fi : es la frecuencia absoluta
n : es el nmero de datos
hi : es la frecuencia relativa.
LAS GRAFICAS DE SECTORES ANGULARES O DIAGRAMAS CIRCULARES PARA

LOS EJEMPLOS ANTERIORES SERIAN:

PICTOGRAMA
Son grficas de figuras, imgenes o esquemas relacionadas a los datos,

cuyas bases representan los Intervalos de Clase y las alturas las Frecuencias
Absolutas o Relativas. (Ii , ni), (Ii , fi), (Ii , hi) Este grfico tambin permite
comparar frecuencias.

CAPTULO IV
MEDIDAS DE TENDENCIA CENTRAL y DE POSICION
INTRODUCCIN
Los datos organizados en una distribucin de frecuencias, destacan sus

caractersticas ms esenciales, como marcas de clases, tipo de distribucin
(asimtrica, simtrica, normal, etc.).
Sin embargo los indicadores que describen a los datos en forma ms

precisa, deben calcularse. Estos indicadores resumen los datos de medidas
descriptivas que se refiere a la centralizacin o posicin, a la dispersin o
variacin, a la asimetra, y a la curtosis de los datos.
Las medidas de posicin reflejan la tendencia central y la localizacin de los

datos. Las de tendencia central, denominados tambin promedios, ubican
el centro de los datos, entre ellos tenemos.
a) Promedio aritmtico.
b) Promedio aritmtico ponderado.
c) Promedio geomtrico.
d) Promedio armnico.
e) Promedio cuadrtico.
f) Promedio cbico.
g) Moda
h) Mediana.
MEDIDAS DE POSICIN
i) Cuartiles.
j) Quintiles
k) Deciles
l) Percentiles.
Las de localizacin indican el lugar de los datos ms frecuentes (moda) o de

los menos frecuentes a partir de los cuartiles.

4.1. PROMEDIO ARITMTICO.
El promedio aritmtico, a veces denominado simplemente media, puede

definirse como la clase que determina el centro de gravedad del conjunto,
es la suma de los valores observados de la variable, dividido por el nmero
de observaciones. Es una medida solamente aplicable a mediciones de
variables por intervalos o de razn.
Caractersticas.
a) En el valor del promedio aritmtico influyen todos los componentes

de la distribucin.
b) El promedio aritmtico es seriamente afectada por los valores
extremos.
c) La suma de las desviaciones medidas desde el promedio aritmtico
es cero.
d) La suma de los cuadrados de las desviaciones del promedio
aritmtico es menor que aquellas computadas con respecto a
cualquier otra tendencia central.
e) Puede ser manejada algebraicamente.
Ventajas.
a) El promedio aritmtico es, en s, la medida ms fcil de entender y

la ms comnmente usada. Es un valor tal que si se calculara para
un grupo en el cual todos los elementos fueran iguales, cada uno de
ellos sera igual a su promedio aritmtico, de donde podemos
deducir que el promedio aritmtico de n elementos es un nuevo
elemento formado, tomando una parte igual a 1/n de cada uno de
los elementos originales.
b) Esta medida se define en forma rgida por una ecuacin
matemtica muy fcil de entender y algunas veces, se puede
obtener cuando no es posible calcular otros tipos de medidas de
tendencia central y an en el caso de no conocer los valores
individuales de la serie.
c) El promedio aritmtico es extraordinariamente estable en el
muestreo.
d) Es altamente sensible a cualquier cambio en los datos de la
distribucin.
e) Es excepcionalmente adaptable cuando se trata de hacer clculos
matemticos posteriores con l.
Desventajas.
a) Es muy sensible a los valores muy grandes o muy pequeos,

especialmente a los primeros, y la inclusin de tales datos extremos

en la distribucin que se est estudiando, puede dar un promedio

aritmtico que no sea realmente el representante tpico del grupo.
b) Cuando una distribucin es marcadamente asimtrica en tal forma
que el promedio aritmtico, la mediana y la moda difieren en forma
apreciable, debe considerarse siempre de que el promedio
aritmtico pueda no ser el valor nico representativo de la serie.
c) Cuando la distribucin tiene forma de U; es decir, parablica, este
corresponde a los valores menos comunes en la serie y por tanto,
puede dar una idea irreal de la distribucin.
4.1.1. Promedio aritmtico para datos no agrupados o dispersos.
Sea X una variable aleatoria con valores X1, X2,....Xn; entonces la media
aritmtica o promedio est dado por:
X i
X i 1
Ejemplo: Considere las notas de 7 estudiantes del curso de Estadstica:

12, 14, 15, 16, 13, 15, 12; hallar el promedio aritmtico.
Solucin: n=7
X1 = 12 X5 = 13
X2 = 14 X6 = 15
X3 = 15 X7 = 12
X4 = 16
Aplicando la frmula del promedio aritmtico se tiene:

n
X i
X 1 X 2 X 3 ... X 7
X i 1

n 7
12 14 15 16 13 15 12 97
X 13,8571429
7 7
El promedio de notas de los 7 estudiantes del curso de Estadstica es de

aproximadamente 13.86.

4.1.2. Promedio aritmtico para datos agrupados
Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con
sus respectivas frecuencias absolutas f1, f2, ... , fk; entonces la media
aritmtica o promedio est dado por:
fX i i
X i 1
n
Ejemplo: Considere la estatura (en centmetros) de una muestra de 50

estudiantes que estn matriculados en el curso de Estadstica
[ Li - Ls > Xi fi fiXi
[150 - 155) 152,5 3 457,5
[155 - 160) 157,5 8 1260,0
[160 - 165) 162,5 12 1950,0
[165 - 170) 167,5 14 2345,0
[170 - 175) 172,5 10 1725,0
[175 - 180) 177,5 2 355,0
[180 - 185] 182,5 1 182,5
Total 50 8275,0
Solucin:
K = 7 (7 intervalos de clase)
n = 50
f X i i
f1 X 1 f 2 X 2 f 3 X 3 ... f 7 X 7
X i 1

50 50
(3)(152,5) (8)(157,5) ... (1)(182,5) 8275
X 165,5
50 50
El promedio de estatura de los 50 estudiantes que estn matriculados en el

curso de Estadstica, es 165,5 centmetros.
4.2. PROMEDIO ARITMTICO PONDERADO.
El promedio aritmtico ponderado permite calcular un promedio que toma

en cuenta la importancia o el peso que tiene cada valor sobre el total. De
ah que en tal caso la denominacin de promedio aritmtico ponderado.
Tericamente, todos los promedios aritmticos son ponderados. Si no se
dan pesos especficos a todos y cada uno de los valores de la serie, asume

que cada observacin tiene el mismo peso y se asigna implcitamente un

peso de 1, y se les llama a menudo promedio aritmtico simple o promedio
aritmtico no ponderado. Para datos agrupados en clases, las frecuencias
de clase pueden ser consideradas como una serie de pesos para los
distintos puntos medios (o marcas de clase) en el clculo del promedio
aritmtico.
Para este tipo de promedio se utiliza la siguiente frmula:
n1 X1 n2 X 2 ... nk X k
X
n1 n2 ... nk
Donde:
k : nmero de grupos o categoras
4.3. PROMEDIO GEOMTRICO.
El promedio geomtrico ( X G ) de n valores positivos X1, X2,....Xn es el valor que se

define como la raz n-sima del producto de estos n valores.
El promedio geomtrico se utiliza para promediar tiempos que siguen una

tendencia exponencial, razones (a/b), ndices (a/b en %) proporciones (a/(a+b)),
tasas de cambio (a-b)/b), entre otros.
Ventajas
a) Se define rgidamente por una frmula matemtica.

b) Se utiliza cuando se quiere dar importancia a valores pequeos de la
variable.
c) Es sensible a cualquier cambio en los valores de la distribucin.
d) Su valor no es influenciable por los datos extremos, como sucede con los
otros promedios.
e) Es indispensable cuando se desea sacar el promedio de una serie de
valores que estn en progresin o aproximadamente geomtrica.
Desventajas
a) La primera de todas, es la complicacin de su clculo.

b) Si cualquier dato de la serie original es 0, el promedio geomtrico toma el
valor 0.
c) Si un valor de la serie es negativo, el promedio aritmtico puede ser
negativo o imaginario, cuando el nmero de datos es par, tericamente
tiene dos valores: uno positivo y el otro negativo.

4.3.1 Promedio geomtrico para datos no agrupados
X G n ( X 1 )( X 2 )...( X n )
4.3.2 Promedio geomtrico para datos agrupados.
X G n ( X1 1 )( X 2 2 )...( X k k )
f f f
4.4. PROMEDIO ARMNICO.
Es otro estadgrafo de posicin. El promedio armnico ( X H ) se usa especialmente

cuando van a promediarse relaciones que son inversamente proporcionales como
es el tiempo en relacin a la velocidad, tipos de relaciones o tasas: tasas de
crecimiento, de mortalidad, etc.
Ventajas
a) Se usa preferencialmente para calcular la velocidad media.

b) De gran utilidad cuando la variable est dada en forma de tasas.
c) Con las relaciones formadas por una variable y una constante en el
promedio, el factor que es constante en la relacin o el factor que es la
variable en ella. El promedio armnico es nico para el segundo caso.
Desventajas
a) El promedio armnico est rgidamente definido por una frmula

matemticamente, su valor depende de cada uno de los datos de la
distribucin y el resultado puede ser usado en clculos posteriores.
4.4.1. Promedio armnico para datos no agrupados.
Sea X una variable aleatoria con valores X1, X2,....Xn; entonces el promedio
armnico est dado por:
n
XH n
1
i 1 X i
4.4.2. Promedio armnico para datos agrupados.
Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con sus
respectivas frecuencias absolutas f1, f2, ... , fk; entonces la media aritmtica o
promedio est dado por:

n
XH k
fi
X
i 1 i
4.5. PROMEDIO CUADRTICO.
Se define como la raz cuadrada de la media de los cuadrados de la variable. Es

aplicable tanto para datos agrupados como para los datos no agrupados. Su
utilizacin es poco frecuente.
Ventajas
a) En algunos problemas de probabilidad, es tericamente recomendable

trabajar con el cuadrado de las cifras, donde es importante la media
cuadrtica.
Desventajas
a) El promedio est definido rgidamente por una frmula matemtica.

b) Se deja influenciar mucho por valores extremos, especialmente por los
grandes.
4.5.1. Promedio cuadrtico para datos no agrupados.
cuadrtico est dado por:
n
X i
2
Xc i 1
n
Ejemplo: Considere las notas de 7 estudiantes del curso de Estadstica: 12, 14,
15, 16, 13, 15, 12; hallar el promedio aritmtico.
X i
2
122 142 ... 122 1359
Xc i 1
13.93351561
n 7 7
4.5.2. Promedio cuadrtico para datos agrupados.
Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con sus
respectivas frecuencias absolutas f1, f2, ... , fk; entonces el promedio cuadrtico
est dado por:

k
X 2
i i f
Xc i 1
n

estudiantes que estn matriculados en el curso de Estadstica.
[ Li - Ls > Xi fi X2i * fi
[150 - 155) 152.5 3 69768.8
[155 - 160) 157.5 8 198450.0
[160 - 165) 162.5 12 316875.0
[165 - 170) 167.5 14 392787.5
[170 - 175) 172.5 10 297562.5
[175 - 180) 177.5 2 63012.5
[180 - 185] 182.5 1 33306.3
Total 50 1371762.5
X 2
i i f
152.52 * 3 157.52 * 8 ... 182.52 *1
Xc i 1

n 50
X 2
i i f
1371762 .5
Xc i 1
165.6358959
n 50
4.6. PROMEDIO CBICO.
Como la anterior, pertenece a los estadgrafos de posicin, siendo una medida

poco conocida y por tanto de uso limitado. Se define como la raz cbica del
promedio aritmtico de los cubos de los valores de la variable.
4.6.1. Promedio cbico para datos no agrupados.
cbico est dado por:
3
X i
3
X cubico i 1
n
Ejemplo: Considere las notas de 7 estudiantes del curso de Estadstica:

12, 14, 15, 16, 13, 15, 12; hallar el promedio aritmtico.

n
3
X i
3
123 143 ... 123 3 19243
Xc i 1
3 14.00849824
n 7 7
4.6.2. Promedio cbico para datos agrupados.
Sea X una variable aleatoria con marcas de clase X1, X2,....Xk; cada una con
sus respectivas frecuencias absolutas f1, f2, ... , fk; entonces el promedio
cbico est dado por:
k
3
X 3
i i f
X cbico i 1
n

[ Li - Ls > Xi fi X3i * fi
[150 - 155) 152.5 3 10639734.4
[155 - 160) 157.5 8 31255875.0
[160 - 165) 162.5 12 51492187.5
[165 - 170) 167.5 14 65791906.3
[170 - 175) 172.5 10 51329531.3
[175 - 180) 177.5 2 11184718.8
[180 - 185] 182.5 1 6078390.6
Total 50 227772343.8
3
X 3
i fi
152.53 * 3 157.53 * 8 ... 182.53 *1
Xc i 1
3
n 50
3
X 3
i i f
227772343 ,8
Xc i 1
3 165.7716762
n 50
4.7. LA MODA.

La moda ( X ), tambin es una medida de tendencia central, la moda de una serie
de datos es el valor, que se define como la observacin (dato) que ms veces se
repite (categora o puntuacin que ms se repite).
La moda se usa cuando se requiere sealar el valor ms comn de una serie de

datos. La moda es una medida menos importante que la mediana debido a su
ambigedad. La moda no siempre existe y si existe, no siempre es nica.

Si el conjunto de datos tiene una sola moda se llama unimodal, si tiene dos modas
se llama bimodal. En general, si tiene ms de dos modas, se llama multimodal.
Se utiliza en cualquier nivel de medicin.
Ventajas
a) El hecho de que la moda indica el punto de mayor concentracin, lo hace

tal vez, la mejor medida de tendencia central. Cuando una distribucin es
muy asimtrica, claramente se ve que la moda es el ms representativo del
grupo, y en algunos casos, si la moda y el promedio aritmtico son
significativamente diferentes de su valor, es preferible usar la moda.
b) En series polimodales, la moda permite dividir la distribucin con fines de
estratificacin.
Desventajas
a) La moda es fcil de calcular en una serie agrupada y las probabilidades de

su clculo no son de mucha confianza.
b) La moda es muy inestable en el muestreo.
c) La moda no puede ser usada fcilmente en procesos algebraicos
posteriores.
d) La moda no es sensible a cambio de valores de la distribucin, a menos
tales cambios afecten su propio valor.
e) No es recomendable en la variable continua cuando la amplitud en los
intervalos es diferente.
4.7.1. Moda para datos no agrupados.
Ejemplo: Las siguientes edades corresponden a 10 estudiantes que llevan el

curso de Estadstica.
18, 20, 18, 23, 19, 17, 19, 18, 20, 22, 18, determine la moda.
Solucin: Contando el nmero de ocurrencias de cada dato tenemos:
VALORES OCURRENCIAS
17 1
18 4
19 2
20 2
22 1
23 1
La moda para la edad de los estudiantes que llevan el curso de Estadstica es

de 18 aos.

4.7.2. Moda para datos agrupados.
Cuando los datos estn tabulados: la clase que contiene mayor frecuencia ser
la que contiene a la moda, y se le llama clase modal.
1
Mo Li [ ]C
(1 2 )
Donde:
1 fi fi1
2 fi fi1
Li: Es el lmite inferior del intervalo modal.

fi: Es la frecuencia absoluta donde se encuentra la moda.
fi-1
: Es la frecuencia absoluta anterior donde se encuentra la moda.
fi+1
: Es la frecuencia absoluta posterior donde se encuentra la
moda.
C : Es la amplitud del intervalo modal.

[ Li - Ls > Xi fi
[150 - 155) 152,5 3
[155 - 160) 157,5 8
[160 - 165) 162,5 12
[165 - 170) 167,5 14
[170 - 175) 172,5 10
[175 - 180) 177,5 2
[180 - 185] 182,5 1
Total 50
Solucin:
Primeramente se identifica donde se encuentra la clase modal, para nuestro

ejemplo, la moda (mayor frecuencia) se encuentra en la clase 4 (f4 = 14).
( fi fi1 )
X Li C
( fi fi1 ) ( fi fi1 )

X 165 14 12
5
(14 12) (14 10)


X 165 2
5
(2) (4)

X 166.66666 167
La moda en la estatura de los 50 estudiantes que estn matriculados en el

curso de Estadstica es de 167 centmetros.
4.8. MEDIANA.
La mediana ( X~ ) es el valor que divide a la distribucin por la mitad. Esto es, la

mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por
encima de la mediana.
La mediana refleja la posicin intermedia de la distribucin y cuando las

observaciones se han ordenado por su magnitud creciente o decreciente. La
mediana es una medida de tendencia central propia de los niveles de medicin
ordinal. Por intervalos y de razn.
Ventajas
a) La mediana tiene una definicin rgida y el concepto que envuelve es tan

claro, que cualquiera puede entenderlo aun no siendo familiar el trmino.
b) Si los datos estn ordenados en un cuadro de frecuencia, esta medida es
fcil de calcular y por otro lado, los datos extremos no tienen ninguna
influencia en ella.
c) Tiene menos estabilidad en el muestreo que el promedio aritmtico, pero
es ms estable que otras medidas.
d) Hay situaciones en que la nica medida de tendencia central que puede
calcularse en la mediana, tal como sucede en el caso de una distribucin
cuyos intervalos extremos no estn definidos.
Desventajas
a) No es tan conocido como el promedio aritmtico.

b) Es necesario ordenar los datos para poderla calcular.
c) La mediana no se adapta a clculos posteriores aritmticos, por cuanto que
si obtenemos las medianas de diferentes grupos, no podemos obtener una
mediana de los grupos reunidos.
d) La mediana no es sensible a cambios de valores de los elementos que
componen la distribucin.

4.8.1. Mediana para datos no agrupados.
Si n valores de alguna variable cuantitativa X son ordenados en forma

creciente (ascendente), obteniendo la serie ordenada:
X1 X2 .......... X i ......... Xn
Entonces su mediana, est dada por:
~
Me X X ( n1) / 2 Si n es un nmero impar.
~ X X ( n 2 ) / 2
Me X n / 2 Si n es un nmero par.
2
Ejemplo:
a) Si n es impar; determinar la mediana de las siguientes edades: 20, 24,

18, 19, 23, 21, 19.
i) Ordenamos las edades en forma ascendente (creciente)
18 19 19 20 21 23 24
X1 X2 X3 X4 X5 X6 X7
ii) Ubicamos la mediana, para n impar:
~
Me X X ( n1) / 2 X (71) / 2 X 8 / 2 X 4
Entonces la ubicacin X4 corresponde a X4 = 20, la cual es la mediana de

las edades.
b) Si n es par; determinar la mediana de las siguientes edades: 25, 18, 28,

22, 20, 27, 21, 26.
i) Ordenamos las edades en forma ascendente (creciente)
18 20 21 22 25 26 27 28
X1 X 2 X3 X4 X5 X6 X7 X8
ii) Ubicamos la mediana, para n par:
X~ X ( n ) / 2 X (8 / 2) X 8 / 2 X 4 22
~
Me X X ( n2) / 2 X (82) / 2 X 10/ 2 X 5 25

Luego la mediana es:
~ X X (n2) / 2 22 25 47
Me X n / 2 23,5
2 2 2
Entonces, la mediana de las edades es de 23,5 aos.
4.8.2. Mediana para datos agrupados.
a) Si los valores de una variables discreta se tabulan en una distribucin de la

forma, dato-frecuencia, el clculo de la mediana se hace siguiendo el
procedimiento anterior.
b) Si los valores de una variable (discreta o continua) se tabulan en una

distribucin de frecuencias por intervalos, la mediana se determina
aproximadamente por interpolacin a partir de la distribucin de
frecuencias acumuladas.
c) Para frecuencias relativas.
~ n / 2 Fi 1
Me X Li C
f i
Donde:
Li : es el lmite inferior de la mediana.

n : es el nmero de datos observados.
Fi-1 : es la frecuencia acumulada absoluta del intervalo
inmediatamente inferior al intervalo de la mediana.
fi : es la frecuencia absoluta del intervalo de la mediana.
C : es la amplitud del intervalo de la mediana.

[Li - Ls> Xi fi Fi
[150 - 155) 152.5 3 3
[155 - 160) 157.5 8 11
[160 - 165) 162.5 12 23
[165 - 170) 167.5 14 37
[170 - 175) 172.5 10 47
[175 - 180) 177.5 2 49
[180 - 185] 182.5 1 50
Total 50

Solucin:
a) Primero se halla la clase mediana considerando: n/2 = 50/2 = 25 este

valor resultante se busca en la Fi, si no se encuentra considerar el
primero que lo supere, en este caso corresponde a 37 del intervalo 4 (I i
= I4), (i = 4).
b) Entonces: fi = f4 = 14,
Fi-1 = F4-1 = F3 = 23,
Li = L4 = 165
c) Se reemplaza estos valores en la frmula de la mediana para datos

agrupados.
~ n / 2 Fi 1
Me X Li ( )C
fi
~ 50 / 2 23
Me X 165 5 165.7142857 166
14
Considere la estatura (en centmetros) de una muestra de
La mediana de la estatura de los estudiantes que estn matriculados en el

curso de Estadstica es de 166 centmetros.
4.9. MEDIDAS DE POSICIN (CUANTILES)
Como una consecuencia del estudio de la mediana, es fcil ampliar este concepto
a otros estadgrafos que dividen a los datos en otras proporciones y no slo en
mitades como lo hacen la mediana. Estas medidas se llaman cuantiles y estos
valores a menudo se expresan en porcentajes.
Se denomina cuantiles a los valores que dividen a los datos ordenados en 4, 5, 10

100 partes iguales (cuando la distribucin contiene un nmero alto de intervalos
o de marcas de clase), entre las cuales tenemos:
a) Cuartiles
b) Quintiles
c) Deciles
d) Percentiles.
4.9.1. CUARTILES.
Los cuartiles ( Qi ) son valores que dividen a un conjunto de datos ordenados en

forma ascendente o descendente en cuatro partes iguales, y se denota por Qi ,
donde i = 1, 2, 3.

La frmula del cuartil est dado del siguiente modo:
n(i)
Fi 1
Qi Li 4 C , i 1,2,3
fi

donde:
Li : es el lmite inferior del cuartil.

inmediatamente inferior al intervalo del cuartil.
fi : es la frecuencia absoluta del intervalo del cuartil.
C : es la amplitud del intervalo del cuartil.
Primer Cuartil: Q1
Es el valor que supera a no ms de un cuarto de las observaciones y es superado
por no ms de tres cuartos de ellas. Es decir, es el valor que deja 25% de las
observaciones menores o iguales a l y el 75% superiores a l.
Segundo Cuartil: Q2
Es el valor que supera a no ms de la mitad de las observaciones y es superado
~
por la otra parte. Coincide con la mediana; es decir, Q2 = X
Tercer Cuartil: Q3
Es el valor que supera a no ms de las tres cuartas partes de las observaciones y
superado por no ms de un cuarto de ellas. Es decir deja el 75 % de los datos
inferiores o iguales a l y el 25% de stas superiores a l.
Ejemplo: Considere la estatura (en centmetros) de una muestra de 50 estudiantes

que estn matriculados en el curso de Estadstica.
Encuentre el primero, segundo y tercer cuartil.
SOLUCIN

PRIMER CUARTIL:
La clase cuartil 1 seria: 50(1)/4=12,5 Buscamos este valor en Fi o el primero que
lo supere, en este caso corresponde al intervalo 3 ( I3)
En este caso i = 1
n(1) / 4 Fi 1
Q1 Li C
fi
50(1) / 4 11
Q1 160 5
12
12,5 11
Q1 160 5 160,625
12
Interpretacin:
El 25 % de los estudiantes tienen estaturas menores o iguales a 160,625

centmetros y el 75 % de los estudiantes tienen estaturas mayores a 160,625
centmetros.
SEGUNDO CUARTIL:
La clase cuartil 2 seria: 50(2)/4 = 25 Buscamos este valor en Fi o el primero que
lo supere, en este caso corresponde al intervalo 4 ( I4 )
El segundo cuartil, es exactamente igual a la mediana: Q2 = Me = 165.7142857,

porque tambin representa el 50% de la distribucin.
En este caso i = 2
n(2) / 4 Fi1
Q2 Li C
f i
50(2) / 4 23
Q2 165 5
14
25 23
Q2 165 5 165,714
14
Interpretacin:

centmetros.

TERCER CUARTIL:
La clase cuartil 3 seria: 50(3)/4=37,5 Buscamos este valor en Fi o el primero que
lo supere, en este caso corresponde al intervalo 5 ( I5)
En este caso i = 3
n(3) / 4 Fi 1
Q3 Li C
f i
50(3) / 4 37
Q3 170 5 170,25
10
Interpretacin:

centmetros.
4.9.2. QUINTILES.
Los quintiles (Qu) son valores que dividen a la muestra ordenada en forma
ascendente (o descendente) en 5 partes iguales y se denota por Qui i =1,2,3,4.
n(i)
Fi 1
Qui Li 5 C, i 1,2,3,4
fi

donde:
Li : es el lmite inferior del quintil.

inmediatamente inferior al intervalo del quintil.
fi : es la frecuencia absoluta del intervalo del quintil.
C : es la amplitud del intervalo del quintil.
Primer Quintil: Qu1
Es el valor que supera a no ms del 20% de las observaciones y es superado por no

ms del 80% de ellas, es equivalente a decir que Qu1 es el valor que deja 20% de
las observaciones menores o iguales a l y el 80% superiores a l.
Segundo Quintil: Qu2


Tercer Quintil: Qu3

Cuarto Quintil: Qu4


Encuentre el primero, segundo y tercer quintil.
SOLUCIN
PRIMER QUINTIL:
La clase quintil 1 seria: 50(1)/5=10 Buscamos este valor en Fi o el primero que lo

supere, en este caso corresponde al intervalo 2 ( I2)
En este caso i = 1
n(1) / 5 Fi 1
Qu1 Li C
fi
50(1) / 5 3
Qu1 155 5
8
10 3
Qu1 155 5 159,375
8

Interpretacin:

centmetros.
SEGUNDO QUINTIL:
En este caso i = 2
n(2) / 5 Fi 1
Qu2 Li C
f i
50(2) / 5 11
Qu2 160 5
12
20 11
Qu2 160 5 163,75
12
Interpretacin:

centmetros.
TERCER QUINTIL:
En este caso i = 3
n(3) / 5 Fi 1
Qu3 Li C
f i
50(3) / 5 23
Qu3 165 5
14
30 23
Qu3 165 5 167,5
14
Interpretacin:
El 60 % de los estudiantes tienen estaturas menores o iguales a 167,5 centmetros

y el 40 % de los estudiantes tienen estaturas mayores a 167,5 centmetros.

4.9.3. DECILES.
Los deciles (D) se determinan en forma similar a los cuartiles. As, cuando los datos
no estn agrupados primero se ordena en forma ascendente o descendente las
observaciones. Luego, se localiza la posicin deseada, que puede estar
comprendida en el intervalo de 1a 9 inclusive. El conjunto de datos se divide en 10
partes iguales del siguiente modo:
D1 D2 D9
10% 20% 90%
La frmula est dada del siguiente modo:
n(i)
Fi 1
Di Li 10 C, i 1,2,3,4,.....,9
fi

donde:
Li : es el lmite inferior del decil.
inmediatamente inferior al intervalo del decil.
fi : es la frecuencia absoluta del intervalo del decil.
C : es la amplitud del intervalo del decil.
Primer Decil: D1
ms del 90% de ellas, es equivalente a decir que D1 es el valor que deja 10% de las
Segundo Decil: D2
Noveno Decil: D9


Encuentre el primer decil.

Solucin:
PRIMER DECIL:
La clase decil 1 seria: 50(1)/10=5 Buscamos este valor en Fi o el primero que lo
En este caso i = 3
En este caso i = 1
n(1) / 10 Fi 1
D1 Li C
f i
50(1) / 10 3
D1 155 5 156,25
8
Interpretacin:

centmetros.
4.9.4. PERCENTILES.
Los percentiles (P) son valores que dividen a la muestra ordenada en forma
ascendente (o descendente) en 100 partes iguales, y se denota por P i , i =
1,2,3,....99.
La frmula est dada del siguiente modo:
n(i)
Fi 1
Pi Li 100 C, i 1,2,3,4,.....,99
fi

donde:

Li : es el lmite inferior del percentil.

inmediatamente inferior al intervalo del percentil.
fi : es la frecuencia absoluta del intervalo del percentil.
C : es la amplitud del intervalo del percentil.
Primer Percentil: P1
ms del 99% de ellas, es equivalente a decir que P1 es el valor que deja 1% de las
Octavo Percentil: P8
ms del 92% de ellas, es equivalente a decir que P8 es el valor que deja 8% de las
El percentil 25, es igual al primer cuartil: P25 = Q1.

El percentil 50, es igual a la mediana: P50 = Mediana
El percentil 50, es igual al segundo cuartil: P50 = Q2
El percentil 75, es igual al tercer cuartil: P75 = Q3.

Encuentre el percentil 90.

Solucin:
PERCENTIL 90:
La clase percentil 90 seria: 50(90)/100=45 Buscamos este valor en Fi o el
primero que lo supere, en este caso corresponde al intervalo 5 ( I5 )
En este caso i = 90
n(90) / 100 Fi 1
p90 Li C
fi

50(90) / 100 37
P90 170 5
10
45 37
P90 170 5 174
10
Interpretacin:
El 90 % de los estudiantes tienen estaturas menores o iguales a 174 centmetros y

el 10 % de los estudiantes tienen estaturas mayores a 174 centmetros.
PERCENTIL 10:
La clase percentil 10 seria: 50(10)/100=45 Buscamos este valor en Fi o el
primero que lo supere, en este caso corresponde al intervalo 2 ( I2 )
En este caso i = 10
n(10) / 100 Fi 1
p10 Li C
f i
50(10) / 100 3
P10 155 5
8
53
P10 155 5 156,25
8
Interpretacin:

centmetros. (Este resultado es exactamente igual al Decil 1).

CAPTULO V
MEDIDAS DE DISPERSIN
Las medidas de dispersin o variabilidad son valores que miden el grado de
dispersin de los datos con respecto a un valor central, que generalmente es la
media aritmtica.
Es necesario una medida del grado de dispersin o variacin con respecto

al centro, con la finalidad de ampliar la descripcin de los datos o de comparar dos
o ms series de datos.
Es necesario una medida del grado de asimetra o deformacin en ambos

lados del centro de una serie de datos, con el fin de describir la forma de la
distribucin de los datos. Esta medida se denomina ndice de asimetra.
Es necesario una medida que nos permita comparar el apuntamiento o

curtosis de distribuciones simtricas normales. Esta medida se denomina ndice de
apuntamiento.
Las principales medidas de dispersin son:
El rango o recorrido.
Desviacin Media
El rango intercuartil.
El rango semiintercuartil.
La varianza.
La desviacin estndar.
Coeficiente de variacin.
5.1. RANGO O RECORRIDO.
El rango de variacin o recorrido R, de una serie de datos, es la diferencia entre

sus valores extremos (valor mximo menos valor mnimo).
R = Valor mximo Valor mnimo
El rango es una medida de dispersin muy fcilmente calculable, pero es

muy inestable, ya que depende nicamente de los dos valores extremos. Su valor
puede cambiar grandemente si se agrega un solo dato. Por tanto su uso es muy
limitado.

Ejemplo: Para las siguientes edades de 7 estudiantes: 21, 34, 20, 19, 20, 22, 18,
calcular el rango:
Solucin:
En este caso se tiene: Valor mximo = 34 Valor mnimo = 18
Entonces el rango ser: R = Valor mximoValor mnimo = 34 18 = 16
Significa que las edades de los 7 estudiantes varan en 16 aos considerando esta
desde la mnima a la mxima edad
El empleo del rango como medida de cooperacin de variacin puede estar

justificado cuando se precise rpidamente de una medida de dispersin y no haya
tiempo de calcular alguna de las otras formas.
5.2. DESVIACIN MEDIA
La desviacin media es la media de las diferencias en valor absoluto de los valores

a la media.
DESVIACION MEDIA PARA DATOS DISPERSOS O NO AGRUPADOS O NO

CLASIFICADOS:
Ejemplo: Para las siguientes edades de 7 estudiantes: 21, 34, 20, 19, 20, 22, 18,
calcular la desviacin media (Dm):
Promedio = 154 / 7 = 22
x x i
21 22 34 22 ... 18 22
Dm i 1
3,4285714 _ aos
n 7
En las edades de los 7 estudiantes, existe una variacin de 3,43 aos con respecto
al promedio.
DESVIACIN MEDIA PARA DATOS AGRUPADOS O CLASIFICADOS:


[Li - Ls> Xi fi fi*|Xi-Xprom|

[150 - 155) 152,5 3 39
[155 - 160) 157,5 8 64
[160 - 165) 162,5 12 36
[165 - 170) 167,5 14 28
[170 - 175) 172,5 10 70
[175 - 180) 177,5 2 24
[180 - 185] 182,5 1 17
Total 50 278
Sabemos que:
X 165.5cm.
f i xi x
278
Dm i 1
5,56cm.
n 50
Para el ejemplo de las estaturas (en centmetros) de una muestra de 50

estudiantes que estn matriculados en el curso de Estadstica, existe una variacin
de 5,56 cm. con respecto al promedio.
Este valor estadstico no es de mucha utilidad en estadstica debido a que no es

fcil manipular dicha funcin al no ser derivable.
Siendo ms formales, la desviacin media debera llamarse desviacin absoluta

respecto a la media, para evitar confusiones con otra medida de dispersin, la
desviacin absoluta respecto a la mediana, DM, cuya frmula es la misma,
sustituyendo la media aritmtica ( )por la mediana. Pero tal precisin no es
relevante, porque la desviacin absoluta respecto a la mediana es de uso todava
menos frecuente.
5.3. RANGO INTERCUARTIL.
El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y primero. Esto
es: RI = Q3
Q1
Para el ejemplo de las estaturas (en centmetros) de una muestra de 50
estudiantes que estn matriculados en el curso de Estadstica:
RI = 170.25 - 160.625 = 9.625
El rango intercuartil es una medida que excluye el 25% ms alto y el 25% ms

bajo, dando un rango dentro del cual se encuentra el 50% central de los datos
observados y a diferencia del rango total se encuentra afectada por los valores
extremos.

Si el rango intercuartil es muy pequeo entonces describe alta uniformidad o

pequea variacin de los valores centrales.
5.4. RANGO SEMIINTERCUARTIL.
El rango semiintercuartil, RSI, est dado por el rango intercuartil dividido por 2.
Q3 Q1
RSI
2
Para el ejemplo de las tallas de estudiantes:
RSI = 9.625 / 2 = 4.8125
El rango semiintercuartil se puede asociar con la mediana y se puede expresar en

funcin de ella. Si una distribucin es normal, los cuartiles Q1 y Q3 son
equivalentes a la mediana.
NOTA: Si la distribucin es muy asimtrica, el rango semiintercuartil es preferible a

la desviacin estndar como medida de la dispersin.
5.5. VARIANZA.
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de

los valores de una variable cuantitativa con respecto a su media aritmtica. Si los
valores tienden a concentrarse alrededor de su promedio, la varianza ser muy
pequea. Si los valores tienden a distribuirse lejos del promedio, la varianza ser
muy grande.
5.5.1. Varianza para datos dispersos o no agrupados o no clasificados:
Varianza Poblacional: 2
N
N N
( X i ) 2
(X i )2 X i
2
i 1
N

2 i 1
i 1
N N
Varianza Muestral: S 2
n
n n
( X i ) 2
(X i X )2 X i
2
i 1
n
S
2 i 1
i 1
n 1 n 1

Desviacin Estndar.
Desviacin Estndar Poblacional:

N
N N (X ) i
2
(X i ) 2
X i
2
i 1
N
i 1
i 1
N N
Desviacin Estndar Muestral: S
n n
( X i ) 2
(X
i 1
i X )2 X
i 1
i
2
i 1
n
S
n 1 n 1
CASO I: DATOS DISPERSOS O NO CLASIFICADOS O NO AGRUPADOS:
Ejm: Dada las siguientes calificaciones obtenidas por 7 estudiantes en el Curso de

Estadstica: 14, 13, 12, 11, 12, 16 y 13. Hallar la varianza y la desviacin estandart.
SOLUCION:
Xi (Xi-Xprm)2 Xi2
14 1 196
13 0 169
Hallamos es promedio:
12 1 144 91
11 4 121 X 13
7
12 1 144
16 9 256
13 0 169
91 16 1199
Varianza:
n
(X i X )2
16
S2 i 1
2.66666667
n 1 7 1
n
( X i ) 2
X i
2
i 1
n
1199
912
7 2.66666667
S2 i 1

n 1 7 1
En las calificaciones obtenidas por los 7 estudiantes en el Curso de Estadstica,

existe una variacin de 2.67 puntos2 con respecto al promedio.

Desviacin Estandart:
S S 2 2.66666667 1.632993162

existe una variacin de 1.63 puntos con respecto al promedio.
S 1.632993162
C.V . (100%) (100%) 12.56%
X 13
existe una variacin de 12.56% con respecto al promedio.
5.5.2. Varianza para datos tabulados o agrupados
Varianza Poblacional: 2
k k
( f i X i ) 2
f (X i i )2 f X i i
2
i 1
N

2 i 1
i 1
N N
Varianza Muestral: S 2
k
k k
( X i f i ) 2
f (X
i 1
i i X )2 X
i 1
i
2
fi i 1
n
S2
n 1 n 1
Desviacin Estndar.
Desviacin Estndar Poblacional:

k
k k
( f i X i ) 2
f (X i i )2 X i
2
fi i 1
N
i 1
i 1
N N
Desviacin Estndar Muestral: S

k
k k
( f i X i ) 2
f (X i i X )2 f X i i
2
i 1
n
S i 1
i 1
n 1 n 1


matriculados en el curso de Estadstica.
[Li - Ls> Xi fi fi* Xi fi*Xi2

[150 - 155) 152.5 3 457.5 69768.75
[155 - 160) 157.5 8 1260 198450
[160 - 165) 162.5 12 1950 316875
[165 - 170) 167.5 14 2345 392787.5
[170 - 175) 172.5 10 1725 297562.5
[175 - 180) 177.5 2 355 63012.5
[180 - 185] 182.5 1 182.5 33306.25
Total 50 8275 1371762.5
Hallar la varianza muestral y desviacin estndar
a) Varianza Muestral:
k
k
( f i X i ) 2
fX i i
2
i 1
n
1371762 ,5
(8275) 2
50 45,918cm2
S2 i 1

n 1 50 1
En las estaturas de los 50 estudiantes matriculados en el curso de Estadstica,

existe una variacin de 45,918 cm2 con respecto al promedio.
b) Desviacin Estndar Muestral:
S S 2 45,91836735 6,776309272 6,78 cm
En las estaturas de los 50 estudiantes matriculados en el curso de Estadstica,

existe una variacin de 6,78 cm. con respecto al promedio.
5.6. COEFICIENTE DE VARIACIN.
El coeficiente de variacin CV, es una medida de dispersin relativa (libre de

unidades de medida), que se define como la desviacin estndar dividido por el
promedio aritmtico.

a) Coeficiente de Variacin Poblacional: C.V . (100%)

S
b) Coeficiente de Variacin Muestral: C.V . (100%)
X
El coeficiente de variacin es una medida muy til para comparar la variabilidad de

dos o ms series de datos que tengan distintas unidades de medida y/o distintos
promedios aritmticos.

Ejemplo 1:
Para el ejemplo de las estaturas de los 50 estudiantes matriculados en el curso de
Estadstica, Hallaremos el coeficiente de variabilidad directamente porque ya se
hall la desviacin estandart y el promedio.
Considerando:
Desviacin estandart: S=6,776309272 cm
Promedio aritmtico: X = 165.5 cm
S 6,776309272
C.V . (100%) (100%) 4,0967%
X 165.5
Concluimos que en las estaturas de los 50 estudiantes matriculados en el curso de

Estadstica, existe una variabilidad o variacin de 4.0967% 4%, con respecto al
promedio de las estaturas.
Ejemplo 2:
Considere las edades (en aos) de los siguientes estudiantes considerando dos
grupos separados por el gnero:
Varones: Mujeres:
20 23 19 27 21 19 25 23 19 22 18 27 24 18 21
177 149
X 22.125 X 21.28571429
8 7
3975 (177 2 / 8) 3239 (149 2 / 7)

S2 S2
8 1 7 1
S 8.410714285
2
S 2 11.238095238
S 2.90012315 S 3.352326839
2.90012315
c.v. (100%) 13.11% c.v.
3.352326839
(100%) 15.75%
22.125 21.28571429
En estos resultados podemos observar que las edades de los varones son ms
homogneos que el de las mujeres porque el coeficiente de variacin de los
varones es menor que el coeficiente de variacin de las mujeres.

5.7. MEDIDAS DE FORMA DE LA DISTRIBUCIN.
En trabajos propios de algunas disciplinas, surge con frecuencia la necesidad de

calcular una medida que muestre las direcciones de la dispersin de los datos con
respecto a su centro y que completan la descripcin de las distribuciones de
frecuencias. Estas caractersticas se llaman: Asimetra (que significa no tener
simetra) y curtosis o apuntamiento. Las medidas de dispersin slo indican la
magnitud de las variaciones, pero no dan informacin acerca de la direccin de las
variaciones.
a) MEDIDAS DE ASIMETRA.
El concepto de asimetra de una distribucin indica la deformacin horizontal de

las distribuciones de frecuencias. Una distribucin es asimtrica, cuando su curva
(polgono) de frecuencia es simtrica respecto al eje vertical. Es decir, si se le
puede doblar a lo largo del eje vertical de manera que coincidan los dos lados.
Asimetra Positiva: Se dir que una distribucin de frecuencia unimodal presenta

asimetra positiva o a la derecha, si tiene ramificacin extendida hacia la derecha o
hacia valores grandes de la variable. En este caso la media aritmtica es mayor
que la moda. La mediana por el hecho de dividir el conjunto de observaciones en
dos partes iguales, quedar comprendida entre ambas.
Asimetra Negativa: Se dir que una distribucin de frecuencia unimodal presenta

asimetra negativa o a izquierda, si tiene una ramificacin ms extendida hacia la
izquierda o hacia valores pequeos de la variable. La media aritmtica es menor
que la moda. La mediana por la misma razn anterior permanecer en el centro.
Asimetra Negativa Asimtrica Asimetra Positiva
Coeficiente de Asimetra:
a) El coeficiente de asimetra cuartlico o de BOWLEY, est dado en funciones de

los cuartiles:
Q3 2Q2 Q1
CA.
Q3 Q1
Considerando.

i) La distribucin es asimtrica (Promedio = Mediana = Moda), Si CA=0.

ii) La distribucin es asimtrica positiva
(Promedio > Mediana > Moda), si CA > 0.
iii) La distribucin es asimtrica negativa
(Promedio < Mediana < Moda), si CA < 0.
Ejemplo. Para el ejemplo de las estaturas (en centmetros) de una muestra de 50

estudiantes matriculados en el curso de Estadstica. Hallamos directamente el C.A.
porque anteriormente ya se hall los Cuartiles 1 , 2 y 3
Q3 2Q2 Q1 170.25 2(165.714) 160.625

CA. 0.05745455
Q3 Q1 170.25 160.625
Encontrado este valor del CA=-0,05745455, podemos decir que la distribucin

para las estaturas de la muestra de 50 estudiantes matriculados en el curso de
Estadstica es asimtrica negativa.
Por otro lado tomando en cuenta el considerando iii) La distribucin es asimtrica

negativa si: (Promedio < Mediana < Moda),
Este considerando se comprueba con los resultados obtenidos anteriormente del

mismo ejemplo de las estaturas de la muestra de 50 estudiantes matriculados en
el curso de Estadstica siendo:
X prom=165.5 < Me=165.7142857 < Mo=166.6666,
El coeficiente de asimetra en funcin de los percentiles (10, 90), est dado

por :
P90 2P50 P10

CA.
P90 P10
b) NDICE DE CURTOSIS O APUNTAMIENTO.
Se entiende por curtosis, a la medida de deformacin vertical de una distribucin

de frecuencias, es decir la medida de apuntamiento o achatamiento de una
distribucin.
La idea de apuntamiento de una distribucin con la frecuencia de dichos valores

en la distribucin de frecuencias indica la mayor o menor altura del mximo
central, con respecto a la altura de la curva normal con media y desviacin tpica
que la distribucin que se estudia.

CURTOSIS EN FUNCIN DE CUANTILES.
El coeficiente est dado por:
Q3 Q1
K
2( P90 P10 )
Considerando la siguiente constante:
i) si K = 0.263, la distribucin es normal o mesocrtica.

ii) si K < 0.263, la distribucin es achatada o leptocrtica.
iii) si K > 0.263, la distribucin es platicrtica.
Al igual que el caso de los coeficientes de asimetra de una distribucin, los que
representan a la curtosis o apuntamiento se utilizan para ayudar a describir las
caractersticas de una distribucin y no precisamente como medidas, ya que a
veces el valor de la curtosis se contradice con la realidad por estar relacionado con
la distribucin normal.
Ejemplo. Para el ejemplo de las estaturas (en centmetros) de una muestra de 50

estudiantes matriculados en el curso de Estadstica. Hallamos directamente K.
porque anteriormente ya se hall los Cuartiles (1 y 3), percentiles (90 y 10).
Q3 Q1 170,25 160,625
K 0,271126
2( P90 P10 ) 2(174 156,25)
Encontrado este valor de K=0,271126, es mayor a 0.263, podemos decir que la

distribucin para las estaturas de la muestra de 50 estudiantes matriculados en el
curso de Estadstica es Platicurtica.

EJERCICIOS PRCTICOS 01
1. A continuacin se dan los gastos en servicios pblicos de 40 tiendas comerciales del

cercado de la ciudad de Puno.
209 190 197 205 193 163 192 210 213 193
255 268 218 241 209 243 183 229 188 209
239 243 231 248 210 223 230 218 213 204
231 221 213 204 200 208 214 213 217 207
a) Elaborar la Tabla de Distribucin de Frecuencia

b) Hacer el Histograma de Frecuencias ojiva y el Polgono de Frecuencias
c) Interpretar: f2, F3, h1%, H4%
d) Hallar promedio aritmtico, Me, Moda, Desviacin Estndar y Coeficiente de
variacin.
2. Los siguientes datos son registros de las velocidades de transmisiones en nano

segundos de 35 instrucciones informticas registradas desde su ingreso por un dispositivo
de entrada hasta recibir una respuesta.
1.0 1.4 1.5 0.7 1.1 0.7 0.5 1.1 1.8 1.2
1.2 1.3 0.5 0.1 0.8 1.5 1.6 0.7 1.7 0.2
0.9 0.8 1.0 1.1 1.3 0.8 0.7 0.9 0.9 1.0
1.5 1.4 0.7 0.3 0.8

e) Hallar una media apropiada de transmisin, varianza, coeficiente de variacin,
coeficiente de asimetra y coeficiente de curtosis
3. Dada la siguiente Distribucin Simtrica verificar que la Media Aritmtica, Mediana y

Moda son iguales. Elabore su histograma ojiva y su grafico circular.
[Ii Ii+1> fi
[0 2> 2
[2 4> 4
[4 6> 6
[6 8> 4
[8 10] 2
4. Calcula las medidas de tendencia central y dispersin de los siguientes datos:

a) 2, 5/2, 10/3, 5, 10
b) 1.6, 2.4, 3.0, 4.0, 5.6, 4.2

5. Dada la siguiente Distribucin calcular todas las medidas de tendencia central, medidas
de dispersin y los grficos tratados.
[Ii Ii+1> fi
[20 30> 2
[30 40> 10
[40 55> 8
[55 65> 6
[65 85] 2
6. Un investigador realiza un estudio en la ciudad de Puno, acerca del nmero de horas

semanales que dedican los estudiantes universitarios a ver televisin. Una muestra de 35
estudiantes, arroj los siguientes resultados:
10 19 25 19 26 20 19
16 19 27 27 25 20 28
23 22 17 12 20 23 18
15 21 23 26 14 22 24
18 25 23 24 21 26 24

d) Hallar promedio aritmtico, Me, Media armnica, Media geomtrica, Moda,
coeficiente de asimetra y coeficiente de curtosis.
7. Los siguientes datos son los pesos medidos en Kg. de 30 estudiantes de la carrera
profesional de Contabilidad
75,8 69,3 96,2 86,3 99,8
84,6 72,2 74,1 76,0 86,5
70,2 61,8 58,4 69,2 68,4
68,3 75,0 67,3 82,2 72,1
59,4 65,5 76,4 76,5 81,0
65,0 86,2 68,3 65,9 69,0

d) Hallar promedio aritmtico, Mediana y Moda
8. Los siguientes datos se refieren al nmero de libros de Estadstica consultados por 50

estudiantes para rendir el examen parcial de la asignatura:

2 0 4 4 1 4 0 3 2 0
0 1 1 1 0 1 2 4 0 1
1 5 2 2 5 3 4 0 4 0
0 0 3 0 1 4 2 1 2 0
3 1 3 1 2 0 5 6 3 2
a) Hacer un cuadro de distribucin de frecuencias.

b) Qu porcentaje de alumnos no consultaron ningn libro para el examen parcial?
c) Qu porcentaje de alumnos consult entre 5 y 6 libros?
d) Presente los datos en cuadros y grficos estadsticos.
9. Los siguientes datos que se presentan en una tabla incompleta de distribucin de

frecuencias, corresponden a las calificaciones de un grupo de estudiantes en la asignatura
de Estadstica:
I Ii fi Fi hi (%) Hi (%)
1 [ ) 12 20
2 [ 05 ) 60
3 [ 09 ) 70
4 [ ) 85
5 [ ]
Se sabe que la amplitud del intervalo es igual en todas las clases, completar los datos
que faltan en la tabla de frecuencias y realizar interpretaciones para f2, F3, h1%, H4%.
10. Se tiene una distribucin de frecuencias con 4 intervalos de amplitud constante para
50 datos.
i Ii fi Fi hi Hi
1 [ 3) 0,08
2 [ 5) 0,40
3 [ ) 12
4 [ 9] 0,36
Se pide completar la tabla de frecuencias y realizar interpretaciones para f3, F2, h2%,
H3%.

EJERCICIOS PRCTICOS 02
1. A continuacin se dan los gastos en servicios pblicos de 44 tiendas comerciales del

cercado de la ciudad de Puno.
216 197 204 212 200 170 199 198 217 220 200
262 275 225 248 216 250 190 190 236 195 216
246 250 238 255 217 230 237 221 225 220 211
238 228 220 211 207 215 221 232 220 224 214
a. Elaborar la Tabla de Distribucin de Frecuencia

b. Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
c. Interpretar: f2, F3, h1%, H4%
2. A continuacin se dan resultados sobre los puntajes de coeficientes de inteligencia de

40 estudiantes universitarios:
105 104 103 102 100 100 99 97
106 109 109 110 110 111 111 112
116 115 115 115 115 114 114 113
117 117 117 117 119 122 122 127
147 143 137 137 132 131 131 129

b) Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
3. Un investigador realiza un estudio en la ciudad de Puno, acerca del nmero de horas

semanales que dedican los estudiantes universitarios a ver televisin. Una muestra de 45
estudiantes, arroj los siguientes resultados:
17 26 32 26 33 27 26 30 21
23 26 34 34 32 27 35 32 24
30 29 24 19 27 30 25 29 25
22 28 30 33 21 29 31 21 21
25 32 30 31 28 33 31 28 23


4. Se someti a una evaluacin a 40 estudiantes de una escuela profesional de Turismo

sobre conceptos bsicos del rea, obtenindose los siguientes resultados entre 0 20.
8 11 14 17 7 12 13 14
9 7 11 11 11 13 12 15
12 15 10 12 12 13 15 11
13 12 15 11 13 15 14 9
14 13 8 9 7 11 15 16

b) Hacer el Histograma de Frecuencias, ojiva y el Polgono de Frecuencias
5. A continuacin se presentan las calificaciones finales de 42 estudiantes de

Contabilidad, que llevaron el Curso de Estadstica, durante el 2do. Semestre Acadmico:
11 12 16 14 14 15 12
12 10 13 12 12 17 13
13 12 14 12 13 13 13
15 16 11 16 12 12 12
18 15 15 17 11 12 12
14 14 13 16 14 14 13

6. Los siguientes datos son los pesos medidos en Kg. de 42 estudiantes varones de la
carrera profesional de Contabilidad
75,1 68,5 95,4 85,5 98,4 86,2 94,9

83,8 71,4 73,3 75,2 85,7 75,9 86,4
69,4 62,1 57,6 68,4 67,6 69,1 68,3
67,5 74,2 66,5 81,4 71,3 82,1 74,3
58,6 64,7 75,6 75,7 80,2 76,4 80,9
64,2 85,4 67,5 65,1 68,2 65,8 68,9


7. Los siguientes datos son registros de las velocidades de transmisiones en nano

segundos de 35 instrucciones informticas registradas desde su ingreso por un
dispositivo de entrada hasta recibir una respuesta.
1.0 1.4 1.5 0.7 1.1 0.7 0.5 1.1 1.8 1.2 1.2 1.3 0.5 0.1 0.8 1.5 1.6 0.7 1.7
0.2 0.9 0.8 1.0 1.1 1.3 0.8 0.7 0.9 0.9 1.0 1.5 1.4 0.7 0.3 0.8

8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
Altura(cm.) [170 - 175) [175 - 180) [180 - 185) [185 - 190) [190 - 195) [195 - 200)
N de jugadores 3 5 6 10 7 4
a) Completar la tabla de distribucin de frecuencias.

b) Hacer el histograma la ojiva y grafico por sectores.
c) interpretar Interpretar: f2, F3, h1%, H4%
9. Un contador observa que de 60 tributantes el nmero de infracciones tributarias

cometidas son como sigue:
infracciones fi Hi
[0-1) 0.25
[1-2) 0.20
[2-3)
[3-4) 0.15
[4-5] 0.05
TOTAL
a) Completar la tabla de distribucin de frecuencias
10. Un contador observa que de 100 tributantes el nmero de infracciones tributarias

cometidas son como sigue:
infracciones fi hi
[0-1) 0.15
[1-2) 0.30
[2-3)
[3-4) 0.20
[4-5] 0.05
TOTAL


11. Se realiz un diagnstico a 40 personas sobre un tipo de malestar los cuales se

encuentran en los siguientes rangos de edades:
[Ii) fi
[ 5 - 10 ) 3 a) Completar la tabla de distribucin de
[ 10 - 15 ) 9 frecuencias
[ 15 - 20 ) 15 b) Hacer el histograma la ojiva y grafico por
sectores.
[ 20 - 25 ) 8
[ 25 - 30 ) 5
Total 40
12. Se realiz un diagnstico a 45 personas sobre un tipo de malestar los cuales se

encuentran en los siguientes rangos de edades:
[Ii) fi
[ 5 - 10 ) 4 a) Completar la tabla de distribucin de
[ 10 - 15 ) 11 frecuencias
b) Hacer el histograma la ojiva y grafico
[ 15 - 20 ) 15
por sectores.
[ 20 - 25 ) 9 c) interpretar Interpretar: f2, F3, h2%, H4%
[ 25 - 30 ) 6
Total 45
13. Los siguientes datos corresponden a calificaciones obtenidas en una evaluacin final
en el curso de ESTADISTICA conformada por 45 estudiantes del II Semestre de
Contabilidad, con h2 y h5 borrados, tambin se conoce que la frecuencia f5 es el doble de
f 2.
[ Ii) Xi fi Fi hi Hi hi % Hi %
[08 - 10) 0.155556
[10 - 12)
[12 - 14) 0.2
[14 - 16) 0.222222
[16 - 18)
[18 - 20] 0.088889
TOTAL

b) Hacer el histograma, polgono de frecuencias, la ojiva y grafico por sectores.

14. Se conocen las siguientes calificaciones de un grupo de 45 estudiantes Universitarios.

Los anchos de intervalos son constantes(o iguales) Completar y Calcular lo que se indica
[ - )
[ - ) 5 12
[ 12 - ) 0.2
[ - )
[ - ) 10
[ - 20 ] 0.089
TOTALES
15. Los siguientes datos son registros de las velocidades de transmisiones elctricas en
nano segundos de 45 sentencias ingresadas por un dispositivo de entrada hasta recibir
una respuesta.
1.0 0.9 0.7 0.8 1.2 1.5 0.5 1.5 1.2

1.7 0.7 1.1 1.8 0.9 0.1 0.6 0.3 0.6
1.4 0.8 0.5 0.7 1.3 1.4 0.7 1.6 0.1
0.2 1.1 1.3 1.2 1.0 0.8 0.9 0.8 0.3
1.5 1.0 1.1 0.9 0.5 0.7 0.7 0.7 1.8
a) Construir la tabla de distribucin de frecuencias
16. Los siguientes datos corresponden al nmero dietas especiales por semana aplicados
a una muestra de 51 estudiantes que muestran debilidad mental.
7 8 6 7 1 7 6 1 7 3 7 1 1 2 5 4 2
3 4 5 7 1 5 7 4 8 3 6 6 7 8 7 2 3
8 5 2 6 1 2 6 3 2 1 6 1 9 2 4 5 4
a) Construir la tabla de distribucin de frecuencias


CAPTULO VI
MUESTREO
El muestreo es el procedimiento mediante el cual se extraen algunos elementos de una

poblacin total y solo de esa parte de la poblacin consideramos muestra.
Por lo tanto, la MUESTRA es un conjunto de unidades, casos o eventos que son tomadas o
extradas de una poblacin las que poseen algunas caractersticas comunes o similares, de
acuerdo al problema de investigacin.
MTODOS MUSTRALES:
A) MUESTREO PROBABILISTICO:
Es un proceso muestral donde cada elemento de la poblacin tiene una
probabilidad conocida de ser incluida dentro de la muestra. Los elementos
mustrales tendrn valores muy parecidos a los de la poblacin de manera que las
mediciones de la muestra no darn estimados ptimos de la poblacin.
En una muestra probabilstica se debe considerar dos casos:
a) Determinar el tamao de la muestra, bajo una frmula segn el tipo de

muestreo a aplicar.
b) Seleccionar los elementos mustrales de tal manera que todos tengan
la misma probabilidad de ser elegidos.

Las muestras probabilsticas tienen mucha ventaja principalmente por que pueden
medirse y controlar el tamao de error, nivel de significancia y/o nivel de
confianza.
B) MUESTREO NO PROBABILISTICO:
Es un proceso por el cual no se puede asignar objetivamente probabilidades a los
elementos seleccionados y por consiguiente no se puede determinar la precisin
de los resultados mustrales en trminos de probabilidad entre los cuales
tenemos:
i) Muestreo a criterio o Juicio: Es proceso por el cual la seleccin depende

del juicio humano y no de una rigurosa aplicacin de la teora de
probabilidades.
ii) Muestreo por Cuotas: Es el proceso del muestreo a juicio en que los
sesgos que sufren los mtodos no probabilsticos de seleccin no se
controlan hasta cierto punto por la estratificacin y establecimiento de
cuotas de seleccin. Se divide la poblacin en grupos o estratos segn las
exigencias del estudio, generalmente: Edad, sexo, condicin social, etc.
iii) Cuestionario por correo: Se emplea por ser de bajo costo y fcil de
administracin, la principal obsesin a este muestreo es el sesgo causado
por el no retorno del cuestionario, estudios de opinin de mercado an
se emplean estos tipos de muestreo aunque su uso tiende a disminuir
por sus imprecisiones.

TIPOS DE MUESTREO
a). Muestreo Aleatorio Simple.

Consiste en elegir una serie de elementos de la poblacin considerando
que cada uno de ellos tiene igual probabilidad de ser elegido al conformar
la muestra.
Este tipo de muestreo es de gran utilidad cuando se requiere extraer una

muestra de una poblacin, por su fcil aplicacin.
FORMAR DE ELECCION DE ELEMENTOS MUESTRALES

Con reemplazo: Todas las unidades de la poblacin tienen la
probabilidad de ser seleccionadas para tomar parte de la muestra,
formalmente coincide con el muestreo de poblaciones infinitas. Una
vez extrada la informacin se devuelve el elemento a la poblacin y
la extraccin del siguiente elemento es independiente al resultado
anterior. El nmero de formas para elegir la muestra est dado por
(Nn) formas diferentes.
Sin reemplazo: Toda las unidades de la poblacin tienen la misma

probabilidad de ser extrada para la poblacin si es finita, la
probabilidad de que salgan un elemento depender de lo que
fueron separados independientemente para formar parte de la
muestra y dejar por tanto pertenecer a la poblacin. El nmero de
N
formas para elegir la muestra est dado por: formas
n
diferentes.
b). Muestreo Estratificado.

Basndose en alguna caracterstica, se divide la poblacin en grupos de
unidades llamados estratos. Siempre con unidades de caractersticas

homogneas. Luego, cada uno de ellos se selecciona al azar una muestra

de tamao adecuado; as, la unin de estos conjuntos de unidades
conforman la muestra de tamao n. Por ejemplo, dividir la poblacin
Universitaria en Facultades o Escuelas Profesionales, por niveles o
semestres de estudio, gnero, etc. Segn el enfoque de la investigacin
c). Muestreo Sistemtico.

Es el procedimiento de seleccin del k-simo elemento de la poblacin con
un comienzo aleatorio. Este mtodo usual por su simplicidad se prefiere
frente al muestreo estratificado si la poblacin puede ponerse en orden.
Con el muestreo sistemtico se logra mayor eficiencia si las unidades se
hallan tienen mayor uniformidad que las unidades que se encuentran
alejados entre s.
d). Muestreo aleatorio por conglomerados:

En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la poblacin que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., cuando los
conglomerados son reas geogrficas suele hablarse de "muestreo por
reas". El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto nmero de conglomerados (el necesario para
alcanzar el tamao muestral establecido) y en investigar despus todos los
elementos pertenecientes a los conglomerados elegidos.

A) TIPO DE MUESTREO: MUESTREO ALEATORIO SIMPLE (MAS)
Llamado tambin irrestricto aleatorio, es un proceso de seleccin al azar de

unidades para obtener una muestra que tiene una cierta probabilidad de
ocurrencia. Esta probabilidad de propiedades especficas a los valores obtenidos
en la muestra que sirven para estimar los parmetros.
El muestreo aleatorio simple es el esquema ms simple de muestreo y en rigor es

el que sirve de base para todos los dems.
Consiste en extraer un nmero n (tamao de la muestra) unidades de muestreo de

una poblacin de tamao N.
La seleccin de estas unidades de muestreo se va extrayendo aleatoriamente una

a una las unidades de la poblacin. La mejor manera de lograr esta condicin de
aleatoriedad es la seleccin de la muestra mediante el uso de las tablas de
nmeros aleatorios.
DETERMINACIN DEL TAMAO DE MUESTRA

CASO I: VARIABLES CUALITATIVAS (PARA PROPORCIONES)
P : proporciones favorable a la investigacin

Q : proporciones desfavorable a la investigacin.
e : error para la proporcin.
E : Error muestral.
: Nivel de significancia
1- : nivel de confianza
Z : Valor de la distribucin normal para un

Se determina el tamao de la muestra inicial o preliminar no= Tamao de la

muestra inicial. Aplicando un muestreo sin reemplazo, para un tamao de
poblacin relativamente grande o desconocida.
( Z ) 2 ( P)(Q)
i) n0
(E)2
ii) Si (n0/N) Entonces se corrige el tamao de la muestra utilizando la

frmula de iii). En caso contrario la muestra final queda como n0
n0
iii) n
(n 1)
1 0
N
Ejemplo 1: (Cuando existe investigacin preliminar)
SE CONSIDERA LOS VALORES DE LA PROPORCION FAVORABLE (P) Y PROPORCION

DESFAVORABLE (Q), A LOS OBTENIDOS DEL ESTUDIO PRELIMINAR
Se desea determinar el tamao de muestra adecuado, para el trabajo de

investigacin denominado: Preferencia por estudios superiores en Ciencias
Contables y Administrativas y su relacin con el Rendimiento Acadmico en
estudiantes de la I.E.S. G.U.E. San Carlos Puno 2014, se sabe que la poblacin
estudiantil es de 1643. Por estudios referenciales realizados sobre el tema similar
en otra Institucin Educativa, se obtuvo que la preferencia es en una proporcin
de 30%, determine el tamao de muestra con un nivel de significancia del 5% y un
error del 15% para la proporcin.
SECCIONES
GRADO A B C D E F G H I J K L M TOTAL
Primero 30 30 32 31 32 23 25 26 26 24 29 26 30 364
Segundo 30 32 29 30 24 26 26 26 24 24 27 28 26 352
Tercero 28 26 26 26 31 29 26 26 30 24 23 22 317
Cuarto 29 32 25 29 29 25 27 26 24 25 20 20 311
Quinto 27 28 30 25 23 30 27 20 24 22 24 19 299

Gran total 1643
Solucin:
N = 1643
P = 0.30 = 30% Datos indispensables para la investigacin
Q = 0.70 = 70%
= 0.05 (5% de nivel de significancia 95% de nivel de confianza)
Z/2 = Z0.05/2 = 1.96
e = 15 % = 0.15 = error para la proporcin P
E = e * P = 0.15 (0.30) = 0.045 = 4.5% error muestral.
( Z ) 2 ( P)(Q) (1.96) 2 (0.3)(0.7)

i) n0 = = 398.38815
(E)2 (0.045) 2
n0 = 398
ii) Si (n0/N) Entonces se corrige el tamao de la muestra

Si (398/1643)= 0.2422398 = 0.05 Entonces se corrige.
n0 398
iii) n = = 320,546=321
(n0 1) (398 1)
1 1
N 1643
Finalmente el tamao de muestra para la investigacin Preferencia por estudios

superiores en Ciencias Contables y Administrativas y su relacin con el
Rendimiento Acadmico en estudiantes de la I.E.S. G.U.E. San Carlos Puno 2014
es de 321 estudiantes de educacin secundaria, con un nivel de confianza de 95%
Ejemplo 2: (Cuando realizamos una encuesta piloto)
SE CONSIDERA LOS VALORES DE LA PROPORCION FAVORABLE (P) Y PROPORCION

DESFAVORABLE (Q), LOS OBTENIDOS DE LA MUESTRA PILOTO

Se desea determinar el tamao de muestra para un nivel de significancia del 1% y

un error de 18% para la proporcin. De una poblacin de 625 personas que tienen
al menos un proceso judicial de tipo penal en el Distrito Judicial de Puno, se desea
estudiar la proporcin sobre el conocimiento referencial de esta poblacin en
litigio de la aplicacin del nuevo cdigo procesal penal en dichas personas. No se
tiene estudios referenciales, para lo cual se toma una muestra piloto de 15
personas, (que representa 15/625=0,025 = 2,5%, para una muestra piloto se
recomienda que la proporcin debe ser de 1% al 5% del tamao de la poblacin),
cuyos resultados se muestran de la siguiente forma:
Personas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Conoce el nuevo
No Si Si No No No Si No No Si No No Si Si No
cdigo procesal penal
Solucin:
Si = 6 P = 6/15 = 0.40
No = 9 Q = 9/15 = 0.60
= 1% = 0.01
N = 625
Z/2 = Z0.01/2 = 2.575
e = 18 % = 0.18 = error para la proporcin P
E = e * P = 0.18 (P) = 0.18 (0.40) = 0.072 = 7.2% de error muestral.
( Z ) 2 ( P)(Q) (2.575) 2 (0.4)(0.6)

i) n0 = = 306.9733796
(E)2 (0.072) 2
n0 = 307
ii) Si (307/625 = 0.4912) = 0.01 Entonces se corrige.
n0 307
iv) n = = 206.096 = 206
(n0 1) (307 1)
1 1
N 625

El tamao de muestra es de 206 personas que tienen al menos un proceso judicial

de tipo penal en el Distrito Judicial de Puno, para estudiar la proporcin sobre el
conocimiento de la aplicacin del nuevo cdigo procesal penal con un nivel de
confianza de 99%
Ejemplo 3: (Cuando la investigacin es nueva Asumimos P = 0.50 y Q = 0.50)
SE ASUME LOS VALORES DE LA PROPORCION FAVORABLE (P=0.5) Y PROPORCION

DESFAVORABLE (Q=0.5), PROPORCION EQUILIBRADA PARA AMBOS CASOS.
Se desea determinar el tamao de muestra adecuado, para investigar la

preferencia de consumo de productos embolsados de estudiantes de la Escuela
Profesional de Contabilidad, se sabe que la poblacin estudiantil es de 500. No se
tiene estudios referenciales. Determinar el tamao de muestra con un nivel de
significancia del 10% y 12% de error para la proporcin
Solucin:
P = 0.50
Q = 0.50
N = 500, = 10% = 0.10
Z/2 = Z0.10/2 = 1.645
e = 12 %
E = e * P = 0.12 (P) = 0.12 (0.50) = 0.06
( Z ) 2 ( P)(Q) (1.645) 2 (0.5)(0.5)

i) n0 = = 187.9184028
(E)2 (0.06) 2
n0 = 188
ii) Si (188/500) = 0.376 = 0.10 Entonces se corrige.

n0 188
iii) n = = 136.8267831=137
(n0 1) (188 1)
1 1
N 500
El tamao de muestra es de 137 estudiantes para determinar si cuenta o no con

vivienda propia, con un nivel de confianza de 90%.
TAMAO DE MUESTRA PARA VARIABLES CUALITATIVAS SEGN SIERRA BRAVO:

El tamao de la muestra se determina de la siguiente forma:
PARA POBLACIONES INFINITAS (> a 100,000)

CASO I: Criterio 2 (95.5% de confianza Z = 2)
4 PQ
n
E2
CASO II: Criterio 3 (99.7% de confianza Z = 3)

9 PQ
n
E2
PARA POBLACIONES FINITAS (< a 100,000)

4 NPQ
n
E ( N 1) 4PQ
2

9 NPQ
n
E ( N 1) 9PQ
2

CASO II: VARIABLES CUANTITATIVAS
a) CUANDO SE TIENE ESTUDIOS PRELIMINARES.
Z 2 2
i) n0
E2
ii) Si (n0/N) Entonces se corrige.
n0
iii) n
(n 1)
1 0
N
Ejemplo 4:
Se desea realizar una evaluacin sobre conocimientos generales de CONTABILIDAD
FINANCIERA, a estudiantes del rea de Contabilidad, conformado por 315 estudiantes,
por estudios referenciales se sabe que una evaluacin similar del ao anterior, la nota
promedio obtenido por los estudiantes fue de 13,5 y su varianza 17,5. Determine el
tamao de la muestra para la investigacin con un nivel de confianza del 95% y un error
del 8% para el promedio.
Solucin:
N = 315
= 13,5 Datos indispensables para la investigacin
2 = 17,5
= 0.05 (5% de nivel de significancia = 95% de nivel de confianza)
Z/2 = Z0.05/2 = 1.96
e = 8 % = 0.08
E = e () = 0.08 (13,5) = 1.08
Z 2 2 (1.96) 2 (17.5)
i) n0 = = 57,63717421 = 58
E2 (1.08) 2

n0 58
iii) n = = 49,11290323 = 49
(n0 1) (58 1)
1 1
N 315
El tamao de muestra es de 49 estudiantes del rea de contabilidad que deben ser

evaluados sobre conocimientos generales de Contabilidad Financiera, con un nivel de
confianza de 95%.
b) CUANDO REALIZAMOS UNA ENCUESTA PILOTO.
Ejemplo 5:
Se desea determinar el nivel de rendimiento de un examen pre universitario, conformado
por 1800 postulantes, no se tiene estudios referenciales sobre el caso. Determine el
tamao de la muestra para la investigacin con un nivel de confianza del 90% y un error
para el 5% del promedio. Para lo cual se toma una muestra piloto de 20 resultados.
2600 2700 2100 3500 2800 3300 2300 2700 2500 2400
2500 3400 2400 2100 2400 2900 3000 2500 2400 3000
Solucin:
N = 1800
= 2675 Resultado de la
muestra piloto.
2 = 161973,684
= 0.10 (10% de nivel de significancia = 90% de nivel de confianza)
Z/2 = Z0.10/2 = 1.645
e = 5 % = 0.05
E = e * = 0.05(2675) = 133,75
Z 2 2 (1,645) 2 (161973,684)
n0 24,50127491 25
E2 133,75 2
Si (25/1800) = 0.01388888889< = 0.10, Entonces ya no se corrige, el tamao de la
muestra es ptimo.

El tamao de muestra es de 25 postulantes que deben ser evaluados para determinar el

nivel de rendimiento, con un nivel de confianza de 90%
TAMAO DE MUESTRA PARA VARIABLES CUANTITATIVAS SEGN SIERRA BRAVO:

El tamao de la muestra se determina de la siguiente forma:
PARA POBLACIONES INFINITAS (> a 100,000)
4 2
n
E2
9 2
n
E2
PARA POBLACIONES FINITAS (< a 100,000)
4 N 2
n
4E 2 N 2
9 N 2
n
9E 2 N 2

B) TIPO DE MUESTREO: MUESTREO ALEATORIO ESTRATIFICADO (MAE)
Denominado tambin muestreo aleatorio restringido o muestreo aleatorio

condicionado. Es un mtodo de muestreo probabilstico en la que se divide la
poblacin en estudio con base con algunos variables en diferentes clases o grupos
para luego realizar el muestreo en cada grupo.
Este muestreo es ms eficiente que el MAS en especial cuando las

caractersticas especficos es de una variabilidad lo cual implica un tamao
muestral relativamente grande en comparacin a lo obtenido mediante el MAS. En
una muestra aleatorio estratificado la poblacin a investigar se divide en grupos
relativamente homogneos con relacin a la caracterstica en estudio, estos
grupos se denominan estratos donde la unidad investigada presenta una
caracterstica tal que slo permite pertenecer a un solo estrato.
Es necesario entender que cada estrato se constituye en un dominio de

estudio, los estratos pueden o no estar compuestos del mismo nmero de
unidades por esta razn la operacin del muestreo puede variar de un estrato a
otro.
Para aplicar el muestreo estratificado se requiere de dos etapas:
1. Dividir la poblacin en grupos mutuamente excluyentes y exhaustivos,

esto indica que se debe asignar cada elemento de la poblacin en un
solo grupo y que ningn elemento debe quedar eliminado.
2. Despus de estratificar la poblacin aplicar muestreo probabilstico en

cada grupo.
La idea principal del muestreo estratificado es medir el grado de precisin

muestral o al menos controlar las variables extradas que pueden aumentar el

error muestral. Es muy importante identificar las variables de la base de

estratificacin si no existe informacin para identificar estas variables, se puede
aplicar un estudio piloto exploratorio para conocer dichas variables de
estratificacin.
VARIABLES DE ESTRATIFICACION.
CUALITATIVO: Sexo, condicin social, estado civil, nivel de tasa de consumo,

tamao de una empresa (pequeo, mediano y grande), utilidades de una empresa
(baja, regular y alta).
CUANTITATIVOS: Peso, talla, monto de ingreso, egreso, utilidad, renta, impuesto,

tasa de inters, capitalizacin, o todo lo que se pueda registrar como dato
numrico entero, real o fraccionario.
AFIJACIN
Cuando se tiene tamao de muestra n llamamos afijacin de la muestra a la
asignacin del tamao correspondiente a cada estrato de tal forma que frente a
un costo total de la investigacin, la Barina muestral sea minimizada, Los criterios
de afijacin ms utilizada son:
AFIJACION IGUAL: Llamado tambin afijacin simple en la que se asigna a

todo los estratos el mismo nmero de unidades para lo cual basta con
dividir el tamao de muestra por el nmero de estratos Esta asignacin no
tiene en cuenta el equilibrio de la muestra y es poco usado salvo que se
quiere un nmero suficiente en todo los estratos.
n
nh
L

AFIJACION PROPORCIONAL: Consiste en determinar el tamao de cada

estrato de modo que su porcentaje dentro de la muestra coincida con el
porcentaje que represente en estrato poblacional correspondiente
respecto a la poblacin total, se realiza aplicando simplemente los
porcentajes de cada estrato en la poblacin del tamao global de la
muestra, esto indica que cuanto mayor sea un estrato mayor ser la
muestra asignado al mismo.
N
nh h n
N
AFIJACION OPTIMA: Es el ms completo que los anteriores (solo para datos

cuantitativos) y se centra en la necesidad de que los distintos estratos
deben tener la misma representatividad y variacin. Consiste en
multiplicar, cuando se conoce los desviaciones tpicas de cada estrato de la
poblacin el porcentaje de cada estrato en la poblacin por su desviacin
tpica, adems se puede tener en cuenta el costo de la investigacin para
luego asignar proporcin limite a estratos producto, el tamao global de la
muestra se actualiza especialmente cuando su empleo deduce de una
manera sensible considerando la varianza por estratos.
La afijacin optima si bien no respeta el coeficiente de elevacin

(cantidad de unidades mustrales representadas por cada uno de los
componentes de la muestra), proporciona unos estratos en las que la
dispersin de la informacin es constante para toda la muestra.
n( N h )( S h )
nh L
N S
h 1
h h

Ejemplo 1: (CASO DE VARIABLES CUALITATIVAS):
Si se tiene 805 personas de un sector de la Ciudad, del cual se pretende estudiar el

rechazo o preferencia del consumo de bebidas gaseosas, para ello se considera tres
grupos (nios, jvenes y adultos), hallar el tamao de la muestra para un nivel de
confianza del 95% y un error del 18% para la proporcin y luego asignar el tamao de
muestra para cada estrato. Los valores de Ph y Qh son tomados de un estudio preliminar
(hallados de un barrio de la ciudad de Juliaca) y se toma como antecedente o referencia
para este ejemplo.
Personas Nh Ph Qh Wh
Nios 345 0.18 0.82 345/805
Jvenes 262 0.27 0.73 262/805
Adultos 198 0.38 0.62 198/805
Total 805
FUENTE: Resultados de un estudio similar al planteado en un barrio de Juliaca
Ph : Proporcin de rechazo del consumo de bebidas gaseosas

Qh : Proporcin de preferencia de consumo de bebidas gaseosas
= 0.05 entonces Z = 1.96

e = 18% = 0.18
E = e ( PG) = 0.18 (0.258484472) = 0.0465272=4.65%
Calculando la proporcin general.

L
N h Ph
345(0.18) 262(0.27) 198(0.38)
PG h 1
= = 0.258484472
N 805
Primera aproximacin:
L
Z 2 (Wh Ph Qh )
i) n0 h 1
=
E2

345 262 198

(1.96) 2 (0.18)(0.82) (0.27)(0.73) (0.38)(0.62)
n0 805 805 805
2
(0.0465272 )
(1.96) 2 0.18535528
n0 328.929765 5 329
(0.0465272 ) 2
ii) Condicin para su correccin o no de la muestra inicial.
Si (329/805) = 0.408695652 = 0.05
Entonces se corrige aplicando la misma frmula de correccin.
n0 329
n 233.755516 3 234
(n0 1) (329 1)
1 1
N 805
Finalmente la muestra para el presente estudio ser 234, con un 95 % de

nivel de confianza o =0.05 nivel de significancia.
DETERMINAMOS LA AFIJACION UTILIZANDO SUS RESPECTIVAS FORMULAS:

n
Afijacin igual: nh
L
Afijacin proporcional: N
n h h n (Wh )n
N
AFIJACION
Igual Proporcional (Recomendado)
Estratos Nh nh nh
Nios 345 234/3 = 78 (345/805)*234 = 100
Jvenes 262 234/3 = 78 (262/805)*234 = 76
Adultos 198 234/3 = 78 (198/805)*234 = 58
TOTAL 805 234 234

CASO II: VARIABLES CUANTITATIVOS

Z2
Primera aproximacin:
n0
E2
Wh (Sh2 )
L
N h Xh
Promedio General: XG H 1
N
Ejemplo 2 (CASO DE VARIABLES CUANTITATIVAS):
En el Gobierno Regional de Puno, se desea investigar el nivel de la capacidad laboral de

265 profesionales distribuidos en las cinco principales especialidades, en una
investigacin similar en Arequipa se obtuvo las siguientes calificaciones promedio con sus
respectivas varianzas, los que se muestran en la siguiente tabla, determine el tamao de
muestra para cada estrato (con los 3 tipos de afijaciones), con un nivel de confianza del
95% y un error del 6% para el promedio.
Especialidades Nh X S2h
Funcionarios 62 11.25 12.5

rea Administracin y Contabilidad 83 14.5 12.25
rea Ingenieras 72 14.75 14.5
rea Biomdicas 27 14.25 9.5
rea Sociales 21 13.5 16.5
TOTAL 265
= 0.05 entonces Z =1.96

e = 6% = 0.06
Calculando el Promedio general:

L
N h Xh
62 * 11.25 83 * 14.5 72 * 14.75 27 * 14.25 21 * 13.5
X G H 1 13.7028302
N 265
E = e ( X G) = 0.06 ( X G) = 0.06 (13.7028302) = 0.82216981

CALCULANDO LA PRIMERA APROXIMACIN:

Especialidades Nh X S2h Wh Wh*S2h
Funcionarios 62 11.25 12.5 0.233962264 2.924528302
rea Administracin y Contabilidad 83 14.5 12.25 0.313207547 3.836792453
rea Ingenieras 72 14.75 14.5 0.271698113 3.939622642
rea Biomdicas 27 14.25 9.5 0.101886792 0.967924528
rea Sociales 21 13.5 16.5 0.079245283 1.30754717

TOTALES 265 12.97641509
Z2
i) n0 2 Wh (Sh2 )
E
(1.96) 2
ii) n0 (12.9764150 9) 73.7469086 74
(0.82216981 1) 2
Condicin para la correccin:

74
n 58.0177514 8 58
(74 1)
1
265
iii) n = 58
DETERMINAMOS LA AFIJACION UTILIZANDO SUS RESPECTIVAS FORMULAS:

AFIJACION IGUAL AFIJACION PROPORCIONAL AFIJACION PTIMA
n n( N h )( Sh )
nh N nh
L nh h n N h Sh
N
CALCULOS PREVIOS:
Especialidades Nh S2h Wh Sh Nh * S h
Funcionarios 62 12.5 0.233962264 3.535533906 219.2031022
rea Administracin y Contabilidad 83 12.25 0.313207547 3.5 290.5
rea Ingenieras 72 14.5 0.271698113 3.807886553 274.1678318
rea Biomdicas 27 9.5 0.101886792 3.082207001 83.21958904
rea Sociales 21 16.5 0.079245283 4.062019202 85.30240325

TOTALES 265 952.3929263

AFIJACIONES
Afijaciones (nh)
Igual Proporcional ptima

Especialidades Nh
nh
n N n( N h )( Sh )
nh h n nh
L N N h Sh
Funcionarios 62 58/5=11.6 = 12 13.56981132 = 14 13.34930109 = 13
rea Administracin y
83
Contabilidad 58/5=11.6 = 12 18.16603774 = 18 17.69122758 = 18
72
rea Ingenieras 58/5=11.6 = 12 15.75849057 = 16 16.69661104 = 17
27
rea Biomdicas 58/5=11.6 = 12 5.909433962 = 6 5.068009255 = 5
21
rea Sociales 58/5=11.6 = 12 4.596226415 = 5 5.194851045 = 5
TOTALES 265 60 59 58
Finalmente las afijaciones (igual y proporcional) no coinciden con la muestra final de

n=58, sin embargo la afijacin ptima coincide exactamente a este tamao de muestra,
entonces la afijacin ptima es la ms adecuada para aplicar el muestreo aleatorio
estratificado.

Se tiene calificaciones promedio con sus varianzas respectivas, sobre estudiantes de una
misma escuela profesional pero de tres semestres diferentes, los que se muestran en la
siguiente tabla, determine el tamao de muestra para cada estrato con un nivel de
significancia = 0.05 y un error del 9% para el promedio.
Con la informacin del problema anterior, hallar el tamao de muestra para cada estrato

SEMESTRE Nh Sh2 Wh
X
PRIMERO 200 15.3 16.16 200/550
TERCERO 150 14.5 14.56 150/550
QUINTO 200 13.8 15.48 200/550
Totales 550

= 0.05 entonces Z =1.96

L
N h Xh
200(15.3) 150(14.5) 200(13.8)
XG H 1
= = 14.5363633636
N 550

E = 0.09 ( X g) = 0.09 (14.5363) = 1.308272727
Z2
i) n0 2
E
Wh(S 2
h)
(1.96) 2
n0 (200 / 550(16.16) 150 / 550(14.56) 200 / 550(15.48)) 34.7363748
(1.3083) 2
n0 = 35
ii) Condicin para la correccin o no de la muestra inicial:

Si (35/550) = 0.06363636 = 0.05 Entonces se corrige.
n0 35
n = = 32.9623288
(n0 1) (35 1)
1 1
N 550
iii) n = 33
LAS AFIJACIONES SERAN DE LA SIGUIENTE MANERA:
SEMESTRE Nh Afijacin Afijacin Afijacin

simple nh proporcional nh ptima nh
PRIMERO 200 11 12 12
TERCERO 150 11 09 09
QUINTO 200 11 12 12
Totales 550 33 33 33


Se desea estudiar sobre el rendimiento acadmico de la Escuela Profesional de Ingeniera
Econmica de los estudios realizados en el ao acadmico 2009. Los resultados de la tabla
mostrada son tomados como referencia de estudio. Determine el tamao de muestra
para un nivel de confianza del 90% y un error de 6% para el promedio, realizar afijacin
en las 3 formas.

Nivel Nh X Sh2 Wh
Primero 189 12.33 15.75 189/519

Segundo 120 13.13 16.25 120/519
Tercero 96 13.33 13.25 96/519
Cuarto 71 13.75 14.75 71/519
Quinto 43 14.25 17.25 43/519
Totales 519
= 0.10 entonces Z =1.645

e = 0.06 = 6%
L
N h Xh
189(12.33) 120(13.13) ... 43(14.25)
XG H 1
= = 13.05327553
N 519

E = 0.06 ( X g) = 0.06 (13.05327553) = 0.7831965
Z2
i) n0
E2
Wh(S 2
h)
(1.645) 2
n0 (189 / 519(15.75) 120 / 519(16.25) ... 43 / 519(18.25)) =
(0.7831965 ) 2
n0 = 67.89650187 = 68
ii) Condicin para la correccin o no de la muestra inicial:

Si (68/519) = 0.13 = 0.10 Entonces se corrige.

n0 68
n = = 60.2252557
(n0 1) (68 1)
1 1
N 519
iii) n = 60
SEMESTRE Nh Afijacin Afijacin Afijacin

Primero 189 12 22 22
Segundo 120 12 14 14
Tercero 96 12 11 11
Cuarto 71 12 08 08
Quinto 43 12 05 05
TOTALES 519 60 60 60
n N n( N h )( S h )
nh nh h n nh
N
L
L
N S
n 1
h h

Ejemplo 5: CASO (MUESTRA PILOTO) DATOS CUANTITATIVOS

Se desea realizar un estudio sobre el nivel de desnutricin de nios de 6, 7, 8, 9, 10, 11,
12 meses registrados en el HMNB se tiene un total de 716 ficha registradas durante el
presente ao. Determinar el tamao de muestra para un nivel de confianza del 95 % y un
error del 2% para el promedio, luego realizar la afijacin de las tres formas, considerando
que no se tiene ninguna investigacin similar en dicho Centro de Salud.
DATOS PARA LA MUESTRA PILOTO
Estrato 6 meses 7 meses 8 meses 9 meses 10 meses 11 meses 12meses

Nro.Obs.. 5 6 5 4 6 5 5
1 7.80 8.30 8.80 9.20 9.50 9.90 10.20
2 7.93 7.50 9.40 9.45 10.15 8.10 11.45
3 8.35 8.75 9.25 7.50 10.05 10.50 9.90
4 8.40 7.45 7.95 9.80 9.80 10.25 10.36
5 6.00 6.15 6.65 10.20 9.82 9.56
6 8.90 8.15
Promedio 7.696 7.84166667 8.41 8.9875 9.64166667 9.714 10.294

Varianza 0.96633 1.05741667 1.28675 1.043958333 0.60141667 0.88898 0.51088
Meses
Nh X Sh2 Wh Wh X Nh Wh S2h
6 108 7.696 0.96633 108/716 0.15083799 831.168 0.14575927

7 120 7.8416667 1.057416667 120/716 0.16759777 941 0.17722067
8 98 8.41 1.28675 98/716 0.13687151 824.18 0.17611941
9 76 8.9875 1.043958333 76/716 0.10614525 683.05 0.11081122
10 127 9.6416667 0.601416667 127/716 0.1773743 1224.491667 0.10667586
11 91 9.714 0.88898 91/716 0.12709497 883.974 0.11298489
12 96 10.294 0.51088 96/716 0.13407821 988.224 0.06849788
totales 716 1 6376.087667 0.8980692
= 0.05 entonces Z =1.96

L
Nh X h 108(7.696) 120(7.842) ... 96(10.294)

XG H 1
= = 8.90515057
N 716

e=2%=0.02; E=0.02( X g)=0.02(8.9015057) = 0.178103007
Z2
i) n0
E2
Wh(S 2
h )
(1.96) 2
(108 / 716)(0.966333) (120 / 716)(0.05741) ... (96 / 716)(0.51088)
(0.178103 ) 2
n0 = 108.762565 = n0 = 109
ii) Si(109/716) =0.1522347 > =0.05 Entonces se corrige

n0 109
n = = 94.71359223 = 95
(n0 1) (109 1)
1 1
N 716

Meses Nh Afijacin Afijacin Afijacin
6 108 14 14 15 Afijacin n
igual
nh
7 120 14 16 17 L
8 98 14 13 16
N
9 76 14 10 11 Afijacin nh h n
proporcional N
10 127 14 17 14
11 91 14 12 12 n( N h )( S h )
Afijacin
nh L
12 96 14 13 10 ptima N S
n 1
h h
Totales 716 98 95 95

CAPTULO V
PRUEBAS DE HIPTESIS
DIFERENCIA DE DOS MEDIAS MUESTRALES
Es una prueba estadstica aplicado a datos cuantitativos. La prueba de hiptesis que

involucra las diferencias entre las medias de dos muestras se utiliza con ms frecuencia
para determinar si es razonable o no concluir que las dos son distintas entre si. Se utiliza
la distribucin T (T-Student) cuando n<32, y Z (Distribucin Normal) cuando n>=32.
EJEMPLO 1. De una muestra de 10 estudiantes se considera las siguientes calificaciones

obtenidas de una evaluacin (prueba de entrada) sobre conocimientos bsicos sobre el
uso y aplicacin del Plan Contable y luego de una capacitacin se volvi a evaluar (prueba
de salida). Determinar si existe diferencia en la prueba de entrada y salida para un nivel
de confianza del 95% (=0.05 nivel de significancia). Para as comprobar si la capacitacin
tuvo xito o no.
PRUEBA
Nro. Dato
ENTRADA SALIDA
1 11 13
2 7 14
3 10 15
4 7 7
5 11 13
6 7 12
7 11 13
8 8 11
9 11 12
10 9 11
Promedio 9.2 12.1
Varianza 3.288888889 4.766666667

1. PLANTEAMIENTO DE HIPOTESIS
Ho : Promedio Prueba de entrada = Promedio Prueba de
Ho : A = B Salida (Hiptesis nula).
H1 : Promedio Prueba de entrada Promedio Prueba de
H1 : A B Salida (Hiptesis alterna).
2. FIJAR EL NIVEL DE SIGNIFICANCIA ( )

Se puede tomar diferentes niveles de significancia dependiendo con qu nivel de
confianza se concluir, el ms utilizado es = 0.05 (95 % de nivel de confianza)
3. REGLA DE DECISION UTILIZANDO (Tc= T calculada y Tt= T tabulada o de tabla)

si Tc > Tt Se rechaza la Ho y se Acepta la H1
4. CALCULO DE Tc SEGN LA FORMULA
XA XB 9.2 12.1
Tc 3.23109888
S A2 S B2 3.288888888 4.766666666

n A nB 10 10
Para este caso buscamos el valor de (Tt) T tabulada o T de tabla con

(n=nA+nB=10+10=20) n-2 = 20 - 2 = 18 g.l. (Grados de libertad) y ( = 0.05 5%
Nivel de significancia).
Luego: Tt = T [18,0.05] = 2.1009 (18 g.l. y =0.05 95% de nivel de confianza)
5. DECISION: Como Tc = 3.231 > Tt =2.1009 , Entones Se rechaza la H0 y se Acepta la

H1, esto implica que SI EXISTE diferencia significativa entre estas dos
evaluaciones, es decir que la capacitacin tuvo un efecto positivo, para un
nivel de significancia de 0,05 o para un nivel de confianza del 95%.
NOTA: Si el caso fuera que Tc < Tt , Ocurre lo contrario es decir que se Aceptara la
hiptesis nula y se rechazara la hiptesis alterna, generalmente este caso no
debe ocurrir en una investigacin porque no estaramos demostrando la
hiptesis alterna, lo que implicara que la investigacin que se realiz no es
beneficiosa ni satisfactoria para nuestros objetivos.

EJEMPLO 2. : De una muestra de 72(Puno) y 80(Juliaca) establecimientos comerciales se

obtuvo informacin sobre las utilidades netas semanales, con esta informacin
determinar si existe o no diferencia significativa entre estos establecimientos
entre Puno y Juliaca para un nivel de confianza de 95%.
Para este caso en el contraste de las hiptesis se usa la prueba estadstica de la

distribucin normal (Z) porque n>=32.
Utilidades en cientos de S/. Utilidades en cientos de S/.

Nro. Nro.
Establec.Com. Establec.Com. Establec.Com. Establec.Com.
Tienda PUNO JULIACA Tienda PUNO JULIACA
1 62 79 42 49 80
2 60 79 43 55 59
3 62 63 44 52 62
4 50 70 45 62 60
5 49 71 46 59 72
6 45 60 47 58 70
7 59 65 48 57 81
8 53 58 49 63 71
9 51 64 50 52 77
10 50 75 51 60 67
11 53 85 52 59 62
12 55 74 53 61 70
13 55 70 54 64 60
14 60 58 55 47 81
15 49 62 56 64 62
16 53 67 57 47 79
17 61 67 58 64 74
18 54 73 59 59 61
19 48 79 60 48 67
20 51 64 61 50 65
21 57 82 62 64 79
22 61 65 63 59 77
23 58 83 64 59 67
24 51 66 65 53 67
25 56 64 66 51 76
26 45 85 67 63 60
27 60 62 68 58 64
28 53 69 69 53 74
29 48 65 70 60 72

30 49 75 71 51 84
31 53 68 72 51 84
32 60 80 73 70
33 64 63 74 66
34 63 58 75 82
35 50 60 76 72
36 59 81 77 62
37 54 70 78 58
38 50 65 79 76
39 51 69 80 85
40 51 70 Prom. 55.2916667 70.0375
41 56 65 Var. 29.0827465 62.390981
1. PLANTEAMIENTO DE HIPOTESIS
Ho : Promedio de las utilidades netas semanales en cientos de soles de los
Ho : A = B
establecimientos comerciales de Puno = Promedio de las utilidades netas
semanales en cientos de soles de los establecimientos comerciales de
Juliaca (Hiptesis nula)
H1 : Promedio de las utilidades netas semanales en cientos de soles de los
H1 : A B establecimientos comerciales de Puno Promedio de las utilidades netas

semanales en cientos de soles de los establecimientos comerciales de
Juliaca (Hiptesis alterna)
2. FIJAR EL NIVEL DE SIGNIFICANCIA ( )
Se puede tomar niveles de significancia dependiendo con qu nivel de confianza se

concluir, los ms utilizados son:
= 0.05 de nivel de significancia (95 % de nivel de confianza)
En funcin a este valor ( = 0.05) se busca en la tabla estadstica el valor de Zt = 1,96
3. REGLA DE DECISION UTILIZANDO

(Zc= Z calculada y Zt= Z tabulada o de tabla)
Si Zc > Zt Se rechaza la Ho (Hiptesis nula) y se Acepta la H1 (Hiptesis Alterna)

4. CALCULO DE Zc SEGN LA FORMULA
XA XB 55.2916667 70.0375
Zc 13.552753
S A2 S B2 29.0827465 62.390981

n A nB 72 80
BUSQUEDA DE Zt DE TABLA CON nivel de significancia

si = 0.05 ==> Zt = Z0.05 = 1.96 (95% de nivel de confianza)
5. DECISION:
Como Zc = 13.552753 > Zt =1.96 , Se rechaza la Ho y se Acepta la H1, ENTONCES significa
que SI EXISTE diferencia significativa entre Promedio de las utilidades netas
semanales en cientos de soles de los establecimientos comerciales de Puno con
el Promedio de las utilidades netas semanales en cientos de soles de los
establecimientos comerciales de Juliaca para un nivel de significancia 0.05; 0.10 y
0,01 un nivel de confianza del 95%, 90% y 99 % respectivamente.

CORRELACIN DE PEARSON
Este indicador es utilizado para medir la relacin existente entre dos variables cuantitativas en
estudio. Se utiliza la distribucin T (T-Student) cuando n<32, y Z (Distribucin
Normal) cuando n>=32. Los pasos a seguir para este tipo de pruebas de hiptesis son los
siguientes:
PRUEBA de HIPTESIS.
Las hiptesis son planteadas del siguiente modo:
H0: 0 No existe grado de correlacin o dependencia entre las variables en estudio
H1: 0 Existe algn grado de correlacin o dependencia entre las variables en estudio
NIVEL de SIGNIFICANCIA.
Se usar un nivel significancia entre el 1 % y el 10 %, cuando no se precisa este nivel,
se asume un nivel de significancia del 5 % (Es el ms recomendado y es equivalente a
un 95% de nivel de confianza) , es decir = 0,05 y una Tt (T tabulada o de tabla) con n-
2 grados de libertad. (n es el nmero de datos sumado de las dos variables es decir
n=nA+nB)
PRUEBA ESTADSTICA.
Se usar la distribucin Tt con n-2 grados de libertad.
n n
X i Yi
X iYi i 1 i 1
n
n
r i 1
2 2

n
n

Xi Yi
i 1 i 1
n n
X
i 1
i
2
n
Y
i 1
i
2
r
n2 Zc
Tc r 1 r 2
1 r2
n2

Donde:
Tc : T calculada.
n : Tamao de muestra.
r : Coeficiente de correlacin.
Y : Variable dependiente.
X : Variable independiente.
REGLA DE DECISIN.
Si Tc > Tt. entonces se rechazar H0; Si Zc > Zt. entonces se rechazar H0,
CONCLUSIN.
Se compara el valor Tc (T calculado) es mayor que T (T tabulada o de tabla) se
rechaza la Ho y se acepta H1, esto significa que Existe algn grado de
correlacin o dependencia entre las variables en estudio.
Ejemplo 1:
Se tiene los siguientes resultados de la investigacin: FUNCIONALIDAD
FAMILIAR Y AUTOESTIMA EN LOS ESTUDIANTES DEL INSTITUTO SUPERIOR
PEDAGOGICO PUBLICO PUNO 2014, con una muestra de 10 estudiantes,
determinar si existe o no algn grado de correlacin o dependencia entre estas
dos variables en estudio para un nivel de significancias de 0.05
PRUEBA
FUNCIONALIDAD AUTOESTIMA
Xi * Yi Xi Yi
FAMILIAR ( Xi ) ( Yi )
1 14 10 140 196 100
2 12 11 132 144 121
3 16 14 224 256 196
4 14 12 168 196 144
5 13 11 143 169 121
6 14 10 140 196 100
7 17 13 221 289 169
8 19 16 304 361 256
9 13 10 130 169 100
10 12 12 144 144 144
144 119 1746 2120 1451

1. PRUEBA de HIPTESIS.
H0: 0 No existe grado de correlacin o dependencia entre la autoestima y la
funcionalidad familiar. (HIPTESIS NULA)
H1: 0 Existe algn grado de correlacin o dependencia entre la autoestima y
la funcionalidad familiar. (HIPTESIS ALTERNA)
2. NIVEL de SIGNIFICANCIA.
= 0,05 (5%) nivel de significancia del equivalente a un 95% de nivel de confianza
3. PRUEBA ESTADSTICA.
Se usar la distribucin Tt (T tabulada o T de tabla) con n-2 grados de libertad.
Tt (18 G.L., =0.05) = 2.1009
n
n n
n X iYi X i Yi
r i 1 i 1 i 1
2 2
n
n n
n
n X i2 X i n Yi 2 Yi
i 1 i 1 i 1 i 1
10(1746 ) (144)(119)
r 0.80514353
10(2120 ) 144 2 10(1451) 119 2
n2 20 2
Tc r 0.80514353 5.75965238
1 r 2
1 0.80514353 2
4. REGLA DE DECISIN.
Si Tc > Tt. entonces se rechazar H0,
5. CONCLUSIN.
Como Tc = 5.75965238, es mayor que Tt = 2.1009, se rechaza la H0 (Hiptesis
Nula) y se acepta H1 (Hiptesis Alterna), esto significa que Existe algn grado
de correlacin o dependencia entre la autoestima y la funcionalidad familiar,
para un nivel de confianza de 95% con un nivel de significancia 5% 0.05.

Ejemplo 2. Realizar una prueba de hiptesis y determinar si existe o no RELACION

entre la variable Y que representa (Ventas miles de S/.) y X (N pedidos de material de
escritorio) de una entidad pblica, para un nivel de confianza del 95%
pedido (X) venta (Y) Xi * Yi Xi Yi

1 110 1870 205700 12100 3496900
2 139 2201 305939 19321 4844401
3 150 2550 382500 22500 6502500
4 133 2261 300713 17689 5112121
5 117 1234 144378 13689 1522756
6 135 2295 309825 18225 5267025
7 155 2635 408425 24025 6943225
8 153 2601 397953 23409 6765201
9 153 1920 293760 23409 3686400
10 135 2740 369900 18225 7507600
11 105 1785 187425 11025 3186225
12 138 2346 323748 19044 5503716
1623 26438 3630266 222661 60338070
H0: 0 No existe grado de relacin entre las ventas y el pedido de material de
escritorio de una entidad pblica. (HIPTESIS NULA)
H1: 0 Existe algn grado de relacin entre las ventas y el pedido de material
de escritorio de una entidad pblica. (HIPTESIS ALTERNA)
= 0,05 (5%) nivel de significancia del equivalente a un 95% de nivel de confianza
Se usar la distribucin Tt (T tabulada o T de tabla) con n-2 grados de libertad.
Tt (22 G.L., =0.05) = 2.0739
n
n n
n X iYi X i Yi
r i 1 i 1 i 1
2 2
n
n n
n
n X i
2
Xi n Yi Yi
2
i 1 i 1 i 1 i 1

12(3630266 ) (1623)(26438 )
r 0.671868211
12(222661) 1623 2
12(60338070 ) 26438 2
n2 24 2
Tc r 0.671868211 4.254712907
1 r 2
1 0.671868211 2
Si Tc > Tt. entonces se rechazar H0,
5. CONCLUSIN.
Como Tc = 4.254712907, es mayor que Tt = 2.0739, se rechaza la H0 (Hiptesis
Nula) y se acepta H1 (Hiptesis Alterna), esto significa que Existe algn grado
de relacin o dependencia entre las ventas y los pedido de material de
escritorio de una entidad pblica, para un nivel de confianza de 95% con un
nivel de significancia 5% 0.05.

Ejemplo 3: Dada la siguiente informacin determinar si existe influencia significativa entre la
ACTITUD DOCENTE Y LA IMPLEMENTACIN DEL PROYECTO CURRICULAR REGIONAL en la IES
Industrial 32 Puno 2014
IMPLEMENTACION del
IMPLEMENTACION del
ACTITUD DOCENTE ACTITUD DOCENTE
MOTIVACIONAL
MOTIVACIONAL
CONDUCTUAL
CONDUCTUAL
AFECTIVA
AFECTIVA
P.C.R.
P.C.R.
TOTAL
TOTAL
1 12 12 12 36 26 35 8 13 10 31 25
2 12 13 9 34 30 36 7 10 7 24 22
3 8 9 5 22 21 37 4 4 3 11 15
4 8 12 9 29 26 38 7 5 2 14 10
5 5 9 9 23 27 39 11 13 11 35 24
6 8 8 9 25 22 40 12 12 10 34 27
7 14 16 10 40 33 41 8 10 9 27 23
8 12 15 10 37 29 42 12 12 9 33 24
9 8 8 5 21 16 43 12 12 9 33 25
10 8 7 9 24 18 44 6 9 8 23 20
11 8 9 6 23 19 45 10 10 8 28 22
12 12 14 12 38 34 46 8 10 6 24 26
13 14 14 11 39 29 47 14 14 9 37 32
14 10 10 8 28 27 48 10 13 9 32 25
15 3 5 8 16 19 49 12 16 11 39 28
16 4 5 6 15 13 50 9 11 11 31 18
17 6 5 5 16 14 51 10 11 10 31 25
18 10 10 9 29 23 52 6 10 9 25 27
19 13 14 9 36 30 53 13 12 9 34 28
20 10 12 7 29 28 54 10 9 8 27 21
21 8 9 7 24 25 55 10 6 7 23 17
22 13 16 12 41 36 56 7 8 7 22 16
23 10 10 9 29 23 57 9 10 7 26 27
24 13 11 10 34 26 58 12 12 9 33 31
25 6 9 5 20 20 59 12 12 11 35 28
26 12 13 9 34 22 60 4 6 4 14 15
27 10 9 7 26 21 61 11 12 11 34 31
28 10 11 9 30 27 62 9 10 7 26 16
29 12 12 10 34 30 63 9 10 7 26 27
30 4 1 3 8 9 64 12 12 9 33 31
31 9 7 3 19 13 65 12 12 11 35 28
32 8 9 9 26 25 66 10 10 4 24 18
33 4 8 7 19 19 67 11 12 11 34 31
34 14 11 10 35 29

H0: 0 No Existe influencia significativa entre la ACTITUD DOCENTE Y LA
IMPLEMENTACIN DEL PROYECTO CURRICULAR REGIONAL en la IES
Industrial 32 Puno 2013.
Ha: 0 Si Existe influencia significativa entre la ACTITUD DOCENTE Y LA
IMPLEMENTACIN DEL PROYECTO CURRICULAR REGIONAL en la IES
Industrial 32 Puno 2013.
Se us un nivel de significancia = 0,05. Que es equivalente a 95% de nivel de
confianza. Cuyo valor de tabla de la Distribucin Normal es Zt = 1.96
Se calcul el coeficiente de correlacin mediante la siguiente formula con los
datos del anexo 01:
n n
X i Yi
X iYi i 1 i 1
n
n
r i 1
2 2
n n
Xi Yi
i 1 i 1
n n
X
i 1
i
2
n
Y
i 1
i
2
r = 0,856659868747961
Donde:
Y : Variable dependiente.
X : Variable independiente.
Para contrastar las hiptesis se us la distribucin Normal: para la Zt con n-2

grados de libertad (Extrada de la tabla estadstica). Y la Zc se calcula con la
siguiente frmula:

r
Zc
1 r 2
n2
Zc = 19,0785477731842
Donde:
Zc : Z calculada.
Si Zc > Zt. Entonces se rechazar H0,
Como Zc = 19,07855 > Zt = 1.96, Entonces se Rechaza la H0., Es decir que Si Existe
influencia significativa entre la ACTITUD DOCENTE Y LA IMPLEMENTACIN DEL
PROYECTO CURRICULAR REGIONAL en la IES Industrial 32 Puno 2013, Para un
nivel de significancia = 0,05 para un 95% de nivel de confianza.

PRUEBA DE DIFERENCIA DE 2 A MAS TRATAMIENTOS (F de Fisher)
1) PLANTEAMIENTO DE HIPOTESIS
H0: (No existe diferencia entre las variables en estudio).
H1: (Existe diferencia entre las variables en estudio).
2) NIVEL DE SIGNIFICANCIA
= 0,05 nivel de significancia (1-=1-0,05=0,95==> 95% de nivel de confianza)
3) REGLA DE INFERENCIA:
si Fc > F[t-1,t(r-1)], Se rechaza la Ho
t=2 = NRO DE VARIABLES , r=NRO DATOS
4) ANDEVA (Anlisis de Varianza)
G.L. S.C. C.M. Fc.
Grados de Suma de Cuadrados F-Fisher
Fuentes de Variabilidad libertad cuadrados medios Calculado
Entre Tratamientos t-1 A A/(t-1) = E E/F
Dentro Trat.(Err.Exp) t(r-1) B B/(t(r-1)) = F

TOTAL tr-1 A+B
SC.trat.
2 2
X i. X 2 .. X i.
SC.Error X 2
ij
r rt r
X 2 ..
SC.tot X 2ij
rt Opcional
SC error = SC tot - SC trat
CM trat = SC trat / GL trat
CM error = SC error / GL error
Fc = CM trat / CM error
5) DECISION
Si se comprueba que el valor Fc (F calculado), es mayor que Ft (F tabulada o de tabla) se
rechaza la H0 (Hiptesis Nula) y se acepta H1 (Hiptesis Alterna), esto significa que Existe
diferencia entre las variables en estudio. En caso contrario se acepta la Ho (Hiptesis Nula) lo
que significara que No Existe diferencia entre las variables en estudio. Todo ello con un nivel
de confianza de 95%, 90% 99%, segn el (nivel de significancia) utilizado.

Ejemplo:
SE TIENE LOS SIGUIENTES RESULTADOS DE UNA EVALUACION APLICADA A 10 ESTUDIANTES
SOBRE CULTURA GENERAL(Evaluacin de entrada) Y LUEGO DE UNA CAPACITACION
(Evaluacin de salida), DETEMINAR SI EXISTE O NO DIFERENCIA SIGNIFICTIVA ENTRE ESTAS
PRUEBAS EN ESTUDIO para un nivel de significancia DE 0.05
PRUEBA
ENTRADA SALIDA
Xi Yi
(Xi) (Yi)
10 14 100 196
11 12 121 144
14 16 196 256
12 14 144 196
11 13 121 169
10 14 100 196
13 17 169 289
16 19 256 361
10 13 100 169
12 12 144 144
119 144 1451 2120
X.. = 119+144=263 t= 2
X2ij = 1451+2120=3571 r = 10
1) PLANTEAMIENTO DE HIPOTESIS
H0: No existe diferencia entre la Evaluacin de entrada y la Evaluacin de salida.

H1: Si existe diferencia entre la Evaluacin de entrada y la Evaluacin de salida.
2) NIVEL DE SIGNIFICANCIA
= 0,05 de nivel de significancia (95% de nivel de confianza)

3) REGLA DE INFERENCIA:
si Fc > F[t-1,t(r-1)], Se rechaza la Ho
F tabulada (de tabla)

F[1,18],0.05 = 4,413863
F[1,18],0.01 = 8,285497
4) ANLISIS DE VARIANZA
SC.trat.
2
X i. X 2 .. X 2 ..
SC.tot X ij 2

r rt rt
119 2 144 2 263 2 263 2

SC.trat. 31.25 SC.tot 3571 112.55
10 10(2) 10(2)
ANDEVA
Fuentes de Variabilidad G.L. S.C. C.M. Fc.
Entre Tratamientos 1 31.25 31.25 6.918819188
Dentro Trat.(Err.Exp) 18 81.3 4.516666667
TOTAL 19 112.55
5) DECISION:
Como Fc =6.919 > Ft, 0,05 = 4,414 Entonces, Se rechaza la H0, para un nivel de sig. 0,05, aceptndose H1,
es decir que EXISTE diferencia entre la PRUEBA DE ENTRADA Y LA PRUEBA DE SALIDA, para nivel de
confianza del 95%, Sin embargo como Fc=6.919 < Ft, 0,01 = 8,2855 NO EXISTE diferencia entre la
autoestima y la funcionalidad familiar para un nivel de confianza del 99%

Ejemplo: Supongamos que una compaa manufacturera ha comprado 03 mquinas

(A1, A2 y A3) de produccin de diferentes marcas se desea determinar si una de ellas es
ms rpida que las otras al producir un cierto bien. Se observa los resultados de 5 hrs.
de produccin en forma aleatoria para cada mquina y se obtiene los siguientes
resultados, Probar si existe diferencias entre las 3 mquinas para un nivel de
significancia = 0.05
REPETICIONES
Tratamientos 1 2 3 4 5 Xi. Prom.Xi Sum Xi.^2 Xi.2
A1 25 30 36 38 31 160 32 5226 25600
A2 31 39 38 42 35 185 37 6915 34225
A3 24 30 28 25 28 135 27 3669 18225
SUM 480 15810 78050
1. Planteamiento de hiptesis:
Ho (Hiptesis nula) : A1 = A2 = A3
H1 (Hiptesis alterna) : al menos alguno es diferente
2. Nivel de significancia:
= 0,05 nivel de significancia 95% de nivel de confianza
3. Prueba Estadstica:
Se establece el punto y la regin crtica o regin de rechazo o aceptacin
Si Fc > F[t-1,t(r-1)], Se rechaza la Ho
F[2,12],0.05 = 3.88529
SC.trat.
X 2
i.

X 2 .. 160 2 185 2 135 2 480 2
250
r rt 5 5(3)
X 2 .. 480 2
SC.tot X 2
ij 15810 450
rt 5(3)

t= 3
ANVA (Anlisis de varianza) r= 5
Fuentes de Variabilidad G.L. S.C. C.M. Fc.
Entre Tratamientos t-1 2 250 125 7.5
Dentro Trat.(Error Exp.) t(r-1) 12 200 16.6666667
TOTAL tr-1 14 450
SC error = SC tot - SC trat

CM trat = SC trat / GL trat
CM error = SC error / GL error
Fc = CM trat / CM error
5. DECISION
Como Fc = 7.5 > Ft =3.88529, Se rechaza la Hiptesis Nula(Ho) y se acepta la Hiptesis alterna (H1)
Esto implica que al menos alguna marca de las maquinas tiene diferente produccin
despus de 5 hrs. para un nivel de significancia 0,05 un nivel de confianza del 95%

LA DISTRIBUCIN JI-CUADRADO
La distribucin ji-cuadrado tiene muchas aplicaciones en inferencia estadstica, por

ejemplo en la denominada prueba utilizada como prueba de independencia y como
prueba de bondad de ajuste y en la estimacin de varianzas. Tambin est involucrada
en el problema de estimar la media de una poblacin normalmente distribuida y en el
problema de estimar la pendiente de una recta de regresin lineal, a travs de su
papel en la distribucin t de Student, y participa en todos los problemas de anlisis de
varianza, por su papel en la distribucin F de Snedecor, que es la distribucin del
cociente de dos variables aleatorias de distribucin ji-cuadrado e independientes.
La distribucin Ji cuadrada se utiliza para establecer la relacin de dos variables

cualitativas
Ejemplo 1. De una muestra de 185 profesionales del rea de Administracin y

Contabilidad del Municipio de Lima, Se desea saber si la especialidad y/o desempeo
en el rea de (Financiera, Tributaria y Gubernamental) est relacionado con el gnero
(varones y mujeres). La tabla de contingencia presenta las siguientes frecuencias
observadas. Hacer la prueba de hiptesis para un nivel de confianza del 95%.
ESPECIALIADAD Y/O DESEMPEO Total

GENERO Financiera Tributaria Gubernamental
Varones 47 38 29 114
Mujeres 41 21 9 71
Total 88 59 38 185
Si la especialidad y/o desempeo en el rea de (Financiera, Tributaria y

Gubernamental) no est relacionado con el gnero se espera el mismo porcentaje de
Varones que de mujeres en cada especialidad y/o desempeo en el rea de
(Financiera, Tributaria y Gubernamental). La tabla de frecuencias esperadas es:

Financiera Tributaria Gubernamental Total

Varones (88)(114)/185 (59)(114)/185 (38)(114)/185 114
Mujeres (88)(71)/185 (59)(71)/185 (38)(71)/185 71
Total 88 59 38 185
Financiera Tributaria Gubernamental Total

Varones 54.227027 36.3568 23.4162 114
Mujeres 33.772973 22.6432 14.5838 71
Total 88 59 38 185
(Es importante observar que los totales no cambian). La frecuencia esperada se

encuentra en la segunda tabla.
Es posible decir que mientras ms cercanas sean las frecuencias observadas (f o) a las
frecuencias esperadas, ms seguro se puede estar de que el gnero y la especialidad
y/o desempeo en el rea (Financiera, Tributaria y Gubernamental) son
independientes uno del otro. En otras palabras, es posible esperar los mismos
porcentajes de Varones que de mujeres en cada nivel de la especialidad y/o
desempeo en el rea. La frmula que indica cuanto se parecen las frecuencias
esperadas a las observadas es la estadstica x2.
( fo fe )2
La frmula para hallar la Chi cuadrada (X2) calculada es: x
2
c
fe
fo fe fo - fe (fo - fe)2 (fo - fe)2/fe

47 54.2270 -7.2270 52.2299 0.9632
38 36.3568 1.6432 2.7002 0.0743
29 23.4162 5.5838 31.1786 1.3315
41 33.7730 7.2270 52.2299 1.5465
21 22.6432 -1.6432 2.7002 0.1193
9 14.5838 -5.5838 31.1786 2.1379
185 185 Ji-cuadrada ==> 6.172590369
LUEGO DECIMOS QUE : X2 (Calculada) = 6.172590369

Para determinar si esta estadstica es demasiado grande se utiliza la tabla de la

distribucin. Si cae en la zona de rechazo, la conclusin es que las dos variables estn
relacionadas
X2 (TABULADA) = X2(n-1)(m-1),0.05= X2(3-1)(2-1),0.05= X22, 0.05=5.9915
PRUEBA DE HIPOTESIS PARA LA JI CUADRADA

1) Prueba de Hiptesis:
Ho: No hay relacin o asociacin entre el gnero y el aprovechamiento en
matemticas en la poblacin.
H1: SI hay relacin o asociacin entre el gnero y el aprovechamiento en

matemticas en la poblacin.
2) Nivel de significacin ; = 0.05 (5% de nivel de significancia) equivalente a 95%

de nivel de confianza.
3) Prueba estadstica:
Se utiliza la prueba X2 (Chi cuadrada) de independencia con (n-1)(m-1) grados de
libertad donde n es el nmero de columnas y m el nmero de filas. Valores crticos
para las zonas de rechazo y de no rechazo. En este caso X 2 para = 0.05 y 2 g.l., el
valor crtico es 5.9915.
4) Decisin:
Como X2C =6.172590369 X2t =5.9915, Entonces se rechaza Ho (hiptesis nula). Esto
significa que el genero est RELACIONADO con el aprovechamiento en matemticas
para un nivel de significancia de =0.05 ( 95% de nivel de confianza).

REGRESIN LINEAL
La palabra Regresin proviene del latn regresio: regreso, vuelta, retroceso.
En nuestro entorno encontramos muchos eventos que estn relacionados

entre s, en trminos de dos o ms variables, como por ejemplo: la
metodologa de enseanza influye en el nivel de rendimiento acadmico del
alumno.
Los datos univariantes se presentan cuando en una poblacin o muestra se

mide slo una variable en cada uno de los individuos o sujetos que integran el
conjunto bajo estudio. Los datos bivariantes se presentan cuando en una
poblacin o muestra se miden simultneamente dos variables en cada uno de
los individuos o sujetos que integran el conjunto o subconjunto bajo estudio.
Algunos ejemplos de datos variantes son: la estatura y el peso de varones
adultos, el coeficiente de inteligencia y el rendimiento acadmico de los
alumnos.
Como ejemplo de datos bivariantes tenemos:

POSIBLES RELACIONES BIVARIANTES
Variable 1 (X) Variable 2 (Y)
Horas de estudio Rendimiento acadmico
Edad Peso
Clima Produccin de quinua
Habilidad verbal Calificacin en un examen
Nmero de hijos en la familia Consumo familiar
Coeficiente de inteligencia Rendimiento acadmico
Nmero de hermanos Consumo familiar
Estado emocional Aprendizaje
Alimentacin Rendimiento fsico
Dilogo con los padres Personalidad del nio

Regresin Lineal Simple.

El anlisis de regresin se encarga de descubrir la relacin funcional entre dos
o ms variables. Cuando se estudian solamente dos variables la metodologa a
utilizar se conoce como anlisis de regresin simple, en tanto que si se trata
de tres o ms variables el anlisis regresional es mltiple. El anlisis de
regresin puede ser lineal o no lineal.
Anlisis de regresin lineal.

Es la relacin que existe entre dos variables, la misma que est definida en una
funcin expresada en trminos de una ecuacin de una lnea recta, tal como se
muestra en el siguiente grfico:
Anlisis de regresin no lineal.

Es la relacin que existe entre dos variables, la misma que est definida por
una ecuacin polinomial de grado avanzado. Estas ecuaciones no lineales
producen curvas cuadrticas, hiperblicas, parablicas, cbicas, etc., tal
como se muestra en el siguiente grfico:

Modelo Regresional.
La variable Y se conoce como la variable dependiente, endgena o predicha, en

tanto que la variable X es llamada variable independiente, exgena o
predictora. La magnitud de Y depende de la magnitud de X, y por lo tanto
puede predecirse en base al valor que asuma la variable independiente.
El anlisis regresional permite expresar la relacin entre las variables X y Y

mediante una ecuacin matemtica.
El modelo matemtico poblacional est representado por:

Yi X i i
Donde:
: Parmetro poblacional, intercepto
: Parmetro poblacional, pendiente de la recta
Yi : Variable dependiente
Xi : Variable independiente
i : Error poblacional
El modelo matemtico muestral est representado por: Yi X i ei
Donde:
: Estimador muestral, intercepto
: Estimador muestral, pendiente de la recta

Yi : Variable dependiente
Xi : Variable independiente
ei : Error muestral
El modelo estimado de la recta de regresin muestral se define del siguiente
modo: Yi X i
Donde: ei Yi Yi

En la expresin anterior y son los coeficientes de regresin, son valores

desconocidos que debern ser determinados matemticamente. Cuando se
estiman los valores de los coeficientes de regresin, es posible calcular los
valores predictivos de Y para determinados valores de X, mediante la
sustitucin apropiada en la ecuacin de regresin muestral.
Esta ecuacin de regresin sera el medio de prediccin que se usara para

predecir los valores de Y correspondientes a los valores de X. Grficamente se
representa del siguiente modo:
Para estudiar la regresin de Y en X contamos con el modelo de regresin

lineal simple que se basa en los siguientes supuestos.
a) La variable independiente X tiene valores que son preestablecidos por el

equipo de investigadores. Esto implica que solamente Y, la variable
dependiente, es una variable aleatoria y que X no vara aleatoriamente sino
que est bajo el control de los investigadores.
b) El valor de la variable aleatoria Y depende en cierto grado del valor de la

variable independiente X.
c) La relacin que media entre X e Y se puede describir adecuadamente

mediante una ecuacin lineal cuya representacin geomtrica es una lnea
recta. Los valores paramtricos de la variable Y son funcin de la variable X.

En el estudio de modelos de regresin se presentan dos casos:
1. Recta ascendente (creciente)

En este tipo de modelo de regresin, se observa que ambas variables
tienen una relacin directa, es decir si una variable aumenta la otra
tambin aumenta y si una variable disminuye la otra tambin disminuye.
Como por ejemplo:

X : Horas dedicadas al estudio
Y : Rendimiento acadmico
La grfica tiene la siguiente forma:
Este grfico se puede entender del siguiente modo: Mientras el alumno le

dedique menos horas al estudio, su rendimiento ser deficiente; pero si el
alumno le dedica ms horas al estudio, su rendimiento ser satisfactorio o
mejor.
2. Recta descendente (decreciente)

En este tipo de modelo de regresin, se observa que ambas variables
tienen una relacin inversa, es decir si una variable aumenta la otra
disminuye y si una variable disminuye la otra aumenta.
Como por ejemplo:

X : Horas dedicadas al vicio

Y : Rendimiento acadmico
La grfica tiene la siguiente forma:
Este grfico se puede entender del siguiente modo: Mientras el alumno le

dedique menos horas al vicio, su rendimiento ser satisfactorio; pero si el
alumno le dedica ms horas al vicio, su rendimiento ser deficiente o
peor.
Determinacin de la ecuacin de regresin.

La regresin entre dos variables cuantitativas debe ser definida usando mtodos
que ofrezcan mayor precisin que la ofrecida mediante la utilizacin de los
diagramas de dispersin.
Los estimadores del modelo de regresin son los siguientes:
n n n
n X iYi X i Yi
i 1 i 1 i 1
2
n
n
n X X i
i
2
i 1 i 1
Y X

Ejemplo 01:
Los siguientes datos muestran los gastos invertidos en publicidad
(en miles de soles) (Xi) y las ventas obtenidas (en cientos) de vehculos (Yi) de
7 tiendas sucursales del Per. Hallar el modelo de regresin lineal y Estimar
la venta de vehculos para cuando una Empresa invierta S/.8000 y S/.10000
en gastos de publicidad.
Nro. Gastos.(X) Venta de(Y)

1 4 2,5
2 5 3,2
3 7 7,5
4 9 8,4
5 12 10,2
6 15 14,5
7 18 19,8
a) Estimando el modelo de regresin lineal.

Para encontrar el modelo se realizar los siguientes clculos:
Nro. X Y Xi*Yi Xi Y.est (Yest. - Yprom.) (Yi - Yprom.)
1 4 2,5 10 16 2,51358885 48,01475907 48,20326531
2 5 3,2 16 25 3,668466899 33,34358269 38,97326531
3 7 7,5 52,5 49 5,978222997 12,00368977 3,774693878
4 9 8,4 75,6 81 8,287979094 1,333743308 1,08755102
5 12 10,2 122,4 144 11,75261324 5,33497323 0,573265306
6 15 14,5 217,5 225 15,21724739 33,34358269 25,57469388
7 18 19,8 356,4 324 18,68188153 85,35957168 107,2704082
Tot. 70 66,1 850,4 864 66,1 218,7339024 225,4571429
Prom. 10 9,44285714

Calculando el estimador tenemos:

n n n
n X iYi X i Yi
i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i1
7(850,4) (70)(66,1)
1,15487805
7(864) (70)2
Y X
66,1 70
(1.154778049 ) 2.105923345
7 7
Entonces la ecuacin de regresin lineal es:
i = -2.105923345 + 1,154878049 Xi
Este modelo nos servir para hacer las predicciones de las ventas obtenidas (en
cientos de soles) de vehculos (Y) para los diferentes gastos invertidos (en miles de
soles) (X).
Al interpretar estos resultados es conveniente recordar que la razn esencial que

motiv el clculo de la ecuacin de regresin es poder usar esta para establecer
estimados o proyecciones de los valores de la variable dependiente Y. As por
ejemplo podra interesarnos predecir el valor de Y asociado con un valor particular
de X.

Estimar la venta de vehculos para cuando una Empresa invierta S/.8000 y

S/.10000. en gastos de publicidad..
Para responder a esta pregunta, se requiere la sustitucin del valor de X = 8 y 10

respectivamente en los trminos de la ecuacin de regresin.
i = -2.105923345 + 1,154878049 Xi
8 = -2.105923345 + 1,154878049 (8) = 7,133101045

10 = -2.105923345 + 1,154878049 (10) = 9,442857143
Se estima que la venta de vehculos para cuando una Empresa invierta S/.8000 en
gastos de publicidad, obtendr una venta de 713 vehculos, con un coeficiente de
determinacin de 97,02%
Se estima que la venta de vehculos para cuando una Empresa invierta S/.10000 en
gastos de publicidad, obtendr una venta de 944 vehculos, con un coeficiente de
determinacin de 97,02%
NOTA:
Para realizar la prediccin, es necesario cumplir las siguientes condiciones:
El coeficiente de correlacin(r =(R2)1/2), sea mayor o igual a 0,80.
El error estndar del estimador que sea cercano a cero.
Que se cumplan los supuestos del anlisis de regresin.

Coeficiente de Determinacin (R2).
R2 nos indica la cantidad de mejoramiento en trminos de reduccin del error

total gracias al uso de la recta de regresin y se dice que mide la bondad de
ajuste. R2 Representa la reduccin relativa de la suma de cuadrados total gracias
al uso de la recta de regresin. Por Ejemplo si: R2 = 0,80 significa que hubo con una
reduccin del 80% de la suma de cuadrados total. Si R2 =1 indica que la reduccin
de la suma de cuadrados del error total fue del 100%. Lo que nos dice que el error
Yi - Yi = 0, para todo i y que todos los puntos estn sobre la recta de regresin.
En las siguientes grficas se muestra diferentes valores del coeficiente de

determinacin:
R2 = 1 0,8 R2 < 1
0,5 R2 < 0,8 0,3 R2 < 0,5
0 < R2 < 0,3 R2 = 0

y
n
2
i Y
suma _ de _ cuadrados _ de _ error _ exp licado
R2 i 1

y
n
2 suma _ de _ cuadrados _ de _ error _ total
i Y
i 1
Donde : 0 R2 1
De nuestro ejemplo:
y
n
2
i Y
218,733902 4
R2 i 1
0,970179519 97,02%
y
n
2 225,457142 9
i Y
i 1
Observamos que hay una bondad de ajuste (de la recta de regresin con los datos
originales) del 97,02% lo que implica que el ajuste es muy bueno.
Ejemplo 02.
Los siguientes datos corresponden al tiempo de estudio en hrs. (Xi) empleado
semanalmente por 10 estudiantes y el reflejo de sus respectivas calificaciones (Yi)
obtenidas en una Escuela Profesional de la Universidad. Hallar el modelo lineal y
estimar para cuando se estudie 5 y 15 hrs., Cules seran las calificaciones que
pueden obtener?
Nro. Hrs.(X) Calific.(y)

1 6 10
2 6 10
3 7 10
4 7 10
5 8 12
6 9 12
7 9 13
8 12 14
9 12 16
10 14 18
Tot. 90 125
Prom. 9 12,5

Procediendo con los clculos:

Nro. Hrs.(X) Calific.(y) Xi * Yi Xi Y.est (Yest. - Yprom.) (Yi - Yprom.)
1 6 10 60 36 9,585714286 8,493061224 6,25
2 6 10 60 36 9,585714286 8,493061224 6,25
3 7 10 70 49 10,55714286 3,774693878 6,25
4 7 10 70 49 10,55714286 3,774693878 6,25
5 8 12 96 64 11,52857143 0,943673469 0,25
6 9 12 108 81 12,5 0 0,25
7 9 13 117 81 12,5 0 0,25
8 12 14 168 144 15,41428571 8,493061224 2,25
9 12 16 192 144 15,41428571 8,493061224 12,25
10 14 18 252 196 17,35714286 23,59183673 30,25
Tot. 90 125 1193 880 125 66,05714286 70,5

n n n
n X iYi X i Yi
i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i1
10(1193) (90)(125)
0,971428571
10(880) (90) 2
Y X
12,5 (0,971428571 )(9) 3,75714285 7
Entonces la ecuacin de regresin lineal es:

i = 3,757142857 + 0,971428571 Xi
Este modelo nos servir para hacer las predicciones para las calificaciones que
puedan obtener (Y) segn el tiempo de estudio empleado semanalmente (X).

Y
n 2
Coeficiente de Determinacin: i Y
i 1
R2 0,93698075
Y Y
n
2
i
i 1
Estimar la calificacin de los estudiantes para cuando el estudiante emplee 5 y 15

hrs. De estudio
Para responder a esta pregunta, se requiere la sustitucin del valor de X i = 5 y 15

respectivamente en los trminos de la ecuacin de regresin.
i = 3,757142857 + 0,971428571 Xi
5 = 3,757142857 + 0,971428571 (5) = 8,614285714

15 = 3,757142857 + 0,971428571 (15) = 18,32857143
Se estima que, cuando un estudiante emplea solo 5 horas de estudio

semanalmente obtendra una calificacin aproximada de 8,61, con un coeficiente
de determinacin de 93,70%
Se estima que, cuando un estudiante emplea solo 15 horas de estudio

semanalmente obtendra una calificacin aproximada de 18,33, con un coeficiente
e determinacin de 93,70%.

TABLA ESTADISTICA: Distribucin t-student (dos colas)

Para (nivel de significancia) para un nivel de confianza del (1- )100%.
= nivel de significancia = nivel de significancia

g.l. 0,1 0,05 0,025 0,01 g.l. 0,1 0,05 0,025 0,01
1 6,314 12,706 33,821 63,656 51 1,6753 2,0076 2,3095 2,6757
2 2,92 4,3027 6,2054 9,925 52 1,6747 2,0066 2,3082 2,6737
3 2,3534 3,1824 4,1765 5,8408 53 1,6741 2,0057 2,3069 2,6718
4 2,1318 2,7765 3,4954 4,6041 54 1,6736 2,0049 2,3056 2,67
5 2,015 2,5706 3,1634 4,0321 55 1,673 2,004 2,3044 2,6682
6 1,9432 2,4469 2,9687 3,7074 56 1,6725 2,0032 2,3033 2,6665
7 1,8946 2,3646 2,8412 3,4995 57 1,672 2,0025 2,3022 2,6649
8 1,8595 2,306 2,7515 3,3554 58 1,6716 2,0017 2,3011 2,6633
9 1,8331 2,2622 2,685 3,2498 59 1,6711 2,001 2,3 2,6618
10 1,8125 2,2281 2,6338 3,1693 60 1,6706 2,0003 2,299 2,6603
11 1,7959 2,201 2,5931 3,1058 61 1,6702 1,9996 2,2981 2,6589
12 1,7823 2,1788 2,56 3,0545 62 1,6698 1,999 2,2971 2,6575
13 1,7709 2,1604 2,5326 3,0123 63 1,6694 1,9983 2,2962 2,6561
14 1,7613 2,1448 2,5096 2,9768 64 1,669 1,9977 2,2954 2,6549
15 1,7531 2,1315 2,4899 2,9467 65 1,6686 1,9971 2,2945 2,6536
16 1,7459 2,1199 2,4729 2,9208 66 1,6683 1,9966 2,2937 2,6524
17 1,7396 2,1098 2,4581 2,8982 67 1,6679 1,996 2,2929 2,6512
18 1,7341 2,1009 2,445 2,8784 68 1,6676 1,9955 2,2921 2,6501
19 1,7291 2,093 2,4334 2,8609 69 1,6672 1,9949 2,2914 2,649
20 1,7247 2,086 2,4231 2,8453 70 1,6669 1,9944 2,2906 2,6479
21 1,7207 2,0796 2,4138 2,8314 71 1,6666 1,9939 2,2899 2,6469
22 1,7171 2,0739 2,4055 2,8188 72 1,6663 1,9935 2,2892 2,6458
23 1,7139 2,0687 2,3979 2,8073 73 1,666 1,993 2,2886 2,6449
24 1,7109 2,0639 2,391 2,797 74 1,6657 1,9925 2,2879 2,6439
25 1,7081 2,0595 2,3846 2,7874 75 1,6654 1,9921 2,2873 2,643
26 1,7056 2,0555 2,3788 2,7787 76 1,6652 1,9917 2,2867 2,6421
27 1,7033 2,0518 2,3734 2,7707 77 1,6649 1,9913 2,2861 2,6412
28 1,7011 2,0484 2,3685 2,7633 78 1,6646 1,9908 2,2855 2,6403
29 1,6991 2,0452 2,3638 2,7564 79 1,6644 1,9905 2,2849 2,6395
30 1,6973 2,0423 2,3596 2,75 80 1,6641 1,9901 2,2844 2,6387
31 1,6955 2,0395 2,3556 2,744 81 1,6639 1,9897 2,2838 2,6379
32 1,6939 2,0369 2,3518 2,7385 82 1,6636 1,9893 2,2833 2,6371
33 1,6924 2,0345 2,3483 2,7333 83 1,6634 1,989 2,2828 2,6364
34 1,6909 2,0322 2,3451 2,7284 84 1,6632 1,9886 2,2823 2,6356
35 1,6896 2,0301 2,342 2,7238 85 1,663 1,9883 2,2818 2,6349
36 1,6883 2,0281 2,3391 2,7195 86 1,6628 1,9879 2,2813 2,6342
37 1,6871 2,0262 2,3363 2,7154 87 1,6626 1,9876 2,2809 2,6335
38 1,686 2,0244 2,3337 2,7116 88 1,6624 1,9873 2,2804 2,6329
39 1,6849 2,0227 2,3313 2,7079 89 1,6622 1,987 2,28 2,6322
40 1,6839 2,0211 2,3289 2,7045 90 1,662 1,9867 2,2795 2,6316
41 1,6829 2,0195 2,3267 2,7012 91 1,6618 1,9864 2,2791 2,6309
42 1,682 2,0181 2,3246 2,6981 92 1,6616 1,9861 2,2787 2,6303
43 1,6811 2,0167 2,3226 2,6951 93 1,6614 1,9858 2,2783 2,6297
44 1,6802 2,0154 2,3207 2,6923 94 1,6612 1,9855 2,2779 2,6291
45 1,6794 2,0141 2,3189 2,6896 95 1,6611 1,9852 2,2775 2,6286
46 1,6787 2,0129 2,3172 2,687 96 1,6609 1,985 2,2771 2,628
47 1,6779 2,0117 2,3155 2,6846 97 1,6607 1,9847 2,2767 2,6275
48 1,6772 2,0106 2,3139 2,6822 98 1,6606 1,9845 2,2764 2,6269
49 1,6766 2,0096 2,3124 2,68 99 1,6604 1,9842 2,276 2,6264
50 1,6759 2,0086 2,3109 2,6778 100 1,6602 1,984 2,2757 2,6259

TABLA ESTADSTICA DE LA DISTRIBUCIN CHI CUADRADO
Ejemplo: si tenemos una tabla de contingencia de 2 filas y 5 columnas entonces los grados de libertad
serian (2-1)(5-1)=1*4=4 g.l. Entonces el dato de la Chi Cuadrada Calculada con un =0.05 y 4 g.l. Es = 9,4877
Nivel de significancia Nivel de significancia
gl 0.10 0.05 0.025 0.01 0.005 gl 0.10 0.05 0.025 0.01 0.005
1 2.7055 3.8415 5.0239 6.6349 7.8794 51 64.2954 68.6693 72.616 77.386 80.7465
2 4.6052 5.9915 7.3778 9.2104 10.5965 52 65.4224 69.8322 73.8099 78.6156 82.0006
3 6.2514 7.8147 9.3484 11.3449 12.8381 53 66.5482 70.9934 75.0019 79.8434 83.2525
4 7.7794 9.4877 11.1433 13.2767 14.8602 54 67.6728 72.1532 76.1921 81.0688 84.5018
5 9.2363 11.0705 12.8325 15.0863 16.7496 55 68.7962 73.3115 77.3804 82.292 85.7491
6 10.6446 12.5916 14.4494 16.8119 18.5475 56 69.9185 74.4683 78.5671 83.5136 86.994
7 12.017 14.0671 16.0128 18.4753 20.2777 57 71.0397 75.6237 79.7522 84.7327 88.2366
8 13.3616 15.5073 17.5345 20.0902 21.9549 58 72.1598 76.7778 80.9356 85.9501 89.477
9 14.6837 16.919 19.0228 21.666 23.5893 59 73.2789 77.9305 82.1174 87.1658 90.7153
10 15.9872 18.307 20.4832 23.2093 25.1881 60 74.397 79.082 83.2977 88.3794 91.9518
11 17.275 19.6752 21.92 24.725 26.7569 61 75.5141 80.2321 84.4764 89.5912 93.1862
12 18.5493 21.0261 23.3367 26.217 28.2997 62 76.6302 81.381 85.6537 90.8015 94.4185
13 19.8119 22.362 24.7356 27.6882 29.8193 63 77.7454 82.5287 86.8296 92.0099 95.6492
14 21.0641 23.6848 26.1189 29.1412 31.3194 64 78.8597 83.6752 88.004 93.2167 96.8779
15 22.3071 24.9958 27.4884 30.578 32.8015 65 79.973 84.8206 89.1772 94.422 98.1049
16 23.5418 26.2962 28.8453 31.9999 34.2671 66 81.0855 85.9649 90.3488 95.6256 99.3303
17 24.769 27.5871 30.191 33.4087 35.7184 67 82.1971 87.108 91.5193 96.8277 100.5538
18 25.9894 28.8693 31.5264 34.8052 37.1564 68 83.3079 88.2502 92.6885 98.0283 101.7757
19 27.2036 30.1435 32.8523 36.1908 38.5821 69 84.4179 89.3912 93.8565 99.2274 102.9961
20 28.412 31.4104 34.1696 37.5663 39.9969 70 85.527 90.5313 95.0231 100.4251 104.2148
21 29.6151 32.6706 35.4789 38.9322 41.4009 71 86.6354 91.6703 96.1887 101.6214 105.4323
22 30.8133 33.9245 36.7807 40.2894 42.7957 72 87.7431 92.8083 97.353 102.8163 106.6473
23 32.0069 35.1725 38.0756 41.6383 44.1814 73 88.8499 93.9453 98.5162 104.0098 107.8619
24 33.1962 36.415 39.3641 42.9798 45.5584 74 89.9561 95.0815 99.6784 105.2019 109.0742
25 34.3816 37.6525 40.6465 44.314 46.928 75 91.0615 96.2167 100.8393 106.3929 110.2854
26 35.5632 38.8851 41.9231 45.6416 48.2898 76 92.1662 97.351 101.9992 107.5824 111.4954
27 36.7412 40.1133 43.1945 46.9628 49.645 77 93.2702 98.4844 103.1581 108.7709 112.7037
28 37.9159 41.3372 44.4608 48.2782 50.9936 78 94.3735 99.617 104.3159 109.9582 113.9107
29 39.0875 42.5569 45.7223 49.5878 52.3355 79 95.4762 100.7486 105.4727 111.144 115.1163
30 40.256 43.773 46.9792 50.8922 53.6719 80 96.5782 101.8795 106.6285 112.3288 116.3209
31 41.4217 44.9853 48.2319 52.1914 55.0025 81 97.6796 103.0095 107.7834 113.5123 117.524
32 42.5847 46.1942 49.4804 53.4857 56.328 82 98.7803 104.1387 108.9373 114.6948 118.7261
33 43.7452 47.3999 50.7251 54.7754 57.6483 83 99.8805 105.2672 110.0902 115.8762 119.927
34 44.9032 48.6024 51.966 56.0609 58.9637 84 100.98 106.3949 111.2422 117.0566 121.1262
35 46.0588 49.8018 53.2033 57.342 60.2746 85 102.0789 107.5217 112.3933 118.2356 122.3244
36 47.2122 50.9985 54.4373 58.6192 61.5811 86 103.1773 108.6479 113.5436 119.4137 123.5218
37 48.3634 52.1923 55.668 59.8926 62.8832 87 104.275 109.7733 114.6929 120.5909 124.7176
38 49.5126 53.3835 56.8955 61.162 64.1812 88 105.3723 110.898 115.8415 121.7672 125.9123
39 50.6598 54.5722 58.1201 62.4281 65.4753 89 106.4689 112.022 116.989 122.9422 127.106
40 51.805 55.7585 59.3417 63.6908 66.766 90 107.565 113.1452 118.1359 124.1162 128.2987
41 52.9485 56.9424 60.5606 64.95 68.0526 91 108.6606 114.2679 119.282 125.2893 129.4902
42 54.0902 58.124 61.7767 66.2063 69.336 92 109.7556 115.3898 120.427 126.4616 130.6812
43 55.2302 59.3035 62.9903 67.4593 70.6157 93 110.8501 116.511 121.5714 127.633 131.8705
44 56.3685 60.4809 64.2014 68.7096 71.8923 94 111.9442 117.6317 122.7152 128.8032 133.0589
45 57.5053 61.6562 65.4101 69.9569 73.166 95 113.0377 118.7516 123.858 129.9725 134.2466
46 58.6405 62.8296 66.6165 71.2015 74.4367 96 114.1307 119.8709 125.0001 131.1411 135.4327
47 59.7743 64.0011 67.8206 72.4432 75.7039 97 115.2232 120.9897 126.1414 132.3089 136.6188
48 60.9066 65.1708 69.0226 73.6826 76.9689 98 116.3153 122.1077 127.2821 133.4756 137.803
49 62.0375 66.3387 70.2224 74.9194 78.2306 99 117.4069 123.2252 128.4219 134.6415 138.9869
50 63.1671 67.5048 71.4202 76.1538 79.4898 100 118.498 124.3421 129.5613 135.8069 140.169

Distribucin F de FISHER, Para =0.05(nivel de significancia) para un nivel de confianza del 95%.
= 0,05 grados de libertad del numerador
G.L.denom. 1 2 3 4 5 6 7 8 9 10 20 60 100 10000
1 161,446 199,499 215,707 224,583 230,160 233,988 236,767 238,884 240,543 241,882 248,016 252,196 253,043 254,302
2 18,5128 19,0000 19,1642 19,2467 19,2963 19,3295 19,3531 19,3709 19,3847 19,3959 19,4457 19,4791 19,4857 19,4957
3 10,1280 9,5521 9,2766 9,1172 9,0134 8,9407 8,8867 8,8452 8,8123 8,7855 8,6602 8,5720 8,5539 8,5267
4 7,7086 6,9443 6,5914 6,3882 6,2561 6,1631 6,0942 6,0410 5,9988 5,9644 5,8025 5,6878 5,6640 5,6284
5 6,6079 5,7861 5,4094 5,1922 5,0503 4,9503 4,8759 4,8183 4,7725 4,7351 4,5581 4,4314 4,4051 4,3654
6 5,9874 5,1432 4,7571 4,5337 4,3874 4,2839 4,2067 4,1468 4,0990 4,0600 3,8742 3,7398 3,7117 3,6693
7 5,5915 4,7374 4,3468 4,1203 3,9715 3,8660 3,7871 3,7257 3,6767 3,6365 3,4445 3,3043 3,2749 3,2302
8 5,3176 4,4590 4,0662 3,8379 3,6875 3,5806 3,5005 3,4381 3,3881 3,3472 3,1503 3,0053 2,9747 2,9281
9 5,1174 4,2565 3,8625 3,6331 3,4817 3,3738 3,2927 3,2296 3,1789 3,1373 2,9365 2,7872 2,7556 2,7072
10 4,9646 4,1028 3,7083 3,4780 3,3258 3,2172 3,1355 3,0717 3,0204 2,9782 2,7740 2,6211 2,5884 2,5384
11 4,8443 3,9823 3,5874 3,3567 3,2039 3,0946 3,0123 2,9480 2,8962 2,8536 2,6464 2,4901 2,4566 2,4050
12 4,7472 3,8853 3,4903 3,2592 3,1059 2,9961 2,9134 2,8486 2,7964 2,7534 2,5436 2,3842 2,3498 2,2967
13 4,6672 3,8056 3,4105 3,1791 3,0254 2,9153 2,8321 2,7669 2,7144 2,6710 2,4589 2,2966 2,2614 2,2070
14 4,6001 3,7389 3,3439 3,1122 2,9582 2,8477 2,7642 2,6987 2,6458 2,6022 2,3879 2,2229 2,1870 2,1313
15 4,5431 3,6823 3,2874 3,0556 2,9013 2,7905 2,7066 2,6408 2,5876 2,5437 2,3275 2,1601 2,1234 2,0664
16 4,4940 3,6337 3,2389 3,0069 2,8524 2,7413 2,6572 2,5911 2,5377 2,4935 2,2756 2,1058 2,0685 2,0102
17 4,4513 3,5915 3,1968 2,9647 2,8100 2,6987 2,6143 2,5480 2,4943 2,4499 2,2304 2,0584 2,0204 1,9610
18 4,4139 3,5546 3,1599 2,9277 2,7729 2,6613 2,5767 2,5102 2,4563 2,4117 2,1906 2,0166 1,9780 1,9175
19 4,3808 3,5219 3,1274 2,8951 2,7401 2,6283 2,5435 2,4768 2,4227 2,3779 2,1555 1,9795 1,9403 1,8787
20 4,3513 3,4928 3,0984 2,8661 2,7109 2,5990 2,5140 2,4471 2,3928 2,3479 2,1242 1,9464 1,9066 1,8438
21 4,3248 3,4668 3,0725 2,8401 2,6848 2,5727 2,4876 2,4205 2,3661 2,3210 2,0960 1,9165 1,8761 1,8124
22 4,3009 3,4434 3,0491 2,8167 2,6613 2,5491 2,4638 2,3965 2,3419 2,2967 2,0707 1,8894 1,8486 1,7838
23 4,2793 3,4221 3,0280 2,7955 2,6400 2,5277 2,4422 2,3748 2,3201 2,2747 2,0476 1,8648 1,8234 1,7577
24 4,2597 3,4028 3,0088 2,7763 2,6207 2,5082 2,4226 2,3551 2,3002 2,2547 2,0267 1,8424 1,8005 1,7338
25 4,2417 3,3852 2,9912 2,7587 2,6030 2,4904 2,4047 2,3371 2,2821 2,2365 2,0075 1,8217 1,7794 1,7117
26 4,2252 3,3690 2,9752 2,7426 2,5868 2,4741 2,3883 2,3205 2,2655 2,2197 1,9898 1,8027 1,7599 1,6913
27 4,2100 3,3541 2,9603 2,7278 2,5719 2,4591 2,3732 2,3053 2,2501 2,2043 1,9736 1,7851 1,7419 1,6724
28 4,1960 3,3404 2,9467 2,7141 2,5581 2,4453 2,3593 2,2913 2,2360 2,1900 1,9586 1,7689 1,7251 1,6548
29 4,1830 3,3277 2,9340 2,7014 2,5454 2,4324 2,3463 2,2782 2,2229 2,1768 1,9446 1,7537 1,7096 1,6384
30 4,1709 3,3158 2,9223 2,6896 2,5336 2,4205 2,3343 2,2662 2,2107 2,1646 1,9317 1,7396 1,6950 1,6230
40 4,0847 3,2317 2,8387 2,6060 2,4495 2,3359 2,2490 2,1802 2,1240 2,0773 1,8389 1,6373 1,5892 1,5098
50 4,0343 3,1826 2,7900 2,5572 2,4004 2,2864 2,1992 2,1299 2,0733 2,0261 1,7841 1,5757 1,5249 1,4392
60 4,0012 3,1504 2,7581 2,5252 2,3683 2,2541 2,1665 2,0970 2,0401 1,9926 1,7480 1,5343 1,4814 1,3903
70 3,9778 3,1277 2,7355 2,5027 2,3456 2,2312 2,1435 2,0737 2,0166 1,9689 1,7223 1,5046 1,4498 1,3540
80 3,9604 3,1108 2,7188 2,4859 2,3287 2,2142 2,1263 2,0564 1,9991 1,9512 1,7032 1,4821 1,4259 1,3259
90 3,9469 3,0977 2,7058 2,4729 2,3157 2,2011 2,1131 2,0430 1,9856 1,9376 1,6883 1,4645 1,4070 1,3032
100 3,9362 3,0873 2,6955 2,4626 2,3053 2,1906 2,1025 2,0323 1,9748 1,9267 1,6764 1,4504 1,3917 1,2845
200 3,8884 3,0411 2,6498 2,4168 2,2592 2,1441 2,0556 1,9849 1,9269 1,8783 1,6233 1,3856 1,3206 1,1903
300 3,8726 3,0258 2,6347 2,4017 2,2441 2,1288 2,0402 1,9693 1,9112 1,8623 1,6057 1,3634 1,2958 1,1521
400 3,8648 3,0183 2,6272 2,3943 2,2366 2,1212 2,0325 1,9616 1,9033 1,8544 1,5969 1,3522 1,2831 1,1303
500 3,8601 3,0138 2,6227 2,3898 2,2320 2,1167 2,0279 1,9569 1,8986 1,8496 1,5916 1,3455 1,2753 1,1159
600 3,8570 3,0107 2,6198 2,3868 2,2290 2,1137 2,0248 1,9538 1,8955 1,8465 1,5881 1,3410 1,2701 1,1055
700 3,8548 3,0086 2,6176 2,3847 2,2269 2,1115 2,0226 1,9516 1,8932 1,8442 1,5856 1,3377 1,2664 1,0976
800 3,8531 3,0070 2,6160 2,3831 2,2253 2,1099 2,0210 1,9500 1,8916 1,8425 1,5837 1,3353 1,2635 1,0912
900 3,8518 3,0057 2,6148 2,3818 2,2240 2,1086 2,0197 1,9487 1,8903 1,8412 1,5822 1,3334 1,2613 1,0861
1000 3,8508 3,0047 2,6138 2,3808 2,2231 2,1076 2,0187 1,9476 1,8892 1,8402 1,5811 1,3318 1,2596 1,0818
1500 3,8477 3,0017 2,6108 2,3779 2,2201 2,1046 2,0157 1,9446 1,8861 1,8370 1,5775 1,3273 1,2542 1,0675
2000 3,8461 3,0002 2,6094 2,3764 2,2186 2,1031 2,0142 1,9430 1,8846 1,8354 1,5758 1,3250 1,2516 1,0593
10000 3,8424 2,9966 2,6058 2,3728 2,2150 2,0995 2,0105 1,9393 1,8808 1,8316 1,5716 1,3194 1,2451 1,0334

Distribucin F de FISHER, Para =0.01(nivel de significancia) = nivel de confianza del 99%.
= 0,01 grados de libertad del numerador
G.L.denom. 1 2 3 4 5 6 7 8 9 10 20 60 100 10000
1 4052,18 4999,34 5403,53 5624,26 5763,96 5858,95 5928,33 5980,95 6022,40 6055,93 6208,66 6312,97 6333,92 6365,59
2 98,5019 99,0003 99,1640 99,2513 99,3023 99,3314 99,3568 99,3750 99,3896 99,3969 99,4478 99,4842 99,4914 99,4987
3 34,1161 30,8164 29,4567 28,7100 28,2371 27,9106 27,6714 27,4895 27,3449 27,2285 26,6900 26,3162 26,2407 26,1261
4 21,1976 17,9998 16,6942 15,9771 15,5219 15,2068 14,9757 14,7988 14,6592 14,5460 14,0194 13,6522 13,5769 13,4642
5 16,2581 13,2741 12,0599 11,3919 10,9671 10,6722 10,4556 10,2893 10,1577 10,0511 9,5527 9,2020 9,1300 9,0215
6 13,7452 10,9249 9,7796 9,1484 8,7459 8,4660 8,2600 8,1017 7,9760 7,8742 7,3958 7,0568 6,9867 6,8811
7 12,2463 9,5465 8,4513 7,8467 7,4604 7,1914 6,9929 6,8401 6,7188 6,6201 6,1555 5,8236 5,7546 5,6506
8 11,2586 8,6491 7,5910 7,0061 6,6318 6,3707 6,1776 6,0288 5,9106 5,8143 5,3591 5,0316 4,9633 4,8599
9 10,5615 8,0215 6,9920 6,4221 6,0569 5,8018 5,6128 5,4671 5,3511 5,2565 4,8080 4,4831 4,4150 4,3116
10 10,0442 7,5595 6,5523 5,9944 5,6364 5,3858 5,2001 5,0567 4,9424 4,8491 4,4054 4,0819 4,0137 3,9100
11 9,6461 7,2057 6,2167 5,6683 5,3160 5,0692 4,8860 4,7445 4,6315 4,5393 4,0990 3,7761 3,7077 3,6035
12 9,3303 6,9266 5,9525 5,4119 5,0644 4,8205 4,6395 4,4994 4,3875 4,2961 3,8584 3,5355 3,4668 3,3619
13 9,0738 6,7009 5,7394 5,2053 4,8616 4,6203 4,4410 4,3021 4,1911 4,1003 3,6646 3,3413 3,2723 3,1665
14 8,8617 6,5149 5,5639 5,0354 4,6950 4,4558 4,2779 4,1400 4,0297 3,9394 3,5052 3,1813 3,1118 3,0051
15 8,6832 6,3588 5,4170 4,8932 4,5556 4,3183 4,1416 4,0044 3,8948 3,8049 3,3719 3,0471 2,9772 2,8695
16 8,5309 6,2263 5,2922 4,7726 4,4374 4,2016 4,0259 3,8896 3,7804 3,6909 3,2587 2,9330 2,8627 2,7539
17 8,3998 6,1121 5,1850 4,6689 4,3360 4,1015 3,9267 3,7909 3,6823 3,5931 3,1615 2,8348 2,7639 2,6542
18 8,2855 6,0129 5,0919 4,5790 4,2479 4,0146 3,8406 3,7054 3,5971 3,5081 3,0771 2,7493 2,6779 2,5671
19 8,1850 5,9259 5,0103 4,5002 4,1708 3,9386 3,7653 3,6305 3,5225 3,4338 3,0031 2,6742 2,6023 2,4905
20 8,0960 5,8490 4,9382 4,4307 4,1027 3,8714 3,6987 3,5644 3,4567 3,3682 2,9377 2,6077 2,5353 2,4224
21 8,0166 5,7804 4,8740 4,3688 4,0421 3,8117 3,6396 3,5056 3,3982 3,3098 2,8795 2,5484 2,4755 2,3615
22 7,9453 5,7190 4,8166 4,3134 3,9880 3,7583 3,5866 3,4530 3,3458 3,2576 2,8274 2,4951 2,4218 2,3067
23 7,8811 5,6637 4,7648 4,2635 3,9392 3,7102 3,5390 3,4057 3,2986 3,2106 2,7805 2,4471 2,3732 2,2571
24 7,8229 5,6136 4,7181 4,2185 3,8951 3,6667 3,4959 3,3629 3,2560 3,1681 2,7380 2,4035 2,3291 2,2119
25 7,7698 5,5680 4,6755 4,1774 3,8550 3,6272 3,4568 3,3239 3,2172 3,1294 2,6993 2,3637 2,2888 2,1706
26 7,7213 5,5263 4,6365 4,1400 3,8183 3,5911 3,4210 3,2884 3,1818 3,0941 2,6640 2,3273 2,2519 2,1327
27 7,6767 5,4881 4,6009 4,1056 3,7847 3,5580 3,3882 3,2558 3,1494 3,0618 2,6316 2,2938 2,2180 2,0978
28 7,6357 5,4529 4,5681 4,0740 3,7539 3,5276 3,3581 3,2259 3,1195 3,0320 2,6018 2,2629 2,1867 2,0655
29 7,5977 5,4205 4,5378 4,0449 3,7254 3,4995 3,3303 3,1982 3,0920 3,0045 2,5742 2,2344 2,1577 2,0355
30 7,5624 5,3903 4,5097 4,0179 3,6990 3,4735 3,3045 3,1726 3,0665 2,9791 2,5487 2,2079 2,1307 2,0075
40 7,3142 5,1785 4,3126 3,8283 3,5138 3,2910 3,1238 2,9930 2,8876 2,8005 2,3689 2,0194 1,9383 1,8061
50 7,1706 5,0566 4,1994 3,7195 3,4077 3,1864 3,0202 2,8900 2,7850 2,6981 2,2652 1,9090 1,8248 1,6847
60 7,0771 4,9774 4,1259 3,6491 3,3389 3,1187 2,9530 2,8233 2,7185 2,6318 2,1978 1,8363 1,7493 1,6023
70 7,0114 4,9218 4,0744 3,5997 3,2907 3,0712 2,9060 2,7765 2,6719 2,5852 2,1504 1,7846 1,6954 1,5422
80 6,9626 4,8807 4,0363 3,5631 3,2551 3,0361 2,8713 2,7420 2,6374 2,5508 2,1153 1,7459 1,6548 1,4960
90 6,9251 4,8491 4,0069 3,5350 3,2276 3,0091 2,8445 2,7154 2,6109 2,5243 2,0882 1,7158 1,6231 1,4593
100 6,8953 4,8239 3,9837 3,5127 3,2059 2,9877 2,8233 2,6943 2,5898 2,5033 2,0666 1,6918 1,5977 1,4292
200 6,7633 4,7128 3,8810 3,4143 3,1100 2,8933 2,7298 2,6012 2,4971 2,4106 1,9713 1,5833 1,4811 1,2812
300 6,7201 4,6766 3,8475 3,3822 3,0787 2,8625 2,6993 2,5709 2,4668 2,3804 1,9401 1,5468 1,4410 1,2228
400 6,6987 4,6586 3,8309 3,3664 3,0632 2,8472 2,6842 2,5559 2,4518 2,3654 1,9245 1,5285 1,4207 1,1900
500 6,6858 4,6479 3,8210 3,3569 3,0540 2,8381 2,6751 2,5469 2,4429 2,3565 1,9152 1,5174 1,4084 1,1684
600 6,6773 4,6407 3,8144 3,3506 3,0478 2,8321 2,6691 2,5409 2,4369 2,3505 1,9091 1,5101 1,4001 1,1529
700 6,6713 4,6356 3,8097 3,3460 3,0434 2,8278 2,6648 2,5367 2,4327 2,3463 1,9047 1,5048 1,3942 1,1411
800 6,6667 4,6318 3,8062 3,3427 3,0402 2,8245 2,6617 2,5335 2,4295 2,3431 1,9013 1,5008 1,3897 1,1318
900 6,6631 4,6288 3,8034 3,3401 3,0376 2,8220 2,6592 2,5310 2,4270 2,3406 1,8988 1,4978 1,3863 1,1242
1000 6,6603 4,6264 3,8012 3,3380 3,0356 2,8200 2,6572 2,5290 2,4250 2,3386 1,8967 1,4953 1,3835 1,1178
1500 6,6518 4,6193 3,7947 3,3317 3,0294 2,8140 2,6512 2,5231 2,4191 2,3327 1,8906 1,4879 1,3751 1,0969
2000 6,6476 4,6158 3,7914 3,3286 3,0264 2,8110 2,6482 2,5201 2,4162 2,3298 1,8875 1,4842 1,3708 1,0850
10000 6,6374 4,6073 3,7836 3,3210 3,0191 2,8038 2,6411 2,5130 2,4091 2,3227 1,8802 1,4752 1,3606 1,0476

DISTRIBUCION NORMAL
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-4 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.0001 0.0001 0.0001 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.0002 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.0003 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.0004 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.0006 0.00058 0.00056 0.00054 0.00052 0.0005
-3.1 0.00097 0.00094 0.0009 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.001
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.0024 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.0028 0.00272 0.00264
-2.6 0.00466 0.00453 0.0044 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.0057 0.00554 0.00539 0.00523 0.00508 0.00494 0.0048
-2.4 0.0082 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.0099 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.0139 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.0116 0.0113 0.01101
-2.1 0.01786 0.01743 0.017 0.01659 0.01618 0.01578 0.01539 0.015 0.01463 0.01426
-2 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.0197 0.01923 0.01876 0.01831
-1.9 0.02872 0.02807 0.02743 0.0268 0.02619 0.02559 0.025 0.02442 0.02385 0.0233
-1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
-1.7 0.04457 0.04363 0.04272 0.04182 0.04093 0.04006 0.0392 0.03836 0.03754 0.03673
-1.6 0.0548 0.0537 0.05262 0.05155 0.0505 0.04947 0.04846 0.04746 0.04648 0.04551
-1.5 0.06681 0.06552 0.06426 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.4 0.08076 0.07927 0.0778 0.07636 0.07493 0.07353 0.07215 0.07078 0.06944 0.06811
-1.3 0.0968 0.0951 0.09342 0.09176 0.09012 0.08851 0.08692 0.08534 0.08379 0.08226
-1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09853
-1.1 0.13567 0.1335 0.13136 0.12924 0.12714 0.12507 0.12302 0.121 0.119 0.11702
-1 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.9 0.18406 0.18141 0.17879 0.17619 0.17361 0.17106 0.16853 0.16602 0.16354 0.16109
-0.8 0.21186 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.7 0.24196 0.23885 0.23576 0.2327 0.22965 0.22663 0.22363 0.22065 0.2177 0.21476
-0.6 0.27425 0.27093 0.26763 0.26435 0.26109 0.25785 0.25463 0.25143 0.24825 0.2451
-0.5 0.30854 0.30503 0.30153 0.29806 0.2946 0.29116 0.28774 0.28434 0.28096 0.2776
-0.4 0.34458 0.3409 0.33724 0.3336 0.32997 0.32636 0.32276 0.31918 0.31561 0.31207
-0.3 0.38209 0.37828 0.37448 0.3707 0.36693 0.36317 0.35942 0.35569 0.35197 0.34827
-0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129 0.39743 0.39358 0.38974 0.38591
-0.1 0.46017 0.4562 0.45224 0.44828 0.44433 0.44038 0.43644 0.43251 0.42858 0.42465
0 0.5 0.49601 0.49202 0.48803 0.48405 0.48006 0.47608 0.4721 0.46812 0.46414

DISTRIBUCION NORMAL
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.5 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.5279 0.53188 0.53586
0.1 0.53983 0.5438 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.6293 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.6591 0.66276 0.6664 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.7054 0.70884 0.71226 0.71566 0.71904 0.7224
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.7549
0.7 0.75804 0.76115 0.76424 0.7673 0.77035 0.77337 0.77637 0.77935 0.7823 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.8665 0.86864 0.87076 0.87286 0.87493 0.87698 0.879 0.881 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.9032 0.9049 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.9222 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.9452 0.9463 0.94738 0.94845 0.9495 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.9608 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.9732 0.97381 0.97441 0.975 0.97558 0.97615 0.9767
2 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.9803 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.983 0.98341 0.98382 0.98422 0.98461 0.985 0.98537 0.98574
2.2 0.9861 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.9884 0.9887 0.98899
2.3 0.98928 0.98956 0.98983 0.9901 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.9918 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.9943 0.99446 0.99461 0.99477 0.99492 0.99506 0.9952
2.6 0.99534 0.99547 0.9956 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.9972 0.99728 0.99736
2.8 0.99744 0.99752 0.9976 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.999
3.1 0.99903 0.99906 0.9991 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.9994 0.99942 0.99944 0.99946 0.99948 0.9995
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.9996 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.9997 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.9998 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.9999 0.9999 0.9999 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4 0.99997 0.99997 0.99997 0.99997 0.99997 0.99997 0.99998 0.99998 0.99998 0.99998

Estadistica,, PDF

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estadistica,, PDF

Transféré par

Droits d'auteur :

Formats disponibles

Estadstica Aplicada a la Investigacin Pg.

UNIVERSIDAD NACIONAL DEL ALTIPLANO-PUNO

ESCUELA DE POST GRADO

D.Sc. Percy Huata Panca

C.U. septiembre de 2015 .

D.Sc. Percy Huata Panca

Segunda Edicin: Setiembre del 2015.

Estadstica aplicada a la investigacin, son exclusivamente derechos de los autores,

PERCY HUATA PANCA

D.Sc. Percy Huata Panca

CONCEPTOS BSICOS DE LA ESTADSTICA

1.1. DEFINICIONES DE ESTADISTICA

La estadstica se puede dividir en dos partes principales: la estadstica descriptiva y

La estadstica descriptiva, tiene como objetivo representar y resumir los

La estadstica analtica, tambin denominada inferencial, estudia los elementos de

Ruiz (2004) La Estadstica es la ciencia cuyo objetivo es reunir una informacin

La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin,

D.Sc. Percy Huata Panca

Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para

La ms aceptada, sin embargo, es la de Mnguez, que define la Estadstica como

1.2. HISTORIA DE LA ESTADISTICA

Alvarez (2007) La estadstica moderna surge de la confluencia de dos disciplinas

La mayora de civilizaciones antiguas recogan datos sobre los impuestos

El clculo de probabilidades se desarroll debido a los juegos de azar. En los siglos

En el siglo XVIII De Moivre comprob que la distribucin binomial poda

D.Sc. Percy Huata Panca

demogrficos, contribuyendo a unificar la estadstica y el clculo de probabilidades

En el siglo XIX una de las figuras ms relevantes en el campo de fsica y de la

Las modernas teoras fsicas como la mecnica estadstica y la mecnica cuntica

Dentro del campo de la bioestadstica uno de los primeros en aplicarla a

Ruiz (2004) Los comienzos de la estadstica pueden ser hallados en el antiguo

D.Sc. Percy Huata Panca

antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra,

Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al

Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno

D.Sc. Percy Huata Panca

el nmero de personas que moriran de varias enfermedades y sobre las

Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de

Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la

D.Sc. Percy Huata Panca

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos

Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior

1.3. CLASIFICACIN DE LA ESTADSTICA.

La estadstica se clasifica de acuerdo a las dos funciones que realiza:

Estadstica Descriptiva. Es aquella parte de la Estadstica que describe y analiza

Estadstica Inferencial. Es aquella parte de la Estadstica, cuyo propsito es inferir

1.4. POBLACIN Y MUESTRA.

Un conjunto de personas, tales como: Los estudiantes matriculados en una

Un conjunto de trabajadores de una organizacin gubernamental: tales como:

D.Sc. Percy Huata Panca

Existen dos mtodos muestrales: no probabilstico y probabilstico, el no

Estadsticamente son los datos que se recolectan para un estudio.

Ejemplo: Si se toma datos acerca del rendimiento acadmico de los estudiantes

D.Sc. Percy Huata Panca

ms objetivos posible. Al leer o escribir un trabajo cientfico lo primero que

Se definen las variables, como magnitudes o valores que tienden a sufrir

Es decir, las caractersticas que varan de individuo a individuo o de objeto

Generalmente, las variables se designan con las ultimas letras del

Ejemplo: En una Universidad del Per, se lleva a cabo un estudio para

En relacin a este estudio, identifique las propiedades siguientes como

a) Sexo VARIABLE Todos los egresados(as) son de