Vous êtes sur la page 1sur 205

1.1.

LA ESTADISTICA

La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas.

Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de
todas las dems ciencias.

La ausencia de sta conllevara a un caos generalizado, dejando a los


administradores y ejecutivos sin informacin vital a la hora de tomar decisiones en
tiempos de incertidumbre.

La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los


trabajos matemticos de aquellos hombres que desarrollaron la teora de las
probabilidades, con la cual se adhiri a la Estadstica a las ciencias formales.

1.2. DEFINICIN DE ESTADSTICA


La estadstica, es la
ciencia que trata de la
recopilacin, organizacin
presentacin, anlisis e
interpretacin de datos
numricos con el fin de
realizar una toma de
decisin ms efectiva.

Porque la estadstica va tomando ms importancia en la investigacin cientfica, en el


aspecto acadmico y en el desarrollo profesional.
-

Porque sirve como herramienta de investigacin objetiva y veraz,

Porque a travs de un conjunto de datos obtenidos adecuadamente, permite tomar


decisiones adecuadas y oportunas;

Porque permite apreciar objetivamente las diferencias de algn fenmeno de


incertidumbre en el tiempo y en el espacio

1.3. UTILIDAD E IMPORTANCIA


-

Las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad,


control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados
en deportes; administradores de instituciones; en la educacin; organismos polticos;
mdicos; y por otras personas que intervienen en la toma de decisiones.

Diagnostico de un problema cualquiera, ejemplos: Diagnostico de las enfermedades,


diagnostico del nivel de vida, del nivel socioeconmico, el nivel educativo, etc.

Determinar prioridades en los programas de salud, educacin, de las empresas privadas,


o de otros problemas de las comunidades o personales

Establecer y analizar las relaciones entre las variables (causa efecto)

Realizar pronsticos a travs del tiempo

Estimar valores poblacionales, tomando solo una muestra

NOTA: Sin embargo para que el uso de la estadstica sea adecuado, es necesario trabajar
con muchos datos, porque el uso de pocos datos puede dar lugar a interpretaciones no
consistentes.

1.4. DIVISION DE LA ESTADISTICA


La Estadstica se ha dividido en dos grandes ramas: la Estadstica Descriptiva y la
Inferencial:

La estadstica Descriptiva: consiste sobre todo en la presentacin de datos en


forma de tablas y grficas. Esta comprende cualquier actividad relacionada con los
datos y est diseada para resumir o describir un conjunto de datos, sin intentar
inferir nada que vaya ms all de los datos, como tales.

La estadstica Inferencial: Se deriva de muestras, de observaciones hechas slo


acerca de una parte de un conjunto numeroso de elementos y esto implica que su

anlisis requiere de generalizaciones que van ms all de los datos. Como


consecuencia, la caracterstica ms importante del reciente crecimiento de la
estadstica ha sido un cambio en el nfasis de los mtodos que describen a mtodos
que sirven para hacer generalizaciones. La Estadstica Inferencial investiga o analiza
una poblacin partiendo de una muestra tomada. Los problemas de la inferencia
estadstica son: la estimacin de parmetros y las pruebas de hiptesis

1.5. HISTORIA DE LA ESTADSTICA


Los comienzos de la estadstica pueden ser hallados en el antiguo
Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 AC, recogi
datos relativos a la poblacin y la riqueza del pas con el objetivo de
preparar la construccin de las pirmides. En el mismo Egipto, Ramss
II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.

En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros,


de los datos estadsticos obtenidos en dos recuentos de la poblacin
hebrea. El rey David por otra parte, orden a Joab, general del ejrcito
hacer un censo de Israel con la finalidad de conocer el nmero de la
poblacin.

Los griegos y los Chinos efectuaron censos peridicamente con


fines tributarios, sociales (divisin de tierras) y militares (clculo de
recursos y hombres disponibles). La investigacin histrica revela
que se realizaron 69 censos para calcular los impuestos, determinar
los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organizacin poltica,


quienes mejor supieron emplear los recursos de la estadstica.
Cada cinco aos realizaban un censo de la poblacin y sus
funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del
ganado y de las riquezas contenidas en las tierras conquistadas.
Para

el

nacimiento

de

Cristo

suceda

uno

de

estos

empadronamientos de la poblacin bajo la autoridad del imperio.

Durante los mil aos siguientes a la cada del imperio


Romano se realizaron muy pocas operaciones Estadsticas,
con la notable excepcin de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en
el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se
realizaron en Francia algunos censos parciales de siervos.
En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del Gran
Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de
Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico,
Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes
operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales
y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los
datos econmicos.

Para el ao 1532 empezaron a registrarse en Inglaterra las


defunciones debido al temor que Enrique VII tena por la
peste. Ms o menos por la misma poca, en Francia la ley
exigi a los clrigos registrar los bautismos, fallecimientos y
matrimonios. Durante un brote de peste que apareci a fines
de la dcada de 1500, el gobierno ingls comenz a publicar
estadsticas semanales de los decesos. Esa costumbre
continu muchos aos, y en 1632 estos Bills of Mortality
(Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. En 1662, el
capitn John Graunt us documentos que abarcaban treinta aos y efectu predicciones
sobre el nmero de personas que moriran de varias enfermedades y sobre las proporciones
de nacimientos de varones y mujeres que cabra esperar. El trabajo de Graunt, condensado
en su obra Natural and Political Observations Made upon the Bills of Mortality
(Observaciones Polticas y Naturales Hechas a partir de las Cuentas de Mortalidad), fue un
esfuerzo innovador en el anlisis estadstico.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los
recursos nacionales, comprensiva de datos sobre organizacin poltica, instrucciones
sociales, comercio y podero militar. Durante el siglo XVII aport indicaciones ms concretas
de mtodos de observacin y anlisis cuantitativo y ampli los campos de la inferencia y la
teora Estadstica.

Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca
esttica.

En los tiempos modernos tales mtodos fueron resucitados por


algunos

reyes

que

necesitaban

conocer

las

riquezas

monetarias y el potencial humano de sus respectivos pases. El


primer empleo de los datos estadsticos para fines ajenos a la
poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar
Neumann, un profesor alemn que viva en Breslau. Este
investigador se propuso destruir la antigua creencia popular de
que en los aos terminados en siete mora ms gente que en
los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad.
Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no
fallecan ms personas que en los dems. Los procedimientos de Neumann fueron
conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su nombre,
quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas
de mortalidad que hoy utilizan todas las compaas de seguros.

Durante el siglo XVII y principios del XVIII, matemticos


como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teora de probabilidades. No obstante
durante cierto tiempo, la teora de las probabilidades limit
su aplicacin a los juegos de azar y hasta el siglo XVIII no
comenz a aplicarse a los grandes problemas cientficos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en


1760 la palabra estadstica, que extrajo del trmino italiano statista
(estadista). Crea, y con sobrada razn, que los datos de la nueva ciencia
seran el aliado ms eficaz del gobernante consciente. La raz remota de
la palabra se halla, por otra parte, en el trmino latino status, que significa
estado o situacin; Esta etimologa aumenta el valor intrnseco de la
palabra, por cuanto la estadstica revela el sentido cuantitativo de las ms
variadas situaciones.

Jacques Qutelect es quien aplica las Estadsticas a las ciencias


sociales. Este interpret la teora de la probabilidad para su uso en
las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect
fue el primero en realizar la aplicacin prctica de todo el mtodo
Estadstico, entonces conocido, a las diversas ramas de la ciencia.

Entre 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales


para la teora Estadstica; la teora de los errores de observacin, aportada por
Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por
Laplace, Gauss y Legendre.

A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por
Correlacin, que tena por objeto medir la influencia relativa de los factores
sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin
creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J.
Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios
estudios sobre la medida de las relaciones.

Los progresos ms recientes en el campo de la Estadstica se


refieren

al

desarrollo

del

clculo

de

probabilidades,

particularmente en la rama denominada indeterminismo o


relatividad, se ha demostrado que el determinismo fue
reconocido en la Fsica como resultado de las investigaciones
atmicas y que este principio se juzga aplicable tanto a las
ciencias sociales como a las fsicas.

ETAPAS DE DESARROLLO DE LA ESTADSTICA


La historia de la estadstica est resumida en tres grandes etapas o fases.
1.- Primera Fase: Los Censos:
Desde el momento en que se constituye una autoridad poltica, la idea de
inventariar de una forma ms o menos regular la poblacin y las riquezas
existentes en el territorio est ligada a la conciencia de soberana y a los primeros
esfuerzos administrativos.
2.- Segunda Fase: De la Descripcin de los Conjuntos a la Aritmtica Poltica:
Las ideas mercantilistas extraan una intensificacin de este tipo de
investigacin.

Colbert

multiplica las encuestas sobre artculos

manufacturados, el comercio y la poblacin: los intendentes del Reino


envan a Pars sus memorias. Vauban, ms conocido por sus
fortificaciones o su Dime Royale, que es la primera propuesta de un
impuesto sobre los ingresos, se seala como el verdadero precursor
de los sondeos.

La escuela inglesa proporciona un nuevo progreso al superar la fase

puramente descriptiva. Sus tres principales representantes son Graunt, Petty (autor de la
famosa Aritmtica Poltica) y Halley.
Chaptal, ministro del interior francs, publica en 1801 el primer censo general de poblacin,
desarrolla los estudios industriales, de las producciones y los cambios, hacindose
sistemticos durante las dos terceras partes del siglo XIX.
3.- Tercera Fase: Estadstica y Clculo de Probabilidades:
El clculo de probabilidades se incorpora rpidamente como un
instrumento de anlisis extremadamente poderoso para el estudio de
los fenmenos econmicos y sociales y en general para el estudio de
fenmenos cuyas causas son demasiados complejas para
conocerlos totalmente y hacer posible su anlisis.

CRONOLOGIA DE LA ESTADISTICA

poca
Grecia
antigua
Siglo XVII
Siglo XVII

Siglo XIX

Siglo XX

Contribuidor
Filsofos

Ideas sobre el anlisis no cualitativo

Graunt, Petty

Estudio de la estadstica vital

Pascal, Berno

Estudio probabilstico acerca del cambio del juego

DMoire,
Curva normal, regresin aplicada sobre estudios de astronoma
Laplace, Gauss
Quetelet

Astrnomo que primero aplic el anlisis estadstico a biologa


humana.

Galton

Estudia la variacin gentica en humanos (usando regresin y


correlacin lineal)

Pearsons

Estudio de la seleccin natural usando correlacin, formando


primero departamentos acadmicos de estadstica, Journal de
Biomtrica, ayudados de el anlisis de Chi Cuadrada

Gossett
(Student)
Fisher
Wilcoxon

Siglo XX

Estudio de procesos, alerta la comunidad estadstica acerca de


problemas con pequeas muestras, presentando la prueba
tstudent
Evolucin biolgica presentada- presentacin de ANOVA , resalta
la importancia del diseo experimental.
Bioqumico estudi pesticidas, equivalente no parmetrico de
dos pruebas.

Kruskal Wallis

Economista que present el equivalente no parmetrico de


ANOVA

Spearman

Psiclogo que presenta el equivalente no parmetrico del


coeficiente de correlacin

Kendall

Estadista que presenta otro equivalente no parmetrico del


coeficiente de correlacin.

Tukey
Dunnett

Keuls

Contribucin

Estadista que presenta el procedimiento de la comparacin


mltiple.
Bioqumico que estudia los pesticidas, presenta un procedimiento
de comparacin mltiple para grupos control.
Agrnomo que presenta una procedimiento de comparacin
mltiple. Prueba muchas ventajas sobre clculos a mano y en
calculadora, estimula el fondo de la investigacin mediante
nuevas tcnicas

ETAPAS DEL TRABAJO ESTADISTICO


EN LA INVESTIGACION CIENTIFICA
La estadstica se incluye en todas las etapas de investigacin, desde el diseo hasta el
anlisis final de la informacin. Podemos distinguir tres grandes etapas:
a) Diseo: Define de cmo se realizara la investigacin, esta etapa es crucial, porque
un estudio bien diseado o con datos incorrectamente recolectados puede no
responder a las preguntas de la investigacin. Esta etapa incluye la poblacin
objetivo, el tamao de muestra, los mecanismos de seleccin de la muestra, los
tratamientos de los datos.
b) Descripcin: Esta etapa ayuda a comprender la estructura de los datos para detectar
patrones de comportamientos. Una forma de resumir la informacin es mediante los
grficos y las tablas, otra forma es mediante algunas medidas descriptivas.
c) Inferencia: Predicciones y toma de decisiones sobre las caractersticas de una
poblacin en base a la informacin recogida en una muestra.

10

CONCEPTOS Y DEFINICIONES PREVIAS


1. POBLACIN - es el conjunto total de elementos (individuos, objetos o medidas) que
poseen algunas caractersticas comunes observables en un lugar (espacio) y en un
momento (tiempo) determinado. Cuando se vaya a llevar a cabo alguna investigacin
debe de tenerse en cuenta algunas caractersticas esenciales al seleccionarse la
poblacin bajo estudio. Entre stas tenemos:
a. Homogeneidad - que todos los elementos de la poblacin tengan las mismas
caractersticas segn la variables de estudio. Por ejemplo, si se investiga la
drogadiccin entre jvenes mujeres adolescentes, entonces hay que definir
claramente las edades que comprenden la adolescencia (12 y 21 aos).
b. Tiempo - se refiere al perodo de tiempo donde se ubica la poblacin de
inters.
c. Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un
estudio no puede ser muy abarcador y hay que limitarlo a un rea o
comunidad en especfico.
d. Tamao de la poblacin. Es sumamente importante porque ello determina o
afecta al tamao de la muestra, adems que la falta de recursos y tiempo
tambin nos limita la extensin de la poblacin que se vaya a investigar. La
poblacin puede ser Finita o Infinita.
2. MUESTRA - la muestra es un subconjunto de la poblacin. La muestra para que
tenga valor, debe ser representativa, esto significa que la muestra debe contener
todos los tipos de elementos de la poblacin (Si en la poblacin hay altos, bajos,
gordos y flacos en la muestra tambin deben contener a todos estos tipos de
elementos) y adecuada, es decir debe ser lo suficientemente grande para contener la
cantidad necesaria de representacin (clculo del tamao de la muestra). La muestra
puede ser probabilstica o no probabilstica

11

3. PARAMETRO: Es un valor que se obtiene a partir de los datos de una Poblacin o


son los valores que se originas al analizar una poblacin. Un parmetro es un
sumario descriptivo de alguna caracterstica de una poblacin (la media aritmtica,
mediana, desviacin estndar). Ejemplo: La tasa de desempleo se ha mantenido en
18%. Es un ndice estadstico que va dirigido a describir a la poblacin. Muchos de
estos ndices se obtienen mediante registros oficiales de agencias del Gobierno.

4. ESTADISTICO O ESTADIGRAFO: Es un valor que se obtiene a partir de los datos de


una muestra o son los valores que se originan al analizar una muestra. Debe
entenderse que el parmetro y el estadgrafo son conceptos muy similares. Su
diferencia radica realmente en que el estadgrafo se calcula sobre una muestra y el
parmetro se calcula con relacin a una poblacin.
5. DATOS: Notacin o son smbolos que describen condiciones, hechos, situaciones o
valores. Ejemplo: 18 aos, 1.55 cm, Catlica, Alto

6. UNIDAD MUESTRAL: Para seleccionar una muestra, primero se define la Unidad de


Anlisis que puede ser un cliente, un votante, una organizacin, un libro contable, un
peridico, un hospital, un paciente, etc. Esta definicin nos permite identificar Quien
va ha ser medido, Quien nos va ha dar la informacin y por lo tanto precisar
claramente el problema a investigar y los objetivos de la investigacin.

12

7. VARIABLES: Es una caracterstica observable que poseen


los elementos y que puede tomar diferentes valores.
Ejemplo: Edad, Talla, Tipo de religin

III. EJERCICIOS
En los ejemplos siguientes identifique los elementos indicados en el recuadro:

3.1. Un estudio de 250 pacientes admitidos en un hospital durante el ao pasado revel


que, en promedio, los pacientes viven a 22.5 kilmetros del hospital.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio

3.2. Un estudio de 300 hogares en un pueblo sureo revelo que 20 por ciento tiene al
menos un hijo en edad escolar.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio

3.3. Varias veces durante el da un ingeniero de control de calidad, en una fbrica textil,
selecciona diferentes muestras de metros cuadrados de telas, las examina y registra el
nmero de imperfecciones que encuentra.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio

13

3.4. Un investigador mdico examina los efectos de un agente cancergeno en las ratas.
Tres semanas despus de inyectado el agente en una rata, el investigador realiza una
intervencin quirrgica para extraer y pesar los tumores.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio

3.5. Un gerente desea conocer si aquellos trabajadores que reciben 25 das de vacaciones
son ms productivos durante el ao, que los que reciben solo 15 das. El gerente
selecciona una muestra de 40 trabajadores y registra su rendimiento laboral.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio

3.6. De un establo se seleccionan 1000 vacas y se desea conocer el nmero promedio de


litros de leche que se obtienen por vaca y por da.
Poblacin
Muestra
Unidad de Anlisis
Variable de estudio

14

En los siguientes ejemplos identifique los parmetros y los estimadores:

3.7. En cierta universidad el decano de un colegio al hacer los preparativos para una
presentacin de consejeros, necesita conocer el promedio del nmero de estudiantes
por clase. El decano descubre que:
En una muestra de 20 grupos, el nmero promedio de
estudiantes por grupo es de 77.
En un estudio acerca de toda la universidad, el
promedio por grupo resulta en 84.

3.8. Un aforador que est interesado en conocer el promedio de precipitacin pluvial


durante el mes de septiembre, reporta:
El promedio de precipitacin pluvial para septiembre de
1998 y septiembre de 1999.
El promedio de precipitacin pluvial para todos los
septiembres, desde el principio de los registros
calculados hasta el presente ao.

3.9. Un fisilogo est interesado en el ndice de latidos cardiacos por persona, despus de
ciertas cantidades de ejercicio. Est interesado en lo siguiente:
El ndice ms elevado de latidos cardiacos de 100
personas despus de ejercicios vigorosos.
El ndice de latidos cardiacos promedio de todas las
personas, antes de realizar ejercicios.

15

IV. ACTIVIDADES DE AUTO EVALUACIN


Antes de continuar con los dems temas, es conveniente que te autoevales, desarrollando
las preguntas en forma individual. Luego coteja tus respuestas con la teora estudiada y
califica de acuerdo a la escala siguiente:

19 20 puntos

Excelente

17 18,5 puntos

Muy bueno

14 16,5 puntos

Bueno

11 14,5 puntos

Regular

Menos de 11

Malo

Si tienes un calificativo menor a 14,5 puntos debes estudiar un poco ms. Es


recomendable que revises las partes que has fallado.

Si tiene un calificativo menor de 11 puntos, es recomendable revisar los temas en


estudio, haciendo nfasis en los temas que perciba alguna dificultad.

4.1. Define los siguientes trminos:


a)

(4 ptos)

Estadstica:
..

b)

Poblacin:
..

c)

Muestra:.
..

d)

Dato:
..

16

4.2. La estadstica que se ocupa de interpretar los resultados obtenidos con las tcnicas
descriptivas, para tomar decisiones se denomina.......................................... (1Pto)
4.3. Es la caracterstica medible o descrita mediante un valor o atributo de un elemento en
estudio... (1Pto)

4.4. Un objetivo general de la Estadstica es estimar los parmetros de la poblacin, usando


muestras estadsticas.
a) Verdadero

(2 ptos)
b) Falso

Justifique su respuesta.

.
.

4.5. La estadstica descriptiva tiene como objetivo:

(1Pto)

a)

Probar la significacin de los resultados

b)

Ser herramienta indispensable en el muestreo

c)

Descubrir las causas que originan el hecho

d)

Lograr conclusiones ms all de las muestras

e)

Efectuar comparaciones sin sacar conclusiones de tipo ms general

4.6. Se debe responder verdadero si el enunciado es siempre vlido. En caso contrario se


deber sustituir la palabra subrayada por otra, con la cual el enunciado tenga validez:
(5 ptos)
a)

Parmetro es el resultado al aplicar una medida a las caractersticas de las


unidades de una poblacin.

b)

El conteo de los empleados de una empresa de acuerdo a su cargo, es un


ejemplo de caractersticas cuantitativas.

c)

La Estadstica Descriptiva, es el estudio de una muestra a fin de hacer


estimaciones acerca de la poblacin de la cual se tom la muestra.

d)

Una poblacin infinita tiene un nmero ilimitado de elementos

e)

Estimador es la medida estadstica obtenida con los datos de la poblacin.

17

4.7. En el ao 2006, se realiz un muestreo de opinin para determinar si los profesores de


Lima prefieren como texto de consulta el libro de Propedutica de Razonamiento
Matemtico de la editorial Lumbreras con respecto a otro. Con este fin se entrevistaron
a 2000 profesores y entre ellos 1 500 prefirieron dicho texto. Responda lo siguiente: (4
ptos)
Cmo estuvo formada la muestra?
Cmo estuvo formada la poblacin?
Cul fue la variable de estudio?
Cul fue valor estadstico?

VI. REFERENCIAS BIBLIOGRFICAS


6.1. WAYNE W. DANIEL. (2004) BIOESTADISTICA. Base para el anlisis de las Ciencias de la
Salud. 4ta Edicin. Editorial LIMUSA. Mxico D.F.

6.2. VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima Per.
6.3. BERENSON LEVINE, (1996). Estadstica Bsica en Administracin. 6ta edicin. Edith. PHH
S. A. Mxico.

6.4. FREUND, John y MANNING SMITH, Richard, (1999). Estadstica. 6ta edicin Edith. Prentice
Hall Hispanoamericana S.A.- Mxico.

6.5. GUILFORD, J.P. y FRUCHTER, Benjamn, (1996). Estadstica Aplicada a la Psicologa y la


Educacin. Edit. Mc Graw-Hill Mxico.

6.6. MILLER, Irwin y FREUND, John E., 1995. Probabilidad y Estadstica para Ingenieros Edit.
Prentice Hall Hispanoamericana S.A. Mxico.

6.7. MOYA, Rufino, (1991). Estadstica Descriptiva. Editorial San Marcos- Lima- Per.
6.8. WEBSTER, A. y otros, (2000). Estadstica Aplicada a los Negocios y a la Economa. 3era
edicin Edith. McGraw-Hill Companies, Inc. Santa Fe de Bogot- Colombia.

Fuentes electrnicas:
http://www.eumed.net/cursecon/libreria/drm/index.htm

18

Sesin 2
Variables y Escalas de Medicin
Recoleccin de datos
CAPACIDADES
1.
2.
3.
4.

Explica qu es una Variable.


Identifica y ejemplifica las clases de variables.
Reconoce la importancia de la recoleccin de datos reales en la investigacin.
Describe en forma clara y precisa las tcnicas ms importantes a utilizar en el
proceso de recoleccin de datos.
5. Identifica las fuentes de la informacin.
6. Elabora cuestionarios bsicos para recolectar datos.

ACTITUDES
1. Valora la importancia que tiene la clasificacin de las Variables Estadsticas; segn
las diferentes escalas de medicin en la investigacin cientfica.
2. Asume una actitud reflexiva para identificar las tcnicas e instrumentos de
recoleccin de datos adecuados.
3. Valora la importancia que tienen las tcnicas e instrumentos a utilizar en la de
recoleccin de datos como parte fundamental del proceso estadstico.
4. Asume una actitud reflexiva, crtica, creativa y participativa en la realizacin de las
actividades de aprendizaje.

CONTENIDO
Variables. Clasificacin. Escalas de Medicin.
Recoleccin de Datos. Tcnicas e Instrumentos.

19

VARIABLES
DEFINICION:

Las variables son atributos o


observables y cuantificables que poseen los objetos.

caractersticas

Cada rasgo o aspecto de una poblacin constituye una variable. La edad de unas personas,
su sexo, color de su piel, nacionalidad, su nivel de motivacin, niveles de ansiedad, el
nmero de nacimientos, nmero de matrimonios, frecuencia de suicidios, estatura, peso,
niveles de inteligencia, actitudes, entre muchas otras.

Las variables constituyen la unidad bsica de toda investigacin. Generalmente cuando se


investiga un asunto o problema lo primero que se hace es definir y clarificar el problema y lo
que realmente se hace en esta fase es establecer la relacin de causa y efectos entre dos o
ms variables. Por ejemplo, supongamos que se vaya a investigar el problema de la
ansiedad como una condicin que afecta al aprovechamiento acadmico de los estudiantes
en una determinada escuela entre nios de tercer grado. En este caso tenemos dos
variables principales: ansiedad y aprovechamiento acadmico. Nios de tercer grado es
otra variable que indica la poblacin bajo estudio. Y si l (la) investigador(a) interesa saber si
hay o no diferencias significativas entre nias y varones sobre el efecto de la ansiedad,
entonces aadira otra variable en su investigacin: el sexo.

Las variables pueden adquirir diferentes valores o clasificarse en diferentes categoras segn
la naturaleza o tipo de estudio que se lleve a cabo. Entre stas tenemos las siguientes
clasificaciones:

20

CLASIFICACIN DE LAS VARIABLES


CLASIFIC.
POR SU
RELACION DE
DEPENDENCIA
O CAUSAL

VARIABLES

TIPOS

INDEPENDIENTES
Es la variable que se manipula con la intencin de observar cambios en otra
variable (var. Dependiente)

La educacin de las madres


(Analfabeto, Primaria, secundaria,
Superior, etc)

DEPENDIENTES
Aquella en la que se observa cambios por efectos producidos por algn estimulo
(var. Independientes)

La desnutricin (Alta, media, baja)


El rendimiento de los hijos (aprobado,
desaprobado)
Sexo, Nacionalidad, Nombres
Marcas de auto, Colores,
Grado de Satisfaccin, puesto laboral,
grado de instruccin, estado Civil,

VAR. CUALITATIVA

POR SU
NATURALEZA

Indican una caracterstica o cualidad de


un elemento, las operaciones
aritmticas, no son significativas.

DISCRETA
VAR. CUANTITATIVA
Cuando los datos que se estudia son
nmeros y es posible operarlas
aritmticamente

SEGN EL
NUMERO DE
VARIABLES

21

EJEMPLOS

Solo adoptan ciertos valores y existe espacio


entre ellos.

CONTINUA
Cuando adopta cualquier valor dentro de un
rango especifico.

edad,
nmero de das
cantidad hijos
longitud,
superficie, volumen,
peso, tiempo, dinero

UNIDIMENSIONAL
Cuando se estudia una sola variable o muchas, pero en forma independiente

La edad, El rendimiento
La autoestima, El estado Civil

BIDIMENSIONAL
Cuando se estudia dos variables al mismo tiempo, para ver la relacin entre
ellas
MULTIDIMENSIONAL
Cuando se estudia ms de 2 variables al mismo tiempo.

Horas de estudio y el rendimiento


La autoestima y el rendimiento
Salario y el tiempo de servicio en aos
El Sexo, la edad, el salario y el
rendimiento

DEPARTAMENTO DE INVESTIGACIN
ESTADSTICA GENERAL

ESCALAS DE MEDICIN
Es una sucesin de medidas que permite organizar datos en orden jerrquico y mediante un
esquema especfico para asignar nmeros o smbolos con el objeto de designar
caractersticas de una variable (Ary, Jacobs, Razavieh, 1984). La taxonoma ms conocida
sobre las escalas de medicin las presenta Stevens (1951) quien las clasifica en nominales,
ordinales, de Intervalos y de razn. A continuacin veamos los cuatro tipos de escalas de
medicin.

a. Nominales

Los elementos solo pueden ser


clasificados en categoras pero no
se da un orden o jerarqua.

b. Ordinales

Existe un orden o jerarqua entre las categoras.


Posee un atributo de orden (Desnutricin, El nivel
de instruccin, Intensidad)

c. De Intervalo

d. De razn

DICOTOMICAS
TRICOTOMICAS
MULTITOMICAS

Establece la distancia entre una medida y otra.


Carece de un cero absoluto.
Es posible cuantificar la diferencia entre dos valores.
Generalmente tienen unidad de medida.

Existe el 0 absoluto, es la ausencia de la variable medida.


Esta escala permite todas las operaciones matemticas.
La multiplicacin y la divisin adquieren significacin
La diferencia entre dos valores es importante y definido.

ESCALAS NOMINALES
Las escalas nominales son aquellas donde se clasifican a los elementos
en categoras cualitativamente distintas.
Consiste simplemente en agrupar objetos en clases o asignar las
personas de acuerdo a alguna cualidad una vez que los objetos o
personas posean caractersticas comunes que lo hagan pertenecer a
una categora.
Se pueden utilizar nmeros en las escalas nominales, pero estas solo
como

etiquetas,

nunca

se

utilizarn

para

llevar

cabo

los

procedimientos matemticos de suma, resta, multiplicacin y divisin.


Por ejemplo, El DNI, la placa de los automviles.
Su funcin solamente est dada para efectos de identificacin, no
podemos hacer alguna estimacin de la magnitud de lo que
clasificamos.

- 22 -

ESCALAS ORDINALES
Escala ordinal = Nominal + Orden
Las escalas ordinales son las que clasifican a las personas, eventos u
objetos en una posicin con relacin a cierto atributo, pero sin indicar la
distancia que hay entre las posiciones.
Cuando se asignan nmeros es slo para indicar el orden de las
posiciones de lo que se est clasificando. Por ejemplo, el cuadro de
meritos del curso de Estadstica.
En este nivel tambin se definen varias categoras, pero adems de
mostrar un ordenamiento existe una relacin de mayor o menor que
entre ellas.
Las etiquetas, smbolos o nmeros asignados si indican jerarqua,
aunque no es posible conocer la magnitud de la diferencia entre cada
una de las categoras
Con las escalas ordinales tampoco se pueden llevar a cabo las
operaciones aritmticas de suma, resta, multiplicacin y divisin. La
diferencia que puede haber entre unas personas u objetos en este tipo
de escala no necesariamente constituye unidades iguales o absolutas
que puedan utilizarse para determinar si el que tiene un segundo lugar
posee el doble valor que el que queda en cuarta posicin. Por ejemplo,
en un evento atltico de una carrera que no haya sido cronometrada,
podemos saber quin lleg primero, segundo y tercer lugar, pero no
podemos saber con precisin la velocidad entre un corredor y otro. La
diferencia que hay entre el primero y el segundo no necesariamente es
igual a la que hubo entre el segundo y el tercero.

- 23 -

ESCALA DE INTERVALO
Esta escala mide las variables de manera numrica
Los nmeros de esta escala permiten establecer distancias entre 2
individuos.
Las operaciones aritmticas de suma o resta son perfectamente
realizables y significativas, no siendo la multiplicacin o divisin (no
tienen significados)
El cero es un valor que no indica ausencia de la caracterstica (es decir
es relativo) y es colocado en algn lugar de la escala. Ejemplo: la
Temperatura, donde el cero no implica la ausencia de temperatura
Ejemplo2: La escala de inteligencia posee un punto 0, pero nunca se va
a encontrar a un ser humano con cero de inteligencia.

ESCALA DE RAZON O COCIENTE


El cero, indica la ausencia de la caracterstica que se est midiendo
(cero absoluto)
Las operaciones aritmticas de multiplicacin y divisin adquieren
significado
La diferencia entre 2 valores es significativa y de magnitud definida.
Ejemplo1: 0 ingreso de ventas, significa que no se ha producido ninguna
venta.
Ejemplo2: un artculo que pesa 6 kg., tiene el doble de peso que otro de
3 kg.

- 24 -

CARACTERISTICAS, EJEMPLOS Y LIMITACIONES DE LAS


ESCALAS DE MEDICION
ESCALA

CARACTERISTICAS
Se clasifican las

Nominal

personas, eventos u
objetos en categoras

Denominaciones religiosas,
partidos polticos, nombres
de objetos, pinturas,
movimientos literarios.

LIMITACIONES
No se pueden precisar
diferencias cuantitativas
entre las categoras.

Orden de llegada de atletas

Restringida para

en una carrera,

Identificar diferencias

puntuaciones de una

relativas, pero no precisa

prueba, rangos militares,

diferencias en cantidad

nivel de popularidad de

absoluta entre personas

estudiantes en una escuela.

u objetos.

unidades de igual

Temperaturas (Celsius y

Razones no tienen

magnitud. El punto cero

Fahrenheit), fechas del

sentido ya que el punto

de la escala es arbitrario

calendario, escala de

cero es establecido

y no refleja la ausencia

inteligencia.

convencionalmente

Se clasifican u ordenan
las
Ordinal

USOS/EJEMPLOS

personas, objetos y
eventos en determinada
posicin
Escala que posee

Intervalo

del atributo.
Ninguna, excepto que su
Escala que posee un
Razn

punto cero absoluto e


intervalos de igual
magnitud.

Distancia, peso, estatura,


tiempo requerido para
realizar una tarea escolar.

uso se supedita
mayormente a medir
cualidades fsicas ms
que para la medicin de
aspectos psicolgicos.

- 25 -

PRUEBAS ESTADISTICAS ASOCIADAS A CADA UNA DE LAS ESCALAS DE


MEDICION
Los siguientes cuadros contienen las principales pruebas estadsticas. Estos cuadros solo
representan una gua o procedimiento estadstico en particular.

A. PRUEBAS ESTADSTICAS DESCRIPTIVAS MS FRECUENTES DE ACUERDO A LA


ESCALA DE MEDICIN DE LA VARIABLE DE ESTUDIO

TIPO DE

ESCALA DE LA

DESCRIPCION

VARIABLE
Cualitativa (nominal

Variables

MTODO O TCNICA ESTADISTICA


-

representados por grafico de barras, pastel o

u ordinal)

pictograma

individuales
Cuantitativa
(Intervalo

Frecuencias, proporciones o porcentajes

o razn)

Distribucin de frecuencias en clases.

Frecuencias acumuladas

Medidas de tendencia central, dispersin,


posicin, curtosis.

Cualitativa con
cualitativa
Asociacin entre
variables

Cualitativa con

Tablas de contingencia

Grficos de barras

Prueba de Kendall, de Cramer, de Spearman

Tablas de clasificacin categrica con


promedios y desviaciones o error estndar

cuantitativa
Cuantitativa con
cuantitativa

- 26 -

de cada entrada
-

Grafico de puntos (dispersin)

Coeficiente de correlacin de Pearson

Recta de regresin

B. PRUEBAS ESTADSTICA INFERENCIALES MS FRECUENTE DE ACUERDO A LA


ESCALA DE MEDICIN DE LA VARIABLE EN ESTUDIO.

TIPO DE

ESCALA DE LA

DESCRIPCION

VARIABLE

Variables

Nominales

individuales

METODO O TECNICA ESTADISTICA


-

Prueba Z para una proporcin poblacional.

Prueba X2 para varias proporciones en


una sola poblacin.

Intervalos de confianza para proporciones

Prueba del signo o binomial para la

Ordinales

Muestras grandes

mediana poblacional
-

Intervalo de confianza para proporciones

Prueba t-student para un promedio

con distribucin
Asociacin entre
variables

poblacional.

normal

Intervalo de confianza para el promedio

Muestras

Prueba del signo o binomial para la

pequeas sin
distribucin normal

- 27 -

mediana poblacional.
-

Intervalo de confianza para el promedio

C. PRUEBAS ESTADSTICAS PARA ESTUDIOS COMPARATIVOS MAS FRECUENTES


DE ACUERDO A LAS ESCALAS DE MEDICIN DE LA VARIABLE EN ESTUDIO.

TIPO DE
ESCALA DE
DESCRIPCION LA VARIABLE
Independientes Nominal
(sin control de
factores de
confusin)
Ordinal

METODO O TECNICA ESTADISTICA


-

Independientes Razn

Nominal
Dependientes
con bloques o
igualacin de
atributos

Ordinal

Razn

- 28 -

Prueba de Fisher
Prueba X2
Calculo del riesgo relativo
Modelos logsticos y logartmicos lineales
Prueba U de Mann Whitney (dos poblaciones)
Prueba de Kruskall Wallis (2 o ms
poblaciones)
Modelos logartmicos lineales
Prueba t-student (dos poblaciones)
Anlisis de varianza para la prueba F (ms de
2 poblaciones) seguida de la prueba de
medias de Tukey, Dunkan, etc.
Prueba de logrank para comparar sobreviva.
Regresin mltiple
Prueba de McNemar.
Mtodo de Mantel Haenzel
Prueba de X2 para cada bloque
Modelo logsticos y logartmicos lineales.
Prueba de Friedman
Prueba de Wilcoxon para rangos sealados
Modelos logartmicos lineales
Prueba t apareada
Anlisis de varianza para prueba F con 2
criterios de clasificacin con prueba de Tukey
Regresin mltiple

RECOLECCION DE DATOS
La recoleccin de datos proporciona la materia prima para el proceso estadstico. La
veracidad de los resultados depende de la calidad de los datos que se recolecten. A menudo
esta actividad de recoleccin es la que consume mayor tiempo y costo, por lo que es lgico
concluir que es muy importante planearla y ejecutarla adecuadamente.
La recoleccin de datos implica tres actividades:
o

Seleccionar o desarrollar un instrumento de medicin.

Aplicar ese instrumento de medicin

Codificar las mediciones obtenidas para su anlisis.

FUENTES DE INFORMACION
Una fuente de informacin es el lugar, la institucin, la persona donde estn
los datos que se necesitan para la investigacin.
Los datos pueden reunirse a partir de fuentes de informacin existentes o pueden obtenerse
mediante encuestas y estudios experimentales diseados para conseguir nuevos datos. Las
fuentes de informacin pueden ser:

Primarias
Informacin que se obtiene
directamente de la Unidad
de observacin

Fuentes de datos
internos.
aquellas que la empresa puede
obtener y explorar por sus
propios medios y recursos sin
necesidad de acudir a terceros

Fuentes de datos
externos
Informacin que estn situadas
fuera de la empresa cuya
informacin puede obtenerse a
travs de diferentes medios

- 29 -

Secundarias
Informacin elaborada a base de
datos de las fuentes primarias

Reportes Financieros,
Reporte de operaciones,
planificacin, reportes
especiales, etc

Informes, Anlisis o
comparaciones sobre reportes
anteriores de la empresa

Informes de Estudio de
mercado, estudio de
posicionamiento,
Reportes del INEI

Anlisis o informes basados en


los reportes del INEI, Ministerios
u otras entidades que genera
informacin estadstica

TECNICAS E INSTRUMENTOS DE RECOLECCION


DE DATOS
ENCUESTA

ENCUESTA

ENTREVISTA

OBSERVACIN

ANLISIS DOCUMENTAL

Desde el inicio de la investigacin se hace necesario decidir sobre el enfoque a


utilizar, lo que determina las caractersticas de todo el estudio.

Un buen instrumento determina en gran medida la calidad de la informacin, siendo


esta la base para las etapas subsiguientes y para los resultados.

La metodologa utilizada en la recoleccin de datos debe definir el tipo de informacin


requerida (cuantitativa, cualitativa o ambas).

Mtodo: Representa la estrategia o camino a travs del cual se establece la relacin


entre el investigador y el consultado para la recoleccin de los datos, se citan la
observacin y la encuesta.

Tcnica: conjunto de reglas y procedimientos que permiten al investigador establecer


la relacin con el objeto o sujeto de la investigacin.

Instrumento: mecanismo que usa el investigador para recolectar y registrar la


informacin; formularios, pruebas, test, escalas de opinin, listas de chequeo.

Las principales tcnicas de recoleccin de datos son:

- 30 -

La encuesta

La entrevista

La observacin (no experimental y experimental)

El Anlisis documentario

1. LA OBSERVACION
Es el registro visual de lo que ocurre en una situacin real, clasificado y consignando
los datos de acuerdo con algn esquema previsto y de acuerdo al problema que se
estudia.

VENTAJAS

DESVENTAJAS

Permite obtener datos cuantitativos y

agudeza

cualitativos.

Se

observan

caractersticas

Tambin

conductas,

Puede

ser

utilizada

en

los

Demanda

gran

cantidad

de

Tiene sesgos; el humano ve lo


que quiere ver.

cualquier

investigacin y rea del saber.

ver

tiempo.

actividades,

caractersticas o factores ambientales.

para

fenmenos estudiados.

condiciones de los individuos.

Se requiere de mucha habilidad y

Al momento de la interpretacin

Es un mtodo que no depende de

pueden distorsionrse los hechos

terceros o de registros; con ello se

e ir ms all de lo que vimos en

eliminan sesgos y ambigedades.

realidad.

PARA REDUCIR LOS PROBLEMAS SE UTILIZA

Definir claramente los objetivos perseguidos.

Determinar claramente la unidad de observacin.

Registrar las condiciones en que se asumir la observacin y las conductas

LOS ERRORES MAS COMUNES EN LA OBSERVACION

Los fenmenos a observar no se dan de la misma manera en todos los sujetos


de observacin.

Cuando el observador tiene ideas prejuiciadas.

Cuando el instrumento no es vlido o es poco exacto o est mal definido.

- 31 -

TIPOS DE OBSERVACION
CLASES

TIPOS

CARACTERISTICAS

El

investigador

se

involucra

total

parcialmente con la actividad objeto de


Observacin
Participante
Segn el

investigacin.

grupo.

Nivel de

La observacin se hace desde el interior del

Pueden

intervenir

las

emociones

del

investigador.

participacin

El investigador no se involucra en la
actividad objeto de estudio.

Observacin
NO

Los datos pueden ser ms objetivos.

Participante

Al no integrarse al grupo los datos pueden no


ser exactos, reales y veraces.

Segn la

Observacin

forma de

Directa

registrar la
conducta

Observacin

Cuando el investigador se pone en contacto


personalmente con el hecho o fenmeno que
se quiere investigar

Indirecta

A travs de filmadoras u otro medios


audiovisual

El investigador utiliza lineamientos generales


parta observar y luego escoge lo que estima

Segn la
Planificacin

Simple o No

relevante a los efectos de la investigacin

estructurada

propuesta.

de la

usada

para

estudios

exploratorio

observacin
Sistemtica
o
Estructurada

- 32 -

Fundamentalmente

El investigador dispone de un instrumento


estructurado y estandarizado para medir las
variables en estudio (lista de cotejos, etc).

2. LA ENTREVISTA
Es la comunicacin interpersonal establecida entre el investigador y el sujeto de
estudio a fin de obtener respuestas verbales a las interrogantes planteadas sobre el
problema propuesto.

VENTAJAS

Es aplicable a toda persona, (incluyendo a con limitaciones fsica o


psicolgica).

Permite estudiar aspectos psicolgicos o de otra ndole donde se desee


profundizar en el tema.

Permite obtener informacin ms completa,

A travs de ella el investigador puede: Aclarar el propsito del estudio,


especificar claramente la informacin que necesita, aclarar preguntas y permite
usar triangulacin.
Permite captar mejor el fenmeno estudiado ya que permite observar lenguaje
no verbal.

TIPO DE ENTREVISTAS
1. ENTREVISTA ESTRUCTURADA

Se elabora un formulario estandarizado.

Idnticas preguntas y en el mismo orden a todos los sujetos.

Los sujetos eligen la respuesta de 2, 3 o pocas ms alternativas.

Los comentarios y explicaciones son los mismos para todos.


VENTAJAS

Respuestas cortas y precisas.

Informacin fcil de procesar.

El entrevistador no requiere

DESVENTAJAS

La informacin puede ser muy


superficial.

Limitada

la

gran entrenamiento.

profundizar

Informacin uniforme.

determinado.

Difcil

en

obtener

confidencial.

- 33 -

posibilidad
un

de

aspecto

informacin

2. ENTREVISTA NO ESTRUCTURADA

Es flexible y abierta, pero regida por los objetivos de la investigacin.

Las preguntas, su contenido, orden y formulacin es controlado por el


investigador, el que puede adaptarlas dependiendo de las situaciones
y caractersticas de los sujetos en estudio.

El entrevistado tambin cuenta con libertad para dar sus respuestas.

Se utiliza un instrumento gua que contiene las orientaciones de los


temas a tratar.

Muy til para estudios exploratorios, descriptivos y cualitativos


VENTAJAS

DESVENTAJAS

Adaptable y aplicable

Requieren mucho tiempo.

de

Muy costosos por el tiempo de las entrevistas.

sujetos en diversas

Limitado para personas con problemas de la

toda

clase

situaciones.

palabra.

Permite

profundizar

en

temas

los

de

Orienta

posibles

hiptesis y variables

Dificultad para tabular datos que han sido


recopilados de distinta forma.

inters.

Se requiere crear confianza y comodidad


entre el entrevistado y el entrevistador.

Se requiere habilidad tcnica para obtener la

cuando se exploran

informacin y mayor conocimiento respecto

reas nuevas.

del tema.

Debido a que son entrevistas en profundidad


habitualmente se utilizan muestras pequeas.

CONSIDERACIONES PARA LAS ENTREVISTAS


Para evitar el rechazo o atrasos al aplicar entrevistas:

Establecer los contactos necesarios para el buen fin de las entrevistas.

Entrevistador debe estar bien capacitado.

El entrevistador debe establecer una buena comunicacin con el


entrevistado, uso de vestuario adecuado, lenguaje adecuado, escuchar
adecuadamente, no apresurar al entrevistado, etc.

- 34 -

Buen registro de la informacin a fin de poder interpretarla adecuadamente.

El entrevistador debe:

Dejarle un mensaje positivo al entrevistado.

Jams dar consejos,

Jams hacer juicios morales,

Jams rebatir al entrevistado.

3. LA ENCUESTA

Mtodo que utiliza un formulario impreso, destinado a obtener respuestas


sobre el problema en estudio y que el sujeto investigado llena por s mismo.

La encuesta puede aplicarse a grupos o individuos estando presente el


investigador. Incluso puede enviarse por correo a los destinatarios.

Algunos instrumentos utilizado en la encuesta son: EL CUESTIONARIO, TEST


FORMULARIOS - PRUEBAS

VENTAJAS

DESVENTAJAS

Costo relativamente bajo.

Proporciona informacin sobre


un mayor nmero de personas

puede variar ni profundizarse.

Si el cuestionario se enva por

en un perodo breve.

correo, es posible que no sean

Fcil para obtener, cuantificar,

devueltos o que no se obtengan

analizar e interpretar datos.

respuestas.

Menores

requerimientos

de

No utilizable en personas que no


saben leer ni escribir.

personal capacitado.

Es poco flexible, la informacin no

Mayor posibilidad de mantener

No permite aclarar dudas.

anonimato de los encuestados.

Resulta

Eliminacin de los sesgos que

cuestionarios

introduce el encuestador.

contestados.

Se

deben

muestras.

- 35 -

difcil

obtener

completamente

obtener

grandes

4. ANALISIS DOCUMENTARIO

Este tipo de investigacin es la que se realiza apoyndose en fuentes de carcter


documental (documentos que se encuentran en los archivos, como cartas, oficios,
circulares, expedientes, etc).

Consiste en seleccionar las ideas informativamente relevantes de un documento a


fin de expresar su contenido sin ambigedades para recuperar la informacin
contenida. Esta representacin puede ser utilizada para identificar el documento e
identificar su contenido o para servir de sustituto del documento.

III. EJERCICIOS
3.1. De los siguientes incisos, cules representan variables discretas y cules variables
continuas?
a) El nmero de acciones vendidas por da en la bolsa de valores.
b) Las temperaturas registradas cada media hora en un observatorio.
c) El tiempo de vida de bateras de equipos celulares con cmara y MP3.
d) El ingreso anual de los profesores universitarios.
e) La longitud de 1000 tornillos producidos por una fbrica.

3.2. Establece una correspondencia entre las variables indicadas y la clasificacin que se
muestra a continuacin:
VARIABLES

CLASIFICACION
A

Cualitativa Nominal.

Dependiente, independiente
Bidimensional.

3 El ingreso familiar en soles

Cuantitativa discreta
Unidimensional.

Lugar de nacimiento de los


estudiantes de la UCV

Cualitativa Ordinal.

La raza y la religin del padre de los


pobladores de una ciudad

Cualitativa, cualitativa
Bidimensional.

El N de libros que tiene cada una de


las universidades del Per

Cuantitativa continua
Razn.

1 El peso y la talla
2

- 36 -

Ciclos de estudios de una carrera


profesional

DEPARTAMENTO DE INVESTIGACIN
ESTADSTICA GENERAL

3.3. Indica a qu clase de variable: por su naturaleza y por su escala de medicin,


pertenece cada uno de los siguientes casos:
a) Cantidad de hombres y mujeres en un aula de clase.
b) La edad (en aos cumplidos) de los estudiantes de la UCV.
c) Grado de instruccin de los PPFF de los alumnos de un centro educativo.
d) El nivel de autoestima.
e) Etapas del desarrollo.
f) Coeficiente intelectual.

3.4. Proporciona una definicin operacional en cada uno de los siguientes casos:
a) Un buen trabajador

b) Un bonito da

c) Un servicio de atencin rpido

d) Tiempo de estudio

e) Nmero de personas en el hogar

f) Un buen estudiante

3.5. Un investigador que est estudiando hbitos de consumo le pregunta a cada vigsima
persona que entra en un supermercado acerca del nmero de veces que va de
compras semanalmente
a) Si la persona encuestada responde 2, esta respuesta es una muestra, variable,
medida estadstica, parmetro o dato? La respuesta es un valor cuantitativo o
cualitativo?, porqu?
b) A la persona encuestada tambin se le pregunta por su edad, estado civil

ingresos y responde: 32, soltero, S/. 1500 respectivamente. Identifique los


elementos de cada uno de estos datos.

3.6. Propn las tcnicas e instrumentos que se podran utilizar en la recoleccin de datos
para responder las preguntas que se presentan a continuacin y explica la razn de su
eleccin.
a)

Cul es la opinin de los estudiantes de la universidad sobre la actual poltica


educativa?

b)

Qu opinan los residentes de una urbanizacin y del Consejo Territorial


correspondiente, sobre la seguridad ciudadana en dicha urbanizacin?

- 37 -

c)

Cules son los niveles de desempeo del docente y de rendimiento de los


alumnos del curso de Estadstica General de la UCV?

d)

Existe relacin entre el nivel de autoestima de los trabajadores de una empresa y


su nivel de satisfaccin en el trabajo?

e)

Cul es la opinin de los decanos de las facultades sobre las fortalezas y


debilidades de la investigacin cientfica en la universidad y sus causas?

f) Cules son los tiempos promedio de espera y de atencin de los clientes de un


banco en las colas que se forman en las ventanillas y la opinin al respecto?
g) Cul es la opinin de los residentes en el distrito de Salaverry sobre la calidad del
agua potable y la calidad de atencin al cliente?
h) Cul es el pronstico de las ventas de una empresa para los aos 2009 y 2010,
teniendo en cuenta las ventas durante los ltimos diez aos?
i) Cul es el desgaste de los rodamientos de cierto tipo de mquinas y su relacin
con el tipo de aceite que se utiliza para lubricarlas?
j) Cul es la opinin de las autoridades del sector turismo del departamento de la
Libertad sobre cmo incrementar el flujo de turistas nacionales y extranjeros hacia
el departamento?

3.7. Un profesor est interesado en analizar la relacin entre el rendimiento acadmico de


los estudiantes de un examen con otras variables como edad, gnero, escuela, tiempo
de estudio fuera de clase, tiempo de diversin fuera de clase, otras actividades que
realiza fuera de clase, mtodo de estudio, etc. Algunas de las preguntas o tems del
primer cuestionario que elabora como instrumento para recolectar los datos son:
1) Edad

6)

2) Gnero

Cuntas horas a la semana dedica a


trabajar, adems de estudiar?

3) Escuela a la que pertenece

7)

Realiza actividades de diversin?

4) Cuntas

8)

Cuntas horas a la semana dedica a

horas a la semana

dedica al estudio, fuera de clases?


5) Adems de estudiar, realiza otro

divertirse?
9)

tipo de trabajo?

utiliza?
10)

- 38 -

Cul es el mtodo de estudio que

Cul es tu estrato socio-econmico?

ACTIVIDADES DE REFORZAMIENTO
4.1. Propn la tcnica e instrumento de recoleccin de datos que se podran utilizar para
lograr los siguientes objetivos.
Objetivos

Tcnicas

Instrumentos

Conocer la opinin de los estudiantes universitarios


sobre la poltica econmica del gobierno
Conocer la opinin de los gerentes de las
entidades financieras sobre las ltimas medidas
del gobierno en su sector.
Estimar el nmero promedio de automviles por
hora que pasan por el cruce de dos avenidas y el
tiempo promedio entre llegadas
Evaluar el cumplimiento de las normas en el
otorgamiento de prstamos para vivienda en una
entidad financiera
Analizar si existe relacin entre el nivel de
autoestima y el rendimiento acadmico de los
estudiantes de una facultad

4.2. Algunos de los objetivos especficos de una investigacin para analizar la satisfaccin
de los clientes de un restaurante son: (a) Describir el perfil de los clientes, (b) Evaluar
la atencin del personal, segn la opinin de los clientes, (c) Determinar la opinin de
los clientes sobre la calidad de la comida, (d) Conocer la opinin de los clientes sobre
la infraestructura, (e) Identificar las razones por las que los clientes prefieren el
restaurante. Elabora un cuestionario estructurado y codificado, considerando por lo
menos dos preguntas para cada objetivo.

39

REFERENCIAS BIBLIOGRFICAS

1.

VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.

2.

BERENSON LEVINE, (1996). Estadstica Bsica en Administracin. 6ta edicin.


Edit. PHH S. A. Mxico.

3.

FREUND, John y MANNING SMITH, Richard, (1999). Estadstica. 6ta edicin


Edit. Prntice Hall Hispanoamericana S.A.- Mxico.

4.

GUILFORD, J.P. y FRUCHTER, Benjamn, (1996). Estadstica Aplicada a la


Psicologa y la Educacin. Edit. Mc Graw-Hill Mxico.

5.

MILLER, Irwin y FREUND, John E.,1995. Probabilidad y Estadstica para Ingenieros


Edit. Prntice Hall Hispanoamericana S.A. Mxico.

6.

MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.

7.

WEBSTER, A. y otros, (2000). Estadstica Aplicada a los Negocios y a la Economa.


3era edicin Edit. McGraw-Hill Companies, Inc. Santa Fe de Bogot- Colombia.

40

MUESTREO
I. DEFINICIONES PRELIMINARES:
UNIDAD DE ANLISIS:
Para seleccionar una muestra, primero se define la Unidad de Anlisis que puede ser un
cliente, un votante, una organizacin, un libro contable, un peridico, un hospital, un paciente,
etc. Esta definicin nos permite identificar Quien va ha ser medido, Quien nos va ha dar la
informacin y por lo tanto precisar claramente el problema a investigar y los objetivos de la
investigacin.
POBLACION OBJETIVO:
Una vez que se ha definido la unidad de anlisis se procede a delimitar la poblacin que va a
ser estudiada y sobre la cual se pretende generalizar o inferir los resultados. Entonces, una
poblacin es el conjunto de todas las unidades de estudio que concuerdan con una serie de
especificaciones o caractersticas. Para seleccionar la muestra debe delimitarse la poblacin
identificando sus caractersticas o variables de inters a fin de determinar los parmetros
poblacionales. En algunos casos, la delimitacin de una poblacin no slo depende de los
objetivos del estudio, sino de otras razones prcticas. Las poblaciones tienen que ser
especificadas en contenido, lugar y tiempo.

MUESTRA:
La muestra es un subconjunto de elementos que pertenecen a una poblacin de estudio. Para
seleccionar una muestra debemos de tener presente el tipo de muestreo a utilizar: muestreo
probabilstica y el muestreo no probabilstico. Se tiene que definir la variable de inters, para
que en funcin de esta se sepa qu tipo de muestreo utilizar. Luego calcular el tamao de
muestra y finalmente seleccionar las unidades de anlisis.

41

MUESTREO
Es una TCNICA ESTADSTICA por la cual se realizan inferencias a la poblacin examinando
solo una parte de ella, sta parte recibe el nombre de

MUESTRA, la cual debe ser

estadsticamente representativa y adecuada.


Ventajas:

Desventajas:

Costo reducido

Presencia del error de muestreo

Mayor rapidez

Presencia de gran variabilidad de las obs.

Claridad

TCNICAS DE MUESTREO: Existen 2 tipos de tcnicas de muestreo:


A. TECNICAS PROBABILISTICAS:

B. TECNICAS NO PROBABILISTICAS

Muestreo aleatorio

El muestreo a criterio o juicio.

Muestreo aleatorio estratificado

El muestreo por cuotas.

Muestreo sistemtico

El muestreo por conveniencia.

Muestreo por conglomerados

El muestreo intencional

A. TECNICAS PROBABILISTICAS
MUESTREO ALEATORIO:
Escoge al azar los miembros de la poblacin hasta completar el tamao muestral previsto.
En teora se enumeran previamente todos los elementos y de acuerdo con una tabla de
nmeros aleatorios se van escogiendo.
El procedimiento puede darse con o sin reemplazos y esta condicin afectar posteriormente el
anlisis.
a. Sin reposicin:
Cuando un elemento es seleccionado y puede volver a ser seleccionado, se dice que hacemos
un muestreo aleatorio con reemplazamiento o con reposicin. Generalmente recibe el nombre
de muestreo aleatorio simple. (m.a.s.)
b. Con reposicin:
En caso de que el elemento no vuelva a formar parte de la poblacin de manera que no puede
volver a ser seleccionado se dice que se ha obtenido la muestra mediante un muestreo
aleatorio sin reposicin o reemplazamiento. En algunos libros, este mtodo recibe tambin el
nombre de muestreo irrestrictamente aleatorio.

42

MUESTREO SISTEMATICO:
En la poblacin (N) se elige el primer elemento al azar.
Luego los dems se escogen cada cierto intervalo (k), hasta completar el tamao muestral (n).
El tamao del intervalo (k) se calcula as: k = N/n

MUESTREO ESTRATIFICADO:
Considera que al interior del universo existen estratos (subgrupos internamente homogneos
pero cualitativa y cuantitativamente diferentes entre s), y que no se cumple la condicin de
seleccin aleatoria pues los miembros del grupo mayoritario tienen una mayor probabilidad de
ser seleccionados en la muestra.

MUESTREO POR CONGLOMERADO:


En el muestreo por conglomerados, la poblacin se divide en unidades o grupos, llamados
conglomerados (generalmente son unidades o reas en los que se ha dividido la poblacin),
que deben ser lo ms representativas posible de la poblacin, es decir, deben representar la
heterogeneidad de la poblacin objeto del estudio y ser entre s homogneos.

B. TECNICAS NO PROBABILISTICAS
MUESTREO POR CUOTAS:
Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un
buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o
"adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.

MUESTREO A JUICIO:
Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo
del tema bajo estudio, por lo tanto, se considera que la informacin aportada por esas personas
es vital para la toma de decisiones.

43

MUESTREO OPINTICO O INTENCIONAL:


El investigador selecciona aquellos casos que le estn ms disponibles. Los resultados que se
obtengan no podrn generalizarse ms all de los individuos que componen la muestra, al igual
que las conclusiones.

BOLA DE NIEVE:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
etc.

II. DISEO DE LA MUESTRA:

Para determinar el tamao, primeramente hay que identificar la variable a estudiar


(Cuantitativa o cualitativa). Luego depende de cuatro factores o elementos que son los
siguientes:

44

Se quiere saber cmo se


comporta una cierta
caracterstica en una Poblacin
particular

Hacer
un Censo

La poblacin
est bien
definida
?

Es posible
observar toda la
poblacin?

NO
Definir
La
poblacin

Las observaciones
pueden atribuirse
a los miembros la
poblacin

Variable
Cualitativa

Muestreo
Representativo
para estimar una
Proporcin

Variable
Cuantitativa

Muestreo
Representativo
para estimar una
Media

NO
Observar
una Muestra

De que naturaleza
es el parmetro
que se
quiere estimar
?

III. TAMAO DE LA MUESTRA

3.1. PARA UNA VARIABLE CUANTITATIVA:

a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La desviacin estndar varianza: que son valores que se obtienen por estudios
anteriores, por la muestra piloto o por la distribucin de la poblacin.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.

45

3.2. PARA UNA VARIABLE CUALITATIVA:

a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La proporcin poblacional (P): que son valores que se obtienen por estudios
anteriores, por la muestra piloto y si no se conoce asumir p=0.5.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.

3.3. FORMULAS PARA DETERMINAR EL TAMAO DE MUESTRA:

VARIABLE

(Cuando no se conoce N)

(Cuando se conoce N)

Cuantitativa

(Proporcin

(Promedio

Poblacional)

Poblacional)

Z 2 P(1 - P)
n0 =
E2

POBLACION INFINITA

POBLACION FINITA

Cualitativa

n=

Z 2 P(1 - P) N
E 2 ( N - 1) + Z 2 P(1 - P)

n0 =

n=

Z 2S 2
E2

Z 2S 2 N
E 2 ( N - 1) + Z 2 S 2

Z = es el valor de la distribucin normal estandarizada para un nivel de confianza


fijado por el investigador.
S = Desviacin estndar de la variable fundamental del estudio o de inters para el
investigador. Obtenida por estudios anteriores, muestra piloto, criterio de
experto o distribucin de la variable de inters.
P = es la proporcin de la poblacin que cumple con la caracterstica de inters.
E = % del estimador o en valor absoluto (unidades). Fijada por el investigador.
N = Tamao de la poblacin.

46

3.4. ESTIMACION DE LOS VALORES A APLICAR EN LAS FORMULAS


A. Valor de Z: es el valor de la abscisa de la distribucin normal estandarizada
teniendo en cuenta el nivel de confianza fijado por el investigador, por lo tanto
este valor se encuentra en las tablas estadstica respectiva. Para hacer el
trabajo menos tedioso, presentamos a continuacin los diferentes valores de Z
VALORES DE LA DISTRIBUCIN NORMAL
ESTANDARIZADA(Z)
Nivel de
Valor Z
Nivel de confianza
significancia
(1-)
Bilateral
Unilateral
()
90% = 0.90
10% = 0.10
1.64
1.28
95% = 0.95
5% = 0.05
1.96
1.64
98% = 0.98
2% = 0.02
2.33
2.05
99% = 0.99
1% = 0.01
2.58
2.32
B. Clculo del Valor de P:(Se calcula este valor cuando la variable es
CUALITATIVA)
Que son valores que se obtienen por estudios anteriores, por la muestra piloto y
si no se conoce asumir p=0.5.
C. Clculo del Valor de la varianza (Si la variable es CUANTITATIVA): este
valor es obtenida por estudios anteriores, muestra piloto, criterio de experto o
distribucin de la variable de inters.

D. Clculo del error de estimacin: Generalmente se asume 2%, 5%, y 8% de


error. Este valor es fijado por el investigador. Es la diferencia entre el parmetro
(poblacin) y el estimador (Muestra). Es decir, por ejemplo E=| x |. Este
error puede ser absoluto o relativo. Si E=0.35 se denomina error absoluto. Si
consideramos un error del 10% de la media, es decir, E=10%( x )= 0.10(3.5)=
0.35 se denomina error relativo.

47

CASOS
CASO N 01: (Cuando se conoce la varianza)
En un estudio realizado en la Minera Barrick se obtuvo que el
promedio de horas extras por trabajador es de 3.3 hrs., con una
varianza de 4.18 hrs2. Si en el presente ao cuenta con 120
trabajadores, los cuales registran sus horas extras en tarjetas de
control. Determinar el tamao de muestra necesario para estimar el
promedio de horas extras diarias con un error del 10% del promedio
y una confianza del 95%.

CASO N 02: (cuando se conoce la varianza)


El Director del Departamento de Salud Pblica de la Ciudad de
Trujillo desea obtener una muestra de los registros de casos de
mordidas de perro, reportadas durante el ao anterior, para estimar la
edad media de las personas mordidas. El Director desea una
muestra con una seguridad del 95%, con un error del 5% del
promedio. En base a estudios anteriores se conoce que la edad
promedio de las personas que son mordidas por perros es de 25
aos y la desviacin estndar es de 5 aos. De que tamao debe
ser la muestra?
CASO N 03:
De una poblacin de 1,043 pequeos establecimientos comerciales
con 5 o ms empleados, en una rea del centro de la ciudad de
Trujillo, se requiere ser muestreada para estimar el numero medio de
empleados por establecimiento, teniendo informacin preliminar que la
desviacin estndar es de 1.3 empleados.
Qu tamao debe ser la muestra, si la estimacin se establece una
precisin de 0.25 con una confianza del 95%?.
Analice los resultados obtenidos.

48

CASO N 04: (Cuando no se conoce la varianza-Muestra piloto)


La Direccin Regional de Salud DIRESA-Trujillo esta realizando una
investigacin acerca del comportamiento del peso de nios en la ciudad de
Trujillo y ver si presenta un plan de salud para mejorar esta factor latente de
bajo de peso. Como no se conoce la varianza se obtiene una muestra piloto
de 20 nios cuyos pesos son:
14.8, 14.2, 15.3, 15.4, 15.0, 15.2, 15.3, 14.2, 15.2, 15.5, 15.6, 16.4, 14.8,
15.1, 15.8, 16.1, 14.5, 15.3, 14.9, 15.9.
Determinar el tamao de muestra apropiado con una confianza del 95% y
un error tolerable del 1% respecto al promedio.

CASO N 05: (Cuando existen estudios previos)


Por estudios cientficos se sabe que el Coeficiente de Inteligencia promedio para jvenes
segn la escala de Weshler es de 100 puntos con una desviacin estndar de 15 puntos.
Determinar el tamao de muestra para realizar una investigacin sobre niveles de
inteligencia en la Universidad Privada del Norte, si se admite un error del 2% del promedio y
una seguridad del 95%.

CASO N 06:
Se desea determinar una muestra representativa para conocer la opinin en contra de la
poblacin acerca de la explotacin del Cerro Quilish-Cajamarca. Se aplic una muestra piloto
a 20 de los 10000 cajamarquinos, obtenindose los siguientes datos. Cul es el tamao de
muestra con un 95% de confianza y un error del 2%?

49

Grupo

Tamao de muestra

A favor

En contra

Indecisos

Total

20

CASO N 07:
Se desea estimar la proporcin de jvenes de la ciudad de Trujillo
que hacen uso de Internet como mnimo una hora diaria con un 95%
de confianza. De estudios anteriores se conoce que P=0.70 y se
desea un E = 5%. Suponiendo que N = 1500. Cual debe ser el
tamao de muestra.

CASO N 08:
El administrador del Restaurante El Romano desea saber que proporcin de sus ClientesTuristas estn inconformes con las atenciones recibidas durante su estada en Trujillo. De
que tamao debe ser la muestra si se considera E=0.05, nivel de confianza del 95% y no se
dispone de alguna otra informacin?

CASO N 09:

En una muestra piloto de tamao 50 estudiantes universitarios,


seleccionados de 4,000 estudiantes se encuentra que 30 fuman, que
tamao deber ser la muestra, para que la precisin de estimacin
p sea del 5%, considere una confianza del 95%.

50

Sesin 4
Organizacin de los datos:
Tablas y Grficos Estadsticos
CAPACIDADES
1. Construye e Interpreta los diferentes tipos distribuciones de frecuencias.
2. Presenta adecuadamente los cuadros estadsticos.
3. Construye e interpreta los grficos de acuerdo a las normas tcnicas del INEI

ACTITUDES
1. Valora la importancia que tiene la distribucin de frecuencias y los grficos como

mtodo de organizacin y como mtodo para describir el comportamiento de las


variables de inters.
2. Valora la importancia que tiene la estructura y la presentacin adecuada de los cuadros

y grficos estadsticos para descubrir patrones de comportamiento en la Investigacin


cientfica.
3. Actitud creativa y disposicin a trabajar en equipo.

CONTENIDO

Organizacin de datos: Distribucin de Frecuencias. Interpretacin. Presentacin


de Cuadros. Representacin grafica de acuerdo a las normas tcnicas del INEI

51

CUADROS ESTADISTICOS

I.

CUADRO ESTADISTICO
Un cuadro estadstico es un arreglo ordenado de filas y columnas, de datos estadsticos
o caractersticas relacionadas, con el objeto de presentar adecuadamente informacin
estadstica. (Ejemplo: las tablas del BCR, INEI). Deben ser diseados de tal forma que el
lector pueda dirigirse fcilmente al cuadro.

II. FINALIDAD: Es ofrecer informacin resumida de fcil

lectura, comparacin e

interpretacin
III. VENTAJAS:

Los cuadros permiten presentar en forma resumida y ordenada muchos datos.

Es un instrumento que clasifica, resume y comunica informacin estadstica.

Facilita el anlisis de los datos.

IV. PARTES DE CUADRO ESTADISTICO

52

1. Nmero: Es el cdigo de identificacin. El nmero se anota junto a la palabra tabla o


cuadro, ejm.: Tabla N 1, Cuadro N 1
2. Ttulo: Se refiere a la descripcin del contenido del cuadro. Debe indicar la
caracterstica principal en estudio, lugar y tiempo que se realiz el trabajo.
3. Encabezamiento:

Es la descripcin de las filas y columnas de un cuadro

estadstico. El encabezamiento se ubica en la parte superior del cuerpo del cuadro.


4. Columna Matriz: En esta columna se designa la naturaleza del contenido de cada
fila. Se anotan las categoras o las diferentes clases de la escala de clasificacin
utilizada.
5. Cuerpo del Cuadro: Se ubica la distribucin de los datos estadsticos de acuerdo a
las indicaciones del encabezamiento y la columna matriz.
6. Notas explicativas: Se refiere a cualquier nota aclaratoria sobre el contenido del
cuadro estadstico.
7. Fuente:

Sirve para indicar de donde se obtuvo la informacin estadstica.

Ejemplo:

Cuadro N 1

Intervenciones por delitos, registrados por la Polica Nacional, en el Pas


y en el Departamento de La Libertad, segn tipo de falta: 2009
TIPO DE FALTA

53

INTERVENCIONES EN DELITOS
TOTAL
DPTO LA
RESTO

PAIS

Contra la vida el cuerpo y la salud


Contra la tranquilidad pblica 1/
Contra el patrimonio
Contra la familia
Contra la libertad
Contra la seguridad pblica
Contra el orden econmico
Delito tributario
Contra la fe pblica
Contra la administracin pblica
Otros
TOTAL

23681
1296
109112
6669
8531
7736
4247
15081
1483
314
924
179074

LIBERTAD

2137
1
7793
21
424
17
--6
6
36
10467

PAIS

21544
1295
101319
6648
8107
7719
4247
15081
1451
308
888
168607

Fuente: Polica Nacional del Per- Divisin de Estadstica


V.

ERRORES MAS COMUNES

Disposicin incorrecta de los datos

Ttulos y encabezamientos incompletos e inadecuados

Datos no comparables: establecer comparaciones es una de las partes ms


importantes del anlisis

Cuadro sobrecargado

CLASIFICACION DE LOS CUADROS ESTADISTICOS

54

CUADROS DE DISTRIBUCION DE FRECUENCIAS


DEFINICION: Es una forma de organizar u resumir los datos con la finalidad de describir el
comportamiento de las variables de inters. Esta organizacin tabular, consiste en presentar
la lista de valores de la variable, clases o categoras junto con el nmero de veces que se
repite cada valor de la variable (frecuencia)

55

Donde:

fi : Frecuencia absoluta simple


hi : Frecuencia relativa simple
Fi : Frecuencia absoluta acumulada
Hi : Frecuencia relativa acumulada

EJEMPLO
Simples

Acumuladas

# hijos

fi

hi

Fi

Hi

0 hijos

f1 = 6

6/13 =
46.1%

F1 = f1 = 6

H1 =F1/N =
46.1%

1 hijos

f2 = 4

4/13 =
30.8%

F2 = f1+f2 =10

H2 =F2/N =
76.9%

2 hijos

f3 = 3

3/13 =
23.1%

F3 = f1+f2+f3 =13

H3 =F3/N =
100%

13

100%

Total

f2 : 4 personas tienen 1 hijo


h1: El 46.1% de la poblacin tiene 0 hijos (no tiene hijos)
F2: 10 personas tiene 1 o menos hijos
H2: el 76.9% de la poblacin tiene 1 hijo o menos

56

GRAFICOS ESTADISTICOS

Un grfico es la representacin de un fenmeno estadstico por medio de figuras


geomtricas, cuyas dimensiones son proporcionales a la magnitud de los datos
representados.

Su objeto principal es la representacin de los datos de forma grfica, que permita


de un solo golpe de vista darse cuenta del conjunto de elementos representados y de
evidenciar sus variaciones y caractersticas.

El grfico es un auxiliar del cuadro estadstico, no lo sustituye sino que lo


complementa.

En estadstica los grficos estn en relacin a las variables de estudio: cuantitativa o


cualitativa

I.

PARTES DE UN GRAFICO ESTADISTICO

LEYENDA:

1. TITULO DEL GRAFICIO:


2. ESCALAS:
3. CUERPO:
4. FUENTE:
5. LEYENDA:

57

II. CLASIFICACION DE LOS GRAFICOS ESTADISTICOS

A. GRAFICO PARA VARIABLES CUALITATIVA O CUANTITATIVA DISCRETA

58

B. GRAFICO PARA VARIABLES CUANTITATIVAS CONTINUAS

III. PRINCIPALES GRAFICOS ESTADISTICOS


A) HISTOGRAMA DE FRECUENCIAS
Para construir un histograma de frecuencias, se trazan barras por arriba de cada
intervalo de clase y a una altura que es igual a la frecuencia de la clase.

59

Ilustracin 1: Histograma de Frecuencia


12

10
8
6
4
2
0

10

20

30

40

f 9
8

B) POLIGONO DE FRECUENCIAS

Para construir un polgono de

frecuencias absolutas simples se

6
5

traza una lnea poligonal sobre los

puntos marcados, teniendo en

cuenta la marca de clase y sus

2
1

frecuencias correspondientes.

0
5

15

35

25

45

F 90
80

El polgono de
Frecuencias acumuladas se
llama OJIVA

70
60
50
40
30
20
10
0
1

60

C) GRAFICO DE BARRAS
Estos grficos constituyen una herramienta adecuada para comparar los tamaos
relativos de cantidad que se distribuyen en el espacio.
Ejemplo:

Nmero de personas que visitaron, durante un mes, lugares tursticos

de una ciudad.
f

LUGAR
TURISTICO
A
B
C
D
TOTAL

N DE
PERSONAS
40
20
30
15
105

45
40
35
30
25
20
15
10
5
0
A

D) GRAFICO CIRCULAR
Sirve para representar la divisin de un todo en las partes que lo constituyen. El
crculo total es dividido en partes por medio del trazado de radios, segn los grados
del ngulo correspondiente.
Ejemplo: La siguiente tabla muestra la situacin acadmica de un grupo de
estudiantes al final de un ciclo acadmico

CONDICION
APROBADO
DESAPROBADO
INHABILITADO
RESERVA DE MAT
TOTAL

N DE
ESTUD
35
8
5
2
50

%
70
16
10
4
100

INHABILITADO;
10

RESERVA DE
MAT; 4

DESAPROBADO;
16

APROBADO; 70

61

EJEMPLOS

IV.

62

ERRORES MAS COMUNES EN LA CONFECCION DE GRAFICOS

Falta de Titulo o ttulos extremadamente extensos.

No usa correctamente las partes de un grafico

Escasez de datos

No uso de la identificacin.

Ttulos que no responden a las preguntas bsicas.

Grficos muy cargados y/o sumamente complejos de interpretar.

Desproporcin notable entre las longitudes de los ejes.

Omisin de los rtulos de los ejes y/o las unidades de medida.

EJERCICIOS
1.

Se presenta os tiempos (en minutos) que demoran 45 estudiantes en un


consultorio Psicolgico de la universidad
Tiempo de

Frecuencia Frecuencia Frec.

Frec.

ocupacin

Absoluta

Relativa

(min)
20 30

30 40

16

40 50

12

50 60

60 70

70 80

TOTAL

45

Relativa

Absoluta

simple

acumulada acumulada

a) Completa la informacin del cuadro estadstico


b) Hacer la grafica respectiva

2.

Los siguientes datos corresponden al nmero de hijos de cada una de las 30


familias de una urbanizacin de Trujillo.
2

Presentar la informacin en un cuadro estadstico y grafico estadstico

3.

La siguiente informacin corresponde a las calificaciones individuales de 50


alumnos en un examen de ingles de la Universidad Cesar Vallejo

63

84

47

74

57

42

35

50

85

81

60

65

53

54

68

85

65

52

35

33

71

74

65

77

45

73

55

91

61

41

40

59

65

60

76

64

69

48

55

78

94

67

47

88

89

77

73

66

98

66

70

a) Presentar la informacin en un cuadro estadstica, utilizando intervalos


cerrados
b) Grafica un histograma de frecuencia absolutas simples
c) Graficar un polgono de frecuencia relativas simples
d) Grafica una ojiva porcentual menor que

4.

Las siguientes observaciones expresan el nmero de veces que 22


consumidores compraron una determinada marca de un producto en los 2
ltimos meses
Primer mes

0 2 5 0 3 1 8 0 3 1 1

Segundo mes 9 2 4 0 2 9 3 0 1 9 8
a) Construir la distribucin de frecuencias relativas y la de frecuencias
relativas acumuladas
b) Representar ambas distribuciones en un grafico comparativo
c) Qu proporcin de personas no compraron nunca dicha marca?
d) Qu porcentaje de consumidores adquirieron dicha marca menos de 5
veces?

5.

Los siguientes datos corresponden al nmero

de bibliotecarias o

bibliotecarios en las bibliotecas pblicas de las diferentes provincias


espaolas
4 7 5 2 4 5 6 4 7 3 7 4 3 4 4 3 4 3 2 4

1 10 2

5 3
2 2 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7

12

a) Hallar la distribucin de frecuencias relativas y representarla mediante un


diagrama de barras
b) Obtener y representar la distribucin de frecuencias relativas acumuladas
c) Qu proporcin de provincias tiene ms de 7 bibliotecarios?

64

6. Los dos cuadros siguientes presentan datos sobre el gasto mensual en


calefaccin para un apartamento de dos habitaciones
Calefaccin por gas
25.42 26.22 25.22 23.60 27.77 28.52 21.60 29.49 26.22
25.22 20.19 23.97 26.32 23.38 26.77 31.56 25.42 22.72
27.58 29.96 26.22 23.97 28.17 18.01 22.98

Calefaccin por electricidad


33.52 51.01 41.99 33.82 25.93 30.32 32.06 39.86 24.62
31.80 48.58 44.65 31.30 35.04 19.24 40.78 43.39 34.78
25.43 33.82 26.47 34.78 32.02 27.98 32.92
a) Hacer una tabla de distribucin de frecuencia
b) Comparar ambas distribuciones grficamente
c) Qu conclusiones pueden extraerse?

7. Las siguientes medidas corresponden a las alturas de 50 nios y nias


1.56

1.59

1.63

1.62

1.65

1.58 1.56 1.59 1.53 1.54

1.61

1.59

1.51

1.62

1.62

1.52 1.54 1.50 1.49 1.56

1.53

1.49

1.57

1.54

1.53

1.63 1.68 1.62 1.47 1.65

1.59

1.58

1.57

1.47

1.64

1.56 1.52 1.59 1.57 1.59

1.55

1.59

1.53

1.56

1.53

1.62 1.62 1.62 1.60 1.54

a) Construir una distribucin de frecuencias absolutas y relativas


b) Obtener las correspondientes distribuciones de frecuencias acumuladas
c) Representar las distribuciones anteriores mediante histogramas
d) Dibujar los correspondientes polgonos de frecuencias
e) Hallar, a partir del polgono de frecuencias acumuladas, la proporcin
de observaciones entre 1.59 y 1.62 ambas inclusive
f) Qu conclusiones pueden extraerse?

65

8. En la oficina de un diario, el tiempo que se tardan en imprimir la primera


plana fue registrado, durante 50 das. A continuacin se transcriben los
datos, aproximados a dcimas de minuto.

a)

20.8

22.8

21.9

22.0

20.7

20.9

25.0

22.2

22.8

20.1

23.3

20.9

22.9

23.5

19.5

23.7

23.6

19.0

25.1

25.0

21.3

21.5

19.9

24.2

24.1

19.8

23.9

22.8

23.9

19.7

21.1

20.9

21.6

22.7

25.3

20.3

23.1

20.7

19.5

23.8

21.8

24.3

22.5

21.2

23.8

23.8

20.7

24.2

24.2

24.1

Presenta los datos en una distribucin de frecuencias con amplitud


de clase entera, utilizando la frmula de Sturges.

b)

Calcula e interpreta las frecuencias porcentuales simples y


acumuladas.

c)

Determina

qu porcentaje de las veces, la primera plana del

peridico puede imprimirse en menos de 24 minutos?


d)

Construye un diagrama de tallos y hojas. Interpreta

9. Para realizar un estudio de la cantidad de azcar vendida por semana en


una tienda, se tom una muestra de 35 semanas del ao 2000, obtenindose
los siguientes resultados (en cientos de Kg.)
68

48

66

21

28

30

46

38

69

50

90

38

21

35

92

53

53

21

27

52

55

50

48

35

36

52

45

24

28

31

39

46

61

81

46

a)

Organiza los datos usando el diagrama de tallos y hojas. Interpreta.

b)

Construye una distribucin de frecuencias que tenga 7 clases de amplitud


entera.

c)

Observando la distribucin de frecuencias obtenida, qu puede decir sobre


la asimetra?

d)

66

Interpreta las frecuencias simples y porcentuales.

10. Una muestra de tiempos, en minutos, de llamadas telefnicas que recibe


una secretaria son:

3 6 2 3 3 1 4 5 2 4 3 1 2 4 4 5 3 1 2 4 1 4 8
1 2 3 4 5 2 7 2 3 5 3 4 4 3 4 3 6 2 1 3 6 4 5
3 2 4 3 2 4 5 3 7 1 3 4 3 4 1 3 7 3 2 1 3
Organiza los datos en una distribucin de frecuencias considerando las
frecuencias absolutas simples (fi) y los porcentajes simples.

11. Considerando la amplitud de clase entera, construya las clases y sus


correspondientes lmites reales para la variable pago por consumo telefnico
mensual en los siguientes casos:
a)

Xmin = S/. 52.5

Xmx = S/. 385.8,

k = 6 redondeado a

dcimos.
b)

Xmin = S/. 153.55 Xmx = S/. 595.75 ,

k=8 redondeado a

centsimos.

12. Cuando se les pidi clasificar la destreza que se requiere para obtener una
alta calificacin en un nuevo juego de computadora como principiante,
aprendiz, competidor, maestro o experto, 45 evaluadores respondieron de la
manera siguiente: experto, maestro, maestro, competidor, experto, maestro,
maestro, maestro, experto, aprendiz, maestro, maestro, maestro, maestro,
experto, maestro, competidor, maestro, maestro, principiante, experto,
competidor, maestro, maestro, experto, experto, maestro, maestro, maestro,
competidor, competidor, experto, maestro, experto, experto, experto,
competidor, maestro, maestro, y experto. Ahora:
Construye una tabla que indique las frecuencias correspondientes a estas
clasificaciones de la destreza que se requiere para obtener una calificacin
alta.

67

13. Se han tomado muestras de ventas, en soles, realizadas en una empresa


durante los meses de julio y agosto. Los datos son los siguientes:
20.00 425.00
30.00 11.60
158.00 194.65
122.00 15.93
63.00 90.00
120.00
21.00
40.00
5.80
55.00
a)

Mes de julio
40.00 380.00 18.00 43.00 47.50 30.00 434.08 16.00 62.50
37.00 98.50
4.80 235.00 97.50 490.00 147.00 235.50 124.00
30.00 16.15 200.00 60.00 22.50 30.00 45.00 490.00 413.00
90.62 55.00 86.00 188.80 32.50 307.40 92.00 140.00
5.70

34.45 14.00 40.00


32.00 19.50 141.00
12.10 129.20 50.00
50.00 141.00 32.00
33.00 500.00

Mes de agosto
95.00 390.30 49.10 29.19
76.00
4.20 18.50 88.50
35.00 78.00 82.00 356.70
50.00 117.50 50.00 300.00

17.20
88.00
86.00
3.00

93.00 160.00
70.00 48.00
6.20 14.10
12.00 13.00

Construye distribuciones de frecuencias de las ventas (una para cada mes)


considerando las clases: 0 menos de 100.00, 100 menos de 200.00, etc.

b)

Construye

una distribucin de frecuencias para las ventas del mes de julio

utilizando la frmula de Sturges. Compara con las distribuciones obtenidas en (a),


cul es mejor? Explica.

ACTIVIDAD EN CLASE
Recolecta la siguiente informacin de los alumnos del aula.
Edad

Genero Talla

Peso

Estado

Numero de

civil

hermanos

1.

Indicar la clasificacin de cada tipo de variable (Cualitativa o Cuantitativa)

2.

Hacer las tablas de frecuencia de Edad, genero, talla, Peso, Estado Civil, #
Hermanos

3.

68

Hacer las graficas respectivas de cada variable.

ACTIVIDADES DE AUTO EVALUACIN (TABLAS)


Antes de continuar con los siguientes temas, es conveniente que te autoevales,
desarrollando las preguntas en forma individual. Luego coteja tus respuestas con la
teora estudiada y califcate en la escala de 0 20:

4.1. Los pesos de los estudiantes de una seccin de Estadstica de la UCV,


redondeados a enteros,

varan entre 52 y 83 kilogramos. Indica los lmites

nominales y los lmites reales de siete clases en que se podran agrupar estos
pesos.

(3 ptos)

4.2. Los nmeros de anlisis de sangre por da que se realizan en un hospital se


agrupan en una distribucin que tiene las clases 25-39, 40-54, 55-69, 70-84 y 8599. Encuentra: a) las fronteras de clase, b) las marcas de clase, c) la amplitud de
clase.

(3 ptos)

4.3. Las marcas de clase de una distribucin del nmero de asaltos registrados
diariamente en una delegacin de polica son 4, 13, 22, 31 y 40. Encuentra: a) los
lmites de clase nominales, b) los lmites reales.

(2 ptos)

4.4. Para agrupar las ventas que varan entre $10.00 y $60.00, un dependiente utiliza
las clasificaciones siguientes: $10.00-19.99, $20.00-35.99, $35.00-49.00 y $50.0059.99. Explica las dificultades que se tendran al utilizar estas clases. (2 ptos)

4.5. Una compaa de computadoras recibi un pedido urgente del mayor nmero de
computadoras domsticas que pudiera entregar en un perodo de tiempo de seis
meses. Los expedientes de la compaa ofrecen las siguientes entregas diarias:
(5 ptos)

69

22

65

65

57

55

50

65

77

73

30

62

54

48

65

79

60

63

45

51

68

79

83

33

41

49

28

55

61

65

75

55

75

39

87

45

50

66

65

59

25

35

53

a) Agrupa estas cifras de entrega diaria en una distribucin que tenga las clases
20-29, 30-39, 40-49,.., 80-89.
b) Cules son los lmites reales o fronteras de clase?
c) Calcula las frecuencias absolutas acumuladas y porcentuales acumuladas
menos que y mayor que. Interpreta las frecuencias de la segunda y quinta
fila.

4.6. En la redaccin del diario El Observador el tiempo requerido para formar la


primera pgina completa fue registrado durante 50 das. Los datos, redondeados a
la dcima de minutos ms cercana, se dan a continuacin:

(5 ptos)

20.8

22.8

21.9

22.0

20.7

20.9

25.0

22.2

22.8

20.1

25.3

20.7

22.5

21.2

23.8

23.3

20.9

22.9

23.5

19.5

23.7

20.3

23.6

19.0

25.1

25.0

19.5

24.1

24.2

21.8

21.3

21.5

23.1

19.9

24.2

24.1

19.8

23.9

22.8

23.9

19.7

24.2

23.8

20.7

23.8

24.3

21.1

20.9

21.6

22.7

a) Utilizando la frmula de Sturges, construye una distribucin de frecuencias


absolutas, que incluya

frecuencias simples y

frecuencias porcentuales

acumuladas menor que y mayor que, utilizando una amplitud de clase de 0.8
minutos.
b) Halla los lmites reales de clase de la distribucin.

70

ACTIVIDADES DE AUTO EVALUACIN (GRAFICOS)


Antes de continuar con los siguientes temas, es conveniente que te autoevales,
desarrollando las preguntas en forma individual. Luego coteja tus respuestas con la
teora estudiada:

1.

A continuacin se da el consumo semanal de carne de vacuno en una muestra de


80 familias de la comunidad de Namora:
Consumo (Kg/Sem.)
N de familias
a)

0 - 1,9
15

2 - 3,9
26

4 - 5,9

6 - 7,9

20

13

8 - 9,9
6

Construye un polgono de frecuencias y describe el comportamiento de la


variable.

b) Construye las ojivas menor que y mayor que en un slo grfico

2.

La Asociacin Nacional de Vendedores de Muebles de Estados Unidos recab los


datos siguientes de una muestra de 130 vendedores, que representan las
ganancias totales por comisiones que obtienen los vendedores anualmente:

Ganancias
$5.000 o menos
$5.001 - $10.000
$10.001 - $15.000
$15.001 - $20.000
$20.001 - $30.000
$30.001 - $40.000
$40.001 - $50.000
ms de $50.000

71

Frecuencias
2
12
11
33
32
20
13
7

a) Construye una ojiva que le ayude a responder las preguntas siguientes:


b) Qu % de vendedores gana ms de 20,000 dlares?
c) Aproximadamente cunto ganar al ao un vendedor de muebles cuyo
desempeo fuera de cerca del 25% del mximo esperado?

3. Para una muestra de 155 estudiantes de una Facultad, se obtuvo la siguiente


distribucin de los estudiantes por gnero y segn tipo de ingreso a la Universidad

GNERO
TIPO DE
INGRESO

Total

MASCULINO

FEMENINO

26

16

42

61.9%

38.1%

100.0%

28.6%

25.0%

27.1%

16.8%

10.3%

27.1%

34

22

56

60.7%

39.3%

100.0%

37.4%

34.4%

36.1%

21.9%

14.2%

36.1%

31

26

57

54.4%

45.6%

100.0%

34.1%

40.6%

36.8%

20.0%

16.8%

36.8%

91

64

155

Total

58.7%

41.3%

100.0%

100.0%

100.0%

100.0%

58.7%

41.3%

100.0%

a) Interpreta cualquier porcentaje de cada uno de los casilleros del cuadro.


b) Construye un grfico de barras simples para la variable gnero. Comenta.
c) Construye un grfico de barras agrupadas que considere ambas variables.
Comenta.
d) Construye un grfico de barras apiladas. Comenta.

72

REFERENCIAS BIBLIOGRFICAS
1.

VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.

2.

BERENSON LEVINE, (1996). Estadstica Bsica en Administracin. 6ta edicin.


Edit. PHH S. A. Mxico.

3.

FREUND, John y MANNING SMITH, Richard, (1999). Estadstica. 6ta edicin


Edit. Prntice Hall Hispanoamericana S.A.- Mxico.

4.

GUILFORD, J.P. y FRUCHTER, Benjamn, (1996). Estadstica Aplicada a la


Psicologa y la Educacin. Edit. Mc Graw-Hill Mxico.

5.

MILLER, Irwin y FREUND, John E., 1995. Probabilidad y Estadstica para


Ingenieros Edit. Prntice Hall Hispanoamericana S.A. Mxico.

6.

MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.

73

Sesin 6
Medidas Estadsticas:
Tendencia Central Posicin - Dispersin
CAPACIDADES
1. Realiza clculos bsicos utilizando las frmulas,

tanto para datos simples como para datos


agrupados, de las medidas de tendencia central.
2. Interpreta las medidas calculadas, usando como

referencia el contexto y las variables en estudio.


3. Calcula e interpreta cuantiles.
4. Analiza la presencia de valores extremos en un

conjunto de datos.

ACTITUDES
1. Valora la importancia que tienen las medidas de tendencia central y los cuantiles en la

descripcin de las poblaciones estadsticas en estudio.


2. Acta trabajando en equipo con responsabilidad, puntualidad y orden en la ejecucin de

las tareas y trabajos asignados, asumiendo una posicin reflexiva y crtica hacia los
resultados obtenidos.

CONTENIDO
Medidas de Tendencia Central. Media Aritmtica, Mediana y Moda. Cuantiles. Valores
Atpicos y Extremos.

74

MEDIDAS ESTADISTICAS
En numerosas ocasiones, en vez de trabajar con todos los datos, es preferible disponer de
una o ms medidas descriptivas que resumen los datos de forma cuantitativa. Se trata, de
resumir en unos cuantos valores la informacin ms importante y til contenida en un
conjunto de datos, haciendo ms fcil la comprensin y la comparacin de las diversas
caractersticas de las poblaciones o muestras.

VI. DEFINICIN
Las medidas estadsticas son medidas de resumen que se calculan a partir de una
muestra y que describen ciertos aspectos de una serie o distribucin de datos para
poder tener un mejor conocimiento de la poblacin
VII. FINALIDAD
Las medidas estadsticas pretenden "resumir" la informacin de la "muestra" para poder
tener as un mejor conocimiento de la poblacin

VIII. ALGUNAS CONSIDERACIONES PARA UNA MEDIDA ESTADISTICA:


1. Debe definirse de manera objetiva: dos observadores distintos deben llegar al
mismo resultado numrico.
2. Usar todas las observaciones y no algunas de ellas solamente, de manera que
si vara alguna observacin la medida considerada debe reflejar esta variacin.
3. Tener un significado concreto: la interpretacin debe ser inmediata y sencilla.
4. Ser sencilla de calcular.
5. Prestarse fcilmente al clculo algebraico: Lo que permitir demostraciones ms
elegantes.
6. Ser poco sensible a las fluctuaciones muestrales. Esta condicin es
imprescindible en la Estadstica Matemtica y en la Teora de Sondeos.

75

IX. CLASIFICACION DE LAS MEDIDAS ESTADSTICAS

a.

MEDIDAS DE TENDENCIA CENTRAL


Son valores que se ubican en la parte central de un conjunto de datos o de una
distribucin.

Las medidas de centralizacin responden a la pregunta. Alrededor de qu


valor se agrupan los datos?

Estas medidas solo se calculan para variables cuantitativas.

EL conocimiento de estas medidas es de gran utilidad tanto en los niveles de


decisin como de ejecucin.

Las principales medidas de tendencia central son:

MUESTRA

Media ponderada

X
Xp

La Mediana
La Moda

me
mo

Me
Mo

Media aritmtica simple

76

POBLACION

):
1.1. LA MEDIA ARITMTICA O PROMEDIO ( o
Es el valor representativo de una poblacin o conjunto de datos
Tambin se llama Esperanza matemtica, valor medio o promedio aritmtico
Se obtiene sumando todos los valores de los datos observados y se divide entre el
nmero total de ellos.
Solo es aplicable para el tratamiento de datos cuantitativos.
Existen dos formas de trabajar con los datos: sin agruparlos o agrupndolos en
tablas de frecuencias.
Formulas de clculo de la media aritmtica:

Datos sin
Agrupar

Datos
Agrupados * fi

77

POBLACION (N)

MUESTRA (n)

Xi
=
N

Xi
=
n

.
.
=
=
N
n

Ejemplo: Suponga que se han registrado 20 observaciones referentes a los


ingresos semanales del jefe de hogar de un determinado distrito. De la informacin
muestral obtenida calcule el promedio:
36

55

55

41

25

55

55

55

41

41

57

37

40

31

58

58

45

36

43

43

Solucin: Calculamos el promedio muestral:

n
xi
36 25 ... 58 43 907 . 0
x i 1

45 . 35
n
20
20

1.2. LA MEDIANA (Me)


Valor que divide en dos partes iguales un conjunto de datos ordenados en forma
ascendente o descendente
En otras palabras es el valor que ocupa del lugar central.
La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.
Es una medida de tendencia central que divide al total de n observaciones
debidamente ordenadas o tabuladas en dos partes de igual tamao, cada una con
el 50% de los datos observados.
Formulas de clculo de la mediana:
n es par

n es impar

Datos no
agrupados
Valor que est en la mitad
de la serie ordenada

Datos
Agrupados
(TABLAS)

78

Promedio de los 2 valores


centrales

1
= + [ 2
]
1

Para datos no agrupados: Para calcular la mediana, los n datos originales


1)

Se ordenan en forma ascendente o descendente los datos

2)

Se halla el lugar en donde se encuentra la mediana

Se presenta dos casos:


a) Para un nmero par de datos:
La mediana ser el promedio de los dos valores centrales.
Ejemplo: Calcular e interpretar la mediana
Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000
Solucin:
1) Ordenando en forma ascendente
Xi: 650, 750, 750, 820, 850, 850, 1000, 1000, 1000, 1200
50%

Me

50%

2) Como n = 10 (par) se ubica el lugar en donde se encuentra la Me

+ +1
2

5 + 6 850 + 850
=
= 850
2
2

3) Interpretacin: El 50% de los trabajadores tienen un ingreso mximo de S/. 850,


el otro 50% supera dicho ingreso.

b) Para un nmero impar de datos:


La mediana ser el valor que est ocupando la posicin central.
Ejemplo: Los siguientes datos corresponden a los tiempos de acceso en minutos a 11
Pginas Web cargadas por la tarde en el horario de 14 a 15 horas desde una PC

79

Xi:

2.9, 1.4, 1.2, 3.4, 1.3, 2.5, 1.6, 1.8, 2.3, 1.5, 1.0

Solucin: Ordenando los datos en forma ascendente


Xi: 1.0, 1.2, 1.3, 1.4, 1.5, 1.6, 1.8, 2.3, 2.5, 2.9, 3.4.
Me

50%

50%

= +1 = 11+1 = 6 = 1.6
2

Interpretacin: El 50% de las pginas Web son cargadas en un tiempo de acceso


Mximo de 1.6 minutos., el otro 50% supera dicho tiempo.

1.3.- LA MODA (Mo)

Definicin: Es el valor que ocurre con ms frecuencia

Es especialmente til para datos de tipos nominal, ordinal y de intervalos

Una distribucin puede ser: amodal sino tiene ninguna moda,


unimodal si tiene una moda,
bimodal si tiene dos modas y
multimodal si tiene tres o ms modas.

PROPIEDADES DE LA MODA

La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de


intervalos, y relativa).

80

La moda no es afectada por valores extremos.

DESVENTAJAS DE LA MODA

En muchas series de datos no hay moda porque ningn valor aparece ms de una
vez.

En algunas series de datos hay ms de una moda, en este caso uno podra
preguntarse cul es el valor representativo de la serie de datos?

CLCULO

Clculo de la moda para datos agrupados

= + [

1
( 1 ) + ( +1 )

= + [
Donde: =

1
]
1 + 2
1

USO ADECUADO DE LA MEDIA, MEDIANA Y MODA.De las tres medidas de tendencia central, se observa que:

1) La media aritmtica tiene la ventaja de que toma en cuenta para su calculo, la


totalidad de los valores de la variable, aumentando o disminuyendo de acuerdo a
ellos, pero a causa de este problema, puede tener la desventaja que es afectada
por la existencia de valores muy altos o muy bajos en los extremos.
En conclusin cuando el comportamiento de la variable es ms o menos simtrico
la media aritmtica es la ms recomendable.

81

2) La mediana se usa cuando existe mucha dispersin de los datos.


3) As tambin la mediana es la mas ventajosa en usarla cuando en el primer o ltimo
grupo o clase no tiene lmite definido.

4) La moda no es muy usual, pero se emplea cuando se quiere conocer el valore que
se presenta ms frecuentemente.

b. MEDIDAS DE POSICION

2.1. CUARTILES (Qi):


Se denotan por Qi, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir,
cada sector tiene el 25% de los datos.
El Q2 coincide con la mediana
Para calcular los cuartiles se utilizan las formulas adecuadas ya sea si son datos
agrupados o datos no agrupados.

Qi = LI + c [

Formula:

in
Fj1
4

Fj Fj1

Ejemplo datos sin agrupar:


o

Nmero Impar de datos

2, 3, 4, 5, 6, 7, 9

Q1 Q2
o

82

Numero par de datos

Q3

1, 2, 3, 4, 5, 6, 7, 9

2.5
Q1

4.5
Q2

6.5
Q3

Ejemplo datos agrupados:


fi

FI

[ 50 60 )

[ 60 70 )

10

18

[ 70 80 )

16

34

[ 80 90 )

14

48

[ 90 100 )

10

58

[ 100 110 )

63

Total

63

Cuartil 1 (Q1)
Q1 = 60 + 10 [

Cuartil 2 (Q2)
Q1 = 70 + 10 [

163
4

= 15.75

15.75 8
] = 67.75
18 8
263
4

= 31.5

31.5 18
] = 78.44
34 18

2.2. DECILES (Di):


Se denotan por Di, donde i=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir,
cada sector tiene el 10% de los datos.
D5 coincide con la mediana

Formula:

in
Fj1
10

Di = LI + c [

Fj Fj1

2.3. PERCENTILES (Pi):


Se denotan por Pi, donde i=1,2,3,4,5,6,7,8,9,10, , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,
cada sector tiene el 1% de los datos.

83

in
Fj1
100

Pi = LI + c [

Formula:

Fj Fj1

EJEMPLO:
Suponga que se han registrado 20 observaciones referentes a los ingresos
semanales del jefe de hogar de un determinado distrito. De la informacin muestral
obtenida calcule el cuatil1, decil 8 y percentil 97:
36

55

55

41

25

55

55

55

41

41

57

37

40

31

58

58

45

36

43

43

Solucin:
Seguimos el siguiente procedimiento:
1. Ordenar la serie en forma ascendente
2. Definir la posicin de los cuartiles, deciles y percentiles siguiendo la formula
correspondiente.
3. Luego

Cuartil1
Ordenando los datos de forma ascendente:
25 31 36 36 37 40 41 41 41 43 43 45 55 55 55 55 55 57 58 58

Calcularemos la ubicacin del cuartil 1 para lo cual definimos la posicin del


cuartil 1(K=1): QK Wk(n+1) 0.25(20+1) 5.25.
De esto decimos que el cuartil 1 esta entre la ubicacin 5y 6 (pues el valor
hallado es 5.25), luego para hallar el valor de la ubicacin 5.25 interpolamos:
5.0

37

5.25
6.0

84

40

de esto obtenemos que la ubicacin 5.25 39.75

Po lo tanto Q1: 39.75.

Decil 8: Ordenando los datos de forma ascendente:


25 31 36 36 37 40 41 41 41 43 43 45 55 55 55 55 55 57 58 58
Calcularemos la ubicacin del decil 8 para lo cual definimos la posicin del
decil 8 (D=8): DK Wk(n+1) 0.80(20+1) 16.80.
De esto decimos que el decil 8 esta entre la ubicacin 15y 17 (pues el valor
hallado es 5.25), luego para hallar el valor de la ubicacin 5.25 interpolamos:
15.0 55
16.8

de esto obtenemos que la ubicacin 16.80 55.0

17.0 55
Po lo tanto D8: 55.0

85

c. MEDIDAS DE DISPERSIN

Rango

Coeficiente
de Variacin

Medidas
de
Dispersin

Varianza

Desviacin
estndar

Son indicadores estadsticos que representan cuan dispersas se encuentran los datos de
la variable, sealndonos el grado de concentracin de los mismos con respecto al
promedio de la distribucin.

Las medidas de dispersin se usan para:


a) Verificar la confiabilidad de los promedios.
b) Establecer como base para el control de la variable. As tenemos:

86

Alta dispersin (medida de dispersin alta) --- baja concentracin alrededor


del promedio.

DATOS HETEROGENEOS

Baja dispersin (medida de dispersin baja) -- Alta concentracin alrededor


del promedio.

DATOS HOMOGENEOS

Las medidas de dispersin ms usuales son:


MUESTRA
R

Rango
Varianza

S2

Desviacin estndar

3.1. RANGO:

POBLACION
R

R = Max - Min

Se denota por R y la medida de variabilidad ms fcil de calcular.


Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto
de datos.
Su uso es muy limitado, pues solo toma en cuenta los valores extremos

Ejemplo: La edad de 10 alumnos en un aula de clase, es segn se muestra a


continuacin. Se pide hallar el rango.
23
Solucin.

18

28

18

Rango = 28 - 16

16
=

26

19

20

21

18

12

Luego, existe una dispersin de 12

aos.

3.2. VARIANZA (2):


Mide la variabilidad de un conjunto de datos respecto a un valor central
(promedio)

87

Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilgica


su interpretacin.
Para calcular la varianza se utilizan las formulas adecuadas ya sea sin son datos
agrupados o datos no agrupados.

POBLACION
DATOS SIN
AGRUPAR

DATOS
AGRUPADOS

i 1

S2

Y . f
i

i 1

n 1

S
2

Y x . f

ABREVIADA

X
i 1

i 1

x x

N
N

MUESTRA

i 1

n 1
N

2
i

X
i 1

2
i

n 1

Donde:
Xi

valores de la variable X

Yi

marca de clase de cada variable o grupo

tamao de la poblacin

tamao de la muestra

2
S2

Varianza poblacional
Varianza muestral

3.3. DESVIACIN ESTANDAR ():


Mide la variabilidad de un conjunto de datos respecto a su valor central pero en
unidades originales.

88

Esta es la medida de variabilidad que tiene una interpretacin lgica.


Se obtiene al sacar la raz cuadrada de la varianza.
DESVIACION STANDARD:

S S2

Ejemplo: En una de las fbricas de Motor Per, se producen autos de diversas


marcas, desde Enero a Agosto de 2007
Meses :

Ene

Feb

Mar

Abr

May

Jun

Jul

Agos

Produccin:

100

130

90

120

100

140

110

98

Defina la variable en estudio y halle la varianza y Desviacin Standard.

3.4. COEFICIETE DE VARIACIN (CV):


Es el grado de desviacin con relacin a la media.
Este coeficiente se usa para comparar las medias aritmticas o promedio de
diferentes muestras.
El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento
homogneo o heterogneo.
Para llegar a determinar la homogeneidad se compara con un valor del 33%.
o

Si el CV 33%

Los datos tiene un comportamiento homogneo.

Si el CV > 33%

Los datos tiene un comportamiento heterogneo.

Nota.- Cuanto menor es el C.V. mejor ser la estimacin del promedio y el


proyecto ser mejor.

C.V .

Donde:

89

*100%

c.v.

S
*100 %
X

C.V.

coeficiente de variacin de la poblacin

c.v

coeficiente de variacin muestral

=
=
=

Desviacin estndar poblacional


Media aritmtica poblacional
Desviacin estndar muestral
Media aritmtica muestral

Ejemplo.- Considerar dos proyectos de inversin A y B. Ambos tienen una ganancia


promedio igual a $ 500. La Desviacin estndar es 63.25 y

516.20 respectivamente.

Halle cul de los dos proyectos es mejor.


Solucin:

500
63.25

500
516.20

C.V.
Luego el mejor proyecto es:

EJEMPLO:
Suponga que se han registrado 20 observaciones referentes a los ingresos
semanales del jefe de hogar de un determinado distrito. De la informacin muestral
obtenida calcule el Rango, varianza muestral, desviacin estndar y el coeficiente
de variacin
36

55

55

41

25

55

55

55

41

41

57

37

40

31

58

58

45

36

43

43

Solucin:
Rango:

R V max V min 58-25 33

Varianza muestral:
Para calcular VARIANZA para datos sin agrupar, trabajamos con la formula:

90

n
2
( xi x )
(36 45.38)2 (25 45.38)2 ... (58 45.38)2 (43 45.38)2 1882.55
2
i

99.08
s

20 1
19
n 1

La varianza tiene una interpretacin un poco dificultosa de entender, es por eso


que nos ayudamos de la desviacin estndar cuando queremos interpretar esta
medida.
Desviacin estndar muestral:
Para calcular la desviacin estndar para datos sin agrupar, trabajamos con la
formula:

= 2 = 99.08 = 9.95

Este valor se puede interpretar como la variabilidad promedio de los datos


con respecto con respecto a su valor

Coeficiente de variacin:
Para calcular el coeficiente de variacin para datos sin agrupar, trabajamos con
la formula:

= / 100 = (9.95/45.38) 100 = 21.93%


Como, CV 21.93 33%, podemos decir que el conjunto de datos tiene un
comportamiento homogneo.

91

EJERCICIOS:
A.- CIENCIAS ECONOMICAS Y CONTABLES

1. La empresa A tiene 100 empleados, con su sueldo promedio mensual por empleado de $
250. La empresa B tiene 200 empleados con un sueldo promedio mensual de $ 240.
a. Cul es el sueldo promedio mensual de las dos empresas en conjunto?
b. Si las dos empresas se agrega una tercera con 50 empleados y un sueldo
promedio mensual por empleado de $ 300, Cul es el sueldo promedio para las
tres empresas en conjunto?

2. El ingreso medio mensual de los 16,500 obreros de una compaa es de S/. 116.00 y de
los 12,900 empleados de esta compaa es de S/. 148.00. Si los obreros reciben una
aumento del 20% sobre sus ingresos ms una bonificacin de S/. 50.00 por condiciones
de trabajo y los empleados reciben un aumento del 30% ms S/. 60.00 por refrigerio.
Cul es el ingreso promedio de todos los trabajadores de la compaa despus del
aumento?

3. Un auxiliar de contabilidad est trabajando en una Tienda Comercial, en la cual se han


realizado ciertas ventas, que han sido facturadas. Se presenta las facturas identificadas
segn nro de cdigo.
FACTURAS: 123, 140, 300, 126, 127, 128, 129, 130, 141, 142, 120, 131, 132, 111, 133,
135, 134, 139, 142, 146.
a. Se le pide ordenar las facturas y luego aplicar los cuartiles Q1, Q2, Q3.
b. Calcular el nro. De factura mediana e interpretar correctamente

92

4. Despus de ser capacitados un grupo de trabajadores en una Empresa, rindieron un


examen de evaluacin, donde los resultados oscilan entre:
a. (Calcule los cuartiles: Q1, Q2, Q3, interprete correctamente cada estadgrafo).
b. Cul es el promedio de nota despus de recibir una capacitacin
c. Cul es la nota mediana despus de recibir una capacitacin

d. Cul es la nota ms frecuente en el grupo de trabajadores.


Yi-1 -Yi
0-50
50-100
100-150
150-200

fi
14
18
19
5

Xi

fi

de la Corte Superior, se pide calcular el promedio, moda

1200

16

y la mediana e interpretar correctamente cada estadgrafo.

1400

23

1600

17

1800

41

2000

32

2200

21

5. En la sgte. Tabla se presenta los sueldos de magistrados

6. Establezca, con base estadstica, en cul de las siguientes empresas el salario est
repartido de forma ms equitativa.
Empresa A
n de personas

15
20
30
20
15

93

salario
percibido
(S/.)
800
1000
1200
1500
7500

Empresa B
n de personas
salario
percibido (S/.)
10
30
35
24
1

800
1000
1200
1500
7500

Calcular el promedio de salario percibido en el grupo de trabajadores de la Empresa


A y de l a Empresa B.

B.- CIENCIAS DE LA SALUD


1. En los siguientes ejercicios calcular el promedio, mediana y moda e interpretar
correctamente cada estadgrafo.
a. Pesos

de pacientes que fueron

evaluados en anlisis de sangre, en un

laboratorio.
PESOS
20-25
26-31
32-37
38-43
44-49
TOTAL

fi
5
9
15
10
6

b. Medidas de paredes de reas de salud de consulta que se encontraron en el


Hospital Regional
MEDICIONES(cms.)
1.2- 2.6
2.7-4.1
4.2-5.6
5.7-7.1
7.2-8.6
TOTAL

fi
7
23
70
135
27

2. Un farmacutico realiza ventas de medicinas en FARMACIA INKAFARMA, del reporte de


ventas tiene a su disposicin el nro de boletas emitidas con respectivos cdigos. Se le
pide ordenar las facturas y luego encontrar el nro de factura mediana. Se le pide ordenar
las facturas y luego aplicar los cuartiles Q1, Q2, Q3.
FACTURAS: 123, 140, 300, 126, 127, 128, 129, 130, 141, 142, 120, 131, 132, 111, 133,
135, 134, 139, 142, 146.

94

3. Se presenta el nro. de vacunas que se aplicaron a nios menores de 5 aos. segn


fueron atendidos en diferentes puestos de salud. Calcula el promedio, la mediana y la
moda, e interprete correctamente.
2 3 4 5 5 5 5 5 6 6 6 67 7 7 7 7 7 88

4. A aquellos pacientes que sienten mejora todos los das del


Tiempo de
reaccin

tratamiento se les realiza un estudio sobre el tiempo de


reaccin del medicamento (en minutos), encontrndose
recogido los datos en la siguiente tabla:
Calcula el promedio, mediana, moda e interpreta correctamente
cada estadgrafo. Identifica la variable en estudio y realiza una
grafica adecuada.

N de
pacientes

0-10

300

10-20

500

20-30

400

30-40

500

40-60

300

5. A continuacin se presenta el nmero de pacientes que son atendidos por dia en el


consultorio de un doctor
10

13

11

10

16

18

12

13

20

10

17

10

16

14

18

Obtener su promedio, moda y mediana

6. Una distribucin estadstica viene dada por la siguiente tabla:

fi

10, 15)

15, 20)

20, 25)

25, 30)

30, 35)

Hallar el promedio, moda y mediana

95

C.- INGENIERIA:
1. En una investigacin agrcola en el Valle de Chancay se determin la produccin total en
(kilogramos), de un cierto cultivo, el cual fue sembrado en 20 parcelas experimentales.
Los resultados fueron:
Produccin en Kg:

40, 35, 38, 40, 41, 37, 41, 38, 20, 25, 33, 27, 25, 28, 44, 22, 29, 36

a. Construya una tabla de Distribucin de frecuencias


b. Calcular el promedio, mediana y moda

y los cuartiles 1, 2 y 3 e interpretar

correctamente

2. La

distribucin

de

establecimientos

industriales,
segn su produccin mensual (en millones
de soles), es la siguiente
Calcular:
a. El promedio de produccin
b. La produccin mediana

PRODUCCION
Menos de 5
5 a 10
10 a 25
25 a 50
50 a 100
100 a 250
250 a 500
500 a ms

ESTABLECIMIENTOS
39
19
14
12
9
4
2
1

c. La produccin ms frecuente

3. En cada uno de las sgtes. Tablas determinar las medidas descriptivas que se te pide.
Media, Mediana, moda y sus interpretaciones.
a. Cantidad en litros de insecticida que se necesita para la fumigacin de las plagas
segn por nro. de terrenos de cultivo

MEDICIONES
1.2- 2.6
2.7-4.1
4.2-5.6
5.7-7.1
7.2-8.6
TOTAL

96

fi
7
23
70
135
27

b. Sueldos en soles que se les paga a los trabadores que realizan siembra y riego
en los cultivos de Chavimochic
SUELDO fi
240-364

13

365-489

76

490-614

18

615-739

740-864

TOTAL

4. Se presenta el nro. frutos maduros hallados cada dos semanas en una huerta de cultivos.
2

Calcula el promedio de frutos, el fruto mediano. El fruto ms frecuente. e interpreta.

5. Se tiene en cuenta el nro. de sembros de arroz por valles de la costa peruana fue lo
sgte:

sembro
1
2
3
4
5
TOTAL

97

fi
3
7
10
5
10

Calcula:
a) El promedio, mediana, moda e interpreta
cada estadgrafo.
b) Realiza una grfica correspondiente de acuerdo al tipo
de variable.

6. Las temperaturas recogidas en un determinada ciudad durante el mes de Enero se


muestran en la siguiente tabla:
Temperatura en C

19

20

21

22

23

24

Nmero de das

a. Cuntos das hizo por encima de 21C? Cuntos por debajo de 23C?
b. Cuntos das hizo la temperatura mxima?
c. Calcula la media, la moda y la mediana.

7. El siguiente cuadro muestra la distribucin de la renta anual (en miles de soles) en que
incurren 50 viviendas:
18.85 21.55 24.25 26.95 29.65 32.35 35.05

Marca de
Clase
N
Viviendas

de

11

11

a) Halle e intrprete segn el enunciado la Media, mediana y moda.


b) Estime el porcentaje de viviendas con rentas superiores o iguales a 26 000 soles pero
menores que 32 000 soles.

8. Una

compaa

servicios

de

requiere
un

los

Prueba

tcnico

especializado. De los expedientes

57

55 54 52 62 55 59

80

40 62 72 46 80 40

Puntaje
obtenido por A
presentados, se han seleccionado
Puntaje
2 candidatos: A y B, los cuales
obtenido por B
renen los requisitos mnimos requeridos.

Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7
pruebas a cada uno de ellos.
a. Halle e interprete la media, mediana y moda de los dos candidatos.
b. Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su
respuesta

98

D.- EDUCACION:
1. Se realiza una estadstica en dos centros de enseanza, uno pblico y otro privado,
referente a la nota global del bachillerato de cada uno de los alumnos que van a acudir a
los exmenes de selectividad. Las distribuciones de frecuencias son las siguientes:
Centro privado
Nota global de Frecuencias
cada alumno.

Centro pblico

Nota global de
Frecuencias
cada alumno.
250

5,5

10

6.5

15

7.5

20

8.5

30

9.5

15

150
100
20

Se pide:
a. A la vista de la tabla, te sugiere algn comentario de especial importancia. Cul
es el motivo de que los datos se presente en dos tablas de diferente tipo?
b. Estudiar las diferentes medidas de tendencia central (promedios) en las dos
distribuciones. En cada distribucin cul te parece ms representativo? por
qu?
c. Indique cual es la nota mediana de cada grupo.

2. En las sgte. Tabla, se presenta la sgte.

NIVEL DE GASTO ()

N DE JVENES

Informacin y se pide calcular la Media

0-5

aritmtica, mediana y moda.

5-10

11

Tenemos la siguiente informacin sobre

10-15

16

el gasto semanal en ocio de un grupo de

15-20

22

estudiantes universitarios.

20-25

25-30

99

3. Hemos pasado una prueba de actitud a 200 aspirantes al ingreso en la Escuela de


Psicologa. Para cada aspirante hemos anotado el nmero de preguntas acertadas, y con
ellas hemos elaborado la distribucin de frecuencias que presentamos en la tabla nro. 1.
Dibuje una representacin grfica de las frecuencias absolutas. Calcule el promedio de
notas, la mediana de y la moda e intrprete correctamente cada estadgrafo.
Tabla nro. 1.
Preguntas Acertadas

Frecuencia absoluta

21-25

16

26-30

20

31-35

30

36-40

42

41-45

22

46-50

29

51-55

23

56-60

18

4. Se muestra la frecuencia de la cantidad de bolas metidas en 2 horas por Eduardo y sus


amigos.
(Li - Ls) fi
10-20
20-30
30-40
40 - 50
50-60

Se pide calcular la
mediana, moda y media.

2
3
5
8
12

5. Dada las edades de 20 seoritas del ciclo anual.


15

17

19

20

18

18

19

17

16

17

20

15

20

18

15

15

16

17

15

17

Calcular el promedio, mediana, moda

100

6. Se tiene que:
A

Se pide determinar el promedio, mediana y moda.

7. Dada la distribucin de frecuencias de cierto nmero de alumnos:


Edades 20

22

24

26

28

fi

Determinar el promedio aritmtico entre la mediana y la media.

8. La siguiente tabla refleja las calificaciones de 30 alumnos en un examen de Matemticas:


nota

10

N alumnos

a. Cuntos alumnos aprobaron? Cuntos alumnos sacaron como mximo un


7?Cuntos sacaron como mnimo un 6?
b. Calcular la nota media, la moda y la mediana

101

SEGUNDA UNIDAD

102

Sesin 8 y 9
Regresin Lineal Simple
Correlacin
CAPACIDADES
1. Establece el tipo de relacin entre variables cuantitativas utilizando diagramas de

dispersin.
2. Calcula e interpreta los coeficientes de la ecuacin de regresin lineal simple.
3. Construye relaciones funcionales lineales simples y realiza predicciones
4. Calcula e interpreta el coeficiente de correlacin.
5. Calcula e interpreta el coeficiente de determinacin para regresin simple..

ACTITUDES
1.

Valora la importancia que tiene el anlisis estadstico de asociacin de variables


en general y especficamente en la investigacin cientfica.

2.

Asume una actitud reflexiva, crtica y creativa al aplicar los mtodos y tcnicas
Estadsticas de regresin y correlacin al anlisis de relaciones de causa-efecto

CONTENIDO
Regresin Lineal Simple. Diagrama de Dispersin. Correlacin. Coeficiente de
Correlacin de Pearson. Coeficiente de Determinacin. Interpretaciones.

103

Con frecuencia, las variables que constituyen una distribucin bidimensional muestran un
cierto grado de dependencia entre ellas. Un ejemplo de esta relacin aparece en la relacin
de peso y altura: aunque no existe una ley causal que relacione ambas variables, en
trminos estadsticos se aprecia una dependencia entre ellas (cuando aumenta la altura,
suele hacerlo tambin el peso). Esta dependencia se refleja en la nube de puntos que
representa a la distribucin, de modo que los puntos de esta grfica aparecen condensados
en algunas zonas.

En tales casos, se pretende definir una ecuacin de regresin que sirva para relacionar las
dos variables de la distribucin. La representacin grfica de esta ecuacin recibe el nombre
de lnea de regresin, y puede adoptar diversas formas: lineal, parablica, cbica,
hiperblica, exponencial, etc.

Anlisis de regresin

Propsito: determinar la ecuacin de regresin; se usa para predecir el valor de la


variable dependiente (Y) basado en la variable independiente (X).

Procedimiento: seleccionar una muestra de la poblacin y enumerar los datos por


pares para cada observacin; dibujar un diagrama de dispersin para visualizar la
relacin; determinar la ecuacin de regresin.

La ecuacin de regresin: Y= a + bX, donde:


o

Y es el valor promedio pronosticado de Y para cualquier valor de X.

a es la intercepcin en Y, o el valor estimado de Y cuando X = 0

b es la pendiente de la recta, o cambio promedio en Y por cada cambio de


una unidad en X:

104

REGRESIN LINEAL
Cuando la lnea de regresin se asemeja a una recta (regresin lineal), puede ajustarse a
esta forma geomtrica por medio de un mtodo general conocido como mtodo de los
mnimos cuadrados. La recta de ajuste tendr por ecuacin:

= 0 + 1
Vamos a llamar a X: VARIABLE INDEPENDIENTE o EXPLICATIVA, y a la otra la
llamaremos Y: VARIABLE DEPENDIENTE o EXPLICADA.
Donde los coeficientes 0 y 1 se calculan teniendo en cuenta que:

La recta debe pasar por el punto (

La separacin de los puntos de la grfica de dispersin con respecto a la recta de

).

regresin debe ser mnima.

CLCULO DE LOS COEFICIENTES 0 y 1:


(,)

1 Clculo de 1:

2 Clculo de 0:

()

Donde:

= =1 :

Media Aritmtica de Y.

= =1 :

105

Media Aritmtica de X.

CORRELACIN (r)
El coeficiente de correlacin (r) mide el grado de relacin lineal (intensidad) de la relacin
entre dos variables cuantitativas. El coeficiente r puede tomar valores entre -1.00 y 1.00.
Bsicamente, esta informacin se refiere a dos caractersticas de la relacin lineal: la
direccin o sentido y la cercana o fuerza.

Correlacin
nula

Correlacin
perfecta
negativa

-1

0
Fuerte
Negativa

Dbil
Negativa

Dbil
Positiva

Correlacin
perfecta
Positiva

Fuerte
Positiva

Es importante notar que el uso del coeficiente de correlacin slo tiene sentido si la
relacin a analizar es del tipo lineal. Si sta no fuera no lineal, el coeficiente de
correlacin slo indicara la ausencia de una relacin lineal ms no la ausencia
de relacin alguna.

El coeficiente de correlacin se expresa como:

(, )
=

( )( )

Donde:
= =1
= =1 2
= =1 2

106

(
=1 )(=1 )

Suma Cruzada de X e Y.

(
=1 )

Suma de Cuadrados de X.

Suma de Cuadrados de Y.

(
=1 )

Correlacin negativa perfecta (r=-1)

Correlacin Nula

107

Correlacin Positiva perfecta (r=1)

Correlacin Positiva Fuerte

EL COEFICIENTE DE DETERMINACION R2
El coeficiente de determinacin, r2 - la proporcin de la variacin total en la variable
dependiente Y que est explicada por o se debe a la variacin en la variable independiente
X. El coeficiente de determinacin es el cuadrado del coeficiente de correlacin, y toma
valores de 0 a 1.

El objetivo principal del anlisis de regresin es proyectar el valor de la variable dependiente


conociendo o suponiendo valores para la variable independiente. La confiabilidad de las
proyecciones est dada por la confiabilidad de la ecuacin, la cual se mide a travs del
coeficiente de determinacin y de los errores de los coeficientes de regresin.

Una vez ajustada la recta de regresin a la nube de observaciones es importante disponer


de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste
lineal es suficiente o se deben buscar modelos alternativos.

Como medida de bondad

del ajuste se utiliza el coeficiente de determinacin, definido como sigue:

108

2 % = (2 ) 100
Donde:
R: Coeficiente de Correlacin.

EJERCICIOS
Despus de haber ledo la bibliografa bsica propuesta en el punto 2.1, resuelve los
siguientes ejercicios:
1.

Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersin de puntos. Qu tipo de relacin
funcional, cree usted, se podra ajustar mejor a los datos?, Por qu?

2.

a)

X
Y

5
2

10 8 19
7 13 14

14
15

19 15 15
16 10 5

25 20
7 10

b)

X
Y

3
16

6
5
14 12

4
18

2
3
11 11

4
20

c)

X
Y

6
10

2
1
4
16 14 10

1
16

3
4
1
13 11 15

3
2
14 14

d)

X
Y

6
8

14 15 18
11 16 17

10
11

16 14 12
14 13 10

18 17
14 18

1
8

7
5

20
5

4
12

Se realiza un estudio para determinar el efecto de la reduccin de las horas de


sueo sobre la habilidad para resolver problemas sencillos. La reduccin de las
horas de sueo es de 8, 12, 16, 20 y 24 horas sin dormir. En el estudio participaron
un total de 10 individuos, con dos en cada nivel de reduccin. Despus de su
perodo especfico de reduccin de horas de sueo, cada individuo fue sometido a

109

un conjunto de problemas simples de suma, observndose el nmero de errores.


Los resultados fueron:
Nmero de errores (Y)

8, 6

6, 10

8, 14

14, 12

16, 12

Reduccin de horas de

12

16

20

24

sueo (X)
a) Grafica el diagrama de dispersin de puntos.
b) Encuentra la recta de mnimos cuadrados apropiada para estos datos.
c) En el diagrama de dispersin de puntos, grafica la recta de mnimos
cuadrados.
d) Interpreta los coeficientes de regresin.

3.

Los gastos semanales de publicidad y las ventas semanales de una empresa, en


dlares, para una muestra de diez semanas son:
Gastos
semanales de

41

54

63

54

48

46

62

61

64

71

publicidad
Ventas

1250 1380 1425

1425 1450 1300 1400 1510 1575 1650

semanales

a) Establece la recta de regresin de mnimos cuadrados que permita predecir las


ventas semanales en funcin de los gastos en publicidad.
b) Representa grficamente los puntos y la recta de mnimos cuadrados. Comenta.
c) Interpreta la pendiente de la recta de regresin.
d) Pronostica las ventas para gastos semanales de publicidad de 50 y 60 dlares.
e) Cules son los errores de estimacin cuando se predice las ventas semanales
para gastos semanales de publicidad de 61, 62 y 63 dlares respectivamente?

110

4.

Las calificaciones en un examen de estadstica y el nmero de horas de estudio


para el examen, de una muestra de doce estudiantes de una seccin, se presentan
en el siguiente cuadro.
Tiempo de
estudio
Calificacin

12

11

12

15

14

16

15

18

16

15

17

a) Halla la recta de regresin de mnimos cuadrados considerando la calificacin


en el examen como variable dependiente.
b) Interpreta la pendiente de la recta de regresin.
c) Calcula el error estndar de estimacin. Para qu se utiliza esta medida?

5.

En una empresa se tiene inters en pronosticar el tiempo, en minutos, que toma


atender a un cliente en caja (Y) y se decide utilizar como variable independiente el
monto de las compras en dlares (X). Se tom una muestra de 18 clientes y se
obtuvieron los siguientes resultados:
75.4,

x = 861, x2 = 60323, xy = 5177.3, y =

y2 = 455.86.

a) Halla la recta de regresin que mejor se ajusta a los datos e interpreta la


pendiente.
b) Grafica la recta de regresin.
c) Utiliza el grfico de la recta de regresin para realizar dos predicciones de la
variable dependiente.
d) Calcula el error de estimacin.
e) Calcula e interpreta el coeficiente de correlacin

6.

Para los puntajes de ansiedad (X) y de aptitud acadmica (Y) de diez postulantes
a un trabajo se han obtenido los siguientes resultados: x = 847, x2 = 71927,
y = 446, y2 = 20058, xy = 37615.
a) Halla la recta de regresin de mnimos cuadrados que se ajusta a estos datos.
Interpreta la pendiente.

111

b) Interpreta la pendiente de la recta de regresin.


c) Grafica la recta de regresin.
d) Calcula e interpreta el coeficiente de correlacin

7.

Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada venta
se han observado el precio de venta (X) y la cantidad vendida (Y) y se han obtenido
los siguientes resultados: x = 77.9,

y = 749,

SCx = 75.53, SCy = 7114.44 y

SCxy = - 489.89.
a) Halla la recta de regresin de mnimos cuadrados.
b) Interpreta la pendiente.
c) Pronostica la cantidad vendida para precios de venta de X=3 y x=5.
d) Calcula e interpreta el coeficiente de determinacin.

8.

Segn investigaciones, el porcentaje de desembolso por empresas manufactureras


estadounidenses en plantas y equipo que fue destinado al control de polucin
durante el periodo 19751987 fue como sigue:*
1975 1980 1981 1984 1987
9.3

4.8

4.3

3.3

4.3

*Fuente: Survey of Current Business.

a) Obtenga un modelo de regresin lineal, donde X: tiempo en aos desde 1975.


b) Grafique la ecuacin de la Recta.
c) Use el modelo calculado en (a) para estimar el porcentaje en 1985.

112

3.9.

La siguiente tabla muestra el beneficio neto, en millones de dlares, de la


empresa Disney durante los aos 1984-1992.

Beneficios estimados al $5 milln ms cercano.


Fuente: Informes de compaa/The New York Times, Dic. 1992.

a) Estime la ecuacin de la recta de mejor ajuste para estos datos.


b) Interprete el coeficiente 1.
c) Use el modelo calculado para hacer una estimacin.

9.

La siguiente tabla muestra la produccin de soja, en millones de toneladas, en la


regin Cerrados de Brasil, como funcin del rea cultivada en millones de hectreas.
rea
(Millones de hectreas)
Produccin
(Millones de toneladas)

10,1 12,1 12,9 16,2 21,0

15

25

30

40

60

*Fuente: Ministerio de Agricultura de Brasil/New York Times.

113

a) Obtenga la ecuacin de la recta de regresin lineal.


b) Interprete el coeficiente 1.
Use el modelo calculado para hacer una estimacin.

10.

Para una muestra de 20 operadores de mquinas se tienen registrados, la nota del


examen de ingreso (X) y la evaluacin de eficiencia laboral (Y). A partir de estos
datos se han obtenido los siguientes coeficientes para la recta de regresin de
mnimos cuadrados: 0 = 28.64 y 1 = 1.01.
a) Escribe la recta de regresin e interpretar 1 .
b) Estima el puntaje promedio de evaluacin de eficiencia laboral para los
operadores que obtuvieron 75 puntos en el examen de ingreso.
c) Grafica la recta de regresin.

11.

La siguiente informacin corresponde a calificaciones obtenidas por 10 estudiantes


en un examen de Estadstica y su calificacin final promedio.

Calificacin
en examen

14

18 16

12

10

15

17

11

08

12

12

14 15

10

11

12

12

11

10

11

Calificacin
promedio

a) Grafica el diagrama de dispersin. Comentar


b) Halla la recta de regresin de mnimos cuadrados. Interpretar la pendiente.
c) Calcula el coeficiente de correlacin lineal. Interpreta.
d) Calcula el coeficiente de determinacin. Interpreta.

114

12.

En un estudio con 15 observaciones mensuales, un analista financiero quiere


determinar la relacin de la tasa porcentual de rendimiento (Y) de las acciones de
una empresa sobre la tasa porcentual de rendimiento (X) de un ndice burstil.
Dispone de la siguiente informacin:
x = 33.8, y = 33.5, xy = 79.22, x2 = 80.34, y2 = 79.45

a) Estima la regresin lineal de Y sobre X. Realiza una prediccin.


b) Calcula el coeficiente de correlacin lineal. Interpreta.
c) Calcula el coeficiente de determinacin. Interpreta.

13.

Un vendedor de bienes desea establecer la relacin entre el nmero de semanas


que las casas estn en el mercado antes de venderse y el precio que por ellas se
pide. La informacin es la siguiente:

Semana

6.2

6.7

7.5

8.5 11.5

9.5

12.2

9.8

25

82

100

95

110

130

135

Precio
(miles)

120

a) Grafica la dispersin de puntos.


b) Halla la ecuacin de regresin de Y sobre X. Interpreta la pendiente.
c) Realiza dos predicciones.
d) Calcula e interpreta el coeficiente de determinacin.
e) Calcula el error estndar de estimacin.

115

14.

La siguiente tabla y grfica muestran el consumo mensual de energa en funcin del


rea del domicilio:
rea

119,8 125,4 136,6 148,8 158,9 170,9 183,9 207,2 223,0 272,2

(m2)
Consumo
(kw-hrs)

1180 1170 1260 1490 1570 1710 1800 1840 1960 1950

a) Establezca la recta de regresin de mnimos cuadrados que permita predecir el


consumo de energa en funcin del rea del domicilio.
b) Represente grficamente los puntos y la recta de mnimos cuadrados. Comenta al
respecto.
c) Interprete la pendiente de la recta de regresin.
d) Calcule e interprete el Coeficiente de Correlacin R.
e) Calcule e interprete el Coeficiente de Determinacin R2.

15.

En el servicio central de turismo del pas se ha observado que el nmero de plazas


hoteleras ocupadas es diferente segn sea el precio de la habitacin. Sobre el total
de plazas ocupadas en un ao se tiene:
Precio

260

650

1000 1400 2100 2500 2700 3300 4000

(US$./noche)
N Habitac

4725 2610 1872

943

750

700

700

580

500

Ocupadas
a) Representa grficamente para comprobar que existe cierta dependencia lineal
entre las variables.
b) Halle la ecuacin de la recta de regresin del precio sobre el nmero de
habitaciones.
c) Cuntas habitaciones se llenaran a US$1500?

116

16.

El volumen de ahorro y la renta del sector familias en billones de pesos, para el


perodo 77-86 fueron:
Ao

77

78

79

80

81

82

83

84

85

86

Ahorro

1.9

1.8

2.0

2.1

1.9

2.0

2.2

2.3

2.7

3.0

Renta

20.5

20.8

21.2

21.7

22.1

22.3

22.2

22.6

23.1

23.5

a) Encuentre la recta de regresin considerando el ahorro como variable


independiente.
b) Encuentre la recta de regresin considerando la renta como variable
independiente
c) Para el ao 87 se supone una renta de 24.1 billones de pesos. Cul ser el
ahorro esperado para el ao 87?

17.

La tabla presenta datos ficticios para un estudio de adolescentes en riesgo de


desarrollar obesidad.
N

de

rpidas

comidas 2

72,6

82,6

74,8

67,6 62,1

consumidas

la ltima semana
Peso (Kg.)

50,8 59,4 77,6

a) Trace un diagrama de dispersin del

peso regresionado a partir del nmero de

comidas rpidas consumidas en la ltima semana.


b) Calcule el coeficiente de correlacin R de Pearson para estas dos variables, as
como la ecuacin de regresin = 0 + 1 .

117

18.

La tabla siguiente contiene la edad (X) y la mxima de la presin sangunea (Y) de


un grupo de 10 mujeres:

Edad
Presin

56

42

72

36

63

47

55

49

38

42

14,8

12,6

15,9

11,8

14,9

13,0

15,1

14,2

11,4

14,1

a) Determine la recta de regresin de Y sobre X, justificando la adecuacin de un


modelo lineal.
b) Interprete la pendiente.
c) Mida la bondad del modelo.
d) Realice las siguientes predicciones, slo si tienen sentido:
Presin sangunea de una mujer de 51 aos.
Presin sangunea de una nia de 10 aos.
Presin sangunea de un hombre de 54 aos.

19.

El crecimiento de los nios desde la infancia a la adolescencia generalmente sigue


un patrn lineal. Se calcul una recta de regresin mediante el mtodo de mnimos
cuadrados con datos de alturas de nias norteamericanas de 4 a 9 aos y el
resultado fue: 0 = 80 y 1 = 6. La variable dependiente Y es la altura (en cm.) y X
es la edad (en aos).
a) Interprete los valores estimados del intercepto y de la pendiente.
b) Cul ser la altura predicha de una nia de 8 aos.
c) Cul ser la altura predicha de una mujer de 25 aos. Comente el resultado.

En 1991 se public un trabajo Diseando plantas en climas difciles en la revista

20.

Field Crops Research, los datos usados en la investigacin son:


Duracin

92

92

96

100

102

102

106 106

121

143

Rendimiento

1,7

2,3

1,9

2,0

1,5

1,7

1,6

1,0

0,3

1,8

Con X = la duracin de la cosecha de porotos de soya en das, Y = rendimiento


de la cosecha en toneladas por hectrea.

118

a) Estime la recta de regresin mediante el mtodo de mnimos cuadrados.


Interprete los estimadores en el contexto de la pregunta
b) Existe una relacin lineal significativa entre la duracin y el rendimiento de la
cosecha?
c) Estime el rendimiento si la duracin de la cosecha fue de 104 das.

21.

Un investigador cree que la inteligencia de los nios, medida a travs del


coeficiente intelectual (CI en puntos), depende del nmero de hermanos. Toma una
muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados
aparecen en la tabla adjunta.
CI

110 115 120 118 110 108 105 104 98 99 99 100 90 93 90

N Hmos

a) Encuentre e interprete el coeficiente de correlacin R.


b) D la ecuacin de la recta de regresin. Interprete los estimadores en el contexto
de la pregunta.
Existe una relacin lineal significativa entre el nmero de hermanos y el
coeficiente intelectual?

22.

Se desea saber si existe alguna relacin entre la ingestin y la absorcin de grasas


en lactantes desnutridos. Se realizan 20 determinaciones de ingestin y absorcin
cuyos resultados se muestran en la tabla que sigue:
INGESTIN Y ABSORCIN DE GRASAS EN 20 LACTANTES
DESNUTRIDOS
Caso N

119

Ingestin

Absorcin

Caso N

Ingestin

Absorcin

1,4

0,7

11

2,0

1,4

1,6

1,2

12

1,4

1,1

2,1

1,6

13

1,9

1,5

1,7

1,1

14

1,8

1,3

1,8

1,3

15

1,9

1,5

2,6

2,0

16

1,6

1,4

1,5

1,2

17

1,9

1,7

2,5

1,5

18

2,1

1,7

2,7

2,4

19

1,6

1,3

10

1,8

1,5

20

1,6

1,1

a) Estime 0 y 1 mediante el mtodo de mnimos cuadrados. Interprete los


coeficientes de regresin.
b) Encuentre e interprete el coeficiente de correlacin R.
c) Existe una relacin lineal significativa entre la ingestin y la absorcin de
grasas?

23.

La siguiente tabla presenta los datos sobre el nmero de cambios de aceite al ao


(X) y el costo de la reparacin (Y), en miles de pesos, de una muestra aleatoria de 8
autos de una cierta marca y modelo.
N Cambios
de Aceite

150

150

250

200

350

200

50

125

Costo
(miles de
pesos)
a) Haga un grfico de dispersin con los datos, verifique el supuesto de linealidad.
b) Encuentre la recta de regresin de mnimos cuadrados.
c) Interprete los valores estimados del intercepto y de la pendiente.
d) Estima cul ser el costo de reparacin de un auto que ha tenido 4 cambios de
aceite.
e) Si cambia X por Y, obtendr la misma recta de regresin?
f)

120

Calcule el residuo para la primera observacin (X=3, Y=150).

24.

Para la economa espaola, disponemos de los datos anuales redondeados sobre


consumo final de los hogares a precios corrientes (Y) y renta nacional disponible
neta (X), tomados de la Contabilidad Nacional de Espaa base 1995 del INE , para
el perodo 1995-2002, ambos expresados en miles de millones de euros:
Ao

1995

1996

1997

1998

1999

2000

2001

2002

258,6

273,6

289,7

308,9

331,0

355,0

377,1

400,4

381,7

402,2

426,5

454,3

486,5

520,2

553,3

590,3

Considerando que el consumo se puede expresar como funcin lineal de la renta,


determine:
a) Los parmetros 0 y 1 de la recta de regresin.
b) El coeficiente de determinacin de dicha regresin.
c) La prediccin del valor que tomar el consumo para una renta de 650.000
millones de euros.

25.

Se supone que se puede establecer cierta relacin lineal entre las exportaciones de
un pas y la produccin interna de dicho pas. En el caso de Espaa, tenemos los
datos anuales (expresados en miles de millones de pesetas) para tales variables
correspondientes al quinquenio 2002-06 en la siguiente tabla:
Ao

Produccin

Exportaciones

2002

52,654

10,420

2003

53,972

11,841

2004

57,383

14,443

2005

61,829

16,732

2006

65,381

18,760

A partir de tal informacin, y considerando como vlida dicha relacin lineal, se pide:
a) Si la produccin para el ao 2007 fue de 2.210.610 millones de pesetas, cual
sera la prediccin de las exportaciones para este ao? Qu grado de precisin
tendra dicha prediccin?

121

b) Qu tanto por ciento de la varianza de las exportaciones no vienen explicadas


por la produccin interna, y se debe a otro tipo de variables?

26.

Un estudiante de la Escuela Universitaria de Estudios Empresariales de la


Universidad de Sevilla, para poder pagarse sus estudios, debe trabajar como
camarero en un bar de copas de su localidad. A este establecimiento, suelen acudir
todos los jvenes de la zona. Este ao, con los conocimientos aprendidos, decide
por fin estudiar la relacin existente entre la cantidad de sal de las galletas saladas
y el consumo de bebidas, ya que es costumbre dar al cliente este aperitivo cuando
pide una consumicin. Se sabe que las galletas no pueden tener una concentracin
de sal superior a 3,5 gramos por cada 1000 galletas y, por ello, decide ir variando a
partir de 1 gramo la concentracin de 0,5 en 0,5 gramos cada semana e ir anotando
el incremento en caja semanalmente, obteniendo la siguiente tabla:
Gramos de sal por

Ingresos

1000 galletas

(pesetas)

140,3

1,5

150

165

2,5

175

200

A partir de tales cifras, se quiere conocer:


a) Considera justificado el planteamiento de un modelo lineal para expresar la
relacin entre las variables?
b) Si el propietario desea unos ingresos de 160.000 pesetas, qu cantidad de sal
debera aportar por cada 1000 galletas? Si aporta el mximo permitido de sal,
cul sera el ingreso en caja? Explicar cul de las dos predicciones le merece
mayor confianza.

122

Cul sera la variacin porcentual de los ingresos cuando la cantidad de sal


aumenta en un 1% sobre el ltimo valor de la tabla? Si aumentamos en 1gr. la sal
por cada 1000 galletas, cunto variarn los ingresos?

27.

La factura mensual del gasto telefnico de una pequea empresa se ha


incrementado notablemente en los ltimos meses. Los estudios realizados por el
administrador de la misma argumentan que el mayor uso de Internet dentro de la
misma es la principal causa del mayor gasto en telfono, lo que ha hecho que se
estudie la posibilidad de acogerse a alguno de los mltiples bonos o tarifas
especiales que ofrecen las compaas, lo que hasta la fecha todava no se llev a
cabo. Las ltimas cifras mensuales no hacen sino confirmar esta relacin:
Mes

Enero

Febrero

Marzo

Abril

Mayo

Cuanta de la factura

55

100

118

120

142

200

500

700

800

1000

telefnica ()
Tiempo de conexin
(minutos)
De acuerdo con la informacin anterior, responda a las siguientes preguntas:
a) Suponiendo la existencia de una relacin de tipo lineal entre tiempo de conexin y
gasto telefnico, qu porcentaje de las variaciones en la cuanta de la factura
telefnica no podran ser explicadas linealmente por el tiempo de conexin a
Internet dentro de la compaa?
b) Cul sera la cuanta de la factura telefnica de la compaa de acuerdo a esta
relacin lineal si no se conectase a Internet en la empresa?
c) Cul sera el gasto telefnico estimado segn esta relacin lineal si el tiempo de
conexin a Internet fuera de 2000 minutos? Le parece aceptable tal prediccin?
Justifique su respuesta.
Se considera que un incremento del 20% en el tiempo de conexin a Internet
respecto al realizado en el mes de mayo conllevara a que la factura telefnica se

123

elevase de forma extraordinaria. Cul sera el incremento relativo en la misma si


ello se produjese? Justifique su respuesta.

28.

Una juguetera ha examinado la evolucin reciente de las ventas de su mueco


Qco (Y, en millones de euros) junto con los gastos de publicidad de ese mueco
(X, en millones de euros), obtenindose los siguientes resultados:
Ao

2003

2004

2005

2006

2007

2008

2009

126

135

156

156

150

150

180

20

25

30

32,5

35

32

34

A partir de esta informacin, responda a las siguientes cuestiones:


a) Se puede afirmar que al aumentar los gastos en publicidad se incrementarn las
ventas? Obtenga los parmetros del ajuste lineal que explique las ventas en
funcin de los gastos. Interprete dichos coeficientes e indique la bondad del ajuste
realizado.
b) Si para este ao 2010 aumentsemos los gastos de publicidad en un 1%, en qu
porcentaje se espera que variasen las ventas, segn el modelo lineal?

29.

Para un conjunto de personas que estn siguiendo una dieta de adelgazamiento, se


han recogido datos sobre el peso perdido desde el inicio de la misma (variable Y,
en Kg.) y el tiempo que llevan siguiendo la dieta (variable X, en semanas), los
cuales se muestran en la siguiente tabla:
Y

2,4

5,4

5,6

8,4

10,6

13,5

15

15

11

13

15

16

a) Estime el modelo lineal que explica el peso perdido en funcin del tiempo que se
lleva siguiendo la dieta e interprete los parmetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total
como suma de la explicada y la no explicada por el mismo y obtenga, a partir de
tal descomposicin, el coeficiente de determinacin.

124

c) Segn el modelo considerado, qu peso esperara perder una persona que siga
la dieta durante 2 meses (8 semanas)? Y una persona que est dispuesta a
seguir la dieta durante dos aos (108 semanas)? Qu fiabilidad le otorga a cada
una de las estimaciones anteriores?
30.

Con el objetivo de estudiar la relacin lineal entre el precio de los automviles y el


nmero de unidades vendidas, se procedi a recoger datos sobre tales magnitudes
durante el pasado mes en una determinada regin. Los resultados obtenidos fueron
los siguientes:
Precio

(miles de euros)
Cantidad
vendida por mes

7,5

10,5

12

14

16

18

20,5

23,5

27

450

425

400

350

325

300

290

280

260

200

En funcin a los datos recabados para esa regin y mes:


a) Una empresa radicada en la regin tiene previsto para el mes prximo aumentar
el precio de su modelo ms vendido en 500 . Si suponemos como vlida la
relacin lineal entre las dos variables analizadas para los datos del pasado mes,
cmo afectara este hecho a las ventas de dicho modelo?
b) Si el modelo ms caro de la tabla anterior se abaratase para el mes prximo un
3%, cmo variaran las ventas de dicho modelo?
31.

En una muestra de familias se han analizado las variables ahorro anual (Y) y renta
anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los
siguientes:
Ahorro
(Y)
Renta
(X)

125

1,9

1,8

2,0

2,1

1,9

2,0

2,2

2,3,

2,7

3,0

20,5 20,8 21,2

21,7

22,1

22,3

22,2

22,6

23,1

23,5

A partir de tales datos, se pide:


a) Obtener el modelo lineal que explica el ahorro de las familias en funcin de su
renta.
b) Qu familia aumentara en un mayor porcentaje su ahorro si su renta se viese
incrementada en un 5%, la familia que tiene la menor renta de entre todas o la
que posee la mayor renta?
c) Cul ser el incremento absoluto del ahorro cuando una familia aumente su
renta anual en 500 euros?
d) Qu porcentaje de varianza de la variable ahorro queda explicado por la variable
renta a travs del modelo lineal planteado?

REFERENCIAS BIBLIOGRFICAS
1.

VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.

2.

BERENSON LEVINE, (1996). Estadstica Bsica en Administracin. 6ta edicin.


Edit. PHH S. A. Mxico.

3.

FREUND, John y MANNING SMITH, Richard, (1999). Estadstica. 6ta edicin


Edit. Prntice Hall Hispanoamericana S.A.- Mxico.

4.

GUILFORD, J.P. y FRUCHTER, Benjamn, (1996). Estadstica Aplicada a la


Psicologa y la Educacin. Edit. Mc Graw-Hill Mxico.

5.

MILLER, Irwin y FREUND, John E.,1995. Probabilidad y Estadstica para Ingenieros


Edit. Prntice Hall Hispanoamericana S.A. Mxico.

6.

MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.

7.

WEBSTER, A. y otros, (2000). Estadstica Aplicada a los Negocios y a la Economa.


3era edicin Edit. McGraw-Hill Companies,

126

TERCERA UNIDAD

ESTADISTICA INFERENCIAL
127

Sesin 11
Introduccin a las Probabilidades:
Probabilidades
Distribucin Normal
CAPACIDADES
1.

Realiza clculos bsicos sobre probabilidades de eventos.

2.

Identifica y construye espacios muestrales para experimentos.

3.

Conoce y aplica las propiedades de probabilidad para resolver problemas.

4.

Calcula e interpreta probabilidades de sucesos con distribucin normal.

ACTITUDES
1.

Valora la importancia que tiene la probabilidad y la distribucin de probabilidad normal


y sus propiedades en la Inferencia Estadstica Clsica.

2.

Acta trabajando en equipo con responsabilidad, puntualidad y orden en la ejecucin


de las tareas y trabajos asignados, asumiendo una posicin reflexiva y crtica hacia
los resultados obtenidos.

CONTENIDO
Nociones de Probabilidad. Espacio Muestral. Probabilidad de un Evento.
Propiedades. Distribucin Normal.

128

PROBABILIDAD
DEFINICIONES PREVIAS:
1) Experimento Aleatorio (E) : es aquel fenmeno cuyos resultado depende del azar y
cumple ciertas caractersticas:
a)

El experimento se puede repetir indefinidamente bajo condiciones idnticas.

b)

Se puede describir el conjunto de todos los resultados posibles, pero no se


pueda asegurar o predecir un resultado en particular.

c)

Si se repite un nmero grande de veces debe aparecer cierta regularidad


estadstica.

2) Sucesos: un suceso de un Experimento Aleatorio (E) es cada uno de los posibles


resultados de dicho experimento que no puede descomponerse en resultados ms
simples

3) Espacio Muestral (S): Es el conjunto de todos los resultados posibles (sucesos) de un


experimento aleatorio.

A los ejemplos previos corresponden los siguientes espacios

muestrales en notacin de conjuntos:


EJEMPLO:
EXPERIMENTO ALEATORIO
1) Observar el lanzamiento de una moneda.

ESPACIO MUESTRAL (S)


E= {Cara, Sello}

Suceso 1

Suceso 2

4) Eventos (A, B, etc) Es cualquier subconjunto de resultados de un espacio muestral S.


Los siguientes son eventos asociados a los espacios muestrales previos.

129

EXPERIMENTO ALEATORIO

ESPACIO

EVENTOS

MUESTRAL (S)
A. Observar el lanzamiento de una moneda.

Cara, Sello

A1: Que salga cara


A2: Que salga sello

B. Observar el lanzamiento de un dado.

1,2,3,4,5,6

B1: Que salga par


B2: Que salga impar
B3; Que salga > 4

C. Medir la duracin de un equipo electrnico.


D. Contar el nmero de vehculos que pasan 0,1,2,4,5,.
por un cruce en lapsos de un minutos.
E. El lanzamiento de dos dados.

(1,1); (1,2); (1,3);

E1: Suma de las


caras superiores es
igual a 7
E2: La suma de las
caras superiores es
menor que 5

F. Lanzamiento de un dado y una moneda

130

(1,S); (2,S); (1,C); F1: Salga un 6 y una


cara

DEFINICIN

DE

PROBABILIDAD

SEGN

LAS

TRES

ESCUELAS

DE

PENSAMIENTO DIFERENTES: LA TEORA CLSICA, LA TEORA DE


FRECUENCIA RELATIVA Y LA TEORA SUBJETIVA
1.1. LA TEORA CLSICA.

Dada por Andrei Kolmogorov, 1903 a 1987, probabilista ruso.

Se aplica cuando todos los elementos del espacio muestral (sucesos) tienen la
misma probabilidad de ocurrir.

Sea S el espacio muestral asociado a un experimento aleatorio y sean A i S


para i 1, 2,.., n eventos.
# de resultados favorables

DEFINICIN DE PROBABILIDAD

Probabilidad de un evento =

# de resultados posibles

CLSICA

Ejemplo 1:
Se tiene el siguiente exp. Aleatorio

E: Lanzamiento de dos monedas al aire.

a) Calcule el espacio muestral?


b) Sea el evento A: salga solo una cara. Plantee el evento A, utilizando conjunto
c) Cul es la probabilidad de que salga 1 cara?
1.2. LA TEORA DE LA FRECUENCIA RELATIVA.

Se debe a Pierre Simn de Laplace, 1749 a 1827.

Supngase que repetimos n veces un experimento aleatorio, sean A un evento


asociado al experimento y al espacio S. Sean n A el nmero de veces en que
ocurren A o sea el nmero de elementos del conjunto.

Definimos la frecuencia relativa del evento A:

como

0 nA n

o sea

0 hA

131

entonces

nA
1
n

hA

nA
;
n

0 nA n

Ejemplo 1.
Se tiene informacin acerca de los cargos y el sexo del personal de cierta empresa.
Sexo

Abogado

Contador

Ingeniero

Hombres

10

Mujeres

15

TOTAL

TOTAL
Cul es la probabilidad de que al seleccionar un trabajador ste sea:
a)

Contador y sea hombre

b)

Abogado y mujer

c)

Mujer

d)

Sabiendo que el trabajador es ingeniero. Cul es la probabilidad de que sea


hombre?

e)

Sabiendo que el trabajador sea mujer. Cul es la probabilidad de que sea


abogado?

Ejemplo 2.
Localice todos los valores de probabilidad asociados a la siguiente tabla de Carrol
que ofrece informacin sobre la hipertensin y el hbito de fumar.
No

Fumadores

Fumadores

fumadores

moderados

empedernidos

20

15

15

10

Hipertensos

No hipertensos

10

30

a. Si se selecciona aleatoriamente uno de estos pacientes, encuentre la probabilidad


de que la persona sea:
a. fumadora moderada:
b. no hipertensa:
c. no hipertensa ni fumadora :

132

d. hipertensa y fumadora empedernida:


e. Sabiendo que el paciente no fuma. Cul es la probabilidad de que sea
hipertensa?
f. Sabiendo que el paciente es hipertenso. Cul es la probabilidad de que sea
fumador empedernido?

1.3. LA TEORA SUBJETIVA.


Se refiere a la posibilidad de que un evento particular ocurra, que es asignada por un
individuo basndose en la informacin que tenga disponible y en su propia experiencia
o presentimientos.
Ejemplos de probabilidad subjetiva son las apuestas en eventos atlticos o deportivos
o la estimacin del futuro de una accin.

AXIOMAS DE LA PROBABILIDAD
1)

0 P A i 1
P(Ai) 0

2)

P(S ) P( Ai) 1

0.5

Sin probabilidad
De ocurrir

Tan probable
como improbable

Certeza
de ocurrir

PROPIEDADES DE LAS PROBABILIDADES


PROPIEDAD 1:

La probabilidad de un evento imposible es cero.


En efecto A A

P A P A
Entonces

133

como

P A P P A

A excluye a

P 0

PROPIEDAD 2:

COMPLEMENTO DE UN EVENTO
Veamos:
A

= S por lo tanto P(A

Como A excluye
entonces

) = P(S)

P(A) + P( ) = 1

P( )= 1 P(A) B

PROPIEDAD 3: LEY DE LA ADICION (UNION DE DOS EVENTOS)

PROPIEDAD 4: UNION DE 3 O MAS EVENTOS

P A B C P A P B P C
P A B P A C P B C
P A B C

134

PROPIEDAD 5: PROBABILIDAD CONDICIONAL


Sean A y B dos sucesos en S. Indicaremos con P B A la probabilidad
condicional del suceso B, dado que A ha ocurrido, as:

P B A

P A B
,
P A

0 P A 1

PROPIEDAD 5: EVENTOS INDEPENDIENTES


Dos eventos son INDEPENDIENTES si el resultado de uno NO afecta al otro, es decir
Cuando

P(AB) = P(A)

P(BA) = P(B)

PROPIEDAD 6: PROBABILIDAD DE UNA INTERSECCION


De la probabilidad condicional podemos deducir que
Si A y B son independientes, entonces P(B/A) = P(B)

P(A B) = P (A). P (B)

135

P(A B) = P (A). P (B/A)

EJERCICIOS:
1.

Las probabilidades de que A, B y C resuelvan un cierto problema son 1/2, 3/5 y 2/3
respectivamente. Cul es la probabilidad de que el problema sea resuelto por lo
menos por uno de los tres?

2.

Una tabla de mortalidad muestra que las probabilidades de que A y B vivan 25 aos
ms son 0.9 y 0.8 respectivamente. Calcula la probabilidad que al final de 25 aos
ambos hayan muerto.

3.

De 300 estudiantes de educacin superior, 100 estn inscritos en ingls y 80 en


Computacin. Estas cifras de inscripcin incluyen 30

estudiantes inscritos en

ambos cursos. Cul es la probabilidad que al seleccionar un estudiante al azar,


est inscrito nicamente en ingls o en Computacin?

4.

En general, la probabilidad de que algn prospecto realice una compra cuando lo


visita un vendedor es 40%. Si un vendedor elige tres prospectos al azar de un
archivo y los visita: Cul es la probabilidad de que?:
A) Los tres prospectos realicen la compra?
B) El vendedor logre al menos dos ventas?
C) El vendedor logre al menos una venta?
D) Ningn prospecto realice la compra?

5.

La tabla de contingencias que se muestra a continuacin, presenta informacin


sobre las reacciones de los votantes con respecto a un nuevo plan de impuestos
sobre la propiedad, de acuerdo con su afiliacin partidaria.

136

CUADRO No 1: REACCION DE VOTANTES RESPECTO A UN NUEVO PLAN DE


IMPUESTOS SOBRE LA PROPIEDAD SEGUN SU AFILIACIN PARTIDARIA.
Afiliacin

Reaccin

Partidaria

A favor

Neutral

Total

Se opone

Fuente:
Datos Hipotticos
NUEVO PER
120

20

20

160

PRO PER

50

30

60

140

Otros

50

10

40

100

Total

220

60

120

400

a) Elabora la tabla de probabilidad conjunta.


b) Determina e interpreta las probabilidades marginales.
c) Si de estas 400 personas, se elige una persona al azar, cul es la probabilidad
que est a favor del plan de impuestos?
d) Si de estas 400 personas, se elige una persona al azar, cul es la probabilidad
que pertenezca a PRO PER?

6.

La probabilidad de que un individuo consuma bebidas alcohlicas y fume es de


15/50, de que consuma bebidas alcohlicas es 25/50, y de que fume es de 20/50.
Calcula las siguientes probabilidades:
a) Que fume o consuma bebidas alcohlicas.
b) Que fume, sabiendo que consume bebidas alcohlicas.
c) Son excluyentes los sucesos fumar y consumir bebidas alcohlicas?

7.

CUADRO No 2: DISTRIBUCION PORCENTUAL DE GRUPOS HEMATICOS EN LA


POBLACION DEL DISTRITO DE LA ESPERANZA.
F/T

AB

Rh +

34%

9%

4%

38%

Rh -

6%

2%

1%

6%

Fuente: Datos Hipotticos

137

De la informacin que se presenta en cuadro No 2 Resolver:


a) Cul es la probabilidad de que una persona tenga sangre tipo O?
b) Cul es la probabilidad de que una persona tenga sangre Rh-?
c) Cul es la probabilidad de que en un matrimonio ambos tengan Rhd) Cul es la probabilidad de que en un matrimonio ambos tengan tipo AB?
e) Cul es la probabilidad de que una persona tenga Rh- si tiene sangre tipo O?
f)

8.

Cul es la probabilidad de que una persona tenga sangre tipo B si tiene Rh+?

Los tiempos de reemplazo de los televisores tiene una distribucin normal con una
media de 8.2 aos y una desviacin Standard de 1.1 aos. Determina la
probabilidad que un televisor seleccionado al azar tenga un tiempo de reemplazo de
menos de 7 aos.

9.

Las duraciones de los embarazos tienen una distribucin normal con una media de
268 das y una desviacin estndar de 15 das. Si estipulamos que un beb es
prematuro si nace al menos tres semanas antes de lo debido. Qu porcentaje de
bebs nacen prematuramente?

10.

Los puntajes de cociente intelectual (IQ) estn distribuidos normalmente con una
media de 100 y una desviacin estndar de 15. MENSA es una organizacin para
personas con cociente intelectual elevado, y slo acepta personas con un IQ mayor
de 131.5.
a) Si se escoge aleatoriamente a una persona, determina la probabilidad de que
satisfaga el requisito de MENSA.
b) En una regin representativa con 75 000 habitantes, cuntos son elegibles
para MENSA?

138

11.

El Cuerpo de Infantes de la Marina de EEUU requiere que los hombres tengan


estaturas entre 1.60 y 1.95 m. Determina el porcentaje de hombres que satisfacen
ese requisito de estatura, sabiendo que la Encuesta Nacional de Salud de ese pas
revela que las estaturas de los estadounidenses de sexo masculino tienen una
distribucin normal con una media de 1.725 m y una desviacin estndar de 0.07
m.

12.

Los niveles de colesterol en el suero de hombres con edades entre 18 y 24 aos


estn distribuidos normalmente con una media de 178.1 y una desviacin estndar
de 40.7. Todas las cifras estn dadas en mg/100 ml, y los datos se basan en la
Encuesta Nacional de Salud de EEUU. El nivel de colesterol en el suero se
considera demasiado alto si est en el 7% superior, encuentre la cantidad de
mg/100 ml para los niveles excesivamente altos.

13.

Se recolect informacin sobre el peso del recin nacido y si la madre fum o no


durante el embarazo. Los datos se presentan a continuacin:
CUADRO No 3: DISTRIBUCION DE LOS RECIEN NACIDOS DE ACUERDO A SU
PESO SEGN LA CONDICION DE FUMAR DE LA MADRE
CONDICIN
DE FUMADORA

PESO R.N.
BAJO
NORMAL

TOTAL

SI

30

10

40

NO

20

140

160

TOTAL

50

150

200

FUENTE: DATOS HIPOTETICOS


A. Cul es la probabilidad que el recin nacido tenga bajo peso?
B. Cul es la probabilidad que una gestante fume?
C. Cul es la probabilidad que el nio seleccionado tenga un peso normal?

139

VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES


DE PROBABABILIDADES
VARIABLE ALEATORIA:
Es una funcin que asigna un valor numrico a cada suceso o resultado de un espacio
muestral. Es una variable cuyo valor numrico est determinado por el resultado del
experimento aleatorio

Las variables aleatorias se le denota con letras maysculas X, Y,Z; y su valores se


denotan con letras minsculas x, y, z

Las Variables aleatorias se clasifican en dos tipos: DISCRETAS y CONTINUAS


o

VARIABLE ALEATORIA DISCRETA: Cuando puede tomar un numero finito o


infinito, pero enumerable de posibles valores

VARIABLE ALEATORIA CONTINUA: Cuando puede tomar un nmero


infinito (no enumerable) de valores

CARACTERISTICAS DE LAS VARIABLES:


VA. DISCRETA
MEDIA O
PROMEDIO

() = ( )

() =
=1

TIPO DE
GRAFICOS

140

() = ( )

=1

VARIANZA

VA. CONTINUA

( ())2 ( )

( ())2 ( )
() =

DISTRIBUCIONES DE PROBABILIDAD
Son modelos que describen la forma en que se espera que varen los resultados o probable
valores de una variable aleatoria.

Debido a que estas distribuciones tratan sobre expectativas de que algo suceda,
resulta ser modelos muy tiles para hacer inferencias y para tomar decisiones en
condiciones donde hay incertidumbre

Las distribuciones de probabilidad son esencialmente modelos grficos que


relacionan los diversos probables valores que puede tomar una variable aleatoria

Tradicionalmente se clasifican en dos grandes familias:


o

Distribuciones Parmetricas

Distribuciones No Parmetricas

Muchos de los acontecimientos cotidianos, pueden ser asimilados a funciones probabilsticas


tericas, que son de gran ayuda en la toma de decisiones bajo condiciones de incertidumbre.
Eminentes estudiosos de la estadstica han planteado modelos probabilsticos que han
contribuido al desarrollo de la ciencia. Veamos algunos de ellos:
DISCRETAS

141

CONTINUAS

Distribucin Binomial

Distribucin Normal

Distribucin Poisson

Distribucin Normal Estandar

Distribucin Geomtrica

Distribucin t - Student

Distribucin Hipergeometrica

Distribucin F - Senedector

PRINCIPALES CARACTERISTICAS DE UNA DISTRIBUCION DE PROBABILIDAD

Una distribucin se caracteriza, en general, por medio de tres criterios:


a.- El valor central o medida de posicin (la media, la mediana o la moda).
b.- Una cantidad que expresa el grado de dispersin (la desviacin estndar).
c.- La forma de la curva, es decir la forma general de la distribucin probabilstica

142

LA DISTRIBUCIN NORMAL O GAUSSIANA


La distribucin normal, llamada tambin Curva de Gauss (en recuerdo al cientfico Karl
Gauss (1777 1855) que lo descubri), es la distribucin de probabilidad ms importancia
en la Estadstica y por ende del Clculo de Probabilidades.
Esta distribucin de probabilidad es importante porque las variables aleatorias continuas
(peso, edad, talla, produccin, gasto en publicidad, temperatura, ventas, PBI, ganancias,
etc.) que son variables que ms se evalan en una investigacin cientfica o investigacin
de mercados se aproximan a esta distribucin de probabilidad.
Tambin es importante porque se utiliza como aproximacin de las distribuciones discretas
tales como: la Binomial, la Poisson, etc.
Se puede reconocer por su forma acampanada

143

CARACTERSTICAS
1. Tiene como parmetros a y
2. Su funcin de probabilidad est dada por:

f ( x)

1
e
2

1 X

, X

3. El rea total bajo la curva normal es igual a 1


4. El promedio puede tomar valores entre y + mientras que > 0, entonces existen
infinitas curvas normales.
5. En la distribucin normal, la mayora de las probabilidades se centra en la zona central
6. Cada distribucin normal es especificada por su media y su desviacin estndar .

144

X ~ N (, 2)

7.

Esta funcin de probabilidad es asinttica con respecto al eje X, (a pesar de tener


recorrido infinito, la curva nunca toca el eje X); adems es unimodal y es simtrica con
respecto a la media .

8. El rea bajo esta funcin o curva es 1 100%, de la misma manera se sabe que las
reas comprendidas bajo la curva normal son :
1.

= 68.3%

2. 2 = 95.5%
3. 3 = 99%

-3

-2 -1

LA DISTRIBUCIN NORMAL ESTNDAR

145

1 2z
f(Z z) N 0, 1
e
2

1.

Es una distribucin Normal a la cual se le ha modificado la escala original; esta


modificacin se ha logrado restando la media al valor de la variable original y
dividiendo este resultado por , la nueva variable se denota por Z y recibe el nombre de
variable estandarizada

2.

La modificacin de la escala ha permitido elaborar una tabla para el clculo de las


probabilidades; si esto no hubiera sido posible, sera necesario construir una tabla para
cada valor de y .
1

f ( z)
3. La funcin de densidad de la variable estandarizada es:

1
2

4. El promedio (valor esperado) y la varianza de Z son: E(Z) = 0 , V(Z) = 1

5. Notacin:
Si X es v.a. continua distribuida normalmente con media y varianza 2, la denotamos
por: X N ( , 2).

146

Aplicando esta notacin a la variable normal estandarizada Z, escribimos:


ZN (0, 1), esto se interpreta como, Z tiene distribucin normal con media 0 y varianza
1.

6. La superficie bajo la curva normal Z estandarizada tambin es igual a 1. Por


consiguiente, las probabilidades pueden representarse como reas bajo la curva normal
escandalizada entre dos valores.

7. Debido a que la distribucin normal es simtrica muchas de las tablas disponibles


contienen solo probabilidades para valores positivos de Z.

USO DE TABLA: Si se conoce el comportamiento de una variable es decir se sabe que


tienen una distribucin normal, para calcular las diferentes probabilidades se tiene que
estandarizar la variable. Una vez estandarizada la variable, recin utilizar la tabla de la
distribucin normal estandarizada o tabla Z.
FORMULAS:

P( x a) P(

b.

P( x a) 1 P( x a) 1 P(

c.

a.

) P( Z
x

P ( a x b) P ( x b) P ( x a ) P ( Z

) 1 P( Z

) P( Z

EJERCICIOS:
1. Determinar la probabilidad de cada una de las siguientes expresiones:

147

a) P ( Z < 1.25 )

b) P ( Z< -2.28)

c) P (Z < 0 )

d) P ( 0 < Z < 2.5 )

e) P ( -2.38 < Z < 0 )

f) P ( - 2.25 < Z < 2.25 )

g) P (1.55 < Z < 2.35)

h ) P ( Z > 2.43 )

2. En una poblacin normalmente distribuida con media = 30 y variancia igual a 25 se


pregunta: Qu porcentaje del total de las observaciones estarn entre 20 y 35?

3. Se sabe que el peso medio de la poblacin de un grupo de estudiantes es igual a 60 Kg.,


y su desviacin estndar es igual a 3 kg. Halle la probabilidad de que el peso de un
alumno este entre 55 y 65 Kg?

4. El peso de los atletas de pruebas de medio fondo sigue una distribucin normal con media
64,3 kilos y desviacin tpica 2,3 kilos. Hallar un intervalo centrado alrededor de la media
que contenga:
a) El 68,3% de la poblacin.
b) El 95,5% de la poblacin.
c) El 99,7% de la poblacin

5. El rendimiento acadmico de los estudiantes de la UPN, tiene una distribucin normal con
media igual a 16 y varianza igual a 4. Si se selecciona un estudiante de esta Universidad,
encuentre la probabilidad de que:
a. El rendimiento sea mayor que 16
b. El rendimiento sea menor que 14
c. El rendimiento este entre 14 y 18
d. El rendimiento este entre 15.5 y 16.5

148

6. Los salarios mensuales de los trabajadores de una empresa tiene un comportamiento


normal cuya media es S/. 2100 y una desviacin estndar de S/. 450. Cuantos
trabajadores tienen salarios:
a. Menores de S/. 2150.
b. Menos de S/. 2200.
c. Mas de S/. 2180.
d. Entre 2080 y 2150 soles.
7. El tiempo de duracin de los focos de alumbrado elctrico producidos por una compaa
elctrica tiene una distribucin normal con una media de 1000 horas y una desviacin
estndar de 750 horas. Determinar la probabilidad de que:
a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento
b. Un foco se que queme entre 980 y 1120 horas de funcionamiento.
c. Un foco dure ms de 998 horas

8. NEUMA Per, es una empresa que produce llantas para automviles en nuestro pas. La
vida til de estas llantas se distribuye aproximadamente como una normal con media y
desviacin estndar iguales a 32000 y 1000 millas respectivamente. Esta empresa quiere
exportar estas llantas por lo que empieza a hacer ciertos clculos acerca de la calidad de
estas llantas, para lo cual se hace las siguientes preguntas:
a. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til
de 31900 millas.
b. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til
desde 31000 y 33000 millas.
c. Si la empresa fija una garanta de 30000 millas. Qu porcentaje de esta produccin
necesitar ser reemplazada?

9. El peso de los estudiantes de la escuela de Ing. Industrial de la UPN, tienen una


distribucin normal que tiene una media de 60 Kgs. y una desviacin estndar de 18 kgs.
Calcular la probabilidad de que un estudiante pese entre:
a. Entre 58 y 65 Kgs.

149

b. Menos de 71 Kgs.
c. Ms de 69 Kgs.

10. El tiempo requerido para realizar una pregunta de examen es una variable aleatoria cuya
distribucin es aproximadamente normal con media 12.9 minutos y una desviacin
estndar de 2.0 minutos. Cules son la probabilidades de que un alumno resuelva una
pregunta del examen en:
a. Al menos 11.5 minutos.
b. Entre 11.0 y 14.8 minutos.
c. A lo mas 12 minutos
d. Entre 10 y 13 minutos.

ACTIVIDAD DE AUTO EVALUACIN:


Antes de continuar con los ltimos temas, es conveniente que te autoevales,
desarrollando las preguntas en forma individual. Luego coteja tus respuestas con la
teora estudiada:

1.

Supone que el administrador de un gran condominio de departamentos elabora los


estimados subjetivos de probabilidad sobre la cantidad de departamentos que
estarn vacos el prximo mes:
Vacantes
0
1
2
3
4
5

150

Probabilidad
0.05
0.15
0.35
0.25
0.10
0.10

Determina la probabilidad de cada uno de los siguientes sucesos:

2.

a)

No hay departamentos vacos.

b)

Cuando menos hay 4 departamentos vacos.

c)

Hay 2 o menos departamentos vacos.

El gerente de una tienda de decoracin vende de 0 a 4 jarrones de porcelana cada


semana. En base a su experiencia, se asigna probabilidades de vender los
jarrones: P(0) = 0.08, P(1) = 0.18, P(2) = 0.32, P(3) = 0.30, P(4) = 0.12.
a)

Son vlidas estas asignaciones de probabilidad? Por qu?

b)

Sea A el evento en el cual se venden 2 o menos en una semana. Determina


P(A).

c)

Sea B el evento en el cual se venden 4 o ms en una semana. Determina P


(B).

3.

CUADRO No 3: DISTRIBUCION DE ALUMNOS DE LA UCV SEGN EL NUMERO


DE ACTIVIDADES EXTRACURRICULARES QUE PARTICIPA.
NUMERO de Actividades
NUMERO de ALUMNOS
Fuente: Datos Hipotticos

0
8

1
20

2
12

3
6

4
3

5
1

RESOLVER:
a)

Sea A el evento en que un alumno participa al menos en una actividad.


Determina P(A).

b)

Sea B el evento en que un alumno participa en 3 o ms actividades. Determina


P(B).

c)

Cul es la probabilidad de que un alumno participe exactamente en 2


actividades?

151

4.

Durante el invierno en Huancayo, el Sr. Llajaruna tiene problemas para arrancar sus
dos automviles La probabilidad que el primero arranque es 0.80 y la probabilidad que
el segundo arranque es 0.40, tambin hay una probabilidad de 0.30 de que arranquen
ambos:
a)

Define los eventos que intervienen y emplea notacin de probabilidades para


mostrar la informacin anterior.

b)

Cul es la probabilidad que al menos un automvil arranque?

c)

Cul es la probabilidad de que el Sr. Llajaruna no pueda arrancar uno de los


dos automviles?

5.

Se ha ajustado el proceso de fabricacin de un tornillo de precisin de manera que


la longitud promedio de los tornillos sea 13 cm. Por supuesto, no todos los tornillos
tienen un longitud exacta, debido a fuentes aleatorias de variabilidad que generan
una variacin de 0.1 cm aprox. Si se sabe que la distribucin de las longitudes tiene
una forma normal, determina la probabilidad de que un tornillo elegido al azar tenga
una longitud entre 13.2 y 13.4 cm.

6.

Se sabe que el tiempo til de un componente elctrico tiene una distribucin normal
con media 2000 horas y desviacin estndar 200 horas.
a)

Calcula la probabilidad de que un componente elegido al azar dure ms de


1950 horas.

b)

A qu cantidad de horas corresponde el 10% superior de la duracin de los


componentes?

7.

El tiempo que se requiere para reparar cierto tipo de transmisin automotriz en un


taller mecnico tiene distribucin normal con media 45 min. y desviacin estndar 8
min. El gerente de servicio planea hacer que se inicie la reparacin de la
transmisin de los automviles de los clientes diez minutos despus de que se
recibe el vehculo, y le dice al cliente que el automvil estar listo en una hora.
A) Cul es la probabilidad de que el gerente est equivocado?

152

B) Qu asignacin de tiempo de trabajo se requiere para que haya una


probabilidad del 75% de que la reparacin de las transmisiones se lleve a
cabo dentro de ese tiempo?

REFERENCIAS BIBLIOGRFICAS:

1.

VILA ACOSTA, R., (2001). Estadstica Elemental. Estudios y Ediciones RA- Lima
Per.

2.

BERENSON LEVINE, (1996). Estadstica Bsica en Administracin. 6ta edicin.


Edit. PHH S. A. Mxico.

3.

KAZMIER, Leonard y DAZ MATA, Alfredo, 1991. Estadstica aplicada a la


Administracin y Economa, Segunda Edicin Editorial Mc Graw Hill Mxico.

153

4.

MILLER, Irwin y FREUND, John E., 1995. Probabilidad y Estadstica para


Ingenieros Edit. Prentice Hall Hispanoamericana S.A. Mxico.

5.

MOYA, Rufino, (1991). Estadstica Descriptiva. 1era edicin Editorial San MarcosLima- Per.

6.

TRIOLA, Mario F., (2000). Estadstica Elemental, Sptima Edicin Editorial


Addison Wesley Longman Mxico.

7.

WEBSTER, A. y otros, (2000). Estadstica Aplicada a los Negocios y a la Economa.


3era edicin Edit. McGraw-Hill Companies, Inc. Santa Fe de Bogot- Colombia.

154

NOCIONES DE ESTADISTICA
INFERENCIAL
155

Sesin 12
Nociones de Estadstica Inferencial:
Prueba de Hiptesis
CAPACIDADES
6. Posee nociones sobre el procedimiento para probar hiptesis estadsticas.
7. Plantea hiptesis en sus investigaciones.
8. Realiza pruebas de hiptesis estadsticas paramtricas bsicas: para una media, dos

medias, una proporcin y dos proporciones poblacionales.


9. Realiza la prueba de hiptesis estadstica: Ji cuadrada.

ACTITUDES
1.

Valora la importancia que tiene el mtodo estadstico para la contrastacin de hiptesis


en la investigacin cientfica.

2.

Asume una actitud analtica al conocer y aplicar a su carrera profesional la docimasia


de hiptesis.

CONTENIDO
1.

Nociones de Estadstica Inferencial. Prueba de Hiptesis. Prueba de Hiptesis sobre


la Media y la Proporcin Poblacional. Uso de la Tabla de la Distribucin T Student.

2.

Prueba de Hiptesis sobre Comparacin de Medias y de Proporciones.

3.

Prueba de Hiptesis sobre Relacin entre Variables Cualitativas. Uso de la Tabla de


la Distribucin Ji Cuadrada.

156

Inferencia
Estadistica
Muestreo

Distribuc.
Muestrales

Estimacion

Prueba de
Hipotesis

Puntual

157

Intervalo

Una
Poblacion

Dos
poblaciones

ESTADISTICA INFERENCIAL
La inferencia estadstica o estadstica inferencial es una parte de la Estadstica que
comprende los mtodos y procedimientos para deducir propiedades (hacer inferencias) de
una poblacin, a partir de una pequea parte de la misma.

El objetivo de la estadstica inferencial es obtener la informacin acerca de una poblacin,


partiendo de la informacin que contiene una muestra.

El proceso que se sigue para

seleccionar una muestra se denomina Muestreo.

Las ventajas que nos brinde el muestreo son:


-

Los operativos son menores.

Posibilita analizar un mayor nmero de variables.

Permite controlar las variables en estudio.

ESTIMACION ESTADISTICA:
Es el conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una
poblacin a partir de los datos proporcionados por una muestra.

Por ejemplo, una estimacin de la media de una determinada caracterstica de una


poblacin de tamao N podra ser la media de esa misma caracterstica para una
muestra de tamao n

La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene
distintos mtodos que se usan en funcin de las caractersticas y propsitos del
estudio:

158

Estimacin puntual

Estimacin por intervalos.

Estimacin bayesiana.

Estimacin Puntual: Consiste en la estimacin del valor del parmetro mediante un slo
valor, obtenido de una muestra. Por ejemplo, si se pretende estimar la talla media de un
determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin
puntual la talla media de los individuos.
Estimacin por Intervalos
Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro
estimado con una cierta probabilidad. Para calcular la estimacin por intervalo o Intervalo de
confianza (IC), en primer lugar se procede a:

Seleccionar

el nivel

de

confianza (grado de fiabilidad en el intervalo), 1- y

nivel de error.

Un nivel de confianza del 95%, implica que 95% de todas las muestras incluye al
parmetro y solo un 5% de las muestras producir un intervalo errneo.

Cuanto mayor es el nivel de confianza se estima que el valor del parmetro este
dentro del intervalo.

ESTIMACIN PARA LA MEDIA POBLACIONAL.


Sabemos que:

Pero tambin

X-

Como no conocemos el parmetro y lo queremos estimar por medio de la media de


la muestra, slo se despejar de la formula anterior, quedando lo siguiente

Para muestras mayores a 30

Para muestras menores que 30

159

X 1-/2

X t (n- 1;1- /2)

s
n

Donde S la desviacin estndar de la muestra y t es la distribucin de la t de


Student con n 1 grados de libertad y nivel de confianza igual a 1 - /2 .

Para el caso de tamaos de muestra grande se puede utilizar una estimacin


puntual de la desviacin estndar, es decir igualar la desviacin estndar de la
muestra a la de la poblacin (s= ).

El error de estimacin

de ser la diferencia absoluta entre x y , es decir

despejando:

Error de estimacin de

- X 1-/2

Ejemplo:
1. Se encuentra que en una dieta la concentracin promedio de vitaminas a partir de
una muestra de 36 mediciones en sitios diferentes del hospital es de 2.6 gramos
por mililitro. Suponga que la desviacin estndar de la concentracin de vitaminas
es 0.3.
a) Seale la estimacin puntual para .
b) Encuentre el intervalo de confianza al 95% para la concentracin media de
vitaminas en las dietas de dicho hospital.
c) Halle el error de estimacin de para la pregunta b.
d) Encuentre el intervalo de confianza al 99% para la concentracin media de
vitaminas en las dietas de dicho hospital.
e) Halle el error de estimacin de para la pregunta d.

Solucin:
a) La estimacin puntual para es:

b) IC para la media poblacional se calcula:

160

, es decir

= 2.6 gr/ml

X 1- /2

0 .3

2.6 (1,96 )
36

Estimacin de una Proporcin


Una proporcin es una razn de una parte con respecto a un todo y que generalmente
pertenecen a un experimento aleatorio de tipo binomial, es decir con solo dos posibles
respuestas.

Sabemos que:

#

Z

p
pq
n

Como no conocemos el parmetro y lo queremos estimar por medio de la proporcin


de la muestra, slo se despejar de la formula anterior, quedando lo siguiente:

pq
p Z1 / 2 *

Error de estimacin de

= = 12

Ejemplo: Un fabricante de reproductores de discos compactos utiliza un conjunto de


pruebas amplias para evaluar la funcin elctrica de su producto. Todos los
reproductores de discos compactos deben pasar todas las pruebas antes de venderse.
Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una

161

o ms pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los


reproductores de discos compactos de la poblacin que no pasan todas las pruebas.

Para la distribucin Normal utilice la siguiente tabla:

Nivel de confianza
90%
95%
99%

162

1.645
1.96
2.576

Ejemplo 1: En poblacin cuya distribucin se desconoce se obtiene una muestra (m.a.s.) de


2000 valores de la que resulta una media de 225 y una desviacin tpica de 10. Suponiendo
que la varianza muestral coincide con la poblacional, estimar un intervalo para la media de la
poblacin con un nivel de confianza del 95%.
Tendramos 1- =0.95 luego =0.05; S=10= (muestra grande n>30); n=2000, para una
poblacin normal.

P( x Z
2

u x Z
2

) 0.95

el resultado sera : [224,56 , 225,44] con el 95 % de confianza.

Ejemplo 2: Las ventas diarias de cierta oficina comercial se supone que siguen una
distribucin normal. Para estimar el volumen medio de ventas por da se realiza una muestra
de 10 das escogidos al azar, resultando que la media de las ventas de esos 10 das es S/.
100 con una desviacin tpica de S/. 4. Dar un intervalo de estimacin para el volumen medio
de ventas por da con una confianza del 95 %.

Conocemos que segn la informacin que poseemos, estamos ante:

Distribucin

normal; n=10 (muestra pequea); S=4(poblacional desconocida); media muestral=100;


Para 1- =0.95, luego =0.05 con lo que t (9 gl ) 2.26 (segn tabla T)
2

P( x t
2

S
S
u x t
) 0.95
n
n
2

El resultado sera: [S/.96,99 ; S/.103,01] con el 95 % de confianza.

Ejemplo 3: Se quiere obtener un intervalo de confianza para el valor de las ventas medias
por hora que se producen en un kiosco. Para ello realizamos una muestra consistente en
elegir al azar las ventas que se realizaron durante 1000 horas distintas; muestra cuyos
resultados fueron: ventas medias por hora S/. 4000, y varianza de dicha muestra S2/. 4000.
Obtener dicho intervalo con un nivel de confianza del 95.5 %.

163

Queremos construir un intervalo para la media con las siguientes caractersticas:

Tamao muestral=n=1000, con muestreo aleatorio simple, la poblacin no es normal ni


conocemos su varianza.
El resultado de la muestra es x 4000 , S2=4000.

Si bien se trata de un intervalo para la media con varianza desconocida y poblacin no


normal, dado que el tamao muestral es grande podemos suponer normalidad y tomar como
varianza poblacional a la muestral as:

P( x z
2

u x z
2

) 0.95

El resultado sera: [S/.399,08 ; S/.4003,92] con el 95 % de confianza.

EJERCICIOS
Una media:
1. Una mquina llena un determinado producto en bolsas cuyo peso medio es gramos.
Suponga que la poblacin de los pesos es normal con desviacin estndar 20 gramos.
Estime mediante un intervalo de confianza del 95%, si una muestra aleatoria de 36
bolsas ha dado una media de 495 gramos
2. Se decide estimar la media del nivel de ansiedad de todos los estudiantes
preuniversitarios. Se supone que la poblacin de los puntajes de la prueba para medir la
ansiedad se distribuye normalmente con desviacin estn dar igual a 10 puntos.
3. Determinar el intervalo para con confianza del 95%, si una muestra aleatoria de
tamao 100 ha dado una media de 70 puntos.

164

4. El tiempo en, minutos que utilizan los clientes en sus distintas operaciones en un banco
local es una variable aleatoria cuya distribucin se supone normal con una desviacin
estndar de 3 minutos. Se han registrado los tiempos de las operaciones de 9 clientes
del banco resultando una media igual a 9 minutos:
a. Hallar el nivel de confianza si la estimacin de es el intervalo de 7 a 11 minutos.
b. Calcular la probabilidad de que la media de los tiempos de todas las muestras de
tamao 9 est entre 6.5 y 11.5 minutos.

1. Un fabricante afirma que el peso promedio de las latas de fruta en conserva que saca al

mercado es 19 onzas. Para verificar esta afirmacin se escogen al azar 20 latas de la


fruta y se encuentra que el peso promedio es 18.5 onzas Suponga que la poblacin de
los pesos es normal con una desviacin estndar de 2 onzas.
a. Utilizando un intervalo de confianza del 98% para , se puede aceptar la
afirmacin del fabricante?
b. Qu tamao de muestra se debe escoger para estimar si se quiere un error no
superior a 0.98 onzas con confianza del 95%?

2. Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los

nios ven televisin. Por estudios anteriores se sabe que la desviacin estndar de
dicho tiempo es de 3 horas. Con el nivel de confianza del 99%.
a. Qu tamao de muestra se debera elegir si el error de la estimacin puntual no
es superior a media hora?

3. Un fabricante produce focos cuya duracin tiene distribucin normal. Si una muestra

aleatoria de 9 focos da las siguientes vidas tiles en horas:


775,

780,

800,

795,

790,

785,

795,

780,

810

a. Estimar la duracin media de todos los focos del -fabricante mediante un intervalo
de confianza del 95%.
b. Si la media poblacional se estima en 790 horas con una confianza del 98%,
cunto es el error mximo de la estimacin si se quiere una confianza del 98%?

165

4. El ingreso mensual de cada una de las 500 microempresas de servicios de una ciudad,

es una variable aleatoria con media desconocida. Con el fin de simplificar la


recaudacin de impuestos, la Sunat ha dispuesto que a estas empresas se las grave
mensualmente con un 10% de sus ingresos. De una muestra al azar de 50
microempresas se obtuvo un ingreso mensual promedio de $1000 con una desviacin
estn dar de $80.
a. Estime el monto medio de los ingresos de las microempresas de la ciudad con un
intervalo de confianza del 95%
b. Estime el monto promedio de la recaudacin a estas microempresas con un
intervalo de confianza del 95%
c. Si el propsito de la SUNAT es lograr mensualmente una recaudacin total de al
menos $52,000 a estas microempresas, es factible que se cumplan sus metas?,
por qu?

Una proporcin:
5. En un estudio socioeconmico se tom una muestra aleatoria de 100 comerciantes

informales y se encontr entre otros datos los siguientes: un ingreso medio de $600,
una desviacin estndar de $50 y slo el 30% tienen ingresos superiores a $800.
a. Estimar la proporcin de todos los comerciantes con ingresos superiores a $800,
mediante un intervalo de confianza del 98%.
b. Si la proporcin de todos los comerciantes con ingresos superiores a $800 se
estima entre 20.06% y 39.94% qu grado de confianza se utiliz?

6. Una muestra aleatoria de 400 menores de 16 aos revela que 220 consumen licor.

a. Estimar la proporcin de menores de 16 aos que consumen licor en toda la


poblacin mediante un intervalo de confianza del 99%.

7. Un fabricante estima en 5% la proporcin de piezas defectuosos de los 5,000

producidos. Para confirmar tal estimacin primero se debe escoger una muestra
aleatoria,

166

a. cuntas piezas debe tener la muestra si se quiere tener una confianza del 95%
que el error de la estimacin no ser superior a 0.047?
b. Se escoge una muestra aleatoria del tamao calculado en a), si en ella se
encuentran 40 piezas defectuosos, mediante un intervalo de confianza del 95%,
se puede inferir que la estimacin del fabricante es coherente con la
estimacin efectuada a partir de la muestra aleatoria?

8. La oficina de planificacin familiar de cierta provincia quiere estimar el porcentaje de

familias con ms de 4 hijos.


a. Qu tamao de muestra se requiere para asegurar con una confianza del 95%
que el error de la estimacin de tal porcentaje no sea superior a 0.05?
b. Si en una muestra aleatoria de 385 familias se encuentra que 154 de ellas tienen
ms de 4 hijos. Estime el porcentaje de familias con ms de 4 hijos en toda la
provincia, mediante un intervalo de confianza del 98%.

9. Para estimar el porcentaje de todos los electores a favor de un candidato, una

encuestadora debe determinar el tamao" de la muestra aleatoria para escoger de una


poblacin de 10,000 electores, qu tan grande debera ser la muestra si se quiere
tener una confianza del 95% que el error de estimacin no sea superior al4.8%?

10. Se prob una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40

defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90,


a la verdadera fraccin de elementos defectuosos.

167

168

PRUEBA DE HIPOTESIS
las hiptesis que formulamos lo sern lgicamente sobre la poblacin. Bien afectando a
algn parmetro de sta, lo que da origen a los contrastes paramtricos o bien a otras
caractersticas de la mismas que no lo sean estrictamente, lo que origina contrates "no"
paramtricos.La solucin estadstica del problema de contrastacin se basar en los datos
muestrales y la base estadstica (probabilstica) de la que arrancar el contraste, de algn
estadstico muestral.

CONCEPTOS BSICOS
a) Hiptesis: Es una respuesta a priori a un problema. Es una conjetura sobre el valor
concreto que tiene en realidad
b) Hiptesis Estadstica: Llamamos hiptesis estadstica a una suposicin que se hace
respecto a un parmetro poblacional. Las hiptesis estadsticas comprenden:
a. Hiptesis Alternativa: Es la cuantificacin de la hiptesis cientfica; es la que
nos interesa probar. Se denota por Ha.
b. Hiptesis Nula: Es la hiptesis que se desea contrastar. Es el supuesto
contrario de la hiptesis alternativa. Se denota por Ho. Esta hiptesis se
formula con el solo propsito de rechazarla o anularla, motivo por el cual,
recibe el nombre de hiptesis nula.
c) Estadstico De Prueba: Es un valor, determinado a partir de la informacin
muestral, que se utiliza para aceptar o rechazar la hiptesis nula.
d) Nivel de Significacin: Despus de plantear la hiptesis nula y la alternativa, el
siguiente paso es definir el nivel de significacin. Este es la probabilidad de rechazar
la hiptesis nula cuando en realidad es verdadera.

169

Decisin posible

Ho Verdadera

Ho Falsa

DECISIN CORRECTA

ERROR TIPO II

=(1-

Aceptar Ho

Nivel de Confianza o Evidencia


Estadstica
ERROR TIPO I

DECISIN CORRECTA

(1-

Rechazar Ho

Poder Estadstico

Si la hiptesis nula (H0) es cierta y nuestra decisin es no rechazarla, la decisin ha


sido correcta.

Si la hiptesis nula (H0) es cierta y nuestra decisin es rechazarla, la decisin provoca


un error. Dicho error se denomina error tipo I.

Si la hiptesis nula (H0) es falsa y nuestra decisin es no rechazarla, la decisin


provoca un error. Dicho error se denomina error tipo II.

Si la hiptesis nula (H0) es falsa y nuestra decisin es rechazarla, la decisin ha sido


correcta.

Pasos a Seguir para Realizar una Prueba de Hiptesis


1 Plantear la hiptesis estadstica Ho y Ha.
2 Fijar el nivel de significancia .
3 Elegir la distribucin de probabilidad. Z o t
4 Establecer las regiones de aceptacin y rechazo de la hiptesis nula.
5 Encontrar el valor experimental. Reemplazando los valores muestrales obtenidos
en la distribucin propuesta en el punto nmero 3.
6 Observar si el valor experimental pertenecen a la RA/RR de Ho y decidir si se
acepta o no la hiptesis nula.
7 Concluir.

170

Estadsticos de Prueba: (z o t)
Estadsticos de Prueba para la Media de una Poblacin
Caso I: Para muestra grande (n30) y cuando te dan la varianza poblacional.

Caso II: Para muestra pequea (n<30):

Estadsticos de Prueba para la Proporcin de una Poblacin


Sea p la proporcin muestral y p0 la proporcin poblacional.

Estadsticos de Prueba para la Media de Dos Poblaciones


Caso I: Muestras Grandes
Para muestra grande (n30) y cuando te dan las varianzas poblacionales:


)
(

+

O con las varianzas muestrales como estimadores de las varianzas poblacionales:

171


)
(

+

Caso II: Muestras Pequeas


Para muestras pequeas (n<30) y varianzas poblacionales desconocidas:

( + )

( ) + ( )

Caso III: t-Student


Cuando se supone que las varianzas poblacionales son iguales (muestras homogneas):


) ( )
(

( + )

( ) + ( )
=
+

Caso IV: t-Student-Welch


Cuando se supone que las varianzas poblacionales son diferentes (muestras heterogneas):

(1 2 )
2 2
1+ 2
1 2

donde

2
2
2
2
1
[ + ]
1 2
2
2
2
2
1
2
[ ]
[ ]
1
2
+
1 1 2 1

Caso V: Diferencia Pareada


Cuando se obtienen dos mediciones repetidas de un mismo artculo o sujeto. En
consecuencia se trabajara con la diferencia de este par de datos

172

Estadsticos de Prueba para Diferencia de Proporciones

[ + ]

+
+

= ( )

Regiones de Aceptacin y Rechazo de la Hiptesis Nula

173

EJERCICIOS
1. Al estudiar si conviene tener o no una sucursal en la ciudad de Trujillo, la gerencia
de una gran tienda comercial de Lima, establece el siguiente criterio para tomar una
decisin: Abrir la sucursal slo si el ingreso promedio familiar mensual en dicha
ciudad es no menos de $ 500 y no abrirla en caso contrario. Si una muestra
aleatoria de 100 ingresos familiares de esa ciudad ha dado una media de $ 480.
Cul es la decisin a tomar al nivel de significancia del5%?, Se sabe que la
distribucin de los ingresos tiene una desviacin estndar poblacional es igual a $
80.
2. El gerente de ventas de una compaa afirma que sus vendedores venden
semanalmente en promedio $ 1500. Al nivel de significacin del 1% pruebe la
hiptesis del gerente versus la hiptesis del presidente de los vendedores que
afirma que el promedio de las ventas semanales es mayor, si una muestra de 36
vendedores ha dado una media igual a $ 1510. se sabe que la varianza semanal es
de $ 900.

3. En un estudio de control de calidad de automviles, se considera un parmetro de


evaluacin si arranca en menos de 3 minutos. Para lo cual se ha tomado 10 autos
de la misma marca para estudiar el tiempo de arranque encontrndose los
siguientes resultados (en segundos): 2.84, 2.86, 3.06, 2.94, 2.94, 2.82, 3.02, 3.14
,3.42, 3.16. Probar si los automviles cumplen con este parmetro de calidad.
Verificar Ho: = 3 frente a H1: < 3, utilizando =0.05 A qu conclusin llegara
usted?
4. Segn Roper Starch, el 62% de las Mujeres en el grupo de 40 a 49 aos de edad
ahorra en una cuenta individual para el retiro. Si quisiramos poner a prueba si este
porcentaje es igual para las mujeres de este grupo de edad que viven en Nueva
York y seleccionramos una muestra aleatoria de 300 neoyorquinas con estas
condiciones y 195 de ellas ahorra en una cuenta individual, Cules seran las
hiptesis nula y alternativa? La prueba seria de z o t? Por qu?

174

5. Se ha dicho que no ms de 5% de las unidades que salen de una lnea de montaje


estn defectuosas, Formule una hiptesis nula y una alternativa para esta situacin.
La prueba ser de una o dos colas? Por qu?. Si la prueba es de una cola,
Sera de cola izquierda o de cola derecha? Por qu?
6. Una encuesta realizada por Bancomer a 35 clientes indic que un poco ms del 74
por ciento tenan un ingreso familiar de ms de $200,000 al ao. Si esto es cierto,
el banco desarrollar un paquete especial de servicios para este grupo. La
administracin quiere determinar si el porcentaje verdadero es mayor del 60 por
ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los
resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron
ingresos de $200,000 o ms al ao.
7. Un muestreo aleatorio de 24 artculos en un supermercado presenta una diferencia
entre el valor marcado del artculo y el valor real de ste. La media y la desviacin
estndar de las diferencias entre el precio marcado y el real en los 24 artculos son
$37.14 y $6.42 respectivamente. Con un nivel de significancia de 0.05 pruebe que
la diferencia media

entre

el

valor

marcado y el real por artculo en ese

supermercado no es mayor de $40.0.


8. Un fabricante de cereales afirma que el peso promedio de cada caja de cereal es
de 500 gramos. Los datos que a continuacin se le dan apoyan la afirmacin del
fabricante? Pruebe con = .10.
506, 508, 499, 503, 504, 510, 497, 512,
514, 505, 493, 496, 506, 502, 509, 496

9. Para determinar el rendimiento anual

de

ciertos

valores,

un

grupo

de

inversionistas tom una muestra de n =10 de esta clase de valores. La media y


desviacin estndar resultaron: X = 8.71% y S = 2.1%. Existe evidencia para
decir que el verdadero rendimiento anual promedio es igual o mayor 8.5%? con
=0.10.

175

10. El presidente del PRI en 1988, basado en su experiencia, sostiene que un 95% de
los votos para las elecciones presidenciales han sido a favor de su partido. Los
partidos de oposicin levantaron una muestra de 1100 electores y encontraron que
un 87% de ellos votara por el PRI. El presidente del PRI quiere probar la hiptesis,
con un nivel de significacin de 0.05, que el 95% de los votos son para su partido.

11. Se afirma que, de todas las familias que salen de Cumana por lo menos el 30 % se
mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los
registros de la Alcalda de Cumana revela que de

los permisos de mudanza

autorizados 153 fueron para Maracaibo, pruebe la hiptesis nula p = 0.30 contra la
hiptesis alternativa p < 30 con un nivel de significancia del 1 %.
12. Un fabricante de semiconductores produce controladores que se emplean en el
sistema elctrico de vehculos. El cliente requiere que la proporcin

de

controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre


estas caractersticas del proceso de fabricacin con este nivel de calidad, con un
nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra
aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. El
fabricante puede demostrar al cliente la calidad exigida? Saque sus conclusiones.
13. Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Malboro.
Despus de una campaa publicitaria del cigarrillo Malboro, se entrevistaron a 200
fumadores para determinar la eficiencia de la campaa publicitaria. El resultado de
la muestra realizada detecto un total de 26 personas que

fumaban Malboro.

Pueden considerarse que esos datos presentan evidencia suficiente para indicar
que hubo un aumento en la aceptacin del cigarrillo Malboro. Obtenga las
conclusiones del planteamiento desarrollando un contraste de hiptesis con un
nivel de significancia del 5 %.
14.

176

15. Probemos la hiptesis de que el porcentaje de microempresas cuyos patrones son


hombres captado por la ENAMIN es distinto de 88%.

SEXO DEL PATRON

Valid

Frequency
Hombre
1634
Mujer
314
Total
1948

Valid
Percent
83.9
16.1
100.0

Percent
83.9
16.1
100.0

Cumulative
Percent
83.9
100.0

16. La administracin de las tiendas Oxxo cree, sobre la base de una investigacin,
que el porcentaje de hombres que visitan sus tiendas 9 o ms veces al mes
(clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo.
La informacin proporcionada es:

nH 45 nM 71
PH 0.58 PM 0.42
PH PM 0.58 0.42 0.16
17. Un fabricante est por decidir entre continuar con el mtodo actual o usar un nuevo
mtodo de montaje de un producto. Cambiar el mtodo actual si, hay prueba que
evidencia que el nuevo mtodo usa menos tiempo. A fin de tomar una decisin, se
seleccion una muestra aleatoria de 10 operarios expertos y se registro el tiempo
de montajes, en minutos, que utiliz cada operario con ambos mtodos. Los datos
se resumen en la siguientes tabla:

177

Operador

10

M. Actual

10

12

13

13

14

14

15

16

M. Nuevo

11

10

11

15

12

13

12

Diferencia

-1

-1

Con los resultados de esta muestra y al 5% de significancia. Cree usted que el


fabricante cambiar el mtodo de montaje del producto??

18. El inversionista desea comparar los riesgos asociados con dos diferentes
mercados, A y B. El riesgo de un mercado dado se mide por la variacin en los
cambios diarios de precios. El inversionista piensa que el riesgo asociado con el
mercado B es mayor que el del mercado A. Se obtienen muestras aleatorias de 31
cambios de precio diario de A y de 36 para el mercado B. Se obtienen los
siguientes resultados.
Medidas Estadsticas

Mercado A

Mercado B

Promedio muestral

0.3

0.4

Desviacin muestral

0.25

0.45

a) Si se supone que las muestras provienen de dos poblaciones normales e


independientes a un nivel de significancia del 5% encuentre apoyo la creencia del
inversionista?
b) Si la varianza de A es la dada cul es el mximo valor de la varianza muestral
de B con base en que no llevar el rechazo de la hiptesis nula del primer inciso?

19. Yahoo Internet Life patrocin encuestas en varias reas metropolitanas para
estimar la proporcin de adultos que usan internet en el trabajo (USA Today, 7 de
Mayo 2007). En los resultados se encontr que 40% de los adultos de Washington,
utilizan internet en el trabajo, en tanto que el 32 % de los adultos de San Francisco
utilizan internet en el trabajo. Si las muestras son de 240 y 250, respectivamente,
los resultados muestrales indican que la proporcin de adultos que usan internet
en el trabajo en Washington es mayor que la proporcin de San Francisco? Con
=0,05.

178

20. Un supervisor de calidad va a comparar las cantidades de artculos defectuosos


que procesan dos lneas de produccin A y B. El escogi dos muestras aleatorias
independientes, una de 50 de A y la otra de 60 de B, observando 8 y 6 artculos
defectuosos respectivamente. Existe alguna evidencia que indique que una de las
lneas produce una mayor proporcin de artculos defectuosos?

En Ciencias de la Salud
1. El doctor Jeffrey M. Barrett de Lakeland, en el estado de Florida, Estados Unidos,
report los datos correspondientes a 8 casos de prolapso del cordn umbilical Las
edades de las madres eran de 25, 28, 17, 26, 27, 22, 25 y 30 aos. Se pretende
saber si es posible concluir que la media de la poblacin de la que se supone fue
extrada la muestra es mayor a 20 aos. Sea =01.
2. Se hizo un estudio de una muestra de 25 expedientes de enfermos crnicos
atendidos como pacientes externos. El nmero medio de consultas por paciente fue
de 4.8 y la desviacin estndar de la muestra fue de 2. Es posible concluir a partir
de estos datos que la media de la poblacin es mayor que cuatro visitas por
paciente? Suponga que la probabilidad de cometer un error de tipo I es de .05.
Cules son los supuestos que se deben cumplir?
3. En una muestra de 49 adolescentes que se prestaron como sujetos para un estudio
inmunolgico, una variable de inters fue la prueba del' dimetro de reaccin de la
piel a un antgeno. La media de la muestra y la desviacin estndar poblacional
fueron eritema de 21 y 11 mm, respectivamente. Es posible concluir a partir de
estos datos que la media de la poblacin es menor que 30? Sea =0.05.

179

4. Nueve animales de laboratorio fueron infectados con cierta bacteria y luego


inmunosuprimidos. El nmero medio de organismos aislados posteriormente de los
tejidos de dichos animales fue de 6.5 (datos codificados) con una desviacin
estndar de 0.6 Es posible concluir a partir de estos datos que la media de la
poblacin es mayor que 6? Sea = 0.05. Qu supuestos se deben cumplir?
5. Se desea saber si es posible concluir que el consumo medio diario de caloras de la
poblacin rural de un pas en desarrollo es de menos de 2000. Una muestra de 500
individuos produjo un consumo medio de 1985. Se sabe que la

desviacin

estndar poblacional es de 210. Sea = 0.05.


6. Una encuesta de 100 hospitales de tamao similar revel un censo medio diario en
el servicio de pediatra de 27 con una desviacin estndar de 6.5. Proporcionan
estos datos suficiente evidencia para indicar que la media de la poblacin es mayor
que 25? Sea =0.05.
7. Una muestra aleatoria de 20 profesores universitarios aparentemente sanos
proporcion los siguientes valores de capacidad respiratoria mxima. Es posible
concluir que la media mxima de respiracin no es de 110 litros por minuto?
132, 33, 91, 108, 67, 169, 54, 203, 190, 133, 96,30, 187, 21,63, 166,84, 110, 157,
138
Sea = 0.01. Qu supuestos se deben cumplir?
8. En un estudio diseado para comparar un nuevo tratamiento para la migraa con el
tratamiento estndar, 78 de los 100 individuos que recibieron el tratamiento
estndar, respondieron favorablemente; de los 100 individuos que recibieron el
nuevo tratamiento, 90 de ellos respondieron satisfactoriamente. Proporcionan
estos datos evidencia suficiente que indique que el nuevo tratamiento es ms
efectivo que el estndar?

180

9. Para analizar la obesidad se obtuvieron los siguientes resultados a partir de una


muestra de hombres y otra de mujeres, entre las edades de 20 a 75 aos:
SEXO

Personas con sobrepeso

MASCULINO
150
21
FEMENINO
200
48
Es posible concluir a partir de estos datos que en las poblaciones muestreadas
existe diferencia en las proporciones de individuos con sobrepeso?

10. Un investigador de enfermera desea saber si los graduados de los programas de


enfermera a nivel bachillerato y los graduados de programas asociados de
enfermera difieren en cuanto a las calificaciones medias obtenidas en un estudio
de personalidad. Una muestra de 50 graduados de programas asociados (grupo A)
y ua maestra de 60 graduados de bachillerato (grupo B) proporcionaron las
siguientes medias y desviaciones estndar:

Muestra

Media

52.5

10.5

49.6

11.2

Con base en estos datos, qu puede concluir e! investigador? Sea = .05.


11. Una prueba diseada para medir las actitudes de las madres en cunto al trabajo
de parto y el periodo de expulsin se aplic a dos grupos de madres primerizas. La
muestra 1 (asistentes) acudieron a clases de instruccin prenatal impartidas en el
departamento de salud. La muestra 2 (ausentes) no asistieron a clases. El tamao
de las muestras, medias y desviaciones estndar de las calificaciones para las
pruebas son las siguientes:

181

Muestra

Media

15

4.75

22

3.00

s
1.0
1.5

Proporcionan estos datos la evidencia suficiente para indicar que las asistentes,
en promedio, tienen calificaciones ms que las ausentes? Sea = .05.
12. Varios investigadores desean saber si es posible concluir que dos poblaciones de
nios difieren respecto a la edad promedio en la cual pueden caminar por s solos.
Los investigadores Obtuvieron los siguientes datos (edades en meses).
Muestra de la poblacin A: 9.5, 10.5, 9.0,-9:75,10.0, 13.0, 10.0, 13.5, 10.0, 9.5,
10.0, 9.75
Muestra de la poblacin B: 12.5, 9.5, 13.5, 13.75, 12.0, 13.75, 12.5, 9.5, 12.0,
13.5, 12.0, 12.0
13. Babaian y Camps afirman que el antgeno especfico prosttico (AP), encontrado
en las clulas, ductales epiteliales de la prstata, es especfico para el tejido
prosttico y es detectable en el suero de hombres con prstata normal y en
hombres con enfermedades benignas malignas de esta glndula. Los
investigadores determinaron los valores de AEP en una muestra de 124 hombres
que se sometieron una biopsia de la prstata. Sesenta y siete hombres tenan
concentraciones elevadas de AEP (>4 ng/ml); de estos, a 46 se les diagnostic
cncer. Diez de los 57 hombres con valores de AEP 4 ng/ml tenan cncer. Con
base en estos datos, es posible concluir que, en general, los hombres con valores
elevados de AEP tienen mayor probabilidad de tener cncer de prstata? Sea
=0.01.
14. La mayora de las personas que dejan de filmar, se quejan de que al hacerlo
suben de peso. Hall y otros investigadores disearon una nueva tcnica para
prevenir que la gente suba de peso, la cual compararon contra otras condiciones
que incluan una condicin control de tratamiento estndar ideada para representar
la atencin estndar del sobrepeso inducido por dejar de fumar. Una de las
hiptesis de los investigadores era que las tasas de abstinencia de tabaco seran
mayores con la nueva tcnica que las registradas en las otras dos condiciones. De
53 individuos asignados a la nueva condicin, 11 dejaron de fumar al final de 52

182

semanas; diecinueve de los 54 individuos asignados a la condicin de control se


abstuvieron hasta el final del mismo periodo. Ofrecen estos datos suficiente
evidencia para apoyar, con un nivel de significacin de 0.05, la hiptesis de los
investigadores?
15. En un estudio para comparar los pesos promedios de nios y nias de sexto grado
en una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25
nias. Se sabe que tanto para nios como para nias los pesos siguen
una distribucin normal. El promedio de los pesos de todos los nios de sexto
grado de esa escuela es de 100 libras y su desviacin estndar es de
14.142 libras, mientras que el promedio de los pesos de todas las nias de
sexto grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247
libras. El promedio de los pesos de los nios ser ms grande que el de las
nias?

En Ingeniera
1. Se sabe que la duracin en horas, de un foco de 75 watts tiene una distribucin
aproximadamente normal, con una desviacin estndar de 25 horas. Se toma una
muestra aleatoria de 20 focos, la cual resulta tener una duracin promedio de x =
1014 horas.
Se tiene evidencia estadstica para decir que la duracin promedio de todos los
focos de 75 watts es de 51 horas? Pruebe con un nivel de significancia de 0.05.

2. Un ingeniero civil analiza la resistencia a la comprensin del concreto. La


resistencia esta distribuida aproximadamente de manera normal, con una varianza
= 1000(psi)2. Al tomar una muestra aleatoria de 12 especmenes, se tiene que x =
3250 psi.
Pruebe Ho

183

3. Despus del mantenimiento y la calibracin, una mquina para extrusin produce


tubos de aluminio con una media de dimetro exterior de 2.500 pulgadas y una
desviacin estndar de 0.027 pulgadas. Cuando la mquina funciona durante un
gran nmero de tumos de trabajo. La desviacin estndar no se altera, pero la
combinacin de desechos acumulados y el desgaste mecnico provoca que la
media del dimetro "se aleje" de las 2.500 pulgadas deseadas. En una muestra
aleatoria reciente de 34 tubos, la media del dimetro fue de 2.509 pulgadas. Con
un nivel de significancia de 0.01, La mquina parece requerir de mantenimiento y
calibracin? Determine e interprete el valor de p para la prueba.
4. Un fabricante de equipos electrnicos encontr que

media del tiempo que

necesitan los novatos para armar su nuevo probador de circuitos es de 3 horas, con
una desviacin estndar de 0.20 horas. Un consultor desarroll un nuevo
instructivo con el fin de reducir el tiempo que necesita un armador inexperto para
montar el dispositivo. En una prueba sobre la eficacia del nuevo instructivo, 15
novatos requirieron una media de 2.90 horas para completar el trabajo. Suponiendo
que la poblacin de tiempos tiene una distribucin normal, y utilizando un nivel de
significancia de 0.05. debemos concluir que el nuevo folleto es eficaz? Determine
e interprete el valor de p para la prueba.
5. En un estudio hecho para determinar el tiempo medio necesario para el montaje de
cierta pieza de una maquina, 40 trabajadores hicieron un promedio de 42.5 minutos
con una desviacin tpica de 3.8 minutos:
Los datos arrojan evidencia para decir que el tiempo promedio de montaje de
cierta pieza es mayor de 44 minutos? Utilice = .02.

6. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir
de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Suponga que la desviacin estndar de la poblacin es 0.3. Existe
suficiente evidencia estadstica para decir que la concentracin promedio de zinc es
menor de 2.9 gramos por mililitro? Utilice = .05.

184

7. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir
de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Suponga que la desviacin estndar de la poblacin es 0.3. Existe
suficiente evidencia estadstica para decir que la concentracin promedio de zinc es
menor de 2.9 gramos por mililitro? Utilice = .02.
8. En un experimento de laboratorio 50 estudiantes de ingeniera midieron por
separado el calor especifico del aluminio, obteniendo una media de 0.2210
caloras por grados centgrado y por gramo y una desviacin estndar de .0240
Los datos arrojan evidencia suficiente para decir Ho : = .2300? .Utilice un nivel
de significancia de 0.05.
9. Una muestra aleatoria simple de 50 artculos origin una media de muestra de 32 y
una desviacin estndar muestral de 6. Con un nivel de significancia 0.10 Podemos
decir que la media de la poblacin es 34?.
10. Una compaa controla su proceso de produccin en tal forma, que se pone en
bolsitas un promedio de 20 grs. de un producto qumico. El proceso se detendr
cuando el promedio no es de 20 grs. Se tom una -muestra; aleatoria de 16
observaciones y el promedio muestra! result ser 19 grs. Debe pararse el proceso
y ajustarse? La desviacin estndar poblacional es d 2 grs. Y el nivel de
significancia escogido es de 5%.
11. Un fabricante requiere fibra de algodn con una resistencia, media a la tensin de
6,50 onzas y o = 0.25. Investig un nuevo lote de fibras mediante una muestra de
16 piezas y encontr x = 6,65 onzas. Existe evidencia de que este lote es de
resistencia mayor a la requerida?
12. Las cajas de avena llenadas por un proceso automtico deben -tener un contenido
de 160 gramos en promedio. Si no es as debe detenerse la produccin para
regular la mquina. Para el control se obtuvo el peso en gramos Xi de 10 cajas
seleccionadas al azar de esa produccin y resultaron las siguientes sumas: xi =

185

1580, xi2 = 249658; al nivel de significancia de 0.01 es razonable detener la


produccin?
13. Una compaa afirma que la resistencia a la rotura de sus maletas plsticas es de
un promedio mayor a las 300 lluras. Se toma una muestra aleatoria de 9 maletines
se encuentra que el promedio de resistencia a la-rotura es:
280, 290, 292, 300,305, 295, 290, 310, 305.
Verificar la afirmacin de la compaa. Suponga que sus resistencias a la rotura
estn normalmente distribuidas =0.05

14. La empresa productora de cereales embasados para consumo directo " ENERGA"
a lanzado al mercado su nuevo producto "CRECIENDO FUERTE el cual tiene
como especificaciones un peso promedio neto de 1 kilogramo. Si un agente del
gobierno toma una muestra representativa de 8 unidades y los pesos netos fueron
los siguientes: 0.995, 0.974, 0.966, 0.9.35, 0.999, 1.06, 1.01 y 0.983 kilogramos.
Con una significacin del 5% Podra el agente ordenar se multe a la empresa
productora?
15. El productor de cierta marca de bateras para .cmara, fotogrfica dice que su
produccin tiene vida media de ms de 750. minutos. Se- prueban 20 bateras
elegidas al azar y s suministraron los siguientes resultados: 720, 759, 723, 740,
754, 725, 790, 719, 775, 700, 745, 750, 753, 730, 780, 710, 775, 728, 702, 752
Suponiendo normalidad, con estos datos podramos contrastar lo que dice el
productor, con un nivel de confianza, del 99%?

16. Una muestra aleatoria de 100 propietarios de automvil en la ciudad de Bogot


indica que los automviles recorren anualmente en promedio 25 000 kilmetros con
una desviacin estndar de 4000 kilmetros. Los datos arrojan evidencia
suficiente para decir que el verdadero recorrido promedio anual es mayor de 27000

186

kilmetros? Existe suficiente evidencia estadstica para decir que la concentracin


promedio de zinc es menor de 2.9 gramos por mililitro?
17. Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra
de piezas cuyos dimetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01, 1.03
centmetros. Con un nivel de significancia de .01. Pruebe la hiptesis de que el
dimetro promedio de piezas de esta mquina es de 1.009?
18. Una muestra aleatoria de 8 cigarrillos de una marca determinada tiene un contenido
promedio de nicotina de 2.6 miligramos y una desviacin estndar de 0.9
miligramos. Existe suficiente evidencia estadstica para decir que el contenido
promedio real de nicotina de esta marca de cigarros en particular es de 2.4
miligramos? Con = .05.
19. Se toma una muestra aleatoria de 12 agujas de tejer en un estudio de la dureza
Rockwell de la cabeza de las agujas. Se realizan las mediciones de la dureza para
cada una de las 12 piezas, de lo que se obtiene un valor promedio 48.50 con una
desviacin estndar de 1.5. Suponiendo que las mediciones estn normalmente
distribuidas, pruebe la hiptesis de que la dureza Rockwell promedio es menor
48.705. Con

= .05.

16. Un contratista ha construido un gran nmero de casas aproximadamente del


mismo tamao y del mismo precio. El contratista afirma que el valor promedio de
estas casas no excede de $35,000 dlares. Un corredor de bienes races
selecciona aleatoriamente 5 de las casas construidas recientemente por

el

contratista y averigua los precios que resultan ser: $34,500, $37,000, $36,000,
$35,000 y $35,500. Contradicen

estas cinco observaciones la afirmacin del

contratista acerca del valor promedio de sus casas?. Use

=0.05

20. Segn los datos obtenidos en una encuesta del CIS sobre poltica internacional,
realizada en febrero de 2002, el 52% de los 1202 hombres entrevistados,
manifestaba prestar bastante atencin a las noticias sobre cuestiones y
acontecimientos sucedidos en otros pases, mientras que entre las 1285 mujeres

187

entrevistadas, ese porcentaje era del 50% . Puede decirse, con un nivel de
confianza del 95% , que existen diferencias significativas entre las proporciones de
hombres y mujeres bastante atentos a ese tipo de noticias? Y si contrastamos la
hiptesis aplicando un nivel de significacin de 0,01?
21. Previo a una eleccin la senadora X contrata los servicios de la compaa Y para
fijar la contienda establecida con los electores. Ella percibe con respecto a
este punto que si tiene el 45% de los votos ser nominada de cuerdo con su
estrategia de campaa. Suponiendo que la compaa contratada selecciona
una

muestra aleatoria simple de 1600 electores

registrados.

Cul es

la

probabilidad de que la muestra pueda produc ir una proporcin de 45% ms


dado que la verdadera proporcin es del 40%?
22. Sea X1 la duracin de un lamento de wolframio en espiral simple, y X2 la duracin
usando espiral doble.Se toma una muestra de tamao 200 de ambos tipos de
lamentos tenindose unas duraciones medias de x1 = 1100 horas, y x2 = 1108
horas. Las varianzas de las duraciones de cada tipo de lamento son 2(1) = (20
horas)2 y 2(2) = (23 horas). Hay diferencias signicativas entre ambos tipos de
lamento?
23. Se quiere elegir entre dos tipos de material textil para construir sistemas de
amarre. Para ello se mide la tensin de rotura de varias cintas de prueba utilizando
dos tipos de material. Se toman 24 datos usando el material M1, obtenindose x1
= 87 (kg/mm2) y s1 = 2. Se toman adems 30 datos usando el material M2,
obtenindose x2 = 75 y s2 = 2.3. Se sabe que las tensiones de rotura se
distribuyen como una Normal. Se supondr, adems, que las varianzas de ambas
poblaciones son iguales. Contrasta, con un nivel de signicacin del 1%, que el
material M1 tiene mayor resistencia media que el M2.
21. Un nuevo programa de cmputo que se ha desarrollado para ayudar a los
analistas de sistemas a reducir el tiempo requerido para disear, desarrollar e
implementar un sistema de informacin. Para evaluar las ventajas del nuevo

188

programa se selecciona una muestra aleatoria de 24 analistas de sistemas. A cada


analista se le proporcionan especificaciones para un sistema hipottico de
informacin, y a los 12 de ellos se les pide producir el sistema usando la tecnologa
(los programas) actual. A los otros 12 se les capacita primero en el uso del nuevo
paquete y, a continuacin, se les pide usarlo para producir el sistema de
informacin.
Tiempos de terminacin y estadsticos del Estudio de Prueba del Programa.
Resultados. Diciembre 2008.
Tecnologa Actual
Nuevo Programa
de Cmputo
300
276
280
222
344
310
385
338
372
200
360
302
288
317
321
260
376
320
290
312
301
334
283
265
12
12
325
288
40
44
Fuente: Escuela de Informtica de UNMSM.

En Ciencias Sociales
1. Una muestra aleatoria de 12 alumnas graduadas de una escuela secretarial
mecanografi un promedio de 79.3 palabras por minuto con una desviacin
estndar de 7.8 palabras por minuto. Se tiene evidencia estadstica para decir
que el nmero promedio de palabras mecanografiadas por todas las graduadas de
esa escuela es menor de 80 con =0.01.

189

2. Los siguientes datos corresponden a los pesos en Kg de 15 hombres escogidos al


azar: 72, 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69. Pruebe la Ho
74 con un nivel de significancia de .05.

3. Se obtiene una muestra de 16 estudiantes con una

X 68 y una varianza de

S2 = 9 en un examen de estadstica. Hay evidencia suficiente que apoye que la


media poblacional de las calificaciones de estadstica es mayor de 70 con

0.02.

4. Un distribuidor de libros plantea la hiptesis de que las ventas por mes promedian
S/.12, 000. Diez meses seleccionados como muestra reportan una media de S/.
11,277 y una desviacin estndar de S/. 3,772. S se utiliza un valor del 5%.
Qu puede concluir acerca de la impresin que tiene el distribuidor sobre las
condiciones del negocio? Cul es el supuesto que se debe cumplir?

5. Una encuesta a 64 empleados profesionales de una institucin correccional revel


que el tiempo promedio de empleo en el campo correccional era de 5 aos: Se
sabe que la desviacin estndar de la poblacin es de 4 aos. Sirven estos datos
de soporte a la hiptesis de que el tiempo promedio de empleo de todos los
empleados de este tipo est por debajo de los 6 aos? Usar = 0.05

6. Se considera que el peso promedio de los profesores de un centro educativo se


distribuye normalmente con una media de 160 libras y la desviacin estndar de 20
libras. En una muestra aleatoria de 55 profesores, la media resulto ser de 150
libras. Probar la hiptesis nula contra la hiptesis alternativa de que el peso
promedio de los profesores ms recientes del centro educativo es diferente de 160
libras para = 0.02.

7. La estatura media de 50 estudiantes de un colegio que tomaban parte en las


pruebas atlticas fue de 68.2 pulgadas con desviacin estndar de 2.5 pulgadas,
mientras que 50 estudiantes que no mostraban inters en tal participacin tenan
una estatura media de 67.5 pulgadas con desviacin estndar de 2.8 pulgadas.

190

Ensayar la hiptesis de que los estudiantes que participan en las pruebas atlticas
son ms altos que los otros. Ensaye la hiptesis al 5%.

8.

Se ha afirmado que por lo menos el 60 % de los alumnos de primero y segundo


semestre de un Tecnolgico prefieren estudiar a partir de las dos de la madrugada.
Si 4 de una muestra de alumnos de primero y segundo semestre de n =14 tomadas
al azar, afirman estudiar a partir de las dos de la madrugada, pruebe con un nivel
de significancia del 5 % si se debe aceptar la hiptesis nula p0.60 contra la
hiptesis alternativa p<0.60.

9. Una muestra aleatoria de 10 estudiantes se someten a una prueba de clculo, y


reciben las calificaciones (X). Despus se efecta una sesin de repaso de lgebra
y se repite el mismo examen (Y). A un nivel de significancia de 0.05 las
calificaciones son mejores en el segundo examen?

Estudiantes

1
2
3
4
5
6
7
8
9
10

191

Examen
1
(X)
80
50
78
90
75
70
62
90
95
68

Examen 2
(Y)
84
56
81
92
76
75
72
87
93
72

10. Una muestra aleatoria de 8 estudiantes se someten a una prueba de estadstica, y


reciben las calificaciones (X). Despus se efecta una sesin de repaso de
Estadstica y se repite el mismo examen (Y). A un nivel de significancia de 0.01
las calificaciones son menores en el segundo examen?

Estudiantes
1
2
3
4
5
6
7
8

(X)
90
85
75
78
95
95
60
83

(Y)
82
95
79
81
88
91
50
81

11. Un epidemilogo desea comparar dos vacunas. Las personas que previamente
haba recibido dichas vacunas se dividieron en dos grupos. El grupo una recibi
una dosis de refuerzo de la vacuna tipo 2. Las respuestas de los anticuerpos se
registraron dos semanas despus. Las medias, desviaciones estndar y tamao de
las muestras para los dos grupos fueron los siguientes:

Grupo
1
2

Muestra
30
49

Media
4.5
2.5

D. Estndar
2.5
2.0

Ho: 1 = 2
Ha: 1 2
El nivel de significancia es de = 0.01

12. Elegimos aleatoriamente 23 alumnos de Psicologa y 25 de Pedagoga de la


Universidad de Sevilla, con el fin de comparar el rendimiento alcanzado en la
asignatura Anlisis de Datos. Las medias de ambos grupos son 74 y 79

192

respectivamente, y sabemos que las varianzas valen 2.9 para la poblacin de


alumnos de Psicologa y 4.2 para la poblacin de alumnos de Pedagoga.
Podemos afirmar que existen diferencias entre las medias alcanzadas por ambos
grupos? Realiza el proceso completo de decisin estadstica tomando un nivel de
significacin igual a 0.05 (alfa).

13. Se aplica un examen a dos grupos de estudiantes de 144 nios cada uno. El grupo
A que est cerca de una fbrica tuvo una puntuacin promedio de 88 con una
varianza de 27 puntos, el grupo B que est lejos de la fbrica tuvo una puntuacin
de 90 con una varianza de 24 puntos Hay diferencia significativa en el rendimiento
promedio de los dos grupos a un nivel de significancia del 5%?.

14. Como parte de un estudio para evaluar las diferencias en los niveles educativos en
2 centros de capacitacin, se aplic un examen comn que personas que asisten a
cada centro. Las calificaciones del examen son uno de los factores principales para
evaluar diferencias de calidad entre los centros.
Resultados de las Calificaciones en el examen en los Centros de adiestramiento.
Marzo 2009.
Centro de Adiestramiento A

Centro de Adiestramiento B

n1 = 30

n2 = 40

1 = 82,5

2 = 78

1 = 8

2 = 10

Fuente: Resumen Estadstico de los Centros de adiestramiento.


A la luz de estos resultados:
a) Cul de los centros de adiestramiento brinda un mejor nivel educativo? Use
un nivel de significancia del 1%.

193

b) Si los tamaos de muestra reales hubieran sido de 10 y 15 para los centros


de adiestramiento A y B, respectivamente, realice la prueba de hiptesis
adecuada.
c) Los resultados obtenidos en la parte (b) son similares a los de la parte (a)?

REFERENCIAS BIBLIOGRFICAS

1.

Daniel Wayne; 1987, Bioestadstica Base para el Anlisis de las Ciencias de la


Salud, Edit Limusa S.A. Mxico; (Pgs. 155 a 159).

2.

Freund J. y Manning R.; 1989, Estadstica 4ta edicin, Edit. Prentice Hall
Hispamericana S.A. Mxico ;(Pgs. 342 a 363).

3.

Miller I. y Freund J.; 1992, Probabilidad y Estadstica para Ingenieros, Edit. Prentice
Hall Hispanoamericana S.A. Mxico (Pgs. 220 a 232).

4.

Mills Richard; 1990, Estadstica para Economa y Administracin, Edit. Mc Graw


Hill Bogot, Colombia (Pgs. 221 a 247).

5.

Mason, , Robert y col., 2000; Estadstica para Administracin y Economa,


Editorial Alfaomega Mxico (Pgs. 358 a 359)

6.

Moya R. y Saravia G.; 1983, Teora de Probabilidades e Inferencia Estadstica,


Edit. San Marcos Lima Per; (Pgs. 637 a 662 y 682 a 692).

7.

Ostle Bernard; 1985, Estadstica Aplicada, Edit. Limusa Wiley S.A. Mxico,
(Pgs. 131 a 138 y 140 a 142).

194

Sesin 14
Prueba de hiptesis sobre relacin entre
variables cualitativas: Chi-Cuadrado
CAPACIDADES
10. Aplicar la prueba Chi Cuadrada en los trabajos de aplicacin de su especialidad
11. Realizar una prueba de hiptesis que compare un conjunto observado de frecuencias

versus una distribucin esperada


12. Realizar una prueba de hiptesis para determinar si hay alguna relacin de

dependencia o independencia entre dos criterios de clasificacin

ACTITUDES
11. Valora el uso de la Chi cuadrada para probar independencia de criterios
12. Valora el uso de la Chi cuadrada como una prueba para ajustar un conjunto de datos a

una distribucin estadstica

CONTENIDO

195

Uso de la Ji Cuadrado. Prueba de bondad de ajuste. Prueba de independencia.

INTRODUCCION

En numerosas ocasiones, se necesita analizar la relacin de dependencia o


independencia entre dos variables de tipo cualitativo o categrico.

A estas variables tambin se les denomina factores, mientras que a las distintas
categoras de la variable se les suele denominar niveles.

Existen diferentes pruebas para medir la dependencia entre dos variables


cualitativas, entre ellas la prueba ji-cuadrado en sus diferentes versiones.

PRUEBA JI-CUADRADO (X2)


La prueba de Pearson es considerada como una prueba no paramtrica que mide la
discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando
en qu medida las diferencias existentes entre ambas se deben al azar en la prueba de
hiptesis. Tambin se utiliza para probar la independencia de dos variables entre s, en una
tabla de contingencia. La frmula que da el estadstico es la siguiente:

Cuanto mayor sea el valor de 2, menos verosmil es que la hiptesis sea correcta. De la
misma forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn
ambas distribuciones.
Los grados de libertad gl vienen dados por :

196

gl= (r-1)(k-1). Donde r es el nmero de filas y k el de columnas.

La prueba ji-cuadrado de Pearson (X2) es una de las pruebas ms utilizadas.

Tambin podremos encontrarla bajo el nombre de chi-cuadrado, siendo su origen la


traduccin al castellano del trmino ingls chi-squared.

Se aplica principalmente para estudiar la asociacin entre dos variables categricas o


cualitativas y para comparar proporciones o porcentajes.

Esta prueba no mide el grado o la fuerza de la asociacin entre dos variables


categricas, para ello ya existen medidas como la odds ratio o el riesgo relativo,
adecuadas para estos fines.

Su uso no est restringido nicamente para variables dicotmicas. Si alguna de las


dos variables es de naturaleza ordinal, se debe aplicar la prueba ji-cuadrado de
tendencia lineal como veremos ms adelante.

La prueba X2 puede aplicarse con una sola variable para comparar valores
observados respecto a esperados, aunque su uso ms frecuente es para comparar
dos proporciones.

Una de sus limitaciones es que requiere un tamao muestral suficientemente grande


y aunque su clculo es sencillo, no lo es tanto el entender su procedencia y su
interpretacin.

Simplemente diremos que los valores que toma el estadstico ji-cuadrado con un
grado de libertad corresponden a los obtenidos a una distribucin normal estandar

197

elevados al cuadrado, y que por tanto la prueba ji-cuadrado solo tiene una cola
tomando nicamente valores positivos.

Ejemplo
Supongamos que realizamos un estudio en 45 pacientes en el que deseamos estudiar la
relacin entre el hbito tabquico y EPOC diagnosticado mediante espirometra obteniendo
los resultados de la Tabla I. Podemos ver que 15 pacientes de 25 (60%) tenan EPOC dentro
del grupo de fumadores, mientras que tan solo 5 de 20 (25%) presentaron EPOC en el grupo
de no fumadores. Desde un punto de vista clnico las diferencias son importantes, pero lo
sern desde un punto de vista estadstico?
Fumador
EPOC

No

Total

No

15 (75%)

10 (40%)

25 (55,6%)

5 (25%)

15 (60%)

20 (44,4%)

Total

20 (100%)

25 (100%) 45 (100%)

Tabla I. Relacin entre EPOC y hbito tabquico. Frecuencias observadas y porcentajes de


columna.

Hiptesis Nula (Ho): La proporcin de pacientes con EPOC es la misma en el grupo de


fumadores que en el de no fumadores.
Hiptesis alternativa (Ha): Las proporciones son distintas.

Si la proporcin es distinta, tenemos en cuenta las dos posibilidades que existen: que la
proporcin de pacientes con EPOC sea ms alta o ms baja en los fumadores, por lo tanto la
prueba es bilateral o tambin denominada de dos colas.
Entonces tenemos:

198

Ho :

Ha:

Si al calcular el valor X2, que es la diferencia entre lo observado y lo esperado,


sobrepasamos cierto valor crtico, diremos que las diferencias encontradas son demasiado
grandes como para poder ser explicadas por el azar.
Si en nuestro estudio tenemos 20 pacientes con EPOC de 45 personas (44%), para que la
hiptesis nula fuese cierta, tendramos que tener la misma proporcin de pacientes con
EPOC en los fumadores y en los no fumadores. Es decir, de los 25 fumadores, esperamos
tener (25*20)/45, que seran 11 fumadores aproximadamente. De este modo obtendramos
las frecuencias esperadas para el resto de las 3 celdas (Tabla II). Una vez conocidas las
frecuencias esperadas, slo nos queda calcular el valor de la expresin X2 que es una
simple suma de unas diferencias al cuadrado:

Fumador
EPOC

No

Total

No

11,1 (55,6%)

13,9 (55,6%)

25 (55,6%)

8,9 (44,4%)

11,1 (44,4%)

20 (44,4%)

Total

20

25

45

X2 = 5.51

Si miramos en las tablas de la distribucin ji-cuadrado para un grado de libertad,


podemos ver que la significacin estadstica p<=0,05, se alcanza para aquellos valores
de X2 iguales o superiores a 3,84. Como el valor obtenido en nuestro estudio; 5,51 es
mayor al valor crtico de 3,84, podemos rechazar la hiptesis nula (H0) y afirmar que las
diferencias encontradas difcilmente pueden ser explicadas por el azar, siendo mayor la
proporcin de pacientes con EPOC en los fumadores (p<0,05).

199

PRUEBA DE INDEPENDENCIA: JI-CUADRADA


EJERCICIOS

1. Estamos interesados en estudiar la relacin entre cierta enfermedad y la adiccin al


tabaco. Para tal fin, seleccionamos una muestra de 150 individuos, 100 individuos no
fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias de enfermedad
en cada grupo:
Padecen la

No padecen la

enfermedad

enfermedad

12

88

No

25

25

Fumadores

Total

Total
Emplee un nivel de confianza del 95%.

2. Estamos interesados en estudiar la fiabilidad de cierto componente informtico con


relacin al distribuidor que nos lo suministra. Para realizar esto, tomamos una
muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el
producto comprobando el nmero de defectuosos en cada lote. La siguiente tabla
muestra el nmero de defectuosos para cada uno de los distribuidores.
Distribuidor

200

Componentes

Componentes

defectuosos

correctos

16

94

24

76

Total

81

Total
Determine si existe relacin entre la cantidad de componentes defectuosos y el
distribuidor que los suministra, con un = 0,01.

3. Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se


seleccion una muestra aleatoria simple de 100 jvenes, con los siguientes
resultados:
Deportista

Sin depresin

Con depresin

38

No

31

22

Total

Total
Determinar si existe independencia entre la actividad del sujeto y su estado de nimo.
Nivel de significacin (5%).

4. Un estudio que se realiz con 81 personas referente a la relacin entre la cantidad de


violencia vista en la televisin y la edad del televidente produjo los siguientes
resultados.
Nivel de

16-34

35-55

56 a ms

Alta

12

21

Baja

18

15

Violencia

Total

Total
Indican los datos que ver violencia en la televisin depende de la edad del
televidente, a un nivel de significacin del 1%?

5. Supongamos que se quiere estudiar la posible asociacin entre el hecho de que una
gestante fume durante el embarazo y que el nio presente bajo peso al nacer. Por lo

201

tanto, se trata de ver si la probabilidad de tener bajo peso es diferente en gestantes


que fuman comparado con aquellas que no lo hacen. Para responder a esta pregunta
se realiza un estudio de seguimiento en 2000 gestantes, a las que se interroga sobre
su hbito tabquico durante la gestacin y se determina adems el peso del recin
nacido. Los resultados se muestran a continuacin:
Gestante

Bajo Peso en el Recin Nacido


S

No

Fumadora

43

207

No Fumadora

105

1645

Total

Total
Realice la prueba Ji-Cuadrada de independencia para determinar la existencia de
relacin o no, use un = 0,10.

6. En un estudio para determinar si existe relacin entre el sexo y el propsito de elegir


una carrera tcnica se entrevistaron a 120 aspirantes a la universidad. Los resultados
se observan en la siguiente tabla de contingencia:
Gnero

Aspira a Carrera Tcnica


S

No

Masculino

40

30

Femenino

10

40

Total

Total
Existe relacin entre las 2 variables presentadas? = 0,05.

7. En la frontera de una provincia del sur se revisaron cargamentos de frutas de distinta


procedencia para evaluar la posibilidad de introduccin de mosca de las frutas
(Ceratitis Capitata), una plaga de los frutales, en reas no infestadas. La informacin
de cargamentos con presencia de la plaga se resume en la siguiente tabla:
Presencia de
la Plaga

202

Regin de Procedencia del Cargamento


Total
Norte

Centro

Selva

22

32

33

No

67

10

Total
Con un nivel de significancia del 1%, existe alguna dependencia entre la regin de
procedencia y la presencia de la plaga?

8. Un grupo de investigadores, al estudiar la relacin entre el tipo sanguneo y la


severidad de una afeccin en la poblacin, reuni los datos de 1500 personas, los
cuales se presentan en la tabla de contingencia adjunta. Los investigadores desean
saber si estos datos son compatibles con la hiptesis de que el grado de la afeccin y
el tipo sanguneo son independientes.
Tipo de Sangre

Severidad de
la Condicin

AB

Ausente

543

211

90

476

Moderada

44

22

31

Severa

28

31

Total

Total

Use los resultados adjuntos para entregar una conclusin a los investigadores con un
nivel de significacin del 5%.

9. Los nios de una escuela primaria fueron clasificados en forma cruzada de acuerdo
con el grupo socioeconmico al que pertenecen y la presencia o ausencia de cierto
defecto en el lenguaje. Los resultados fueron los siguientes:
Grupo Socioeconmico

Defecto del

203

Lenguaje

Alto

Presente

Ausente

42

Medio

Medio Bajo

Bajo

24

32

27

121

138

108

Alto

Total

Total

Son compatibles estos datos con la hiptesis de que el defecto en el lenguaje est
relacionado con el grupo socioeconmico? Nivel de significacin del 2,5%.

10. Una muestra de 500 estudiantes ingresantes a una universidad particip en un


estudio diseado para evaluar el grado de conocimientos en matemticas. La
siguiente tabla muestra los estudiantes clasificados segn su formacin secundaria
(escuelas tcnicas, bachiller y otras) y el nivel de conocimientos en matemticas
(bueno=aprob el examen; deficiente=no aprob el examen):
Escuela

Nivel de Conocimientos en

Total

Matemticas
Bueno

Deficiente

Tcnicas

20

60

Bachiller

15

150

Otras

25

230

Total

Confirman estos datos que la aptitud en matemticas depende de la orientacin de


los estudios secundarios? Nivel de significacin del 1%.

11. Una medicacin nueva para tratar cierta enfermedad de vacunos se compar con la
medicacin de mayor uso. Para esto se tom al azar un grupo de 300 animales que
padecan la enfermedad; a la mitad de stos, tomados al azar, se los trat con la
nueva medicacin y a los otros 150, con la medicacin tradicional. Luego de un
tiempo se analizaron nuevamente los animales con el siguiente resultado:

Tratamiento
Nuevo

204

Resultado del Tratamiento


Empeor

Sin Efecto

Mejor

16

30

104

Total

Tradicional

20

42

88

Total
Considera que estos medicamentos se comportan de manera similar? Nivel de
significacin del 10%.

12. A un grupo de 350 adultos que participaron en una escuela de salud, se les pregunt
si llevaban o no una dieta. Las respuestas (por gnero) son las siguientes:
Gnero

Sigue una dieta?


S

No

Masculino

14

159

Femenino

25

152

Total

Total
Sugieren estos datos que el estar a dieta depende del sexo? Sea =0,05

205

Vous aimerez peut-être aussi