Académique Documents
Professionnel Documents
Culture Documents
Aprendizaje Efectivo de la
ESTADSTICA
RAEEP
Lic. Gabriel Leandro, MBA
Tabla de contenidos
Captulo 1 11
Introduccin a la estadstica 11
Estadstica 12
Estadstica descriptiva e inferencia estadstica 12
Importancia del anlisis de la informacin estadstica 13
Funciones de la estadstica 14
Conceptos bsicos de estadstica descriptiva 15
Fases de una investigacin estadstica 23
Fuentes de informacin o conocimiento 24
Mtodos e instrumentos de recoleccin de informacin 25
Escalas de medida 29
Ejercicios 33
Captulo 2 44
Presentacin de la informacin estadstica 44
Presentacin de los datos 45
Presentacin textual 45
Cuadros estadsticos 46
Construccin de cuadros 46
Representacin grfica 49
Construccin de grficos 49
Clases de grficos 51
Ejercicios 67
Captulo 3 78
Anlisis descriptivo de la informacin estadstica 78
Anlisis descriptivo de la informacin 79
Medidas de posicin 79
Medidas de posicin central 79
Cuantilos 97
Medidas de variabilidad 114
Rango o amplitud total 115
Varianza y la desviacin estndar 116
Medidas de variabilidad relativa: El coeficiente de variacin 126
Ejercicios 133
Captulo 4 148
Distribuciones de frecuencias 148
Necesidad de resumir la informacin 149
Construccin de distribuciones de frecuencias 150
Grficos de las distribuciones de frecuencias: 155
Clculo de medidas de posicin y variabilidad en distribuciones de frecuencias 159
Ejercicios 169
Captulo 5 177
Introduccin a las probabilidad 177
Probabilidad 178
Conteo 179
Captulo 6 209
Distribuciones de probabilidad de variable discreta 209
Distribuciones de probabilidad 210
Media y varianza de una distribucin de probabilidad 212
Distribucin binomial 215
Distribucin hipergeomtrica 223
Distribucin de Poisson 230
Aproximacin de la distribucin de Poisson a la binomial 235
Distribucin multinomial 237
Distribucin geomtrica 239
Ejercicios 244
Captulo 7 258
Distribuciones de probabilidad de variable continua 258
Distribuciones continuas de probabilidad 259
Distribucin normal 259
Aproximacin de la distribucin normal a la binomial 276
Distribucin exponencial 280
Ejercicios 286
Captulo 8 295
Estimacin por intervalos 295
Inferencia estadstica 296
Distribucin muestral de la media si es conocida 296
Teorema del lmite central 300
Distribucin muestral de la media con desconocida (distribucin t de Student) 301
Inferencia para la media 302
Intervalos de confianza para la media y error mximo de la estimacin 303
Inferencia para proporciones 314
Ejercicios 318
Captulo 9 329
Muestreo 329
Introduccin 330
Necesidad de trabajar con muestras 332
Muestreo estadstico y no estadstico 334
Errores de muestreo y sesgos 334
Determinacin del tamao de muestra para estimar la media poblacional 335
Determinantes del tamao de la muestra 336
Clculo del tamao de la muestra 337
Determinacin del tamao de muestra para estimar la proporcin poblacional 342
Clculo del tamao de la muestra 343
Captulo 10 370
Pruebas de hiptesis 370
Inferencia mediante pruebas de hiptesis 371
Procedimiento para pruebas de hiptesis sobre la media 377
Prueba de hiptesis con muestras pequeas 380
Prueba de hiptesis para la proporcin poblacional 382
Uso de Minitab para realizar la prueba de hiptesis y uso del valor P 384
Intervalos de confianza y prueba de hiptesis 388
Ejercicios 390
Captulo 11 404
Pruebas de hiptesis para la diferencia de dos medias poblacionales 404
Diferencia entre medias en poblaciones independientes 405
Diferencias entre medias (muestras pequeas) 411
Observaciones pareadas 416
Pruebas para la diferencia de dos proporciones: 421
Ejercicios 426
Captulo 12 441
Correlacin lineal y regresin lineal simple 441
Asociacin estadstica entre dos variables 442
Correlacin lineal 443
Correlaciones espurias y causalidad 457
Regresin lineal simple 458
Bondad de ajuste: el coeficiente de determinacin 465
Interpolacin y extrapolacin 466
Ejercicios 468
Indice 500
Prefacio
Hay muchos factores que influyen en el desempeo de un estudiante en un curso de
estadstica. Entre ellos estn la clara exposicin de los conceptos por parte del profesor, la
motivacin y empeo por parte del estudiante, los conocimientos previos del alumno,
materiales apropiados para el curso, etc. Este texto y todos los materiales digitales que lo
acompaan han sido diseados para ayudar al estudiante y al profesor en todos estos aspectos,
pues provee al profesor de materiales que puede emplear en su clase para exponer los
conceptos con claridad, presenta al estudiante materiales con ejercicios paso a paso,
aplicaciones y amplio uso de la tecnologa, de modo que pueda sentirse ms motivado al
disponer de recursos para adquirir los distintos conceptos y procedimientos, a la vez que se le
ofrece gran cantidad de ejercicios resueltos, presentaciones interactivas, videos, entre otras
ventajas.
Caractersticas didcticas
A lo largo del texto las definiciones se presentan en recuadros de modo que el estudiante
pueda efectuar un repaso posterior de estos conceptos, los cuales son de gran importancia para
comprender los ejercicios e interpretar los resultados obtenidos.
Adicionalmente cada tema incluye gran cantidad de ejemplos. Los ejemplos en el texto
impreso se presentan en cuadros que incluyen primero el planteamiento del ejercicio y su
solucin explicada paso a paso.
Al final de cada captulo se proveen muchos ejercicios. Estos ejercicios se dividen en dos
bloques. Los primeros son ejercicios de desarrollo. Los segundos son ejercicios se seleccin
nica y se les llama examen del captulo. Las soluciones de estos ejercicios se proveen a
travs de la pgina de internet del texto.
Por otro lado, cabe destacar que Recursos para el Aprendizaje Efectivo de la Estadstica y la
Probabilidad es en realidad ms que solo un libro, pues se compone de una gran cantidad de
recursos en lnea de gran utilidad tanto para el estudiante como para el profesor.
Con la factura de compra del texto cada lector podr recibir una contrasea de ingreso a la
pgina del texto www.auladeeconomia.com/raeep.html y as acceder a una gran cantidad de
Ms de 2000 diapositivas que puede ser presentadas por el profesor para impartir su
clase, o bien, empleados por el estudiante para repasar posteriormente.
Videos que explican los conceptos y que exponen el uso del software.
Ejercicios interactivos. El texto y las diapositivas contienen ms de mil ejercicios con
sus soluciones
A lo largo del texto se incluyen cuadros que indican algunos de los principales recursos
audiovisuales que pueden ser empleados por estudiantes y profesores.
En la pgina los temas estn agrupados de modo similar al que se emplea en el texto, tal como
se muestra en la imagen, donde se pueden elegir los diferentes recursos.
Adicionalmente, en cada captulo se presenta uno o varios cuadros de Aplicacin, los cuales
consisten en algunos ejemplos de aplicaciones de la estadstica en distintos mbitos, como las
ciencias econmicas, la ingeniera, las ciencias sociales y las ciencias de la salud, entre otras
reas del conocimiento humano.
En trminos generales, este material pretende ser una valiosa ayuda para estudiantes y
profesores de modo que puedan seguir un mejor proceso de enseanza aprendizaje, ya que
al disponer de gran cantidad de recursos a travs de internet ofrece una serie de ventajas que
los textos tradicionales no proveen:
Est siempre disponible. Es como tener al profesor disponible las 24 horas del da y en
cualquier lugar donde haya conexin a internet.
Es interactivo. El texto tradicional no es interactivo, pero Recursos para el Aprendizaje
Efectivo de la Estadstica y la Probabilidad es totalmente interactivo. Muestra una
explicacin paso a paso y ejercicios solucionados paso a paso. Usted da clic y el material
lo lleva a su ritmo.
Es motivador e innovador. Actualmente los jvenes emplean intensivamente las
tecnologas de informacin y la comunicacin. De hecho, la mayora de la poblacin
joven emplea internet como su principal herramienta para investigar y estudiar.
Se ajusta a distintos estilos de aprendizaje. Bien es sabido que cada persona posee
diferente modo de aprender. Algunos aprenden ms por lo que ven, otros aprenden ms
por lo que oyen, y aprendemos mucho por lo que hacemos. Recursos para el Aprendizaje
Efectivo de la Estadstica y la Probabilidad ofrece presentaciones con mltiples imgenes,
videos, herramientas tecnolgicas, entre otros recursos que ayudan al estudiante a
aprender segn su estilo de aprendizaje.
Fomenta el uso de la tecnologa. Tanto a travs del uso de software como Excel y
Minitab como por los recursos disponibles en la web se realiza un uso intensivo de las
tecnologas de la informacin y la comunicacin.
Facilita aprender haciendo. Recursos para el Aprendizaje Efectivo de la Estadstica y la
Probabilidad promueve una modalidad de estudio en la que se aprende haciendo, pues
usted puede ir desarrollando los ejercicios en su cuaderno o computadora conforme se
presentan en el material.
Expone aplicaciones diversas: Recursos para el Aprendizaje Efectivo de la Estadstica y
la Probabilidad posee ejemplos y ejercicios que se relacionan con la ingeniera, las
ciencias econmicas, las ciencias de la salud, las ciencias sociales, etc.
Por ms de 18 aos se ha desempeado como docente en diversas instituciones, entre las que
figuran la Universidad Latina de Costa Rica, la Universidad Nacional, la Universidad
Latinoamericana de Ciencia y Tecnologa, la Universidad Estatal a Distancia, la Universidad
Fidlitas y la Universidad de La Salle, entre otras, siempre obteniendo un desempeo docente
sobresaliente, por lo cual ha ganado varios reconocimientos.
Se ha desempeado por varios aos como experto en las auditoras de la Norma Nacional de
los Principios de Inversin y Administracin de Riesgos Operativos y Financieros de los
Fondos Administrados por las entidades reguladas por la Superintendencia de Pensiones.
Tambin ha sido consultor por varios aos para Soluciones Administrativas y Financieras,
S.A., en donde ha laborado en la realizacin de mltiples estudios estadsticos, como
encuestas de satisfaccin de clientes, estudios de clima organizacional, entre otros.
Agradecimientos
Muchas personas me han brindado su colaboracin en la creacin de todo este material, pero
en forma especial deseara agradecer a mis compaeros Erick Torres, Pablo Caldern, Flix
Amado y Lipcia Mungua por sus valiosos comentarios y sugerencias en el desarrollo de este
texto. Igualmente a Natalie Leitn, a doa Higinia Esquivel y don Orlando Saboro por el
apoyo que me han dado. Por otro lado a mis estimados compaeros Felipe Mass, Edgar
Chaves, Hctor Guerra, Rodolfo Mainieri y don Jorge Acua. Por supuesto a don Rodrigo
Ortiz por la gran oportunidad que me ha brindado. Por supuesto, tambin mi familia y al
Seor Jess que me ha dado la vida y toda capacidad.
1 .
Introduccin a la estadstica
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Explicar el concepto de estadstica y sus funciones principales
Reconocer la diferencia entre estadstica descriptiva e inferencial
Identificar las fases bsicas de una investigacin estadstica
Conocer las escalas de medicin de las variables estadsticas
Estadstica
Con mucha frecuencia la gente habla de estadsticas. Por ejemplo, las estadsticas sobre
accidentes en las carreteras, sobre la economa, sobre enfermedades, entre muchos temas.
Adems, es posible observar en la televisin, los peridicos, internet, libros, revistas,
boletines y otros medios distintos grficos, cuadros con datos, proyecciones, a la vez que se
habla de encuestas, realizacin de experimentos, entre otros temas relacionados con la
estadstica.
Esta definicin es particularmente til en los distintos campos de accin, en donde los
profesionales en las distintas reas diariamente tienen que tomar decisiones sobre situaciones
que comprenden tanto datos numricos como incertidumbre, en situaciones que van desde la
contratacin de personal cuyo desempeo no puede ser anticipado, el requerimiento de
materias primas para la produccin de artculos cuya demanda es incierta, las decisiones en
materia de poltica pblica cuando no se conoce la evolucin futura de las variables
econmicas y sociales, las prescripciones que un profesional de la salud puede realizar aun
cuando no tiene certeza de la reaccin del paciente ante el tratamiento, entre muchas otras
posibles situaciones.
Estos mtodos inferenciales se requieren para pronosticar las tendencias de la demanda de los
artculos (con base en perodos anteriores a las ventas) o para estimar las necesidades de
capital de trabajo (basndose en crecimientos o decrecimientos de los costos) o la necesidad
de ajuste de una mquina (analizando las tendencias de ciertas mediciones importantes) o los
porcentajes defectuosos, etc. En todos estos ejemplos existe incertidumbre puesto que no se
cuenta con la informacin completa y es mediante la inferencia estadstica que se puede
llegar a encontrar el curso de accin que facilita la toma de decisiones.
En el mbito de la ingeniera:
El control de la calidad, de la productividad, de los inventarios, etc.
Al desarrollar un proyecto urbanstico se requieren registros
demogrficos, datos sobre el abastecimiento de agua potable, etc.
Son necesarios registros del trnsito para disear el tiempo que duran
los semforos.
En la descripcin de modelos termodinmicos complejos
(termodinmica estadstica).
Al tratar de comprender la variabilidad de sistemas de medicin y el
control de procesos
Funciones de la estadstica
Se pueden establecer como las funciones bsicas de la estadstica las siguientes:
1. Recoleccin: La estadstica busca recolectar en forma adecuada la informacin. Con
este fin muchas veces se emplean cuestionarios, la observacin, experimentos y otros
tipos de instrumentos, a fin de recopilar los datos requeridos.
2. Procesamiento: Una vez que se han recopilado los datos, se desea organizarlos, lo
cual significa que hay que corregir, clasificar y tabular los datos que se obtuvieron de
la etapa anterior, para lo cual tambin es necesario hacer uso de las tcnicas
estadsticas apropiadas.
3. Presentacin: Luego es necesario presentar adecuadamente los datos. Para esto
generalmente se hace uso de cuadros estadsticos y grficos, y se calculan diferentes
tipos de medidas, como los promedios, las proporciones, varianzas, se elaboran
distribuciones de frecuencias, etc.
4. Anlisis: Esto es la aplicacin y desarrollo de modelos, establecimiento de
correlaciones, estimaciones, proyecciones, etc. El anlisis puede ser de una sola
variable en un momento dado o podra ser de series de tiempo, o sea, analizar cmo ha
evolucionado la variable a lo largo del tiempo. El anlisis podra ser de la relacin que
una variable tiene con otras variables, por ejemplo, determinar si una variable se
correlaciona con otra.
5. Interpretacin: Una vez obtenidas las distintas medidas, estos nuevos datos son
empleados para interpretar el comportamiento de las variables en estudio, para realizar
proyecciones, tomar decisiones, etc.
Dependiendo del estudio, la unidad estadstica puede ser una persona, una familia, una
empresa, un rbol, un pas, un ecosistema, etc.
1. Qu/Quin?
2. Dnde?
3. Cundo?
4. Cmo?
Realmente decir que la unidad estadstica es una persona es insuficiente, pues hay que agregar
cules son las cualidades que definen a esa unidad estadstica, por ejemplo, segn su edad, su
lugar de residencia, el periodo y cualquier otro aspecto relevante. Entonces sera mejor decir
que la unidad estadstica es un "profesional en periodismo que haya residido en la ciudad
capital del pas durante los ltimos 12 meses".
De una unidad estadstica a otra hay una serie de diferencias de inters para el investigador,
por eso la caracterstica o variable es cambiante. Por tanto, las variables son las caractersticas
de los sujetos, que debido a su variabilidad, se requiere conocer.
Tal como se ha podido observar las caractersticas o variables pueden ser variables
cuantitativas, cuando producen directamente una magnitud numrica, o bien, pueden ser
variables cualitativas, cuando no pueden cuantificarse. En este ltimo caso se recurre a una
clave o un cdigo para su proceso. Ms adelante en este captulo se ampliar con respecto a
este ltimo punto.
Cuando una variable cuantitativa se puede determinar por conteo, se dice que es una variable
discreta, como es el caso del nmero de hijos que una persona tiene, el nmero de cursos que
un estudiante universitario est realizando, el nmero de empleados de una empresa o el
nmero de artculos defectuosos obtenidos por da en un proceso de produccin, entre muchos
otros posibles ejemplos. Por otro lado, cuando la variable se obtiene por medicin, se dice que
es una variable continua. En estos casos se emplea un instrumento de medicin, tal como una
balanza, un termmetro o un cronmetro, y la unidad se expresa con unidades de medida,
tales como los gramos, grados centgrados, segundos, etc. Algunos ejemplos son el peso de
paquetes de azcar, la temperatura mxima diaria en una ciudad, tiempo de produccin de un
artculo, etc.
El investigador desea entonces conocer cules seran esas observaciones para todas las
familias del pas, y poder analizar esos datos. Ese conjunto total de observaciones constituye
su poblacin.
La poblacin bajo estudio puede ser infinita o finita. Es infinita cuando tiene un nmero
infinito de elementos, es decir, no termina. Por ejemplo, el agua que corre por un ro. Al
contrario, una poblacin finita tiene un nmero limitado de elementos. Una poblacin infinita
podra convertirse en una finita si se le establece un intervalo de tiempo. Por ejemplo, el
nmero de habitantes de una ciudad podra ser una poblacin infinita si se considera a lo largo
de todo el tiempo, pero si se considera el nmero de habitantes en un momento dado, entonces
ser una poblacin finita.
Las poblaciones pueden ser homogneas o heterogneas, segn si los valores de las
caractersticas en estudio son iguales o diferentes, respectivamente. As, la sangre que una
persona posee ser una poblacin homognea, pero los empleados de una empresa sern una
poblacin heterognea en cuanto a sus salarios, por ejemplo.
Si el investigador tuviera toda esa poblacin de datos deseara calcular algunas medidas que le
ayuden a describir el total de datos. Por ejemplo, deseara conocer parmetros como el ingreso
promedio de esa poblacin, la proporcin de familias que satisfacen todas sus necesidades
bsicas, etc.
MUESTRA Es una parte de la poblacin que se selecciona para ser estudiada, ya que
estudiar toda la poblacin es demasiado costoso, toma demasiado tiempo o es
imposible.
Dado que muchas veces es demasiado costoso o requiere demasiado tiempo obtener las
observaciones para toda la poblacin, e incluso a veces es imposible, entonces se emplea una
muestra, la que si es bien seleccionada, va a representar a la poblacin, y entonces las
conclusiones que en ella se obtengan luego podrn ser generalizadas al resto de la poblacin.
Tal como se mencion anteriormente, el investigador desea conocer el ingreso de todas y cada
una de las familias de la poblacin, pero como obtener ese datos sera demasiado costoso y
toma demasiado tiempo, entonces toma una muestra representativa y obtiene el ingreso
promedio de las familias de la muestra. Este ltimo dato es un estadstico que servir como
estimador del parmetro poblacional.
En la prctica pueden usarse dos tipos de muestra, segn el mtodo que se utilice para hacer la
seleccin de los elementos:
Si un investigador desea saber qu tan grande puede ser el error de muestreo, puede utilizar
los modelos de probabilidad apropiados para determinar su magnitud. Despus, si se quisiera
reducir ese error de muestreo, entonces puede emplear una muestra de mayor tamao.
Ahora bien, los sesgos pueden aparecer tanto en estudios por muestreo como en aquellos que
realizan un censo, o sea, que abarcan la poblacin completa. Por ejemplo, si se ha diseado un
cuestionario inadecuado, entonces habr ciertos errores que no se corregirn ni siquiera
empleando la poblacin completa. Los errores de muestreo surgen por la naturaleza aleatoria
de la muestra, mientras que los sesgos son errores sistemticos que se dan en el proceso de
investigacin.
Los sesgos son errores de naturaleza sistemtica, o sea que producen errores que se dan en el
mismo sentido. Por ejemplo, si en un estudio de satisfaccin de los usuarios de un servicio,
las encuestas se aplican en los momentos en que hay menor cantidad de usuarios y el servicio
es ms rpido, entonces los resultados tendern a dar una evaluacin del servicio mejor que la
real. Los sesgos generalmente no son cuantificables, pero deben evitarse mediante las
medidas administrativas adecuadas, que procuren que todo el proceso de recoleccin,
procesamiento y anlisis de los datos se realice del mejor modo posible.
Son muchas las posibles causas de los sesgos, pero algunos sesgos se producen por las
siguientes razones:
Solucin 1. Dado que el cuestionario solo debe ser aplicado a los puestos de
En el captulo 8 se ampliar el tema del muestreo, y por tanto los conceptos de error de
muestreo, sesgo y otros aspectos relacionados, como el tamao de muestra, la seleccin de la
muestra, etc.
datos obtenidos estarn sesgados, afectando las conclusiones que se obtengan a partir de ellos.
En la seccin 1.6 se ampla este tema.
Fuentes primarias: Es aquel documento, obra o elemento publicado o creado por una
persona o una institucin mediante el cual proporciona datos que han sido recopilados por
ella misma. Por ejemplo, en la mayora de los pases existe un instituto de estadstica que
determina datos como los niveles de desempleo, de pobreza y otras variables. Cuando se
consulta un informe de uno de estos institutos de estadstica, entonces se est consultando
una fuente primaria.
Fuentes secundarias: Es aquel documento, obra o elemento publicado o creado por una
persona o una institucin mediante el cual proporciona datos que no han sido recopilados
por ella misma. Con respecto al mismo ejemplo dado en el caso de las fuentes primarias,
si los datos del desempleo se consultan en un medio de comunicacin, como un peridico,
entonces este medio es una fuente secundaria, pues el peridico no determina el nivel de
desempleo en el pas, sino que obtiene sus datos de otra fuente (un informe del instituto de
estadstica, por ejemplo).
informacin cuando los datos requeridos no existen, y por tanto, deben ser recopilados.
Cuando los datos existen, entonces se dice que se obtienen de una fuente de informacin, tal
como se describi en la seccin anterior.
Observacin. Este mtodo consiste en que el investigador recopila los datos observando
(ya sea midiendo o contando) aquellas caractersticas que son de inters para los objetivos
de su investigacin. lo que le interesa y anotando las observaciones. Normalmente se va a
apoyar en algn instrumento de medicin y va a registrar las observaciones en un registro
apropiado.
Entrevista personal. Este mtodo se emplea principalmente en las ciencias sociales y las
ciencias econmicas. El investigador visita a las unidades de estudio, tales como
empleados de una empresa, familias de una zona, pacientes de un hospital, etc. (o a las
unidades de informacin, pues en algunos casos la unidad estadstica no puede suministrar
la informacin, tal como en el caso de un nio, por lo que la unidad de informacin podra
ser alguno de sus padres) y les plantea una serie de preguntas, las cuales se registran en un
cuestionario previamente diseado para este fin.
Entrevista telefnica. Es similar al mtodo anterior, pero la diferencia es que los
informantes son contactados por medio de una llamada telefnica. Tiende a ser ms
econmico que la entrevista personal.
Correo. En este caso tambin se emplea un cuestionario, pero se enva por correo, ya sea
correo postal o correo electrnico. El cuestionario luego se devuelve por la misma va.
Actualmente existe software que facilita la aplicacin de encuestas a travs de internet.
Tiende a ser un mtodo bastante econmico.
Registro. Si usted desea saber cuntas personas han contrado matrimonio durante el
ltimo ao o cunto ha exportado el pas durante este semestre, no va a necesitar ir a
aplicar alguno de los mtodos anteriores, ya que en la mayora de los pases existe alguna
institucin que registra dichos eventos.
Test. Es una tcnica derivada de la entrevista y la encuesta. Tiene como objeto lograr
informacin sobre rasgos definidos de la personalidad, la conducta o determinados
comportamientos y caractersticas individuales o colectivas (inteligencia, inters,
actitudes, aptitudes, rendimiento, memoria, manipulacin, etc.).
Otros mtodos pueden ser: panel, estudios de caso, estudios histricos, anlisis de
contenido, investigacin accin, investigacin participativa, entrevistas en profundidad,
grupos de discusin y los diseos noexperimentales.
De alguna manera el investigador debe garantizarse que el instrumento de medicin que est
empleando muestra lo que realmente se desea saber. En este sentido se evala la calidad de
los instrumentos de medicin considerando dos aspectos:
Aplicacin Psicometra
Posiblemente en algn momento de nuestra vida hemos realizado algn
test de personalidad o algn otro tipo de prueba psicomtrica, por ejemplo,
un test sobre nuestro estilo de aprendizaje.
Para lograr que un cuestionario sea vlido y confiable debe confeccionarse muy bien su
estructura y su contenido, es decir, el orden de las preguntas (generalmente las ms sencillas
primero), los temas o contenidos a que hacen referencia, el vocabulario que emplean
(preferiblemente palabras sencillas y claras) de modo que se eviten ambigedades, que no
sugieran las respuestas y que no influyan en los entrevistados para dar ciertas respuestas.
Otro detalle es la extensin del cuestionario, pues si es demasiado extenso las personas no van
a querer contestarlo, por lo que el investigador debe elegir preguntar aquello que es lo ms
importante y necesario para su investigacin. Finalmente, tambin es importante el formato de
las preguntas. En este sentido existen preguntas abiertas y preguntas cerradas:
Ahora bien, las encuestas sobre temas polticos muchas veces generan
importantes polmicas, pues los partidos polticos o los candidatos no
reconocen los resultados, especialmente cuando no les favorecen, e incluso
algunos aseguran que se emplean para manipular la opinin pblica e
influir sobre los resultados de las elecciones.
Escalas de medida
Se ha mencionado que las variables pueden ser cuantitativas o cualitativas, lo cual implica la
necesidad de asignarles valores numricos, y para tal fin se emplean distintos tipos de escalas,
por ejemplo, la escala nominal.
Estas se emplean, por ejemplo, al hablar del sexo de las personas, donde se podra codificar
como 1 si es masculino y 2 si es femenino. Pero puede observarse en este caso que ese 2
no es el doble del 1, ni tampoco tendra sentido realizar operaciones matemticas con esos
valores.
Esta escala nominal tambin puede usarse para procesar datos como: marcas, productos,
zonas geogrficas, etc.
Las categoras no poseen un orden natural, ya sea de mejor o peor, ni de mayor a menor,
etc. As, si 1 si es masculino y 2 si es femenino, no puede decirse que ese 2 sea
mayor o mejor que el 1.
Al emplearse en variables cualitativas, entonces no existe diferencia cuantitativa entre una
categora y otra.
No se puede realizar operaciones matemticas.
Por otro lado, las mediciones de escala ordinal indican un orden de preferencia o una
secuencia de datos. Por ejemplo, si se le preguntara a alguien evaluar un servicio como 1.
Excelente, 2. Bueno, 3. Regular y 4. Malo. Puede observarse que 2 no es la mitad de 4 y que
no tiene sentido realizar operaciones con estos nmeros.
Tal como la definicin lo indica, en la escala de intervalo las diferencias de valores son
importantes, pero el cero es un valor arbitrario. Un buen ejemplo es el caso de las
temperaturas, las cuales son medidas en grados centgrados. As una temperatura de 40 es
mayor que una de 20, pero eso no indica que 40 sea el doble de 20, ya que la temperatura 0
es arbitraria y no indica cero calor o ausencia de temperatura.
Esta es la nica medida en la que el cero es significativo, lo cual implica que los datos pueden
ser manipulados empleando cualquier operacin matemtica. Tal es el caso de variables como
tiempo, ingreso, participacin de mercado, distancia, etc.
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se formulan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
3. Un mdico est interesado en la relacin que tiene la tasa de mortalidad infantil con
distintos aspectos de la atencin prenatal.
a. Indique cules podran ser 5 variables de este estudio (clasifquelas por su
naturaleza y segn su nivel de medicin).
b. Seale dos posibles fuentes de informacin que podra utilizar.
Con base en esta lectura determine, con respecto al control de calidad de los medicamentos
descrito, indique:
a. Cul sera la unidad estadstica?
8. Cada vez ms personas recurren al quirfano para librarse de las gafas. Se desea realizar un
estudio para determinar cules instituciones estn ofreciendo ese servicio, qu tcnicas
emplean, cules son las calificaciones del personal que realiza estos servicios y cules son los
costos que tienen para los pacientes. Identifique cul es la unidad de estudio en es esta
situacin y seale cuatro variables de inters.
10. Una empresa ha estado recibiendo quejas y devoluciones de sus clientes, dado que el
producto tena algn defecto de fabricacin. El ingeniero a cargo del proceso de produccin
decide que debe realizar algunas mejoras y que debe hacer un estudio estadstico para obtener
informacin al respecto. Cul es la unidad estadstica en este caso? Es la poblacin finita o
infinita? Cules podran ser tres variables del estudio (clasifquelas segn su naturaleza)?
Deber emplearse la poblacin o una muestra para realizar el estudio?
11. Una empresa electrnica toma una muestra de cuatro tipos de componentes electrnicos
para determinar su tiempo de funcionamiento hasta que fallen. Con respecto a este problema,
cul es la unidad de estudio? Seale dos variables de inters y clasifquelas como cualitativas
o cuantitativas.
13. Una institucin financiera desea conocer con detalle el comportamiento de sus clientes
actuales (que han realizado al menos una transaccin al mes durante los ltimos 12 meses), y
entonces se va a realizar un estudio estadstico que permita obtener datos sobre aspectos como
sus hbitos de consumo y ahorro, los servicios financieros que ms emplean, utilizacin de
servicios de la competencia y qu tan satisfechos se sienten con la oferta actual de la
compaa, para as contar con la informacin necesaria que les permita lograr un crecimiento
importante en el mercado. Los aspectos anteriores desea clasificarlos segn el sexo del
cliente, su nivel de ingresos, la edad, el estado civil, su grado acadmico, la actividad a la que
se dedica y el volumen de operaciones que maneja en la institucin.
Con base en esta informacin defina:
a. Cul es la unidad estadstica?
b. Cul es la poblacin?
c. Con respecto a las variables bajo estudio, seale:
- Dos variables cualitativas
- Dos variables cuantitativas
- Una variable cuantitativa discreta
- Dos variables cuantitativas continuas
- Dos variables cualitativas que se midan en escala nominal
- Dos variables cualitativas que se midan en escala ordinal
- Dos variables cuantitativas que se midan en escala de razn
d. Qu sera ms conveniente, realizar el estudio entre toda la poblacin o emplear
una muestra? Explique.
15. Una empresa productora de jabones para el hogar est estudiando la posibilidad de lanzar
al mercado un jabn especial para nios. Desea efectuar un estudio estadstico para
determinar si el citado producto tendr la aceptacin suficiente. Con base en esta informacin
responda lo siguiente:
a. Cul es la unidad estadstica de la investigacin que se llevar a cabo?
b. Cite tres caractersticas de la unidad estadstica citada, de modo que una de ellas sea
una variable continua, otra una variable discreta y otra un atributo.
c. D un ejemplo de una posible observacin para cada una de las caractersticas
citadas.
d. Mencione y explique brevemente dos de las fases del estudio estadstico que ser
necesario realizar en este caso.
e. Describa un mtodo que podra emplear la empresa para recolectar la informacin.
16. Un contador est realizando una auditora. Necesita analizar los cheques emitidos por una
compaa para verificar la exactitud de sus registros contables. Cul es la unidad estadstica
en este caso? Cules podran ser cuatro variables del estudio (clasifquelas segn su
naturaleza e indique su nivel de medicin)? Deber emplearse la poblacin o una muestra
para realizar el estudio?
17. Un economista est tratando de determinar la relacin que existe entre el ingreso familiar
y los gastos en alimentacin de las familias del pas. Determine qu tipo de muestreo podra
emplearse (aleatorio o no aleatorio), e indique las ventajas y desventajas que podra tener cada
tipo de muestreo. Adems, seale cules podran ser algunas fuentes de informacin que se
podran emplear. Indique si son fuentes primarias o secundarias.
18. La cmara de empresas tursticas local est efectuando un estudio sobre las expectativas
de estos empresarios. Se aplica un cuestionario entre una muestra de empresas relacionadas
con el turismo en el pas. En el cuestionario se preguntaron a los gerentes de las empresas
aspectos como el grado de satisfaccin con la rentabilidad de su negocio, sus planes de
contratacin de personal para los prximos meses, su percepcin de la demanda del servicio
que presta, el tipo de negocio (hotel, restaurante, operador de tours, etc.). a. Una persona
comenta que en este estudio la unidad estadstica es el gerente de cada empresa, pero otra
persona le contradice y afirma que la unidad estadstica es la empresa. Cul de los dos cree
usted que tiene la razn? b. Anteriormente se mencionaron 4 variables del estudio.
Clasifquelas como cualitativas o cuantitativas e indique su escala de medicin.
19. Una educadora desea conocer la efectividad de un nuevo mtodo de enseanza de la lecto-
escritura. Decide que debe realizar un estudio estadstico para comparar un mtodo tradicional
con el mtodo nuevo. Cul es la unidad estadstica en este caso? Cules podran ser cuatro
variables del estudio (clasifquelas segn su naturaleza e indique su nivel de medicin)?
Deber emplearse la poblacin o una muestra para realizar el estudio? Cul mtodo debera
emplear para recopilar la informacin? Cul podra ser un sesgo que se cometa en este
investigacin y qu debera hacer la educadora para prevenirlo?
ms de 300 personas que utilizan esta red social a diario. Uno de los hallazgos fue que los
niveles de ansiedad en las personas aumentan cuando su jefe o sus padres les enven una
solicitud de amistad, principalmente cuando el usuario presenta en Facebook una imagen de s
mismo que podra no ser aceptable para algunos de sus esos amigos, como cuando dicen
malas palabras o publican fotografas fumando, tomando licor, etc. Con base en esta situacin
identifique: a. La unidad estadstica en el estudio. b. Tres variables del estudio. c. Clasifique
las variables como cualitativas o cuantitativas. d. Indique el nivel de medicin de las
variables. e. Por qu es necesario emplear una muestra en un estudio de este tipo? f. Cul es
el instrumento de medicin empleado?
22. Una trabajadora social requiere analizar las condiciones en que se encuentran las personas
que estn albergadas en hogares de ancianos de la ciudad capital. Para formular su
investigacin debe determinar cul es la unidad estadstica y su poblacin, definir las
variables de su estudio (una variable cualitativa que se mida en escala nominal, una variable
cualitativa que se mida en escala ordinal, una variable cuantitativa discreta y una variable
cuantitativa continua), y, finalmente, decidir si realiza su estudio visitando toda la poblacin o
si emplea una muestra.
24. Una empresa desea monitorear la publicidad que estn haciendo las empresas de
telecomunicaciones del pas. Cules podran ser cuatro variables del estudio (clasifquelas
segn su naturaleza e indique el nivel de medicin de cada una)? Cul mtodo debera
emplear para recopilar la informacin? Cul podra ser un sesgo que se cometa en este
investigacin y qu debera hacer la educadora para prevenirlo?
25. Una compaa est preocupada por su imagen ante clientes, proveedores, acreedores y la
comunidad donde opera la empresa. Antes de implementar algn tipo de medida en este
sentido desea conocer ms informacin sobre la imagen que tiene ante cada uno de estos
grupos. En una reunin en que se espera definir detalles sobre la investigacin que se debe
realizar, un ejecutivo expresa que el estudio tendr una sola poblacin y que estar compuesta
por todas aquellas personas que sean sus clientes, miembros de alguna empresa proveedora o
acreedora, o que resida en la comunidad aledaa a la empresa. Otro ejecutivo considera que
en realidad son 4 poblaciones distintas, y que no todas estn compuestas por personas. Cul
de los dos considera usted que tiene razn?
2. Una _____________ es una parte representativa de la poblacin que se selecciona para ser
estudiada ya que la poblacin es demasiado grande para ser estudiada en su totalidad. La
opcin que mejor completa la frase anterior es:
( a ) Caracterstica
( b ) Muestra
( c ) Observacin
( d ) Poblacin
3. Considere el siguiente concepto: "unidad de inters en el campo bajo estudio, sobre la cual
recae la observacin y de la cual se derivan los datos para el anlisis". Esto corresponde al
concepto de:
( a ) Unidad estadstica
( b ) Caracterstica
( c ) Muestra
( d ) Poblacin
4. De las siguientes, no es una razn para trabajar con muestras en vez de la poblacin es:
( a ) La poblacin se destruye al estudiarla
( b ) El costo de estudiar la poblacin es muy alto
( c ) La poblacin es muy grande
( d ) Ninguna de las anteriores
8. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parmetros establecidos por la compaa. Para ello se formula lo
siguiente:
9. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parmetros establecidos por la compaa. La caracterstica tiempo
de realizacin de la actividad es una variable que se mide en una escala:
( a ) De razn ( b ) Ordinal
( c ) De intervalo ( d ) Nominal
10. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parmetros establecidos por la compaa. Si la caracterstica grado
acadmico del operario se evala como Primaria incompleta, primaria completa, secundaria
incompleta, secundaria completa, entonces la variable se mide en una escala:
( a ) De razn ( b ) Ordinal
( c ) De intervalo ( d ) Nominal
11. El gerente de un centro de llamadas desea evaluar el desempeo del sistema y para ello
decide basarse en los tiempos de espera de los clientes para ser atendidos (medido en
segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles. Los siguientes son los tiempos de las muestras tomadas de lunes
a mircoles:
12. Con base en la informacin de la pregunta 11, una variable medida en escala ordinal
puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente
13. Con base en la informacin de la pregunta 11, una variable medida en escala de razn
puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Ninguna de las anteriores
14. Con base en la informacin de la pregunta 11, una variable cualitativa puede ser:
( a ) Tiempo de espera ( b ) Nmero de llamadas atendidas por da
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente
15. Con base en la informacin de la pregunta 11, una variable continua puede ser:
( a ) Tiempo de espera ( b ) Nmero de llamadas atendidas
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente
16. Con base en la informacin de la pregunta 11, una variable discreta puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Ninguna de las anteriores
17. Con base en la informacin de la pregunta 11, considere las dos siguientes afirmaciones:
A. Si el centro de llamadas tiene un sistema que registra los tiempos de todas las
llamadas, es mejor hacer un censo.
B. Dado que son muchas las llamadas, es necesario tomar una muestra muy grande.
Con respecto a las dos afirmaciones anteriores, es correcto con toda certeza que:
( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas
1. b 2. b 3. a 4. d
5. b 6. d 7. a 8. d
9. a 10. b 11. b 12. c
13. a 14. c 15. a 16. d
17. b
2 .
Presentacin de la informacin
estadstica
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Identificar las formas principales de presentar la informacin estadstica.
Presentar apropiadamente la informacin estadstica en un formato textual.
Elaborar cuadros estadsticos.
Construir grficos adecuados segn el tipo de datos.
Presentacin textual
En este mtodo de presentacin de la informacin se emplean palabras y cifras combinadas en
el texto, con el fin de informar los datos obtenidos. Observemos el siguiente ejemplo:
Este mtodo, desde la perspectiva del lector, puede ser ms engorroso, pues la presentacin
de muchos datos puede ser muy extensa. Para el redactor, este mtodo tiene la ventaja de que
puede explicar los datos y las conclusiones a la que llega, y se emplea principalmente cuando
la cantidad de datos es poca.
Cuadros estadsticos
Al construir las tablas es posible dar nfasis a ciertas cifras y analizar con detalle los
componentes de un total, por lo que los cuadros son sumamente tiles y muy utilizados en los
informes estadsticos.
Construccin de cuadros
Las partes esenciales de un cuadro o tabla bien diseado son:
Ttulo: se ubica en la parte superior central del cuadro, debe estar redactado con claridad,
y responder a cuatro preguntas bsicas:
o Dnde? Indicar el pas, regin, empresa, institucin, etc. donde sucedi el evento
con el que se relacionan los datos del cuadro.
o Qu? Indicar cul variable o caracterstica es a la que corresponden los datos del
cuadro.
o Cundo? Esto es mostrar la fecha o periodo al que corresponden las cifras del
cuadro.
o Cmo? Debe indicarse con claridad la forma en que vienen expresados los datos,
por ejemplo si son cifras en unidades monetarias, en millones, si son cifras
relativas, etc. Para esto a veces se emplea una nota introductoria, generalmente
entre parntesis, para indicar estos aspectos que son importantes para comprender
adecuadamente los datos mostrados.
Columna matriz: esta es la primera columna a la izquierda del cuadro. En esta columna
se indica cules son las partidas o componentes presentados horizontalmente en el cuadro,
por ejemplo, pases, empresas, productos, etc. Dependiendo de tipo de dato la columna
matriz va a tener un orden particular, por ejemplo:
o Alfabtico: Se usa, por ejemplo, para ordenar pases.
o Cronolgico: Cuando la columna matriz contiene aos, meses, etc.
o Por magnitud: Ciertos datos se ordenan de mayor a menor, o viceversa. Por
ejemplo, cuando se muestra la cantidad de personas segn su estado civil.
Nmero de cuadro
Ttulo del cuadro: dnde? qu?
cundo? cmo?
Encabezados
Columna
matriz Cuerpo del cuadro
Notas al pie:
Fuente:
Un detalle importante es que siempre debe indicarse la unidad de medida en que estn
expresadas las cifras, ya sea como nota introductoria en el ttulo, en el encabezado de las
columnas o en la clasificacin correspondiente en la columna matriz. Igualmente, para
facilitar el anlisis pueden incluirse en el cuerpo del cuadro ndices, porcentajes, promedios u
otros datos tiles.
Adems normalmente no se emplea el rayado vertical, salvo que sea necesario para separar las
columnas. El rayado horizontal solo se usa en los encabezados y en la ltima fila, o en la fila
de totales. El cuadro debe tener proporciones adecuadas, o sea, que no sea excesivamente
ancho o demasiado alto.
Ejemplos:
Cuadro #1
Centroamrica: matrcula inicial en los primeros niveles,
segn nivel educativo, por pases.
1997
(Datos en miles)
Nivel
Pas Preescolar Primaria Secundaria Total
Costa Rica 71.1 525.3 220.2 816.5
El Salvador 179.0 1191.1 152.5 1522.6
Guatemala 221.8 1539.5 317.4 2078.6
Honduras 86.1 1055.0 271.1 1412.1
Nicaragua 133.1 777.9 270.5 1811.5
Panam 45.3 377.9 223.2 646.4
Total 736.4 5466.6 1451.7 7657.7
Fuente: Informe Estado de la Regin en Desarrollo Humano Sostenible.
Proyecto Estado de la Regin. San Jos, C.R.: 1999, pg. 169.
Cuadro #2
MERCOSUR: Tasa de desempleo abierto trimestral, 20071/
(Como porcentaje de la PEA)
www.auladeeconomia.com/raeep.html
Representacin grfica
La principal ventaja de los grficos es que permiten llamar la atencin ms que las otras
formas de presentacin de datos, adems de que tienden a ser ms fciles y rpidos de
comprender que un cuadro y facilitan las comparaciones. La principal desventaja es que no se
puede presentar tanto detalle en la informacin como si se puede hacer en un cuadro.
Construccin de grficos
Un grfico de cualquier tipo tiene las siguientes partes, y stas siguen las mismas
consideraciones hechas para el caso de los cuadros:
Ttulo: se ubica en la parte superior central del grfico, debe estar redactado con claridad,
sealar qu datos se presentan en el cuadro, el lugar donde ocurri el evento al que se
refieren los datos, la fecha o periodo al que corresponden y la forma en que vienen
expresados los mismos. Muchas veces el ttulo incluye una nota introductoria, para
explicar algn aspecto importante relacionado con las cifras presentadas. En resumen se
puede decir que un buen ttulo de un grfico debe responder a las preguntas: qu?,
dnde?, cundo? Y cmo?, con su respectiva nota introductoria si es necesario.
Escalas y leyendas: las leyendas indican el concepto o variable que se representa en cada
coordenada y las unidades de medida empleadas.
Las figuras geomtricas, las cuales representan los datos.
Notas al pie: es opcional y se emplea cuando es necesario aclarar algunas cifras del
cuadro.
Fuente: cuando el autor del grfico no sea el productor original de los datos presentados
en la grfica.
Clases de grficos
Grficos de barras
Este tipo de grficos se emplean principalmente se utilizan para hacer comparaciones, ya sea
entre distintas partidas, como pases, productos, etc., o a lo largo del tiempo. Se usan barras
verticales para representar series de tiempo (series cronolgicas) o datos cuantitativos (en el
caso de distribuciones de frecuencia). Las barras horizontales se emplean cuando los datos
estn clasificados de acuerdo con una caracterstica cualitativa, como lo son datos segn pas,
segn servicio o producto, departamento, etc.
Por lo general, se recomienda que las barras no sean demasiado angostas ni demasiado
anchas, y que entre barra y barra debe dejarse un espacio apropiado, excepto en los
histogramas, los cuales se estudiarn en el captulo 4 en el tema de distribuciones de
frecuencias.
Costa Rica: Valor de las exportaciones tradicionales por tipo de producto, 2011
(Valor FOB en millones de US$)
Banano
Caf
Azcar
Carne
Fuente: Banco Central de Costa Rica (2012). Exportaciones FOB por tipo de producto. Recuperado el 12 de octubre de 2012,
http://indicadoreseconomicos.bccr.fi.cr/indicadoreseconomicos/Cuadros/frmVerCatCuadro.aspx?CodCuadro=479&Idioma=1
&FecInicial=1997/01/31&FecFinal=2012/12/31&Filtro=0&Jump=1
Mximo
23
22
Cierre
21
20 Apertura
19 Mnimo
25
24
23
22
21
20
19
18
17
16
1/10 8/10 13/10 20/10
Venezuela
Uruguay
Per
Paraguay
Ecuador
Rural
Colombia
Urbana
Chile
Brasil
Bolivia
Argentina
Cuando la finalidad es comparar varias series cronolgicas, entonces se pueden usar las barras
verticales comparativas. Por ejemplo, en el siguiente grfico se muestra la evolucin del
porcentaje de hogares con acceso a servicios de telefona celular y el porcentaje de hogares
con computadora en Colombia en el periodo que va del ao 2006 al 2009.
90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
2006 2007 2008 2009
Fuente: CEPAL (2012). CEPAL STAT Indicadores de tecnologas de informacin: Acceso a TIC en los hogares.
Recuperado el 9 de octubre de 2012 de http://websie.eclac.cl/sisgen/ConsultaIntegrada.asp?idAplicacion=16&idioma=e
100%
90%
80%
70%
Otras fuentes nacionales
60%
Extranjero
50%
Empresa
40%
Gobierno
30%
20%
10%
0%
Fuente: CEPAL (2012). InfoData: Indicadores de composicin de gasto en I+D.
Recuperado el 26 de setiembre de 2012 de http://www.eclac.cl/iyd/website/default_002.asp
Costa Rica
El Salvador
Guatemala
Honduras
Nicaragua
Venezuela
Uruguay
Per
Paraguay
Ecuador
Urbana
Colombia
Rural
Chile
Brasil
Bolivia
Argentina
Las barras compuestas tambin pueden ser verticales, esto cuando la serie sea cronolgica,
como en el ejemplo siguiente, el cual muestra cmo se componen los ingresos por impuestos
indirectos de Nicaragua en el periodo 2007 a 2010.
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
500,0
0,0
-500,0
-1.000,0
-1.500,0
-2.000,0
-2.500,0
Fuente: Banco Central de Costa Rica (2012). Balance comercial. Recuperado el 12 de octubre de 2012 de
http://indicadoreseconomicos.bccr.fi.cr/indicadoreseconomicos/Cuadros/frmVerCatCuadro.aspx?CodCuadro=448&Idioma=1
&FecInicial=1995/01/31&FecFinal=2005/12/31&Jump=1
Grfico circular
El grfico circular es la forma ms empleada para representar la estructura de un todo, o sea,
para mostrar las partes en que se divide un todo. Se emplea en los mismos casos que la barra
100%. En este tipo de grfico cada uno de los componentes del todo es representado por un
sector circular de rea, de manera que cada sector es proporcional a la magnitud de la parte
que representa.
Na/Nr, 18%
Empleado Empleador,
asalariado, 52% 13%
Cuenta propia,
16%
Grficas lineales
Los grficos lineales se emplean, principalmente, para representar series cronolgicas de
datos, o sea, valores anuales, mensuales, etc.
El grfico lineal se emplea en los mismos casos que la grfica de barras verticales, pero,
generalmente se prefiere el grfico lineal cuando el nmero de perodos es grande, ya que la
grfica de barras quedara con muchas barras muy delgadas, y entonces no sera atractiva. El
grfico lineal es especialmente til para mostrar la tendencia de una variable a lo largo del
tiempo, o sea, presentar cmo se han comportado en un plazo determinado y cul ha sido su
crecimiento o decrecimiento "absoluto".
Al construir grficos es necesario ser muy cuidadoso con el eje vertical, ya que fcilmente
podra construirse un grfico engaoso, como en el caso siguiente, en el cual pareciera que la
variable tiene un fuerte crecimiento, sin embargo su variacin es mnima. Esto se da porque
no se ha incluido el cero en el eje vertical.
71
70,8
70,6
70,4
70,2
70
2009 2010 2011 2012
Para evitar estos problemas con la escala es importante considerar los siguientes aspectos:
En el eje vertical el cero es necesario, pues de otro modo la impresin visual que causa
podra ser distorsionada.
La escala empleada debe facilitar la comparacin, por lo que se recomienda que sea
sencilla, fcil de interpretar.
Cuando se grafican datos de gran magnitud, la curva podra quedar muy arriba en el
grfico, entonces es difcil comenzar la escala con cero, por lo que en estos casos podra
interrumpirse la escala y no mostrar el cero. Cuando se representan nmeros ndices,
tampoco es necesario incluir el cero (pero s es importante la base del ndice).
Todo proceso tiene cierta variabilidad, o sea, si, por ejemplo, se llenan
botellas de refresco, van a haber algunas botellas con un poco ms de
refresco y otras con un poco menos. Cuando esas variaciones son pequeas
con respecto a lo especificado, generalmente no representan un problema,
y normalmente son inevitables, y se les denomina causas comunes. Pero
existen otras variaciones que si es posible controlar, por ejemplo, si la
mquina que llena las botellas no ha recibido el mantenimiento adecuado,
el operario es descuidado en el manejo de la mquina o las botellas no se
ajustan bien, entre muchas otras posibles causas especiales o asignables.
Las causas asignables son aquellas que se pueden controlar, y por tanto
deben ser eliminadas. Un proceso est bajo control cuando la variacin se
debe solo a las causas comunes y no a las asignables.
12
LSC 10
Media 6
LIC 2
0
1 2 3 4 5 6 7 8 9 10
En trminos del grfico, un proceso est bajo control cuando todos los
puntos se encuentran dentro de los lmites de los lmites de control (LIC y
LSC) y adems, cuando los puntos no muestran patrones no aleatorios, aun
cuando estn los puntos dentro de los lmites de control. Por ejemplo, en la
siguiente grfica, el tercer punto est fuera de los lmites de control, y
luego hay otra situacin fuera de control, pues todos los puntos siguientes
estn debajo de la media, lo cual indicara que las variaciones no son
aleatorias, y por tanto ese patrn indicara que no solo las causas comunes
estn provocando variacin en el proceso.
12
LSC 10
Media 6
LIC 2
0
1 2 3 4 5 6 7 8 9 10
Pictogramas
Los pictogramas son similares a los grficos de barras, pero sustituyen las barras por varias
figuras pequeas del mismo tamao. Se utilizan, generalmente, con el objeto de realizar
comparaciones. Generalmente las figuras empleadas se relacionan con la variable graficada.
Por ejemplo, si el dato graficado es produccin de automvil, podran dibujarse pequeos
automviles. Mientras ms automviles aparezcan, es porque se da una mayor produccin.
Diagrama de dispersin
En muchos casos se desea establecer la relacin que existe entre dos variables de la misma
unidad de estudio. Por ejemplo, el ingreso y el consumo de las personas, la cantidad de tabaco
fumado y la incidencia del cncer, etc.
Estos diagramas son base de muchos anlisis en los que se puede establecer la correlacin
entre variables.
26
Gasto social en relacin con el PIB
24
22
20
18
16
14
12
10
8
6
4
2
0
0 200 400 600 800 1000 1200 1400 1600 1800
Ejercicio Indique qu tipo de grfico empleara para presentar los siguientes datos.
Explique en cada caso:
de
revisin a. Porcentaje de nios de un ao vacunados contra el sarampin para los
pases de Amrica Central en el 2009.
b. Porcentaje de nios de un ao vacunados contra el sarampin para
Costa Rica y Panam del ao 2000 al 2009.
c. Tasa de prevalencia del VIH entre la poblacin de 15 a 49 aos de
edad por sexo para Costa Rica en el 2009.
d. Relacin entre el porcentaje de cobertura de atencin prenatal y la
razn de mortalidad materna por cada 100.000 nacidos vivos para 10
pases de Amrica Latina en el 2006.
Ejercicios:
Ejercicios de desarrollo:
Conteste cada una de las preguntas que a continuacin se formulan (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).
3. Una farmacia comunitaria vende, adems de distintos frmacos, otras lneas de productos,
como productos de belleza, productos de cuidado personal, etc. Se ha reunido informacin de
las ventas de los ltimos 3 aos segn los distintos tipos de productos. En cada caso indique el
tipo de grfico que se podra construir para representar la informacin del modo adecuado:
a. Ventas mensuales totales para los ltimos 36 meses por tipo de producto.
b. Importancia relativa anual de las distintas lneas de producto para los ltimos 3
aos.
c. Comparacin de los montos de ventas totales del ltimo ao por tipo de producto y
segn forma de pago (efectivo o tarjeta).
4. En un peridico se publicaron los siguientes datos sobre las ventas de telfonos celulares
segn su marca: "En el 2011 del 6% de las ventas eran de telfonos marca Samsung, pero para
el 2012 su participacin alcanz el 18%. En ese mismo periodo, la participacin de mercado
de Nokia cay del 69% al 43%. Por otro lado, Apple se mantiene en ambos periodos en un
15% del total. Sony ha perdido un poco de participacin, pasando del 16% al 12%".
a. Construya una tabla que muestre los datos presentados anteriormente.
b. Construya una grfica que muestre los datos anteriores.
c. Cul de los dos modos de presentar la informacin estadstica (cuadro o grfica)
preferira usted en este caso?
6. Un contador est realizando una auditora de los cheques extendidos por una compaa. En
cada caso indique el tipo de grfico adecuado para presentar los datos:
a. Nmero de cheques extendidos por mes durante el ltimo ao.
b. Monto promedio de los cheques extendidos cada mes durante el ltimo ao.
c. Nmero de cheques extendidos durante el ltimo mes segn tipo de gasto.
8. Cada trimestre la cmara de empresas tursticas local efecta un estudio sobre las
expectativas de los empresarios afiliados. Se aplica un cuestionario entre una muestra de
empresas relacionadas con el turismo en el pas. En el cuestionario se pregunta a los gerentes
de las empresas aspectos como el grado de satisfaccin con la rentabilidad de su negocio, sus
planes de contratacin de personal para los prximos meses, su percepcin de la demanda del
servicio que presta, el tipo de negocio (hotel, restaurante, operador de tours, etc.).
a. Indique qu tipo de grfico empleara en cada caso:
a.1. Nmero de empresarios segn el grado de satisfaccin con la rentabilidad
de su negocio segn los resultados de este ao.
a.2. Distribucin porcentual para este ao de los empresarios de acuerdo con
sus planes de contratacin de personal para los prximos meses.
a.3. Percepcin de la demanda del servicio que presta segn tipo de negocio
para los ltimos tres aos.
b. Construya una grfica que muestre los datos siguientes:
Provincia Poblacin %
Provincia A 450.000
Provincia B 300.000
Provincia C 100.000
Total
a. Complete la tabla.
b. Elabore una grfica que muestre la poblacin por provincias.
c. Elabore una grfica que muestre la distribucin porcentual de la poblacin por
provincias.
B Tal como queda claro en la grfica, el gasto per cpita en salud excede al
producto interno bruto per cpita (PIB per cpita) desde hace ya muchos aos
C Hasta antes de la crisis de finales de la dcada de los 70s e inicios de los
80s, el gasto per cpita en salud creca ms aceleradamente que el PIB per
cpita, tal como se muestra claramente en la grfica
2. Si se tiene una serie cronolgica, el tipo de grfico adecuado para representarla es:
( a ) Grfica de barras horizontales
( b ) Grfica de barras verticales
( c ) Histograma
( d ) Diagrama de dispersin
3. Si se tiene una serie cualitativa, el tipo de grfico adecuado para representarla es:
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales
10. Si usted va a representar las exportaciones anuales de un pas en el periodo 2009 2011
por tipo de producto, cul tipo de grfico es ms apropiado?
( a ) Grfico de barras horizontales comparativas
( b ) Grfico de barras horizontales compuestas
( c ) Grfico de barras verticales comparativas
( d ) Grfica de dispersin
11. Qu tipo de grfico utilizara para representar el monto de las ventas (en dlares) de una
empresa por tipo de producto para el ao 2012?
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales
12. Qu tipo de grfico utilizara para representar el monto de las ventas (en dlares) de una
empresa por ao del 2007 al 2012?
( a ) Grfico circular
( b ) Barra 100%
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales
13. Qu tipo de grfico utilizara para representar la distribucin porcentual de las ventas de
una empresa por tipo de producto para el ao 2012?
( a ) Grfico circular
( b ) Grfico lineal
14. Qu tipo de grfico utilizara para representar la distribucin porcentual de las ventas de
una empresa por tipo de producto y segn tipo de cliente para el ao 2012?
( a ) Grfico de barras horizontales comparativas
( b ) Barra 100%
( c ) Grfico de barras verticales compuestas
( d ) Grfico de barras horizontales compuestas
15. Qu tipo de grfico utilizara para comparar el monto de las ventas de una empresa (en
miles $) por tipo de producto y segn tipo de cliente para el ao 2012?
( a ) Grfico de barras horizontales comparativas
( b ) Barra 100%
( c ) Grfico de barras verticales compuestas
( d ) Grfico de barras horizontales compuestas
16. Qu tipo de grfico utilizara para comparar el monto de las ventas de una empresa (en
miles $) por tipo de producto para el periodo 2007 al 2012?
( a ) Grfico de barras horizontales comparativas
( b ) Grfico de barras verticales comparativas
( c ) Grfico de barras verticales compuestas
( d ) Grfico de barras horizontales compuestas
17. El gerente de un centro de llamadas desea evaluar el desempeo de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles y 20 llamadas el jueves y el viernes. Los siguientes son los
tiempos de las muestras tomadas de lunes a mircoles. El lunes y el martes se tomaron
tiempos de llamadas atendidas y el mircoles solo de llamadas no atendidas:
El tipo de grfico apropiado para representar la distribucin porcentual de las llamadas segn
el agente que contest es:
( a ) Grfico lineal
( b ) Grfico de barras verticales
( c ) Grficos de barras horizontales
( d ) Grfico circular
18. Con base en los datos de la pregunta 17, el tipo de grfico apropiado para representar el
nmero de llamadas recibidas por mes durante los ltimos 12 meses es:
( a ) Grfico lineal
( b ) Diagrama de dispersin
( c ) Grficos de barras horizontales
( d ) Barra 100%
1. c 2. b 3. d 4. d
5. c 6. a 7. b 8. b
9. d 10. c 11. d 12. c
13. a 14. d 15. a 16. b
17. d 18. a
3 .
Anlisis descriptivo de la
informacin estadstica
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Reconocer la importancia y utilidad de las medidas de posicin central.
Calcular e interpretar las principales medidas de posicin en datos no agrupados.
Calcular e interpretar las principales medidas de variabilidad en datos no agrupados.
Se recomienda que antes de iniciar la lectura de este tema se estudie el apndice de este
captulo, el cual ayudar a la comprensin de las frmulas y los conceptos expuestos.
El objetivo bsico de calcular estas medidas es poder reducir los datos, sustituyndolos por
algunas pocas medidas que los describan. Por supuesto que cada medida posee sus ciertas
ventajas y desventajas que luego se mencionarn.
La media aritmtica
La media aritmtica, tambin llamada media o promedio, se denota por , cuando
corresponde a una poblacin y por x cuando se refiere a una muestra. Se trata del valor
medio de todos los valores que toma la variable estadstica de una serie de datos. La media
aritmtica es la medida de posicin de ms importancia en estadstica y la de ms uso,
principalmente por su fcil clculo e interpretacin.
X i
i 1
x i
x i 1
Ejemplo Suponga que se tienen los siguientes datos correspondientes a las ventas
mensuales que ha realizado un vendedor durante los ltimos siete meses
(en millones de dlares):
20 33 42 40 19 23 28
x 29.29
7
Segn ese resultado, sus ventas mensuales promedio son de 29.29 millones
de dlares.
Ejemplo Utilice Excel y Minitab para resolver el ejercicio: Suponga que se tienen
los siguientes datos correspondientes a las ventas mensuales que ha
realizado un vendedor durante los ltimos siete meses (en millones de
dlares):
Solucin En Excel, se introducen los datos, bien sea en una fila o una columna. En
este caso los datos se encuentran en el rango de celdas de A1 hasta A7:
Luego se elige una celda para determinar el resultado, por ejemplo la celda
B8, y en ella se ingresa la siguiente funcin de Excel:
=PROMEDIO(A1:A7)
aproximadamente:
La media ponderada
a. Caso de valores repetidos:
Muchas veces se tienen conjuntos de datos con observaciones que se repiten varias veces. Si
los valores distintos del conjunto son x1 , x 2 , x3 , ..., x k , los cuales aparecen f 1 , f 2 , f 3 , ...,
f k veces, respectivamente, entonces la media ponderada ser:
x i fi
x i 1
x i fi
4 50 6 40 3 35 2 20
x i 1
39
n 15
x w i i
x i 1
k
w
i 1
i
Ejemplo Una empresa obtiene distintos mrgenes de utilidad segn los diferentes
productos que vende. Suponiendo que vende 3 productos diferentes A, B y
C, de acuerdo con los siguientes datos:
Volumen de ventas
Producto Margen de utilidad (en millones de dlares)
A 20% 200
B 30% 100
C 40% 60
Total: $ 360
x w i i
20% 200 30% 100 40% 60
x i 1
k
26.11%
w
360
i
i 1
La media geomtrica
En muchos casos no es apropiado determinar la media aritmtica, por ejemplo, cuando se
necesita calcular la tasa de crecimiento promedio del ndice de precios al consumidor. En
estas situaciones se debe calcular la media geomtrica.
Algebraicamente se expresa:
Mg n x1 x2 ... xn
Ejemplo Utilice Excel y Minitab para calcular la media geomtrica del conjunto de
datos siguiente:
Solucin En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A5:
=MEDIA.GEOM(A1:A5)
GMEAN(C1)
Mg n x1 1 x2 2 ... xk
f f fk
La moda
Cuando se est interesado en tener una cierta idea de dnde se concentra la mayor parte de los
datos de una serie de valores, entonces resulta til la moda. La moda, o modo, es simplemente
la medida de posicin que indica el valor que ms se repite en el conjunto de datos, o sea, el
valor que se presenta con ms frecuencia en una serie de datos. La moda se designa como M o
.
La moda se puede obtener por una simple observacin de los datos, es decir, se determina
con gran facilidad.
Un conjunto de datos podra no tener moda, si ningn valor aparece ms de una vez, pero
tambin puede tener una o varias modas. Cuando tiene una moda, se dice que es unimodal. Si
el conjunto de datos posee dos modas, y entonces se dice que el conjunto es bimodal.
Tambin es posible que el conjunto tenga ms de dos modas, y entonces se le llama
multimodal.
Conjunto 1:
12, 14, 14, 15, 18, 18, 18, 22, 25
Conjunto 2:
12, 14, 14, 14, 15, 18, 18, 18, 22, 25
Conjunto 3:
12, 14, 15, 18, 22, 25
Conjunto 4:
12, 14, 14, 15, 18, 18, 18, 22, 2500
Solucin 1. El dato que ms veces aparece es el 18, por tanto la moda es 18.
3. No tiene moda.
revisin
Calcule la moda o modo.
La mediana
La mediana, denotada Med, es una medida de posicin que tiene diversas aplicaciones. Para
calcularla es necesario ordenar el conjunto de datos en forma ascendente, pues la mediana
divide el conjunto de datos en dos partes, de manera que haya igual cantidad de valores de un
lado que de otro.
MEDIANA Es una medida de posicin que divide a la serie de valores en dos partes
iguales, un cincuenta por ciento que es mayor o igual a la mediana y otro cincuenta por
ciento que es menor o igual que ella.
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es
ordenar los datos en una forma creciente y luego se ubica la posicin que esta ocupa en esa
serie de datos; para ello hay que determinar si la serie de datos es par o impar.
N 1
PMed
2
Luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en la serie de
valores, y entonces la mediana ser el nmero que ocupe el lugar de la posicin encontrada.
Cuando el nmero N de datos es una cantidad par, se requerir obtener el punto medio para
poder obtener la mediana.
Ejemplo Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los aos de servicios de un
grupo de trabajadores. Cul es la mediana?
decreciente:
5, 6, 7, 8, 9, 10, 12
N 1 7 1
PMed 4
2 2
Ese resultado indica que la mediana ser el cuarto dato de la serie, es decir,
la mediana ser 8, Med = 8.
Ejemplo Sean los siguientes datos, 5, 12, 7, 8, 11, 10, 6, y 9, los aos de servicios
de un grupo de trabajadores. Cul es la mediana?
5, 6, 7, 8, 9, 10, 11, 12
Dado que se tienen 8 datos, una cantidad par de datos, se aplica la formula:
N 1 8 1
PMed 4.5
2 2
Ese resultado indica que la mediana estar entre el cuarto y el quinto dato
de la serie, y por tanto ser necesario calcular el punto medio entre 8 y 9,
es decir, la mediana ser (8+9)/2, Med = 8.5.
En grupos pequeos la moda puede ser una medida muy inestable, ya que al cambiar
alguno de los datos, la moda podra variar drsticamente.
La moda y la mediana puede ser consideradas medidas ms robustas que la media
aritmtica, ya que no se ven afectas por los valores extremos, mientras que la media s.
Cuando hay valores extremos, generalmente es mejor usar la mediana que la media.
La media aritmtica es la medida de posicin central que es ms estable de muestra a
muestra.
Cuando los datos se han obtenido aleatoriamente, la media aritmtica tiende a ser el mejor
descriptor del conjunto de valores original.
En ciertos conjuntos de datos la media, la mediana y la moda tienden a ser iguales o muy
similares. Esto ocurre en la medida que la distribucin de los datos sea simtrica, en cuyo
caso seran las tres medidas iguales.
Esta asimetra puede ser positiva, cuando los valores extremos son mayores a la media, o
negativa, cuando sean menores. Entonces, el promedio ser menor que la mediana y la
mediana menor que la moda.
Existen medidas sobre el grado de simetra o asimetra de una distribucin, las cuales no se
consideran en este texto, sin embargo, es posible mostrar esas simetras o asimetras en forma
grfica, y la relacin que sea con la moda, la mediana y la media del modo siguiente.
Ejemplo Suponga que se tienen tres conjuntos de datos y para cada uno de ellos se
conoce la media, mediana y moda:
Conjunto 1:
12, 13, 14, 14, 15, 15, 15, 16, 16, 16,
16, 16, 17, 17, 17, 18, 18, 19, 20
Conjunto 2:
12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18,
18, 18, 19, 19, 19, 19, 19, 20, 20, 20
Conjunto 3:
12, 12, 12, 13, 13, 13, 13, 13, 14, 14,
14, 15, 15, 16, 16, 17, 17, 18, 19, 20
Solucin Conjunto 1:
Media = 16
Mediana = 16
Moda = 16
La media, la mediana y la moda son iguales, lo que indica una distribucin
simtrica, lo cual se observa claramente en la grfica siguiente.
Frecuencia
3
0
12 14 16 18 20
C1
Conjunto 2:
Media = 17,19
Mediana = 18
Moda = 19
La media es menor que la mediana, y a su vez la mediana es menor que la
moda, lo que indica una distribucin asimtrica negativa, lo cual se
observa claramente en la grfica siguiente.
4
Frecuencia
0
12 14 16 18 20
C2
Conjunto 3:
Media = 14,8
Mediana = 14
Moda = 13
La media es mayor que la mediana, y a su vez la mediana es mayor que la
moda, lo que indica una distribucin asimtrica positiva, lo cual se observa
claramente en la grfica siguiente.
Frecuencia
3
0
12 14 16 18 20
C3
Los cuantilos
Los cuantilos son medidas de posicin que dividen al conjunto ordenado de datos en una
determinada cantidad de partes iguales, de tal manera que superan a una cierta proporcin de
las observaciones , pero son superados por la proporcin complementaria,
Cuartiles o cuartilos:
Cada serie de datos posee tres cuartilos, los cuales dividen al conjunto de datos en cuatro
partes iguales.
CUARTIL Los cuartiles son los tres valores que dividen a un conjunto ordenado de
datos en cuatro partes iguales.
El primer cuartil, denotado Q1 , se definira como aquel valor que supera a la cuarta parte de
los datos, pero es menor que las restantes tres cuartas partes. El segundo cuartil es la misma
mediana. A su vez, el tercer cuartil, denotado como Q3 , se definira como el valor que es
mayor que las tres cuartas partes de los datos, pero menor a la cuarta parte de ellos.
Ahora bien, los cuartiles pueden ser expresados como percentiles 25 y 75, y por tanto ser
calculados usando la frmula de los percentiles, tal como se expone ms adelante.
Deciles:
Cada serie de datos posee nueve deciles, los cuales dividen al conjunto de datos en diez partes
iguales.
DECIL Los deciles son los nueves valores que dividen a un conjunto ordenado de
datos en diez partes iguales.
El primer decil, denotado D1, se definira como aquel valor que supera a la dcima parte de
los datos, pero es menor que las restantes nueve dcimas partes. El segundo decil es aquel
valor que supera a dos dcimas partes de los datos, pero es menor que las restantes ocho
dcimas partes. As sucesivamente se pueden definir los dems deciles.
Ahora bien, los deciles pueden ser expresados como percentiles 10, 20, ..., y 90, y por tanto
ser calculados usando la frmula de los percentiles, tal como se expone ms adelante.
Quintiles:
Cada serie de datos posee cuatro quintiles, los cuales dividen al conjunto de datos en cinco
partes iguales.
QUINTIL Los quintiles son los cuatro valores que dividen a un conjunto ordenado de
datos en cinco partes iguales.
El primer quintil, denotado K1, se definira como aquel valor que supera a la quinta parte de
los datos, pero es menor que las restantes cuatro quintas partes. El segundo quintil es aquel
valor que supera a dos quintas partes de los datos, pero es menor que las restantes tres quintas
partes. As sucesivamente se pueden definir los dems quintiles.
Ahora bien, los quintiles pueden ser expresados como percentiles 20, 40, 60 y 80, y por tanto
ser calculados usando la frmula de los percentiles, tal como se expone ms adelante.
Percentiles:
Una serie de datos tiene 99 percentiles, los cuales dividen a un conjunto de datos en 100
partes iguales. Los percentiles son un concepto similar al de los cuartiles. Por ejemplo, el
percentil 57, denotado por P57 , corresponder a aquel valor tal que es superior al 57% de las
observaciones y menor al restante 43%.
PERCENTIL Los percentiles son los 99 valores que dividen a un conjunto ordenado
de datos en 100 partes iguales.
Como se mencion anteriormente, los cuartiles, deciles y quintiles pueden ser expresados en
trminos de percentiles, como se ilustra a continuacin:
Para datos sin agrupar, en un conjunto de datos ordenados de acuerdo con su magnitud, el
percentil m, denotado Pm , ser el 100
m
n 1 trmino.
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
25
10 1 2,75
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 25. Hay que buscar el dato en la posicin 2,75.
Como no se tiene un valor en la posicin 2,75, quiere decir que el valor del
percentil va a estar entre el segundo valor y el tercero, entonces se realiza
una interpolacin. Esto es, se toma el segundo dato en la serie ordenada,
que es 40, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,75 por la diferencia entre el segundo y el tercer dato, que
es 70 40 = 30. O sea, el percentil equivale a:
Tercer cuartil:
Paso 1: El primer paso es ordenar la serie de datos:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
75
10 1 8,25
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 75. Hay que buscar el dato en la posicin 8,25.
Como no se tiene un valor en la posicin 8,25, quiere decir que el valor del
percentil va a estar entre el octavo valor y el noveno, entonces se realiza
una interpolacin. Esto es, se toma el octavo dato en la serie ordenada, que
es 120, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,25 por la diferencia entre el octavo y el noveno dato, que
es 140 120 = 20. O sea, el percentil equivale a:
Decil 4:
Paso 1: El primer paso es ordenar la serie de datos:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
40
10 1 4,4
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 40. Hay que buscar el dato en la posicin 4,4. Como
no se tiene un valor en la posicin 4,4, quiere decir que el valor del
percentil va a estar entre el cuarto valor y el quinto, entonces se realiza una
interpolacin. Esto es, se toma el cuarto dato en la serie ordenada, que es
100, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,4 por la diferencia entre el cuarto y el quinto dato, que es
100 100 = 0. O sea, el percentil equivale a:
Percentil 80:
Paso 1: El primer paso es ordenar la serie de datos:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
80
10 1 8,8
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 80. Hay que buscar el dato en la posicin 8,8. Como
no se tiene un valor en la posicin 8,8, quiere decir que el valor del
percentil va a estar entre el octavo valor y el noveno, entonces se realiza
una interpolacin. Esto es, se toma el octavo dato en la serie ordenada, que
es 120, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,8 por la diferencia entre el octavo y el noveno dato, que
es 140 120 = 20. O sea, el percentil equivale a:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Solucin En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A10:
=CUARTIL(A1:A10;1)
=CUARTIL(A1:A10;3)
=PERCENTIL(A1:A10;0,80)
PERCENTILE(nmero.probabilidad)
PERCENTILE(C1.0,80)
Aplicacin Antropometra
Cuando nace un nio, el mdico o la enfermera mide su talla, la
circunferencia ceflica, entre otras dimensiones. Conforme crecemos en
algn momento tambin nos sometemos a algunas mediciones similares
relacionadas con nuestro cuerpo. Cuando usamos un automvil, los
ingenieros emplearon datos sobre las medidas de los seres humanos para
determinar las dimensiones de distintas partes del vehculo, como los
asientos, la distancia entre el asiento y el volante, entre otros. De igual
La caja de la grfica se construye con base en el primer cuartil Q1 y el tercer cuartil Q3, los
cuales definen los lmites de la caja. La caja tiene una lnea que la cruza que corresponde a la
mediana. Los bigotes salen de la caja y llegan hasta el valor mnimo y mximo, o bien, dos
valores a y b que se trazan hasta 1,5 veces la altura de la caja, o sea, que el bigote inferior
llega hasta a = Q1 1,5 (Q3 Q1) y el bigote superior llega hasta b = Q3 + 1,5 (Q3 Q1). Otros
autores trazan los bigotes hasta dos veces el rango intercuartil (Q3 Q1), o sea, que el bigote
inferior llega hasta Q1 2 (Q3 Q1) y el bigote superior llega hasta Q3 + 2 (Q3 Q1). Tambin
hay autores que trazan simplemente los bigotes hasta el mnimo y el mximo. En este texto se
emplear la primera forma, ya que as lo construye el software Minitab. Los valores que
quedan fuera de esos lmites establecidos por los bigotes se consideran valores extremos o
atpicos.
La grfica de caja es til para valorar la existencia de valores extremos o atpicos y para
analizar la simetra o asimetra de la distribucin de los datos.
Primer cuartil: 20
Tercer cuartil: 36
Mediana: 30
Mnimo: 8
Mximo: 42
Mn Q1 Med Q3 Mx
8 20 30 36 42
0 10 20 30 40 50
24, 25, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35, 40
Q1 = 27
Q3 = 31,5
20, 24, 25, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35, 40, 45
Solucin Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al men Grafica y se elige Grfica de caja. En el cuadro se
escoge Una Y Simple, y se da clic en Aceptar. En el cuadro de dilogo que
aparece se selecciona la columna que contiene los datos, que en este caso
es la columna C1, y se da clic en Aceptar. Se obtiene la grfica siguiente:
Grfica de caja de C1
45
40
35
C1
30
25
20
15, 24, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35
Solucin Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al men Grafica y se elige Grfica de caja. En el cuadro se
Grfica de caja de C1
35
30
25
C1
20
15
La grfica de caja tambin es til porque muestra, en cierto grado, la dispersin del conjunto
de datos, pues se puede observar la diferencia entre el valor mximo y el mnimo, que se
conoce como el rango, recorrido o amplitud del conjunto de datos. Tambin, en este mismo
sentido, muestra el rango intercuartil o rango intercuartlico (RIC), el cual corresponde a la
diferencia entre el tercer cuartil y el primer cuartil:
RIC = Q3 Q1
El rango intercuartil indica el rango en el cual se concentra la mitad de los datos alrededor
de su mediana, por lo que un rango intercuartil pequeo indicara que ese 50% de los datos se
aleja poco de su mediana, mientras que un rango intercuartil elevado indicara que esos
valores que se hallan entre el primer cuartil y el tercer cuartil fluctan en un rango grande. En
la grfica de caja, el rango intercuartil se observa en la longitud de la caja (o su altura, si la
caja es vertical).
Cuando se divide el rango intercuartil entre 2, se obtiene la desviacin cuartil, Q, que es una
medida de la dispersin estadstica:
Q = RIC / 2
Q = (Q3 Q1) / 2
15, 24, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35
Solucin Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al men Estadsticas y se elige Mostrar estadsticas descriptivas.
En el cuadro de dilogo se selecciona la variable, en este caso en la
columna C1, y en el botn estadsticas se marca primer cuartil, tercer
cuartil y rango intercuartil, y se da clic en Aceptar.
Adicionalmente, a travs del anlisis de la grfica de caja puede observar que tan simtrica es
la distribucin de los datos, pues si se tiene que la mediana est exactamente en la mitad de la
caja y que los bigotes izquierdo y derecho (o superior e inferior) son de igual longitud,
entonces indicar una distribucin simtrica. Conforme el bigote izquierdo sea ms largo que
el derecho (o el inferior ms largo que el superior) y ms cercana est la mediana del tercer
cuartil que del primero, entonces la distribucin ser ms asimtrica positiva o sesgada hacia
la derecha. Pero, en la medida que el bigote derecho sea ms largo que el izquierdo (o el
superior ms largo que el inferior) y ms cercana est la mediana del primer cuartil que del
tercero, entonces la distribucin ser ms asimtrica negativa o sesgada hacia la izquierda.
Utilice Minitab para elaborar una grfica de caja para cada conjunto de
datos.
Solucin Primero que todo se introducen los datos en la hoja de trabajo, cada
conjunto en una columna distinta, en este caso C1 para los futbolistas y C2
para los basquetbolistas. Luego se da clic en el men Grfica y se elige
Grfica de caja. En el cuadro de dilogo se selecciona Mltiples Y.
Despus se seleccionan las dos variables y se da clic en Aceptar.
2,2
2,1
Datos
2,0
1,9
1,8
1,7
C1 C2
Al comparar las dos grficas, se observa que las estaturas de los futbolistas
tienden a ser menores que las de los basquetbolistas, y que el tercer cuartil
de los primeros es, apenas, un poco superior que el primer cuartil de los
segundos.
60
50
40
30
20
10
0
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Luego se registran los casos nuevos que van ocurriendo cada mes. Si el
nmero mensual de casos se encuentra por debajo del primer cuartil,
indicara que las medidas de control han sido exitosas, pero si se
encuentran entre el primer cuartil y la mediana, entonces la situacin es
normal. La alarma se enciende si el nmero de casos supera la media, y se
considera que hay una epidemia si supera al valor del tercer cuartil.
Medidas de variabilidad
La dispersin o variabilidad en un conjunto de datos se refiere a que los valores son distintos
unos de otros. Ahora bien, la idea es establecer algn tipo de medida de esta variabilidad, que
permita saber qu tan homogneo o qu tan heterogneo es el conjunto de datos. Un modo de
definir esa medida es determinar qu tanto se alejan los datos de un valor tpico, como el
promedio. As, mientras ms heterognea sea la serie de datos, habr diferencias mayores de
los datos con respecto a su media. Lo contrario sucedera en una serie ms homognea, pues
los valores seran ms parecidos entre s, y entonces esas diferencias con respecto a la media
seran menores. En trminos generales, la variabilidad o dispersin de los datos, es el grado en
que los valores de una distribucin o serie numrica tienden a acercarse o alejarse alrededor
de un promedio.
El problema de la variabilidad
La variabilidad es un aspecto esencial de la estadstica. Si no hubiera variabilidad, no existira
el problema del muestreo, por ejemplo. Dado que las variables cambia de una unidad de
estudio a otra, entonces es necesario cuantificar ese grado de variabilidad o dispersin, lo cual
va a ser clave para muchos anlisis estadsticos.
Veamos un ejemplo del impacto de la variabilidad y de por qu no basta slo con las medidas
de posicin. Dos conjuntos de datos podran tener la misma media y ser totalmente distintos.
Por ejemplo, el conjunto A contiene a los datos 5, 5, 5, 5 y 5, mientras que el conjunto B
contiene a los datos 1, 1, 3, 10 y 10. Ambos conjuntos tienen una media de 5, pero en el
conjunto A la variabilidad es cero, ya que todos son iguales. Pero en el conjunto B los datos
son muy distintos unos de otros, es decir, la variabilidad es elevada.
Ejemplo Suponga que se tienen los dos siguientes conjuntos de cinco datos:
Conjunto A: 1, 2, 3, 7, 10
Conjunto B: 1, 9, 9, 10, 10
Rango = 10 1 = 9
Rango = 10 1 = 9
La varianza se expresa como o s si se calcula para datos de una poblacin o una muestra,
respectivamente.
La desviacin estndar se puede definir como la raz cuadrada de la varianza, o sea, la raz
cuadrada del promedio aritmtico de los cuadrados de las desviaciones de las observaciones
con respecto a su media aritmtica.
La desviacin estndar se designa con la letra griega minscula (sigma) cuando se trabaja
con una poblacin y con la letra s cuando se trabaja con una muestra.
Las frmulas para calcular la varianza en datos sin agrupar son, para poblacin y muestra
respectivamente:
(x i )2
2 i 1
N
(x i x )2
s2 i 1
n 1
Las frmulas para calcular la desviacin estndar en datos sin agrupar son, para poblacin y
muestra respectivamente:
N
(x i )2
i 1
2
N
(x i x )2
s i 1
s2
n 1
2
n
xi
i 1
n
x
2
i
n
s i 1
n 1
x i
1 1 3 10 10 25
x i 1
5
n 5 5
x xx x x 2
1 1 5 = 4 (4) = 16
1 1 5 = 4 (4) = 16
3 3 5 = 2 (2) = 4
10 10 5 = 5 (5) = 25
10 10 5 = 5 (5) = 25
Suma: (x x) 2
= 86
(x i x )2
86
s2 i 1
21.5
n 1 5 1
(x i x )2
s i 1
s2 21.5 4.64
n 1
Ejemplo Utilice Excel y Minitab para resolver el ejercicio: Suponga que se tiene el
siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular la
varianza y la desviacin estndar de dicha muestra.
Solucin En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A5:
=VAR(A1:A5)
=DESVEST(A1:A5)
Tambin, la desviacin estndar puede verse como una medida del riesgo. Si una inversin es
segura, va a dar el mismo rendimiento, o casi el mismo rendimiento, en cualquier caso. Pero
una inversin riesgosa podra dar grandes ganancias, pero tambin grandes prdidas, por lo
que su resultado es altamente variable.
La regla emprica
La desviacin estndar es de gran utilidad en una distribucin normal, ya que en dicha
distribucin en el intervalo determinado por se encuentra el 68,3% de los datos de la
serie; en el intervalo determinado por la 2 se encuentra el 95,4% de los datos y entre la
3 se encuentra la casi totalidad de los datos, es decir, el 99,7% de los datos; de donde se
puede derivar una regla general de gran utilidad para la comprobacin de los clculos. Esta
regla se conoce como Regla emprica.
Si el intervalo est definido por la media ms/menos una vez la desviacin estndar, o
sea, , la probabilidad es 68,3%
Si el intervalo est definido por la media ms/menos dos veces la desviacin estndar,
o sea, 2 , la probabilidad es 95,4%
Si el intervalo est definido por la media ms/menos tres veces la desviacin estndar,
o sea, 3 , la probabilidad es 99,7%
Solucin Se tiene una media de $600 con una desviacin estndar de $30, y el
intervalo dado est entre $510 y $690. Para aplicar la regla emprica es
necesario saber cuntas veces se ha sumado y restado la desviacin
estndar al promedio. Esto puede obtenerse fcilmente porque se sabe que
cada lmite se obtuvo a partir de k , as que, tomando el lmite
inferior de 510 (y por eso va con signo menos):
600 k * 30 510
k * 30 510 600
k 90 / 30
k 3
Teorema de Chebyshev
La regla emprica dada anteriormente solo se aplica cuando la distribucin es normal, pero es
posible generalizar esa regla cuando la distribucin sea distinta? Es posible construir
intervalos de modo similar, pero las probabilidades van a cambiar. Segn el teorema de
Chebyshev estas probabilidades van a estar dadas por:
1
1
k2
donde k es el nmero de veces que se suma y resta la desviacin estndar, k > 1. Entonces, si
el intervalo se construye como 3 , se tiene que k = 3, por tanto, la probabilidad ser:
1 1 1 8
1 2
1 2 1 0,889
k 3 9 9
Solucin Se tiene una media de $600 con una desviacin estndar de $30, y el
intervalo dado est entre $525 y $675. Para aplicar el teorema de
Chebyshev es necesario saber cuntas veces se ha sumado y restado la
desviacin estndar al promedio. Esto puede obtenerse fcilmente porque
se sabe que cada lmite se obtuvo a partir de k , as que, tomando el
lmite inferior de 525 (y por eso va con signo menos):
600 k * 30 525
k * 30 525 600
k 75 / 30
k 2,5
sustituyendo k = 2,5:
1 1 1
1 2
1 2
1 0,84
k 2,5 6,25
Ejercicio Las botellas de agua envasadas en un proceso de llenado tienen una media
de 501 ml con una desviacin estndar de 2 ml.
de
revisin a. Si no se conoce si la distribucin es simtrica o asimtrica, qu
porcentaje de las botellas podran tener entre 497 ml y 505 ml de agua?
b. Cmo cambia su respuesta anterior si se sabe que la distribucin del
contenido de agua en las botellas se distribuye normalmente?
Puntajes estandarizados
Considere la siguiente situacin: una persona ha realizado una prueba de aptitud acadmica,
que mide la capacidad del razonamiento verbal, cuantitativo y analtico, entre otras destrezas.
Esta persona obtuvo una puntuacin de 40 en el rea de aptitud verbal y 42 puntos en la de
matemticas y razonamiento analtico. Es cierto que tiene mejores destrezas para el
razonamiento cuantitativo que para el verbal? Para poder responder se requiere un poco ms
de informacin. Segn la institucin que desarrolla la prueba, la seccin de aptitud verbal
tiene una media de 44 puntos con una desviacin estndar de 11 puntos, mientras que la
seccin de razonamiento matemtico tiene una media de 50 puntos con una desviacin
estndar de 9 puntos. Entonces, se puede emplear la desviacin estndar como una especie de
unidad de medida para realizar comparaciones entre datos con diferente media, e incluso con
distintas unidades de medicin. En una situacin como esta se pueden calcular los puntajes
estandarizados, que consisten en tomar un valor de una variable y restarle su media, para
luego dividirlo entre su desviacin estndar. Este resultado va a indicar "cuntas desviaciones
estndar se aleja un dato de su media". La frmula para calcular los puntajes estandarizados
sera:
x
z
x 40 44
z 0,36
11
El resultado es negativo porque su puntuacin est por debajo de la media e indica que su
resultado est 0,36 veces la desviacin estndar por debajo del promedio.
x 42 50
z 0,89
9
Ejemplo Se sabe que los recin nacidos varones de una ciudad tienen un peso medio
de 3.450 gramos, con una desviacin estndar de 75 gramos, mientras que
los recin nacidos varones de una zona rural tienen un peso medio de
3.350 gramos con una desviacin estndar de 100 gramos. Una madre
residente de esa ciudad acaba de tener un nio con un peso de 3.475
gramos y otra madre residente de la zona rural dada acaba de tener un nio
con un peso de 3.450 gramos, cul de los dos nios tiene, en trminos
relativos, un peso mayor?
x 3475 3450
z 0,33
75
x 3450 3350
z 1
100
CV 100
s
CV 100
x
Ejemplo En el caso del conjunto de datos anterior, se calcul una media de 5 y una
desviacin estndar de 4.64, calcule el coeficiente de variacin.
Solucin Dado que se calcul una media de 5 y una desviacin estndar de 4.64,
entonces el coeficiente de variacin es:
s 4.64
CV 100 100 92.74%
x 5
Ejemplo Utilice Minitab para resolver el ejercicio: Suponga que se tiene el siguiente
conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular el coeficiente de
variacin de dicha muestra.
Solucin En Minitab, primero se introducen los datos en una columna, por ejemplo,
en la columna C1:
24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 27, 27, 28, 29, 30
24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 27, 27, 28, 29, 30
Solucin El primer paso es digitar estos datos en una columna de la hoja de trabajo
de Minitab, por ejemplo, en la columna C1. Luego se da clic en el men
Estadsticas, se selecciona Estadstica bsica y ah se elige Resumen
grfico.
Resumen para C1
P rueba de normalidad de A nderson-Darling
A -cuadrado 0,64
V alor P 0,078
M edia 26,133
Desv .Est. 1,767
V arianza 3,124
A simetra 0,932550
Kurtosis 0,217419
N 15
M nimo 24,000
1er cuartil 25,000
M ediana 26,000
3er cuartil 27,000
24 25 26 27 28 29 30 M ximo 30,000
Interv alo de confianza de 95% para la media
25,155 27,112
Interv alo de confianza de 95% para la mediana
25,000 27,000
Interv alo de confianza de 95% para la desv iacin estndar
Intervalos de confianza de 95%
1,294 2,787
Media
Mediana
Medidas de posicin
Medida Significado Uso
Moda El valor que ms se repite. Se usa sobre todo en variables
cualitativas para indicar lo ms
frecuente, aunque tambin se puede
usar en variables cuantitativas.
Mediana Es un valor mayor que el 50% de los Se usan para describir el conjunto y
datos y menor que el restante 50%. es muy til cuando la distribucin de
los datos no es simtrica y hay
valores extremos.
Deciles Son valores que dividen al conjunto Se usa para indicar la posicin
de datos en 10 partes. As, el D6 es relativa de un valor con respecto a
un valor que es mayor que un 60% los dems. Cada decil equivale a un
de los datos y menor que el restante percentil. Por ejemplo D6 = P60.
40%.
Percentiles Son valores que dividen al conjunto Se usa para indicar la posicin
de datos en 100 partes. Por ejemplo, relativa de un valor con respecto a
el P38 es un valor que es mayor que los dems.
un 38% de los datos y menor que el
restante 62%.
Medidas de variabilidad
Medida Significado Uso
Rango o Es la diferencia entre el valor Se usa para medir la variabilidad de
recorrido mximo y el mnimo de un conjunto los datos, pero es una medida
de datos. deficiente.
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se le presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
0,4 0,5 0,0 0,1 0,0 0,2 0,6 0,2 0,1 0,0
0,2 0,3 0,6 0,2 0,3 0,4 0,3 0,2 0,1 0,0
3. Los siguientes son los pesos, en gramos, de una muestra de frascos de mermelada que se
envasan en una empresa:
252, 260, 266, 248, 240, 246, 255, 260, 270, 258, 259, 260, 264, 254, 256, 262
4. Los siguientes datos corresponden a las tasas de pobreza de un pas en el transcurso de los
ltimos 12 aos:
Con base en los datos anteriores, conteste las siguientes preguntas (incluya todos los clculos
y procedimientos necesarios):
a. Calcule la tasa media de pobreza en el periodo citado e interprete el resultado.
b. Calcule la tasa mediana de pobreza en el periodo citado e interprete el resultado.
c. Calcule la tasa de pobreza ms frecuente en el periodo citado e interprete el
resultado.
d. Qu puede decirse sobre la simetra de las tasas de pobreza de este pas en el
periodo dado? Explique la forma de la distribucin de las tasas de pobreza basndose
en los indicadores adecuados.
5. Un contador est realizando una auditora de los cheques extendidos por una compaa. En
una muestra de 15 cheques se obtuvieron los siguientes montos, en miles dlares:
6. En una muestra de 12 personas con miopa elevada superior a 12,00 D se midieron algunos
parmetros biomtricos de sus ojos, como la longitud axial. Los resultados fueron los
siguientes:
6 27
7 25
8 29
9 31
10 30
11 31
12 33
13 29
14 31
15 29
16 32
17 29
Con base en estos datos calcule las medidas de tendencia central e indique si la distribucin
de esta variable es simtrica o asimtrica.
45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88
Calcule:
a. Cuartil 1
b. Cuartil 3
c. Decil 7
d. Percentil 42
e. Percentil 93
f. Quintil 3
45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88
10. Un mdico ha reunido los siguientes datos sobre la estancia hospitalaria en horas de una
muestra de 10 neonatos en la unidad de cuidados intensivos de un hospital:
Con base en los datos anteriores, calcule las siguientes medidas descriptivas (incluya todos los
clculos y procedimientos necesarios):
a. Mediana
b. Media aritmtica
c. Percentil 95
d. Desviacin estndar
e. Interprete cada uno de los resultados anteriores.
45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88
45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88
15. Los siguientes son los tiempos de funcionamiento, en horas, de un tipo de componente
electrnico: 100, 110, 80, 95, 97, 82, 113, 128, 116, 98, 99, 105, 187, 114, 121, 104, 118, 109.
Construya la grfica de caja e interprtela. Puede identificarse valores extremos?
16. Un ingeniero ha recopilado datos sobre la vida til de 20 filtros de gasolina del mismo
tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15, 10, 20, 13,
15, 16, 14, 12, 13, 11, 13, 15, 16, 13, 14, 14, 12.
17. En un pas el 25% de los hogares con menos recursos reciben un ingreso mensual
promedio, por persona, de $125. En el otro extremo, el 25% de los hogares con mayores
ingresos, reciben, en promedio, por persona, $1970 por mes.
45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88
19. Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de
personas seleccionadas al azar dura en completar una prueba:
55, 81, 92, 74, 58, 62, 84, 60, 90, 57, 82, 66, 90, 57, 74, 73, 67, 74, 88, 65, 68, 70, 98, 82
20. Una enfermera ha reunido los siguientes datos sobre la cantidad de horas extra semanales
laboradas por 12 enfermeras de la unidad de cuidados intensivos de un hospital:
Con base en los datos anteriores, calcule las siguientes medidas descriptivas (incluya todos los
clculos y procedimientos necesarios):
a. Mediana
b. Media aritmtica
c. Percentil 65
d. Desviacin estndar
e. Interprete cada uno de los resultados anteriores:
21. Dado el siguiente conjunto de datos sobre el nmero de turistas que se hospedan en un
hotel por semana en una muestra de 22 semanas seleccionadas al azar:
25 81 92 44 58 62 34 40 90 57 42
40 57 57 57 57 62 40 65 58 50 18
19,3 18,1 17,2 16,5 21,6 19,7 16,6 14,2 19,4 19,3
18,7 17,1 11,6 16,4 15,8 16,8 17,9 16,4 19,3 12,9
23. Una maestra ha reunido los siguientes datos sobre la talla en centmetros de nias de una
institucin preescolar. Los datos corresponden a cinco grupos de la institucin. Los datos se
presentan a continuacin:
Con base en los datos anteriores relativos a la zona indicada, calcule las siguientes medidas
descriptivas (incluya todos los clculos y procedimientos necesarios):
a. Moda del grupo 1
b. Mediana del grupo 2
c. Media aritmtica del grupo 3
d. Primer cuartil del grupo 4
e. Percentil 85 del grupo 5
f. Desviacin estndar del grupo 5
g. Interprete cada uno de los resultados anteriores:
h. Qu puede decirse de la simetra o asimetra de la distribucin de los datos en el
grupo nmero 2?
i. Con base en los resultados calculados, es cierto que un nio del grupo 1 con una
talla de 102 centmetros es relativamente pequeo? Explique basndose en los datos.
j. Cul grupo tiene mayor variabilidad relativa: el grupo 2 o el grupo 3?
k. Construya e interprete la grfica de caja para los datos del grupo 4.
24. Suponga que se realiz un estudio en el que se compar la efectividad de dos mtodos de
enseanza A y B en una escuela rural. Luego de aplicar exmenes a los estudiantes se
obtuvieron los siguientes resultados:
Mtodo de enseanza A B
Media aritmtica 74,5 74,9
Desviacin estndar 11,3 24,6
Mediana 72 68
Moda 71 65
35 69 50 41 51 49 31 27 66 78 56 46
45 47 49 33 24 55 49 51 46 47 46 47
Con base en los datos anteriores, calcule e interprete las siguientes medidas descriptivas
siguientes (incluya todos los clculos y procedimientos necesarios):
a. Mediana
b. Moda
c. Media aritmtica
d. Percentil 85
e. Cuartil 1
f. Cuartil 3
g. Desviacin estndar
h. Con base en los datos suministrados, utilice las medidas de posicin central para
determinar si la distribucin de los datos es simtrica o asimtrica. Explique.
i. Dada la respuesta anterior, cul medida preferira en este caso para describir el
comportamiento de los datos? Explique.
j. Con base en los datos suministrados, construya el diagrama de caja para la variable
resultado de la aplicacin del instrumento estandarizado para la medicin de los
aprendizajes en preescolares de 5 aos.
k. Al analizar la grfica de caja, qu se puede afirmar sobre la dispersin de los
datos? Explique. Al analizar la grfica de caja, qu se puede concluir sobre la forma
de la distribucin de los datos (simetra o asimetra)? Explique.
26. Una trabajadora social est preocupada por el consumo de drogas ilegales entre los
estudiantes de secundaria de una comunidad marginal del pas llamada ciudadela Los Robles.
Una muestra de 18 estudiantes varones del liceo local report las siguientes cifras como la
edad en que se inici el consumo de drogas ilegales:
14 17 16 13 15 16 13 14 15 12 16 18 15 14 11 13 15 8
Con base en los datos anteriores, calcule e interprete cada una de las siguientes medidas
descriptivas:
a. Moda
b. Mediana
c. Media aritmtica
d. Rango intercuartil
e. Percentil 85
f. Desviacin estndar
g. Qu puede decirse de la simetra o asimetra de la distribucin de los datos
anteriores sobre la variable edad de inicio en el consumo de drogas?
h. Establezca un intervalo que incluya aproximadamente al 75% de las observaciones,
tomando como base los datos de la pregunta uno sobre las edades de inicio en el
consumo de drogas.
i. Un estudio similar en otra comunidad, llamada San Juan, determin una edad
promedio de inicio en el consumo de drogas entre varones estudiantes de secundaria
de 15,85 aos con una desviacin estndar de 3,1 aos.
i.1. Cul de las dos comunidades presenta mayor homogeneidad en cuanto a
las edades en el inicio del consumo de drogas de los varones estudiantes de
secundaria? Explique basndose en los clculos adecuados.
i.2. Suponga que Luis vive en Los Robles y empez a consumir drogas a los 16
aos. Roberto vive en San Juan y empez a consumir drogas a los 18 aos. En
trminos de relativos, cul de los dos empez a consumir drogas a menor
edad?
j. Con respecto a la variable edad de inicio del consumo de drogas en la comunidad de
Los Robles:
j.1. Construya el diagrama de caja. Incluya todos los clculos y la grfica con
la escala adecuada.
j.2. Qu puede concluirse sobre la dispersin de los datos a partir de la grfica
anterior? Bsese en las medidas de variabilidad asociadas con la mediana.
j.3. Qu puede concluirse sobre la simetra o asimetra de los datos? Utilice la
grfica para responder.
27. Segn un estudio de una agencia de publicidad sobre el nmero de horas de televisin por
semana que ven los jvenes entre 12 y 18 de una zona del pas poseen las siguientes
caractersticas (todas en horas por semana):
2. La media aritmtica del siguiente conjunto de datos 7, 20, 13, 14, 6, 9, 1 es:
( a ) 70 ( b ) 20
( c ) 14 ( d ) 10
3. La moda del siguiente conjunto de datos 7, 7, 20, 20, 13, 14, 13, 6, 9, 13, 6 es:
(a)7 ( b ) 20
( c ) 13 (d)6
4. La media aritmtica del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36
5. La mediana del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36
6. La moda del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 20, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36
7. El primer cuartil del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
(a)7 ( b ) 20
( c ) 13 (d)6
8. El tercer cuartil del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 14 ( b ) 20
( c ) 13 ( d ) 17
9. El percentil 30 del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 7,6 ( b ) 10
(c)7 (d)6
10. El percentil 70 del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
(a)7 ( b ) 20
( c ) 13,4 (d)6
11. La desviacin estndar del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6
es:
( a ) 25,45 ( b ) 5,05
( c ) 1,52 ( d ) 44,4
12. La varianza del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 25,45 ( b ) 5,05
( c ) 1,52 ( d ) 44,4
13. Si en una muestra, la media es igual a la moda y a la mediana, entonces se concluye que:
Con respecto a las dos afirmaciones anteriores, es correcto que con toda certeza:
( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas
14. Si dos valores en un grupo de datos ocurren ms a menudo que otros cualesquiera, la
distribucin de los datos ser ___________. La opcin que mejor completa la frase anterior
es:
( a ) Simtrica ( b ) Bimodal
( c ) Asimtrica positiva ( d ) Asimtrica negativa
17. Cul de los siguientes enunciados no es una ventaja del uso de la mediana?
( a ) Los valores extremos afectan a la mediana menos intensamente que a la media
( b ) La mediana es fcil de entender
( c ) Una mediana puede calcularse para descripciones cualitativas
( d ) Ninguna de las anteriores
20. Si un grupo de datos tiene tan slo una moda y el valor de la moda es menor que el de la
media, podremos llegar a la conclusin de que la grfica de la distribucin es:
( a ) Simtrica ( b ) Sesgada a la izquierda
( c ) Sesgada ala derecha ( d ) Platicrtica
23. Cul de los siguientes casos es un ejemplo de una medida relativa de dispersin?
( a ) Desviacin estndar
( b ) Varianza
( c ) Coeficiente de variacin
( d ) Las opciones a y b pero no c
24. Si p es el mayor de tres enteros consecutivos, entonces el promedio de los tres nmeros
es:
(a)p (b)p1
(c)p3 ( d ) 3p 1
26. El gerente de un centro de llamadas desea evaluar el desempeo de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles y 20 llamadas el jueves y el viernes. Los siguientes son los
tiempos de las muestras tomadas de lunes a mircoles. El lunes y el martes se tomaron
tiempos de llamadas atendidas y el mircoles solo de llamadas no atendidas:
Mircoles 30 40 45 45 50 50 45 35 60 50 80 100
28. El tiempo medio de espera de los clientes de la muestra del da martes es, en segundos:
( a ) 15 ( b ) 19
( c ) 16 ( d ) Ninguna de las anteriores
29. La mediana del tiempo de espera de los clientes de la muestra del da martes es, en
segundos:
( a ) 15 ( b ) 19
( c ) 16 ( d ) Ninguna de las anteriores
30. La moda del tiempo de espera de los clientes de la muestra del da lunes es, en segundos:
( a ) 15 ( b ) 15,5
( c ) 16 ( d ) Ninguna de las anteriores
36. La desviacin estndar de los tiempos de espera del da martes es, en segundos:
( a ) 5,5 (b)8
38. Con relacin a la variabilidad relativa de los tiempos de espera es verdadero que el da
cuyos tiempos tienen una dispersin relativa ms baja es:
( a ) Lunes ( b ) Martes
( c ) Mircoles ( d ) Falta informacin para determinarlo
40. Si el primer cuartil para los tiempos de espera del da viernes es de 14,6 segundos,
entonces es falso que:
( a ) Un 25% de los clientes de ese da esperaron 14,6 segundos o menos
( b ) Un 75% de los clientes de ese da esperaron 14,6 segundos o ms
( c ) Un cliente que esper 12 segundos esper poco con respecto a los dems
( d ) Ninguna de las anteriores
41. Si la mediana para los tiempos de espera del da viernes es de 19,8 segundos, entonces es
falso, con toda certeza, que:
( a ) Un 50% de los clientes de ese da esperaron 19,8 segundos o menos
( b ) El tiempo de espera promedio de ese da fue de 19,8 segundos
( c ) La mayora de los clientes esperaron ms de 19,8 segundos
( d ) Ninguna de las anteriores
42. Si la media para los tiempos de espera del da viernes es de 21,3 segundos, entonces es
verdadero que:
( a ) La mitad de los clientes esperaron 21,3 segundos o menos
( b ) Un 50% de los clientes de ese da esperaron 21,3 segundos o ms
( c ) El tiempo ms frecuente fue 21,3 segundos
( d ) Todas las anteriores son falsas
43. Si la media para los tiempos de espera es de 21,3 segundos y la desviacin estndar para
los tiempos de espera del da viernes es de 7,6 segundos, entonces es verdadero que:
( a ) Los tiempos de espera tuvieron una variabilidad de 7,6 segundos con relacin a su media
( b ) Aproximadamente un 68,3% de los clientes esperaron entre 13,7 y 28,9 segundos
( c ) Aproximadamente un 95,4% de los clientes esperaron entre 6,1 y 36,5 segundos
( d ) Todas las anteriores son verdaderas
1. d 2. d 3. c 4. d 5. b
6. a 7. a 8. a 9. a 10. c
11. b 12. a 13. d 14. b 15. d
16. a 17. d 18. d 19. a 20. b
4 .
Distribuciones de frecuencias
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Construir la tabla de una distribucin de frecuencias.
Representar grficamente los datos provenientes de una distribucin de frecuencias.
Calcular e interpretar las principales medidas de posicin en datos agrupados.
Calcular e interpretar las principales medidas de variabilidad en datos agrupados.
Distribuciones de frecuencias
Necesidad de resumir la informacin
Cuando se tiene un conjunto grande de datos, por ejemplo de 2000 datos, no es fcil poder
determinar por la simple observacin de todos esos datos caractersticas de la forma en que se
distribuyen ni conocer medidas que describen al conjunto, como la media, la mediana, la
desviacin estndar, etc. Entonces es necesario contar con alguna herramienta que permita
resumir la informacin. Un modo de hacer esto es agrupando las observaciones en grupos o
clases, o sea, en una distribucin de frecuencias.
En una distribucin de frecuencias se crean clases y a cada clase se le asocia con una
frecuencia. Es decir, se determina cuntas veces aparecen datos en cada una de las clases. La
distribucin de frecuencias es una tabla de datos estadsticos agrupados en clases que
muestra la frecuencia asociada con cada clase.
Las distribuciones de frecuencias pueden ser tiles para clasificar tanto variables cualitativas
como cuantitativas, sean stas discretas o continuas. A continuacin se dan algunos ejemplos:
19 25 32 40 21 28 56 27 31 29
41 36 32 18 50 48 25 33 35 26
28 24 22 27 35 26 43 34 43 39
Determinacin del rango o amplitud total: Esto consiste en encontrar la diferencia entre
el dato ms alto y el ms bajo. En este caso:
Dato mayor: 56
Dato menor: 18
Rango = dato mayor menos dato menor = 56 18 = 38
Seleccin del intervalo de clase (c): No es prctico que la distribucin de frecuencias tenga
muchas clases, pero tampoco demasiado pocas. Generalmente se recomienda entre un mnimo
de 5 clases y un mximo de 15. Entonces se divide el rango entre 6 y entre 15:
38 5 = 7,6 38 15 = 2,53
Esto quiere decir que cualquier nmero entero entre 2,53 y 7,6 puede escogerse como
intervalo de clase. Generalmente se prefieren los nmero impares, por ejemplo c = 5.
Tambin, para determinar cuntas clases crear, se puede utilizar la siguiente frmula (frmula
de Sturges):
Determinacin de los lmites de clase: Los lmites de clase deben elegirse de modo que el
valor medio coincida, hasta donde sea posible, con los valores en cuyo derredor tiendan a
concentrarse los datos. Cabe sealar que se establece la diferencia entre lmites reales y
lmites indicados. Los lmites reales sern los que se emplearn en el clculo de los puntos
medios y los dems clculos posteriores. Ejemplo:
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos):
de
revisin 12, 16, 8, 22, 14, 12, 13, 19, 17, 10,
21, 25, 23, 18, 14, 9, 14, 16, 10, 12,
15, 16, 16, 17, 12, 11, 11, 19, 20, 15
Tabulacin de los datos: Esto consiste en distribuir los datos entre las clases seleccionadas.
Generalmente se redondea a la unidad inmediata superior si el primer decimal del dato es 5 o
ms.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos):
de
revisin 12, 16, 8, 22, 14, 12, 13, 19, 17, 10,
21, 25, 23, 18, 14, 9, 14, 16, 10, 12,
15, 16, 16, 17, 12, 11, 11, 19, 20, 15
Si los siguientes son los lmites reales, determine las frecuencias absolutas
de cada clase:
Clculo de los puntos medios: El punto medio es el valor central de la clase. Se obtiene
como el promedio entre el lmite superior y el lmite inferior de cada clase. Se denotarn
como x i .
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine los puntos
de medios de cada clase:
revisin
Lmites reales Puntos medios
7,5 - 10,5
10,5 - 13,5
13,5 - 16,5
16,5 - 19,5
19,5 - 22,5
22,5 - 25,5
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias relativas de cada clase:
revisin
Lmites Frecuencia Frecuencia
reales absoluta relativa
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias absolutas acumuladas a menos de y a ms de de cada clase:
revisin
Lmites Frecuencia Frecuencia acumulada
reales absoluta a menos de a ms de
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias relativa acumuladas a menos de y a ms de de cada clase:
revisin
Lmites Frecuencia Frecuencia acumulada
reales relativa a menos de a ms de
7,5 - 10,5 13,33%
10,5 - 13,5 23,33%
13,5 - 16,5 30,00%
16,5 - 19,5 16,67%
19,5 - 22,5 10,00%
22,5 - 25,5 6,67%
Total 30
Un histograma es un grfico que se forma construyendo rectngulos sobre cada uno de los
lmites reales de cada intervalo, cuya altura equivale a la frecuencia absoluta o relativa de
cada clase. En el histograma el valor de la variable aparece en el eje horizontal y la frecuencia
absoluta o relativa en el eje vertical. El histograma se emplea para presentar los datos cuando
estos corresponden a los valores de una variable cuantitativa continua, no una variable
discreta ni cualitativa. Es por eso que, para sealar la continuidad de la variable, no se dejan
espacios entre las barras.
19 25 32 40 21 28 56 27 31 29
41 36 32 18 50 48 25 33 35 26
28 24 22 27 35 26 43 34 43 39
Solucin En Excel, primero se introducen los datos en una columna (o una fila). En
este caso se introducen los datos en el rango de celdas A1 hasta A30.
Histograma de C1
Frecuencia
4
0
20 25 30 35 40 45 50 55
C1
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), construya un
de histograma para esta variable:
revisin
Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Un polgono de frecuencias es una lnea que conecta los puntos medios de todas y cada una
de las barras de un histograma. En el polgono de frecuencias el valor de la variable aparece
en el eje horizontal y la frecuencia absoluta o relativa en el eje vertical. El siguiente es un
ejemplo de un polgono de frecuencias:
Tambin es posible construir los diagramas de las frecuencias acumuladas, tambin llamadas
ojivas, tanto a ms de como a menos de:
Frecuncia
absoluta Ojivas
acumulada
30
Ojiva a menos de
27
24
21
18
15
12
9
6
3
0
Ojiva a ms de
17,5 22,5 27,5 32,5 37,5 42,5 47,5 52,5 57,5 X
Para hallar la moda se emplea la siguiente frmula, la cual se aplica a la clase modal, es decir,
la clase con la frecuencia absoluta ms alta:
d1
M o Li c
d1 d 2
donde:
Mo : valor de la moda
Li : lmite inferior real de la clase modal
c: intervalo de la clase modal
d1 : diferencia entre la frecuencia de la clase modal y la pre modal
d2 : diferencia entre la frecuencia de la clase modal y la pos modal
Calcule la moda.
Solucin La clase modal es la tercer clase, cuyos lmites reales son 27,5 32,5, su
lmite inferior real es 27,5, su intervalo de clase es 5 (lmite superior
menos lmite inferior = 32,5 27,5 = 5) y su frecuencia absoluta es 8. La
clase pre modal (22,5 27,5) tiene frecuencia 5 (por tanto d1 = 8 5 = 3) y
la pos modal (32,5 37,5) tiene frecuencia tambin de 5 (por tanto d2 = 8
5 = 3). El clculo es:
d1 (8 5)
M o Li c 27.5 5 30
d1 d 2 (8 5) (8 5)
La moda es 30.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la moda:
de
revisin Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
La mediana:
Tampoco es posible conocer el valor de la mediana con toda precisin en el caso de
distribuciones de frecuencias con datos agrupados, pero si es posible identificar la clase
mediana (clase donde est la mediana), como aquella cuya frecuencia acumulada menos de
es apenas mayor a n/2. El clculo de la mediana implica el uso de la siguiente frmula:
n Fi 1
Med Li c 2
fi
donde:
Med : valor de la mediana
Li : lmite inferior real de la clase mediana
c: intervalo de la clase mediana
n: nmero total de datos en la distribucin de frecuencias
Fi1 : frecuencia acumulada menos de de la clase pre mediana
fi : frecuencia absoluta de la clase mediana
Calcule la mediana.
Solucin Se tiene que n = 30, por tanto n/2 = 30/2 = 15, lo que quiere decir que la
clase mediana ser la tercer clase, ya que su frecuencia acumulada menos
de es 17, que es la que apenas supera a 15. El lmite inferior de la clase es
27,5, el intervalo de la clase es 5, la frecuencia acumulada de la clase pre
mediana es 9 y la frecuencia de la clase mediana es 8. Aplicando la
frmula:
n Fi 1 30 9
Med Li c 2 27,5 5 2 27,5 5 6 31,25
fi 8 8
La mediana es 31,25.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la mediana:
de
revisin Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
La media aritmtica:
Para calcular la media aritmtica se emplean los puntos medios de cada clase y sus
frecuencias absolutas, como sigue:
x i fi
x i 1
Aplicando la frmula:
k
x i fi
985
x i 1
32,83
n 30
La media es 32,83.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la media:
de
revisin Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
El ndice Promedio Industrial Dow Jones (DJIA, por sus siglas en ingls)
es un promedio ponderado que se calcula a partir de los precios de las
acciones de las 30 mayores empresas transadas en la Bolsa de Valores de
Nueva York. En el ndice se incluyen acciones de empresas como General
Electric, Exxon Mobil, DuPont, 3M, Coca Cola, AT&T, Intel, etc.
Percentiles y cuartilos:
El clculo de los percentiles y los cuartilos es similar al de la mediana. Igual que en el caso de
datos no agrupados, los cuartiles, deciles y quintiles se convierten al percentil equivalente.
Para el clculo se emplea la frmula siguiente:
m
100 n Fi 1
Pm Li c
fi
mn Fi 1 75 x30 22
Q3 P75 Li c 100 37,5 5 100
fi 3
0,5
37,5 5 38,33
3
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule el primer cuartil
de y el percentil 70:
revisin
Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
(x i )2 fi
2 i 1
N
(x i x )2 fi
s2 i 1
n 1
2
n
xi f i
xi f i i 1
n
n
s 2 i 1
n 1
xi absoluta fi fr fi n acumulada
menos de
17,5 22,5 20 4 13,33% 13,33%
22,5 27,5 25 5 16,67% 30,00%
27,5 32,5 30 8 26,67% 56,67%
32,5 37,5 35 5 16,67% 73,33%
37,5 42,5 40 3 10,00% 83,33%
42,5 47,5 45 2 6,67% 90,00%
47,5 52,5 50 2 6,67% 96,67%
52,5 57,5 55 1 3,33% 100,00%
Total 30 100,00%
Puntos Frecuencia
medios x i absoluta f i
( xi x ) ( xi x ) 2 ( xi x ) 2 f i
20 4 12,83 164,69 658,78
25 5 7,83 61,36 306,81
30 8 2,83 8,03 64,22
35 5 2,17 4,69 23,47
40 3 7,17 51,36 154,08
45 2 12,17 148,03 296,06
50 2 17,17 294,69 589,39
55 1 22,17 491,36 491,36
30 Total 2584,17
Aplicando la frmula:
(x i x )2 fi
2584,17
s2 i 1
89,11
n 1 30 1
s s 2 89,11 9,44
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la varianza y la
de desviacin estndar:
revisin
Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se le presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
1. Un mdico ha reunido los siguientes datos sobre la estancia hospitalaria en horas de una
muestra de 40 neonatos en la unidad de cuidados intensivos de un hospital:
Con base en estos datos, construya una tabla de distribucin de frecuencias (con 8 clases) y
elabore el histograma para las frecuencias relativas.
2. En los datos recopilados por la enfermera encontr los datos de los siguientes tiempos de
espera de los pacientes, en minutos. Los siguientes son algunos de los datos.
15 8 12 20 28 45 43 19 9 5 32 33 36 52 47
34 28 27 10 12 8 15 16 18 19 24 27 28 26 23
38 40 42 44 46 48 40 38 37 37 32 22 26 31 34
32 37 33 35 36 34 31 39 29 51 48 21 38
Con base en esos datos, construya una tabla de una distribucin de frecuencias de 7 clases.
Indique el rango, el intervalo de clase, los lmites de clase reales, frecuencia absoluta,
frecuencia relativa, frecuencia absoluta acumulada menos de y frecuencia relativa acumulada
menos de.
3. En una muestra de 12 personas con miopa elevada superior a 12,00 D se midieron algunos
parmetros biomtricos de sus ojos, como la longitud axial. Los resultados fueron los
siguientes:
25 28 26 30 28 27 25 29 31 30 31 33 29 31 29 32 29
Construya el histograma para esta variable (utilice 6 clases) e indique si la distribucin de esta
variable es simtrica o asimtrica.
5. Un ingeniero ha recopilado datos sobre la vida til de una muestra de filtros de gasolina del
mismo tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15, 10,
20, 13, 15, 16, 14, 12, 13, 13, 15, 16, 13, 14, 14, 12, 8, 10, 16, 14, 12, 13, 11, 13, 9, 19, 22.
Construya la tabla de la distribucin de frecuencias.
18 25 20 17 24 12 16 12 18 8
12 13 16 21 19 14 13 22 17 10
24 25 20 19 22 19 16 17 17 10
21 23 26 29 17 14 30 20 18 23
7. Despus de examinar los registros de facturacin mensual de una compaa de ventas por
internet, un auditor toma una muestra de 30 cuentas por cobrar, obteniendo las siguientes
cantidades que distintos clientes deben a la empresa (en miles de dlares):
9 10 10 10 11 11 11 12 14 15
15 17 17 18 18 19 19 19 19 21
25 26 26 32 33 34 34 37 38 40
8. Un contador est realizando una auditora de los cheques extendidos por una compaa. En
una muestra de 20 cheques se obtuvieron los siguientes montos, en miles dlares:
15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6, 8, 12, 19, 11, 12
9. Los siguientes datos corresponden a la demanda, en unidades al mes, que los consumidores
de un producto estaran dispuestos a comprar a un determinado precio: 5, 8, 12, 14, 21, 18, 6,
14, 15, 24, 32, 17, 15, 4, 5, 9, 7, 28, 26, 22, 20, 17, 15, 14, 13, 11, 8, 9, 16, 10, 11, 12, 16, 15,
17, 12, 13, 14, 18, 15, 12, 11, 16.
10. Dado el siguiente conjunto de datos sobre el nmero de turistas que se hospedan en un
hotel por semana en una muestra de 22 semanas seleccionadas al azar:
25 81 92 44 58 62 34 40 90 57 42
40 57 57 57 57 62 40 65 58 50 18
11. Los siguientes datos corresponden a una muestra de personas que aplicaron un test para
medir su cociente intelectual: 102, 98, 95, 100, 99, 112, 125, 85, 83, 100, 98, 129, 78, 100,
116, 101, 102, 101, 96, 100, 103, 97, 100, 97, 98, 99, 103, 102, 95, 101, 98, 100, 98, 99, 101,
102, 99, 103, 101. Construya la tabla de la distribucin de frecuencias y con base en ella
calcule los percentiles 20, 40, 60, 80 y 90.
12. Una trabajadora social est preocupada por el consumo de drogas ilegales entre los
estudiantes de secundaria de una comunidad marginal del pas llamada ciudadela Los Robles.
Una muestra de 18 estudiantes varones del liceo local report las siguientes cifras como la
edad en que se inici el consumo de drogas ilegales:
14 17 16 13 15 16 13 14 15
12 16 18 15 14 11 13 15 8
12 15 16 15 19 9 10 11 10
Con base en los datos anteriores, construya la tabla de la distribucin de frecuencias (usando 5
clases) y a partir de ella calcule e intrprete cada una de las siguientes medidas descriptivas:
a. Moda
b. Mediana
c. Media aritmtica
d. Cuartil 3
e. Percentil 85
f. Desviacin estndar
13. Con relacin a los datos suministrados a cerca de la siguiente distribucin de frecuencias,
complete la tabla.
75, 85, 96, 62, 46, 80, 81, 80, 82, 63, 28, 65, 72, 35, 40, 43, 52, 40, 49, 53, 52, 40, 42, 42, 65, 58,
60, 49, 50, 41, 42, 42, 42, 42, 48, 49, 44, 45, 56, 43, 80, 81, 80, 82, 63, 28, 65, 72, 35, 40, 43, 52,
40, 49, 53, 52, 40, 42, 42, 65, 58, 60, 49, 50, 41, 42, 42, 42, 42
Frec. Frec.
Frecuencia Frecuencia
Lmites Puntos Frecuencia Frecuencia Relativa Relativa
abs. acum. abs. acum.
reales medios absoluta relativa acum. a acum. a
a menos de a ms de
menos de ms de
Total
Si la etiqueta del producto dice que el envase debe contener 40 gramos y la empresa
tolera como aceptable una diferencia de 2 gramos hacia arriba o hacia abajo, qu
puede decirse del grado de cumplimiento de esta especificacin?
16. Con relacin a los datos suministrados a cerca de la siguiente distribucin de frecuencias, complete
la tabla.
Frec. Frec.
Frecuencia Frecuencia
Lmites Puntos Frecuencia Frecuencia Relativa Relativa
abs. acum. abs. acum.
reales medios absoluta relativa acum. a acum. a
a menos de a ms de
menos de ms de
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? 0.9
? ? ? 0.45 ? ? 0.7 ?
? ? ? ? ? ? ? ?
? 85 ? ? ? 4 ? 0.05
Total ?
Adems se sabe que todas las clases tienen el mismo intervalo de clase, que es de 9.
17. Con relacin a los datos suministrados a cerca de la siguiente distribucin de frecuencias,
complete la tabla.
Frec. Frec.
Frecuencia Frecuencia
Lmites Puntos Frecuencia Frecuencia Relativa Relativa
abs. acum. abs. acum.
reales medios absoluta relativa acum. a acum. a
a menos de a ms de
menos de ms de
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? 0.92
? ? ? 0.4 ? ? 0.7 ?
? ? ? ? ? ? ? ?
? 25 ? ? ? 4 ? 0.04
Total ?
Adems se sabe que todas las clases tienen el mismo intervalo de clase, que es de 7.
11. El gerente de un centro de llamadas desea evaluar el desempeo de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles y 20 llamadas el jueves y el viernes.
16. La grfica apropiada para representar las frecuencias absolutas relacionadas con sus
puntos medios se llama:
( a ) Grfico de barras horizontales ( b ) Polgono de frecuencias
( c ) Ojiva a menos de ( d ) Diagrama de frecuencias acumuladas
17. El tiempo medio de espera de los clientes de la muestra del da jueves es, en segundos:
( a ) 20,5 ( b ) 20,3
( c ) 18,5 ( d ) Ninguna de las anteriores
18. La mediana del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 20,5 ( b ) 20,3
( c ) 18,5 ( d ) Ninguna de las anteriores
19. La desviacin estndar del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 4,2 ( b ) 17,64
( c ) 1,21 ( d ) Ninguna de las anteriores
20. El primer cuartil del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 17,5 ( b ) 16,5
( c ) 21,5 ( d ) Ninguna de las anteriores
21. El percentil 78 del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 23,78 ( b ) 19,78
( c ) 22,88 ( d ) Ninguna de las anteriores
22. Con respecto al tercer cuartil para los tiempos de espera del da jueves es verdadero que:
( a ) Un 25% de los clientes de ese da esperaron 23,3 segundos o menos
( b ) Un 75% de los clientes de ese da esperaron 23,3 segundos o menos
( c ) Un 25% de los clientes de ese da esperaron 22,5 segundos o menos
( d ) Un 75% de los clientes de ese da esperaron 22,5 segundos o menos
5 .
Probabilidad
La probabilidad es un tema de todos los das. Cada vez que se habla del clima, por ejemplo si
va a llover o no en un da determinado, o bien, la posibilidad de sufrir un accidente, est
implcito el concepto de probabilidad. En general, se habla de probabilidad en cualquier
situacin en la que no haya certeza del resultado.
Los eventos pueden ser simples o compuestos. Un evento simple es aquel que no se puede
descomponer en otros eventos, mientras que el evento compuesto s se puede descomponer en
otros eventos. En el caso del lanzamiento de un dado, un evento simple es que al tirar el dado
salga un cuatro. Un evento compuesto es que al tirar el dado, salga un nmero par. Este es un
evento compuesto porque se compone de los eventos dos, cuatro y seis.
Por otro lado, el espacio muestral de un experimento aleatorio es el conjunto de todos los
posibles eventos que pueden ocurrir. Por ejemplo en el lanzamiento de un dado el espacio
muestral est dado por los eventos 1, 2, 3, 4, 5, 6.
Conteo
Muchas veces para calcular probabilidades es necesario enumerar sucesos y sus respectivas
posibilidades, para lo cual es necesario aplicar principios de anlisis combinatorio. Por lo
tanto se repasan tres conceptos bsicos:
Ejemplo Si usted invita a 8 personas a comer y hay una mesa con 8 sillas, de
cuntas formas distintas pueden sentarse a la mesa?
n! = n (n1) (n2) 2 1
5! = 5 4 3 2 1 = 120
=FACT(nmero)
Donde "nmero" indica la celda donde se halla el nmero del cual se desea
calcular el factorial, o bien, simplemente se escribe dicho nmero.
Entonces, en este caso se digita en la celda en que se desea obtener el
resultado la funcin:
=FACT(5)
FACTORIAL(nmero de elementos)
FACTORIAL(5)
Permutaciones:
n!
P(n, r )
(n r ) !
5! 5! 120
P(5,3) 60
(5 3) ! 2! 2
=PERMUTACIONES(nmero; tamao)
=PERMUTACIONES(5; 3)
PERMUTATIONS(5.3)
Combinaciones:
n!
C (n, r )
r ! (n r ) !
5! 5! 120
C (5,3) 10
3! (5 3) ! 3! 2! 6 2
n
La expresin es conocida como coeficiente binomial y es igual a C(n, r).
r
=COMBINAT(nmero; tamao)
=COMBINAT(5; 3)
COMBINATIONS(5.3)
n!
n1 ! n2 !... nk !
Ejemplo Suponga que en un grupo de 10 bolas hay 5 de color rojo, 3 azules y dos
blancas, cuntas permutaciones son posibles?
Definiciones de probabilidad
a 2
P( A) 0,3333
N 6
Ejercicio Se lanzan dos dados y se suman los puntos. Si X es la suma de los puntos,
calcule las siguientes probabilidades:
de
revisin 1. P(X = 3) =
2. P(X = 6) =
3. P(X = 7) =
4. P(X = 11) =
5. P(X = 12) =
6. P(X = 15) =
Este concepto de probabilidad tiene algunas limitaciones. Por ejemplo, cuando no es posible
conocer el nmero de resultados posibles (espacio muestral), o bien, este espacio muestral es
infinito, o cuando los eventos no son mutuamente excluyentes ni igualmente posibles.
F ( A)
P( A) Fr ( A)
N
As, por ejemplo, al decir que la probabilidad de obtener una pieza defectuosa en un proceso
es del 6%, se est usando el valor de la frecuencia relativa que se obtuvo al llevar un registro
de las piezas defectuosas durante un perodo razonablemente largo de tiempo.
96
P( d ) 0,0320
3.000
Ejercicio En una ciudad en la que habitan 5.000 personas, se sabe que 2.700 son
mujeres. Si se selecciona una persona al azar, cul es la probabilidad de
de que sea mujer?
revisin
Ver solucin de este ejercicio en la pgina de internet de este texto:
www.auladeeconomia.com/raeep.html
Axioma l: Para cualquier evento A, la probabilidad no puede ser menor que 0, ni mayor que 1:
0 P( A) 1
Por ejemplo, si un club cuenta con 1.200 miembros de ambos sexos (N = 1200). El evento de
inters (A) es ser mujer, por tanto P(A) = a/N. El mnimo nmero de mujeres en el club es
cero (a = 0), ninguna mujer en el club, en cuyo caso P(A) = 0/1200 = 0. El mximo nmero
posible de mujeres es 1200, no hombres en el club, por lo que P(A) = 1200/1200 = 1. No
puede haber menos de 0 ni ms de 1200 mujeres en el grupo de 1200 personas, por lo tanto:
0 P( A) 1
Para el siguiente axioma hay que recordar el concepto de espacio muestral, el cual es el
conjunto de todos los resultados posibles de un experimento aleatorio.
P( S ) 1
Por ejemplo, al jugar un partido de futbol hay tres resultados posibles, ganar, empatar o
perder, los cuales son excluyentes, pues dos o ms de esos eventos no pueden ocurrir
simultneamente.
Si se tiene el evento ser mujer y el evento estudiar ingeniera industrial, entonces estos son
eventos no excluyentes, porque pueden ocurrir simultneamente, es decir, una mujer puede
haber estudiado ingeniera industrial.
P( A o B) P( A) P( B)
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Si se selecciona un
aparato al azar, cul es la probabilidad de que sea un televisor o una
computadora?
Solucin Dado que los eventos televisor (T) y computadora (C) son excluyentes se
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que sea
revisin ingeniero civil o ingeniero industrial?
Teorema 1. Si E1, E2, , Em, son eventos mutuamente excluyentes en el espacio muestral S,
entonces:
P( E1 o E2 o ... o Em ) P( E1 ) P( E2 ) ... P( Em )
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Si se selecciona un
aparato al azar, cul es la probabilidad de que sea un televisor o una
computadora o una cmara fotogrfica?
Solucin Dado que los eventos televisor (T), computadora (C) y cmara fotogrfica
(F) son excluyentes se calcula cada probabilidad por separado y se suman
ambas probabilidades. Adems, en la bodega hay un total de 1000
aparatos:
P( A o B) P( A) P( B) P( AB)
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Adems, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), segn la tabla:
Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000
Solucin En la bodega hay un total de 1000 aparatos. Dado que los eventos televisor
(T) y que el aparato tenga defectos (D) no son excluyentes se calcula cada
probabilidad por separado y se suman ambas probabilidades, pero tambin
se resta la probabilidad de que ocurran a la vez:
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que sea
revisin ingeniero civil o mujer?
P(Aprobar o Reprobar) = 1
P(Aprobar y Reprobar) = 0
P( E C ) 1 P( E )
P(Aprobar) = 1 P(Reprobar)
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Adems, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), segn la tabla:
Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000
Solucin Dado que solo hay dos niveles de calidad, perfecto (P) o con defectos (D),
entonces podran considerarse como eventos complementarios, por lo que
la probabilidad de que tenga defectos es igual a uno menos la probabilidad
de que est perfecto:
850 150
P( D) 1
1000 1000
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que no
revisin sea ingeniero civil?
Probabilidad condicional
Se llama probabilidad condicional a la probabilidad de que ocurra un evento B cuando se sabe
que algn otro evento A ha ocurrido (P(A) > 0) y se denota como P(B | A). Esta expresin se
lee as:
Si A y B son dos eventos en el espacio muestral S, P(A) > 0, P(B) > 0, la probabilidad
condicional de B dado A es:
P( AB )
P( B / A)
P( A)
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Adems, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), segn la tabla:
Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000
P( DT )
P( D / T )
P(T )
P(DT) = 50/1000
P( DT ) 50 / 1000 50
P( D / T )
P(T ) 400 / 1000 400
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional y se sabe que debe ser mujer, cul
revisin es la probabilidad de que sea ingeniero civil?
P( A y B) P( A) P( B / A) si P( A) 0
P( B / A) P( B) y P( A / B) P( A)
Esto conduce a:
P( A y B) P( A) P( B)
Ejemplo Se tiene una caja con 10 bolas de colores: 6 bolas rojas y 4 bolas azules. Se
seleccionarn dos bolas al azar:
Solucin Dado que los eventos televisor (T), computadora (C) y cmara fotogrfica
(F) son excluyentes se calcula cada probabilidad por separado y se suman
ambas probabilidades. Adems, en la bodega hay un total de 1000
aparatos:
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que sea
revisin ingeniero civil o ingeniero industrial?
Total 15 8 10 7 40
Aplicacin Simulacin
La simulacin es una tcnica de la ingeniera que permite realizar
experimentos sobre el papel o en una computadora, y de ese modo,
describir el comportamiento y estructura de sistemas reales mucho ms
complejos. El investigador disea un sistema que representa a travs de un
modelo, el cual incluye las variables y relaciones lgicas implicadas.
Generalmente el modelo se verifica y valida con la ayuda del computador.
Teorema de Bayes
Supngase que Marta viaja desde una casa, en donde no tiene acceso por bus para ir a la
universidad. Como no tiene automvil recurre a cualquiera de tres vecinos amigos que
estudian en el mismo lugar y que viaja cada quien en su carro. Si llamamos A al evento de que
Marta asista a clases, B1 al evento de que un amigo llamado Luis vaya a la universidad y lleve
a Marta, B2 al evento que otro amigo llamado Juan asista a la universidad y lleve a Marta, y B3
al evento que un tercer amigo llamado Ral asista a la universidad y lleve a Marta, entonces la
probabilidad de que Marta vaya a clases est dada por la suma de las probabilidades de que la
lleven cualquiera de los tres amigos.
P( A) P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 ) P( B3 ) P( A / B3 )
Teorema 6. Si B1, B2, ... , Bk son eventos mutuamente excluyentes, uno de los cuales debe
ocurrir, y que tienen interseccin con el evento A, entonces,
P( A) P( Bi ) P( A / Bi )
Teorema 7. Teorema de Bayes. Si B1, B2, ... , Bk son eventos mutuamente excluyentes, uno
de los cuales debe ocurrir, que tienen interseccin con el evento A, entonces,
P( Br ) P( A / Br ) P( Br ) P( A / Br )
P( Br / A)
P( A) P( Bi ) P( A / Bi )
En el caso especfico de los dos eventos A y B, el teorema de Bayes se expresara la
probabilidad de ocurrencia del evento B dada la ocurrencia del evento A como:
P( B) P( A / B)
P( B / A)
P( B) P( A / B) P( B ) P( A / B )
P( B2 ) P( A / B2 ) 0.3 0.25
P( B2 / A) 0.2941
P( A) 0.255
Ejercicios:
Preguntas de desarrollo:
Conteste las preguntas que se formulan a continuacin (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
Tipo de estudiante
Carrera Regular Nuevo
Enfermera 500 100
Publicidad 850 150
Relaciones Internacionales 500 100
Relaciones Pblicas 800 200
Trabajo social 200 100
Sexo
Carrera Hombre Mujer
Administracin 300 200
Contadura 200 150
Derecho 50 60
Ingeniera Civil 100 20
Ingeniera Industrial 200 120
a. Sea hombre
b. Estudie derecho
c. Estudie administracin
d. Estudie alguna ingeniera
e. No estudie contadura
f. Estudie derecho o contadura
g. Sea mujer o estudie derecho
h. Estudie derecho y sea mujer
i. Estudie ingeniera industrial o sea hombre
j. Estudie ingeniera civil dado que el estudiante seleccionado sea mujer
Si se seleccionan dos estudiantes diferentes, calcule la probabilidad de que:
k. Ambos sean mujeres
l. El primero estudie derecho y el segundo administracin
4. La siguiente tabla ofrece datos sobre los niveles de glucosa en la sangre de una muestra de
50 pacientes segn su sexo:
Nivel de glucosa
Sexo Hipoglucemia Normal Hiperglucemia
Masculino 5 10 7
Femenino 8 14 6
Con base en los datos anteriores, calcule la probabilidad de que al seleccionar al azar un
paciente este presente:
a. Nivel de glucosa normal
b. Hipoglucemia o hiperglucemia
c. Hipoglucemia o que sea hombre
d. Hiperglucemia dado que sea mujer
e. Si se seleccionan al azar dos pacientes distintos, cul es la probabilidad de que
ambos tengan hiperglucemia?
efectos adversos causados por esta sustancia segn el sexo del paciente en una muestra de 200
personas que han consumido este frmaco con cierta regularidad:
Efectos adversos
Sexo Sin efecto adverso Nuseas Hipersensibilidad Otros
Masculino 90 5 3 2
Femenino 92 4 2 2
Con base en los datos anteriores, calcule la probabilidad de que al seleccionar un paciente al
azar que haya consumidor paracetamol presente:
a. Ningn tipo de efecto adverso
b. Nuseas o sea hombre
c. Nuseas y no tenga efecto adverso alguno
d. Sea hombre o presente hipersensibilidad
e. Que no tenga efecto adverso si sabe que el paciente seleccionado es hombre.
f. Si se seleccionan tres pacientes distintos al azar, cul es la probabilidad de que el
primero presente hipersensibilidad, que el segundo no tenga efecto adverso alguno y
que el tercero tambin presente hipersensibilidad?
6. Un estudio publicado por SquareTrade a fines del ao pasado, revel que generalmente las
empresas fabricantes de computadoras porttiles de marcas pequeas suelen ser ms
confiables que sus rivales ms grandes. La tabla muestra datos basados en los resultados de
ese estudio.
Marca de la computadora
Asus Sony Acer HP
Fall antes de 3 aos 2 3 5 7
No fall antes de 3 aos 12 17 15 19
7. El trabajo social en crceles o dirigido a reclusos juega un papel muy importante dentro de
los mbitos de actuacin profesional de un trabajador social. En un estudio realizado por un
trabajador social sobre el sistema carcelario nacional se encontraron los siguientes datos en
una muestra de 200 reclusos:
Tipo de delito
Origen Drogas Propiedad Personas Otros Total
Nacional 68 13 4 14 99
Extranjero 93 3 2 3 101
Total 161 16 6 17 200
8. En una encuesta aplicada a un grupo de economistas se encontr que el 60% crean que la
crisis internacional haba afectado menos de los esperado a la economa nacional. Un 40%
consider que las polticas del gobierno haban sido las adecuadas para enfrentar la crisis, a la
vez que un 20% del total coincidan en que la crisis afect menos de lo esperado y que las
polticas del gobierno fueron adecuadas. Con base en estos datos, calcule la probabilidad de
que si selecciona uno de estos economistas al azar:
a. Que est de acuerdo en que la crisis afect menos de los esperado o que las polticas
del gobierno fueron adecuadas.
b. Que est de acuerdo en que la crisis afect menos de los esperado o que las polticas
del gobierno fueron adecuadas, pero no ambas.
c. Que no est de acuerdo en que la crisis afect menos de los esperado y que tampoco
considere que las polticas del gobierno fueron adecuadas.
Peso
Sobre lo esperado En lo esperado para Bajo lo esperado
Sexo para su edad su edad para su edad
Masculino 30 76 34
Femenino 20 54 26
11. En un centro de copiado se tienen tres fotocopiadoras. La probabilidad de que cada una
est fuera de servicio es de 20%, 15% y 30%, respectivamente. Cada mquina es
independiente de las dems. Con base en los datos proporcionados, determine la probabilidad
de que:
a. Exactamente dos copiadoras estn en servicio.
b. La segunda o la tercera estn fuera de servicio, y la primera fuera de servicio.
12. En una fbrica las lneas de ensamblaje 1 y 2 produjeron respectivamente 600 y 400
piezas de un lote. La lnea 1 produce un 6% de piezas defectuosas y la lnea 2 produce 2
piezas defectuosas de cada 40. Si del lote se sacan piezas aleatoriamente, calcule:
a. la probabilidad de obtener una pieza defectuosa.
b. Si al tomar una pieza sale defectuosa, cul es la probabilidad de que haya sido
producida en la lnea 2?
13. Explique cules de las siguientes afirmaciones son falsas y cules verdaderas:
a. La probabilidad de un evento siempre ser igual o mayor que cero y menor o igual
que uno.
b. Cuando la ocurrencia de un evento afecta la probabilidad de ocurrencia de otro
evento, entonces los eventos son independientes.
c. Cuando la ocurrencia de un evento no afecta la probabilidad de ocurrencia de otro
evento, entonces los eventos son dependientes.
d. Si A y B son eventos excluyentes, entonces es correcto que P(A o B) = P(A) + P(B)
P(AB).
e. Si A y B son eventos independientes, entonces es correcto que P(A y B) = P(A) *
P(B/A).
f. Si A y B son eventos dependientes, entonces es correcto que P(A y B) = P(A) *
P(B/A).
14. En una caja hay 10 bolas azules, 6 rojas y 4 verdes. Determine las siguientes
probabilidades:
a. Que al sacar al azar una bola, esta sea verde.
b. Que al sacar aleatoriamente una bola, esta sea azul o roja.
c. Sacar al azar una bola verde y luego una bola roja, sin devolver la primera bola a la
caja antes de sacar la segunda.
d. Sacar aleatoriamente una bola azul y luego una bola roja, devolviendo la primera
bola a la caja antes de sacar la segunda.
16. Un ingeniero conoce los siguientes datos relacionados con el nmero de fallas semanales
que un sistema informtico ha experimentado en el transcurso de tres aos:
# fallas/semana 0 1 2 3 4 5
Frecuencia 35 61 32 21 12 2
17. El trabajo social en crceles o dirigido a reclusos juega un papel muy importante dentro de
los mbitos de actuacin profesional de un trabajador social. En un estudio realizado por un
trabajador social sobre el sistema carcelario nacional se encontr que 1 de 4 cada reclusos
haba cometido un delito relacionado con drogas.
Si se toma una muestra aleatoria con reemplazo de 3 reclusos, calcule la probabilidad de que:
2. Se tiene un grupo de n libros, suponga que los n libros se van a conformar en grupos de 3
libros (suponiendo que n > 3). El nmero de diferentes grupos con distinto orden, equivale a:
( a ) P(n, 3) ( b ) n! / 3!
( c ) C(n, 3) ( d ) P(n, n 3)
5. Se tiene un grupo de 5 personas, suponga que solo se van a sentar 3 de los 5 individuos. El
nmero de diferentes disposiciones posibles de los asientos para este conjunto de 3
individuos, considerando que pueden ser elegidos 3 cualesquiera de los 5, equivale a:
( a ) P(5, 2) ( b ) 5! / 2!
( c ) C(5, 3) ( d ) Ninguna de las anteriores
7. Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera y por sexo
segn la tabla:
La probabilidad de que un ingeniero aleatoriamente seleccionado sea una mujer o que haya
estudiado ingeniera industrial (o ambos) es:
( a ) 11/20 ( b ) 29/40 ( c ) 7/40 ( d ) 210/1600
8. Con respecto a los datos del ejercicio 7, la probabilidad de seleccionar al azar un ingeniero
que sea hombre o sea ingeniero civil, pero no ambos, es:
( a ) 11/20 ( b ) 34/40
( c ) 28/40 ( d ) Ninguna de las anteriores
9. Con respecto a los datos del ejercicio 7, la probabilidad condicional de seleccionar al azar
un ingeniero en electrnica dado que sea mujer es:
( a ) 2/7 ( b ) 14/40
( c ) 4/40 ( d ) 8/4
10. Con respecto a los datos del ejercicio 7, al calcular la probabilidad de seleccionar al azar
un ingeniero industrial y la probabilidad de seleccionar un ingeniero que sea hombre, se
concluye que los eventos, ser ingeniero industrial y ser de sexo masculino son:
( a ) mutuamente excluyentes y dependientes
( b ) dependientes pero no mutuamente excluyentes
( c ) mutuamente excluyentes e independientes
( d ) ni mutuamente excluyentes ni dependientes
11. Se sabe que la caja A contiene un sobre con un billete de un dlar y otro sobre con un
billete de $10. La caja B contiene 2 sobres, cada uno con un billete de $10. Se elige
aleatoriamente una caja y de ella se selecciona un sobre. Si en el primer paso se selecciona la
caja A, la probabilidad de que en el segundo paso se seleccione un sobre con un billete de $10
es:
( a ) 1/2 ( b ) 1/10
(c)1 ( d ) Ninguna de las anteriores
12. Con base en los datos de la pregunta 8, si en el segundo paso se selecciona un sobre con
un billete de $10, la probabilidad de que ese sobre provenga de la caja A es:
( a ) 1/3 ( b ) 1/4
( c ) 1/2 ( d ) Ninguna de las anteriores
18. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola roja no equivale a:
( a ) 1 8/25 7/25 ( b ) 8/25 7/25 1
( c ) 2/5 ( d ) 10/25
19. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y una bola roja despus, en un muestreo sin
reemplazo, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 x 10/24
( c ) 10/25 x 8/25 ( d ) 8/25 + 10/24
20. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y una bola roja despus, en un muestreo con
reemplazo, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 x 10/24
( c ) 10/25 x 8/25 ( d ) Ninguna de las anteriores
21. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde o una bola roja, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 + 10/24
( c ) 10/25 x 8/25 ( d ) 10/25 + 8/25
22. En una caja hay 10 bolas rojas, 8 bolas azules y 7 bolas verdes. La probabilidad de
seleccionar al azar una bola que no sea verde equivale a:
( a ) 2/5 8/25 + 1 ( b ) 17/25 + 1
( c ) 18/25 ( d ) 10/25 + 7/25
23. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y otra bola verde despus, en un muestreo sin
reemplazo, equivale a:
( a ) 8/25 x 8/24 ( b ) 8/25 x 7/24
( c ) 8/25 x 8/25 ( d ) 8/25 + 7/24
24. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que los tres hijos sean varones es de:
( a ) 0,45 ( b ) 0,0911 ( c ) 1,35 ( d ) 0,1664
25. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que tenga dos hijos varones es de:
( a ) 0,45 ( b ) 0,1113 ( c ) 0,3341 ( d ) 1,45
26. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que los dos primeros hijos sean varones es de:
( a ) 0,2025 ( b ) 0,45 ( c ) 0,1135 ( d ) 0,90
27. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que solo tenga un hijo varn es de:
( a ) 0,1361 ( b ) 0,4083 ( c ) 1,55 ( d ) 0,3025
28. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que ninguno de los hijos sea varn es de:
( a ) 0,1361 ( b ) 0,1663 ( c ) 1,65 ( d ) 0,55
29. En una caja hay bolas rojas, bolas azules y bolas verdes. La probabilidad de seleccionar al
azar una bola verde primero y una bola roja despus, en un muestreo sin reemplazo, equivale
a:
( a ) P(V) x P(R) ( b ) P(V) x P(R/V)
( c ) P(V) + P(R) ( d ) P(V) x (1 P(R))
30. En una caja hay bolas rojas, bolas azules y bolas verdes. La probabilidad de seleccionar al
azar una bola que sea verde o bola roja, no equivale a:
( a ) P(V) + P(R) P(VR) ( b ) 1 P(A)
( c ) P(V) + P(R) ( d ) P(V) x P(R)
31. Considere la siguiente informacin: En una encuesta aplicada a 700 hogares a nivel
nacional, de los cuales la mitad tienen actualmente acceso al servicio de telefona celular, se
32. Utilizando la misma informacin del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que no sea un usuario actual de telefona celular y que desee
contratar para ese servicio al proveedor actual es:
( a ) 0,38 ( b ) 0,19 ( c ) 0,62 ( d ) 0,31
33. Utilizando la misma informacin del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que no sea un usuario actual de telefona celular es:
( a ) 0,31 ( b ) 0,38 ( c ) 0,62 ( d ) 0,5
34. Utilizando la misma informacin del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que estara no dispuesto a contratar a un nuevo proveedor de
telefona celular distinto del actual es:
( a ) 0,62 ( b ) 0,68 ( c ) 1,3 ( d ) 0,65
35. El 56% de los habitantes del pas se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar a dos personas y que
ambas utilicen internet con regularidad es:
( a ) 0,1936 ( b ) 0,2809 ( c ) 0,3136 ( d ) 1,12
36. El 56% de los habitantes del pas se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar dos hogares, tal que el
primero tenga computadora y el segundo no, es:
( a ) 0,2209 ( b ) 0,2809 ( c ) 0,2491 ( d ) 0,3136
37. El 56% de los habitantes del pas se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar un hogar, tal que tenga
computadora o que al menos uno de sus miembros utilice internet con regularidad es:
( a ) 1,09 ( b ) 0,2968 ( c ) 0,06 ( d ) Falta informacin
40. Para dos eventos excluyentes A y B, es falso con toda certeza que:
( a ) 0 P(A) + P(B) 1 ( b ) P(A o B) = 1
( c ) P(A) = 1 P(B) ( d ) P(A y B) = 1
1. c 2. a 3. c 4. c 5. b
6. c 7. a 8. a 9. a 10. d
11. a 12. a 13. a 14. a 15. c
16. a 17. a 18. b 19. b 20. c
21. d 22. c 23. b 24. b 25. c
26. a 27. b 28. b 29. b 30. d
31. a 32. b 33. d 34. d 35. c
36. c 37. d 38. a 39. a 40. d
6 .
Distribuciones de probabilidad de
variable discreta
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Calcular la media y la varianza de una distribucin de probabilidad
2. Resolver problemas empleando la distribucin binomial
3. Resolver problemas empleando la distribucin hipergeomtrica
4. Resolver problemas empleando la distribucin de Poisson
5. Resolver problemas empleando la distribucin multinomial
6. Resolver problemas empleando la distribucin geomtrica
Distribuciones de probabilidad
Para hablar de distribuciones de probabilidad es necesario presentar el concepto de
experimento estadstico.
En otras palabras, las variables aleatorias toman valores al azar en cada caso. Las variables
aleatorias se pueden clasificar de acuerdo con el nmero de valores que pueden asumir:
Ejemplo Suponga que se lanza al aire una moneda dos veces para ver si cae cara
(evento A) o cruz (evento B). Construya la tabla de la distribucin de
probabilidad.
Solucin En este caso existen 4 resultados posibles, cada uno con las siguientes
probabilidades:
Evento Probabilidad
AA 0,25
AB 0,25
BA 0,25
BB 0,25
Total 1,00
Solucin En este caso existen resultados posibles, cada uno con las siguientes
probabilidades:
2. Una rifa consta de 100 nmeros a un precio de $20 cada uno. El premio
es de $1000 (premio nico) y el jugador compra dos nmeros.
3. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
saca una bola y si la bola es azul se ganan cero puntos, si es verde se gana
un punto y si es roja se ganan dos puntos.
4. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
sacan dos bolas y se suman los puntos sabiendo que si la bola es azul se
ganan cero puntos, si es verde se gana un punto y si es roja se ganan dos
puntos.
La media es:
E ( X ) xP( x)
Y la varianza es:
2 ( x E ( x)) 2 P( x)
Unidades vendidas xi 30 35 40 45 50
Probabilidad P(xi) 0,20 0,28 0,30 0,15 0,07
E ( X ) xi P ( xi )
30 0.2 35 0.28 40 0.30 45 0.15 50 0.07 38.05
Y la varianza es:
33.95 5.83
2. Una rifa consta de 100 nmeros a un precio de $20 cada uno. El premio
es de $1000 (premio nico) y el jugador compra dos nmeros.
3. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
saca una bola y si la bola es azul se ganan cero puntos, si es verde se gana
un punto y si es roja se ganan dos puntos.
4. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
sacan dos bolas y se suman los puntos sabiendo que si la bola es azul se
ganan cero puntos, si es verde se gana un punto y si es roja se ganan dos
puntos.
el siguiente:
Optimista
$200.000
0,3
Normal $150.000
Producto 0,5
nuevo
Pesimista
0,2 $100.000
Producto
actual $140.000
Vemos que la primera inversin tiene una varianza mayor, o sea, es una
inversin ms riesgosa que la segunda.
Distribucin binomial
Suponga que un vendedor de un producto sabe que cada cliente que visita puede comprar su
producto, o bien, no comprarlo, por lo que solamente hay dos posibles resultados. Por su
experiencia sabe que el porcentaje de casos en los que logra la venta permanece constante a lo
largo del tiempo y que generalmente cada cliente no tiene contacto con los dems. El
vendedor desea saber la probabilidad de lograr 3 ventas si visita 8 clientes. Una situacin
como esta corresponde a un problema de una distribucin binomial de probabilidad.
P( X ) C (n, x) p x q n x para x = 0, 1, 2, , n
n!
C (n, x)
x !( n x ) !
n!
P( X ) C (n, x) p x q n x p x q n x
x !( n x ) !
= np
npq
Solucin a) Se tiene que se realizan 8 intentos de vender el producto, por lo que se tiene
que n = 8. Adems, se desea saber la probabilidad de lograr 3 ventas, o sea
que x = 3.
En este caso se define xito como lograr la venta, por tanto p = 0,30.
8!
P( X 3) (0,30) 3 (0,70) 83 0.2541
3!(8 3) !
b) En este caso se requiere que x 3, lo que significa que nos interesa que 3 o
ms clientes compren el producto, por lo que buscamos:
P( x 3) P( X 3) P( X 4) P( X 5) P( X 6) P( X 7) P( X 8)
P( x 3) 1 P( X 0) P( X 1) P( X 2)
= 0,4482
P(x = 8) = 0,0576
Ejemplo Se sabe que la probabilidad de que un cierto tipo de calentador falle ante
un sobrecalentamiento es de 15%, calcule la probabilidad de que entre 6 de
tales calentadores:
a) fallen entre 2 y 4
b) no fallen como mximo 3
= 0,2235
= 0,0473
Solucin Se tiene que n = 12, el xito es que no llevara el casco, entonces p = 0,42 y
q = 0,58.
P(X = 5) =
=DISTR.BINOM(nm_xito;ensayos;prob_xito;acumulado)
=DISTR.BINOM(5;12;0,42;0)
=DISTR.BINOM(nm_xito;ensayos;prob_xito;acumulado)
=DISTR.BINOM(4;12;0,42;1)
En Minitab, se tiene los mismos datos, o sea, que n = 12, el xito es que
no llevara el casco, entonces p = 0,42 y q = 0,58.
P(X = 5) =
Grfica de distribucin
Binomial. n=12. p=0,42
0,25
0,20
Probabilidad
0,15
0,10
0,3825
0,05
0,00
4 10
X
Distribucin hipergeomtrica
Suponga que se tiene un lote de 50 telfonos celulares y se sabe que 4 de ellos se daaron
durante el embarque. Se va a tomar una muestra sin reemplazo de 10 de estos aparatos y se
desea saber la probabilidad de que uno de ellos est defectuoso. Para esto se realizar un
muestreo sin reemplazo, por lo que los eventos en este caso no son independientes, y por
tanto, no se puede emplear la distribucin binomial. En un caso como este se emplea la
distribucin hipergeomtrica.
C ( N a, n X ) C ( a, X )
P ( X / N , a, n) para x = 0, 1, ... , n
C ( N , n)
Solucin a) En este caso xito es que un telfono salga defectuoso, por tanto se
tienen 4 xitos en la poblacin, o sea, a = 4 defectuosos, N = 50 y n = 10, y
se busca la probabilidad de que en la muestra haya uno defectuoso, es
decir, x = 1, por tanto:
C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)
P( X 2) 1 P( X 0) P( X 1)
C 50 4,10 0C 4, 0 C 50 4,10 1C 4,1
1
C 50,10 C 50,10
1 0,3968 0,4290 0,1742
P( X 7buenos ) P( x 7) P( x 8) P( x 9) P( x 10)
Para que el lote sea aceptado, en la muestra debe haber cero defectuosos, o
sea, x = 0, por lo tanto la probabilidad de aceptacin del lote corresponde a
P(x = 0):
C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)
C 30 2,4 0C 2, 0 20475 1
P( X 0) 0,7471
C 30,4 27405
C 70 8, 5 2C 8, 2
P( X 2) 0,0875
C 70, 5
Solucin Se tiene que una poblacin N = 200 frascos, a = 8 xitos (el xito sera que no
satisfaga la especificacin), una muestra n = 12 frascos, y se pregunta la
probabilidad de que 3 no satisfagan la especificacin, o sea, que lo que se
desea calcular es:
P(X = 3) =
=DISTR.BINOM(muestra_xito;nm_de_muestra;poblacin_xito;nm_de_p
oblacin)
=DISTR.HIPERGEOM(3;12;8;200)
El resultado es 0,0074.
P(X = 3) =
Tambin, se puede hacer uso del men Grfica, donde se selecciona Grfica
de distribucin de probabilidad. En el cuadro de dilogo se selecciona la
opcin que dice Ver probabilidad.
Grfica de distribucin
Hipergeomtrico. N=200. M=8. n=12
0,6
0,5
0,4
Probabilidad
0,3
0,2
0,1
0,007406
0,0
0 3
X
Distribucin de Poisson
A una oficina de un banco llegan, en promedio, 3 clientes por hora a solicitar un crdito. Eso
quiere decir, que en una hora cualquiera, regularmente llegar una cantidad de clientes
cercana a 3. Bajo la capacidad actual, se ha determinado que se puede atender ptimamente
hasta un mximo de 5 clientes por hora, por lo que se desea determinar la probabilidad de que
en una hora cualquiera lleguen ms de 5 clientes. Un problema de este tipo, en el que se desea
calcular la probabilidad de que ocurra determinada cantidad de eventos en un intervalo
continuo de tiempo, rea o volumen, se puede resolver empleando la distribucin de Poisson.
x e
P( X / ) para x = 0, 1, 2, ...
X!
x e
35 e 3
P( X 5) 0,1008
X! 5!
x e 30 e 3
P( X 0) 0,0498
X! 0!
x e
31 e 3
P( X 1) 01494
X! 1!
x e 3 2 e 3
P ( X 2) 0,2240
X! 2!
x e 33 e 3
P( X 3) 02240
X! 3!
x e 3 4 e 3
P ( X 4) 0,1680
X! 4!
P(14 x 17) = P(X = 14) + P(X = 15) + P(X = 16) + P(X = 17)
Ejemplo A una clnica llega un promedio de 5 pacientes cada hora. Calcule, usando
Excel y Minitab, la probabilidad de que en una hora seleccionada en forma
aleatoria lleguen exactamente 3 pacientes.
P(X = 3) =
=POISSON(x;media;acumulado)
=POISSON(3;5;0)
El resultado es 0,1404.
En Minitab, con base en los datos dados, una media de 5 pacientes por
hora y se pregunta la probabilidad de que lleguen 3 por hora, o sea, que lo
que se desea calcular es:
P(X = 3) =
Grfica de distribucin
Poisson. Media=5
0,20
0,15 0,1404
Probabilidad
0,10
0,05
0,00
0 3 13
X
x e 10 8 e 10
P(x = 8) = 0,112599
X! 8!
entonces:
E(X) = V(X) = = 2
= 2
X 0 1 2 3 4 5 6
P(x) 0,2465 0,3452 0,2417 0,1128 0,0395 0,0111 0,0032
Solucin Con base en los datos de la tabla se obtiene primero el valor esperado:
= 1,39
Aplicacin Seguros
Cuando una persona desea adquirir un seguro es porque desea contar con
una compensacin ante la eventualidad de que se materialice determinado
riesgo, o sea, que se presente un evento desfavorable que le genere alguna
necesidad econmica. Cuando la persona adquiere el seguro, la compaa
de seguros se compromete a pagar la compensacin prometida. Para que
una empresa est anuente a participar en este tipo de negocio debe ser
capaz de medir el tipo de riesgo que est asegurando y para ello es
necesario emplear distribuciones de probabilidad. As, la teora del riesgo
analiza esos posibles eventos y permite a la aseguradora determinar
cuntas reservas debe mantener y cunto riesgo aceptar en su cartera.
Por ejemplo, cuando una aseguradora conoce cul podra ser el nmero
mximo de siniestros posibles, puede emplear la distribucin binomial
para determinar la probabilidad de que tenga que pagar una determinada
cantidad de reclamaciones. Cuando no conoce cul podra ser el mximo
de posibles siniestros, entonces podra utilizar la distribucin de Poisson,
la cual se aproxima a la binomial conforme n tiende a infinito, para
determinar el nmero esperado de reclamaciones o las probabilidades de
que se den ciertas cantidades de siniestros.
Distribucin multinomial
Los audfonos fabricados por una empresa son sometidos a un control de calidad en el cual se
clasifican como perfectos, con defectos secundarios o con defectos mayores. Generalmente el
85% de los audfonos se clasifican como perfectos, el 10% con defectos secundarios y un 5%
con defectos mayores. En una muestra de 8 audfonos se quiere saber la probabilidad de que
haya 5 perfectos, 2 con defectos secundarios y uno con defectos mayores. Esta situacin es
similar en todo a un problema binomial, excepto que hay tres resultados posibles y no dos. En
estos casos se emplea la distribucin multinomial.
En general, si un ensayo puede resultar en cualquiera de k posibilidades E1, E2, ... , Ek, con
probabilidades p1, p2, ... , pk, entonces la distribucin multinomial dar la probabilidad de que
E1 ocurra x1 veces, de que E2 ocurra x2 veces, ... , y de que Ek ocurra xk veces, en n intentos
independientes.
n!
P( x1 , x2 ,..., xk )
x x x
p1 1 p 2 2 ... p k k
x1 ! x2 ! ... xk !
Donde:
n = x1 + x2 + ... + xk
Ejemplo Los audfonos fabricados por una empresa son sometidos a un control de
calidad en el cual se clasifican como perfectos, con defectos secundarios o
con defectos mayores. Generalmente el 85% de los audfonos se clasifican
como perfectos, el 10% con defectos secundarios y un 5% con defectos
mayores. En una muestra de 8 audfonos se quiere saber la probabilidad de
que haya 5 perfectos, 2 con defectos secundarios y uno con defectos
mayores.
Perfectos: p1 = 0,85
Con defectos secundarios: p2 = 0,10
Con defectos mayores: p3 = 0,05
8!
P( x1 = 5, x2 2, x3 1) (0,85) 5 (0,10) 2 (0,05)1 0,0372
5! 2! 1!
10!
P( x1 = 5, x2 4, x3 1) (0,35) 5 (0,20) 4 (0,45)1 0,0048
5! 4! 1!
Ejercicio Un equipo de futbol gana el 40% de los partidos que juega, empata el 25%
y pierde el resto de los encuentros. Suponiendo que se mantienen estas
de proporciones, calcule la probabilidad de que en los prximos 6 partidos:
revisin
Distribucin geomtrica
Una empresa de televisin por cable pone a disposicin de sus clientes un nmero telefnico
para proveer soporte en caso de que haya problemas con el servicio. Sin embargo la central
telefnica pasa ocupada el 90% del tiempo, por lo que los clientes deben hacer ms de intento
para que su llamada sea contestada. Cul es la probabilidad de que la llamada de un cliente
sea contestada en su tercer intento? Un problema de este tipo satisface todas las condiciones
de la distribucin binomial, excepto que no hay un nmero fijo de intentos, por lo que es un
problema que se resuelve empleando la distribucin geomtrica.
Entonces, si en una sucesin de pruebas o ensayos se desea saber la probabilidad del nmero
de la prueba en que ocurre el primer xito, y si adems se cumplen todas las dems
condiciones de la distribucin binomial, o sea que existen solamente dos resultados posibles
en cada ensayo (xitos y fracasos), la probabilidad de un xito, representada por p permanece
constante en todos los intentos, y todos los n intentos repetidos son independientes. En
resumen, se cumplen las mismas suposiciones fundamentales de la distribucin binomial,
excepto que n no es fijo.
De ese modo, si en pruebas independientes repetidas puede resultar un xito con una
probabilidad p y en un fracaso con una probabilidad q = 1 p, entonces la distribucin de
probabilidad de la variable aleatoria X, el nmero de la prueba en la cual ocurre el primer
xito es la distribucin geomtrica:
Ejemplo Una empresa de televisin por cable pone a disposicin de sus clientes un
nmero telefnico para proveer soporte en caso de que haya problemas con
el servicio. Sin embargo la central telefnica pasa ocupada el 90% del
tiempo, por lo que los clientes deben hacer ms de intento para que su
llamada sea contestada. Cul es la probabilidad de que la llamada de un
cliente sea contestada en su tercer intento?
Solucin Si la primera oveja que posee algn tipo de lunar que produzca fibras
pigmentadas es la quinta (x = 5), quiere decir que las primeras 7 no poseen
este tipo de lunares (x 1 = 4). La probabilidad de obtener una oveja con
este tipo de lunares es p = 0,40, por tanto, aplicando la frmula:
Ejercicio Un basquetbolista encesta el 60% de los tiros libres que lanza. Calcule la
probabilidad de que:
de
revisin a. El primer tiro que enceste sea el tercero.
b. El primer tiro que falle sea el cuarto.
c. Si el jugador lanza 6 veces, cul es la probabilidad de que enceste en
exactamente tres ocasiones?
Ejemplo El 10% de las llamadas que ingresan al centro de servicio telefnico de una
empresa son para reportar averas. Calcule, usando Minitab, la
probabilidad de que la primera llamada que ingresa para reportar averas
sea la tercera.
P(X = 3) =
Grfica de distribucin
Geomtrico. p=0,1
0,10
0,081
0,08
Probabilidad
0,06
0,04
0,02
0,00
1 3 51
X
X = nmero total de pruebas.
Ejercicios:
Ejercicios de desarrollo:
Conteste las preguntas que se formulan a continuacin (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
Distribuciones de probabilidad
X 0 1 2 3 4
P(x) 0,40 0,30 0,10 0,05
2. La cantidad de pacientes que llegan a una clnica cada hora se comporta de acuerdo con la
tabla siguiente, la cual muestra de distribucin de probabilidad de esta variable discreta.
Nunca llegan ms de 6 pacientes. Obtenga e interprete el valor esperado y la desviacin
estndar.
X 0 1 2 3 4 5 6
P(x) 0,05 0,10 0,15 0,20 0,15 0,05
3. La tabla siguiente muestra el nmero de quejas por da que recibe una compaa de
televisin por cable:
4. Se lanzan dos monedas, si sale escudo gana un punto, si sale corona, gana cero puntos, y X
es la suma de los puntos. Construya la tabla de la distribucin de probabilidad de X, calcule el
valor esperado y la desviacin estndar de la distribucin.
5. Una compaa de internet ha observado el nmero de veces que sus operaciones se han
visto interrumpidas por la cada de alguno de sus servidores. En 200 das analizados, se
determin que en 120 no hubo cada alguna de los servidores, pero que en 35 das el servicio
se interrumpi una vez por esa causa, en 25 das los servidores se cayeron dos veces, en 15
das se presentaron tres cadas de los servidores y que en 5 das el servicio se vio afectado
cuatro veces. Nunca se presentaron ms de 4 cadas de los servidores en un mismo da.
6. En una encuesta aplicada a nivel nacional a exportadores se les pregunt sobre el efecto que
ha tenido la crisis econmica sobre su actividad. El 40% indic que la crisis le haba afectado
mucho en su nivel de exportaciones. Si se toma una muestra de 500 empresas exportadoras,
cuntas de esas empresas se esperara que hayan sido muy afectadas por la crisis? Calcule e
interprete la desviacin estndar para esta distribucin de probabilidad.
Nmero de horas 0 1 2 3 4 5
Probabilidad 0,45 0,20 0,15 0,10 0,05 0,05
a. Calcule el nmero esperado de horas por semana en que la red est fuera de
operacin y la desviacin estndar de esta variable.
b. Si usted tiene que escoger entre este tipo de red y otro tipo de red cuyo nmero
esperado de horas por semana fuera de operacin es 1,05 y con desviacin estndar de
2,12, cul tipo de red seleccionara y por qu?
Unidades vendidas 0 10 20 30 40
Probabilidad 0,05 0,25 0,50 0,15 0,05
10. Un ingeniero conoce los siguientes datos relacionados con el nmero de fallas semanales
que un sistema informtico ha experimentado en el transcurso de tres aos:
# fallas/semana 0 1 2 3 4 5
Frecuencia 35 61 32 21 12 2
Este ingeniero afirma que es mejor otro sistema, ya que el valor esperado del nmero de fallas
semanales es 1,9 con una desviacin estndar de 3,5 veces por semana. Cambiara usted el
sistema actual por el sugerido por este ingeniero o mantendra el sistema actual? Explique
basndose en los resultados del valor esperado y la desviacin estndar, para esto primero
calcule ambos datos primero.
Distribucin binomial
11. En un esfuerzo para fomentar la creatividad y la innovacin entre su personal, una
empresa financiera ha implementado un sistema para captar propuestas de sus empleados. Un
elemento del sistema es un formulario que luego es depositado en un buzn. Se ha observado
que de cada 4 formularios entregados, uno posee una propuesta que podra generar un gran
impacto en la empresa y sus actividades. Con base en estos datos, calcule la probabilidad de
que, de una muestra de:
a. 5 formularios, 3 posean ideas de impacto.
b. 8 formularios, la mitad o menos tengan ideas de impacto.
c. 10 formularios, 6 o ms no tengan ideas de impacto.
12. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfaccin de los trabajadores dentro de la empresa, y ha encontrado
13. Se considera que el 20% de los votantes de un pas estn a favor de la poltica econmica
seguida por el actual gobierno. Si se toma una muestra de 12 votantes, cul es la
probabilidad de que del menos 25% de ellos est a favor de las polticas del gobierno actual?
15. Segn una noticia publicada en das recientes El 4% de los medicamentos que los
proveedores entregan a la Caja Costarricense de Seguro Social (CCSS) se rechazan porque no
cumple con los estndares de calidad internacionales que la institucin tiene establecidos. Si
se toma una muestra aleatoria de 10 de los medicamentos comprados por esta institucin,
calcule la probabilidad de que:
a. Al menos 5 de ellos se rechazado por no cumplir los estndares de calidad.
b. Menos de 3 sean rechazados por no cumplir los estndares de calidad.
c. Si se realiza dos veces la experiencia de seleccionar un medicamento empleando un
muestreo con reemplazo, cul es la probabilidad de que en ambos casos exactamente
9 de sean aceptados por satisfacer los estndares de calidad.
16. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfaccin de los trabajadores dentro de la empresa, y ha encontrado
que 5 de cada 12 empleados se siente insatisfecho con su salario. Esta proporcin se ha
mantenido constante durante mucho tiempo. Si se seleccionan aleatoriamente 8 personas
Cul es la probabilidad de que exactamente 5 de ellas se sientan insatisfechas con su salario?
Distribucin hipergeomtrica
17. Para probar la calidad de un tipo de concreto se prepararon 60 probetas de la mezcla y se
obtuvo que 5 de ellas no presentaban una resistencia a la compresin adecuada. Si se toma
una muestra aleatoria de 8 de esas 60 probetas, calcule la probabilidad de que:
a. Al menos 3 no satisfagan el requerimiento de resistencia a la compresin.
b. A lo sumo 55 satisfagan el requerimiento de resistencia a la compresin.
c. Entre 2 y 6 no satisfagan el requerimiento de resistencia a la comprensin.
18. En un embarque se recibieron 250 cajas con unos componentes electrnicos llamados
termistores. Los termistores pueden ser positivos o negativos. De la cantidad total de cajas se
sabe que 120 solo contienen termistores negativos. Con base en estos datos calcule la
probabilidad de que al seleccionar 10 cajas de componentes al azar se encuentre:
a. Exactamente 3 cajas de termistores negativos.
b. Al menos 4 cajas de termistores negativos.
c. A lo sumo 6 cajas de termistores positivos.
d. Entre 4 y 7 cajas de termistores negativos.
19. En una encuesta reciente se obtuvo que 900 de una muestra 2400 personas se haba visto
afectadas por la gripe en al menos una ocasin en los ltimos seis meses. Suponga que se
selecciona una muestra aleatoria de 12 personas, determine la probabilidad de que en los
ltimos 6 meses:
a. Exactamente 7 personas hayan tenido gripe al menos una vez.
b. Ms de 5 personas hayan tenido gripe al menos una vez.
c. Como mximo 8 no hayan tenido gripe.
d. Entre 7 y 11 no hayan tenido gripe.
Distribucin de Poisson
20. Al servicio de emergencias de un hospital llegan, en promedio, 5 pacientes por hora. Con
base en esta informacin calcule la probabilidad de que en una hora seleccionada al azar:
a. Lleguen exactamente 2 pacientes
b. Lleguen menos de 3 pacientes
c. Lleguen ms de 2 pacientes
21. Usted ha observado que la carretera por la que se dirige desde la universidad hasta su casa
tiene un promedio de tres grietas por kilmetro. Cul es la probabilidad de que en un
kilmetro seleccionado al azar de esa carretera:
a. no haya grieta alguna?
b. hayan al menos cinco grietas?
22. Un estudio revel que a la fila de una caja de un supermercado llegan en promedio 15
clientes cada 20 minutos. Con base en esta informacin determine la probabilidad de:
a. Que en una hora aleatoriamente seleccionada lleguen exactamente 50 clientes.
b. Que en un plazo cualquiera de 10 minutos lleguen como mximo 10 clientes.
c. Que en un plazo cualquiera de media hora lleguen como mnimo 20 clientes.
23. Segn estudios realizados en una autopista del pas, en un determinado tramo ocurren, en
promedio, 5 accidentes por semana. Con esta informacin, calcule la probabilidad de que en
una semana seleccionada aleatoriamente:
a. Ocurran ms de 7 accidentes.
Distribucin multinomial
25. En una encuesta de intencin de voto se obtuvo que el candidato A obtendra el 35% de
los votos, el candidato C el 45% y el candidato B el restante 20%. Si se toma una muestra de
12 personas, cul es la probabilidad de que la mitad deseen votar por el candidato A, una
cuarta partes por el candidato B y el resto por C?
26. Una empresa clasifica a su clientes como promotores, si estn muy dispuestos a
recomendar sus productos, como pasivos, si estn poco dispuestos a recomendar sus
productos, y como detractores si no tienen anuencia a recomendar los productos de la
empresa. El 50% de los clientes de la empresa se han catalogado como promotores, el 40
como pasivos y el 10% como detractores. Calcule la probabilidad de que en una muestra de
10 clientes se obtenga 6 promotores, 3 pasivos y un detractor.
27. En una caja hay 20 bolas, 8 rojas, 6 verdes, 4 azules y 2 blancas. Si se seleccionan 8 bolas
al azar, cul es la probabilidad de que 3 sean rojas, dos verdes, dos azules y una blanca?
28. En el control de calidad de una empresa los productos de una empresa se clasifican como
perfectos, aceptables y como rechazados. Si el 80 de los productos se consideran perfectos, el
15% como aceptables y el 5% como rechazados, calcule la probabilidad de que en una
muestra de 10 productos haya 8 perfectos, uno aceptable y otro rechazado.
Distribucin geomtrica
29. En el proceso de ensamblado de un camin de juguete a bateras se sabe que se obtiene
una unidad defectuosa con una probabilidad de 4%. Peridicamente se efectan pruebas para
controlar la calidad del producto. Determine la probabilidad de encontrar el primer juguete
defectuoso en:
a. Exactamente la quinta prueba.
b. Antes de la sexta prueba.
c. Despus de la tercera prueba.
30. Una central telefnica de una empresa est ocupada todo el tiempo. Si la probabilidad de
lograr hacer una llamada en un momento de alta congestin es del 25%, calcule la
probabilidad de que se tengan que hacer 6 intentos para lograr comunicarse.
31. Un tirador experto acierta en el blanco con una probabilidad del 90%. Calcule la
probabilidad de que al hacer 8 disparos falle por primera vez en el octavo intento.
32. Una compaa tiene la costumbre de ofrecer descuentos a los radioescuchas de un popular
programa de radio, los cuales llaman por telfono para participar en el sorteo. Durante el lapso
del programa la central telefnica tiende a saturarse, por lo que la probabilidad de que la llama
de una persona ingrese es de solo 5%. Suponga que una persona desea participar en el sorteo,
calcule la probabilidad de que tenga que:
a. hacer 10 llamadas para participar.
b. realizar ms de 5 llamadas para participar.
c. logre participar en el stimo intento.
34. Un empresa posee 500 empleados. Se sabe que 100 de ellos trabajan en el rea
administrativa, un 50 laboran en ventas y el resto en produccin. Calcule la probabilidad de:
a. Que al seleccionar 9 empleados aleatoriamente, 2 sean del rea administrativa en un
muestreo con reemplazo.
b. Que al seleccionar 9 empleados aleatoriamente, 2 sean del rea administrativa en un
muestreo sin reemplazo.
c. Que al seleccionar 9 empleados aleatoriamente, 2 sean del rea administrativa, uno
de ventas y el resto de produccin, en un muestreo con reemplazo.
d. Que al seleccionar varios empleados, el primero que pertenezca al rea de ventas
sea el quinto.
( c ) Multinomial ( d ) Poisson
X 0 1 2 3 4
P(x) 0,40 0,30 0,10 0,05
6. Con base en la tabla del ejercicio 4, en el largo plazo, el nmero esperado de accidentes
diarios en esa fbrica es de:
( a ) 0,8 (b)2
( c ) 1,1 ( d ) Ninguna de las anteriores
X 0 1 2 3 4
P(x) 0,30 0,20 0,10 0,02
9. Con base en la tabla del ejercicio 8, en el largo plazo, el nmero esperado de accidentes
diarios en esa fbrica es de:
(a)0 ( b ) 1,6
(c)2 ( d ) 1,16
11. Las acciones de la empresa A tienen una probabilidad de 0,7 de devolver una ganancia de
$200. Tambin tienen una probabilidad de 0,3 de tener una prdida de $600. En el largo
plazo, cul es la mejor opcin de las siguientes que se puede hacer para maximizar su
beneficio, y por qu?
( a ) Invertir en las acciones porque hay una mayor probabilidad de ganar dinero que perder
dinero.
( b ) No invertir en las acciones debido a la cantidad de dinero por cada prdida es mayor que
el monto en dlares para cada ganancia.
( c ) Invertir en las acciones porque la inversin tiene un valor esperado positivo.
( d ) No invertir en las acciones debido a que el valor esperado es una prdida.
12. Las acciones de la empresa A tienen una probabilidad de 0,7 de devolver una ganancia de
$200. Tambin tienen una probabilidad de 0,3 de tener una prdida de $600. Las acciones de
la empresa B tienen una probabilidad de 0,3 de devolver una ganancia de $600 y una
probabilidad de 0,7 de tener una prdida de $200. En el largo plazo, usando la desviacin
estndar como medida del riesgo, es cierto que:
( a ) Las acciones de la empresa A son ms riesgosas que las acciones de la empresa B
( b ) Las acciones de la empresa A son menos riesgosas que las acciones de la empresa B
( c ) Las acciones de la empresa A son igualmente riesgosas que las acciones de la empresa B
( d ) Falta informacin para determinar la desviacin estndar
13. Si usted toma una muestra de 15 artculos con reemplazo, para conocer si se presentan
unidades con algn defecto, entonces se emplea la distribucin:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Geomtrica
14. En un proceso de produccin se genera una unidad defectuosa por cada 10 unidades
producidas. Si usted desea saber la probabilidad de que, en un muestra de 20 unidades sin
reemplazo, se presenten 2 defectuosas, debera emplear la distribucin:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Ninguna de las anteriores
15. La tasa media de llegadas de vehculos a un peaje es de 10 por minuto. Si usted desea
saber la probabilidad de que en una hora seleccionada aleatoriamente lleguen menos de 50
vehculos, entonces usara:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal
16. La tasa media de llegadas de vehculos a un peaje es de 15 por minuto. Si usted desea
saber la probabilidad de que pasen 4 minutos entre la llegada de dos vehculos en una hora
seleccionada aleatoriamente, entonces usara:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal
22. Si se sabe que x sigue una distribucin de Poisson con media igual a 3, la probabilidad de
x sea mayor que 2 es:
( a ) 0,4232 ( b ) 0,8009
( c ) 0,5768 ( d ) Ninguna de las anteriores
23. Si se sabe que x sigue una distribucin de Poisson con media igual a 5, la probabilidad de
x sea cuando mucho 1 es:
( a ) 0,9933 ( b ) 0,0337
( c ) 0,0404 ( d ) Ninguna de las anteriores
24. Si los resultados del anlisis de un producto pueden ser bueno, regular o malo, y se conoce
que las probabilidades de dichos resultados son 0.6, 0.3 y 0.1, respectivamente, entonces en
una muestra de 5 unidades, la probabilidad de que una de ellas sea clasificada como regular, 1
como mala y 3 como buenas es:
( a ) 0,0036 ( b ) 0,0324
( c ) 0,1296 ( d ) Ninguna de las anteriores
25. Si los resultados del anlisis de un producto pueden ser bueno, regular o malo, y se conoce
que las probabilidades de dichos resultados son 0.6, 0.3 y 0.1, respectivamente, entonces en
una muestra de 5 unidades, la probabilidad de que 4 de ellas sean clasificadas como buenas
es:
( a ) 0,9222 ( b ) 0,7408
( c ) 0,2592 ( d ) Ninguna de las anteriores
27. Si usted controla la calidad de las piezas compradas a un proveedor y desea calcular la
probabilidad de que en un muestreo sin reemplazo se rechace el lote por contener ms de 3
piezas defectuosas, entonces se emplea la distribucin:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Geomtrica
29. Un fabricante de medicamentos sostiene que cierta medicina cura una enfermedad para la
sangre en el 80% de los casos. Para verificarlo los inspectores del gobierno utilizan una
muestra de 100 individuos y deciden aceptar la afirmacin si se curan por lo menos 75 de
ellos. La probabilidad de que lo que dice sea rechazado, si efectivamente la probabilidad de
curacin es del 80%, es:
( a ) 0,9162 ( b ) 0.0838
( c ) 0,4567 ( d ) Ninguna de las anteriores
30. En un proceso de manufactura se sabe que la probabilidad de obtener una pieza defectuosa
es de 2%. Cul es la probabilidad de que la octava pieza inspeccionada sea la primera
defectuosa?
( a ) 0,9826 ( b ) 0,9800
( c ) 0,0174 ( d ) Ninguna de las anteriores
31. Un fabricante sabe que cierto tipo de refrigeradores tienen una probabilidad de 0,8 de
clasificarse como aceptable, una probabilidad de 0,15 de ser clasificados como con defectos
secundarios y de 0,05 de ser clasificados como con defectos mayores. Si se revisan seis
refrigeradores, escogidos al azar, la probabilidad de que tres sean aceptables, 2 tengan
defectos menores y 1 tenga defecto mayor es:
( a ) 0,9654 ( b ) 0,7645
( c ) 0,0346 ( d ) Ninguna de las anteriores
32. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que nadie responda es:
( a ) 0,0000 ( b ) 0,8031
( c ) 0,1969 ( d ) Ninguna de las anteriores
33. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que exactamente dos personas respondan es:
( a ) 0,0000 ( b ) 0,8241
( c ) 0,2759 ( d ) Ninguna de las anteriores
34. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que ms de la mitad respondan es:
( a ) 0,0000 ( b ) 0,9986
( c ) 0,0014 ( d ) Ninguna de las anteriores
35. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que ms de 4 no respondan es:
( a ) 0,0099 ( b ) 0,0014
( c ) 0,9986 ( d ) Ninguna de las anteriores
36. Considere la siguiente informacin: En una encuesta aplicada a 700 hogares a nivel
nacional, de los cuales la mitad tienen actualmente acceso al servicio de telefona celular, se
obtuvieron los siguientes datos: ante la apertura en el mercado de telecomunicaciones, el 68%
los usuarios actuales de telefona celular estara dispuesto a cambiar de operador. Entre la
poblacin que aun no posee celular, solo un 38% optar por el operador actual, mientras que
el resto escoger un nuevo proveedor de servicio. Si se toma una muestra de 6 hogares que
ya poseen servicio celular, la probabilidad de que todos conserven el operador actual es:
( a ) 0,0011 ( b ) 0,0989
( c ) 0,0030 ( d ) 0,0568
37. Utilizando la misma informacin del ejercicio 36, si se toma una muestra de 6 hogares que
ya poseen servicio celular, la probabilidad de que 2 o menos hogares cambien su proveedor
actual de telefona celular es:
( a ) 0,0011 ( b ) 0,0875
( c ) 0,7064 ( d ) 0,1527
38. Utilizando la misma informacin del ejercicio 36, si se toma una muestra de 6 hogares que
aun poseen servicio celular, la probabilidad de que 4 o ms hogares utilicen el proveedor
actual en el mercado de telefona celular es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1527
39. Utilizando la misma informacin del ejercicio 36, si se toma una muestra de 6 hogares que
aun poseen servicio celular, la probabilidad de que 4 o ms hogares utilicen el proveedor
actual en el mercado de telefona celular es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1527
40. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfaccin de los trabajadores dentro de la empresa, y ha encontrado
que 4 de cada 20 empleados se siente insatisfecho con su salario. Esta proporcin se ha
mantenido constante durante mucho tiempo. Si se seleccionan aleatoriamente 8 personas, la
probabilidad de que exactamente 3 de ellas se sientan insatisfechas con su salario es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1468
42. La probabilidad de que cierto componente falle ante una carga axial especfica es de 5%.
La probabilidad de que entre 16 de tales componentes fallen entre 2 y 5:
( a ) 0,1891 ( b ) 0,8109
( c ) 0,95 ( d ) Ninguna de las anteriores
43. Con respecto a las lminas de zinc esmaltadas que se emplearn en el techo de un edificio
nuevo, se sabe que el 95% no tienen defecto alguno, que el 4% tienen, en promedio, un
defecto menor en el esmalte por cada dos metros cuadrados de lmina, y el resto poseen
huecos u otros defectos mayores, y por tanto sern devueltas al proveedor. La probabilidad de
que al seleccionar una muestra aleatoria de 8 lminas haya que devolver a lo sumo una lmina
es:
( a ) 0,9926 ( b ) 0,0027
( c ) 0,0074 ( d ) Ninguna de las anteriores
45. En relacin a la misma situacin de la pregunta 43, si se selecciona una lmina al azar
correspondiente a las que tienen un defecto en el esmalte, entonces la probabilidad de que
posea una superficie continua de 1,5 metros cuadrados sin defecto alguno es:
( a ) 0,5276 ( b ) 0,3679
( c ) 0,4724 ( d ) Ninguna de las anteriores
47. En relacin a la misma situacin de la pregunta 43, suponga que se han comprado 100
lminas. Si se toma una muestra aleatoria sin reemplazo de 6 lminas, la probabilidad de que
exactamente 5 estn en perfecto estado es:
( a ) 0,2430 ( b ) 0,2709
( c ) 0,2649 ( d ) Ninguna de las anteriores
48. En relacin a la misma situacin de la pregunta 43, si se toma una muestra aleatoria de 8
lminas, la probabilidad de que 6 estn en perfecto estado, que una tenga un defecto en el
esmalte y otra un defecto mayor es:
( a ) 0,0261 ( b ) 0,0138
( c ) 0,0315 ( d ) Ninguna de las anteriores
1. a 2. d 3. c 4. b 5. c
6. c 7. a 8. b 9. d 10. c
11. d 12. c 13. a 14. b 15. c
16. b 17. c 18. c 19. c 20. c
21. c 22. c 23. c 24. c 25. c
26. c 27. b 28. c 29. b 30. c
31. c 32. c 33. c 34. c 35. c
36. a 37. b 38. d 39. d 40. d
41. d 42. a 43. c 44. c 45. c
46. b 47. a 48. d 49. c 50. a
7 .
Distribuciones de probabilidad de
variable continua
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Resolver problemas empleando la distribucin normal
2. Resolver problemas empleando la distribucin exponencial
Otra diferencia con respecto a las distribuciones de variable discreta, es que al calcular las
probabilidades de variables aleatorias continuas no se puede hablar de la probabilidad de que
tome un valor en particular, por ejemplo, calcular la probabilidad de que el tiempo de espera
en una fila sea exactamente 4 minutos; sino que se calcula la probabilidad de que la variable
tome valores en un intervalo, como sera que el tiempo de espera est entre 3 y 5 minutos.
Entonces, se encontrar la probabilidad de que la variable aleatoria x tome valores entre a y b:
P(a x b), como en el ejemplo, que sera obtener P(3 x 5).
A las funciones de probabilidad de las variables continuas se les llama funciones densidad y
se integran para obtener las probabilidades buscadas.
La distribucin normal
La distribucin de probabilidad de variable continua ms importante es la distribucin normal.
Esta distribucin, cuya curva tiene forma de campana, mide en forma muy aproximada
muchos fenmenos que ocurren en la naturaleza, los negocios, la industria y la investigacin,
como por ejemplo:
Esta distribucin fue estudiada a partir del siglo XVII, cuando el matemtico francs
Abraham DeMoivre desarroll la ecuacin matemtica de la distribucin de probabilidad.
Posteriormente el alemn Karl Friedrich Gauss tambin deriv la ecuacin en un estudio de
errores en mediciones repetidas de la misma cantidad.
1 x
2
1
f ( x, , 2 ) e 2
para < x <
2
1 x
2
b
1
P ( a x b) e 2
dx
a 2
x
z
Los valores de esta distribucin normal estndar se obtienen de una tabla, la cual da el valor
de probabilidad para cada valor de z. La frmula anterior se emplea para convertir de la
variable x a z y viceversa, segn se requiera.
a) P(z 1,46) =
b) P(z 1,46) =
c) P(z 1,46) =
d) P(z 1,46) =
e) P(1,03 z 1,46) =
El nmero que aparece donde se cruza esa fila con esa columna es el valor
de la probabilidad, que en este caso es 0,9279.
De la tabla se obtiene:
Ahora bien, en la prctica muchas variables se distribuyen normalmente, pero no tienen media
igual a 0 y desviacin estndar igual a 1. Es necesario entonces estandarizar estas variables,
tal como se indic anterior, para lo cual se emplea la frmula:
x
z
1010 1000
P( x 1010) P z P( z 0,33)
30
1050 1000
P( x 1050) P z
30
P( z 1,67) 1 0,9525 0,0475
990 1000
P( x 990) P z
30
P( z 0,33) 0,6293
1090 1000
P( x 1090) P z
30
P( z 3) 0,9987
P(980 x 1040)
9.80 1000 1040 1000
P z
30 30
P(0,67 z 1,33)
P( z 1,33) P( z 0,67)
0,9082 (1 0,7486)
0,9082 0,2514 0,6568
f) El valor mximo del 20% de las botellas con menor cantidad de lquido
se encuentra al lado izquierdo de la curva, en el cual los valores de z son
negativos, por estar a la izquierda de z = 0 ( = 0). Grficamente el
problema queda representado del modo siguiente:
x
z
x 1000
0,84
30
x 0,84 * 30 1000
x 974,8
Esto indica que 974,8 ml es el valor mximo del 20% de las botellas con
menor cantidad de lquido.
g) El valor mnimo del 40% de las botellas con mayor cantidad de lquido
se encuentra al lado derecho de la curva, en el cual los valores de z son
positivos, por estar a la derecha de z = 0 ( = 0). Grficamente el problema
queda representado del modo siguiente:
x
z
x 1000
0,25
30
x 0,25 * 30 1000
x 1007,5
Esto indica que 1007,5 ml es el mnimo del 40% de las botellas con mayor
cantidad de lquido.
b. Cuntas veces de las 120 que viaj el ltimo semestre lleg a tiempo, si
debe estar en su oficina a las 9:00 a.m. y acostumbra salir de su casa a las
8:30?
c. Encuentre el tiempo mximo que le tom el 62% de los viajes ms
rpidos.
b. Si sale a las 8:30 y tiene que estar en la oficina a las 9 cuenta con 30
minutos para llegar.
c. Los viajes ms rpidos son los que toman menos tiempo, por lo tanto, el
rea es el 62% del lado izquierdo.
De ese modo se tiene que 27,09 minutos es el tiempo mximo que toma el
62% de los viajes ms rpidos.
Solucin En Excel: Se tiene que una media de 180 mg/100ml con una desviacin
estndar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:
= DISTR.NORM(x;media;desv_estndar;acum)
=DISTR.NORM(200;180;30;1)
El resultado es 0,7475.
En Minitab: Se tiene que una media de 180 mg/100ml con una desviacin
estndar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:
Grfica de distribucin
Normal. Media=180. Desv.Est.=30
0,014
0,012
0,010
Densidad
0,008
0,7475
0,006
0,004
0,002
0,000
180 200
X
Solucin En Excel: Se tiene que una media de 74,5 Kg. con una desviacin estndar
de 8 Kg., y se pregunta el peso que separa el 15% de los hombres adultos
con menor peso. Entonces, en Excel se emplea la funcin
DISTR.NORM.INV, cuya sintaxis es:
= DISTR.NORM.INV(probabilidad;media;desv_estndar)
=DISTR.NORM.INV(0,15;74,5;8)
En Minitab: Se tiene que una media de 180 mg/100ml con una desviacin
estndar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:
Grfica de distribucin
Normal. Media=74,5. Desv.Est.=8
0,05
0,04
Densidad
0,03
0,02
0,01
0,15
0,00
66,21 74,5
X
Claro que no estrictamente los tiempos de los proyectos tienen que seguir
una distribucin normal, por lo que tambin es posible emplear otras
distribuciones de probabilidad, e incluso usar tcnicas de simulacin, que
si bien, son un poco ms complejas, pueden dar resultados ms confiables.
Teorema. Si X es una variable aleatoria binomial con media = np y varianza 2 = npq, y si:
x x np
z
npq
Solucin Este es un problema de distribucin binomial, pero que por tener n > 20 se
resuelve por aproximacin. En este caso no se puede aplicar la Poisson
porque p > 5%, por lo tanto se resuelve usando la normal como
aproximacin.
= np = 80 0,3 = 24
Se requiere calcular:
P(25 x 35) =
P(24,5 x 35,5) =
24,5 24
z1 0,12
4,10
35,5 24
z2 2,80
4,10
Entonces:
P(x 20)
Luego se estandariza:
19,5 24
z1 1,10
4,10
80,5 24
z2 13,78
4,10
= np = 80 0,7 = 56
Ahora se estandariza:
0,5 56
z1 13,78
4,10
59,5 56
z2 0,85
4,10
= 0,8023 0 = 0,8023
Distribucin exponencial
A una oficina de un banco llegan, en promedio, 3 clientes por hora a solicitar un crdito. Se
desea saber la probabilidad de que transcurran 30 minutos entre la llegada de un cliente y el
siguiente. En un problema de este tipo, en el que se desea calcular la probabilidad de que se
d un determinado tiempo entre la ocurrencia de dos eventos sucesivos, muy similar a un
problema en el que se pueda aplicar la distribucin de Poisson, se puede resolver empleando
la distribucin exponencial.
P(x) = ex para x 0, 0.
P( X x) 1 e x
Por otro lado, la probabilidad exponencial de que el primer evento no ocurra dentro de un
intervalo temporal o especial especificado es:
P( X x) e x
= 3/2 = 1,5
P e e 1,5 0,2231
P 1 e 1 e 1 1 0,3679 0,6321
Ejemplo El tiempo requerido para que ocurra una reaccin qumica est
exponencialmente distribuido con un tiempo esperado de 4 minutos:
P e e 0,5 0,6065
Ejercicio Se sabe que la vida til de cierto tipo de bujas sigue una distribucin
exponencial con media de 160.000 km. Cul es la probabilidad de que
de una buja seleccionada aleatoriamente dure:
revisin
a. a lo sumo 180.000 km?
b. entre 150.000 y 200.000 km?
Ejemplo Los clientes de una tienda llegan en promedio de 20 por hora. Utilice
Excel y Minitab para determinar la probabilidad de que transcurran a lo
sumo 6 minutos despus de la llegada del ltimo cliente y el prximo.
Solucin En Excel: Se tiene que una media = 20 clientes por hora y se pregunta la
probabilidad de que transcurran a lo sumo 6 minutos despus de la llegada
del ltimo cliente y el prximo, por lo que x = 0,1, pues equivale a 6
minutos de una hora que tiene 60 minutos, o sea, x = 6/60 = 0,1. Entonces,
en Excel se emplea la funcin DISTR.EXP, cuya sintaxis es:
= DISTR.EXP(x;lambda;acum)
=DISTR.EXP(0,1;20;1)
El resultado es 0,8647.
Grfica de distribucin
Exponencial. Escala=0,05. Valor umbral=0
20
15
Densidad
10
0,8647
0
0 0,1
X
1
E ( x)
1
2
2
Ejercicios:
Ejercicios de desarrollo:
Conteste las preguntas que se formulan a continuacin (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
Distribucin normal
1. Si se tiene que = 35, = 5, halle las siguientes probabilidades normales:
a. P(x 28) =
b. P(x 40) =
c. P(26 x 34) =
2. Se sabe que las concentraciones de colesterol total en la sangre para cierta poblacin se
distribuyen normalmente con promedio 210 mg/100ml y desviacin estndar de 18
mg/100ml. Con base en estos datos, conteste
a. Cul es la probabilidad de que al seleccionar una de estas personas al azar tenga
una concentracin de colesterol entre 175 y 220 mg/100ml?
b. Si hay 25000 personas en esa poblacin, cuntos de ellos se espera que tengan los
niveles de colesterol superiores a 230 mg/100 ml?
5. En un estudio sobre las alpacas se encontr que los adultos machos tenan, en promedio, un
peso vivo de 64,78 Kg., con una desviacin estndar de 12,87 Kg. Con base en estos datos
determine la probabilidad de que un macho adulto seleccionado tenga un peso:
a. Superior a 71 Kg.
b. Inferior a 56 Kg.
c. Entre 60 y 70 Kg.
d. Cul es el peso mnimo que marca el lmite del 35% de los machos adultos de
mayor peso?
e. Cul es el peso mximo que marca el lmite del 15% de los machos adultos de
menor peso?
6. Una empresa fabrica pantallas LCD para cmaras digitales. Las pantallas deben tener una
dimensin de 76 mm. En promedio las pantallas fabricadas miden 75,95 mm con una
desviacin estndar de 0,08 mm distribuidas normalmente. Con base en estos datos, calcule la
probabilidad de obtener al azar una pantalla con dimensin:
a. Mayor que 76,1 mm.
b. Menor que 75,0 mm.
c. Entre 75,2 y 76,9 mm.
d. Cul es la dimensin del 10% de las pantallas de mayor dimensin?
8. Suponga que el proceso de empacado de frijoles tiene una media de 896 gramos por bolsa
con una desviacin estndar de 12 gramos. Se considera que los pesos se distribuyen
normalmente. Con base en los datos anteriores determine la probabilidad de que al seleccionar
aleatoriamente una bolsa:
9. Un analista ha observado las comisiones que ganan los corredores de bolsa durante los
ltimos aos y se ha dado cuenta que siguen una distribucin de probabilidad normal. El
monto anual medio percibido es de $30000, y la desviacin estndar de $7000.
a. Qu porcentaje de los corredores de bolsa percibe entre $27500 y $40000 al ao?
b. Si hay 200 corredores de bolsa, cunto de ellos se espera que tengan comisiones
superiores a $42000?
c. Si se va a otorgar un incentivo al 10% de los corredores que logran mayores
comisiones, a partir de cul monto de comisiones se ofrecer este incentivo?
11. Un viaje en autobs tiene una duracin distribuida normalmente con media de 23 minutos
y desviacin estndar 3,4 minutos. Todos los das se requiere llegar al destino a las 9.00 a.m.
a. A qu hora debe iniciarse para tener una probabilidad del 95% de estar a tiempo?
b. Si se inicia a las 8.30 a.m., Cul es la probabilidad de que no llegue a tiempo?
c. Si se ha decidido iniciar a las 8.30 todos los das, Cuntas veces se llegar a tiempo
en un periodo de un ao (suponga que se realiza 360 veces en ese periodo)?
12. Un hotel registra datos sobre el nmero de das de estancia de cada uno de sus huspedes.
Esta variable se distribuye normalmente con media 6 y desviacin estndar 3,1. Segn una
proyeccin se esperan 150 huspedes. Con base en estos datos, calcule cuntos huspedes se
espera que se hospeden:
a. Menos de 4 das?
b. Ms de 8 das?
c. Entre 5 y 9 das?
d. Cul es el tiempo mnimo que se prolonga la estancia del 75% de los huspedes
que se alojan ms tiempo en el hotel?
13. Las puntuaciones de una prueba para medir el nivel de ingls de personas de habla hispana
se distribuyen normalmente con media de 520 puntos y desviacin estndar de 110 puntos.
Calcule la probabilidad de obtener una nota:
a. Menor de 630 puntos. Primero indique cul debera ser el resultado (empleando la
regla emprica) y luego efecte los clculos para comprobar el resultado.
b. De por lo menos 740 puntos.
c. De ms de 850 puntos.
d. Como mximo 345 puntos.
e. De ms de 475 puntos.
f. De entre 450 y 800 puntos.
g. Cuntas personas, de un grupo de 400, se esperara que obtengan notas entre 420 y
735 puntos?
h. Cul fue la calificacin obtenida por el 10% de los que salieron con mejor nivel de
ingls?
i. Cul fue la calificacin mxima obtenida por el 20% de los de ms bajo nivel de
ingls?
14. Algunas personas desarrollan adiccin al trabajo, lo cual les resta calidad de vida y afecta
sus relaciones familiares y sociales, e incluso afecta su salud. Un equipo especializado ha
elaborado una prueba para determinar si una persona es adicta al trabajo. La prueba mide la
adiccin al trabajo en una escala y si una persona obtiene entre 120 y 150 puntos est en
riesgo de ser adicto al trabajo, y si obtiene ms de 150 puntos, entonces es adicto al trabajo.
Luego de aplicar la prueba a varios miles de personas, se encontr que las puntuaciones se
distribuyen normalmente con una media de 105 puntos y desviacin estndar de 28 puntos.
Calcule la probabilidad de que una persona seleccionada al azar:
a. Est en riesgo de ser adicto al trabajo.
b. Sea adicto al trabajo.
c. No sea adicto ni est en riesgo de ser adicto al trabajo.
d. A partir de cul puntaje se encuentra el 10% de las personas con mayor nivel de
adiccin al trabajo?
15. Si el nmero de horas que los funcionarios de una empresa dedican a iniciativas de
voluntariado se distribuye normalmente, cul es la probabilidad de que un funcionario
seleccionado al azar dedique una cantidad de hora que se ubique en un rango de dos veces la
desviacin estndar (hacia arriba o hacia abajo) con respecto a la media?
16. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. Se logr determinar que el ingreso de estas mujeres se distribuye
normalmente con una media de $450 al mes. Si el percentil 70 de ingreso es de $650, cul es
la desviacin estndar del ingreso de estas mujeres?
17. En un estudio se determin que los gastos en publicidad de las universidades privadas del
pas se distribuye normalmente con una desviacin estndar de $400 mil al ao. Si el monto
mximo del gasto en publicidad del 30% de las empresas que menos gastan en publicidad es
$100 mil dlares al ao, calcule el gasto anual promedio de estas grandes compaas.
18. En una investigacin sobre las iniciativas de voluntariado que realizan los empleados de
distintas empresas del pas involucradas en programas sociales se estim que el tiempo que
cada funcionario dedica a estas actividades se distribuye normalmente con media de 40
19. Suponga que el proceso de empacado de detergente en polvo tiene una media de 996
gramos por bolsa con una desviacin estndar de 42 gramos. Se considera que los pesos se
distribuyen normalmente. Con base en los datos anteriores determine la probabilidad de que al
seleccionar aleatoriamente una bolsa:
a. Tenga un peso superior a 1,1 kilogramos.
b. Tenga un peso superior a 900 gramos.
c. Tenga un peso inferior a 1000 gramos.
d. Tenga un peso inferior a 920 gramos.
e. Tenga un peso entre 900 y 950 gramos.
f. Si se decide volver a llenar el 10% de las bolsas con menor peso, a partir de qu
peso, en gramos, se debern volver a llenar estas bolsas?
20. Si los dimetros del cable coaxial RG-174 fabricado por una empresa se distribuyen
normalmente con media 2,55 mm. y desviacin estndar 0,8 mm., determinar el porcentaje de
cables con dimetros:
a. entre 2,5 y 2,6 mm.
b. menores o iguales a 2,44 mm.
c. mayores o iguales a 2,62 mm.
d. Cul debe ser el tamao mnimo que debe tener el 10% de los cables con el mayor
dimetro?
21. Los dimetros interiores de las arandelas hechas por cierto fabricante se distribuyen
normalmente con una media de 11,2 mm y una desviacin estndar de 0,15 mm.
a. Cuntas arandelas de un lote de 1500 tienen un dimetro interno mayor a 11,5
mm?
b. Cul es la probabilidad de que una arandela tenga un dimetro inferior a 11,4 mm?
c. Cul es la probabilidad de que una arandela tenga un dimetro entre 11,05 y 11,59
mm?
d. Cul es el dimetro mnimo del 70% de las arandelas con mayor dimetro interno?
e. Cul es el valor del dimetro sobre el que est el 15% de las arandelas de menor
dimetro interno?
f. Cul es el valor del dimetro bajo el que est el 25% de las arandelas?
g. Cul es el dimetro mximo del 82,5% de las arandelas?
23. Los resultados de una prueba para determinar el cociente intelectual se distribuyen
normalmente con una media de 101 puntos y desviacin estndar de 10 puntos. Si se
selecciona al azar una persona, determine la probabilidad de que obtenga en la prueba:
a. Ms de 120 puntos.
b. Menos de 85 puntos.
c. Entre 90 y 110 puntos.
d. Cul es el puntaje mnimo del 6% de las personas con mayor cociente intelectual
segn este test?
24. Una empresa que emisora de tarjetas de crdito sabe, por experiencia, que el saldo
mensual promedio de los clientes es de $258 con una desviacin estndar de $136. Calcule la
probabilidad de que el saldo mensual sea:
a. Ms de $220.
b. Menos de $300.
c. Entre $188 y $227.
d. Cunto ser el monto mximo del 70% de los saldos ms bajos?
e. Sobre qu valor se encuentra el 23% de los saldos?
Distribucin exponencial
25. Como administrador de un restaurante de comidas rpidas sabe que, en promedio, llega un
cliente cada 2,5 minutos y desea conocer la probabilidad exponencial de que pasen ms de 50
segundos entre la llegada de dos clientes.
26. Un fabricante de discos duros indica que los discos que fabrica tiene una vida media de
1400000 horas. Si esta vida til vara exponencialmente, determine la probabilidad de que uno
de estos discos duros seleccionados al azar tenga una vida til:
a. Menos a 1000000 de horas.
b. Inferior a 10 aos funcionando 24 horas al da.
c. Si la esperanza de vida en un pas es de 78 aos, cul es la probabilidad de que uno
de estos discos duros dure ms que la vida esperada de una persona?
27. Se sabe que el tiempo de espera de una persona que llama a un centro de llamadas de una
empresa de soporte tecnolgico es una variable aleatoria exponencial con media 4,5 minutos.
Encuentre la probabilidad de que un cliente que llame en un momento seleccionado al azar
tenga que esperar:
a. A lo sumo 6 minutos.
b. Como mximo 3 minutos.
c. Entre 2 y 5 minutos.
28. Se sabe que un cierto tipo de motor debera tener una vida til distribuida
exponencialmente de 400000 kilmetros. Con base en estos datos determine:
a. La probabilidad de que un motor seleccionado al azar tenga una vida de a lo sumo la
mitad de lo esperado.
b. Si se tiene una flota de 200 vehculos empleando este tipo de motor, cuntos se
esperara que se que tenga una vida superior a 500000 km?
b. Entre 17 y 23 minutos.
c. Menos de 25 minutos.
1. Si se sabe que b es una variable normal estndar, Cul es la probabilidad de que b sea
mayor que 2,5?
( a ) 0,0000 ( b ) 0,9938
( c ) 0,0062 ( d ) Falta informacin
2. Si se sabe que b es una variable normal estndar, Cul es el valor de que b que se ubica en
el percentil 19? Usando la tabla de la distribucin normal estndar acumulada:
( a ) 0,88 ( b ) 0,7910
( c ) 0,88 ( d ) Ninguna de las anteriores
3. Si se sabe que x es una variable normal con media 12 y varianza 9, Cul es la probabilidad
de que x sea menor que 10? Usando la tabla de la distribucin normal estndar acumulada:
( a ) 0,4121 ( b ) 0,7486
( c ) 0,2514 ( d ) Ninguna de las anteriores
4. Si se sabe que x es una variable normal con media 12 y varianza 9, Cul es la probabilidad
de que x sea como mnimo igual a 8? Usando la tabla de la distribucin normal estndar
acumulada:
( a ) 0,6716 ( b ) 0,0918
( c ) 0,9082 ( d ) Ninguna de las anteriores
5. Si se sabe que x es una variable normal, Cul es la probabilidad de que x tome valores en
un intervalo de 2 veces la desviacin estndar con respecto a la media?
( a ) 0,997 ( b ) 0,683
( c ) 0,954 ( d ) Falta informacin
6. Si se sabe que x es una variable normal con media 12 y varianza 9, Cul es el valor de x
que separa el 15% superior de los valores posibles de x?
( a ) 0,85 ( b ) 8,891
( c ) 15,11 ( d ) Ninguna de las anteriores
8. Una empresa ha comprado un equipo para su produccin que requiere una pieza especial.
Segn el proveedor esa pieza especial posee una vida esperada de 8 meses. Si usted desea
saber la probabilidad de tener que reemplazar esta pieza antes de 6 meses, debera emplear la
distribucin:
( a ) Binomial ( b ) Normal ( c ) Multinomial ( d ) Geomtrica
11. Una fbrica de cemento empaca su producto en sacos que tienen una media de 51,9
kilogramos, con una desviacin estndar de 350 gramos, de acuerdo con una distribucin
normal. La especificacin es que cada saco pese exactamente 52 kilogramos. La probabilidad
de que un saco seleccionado al azar tenga un exceso en el peso de un kilogramo o ms con
respecto al peso especificado es:
( a ) 0,0008 ( b ) 0,9992
( c ) 0,0021 ( d ) Ninguna de las anteriores
12. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso en un rango de 2 veces la desviacin estndar con respecto al promedio
es:
( a ) 0,9540 ( b ) 0,6830
( c ) 0,9970 ( d ) Ninguna de las anteriores
13. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso entre 50 y 52 kilogramos es:
( a ) 0,6125 ( b ) 0,3875
( c ) 0,9999 ( d ) Ninguna de las anteriores
14. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso inferior a 51,1 kilogramos es:
( a ) 0,4991 ( b ) 0,5009
( c ) 0,0111 ( d ) Ninguna de las anteriores
15. Tomando los mismos datos del problema 11, en un lote de 200 sacos, el nmero de sacos
que se esperara que tengan un peso superior a 52,5 kilogramos es:
( a ) 12,5 ( b ) 8,64
( c ) 0,0432 ( d ) Ninguna de las anteriores
16. Tomando los mismos datos del problema 11, si se considera que si un saco tiene un peso
en el 10% inferior debe reprocesarse, entonces el valor que marca el peso en kilogramos a
partir del cual los sacos deben reprocesarse es:
( a ) 51,95 ( b ) 51,45
( c ) 0,5235 ( d ) Ninguna de las anteriores
17. Tomando los mismos datos del problema 11, el valor que marca el percentil 85 de los
pesos, en gramos, es:
( a ) 52,26 ( b ) 52260
( c ) 0,5154 ( d ) Ninguna de las anteriores
19. Cul de las siguientes es falsa acerca de los datos que sigue la distribucin normal?
( a ) El promedio es el mismo que el modo
( b ) La desviacin estndar es la misma que la media
( c ) La mediana es el mismo que el modo
( d ) La mayora de los datos est dentro de 3 desviaciones estndar de la mediana
21. En los problemas binomiales en que n > 20 y p > 5%, es falso que:
( a ) se puede emplear la normal para aproximar la binomial
( b ) los resultados de la binomial y la normal son iguales
( c ) los resultados de la binomial y la normal convergen con forme n tiende a infinito
( d ) efectuar el clculo usando la distribucin binomial lleva ms trabajo
1. c 2. c 3. c 4. c 5. c
6. c 7. a 8. b 9. c 10. b
11. a 12. a 13. a 14. c 15. b
16. b 17. b 18. a 19. b 20. b
21. b
8 .
Inferencia estadstica
El objetivo de una investigacin estadstica por muestreo es poder realizar inferencias acerca
de la poblacin pero obtenidas a partir de la informacin contenida en una muestra tomada
aleatoriamente. Por ejemplo, si en una investigacin se desea conocer la ingesta promedio de
caloras en una determinada poblacin, entonces se toma una muestra representativa y se
espera que esos datos muestrales permitan efectuar conclusiones relacionadas con toda la
poblacin, pues el objetivo es conocer la poblacin, no la muestra.
Las poblaciones son representadas por descripciones numricas llamadas parmetros, por
ejemplo, la media () o la desviacin estndar (), as, la inferencia estadstica consiste en
hacer inferencias sobre parmetros a partir de estadsticos como x y s, los cuales son
calculados con base en las observaciones de las muestras. Para efectos de este texto, estas
inferencias se relacionarn principalmente con la estimacin por intervalos de una media
poblacional y de una proporcin poblacional, las cuales se tratarn en este captulo, y en un
captulo posterior se trabajar lo relacionado con las pruebas de hiptesis.
Suponga que se realizan 4 lanzamientos seguidos de un dado. En cada caso se van a apuntar
los 4 resultados. En la tabla se presentan los resultados de simular 50 series de 4 lanzamientos
del dado. La simulacin se efectu usando la funcin de Excel =ALEATORIO.ENTRE(1;6) y
los promedios se :
2 4 5 5 2 27 2 5 6 1
3 4 5 5 2 28 1 3 4 6
4 4 5 3 6 29 3 1 6 6
5 4 4 6 2 30 4 5 3 1
6 2 4 2 4 31 4 6 6 1
7 2 2 6 5 32 5 1 5 1
8 3 5 1 4 33 6 4 3 4
9 5 3 1 1 34 5 3 2 3
10 2 2 6 2 35 3 6 1 4
11 2 3 3 2 36 4 1 2 4
12 2 6 5 6 37 4 5 3 2
13 4 5 3 1 38 1 6 4 4
14 4 6 1 5 39 5 1 5 1
15 1 5 3 5 40 4 1 1 6
16 3 1 2 4 41 6 6 5 5
17 4 2 5 2 42 1 6 2 2
18 6 1 1 6 43 3 1 5 4
19 5 4 4 6 44 3 5 4 1
20 4 6 6 4 45 5 4 4 5
21 2 1 2 3 46 5 1 6 4
22 1 2 6 4 47 4 4 6 3
23 2 1 1 3 48 6 5 3 3
24 5 5 3 3 49 2 1 6 1
25 2 4 5 5 50 3 1 5 3
Si se toman los 200 lanzamientos en total (50 series de 4 lanzamientos cada una) y se
construye una grfica representando los resultados, es de esperar que todas las barras sean de
una altura similar, porque cada uno de los 6 posibles resultados tiene la misma probabilidad
de aparecer (probabilidad que en cada caso es 1/6), pero con pequeas diferencias debidas al
azar, tal como se muestra en el siguiente histograma:
40
35
30
25
Frecuencia
20
15
10
5
0
1 2 3 4 5 6
Resultados del dado
Ahora, para cada una de las 50 serie se va a obtener la media, es decir, en cada caso se suman
los 4 valores y se divide entre 4 para cada una de las series de 4 lanzamientos. Esto va a dar
una lista de 50 promedios:
Observe que cada serie tiene una media distinta, a pesar de que se origina del mismo proceso
aleatorio. Esas diferencias se deben al azar. Ahora, en vez de emplear los datos de los 200
lanzamientos, se tomarn las 50 medias obtenidas en cada serie, y se volver a construir la
grfica, la cual corresponde al histograma siguiente.
30
25
20
Frecuencia
15
10
0
1 2 3 4 5 6
Resultados del dado
En principio se pudo haber esperado que las dos grficas debieran tener forma similar, pero es
claro que esto no es as. Al graficar los promedios muestrales se observa que la distribucin
muestral de las medias es aproximadamente normal. Este resultado no es casualidad. En
general, si se toman muestras aleatorias de n elementos de una poblacin y se calculan los
promedios x i de cada una de las muestras, es de esperar que los valores de las medias no sean
todos iguales, sino que presentan diferencias debidas al azar, pero que estas medias tienden a
distribuirse segn una curva normal, independientemente de la forma de la poblacin original,
o sea, que no importa si los datos originales siguen o no una distribucin normal. Todo esto
conduce al siguiente teorema:
Teorema: Si se extrae una muestra aleatoria de tamao n de una poblacin que tiene media
y varianza finita 2 entonces x es el valor de una variable aleatoria con media y desviacin
estndar:
x
n
N n
x
n N 1
N n 5000 40
0,9922
N 1 5000 1
29
x 4,59
n 40
N n 29 5000 40
x 4,57
n N 1 40 5000 1
Puede verse en el ejemplo que la diferencia entre el error estndar con el factor de correccin
y el primero que se calcul que no lo incorporaba es mnima, ya que en ese caso el factor de
correccin es muy cercano a uno. Si el tamao de la muestra es ms grande o si la poblacin
es ms pequea, entonces el factor de correccin marcar una diferencia ms importante. Por
ejemplo, con una poblacin ms pequea de tamao 500 (y con tamao de muestra 40), el
factor de correccin es:
N n 500 40
0,9218
N 1 500 1
N n 29 500 40
x 4,40
n N 1 40 500 1
x
z
/ n
x
t
s/ n
La distribucin t tiene forma de campana y es simtrica con respecto al origen, igual que la
distribucin normal, e, igual que la distribucin normal estndar, tiene media = 0, sin
embargo, su desviacin estndar depende de los grados de libertad. A medida que la muestra
es ms grande la distribucin t se aproxima a la normal estndar, es decir, tiende a 1 cuando
n tiende a y, por lo tanto, gl tiende a . Se considera que la distribucin normal estndar es
una buena aproximacin a la distribucin t para muestras mayores o iguales a 30.
La tabla que aparece en el Apndice 7 se muestra del modo siguiente (aqu aparece solo una
parte de la tabla para ilustrar su uso):
Los siguientes son ejemplos de valores de t tomados de la tabla t (Apndice 7). Si se tiene que
el valor = 0,01, y que n = 2, entonces gl = n 1 = 1, por lo que se busca el = 0,01 en los
niveles de significancia para pruebas de una cola, o sea, en la cuarta columna, y en el rengln
de gl = 1, as que se tendra que t = 31,821. Si se buscara en el valor = 0,01 para pruebas de
dos colas, entonces se busca en la quinta columna, y en el rengln de gl = 1, as que se tendra
que t = 63,657. Luego, en este captulo y los siguientes, se indicar cundo emplear los
valores para la prueba de una cola y cundo los de la prueba de dos colas.
Si = 0,01 con n = 12, entonces gl = n 1 = 11, entonces se busca el = 0,01 en los niveles
de significancia para pruebas de una cola, o sea, en la cuarta columna, y en el rengln de gl =
11, as que se tendra que t = 2,718. Otros ejemplos son:
Claramente se observa que conforme n crece, y por lo tanto gl tambin crece, el valor de t se
aproxima al de z en la curva normal estndar.
En trminos de los smbolos de cada uno de los valores el error de estimacin se expresara:
ERROR DE ESTIMACIN E x
Cuando se utiliza la media muestral x para construir un intervalo de confianza para estimar la
media poblacional , la probabilidad de que esta estimacin no falle es como mximo de 1
. Esta probabilidad se le conoce como nivel de confianza.
x
z
/ n
Solo interesan los valores de Z que estn entre en el intervalo de confianza Z/2 y Z/2:
x
Z / 2 Z / 2
/ n
Si se toman los valores en los extremos de las desigualdades y el valor absoluto de x (que
es el error de estimacin) al sustituir en las desigualdades de arriba se tiene:
x E
Z / 2
/ n / n
ERROR MXIMO DE ESTIMACIN EZ para n 30
n
E t para n < 30
n
x
Z / 2 Z / 2
/ n
se obtienen las frmulas para el intervalo de confianza. Se toma primero slo el lado
izquierdo de la desigualdad:
x
Z / 2
/ n
y se despeja:
Z / 2 / n x
x Z / 2 / n
x Z / 2 / n
x Z / 2 / n x Z / 2 / n
xE
INTERVALOS DE CONFIANZA:
Cuando n 30 y conocida: x Z / n
Cuando n 30 y desconocida: x Z s/ n
En el ltimo caso la confianza del intervalo es 1 1/k2 (se aplica el teorema de Chebyshev).
INTERVALO DE CONFIANZA:
Cuando n 30 y conocida: x Z / n
x Z / n
206 1,96 40 / 50
Ejemplo Utilice Excel y Minitab para resolver el problema: Durante una semana se
toma una muestra aleatoria de 50 empleados de una empresa, y se obtiene
un salario promedio de $206. Se conoce que la desviacin estndar
poblacional de $40.
Determine los intervalos de confianza del 95% para la media de los
salarios de esta empresa.
=INTERVALO.CONFIANZA(alfa;desv_estndar;tamao)
=INTERVALO.CONFIANZA(0,05;40;50)
INTERVALO DE CONFIANZA:
Cuando n < 30 y conocida: x Z / n
Ejemplo Se sabe que el tiempo que toma completar una prueba psicomtrica tiene
una varianza de 225 minutos. Una muestra de 20 estudiantes es sometida a
la prueba obtenindose una media de 71 minutos. Obtenga los lmites de
confianza del 99% para el tiempo medio en que se completa dicha prueba.
x Z / n
71 2,58 15 / 20
Li 71 2,58 15 / 20 62,36
Ls 71 2,58 15 / 20 79,64
INTERVALO DE CONFIANZA:
Cuando n 30 y desconocida: x Z s/ n
x zs/ n
5,25 1,96 1,75 / 42
Ejercicio Una empresa productora de harina de trigo empaca paquetes que deben
contener un kilogramo de producto. En una muestra de 60 paquetes se
de obtuvo un peso medio de 992 gramos y una desviacin estndar muestral
revisin de 44 gramos. Calcule los intervalos de confianza del 98% para el peso
medio de los paquetes de harina.
INTERVALO DE CONFIANZA:
Cuando n < 30 y desconocida: x ts/ n
x ts/ n
2000 2,262 200 / 10
Grados de libertad
Los grados de libertad corresponden a una medida del nmero de observaciones
independientes entre los elementos de una muestra, es decir, es el nmero de datos que se
podran cambiar de modo que, dado un total fijo, se puede obtener ese total. Por ejemplo, la
media aritmtica tiene n - 1 grados de libertad, ya que, si tuviramos una muestra de 10 datos
y conocemos el valor de la media, entonces podramos modificar 9 datos, o sea, n - 1 datos, y
el dcimo quedara determinado. Si se tuviera una tabla de 5 filas y 4 columnas, o sea, 5 x 4, y
se conocen los totales de cada fila y columna, entonces en cada fila se podra modificar 3
datos (y el quinto quedara determinado por la diferencia de los 4 primeros con el total) y en
cada columna se podran cambiar 4 datos, de modo que los grados de libertad de esta tabla 5 x
4 seran (5 - 1) x (4 - 1) = 4 x 3 = 12 grados de libertad.
Ejemplo Utilice Minitab para resolver el problema: El ciclo medio de vida de una
muestra aleatoria de 12 focos es de 2000 horas, con una desviacin
estndar muestral de 200 horas. Se supone que la vida media de los focos
se distribuye normalmente. Determine los intervalos de confianza del 95%
para la vida media de los focos.
Ejemplo Se sabe que 20 fusibles que fueron sometidos a una sobrecarga del 20% se
fundieron en un tiempo promedio de 10,63 minutos, con desviacin
estndar de 2,48 minutos.
Solucin Se tiene que n = 20, x = 10,63 minutos, s = 2,48 minutos y una confianza:
1 = 0,95.
1 1/k2 = 0,95
Despejando k:
1/k2 = 0,05
1/ 0,05 = 20 = k2
k = 4,472
8,15
x k s / n 10,63 4,472 2,48 20 10,63 2,48
13,11
Entonces:
Al trabajar con proporciones se supondr siempre que las situaciones satisfacen las
condiciones de la distribucin binomial, por lo tanto, la distribucin de muestreo en la que se
basarn los mtodos es la binomial con = np y = npq . Se sabe adems que cuando n >
20 y p > 5% la binomial se puede aproximar por la distribucin normal con:
x x nP pP
z
nPQ PQ n
En los intervalos de confianza interesan los valores de Z que estn en Z/2 < Z < Z/2, los
cuales se obtienen por medio de:
pz pq n
Debido a que no se tienen la proporcin poblacional, en todas estas frmulas se usa el valor
de p y q de la muestra.
Ejemplo Se toma una muestra de 500 varones adultos y se encuentra que 156 son
fumadores. Encuentre los lmites de confianza del 99% para la proporcin
de fumadores varones.
0,2586
pz pq n = 0,312 2,58 0,312 0,688 500 =
0,3653
Ejercicio Una empresa desea lanzar un nuevo servicio por internet al mercado y para
ello requiere conocer la proporcin de hogares de la zona que posee acceso
de a internet. En una muestra 120 hogares, 70 indicaron que posean algn
revisin tipo de conexin a la red. Determine los intervalos de confianza del 99%
para la proporcin de hogares de la zona con acceso a internet.
Ejemplo En una muestra de 1000 adultos y se encuentra que 198 estarn de acuerdo
con la despenalizacin de la marihuana. Encuentre los lmites de confianza
del 99% para la proporcin de adultos que apoyaran la despenalizacin de
la marihuana.
Solucin Se tiene que x = 198 eventos de una muestra de n = 1000 adultos, as que
en el men Estadsticas / Estadstica bsica / 1 Proporcin se completa el
cuadro, seleccionando la opcin Datos resumidos con 198 eventos y 1000
ensayos:
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios siguientes (las respuestas a los ejercicios se encuentran en la pgina de
internet del texto: www.auladeeconomia.com/raeep.html).
2. En una muestra de 250 metros de cable coaxial RG-174 fabricado por una empresa se
obtuvo un dimetro medio de 2,55 mm. Se sabe que la desviacin estndar es 0,5 mm.
Determine los intervalos de confianza del 99% para el dimetro promedio.
4. En una feria de empleo se tom una muestra al azar de 40 aplicantes. Se les aplic una
prueba para determinar su nivel de ingls y se obtuvo que 32 tenan un nivel de 600 puntos o
ms y un promedio de 680 puntos. Se sabe que la prueba tiene una desviacin estndar de 150
puntos. Con base en estos datos:
a. Determine los intervalos de confianza del 95% para el nivel medio de ingls de las
personas que buscaban empleo en esa la feria.
b. Si el nivel de 600 puntos se considera como aceptable para las empresas que buscan
un alto dominio del ingls, determine los intervalos de confianza del 99% para la
proporcin de personas que tienen un elevado dominio del idioma ingls.
5. En una nuestra de 40 mujeres se determin que su pulso cardaco promedio era de 76,3
latidos por minuto. Se conoce que la desviacin estndar poblacional es de 12,5 latidos por
minuto. Con base en los datos anteriores, determine:
a. Calcule el error estndar del pulso cardaco promedio (en latidos por minuto).
b. Calcule los intervalos de confianza del 95% para el pulso cardaco promedio de las
mujeres.
6. El gerente de una empresa procesadora de caf est preocupado porque sus proveedores le
entregan con frecuencia caf verde. Se tomaron como muestras 36 probetas de 250 ml cada
una y encontr que en promedio se entreg 30 ml de grano verde por probeta con una
desviacin de 10 ml. Calcule el intervalo del 98% para la cantidad de grano verde por probeta.
8. Segn un estudio en 25 familias de estratos socio econmicos medios y altos, los nios
inician alguna prctica de cuidado de su salud buco dental a los 15,6 meses. Se conoce que la
desviacin estndar es 8,5 meses. Calcule los intervalos de confianza del 99% para la edad de
inicio de las prcticas cuidado buco dental de los nios de familias de estratos socio
econmicos medios y altos.
9. Un arquitecto considera que actualmente las casas tienen un rea construida inferior a la de
hace dos o ms dcadas. En una muestra de 15 viviendas construidas en el transcurso de los
dos ltimos aos se encontr un rea construida promedio de 92 metros cuadrados y una
desviacin estndar de 30 metros cuadrados.
a. Obtenga los intervalos de confianza del 95% para el rea construida de las viviendas
nuevas.
b. Si se sabe, por otro estudio, que las viviendas construidas hace dos dcadas o ms
tenan un rea construida promedio de 130 metros cuadrados, podra considerarse,
con base en el intervalo calculado, que efectivamente el rea de las viviendas es menor
actualmente?
10. En una muestra de 12 motores para automvil de cierto tipo se obtuvo una vida til
promedio de 300000 kilmetros. La desviacin estndar muestral es de 60000 kilmetros.
Obtenga los intervalos de confianza del 90% para la vida til promedio de estos motores.
11. Una compaa ha desarrollado un nuevo motor de gasolina. Para valorar su consumo de
combustible efecta 15 recorridos y el motor consumi en promedio 8,7 galones de gasolina
por minuto con una desviacin estndar de 1,2 galones. Qu se podra afirmar, con un 99%
de confianza, acerca del tamao mximo del error de estimacin?
12. Un jefe de produccin de una maquiladora desea estimar en forma rpida el tiempo medio
que requieren las 520 costureras de la planta para realizar cierta tarea. Con ese fin selecciona
una muestra de 15 de ellas y cronometra sus tiempos, obteniendo los siguientes resultados
(tiempos en segundos):
52 59 63 49 54 56 54 50 66 70 61 57 53 55 56
Efecte una estimacin por intervalos, con una confianza del 95% para el tiempo medio de
realizacin de dicho trabajo.
13. Cierta compaa desea determinar el tiempo medio de horas extra laboradas cada semana
por sus trabajadores del rea de produccin. Se ha tomado una muestra de 15 trabajadores con
las siguientes cantidades de horas para la semana pasada:
5 8 7 2 1 6 0 4 3 11 6 13 7 2 4
14. Los siguientes datos corresponden a una muestra de personas que aplicaron un test para
medir su cociente intelectual: 102, 98, 95, 112, 125, 85, 83, 129, 78, 116, 101, 96, 100, 103,
97, 102, 95, 101, 98, 99, 103, 101. Determine los intervalos de confianza del 90% para el
cociente intelectual promedio.
15. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. El objetivo es que estas mujeres lograran incrementar los ingresos de sus
microempresas. Luego de implementadas las capacitaciones se compararon los ingresos de
una muestra de 12 microempresas y se registraron los siguientes ingresos (en dlares al mes):
Participantes 1 2 3 4 5 6 7 8 9 10 11 12
Antes 320 290 421 510 210 402 625 560 360 431 506 505
Despus 340 285 475 510 210 500 631 560 365 431 525 619
a. Determine los intervalos de confianza del 90% para los ingresos de las participantes
antes de la capacitacin.
b. Determine los intervalos de confianza del 90% para los ingresos de las participantes
despus de la capacitacin.
c. A qu conclusin puede llegarse luego de analizar los dos resultados anteriores?
16. Un ingeniero ha recopilado datos sobre la vida til de 20 filtros de gasolina del mismo
tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15, 10, 20, 13,
15, 16, 14, 12, 13, 11, 13, 15, 16, 13, 14, 14, 12. Calcule los intervalos de confianza del 95%
para la vida media de un filtro de gasolina.
17. Un contador est realizando una auditora de los cheques extendidos por una compaa.
En una muestra de 20 cheques se obtuvieron los siguientes montos, en miles dlares:
15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6, 8, 12, 19, 11, 12
Construya un intervalo del 95% de confianza para el monto medio de los cheques extendidos
por la compaa.
18. Dada la alta incidencia de la diabetes, en una zona del pas se ha implementado un
programa de dieta y ejercicio para la poblacin que padece esta enfermedad. Para determinar
la efectividad del programa se han reunido los siguientes datos, que corresponden a los
niveles de glucosa en la sangre de una muestra de 5 pacientes diabticos, tomadas antes del
programa de dieta y ejercicio y luego de dicho programa.
a. Calcule los intervalos de confianza del 95% para los niveles de glucosa en la sangre
antes del programa de dieta y ejercicio.
b. Calcule los intervalos de confianza del 95% para los niveles de glucosa en la sangre
despus del programa de dieta y ejercicio.
c. Considera usted que existe evidencia estadstica suficiente para considerar que
hubo una disminucin en los niveles de glucosa de los pacientes?
19. Se sabe que el tiempo que toma completar una prueba psicomtrica tiene desviacin
estndar de 10 minutos. Una muestra de 30 estudiantes son sometidos a la prueba
obtenindose una media de 91 minutos. Obtenga los lmites de confianza del 97% para la
media poblacional.
20. Se desea conocer la incidencia del cncer de estmago en una cierta zona del pas. Si en
una muestra de 2000 personas de esa zona se encontraron 26 con dicho padecimiento, obtenga
los lmites de confianza del 95% para la proporcin de personas con cncer de estmago en
esa zona.
21. Una reciente encuesta incluy a 1220 adultos elegidos al azar y se les pregunt si
consideraban que debera permitirse la clonacin de seres humanos. Los resultados mostraron
que 912 de los encuestados dijeron que no debe permitirse la clonacin. Se desea determinar
si estos resultados constituyen una fuerte evidencia de que la mayora de las personas (ms del
50%) se oponen a este tipo de clonacin. Para dar su respuesta,
22. Segn un estudio el 25% de las viviendas de zonas urbanas del pas estn en estado malo
o regular. Si se emple un tamao de muestra de 50 viviendas, obtenga los intervalos de
confianza del 98% para la proporcin de viviendas de zonas urbanas del pas estn en estado
malo o regular.
23. Una empresa pauta publicidad en televisin todos los meses. Recientemente ha lanzado
una campaa muy agresiva, y se espera que al menos el 55% de los consumidores de menos
de 40 aos recuerden el anuncio de la empresa. Se ha tomado una muestra de 120
consumidores de menos de 40 aos y el 48% dijeron que recordaban el anuncio de la empresa.
Determine los intervalos de confianza del 95% para la proporcin de consumidores meta que
recuerda el anuncio. Puede considerarse que se ha alcanzado la meta?
24. En una muestra de 250 periodistas, 120 indicaron que no perciban que hubiera
importantes amenazas a la libertad de prensa en el pas. Estime los intervalos de confianza del
90% para la proporcin de periodistas que no perciban que hubiera importantes amenazas a
la libertad de prensa en el pas.
Estime los intervalos del 95% de confianza para la proporcin de estudio con problemas
metodolgicos si se emple una muestra de 106 estudios.
26. En una poblacin de 850 familias, se llev a cabo una encuesta para estimar el consumo
medio de leche. La muestra consisti en 44 familias seleccionadas por muestreo simple al
azar. El consumo mensual en litros fue el siguiente:
15 45 75 90 45 68 41 12 16 52 53
8 28 35 63 54 90 47 35 41 49 38
30 15 53 43 39 54 21 43 38 32 45
36 32 47 29 41 40 40 42 52 30 44
3. Luis est tratando de estimar el gasto promedio en alimentacin de las familias de su pas.
Para resolver este problema:
(a) Se puede entrevistar a todas y cada una de las familias del pas
(b) Seleccionar algunas familias "modelo" segn el criterio de Luis
(c) Seleccionar una muestra aleatoria de familias de todo el pas
(d) Seleccionar una muestra de familias cercanas al lugar donde Luis vive
(a) El valor esperado del estadstico es igual al valor del parmetro que se estima
(b) Se utiliza toda la informacin proporcionada por la muestra en lo que se refiere al
parmetro
(c) La distribucin del estimador est concentrada alrededor del parmetro
(d) La precisin del estimador ser mayor para tamaos de muestra grandes
11. Se sabe que una variable x tiene una desviacin estndar de 10. Si se toma una muestra de
16 unidades, entonces el error estndar equivale a:
(a) 2,5 (b) 4 (c) 0,625 (d) Ninguna de las anteriores
12. Se sabe que una variable x tiene una desviacin estndar de 10. Si se toma una muestra de
16 unidades de una poblacin de 70, entonces el error estndar equivale a:
(a) 2,5 (b) 2,21 (c) 0,5529 (d) Ninguna de las anteriores
13. La diferencia en, valor absoluto, entre el valor de la media muestral y la media
poblacional se conoce como:
(a) Error estndar (b) Error de la estimacin
(c) Error absoluto medio (d) Ninguna de las anteriores
15. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 5 unidades. En una muestra de tamao 45 se obtiene una media de 63
unidades, entonces el valor de z necesario para obtener los intervalos de confianza del 95%
es:
(a) 1,645 (b) 0,95 (c) 1,96 (d) 2,58
16. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 5 unidades. En una muestra de tamao 45 se obtiene una media de 63
unidades, entonces el al obtener los intervalos de confianza del 95%, el lmite inferior es:
(a) 61,77 (b) 61,54 (c) 64,46 (d) Ninguna de las anteriores
17. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 5 unidades. En una muestra de tamao 45 se obtiene una media de 63
unidades, entonces el al obtener los intervalos de confianza del 95%, se concluye que:
(a) Con una confianza del 95% la media poblacional es 63 unidades
(b) Con una confianza del 95% la media poblacional est entre 61,77 y 64,23 unidades
(c) Con una confianza del 95% la media poblacional es mayor que 61,77 unidades
(d) Con una confianza del 95% la media poblacional est entre 61,54 y 64,46 unidades
18. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 15 unidades. En una muestra de tamao 200 se obtiene una media de 87
unidades, entonces al obtener los intervalos de confianza del 90%, el lmite superior es:
(a) 87 (b) 85,26 (c) 88,74 (d) Ninguna de las anteriores
19. Se desea estimar la media poblacional de una variable x distribuida normalmente cuya
desviacin estndar poblacional es de 20 unidades. En una muestra de tamao 12 se obtiene
una media de 125 unidades, al obtener los intervalos de confianza del 99%, un investigador
realiz las siguientes dos afirmaciones:
20. Se desea estimar la media poblacional de una variable x distribuida normalmente. En una
muestra de tamao 12 se obtiene una media de 125 unidades y una desviacin estndar de 20
unidades, al obtener los intervalos de confianza del 99%, un investigador realiz las siguientes
dos afirmaciones:
21. Se desea estimar la media poblacional de una variable x distribuida normalmente. En una
muestra de tamao 20 se obtiene una media de 3200 unidades y una desviacin estndar de
450 unidades, al obtener los intervalos de confianza del 95%, un investigador realiz las
siguientes dos afirmaciones:
22. Se desea estimar la media poblacional de una variable x. En una muestra de tamao 80 se
obtiene una media de 30 unidades y una desviacin estndar de 4,5 unidades, al obtener los
intervalos de confianza del 99%, un investigador realiz las siguientes dos afirmaciones:
23. Al estimar la media poblacional de una variable x, en una muestra de tamao 50 se obtiene
una media de 1500 unidades y una desviacin estndar de 250 unidades. Al obtener los
intervalos de confianza del 95%, es verdadero que:
(a) Con certeza la media est entre 1430,70 y 1569,30
(b) Con una confianza del 95% la media poblacional es mayor que 1430,70 unidades
(c) Con una confianza del 95% la media poblacional est alrededor de 1500 unidades
(d) Con una confianza del 95% la media poblacional est entre 1430,70 y 1569,30 unidades
24. Al estimar la media poblacional de una variable x, en una muestra de tamao 500 se
obtiene una media de 2150 unidades y una desviacin estndar de 600 unidades. Al obtener
los intervalos de confianza del 90% se obtuvo como lmite inferior 2105,86 y como lmite
superior 2194,14, entonces es verdadero que:
(a) La media est entre 2105,86 y 2194,14
(b) Con una confianza del 90% la media poblacional es menor que 2194,14 unidades
(c) La media poblacional ser mayor que 2194,14 con una probabilidad de 5%
(d) La media poblacional estar entre 2105,86 y 2194,14 unidades en 90 de cada 100 muestras
25. Si x es el nmero de veces que ha ocurrido un evento en una muestra n pruebas, entonces
el cociente x/n representa:
(a) La proporcin poblacional (b) La proporcin muestral
(c) La probabilidad de fracaso (d) Ninguna de las anteriores
26. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 120 se obtiene un conteo de 90 eventos. Al obtener los intervalos de confianza del
99%, un investigador realiz las siguientes dos afirmaciones:
27. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 120 se obtiene un conteo de 90 eventos. Al obtener los intervalos de confianza del
99%, un investigador realiz las siguientes dos afirmaciones:
28. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 12 se obtiene un conteo de 5 eventos. Al obtener los intervalos de confianza del 90%,
un investigador realiz las siguientes dos afirmaciones:
29. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 1200 se obtiene un conteo de 750 eventos. Al obtener los intervalos de confianza del
95%, un investigador realiz las siguientes dos afirmaciones:
30. Se desea estimar el peso promedio de las galletas que se elaboran en una fbrica. En una
muestra de tamao 1100 paquetes de galletas se obtiene una media de 195 gramos con una
desviacin estndar de 45 gramos. La empresa ha especificado que el peso de cada paquete de
galletas debe ser 200 gramos. Al obtener los intervalos de confianza del 95%, el encargado
del control del proceso realiz las siguientes dos afirmaciones:
A. No hay problema con el peso de las galletas, el 95% de las galletas tiene un peso de 195
grs.
B. El peso especificado de 200 gramos est fuera del intervalo de confianza del 95%.
31. Se desea estimar el peso promedio de las galletas que se elaboran en una fbrica. En una
muestra de tamao 10 paquetes de galletas se obtienen los siguientes pesos (en gramos):
190 210 201 196 197 185 176 208 200 191
La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realiz las
siguientes dos afirmaciones:
32. Se desea estimar el peso promedio de las galletas que se elaboran en una fbrica. Se sabe
que el peso medio de los paquetes de galletas se distribuye normalmente y que tiene una
desviacin estndar de 15 gramos. En una muestra de tamao 10 paquetes de galletas se
obtienen los siguientes pesos (en gramos):
190 210 201 196 197 185 176 208 200 191
La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realiz las
siguientes dos afirmaciones:
33. Se desea estimar proporcin de las galletas que se elaboran en una fbrica cuyo peso est
por debajo de la especificacin. En una muestra de tamao 10 paquetes de galletas se obtienen
los siguientes pesos (en gramos):
190 210 201 196 197 185 176 208 200 191
La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realiz las
siguientes dos afirmaciones:
34. En un peridico se presentan los resultados de una encuesta aplicada a una muestra
aleatoria de 1200 adultos, de los cuales 610 indicaron que la labor del gobierno es buena o
muy buena. El estudio se hizo con una confianza del 95%. Segn el autor del artculo la
mayora de los ciudadanos consideran que la labor del gobierno es buena o muy buena. Con
respecto a esa afirmacin del autor del artculo un crtico realiz la siguiente aseveracin: "El
autor se ha equivocado, ya que, 1. Con una confianza del 95% la proporcin de ciudadanos de
ciudadanos que aprueban la gestin del gobierno podra estar entre 48% y 53,6%, con lo cual
es muy probable que el porcentaje de ciudadanos que estn de acuerdo con la gestin del
gobierno sea inferior al 50%". Con respecto a esta situacin es correcto que:
(a) El autor est en lo correcto y el crtico est equivocado
(b) El autor est equivocado y el crtico tambin
(c) El autor est equivocado y el crtico est en lo correcto
(d) Falta informacin para indicar quin est equivocado y quin no
1. c 2. a 3. c 4. c 5. a
6. d 7. c 8. b 9. b 10. d
11. a 12. b 13. b 14. d 15. c
16. b 17. d 18. c 19. b 20. a
21. d 22. b 23. d 24. d 25. b
26. b 27. a 28. d 29. b 30. c
31. a 32. b 33. d 34. c
9 .
Muestreo
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Explicar la importancia y necesidad de trabajar con muestras para conocer informacin
sobre la poblacin
2. Describir algunas aplicaciones empresariales del muestreo
3. Calcular el tamao de muestra necesario para estimar la media poblacional y proporcin
poblacional
4. Describir las principales tcnicas de muestreo probabilstico
Introduccin:
En los primeros captulos de este texto se han presentado distintas tcnicas que se emplean en
estadstica para describir un conjunto de datos, tales como las distribuciones de frecuencias y
el clculo de diferentes medidas numricas, como la media, la mediana, la moda, la varianza,
la desviacin estndar, entre otras medidas. Sin embargo, en la prctica rara vez se cuenta con
los datos ya recolectados y, por tanto, es necesario efectuar un proceso de recoleccin de la
informacin, en el cual, con gran frecuencia se debe tomar la decisin de trabajar con la
poblacin o con una muestra.
As, por ejemplo, cuando una compaa est estudiando la proporcin de sus clientes que
estn satisfechos con sus servicios podra aplicar un cuestionario a todos sus clientes, o bien,
emplear una muestra. Aplicar el cuestionario a todos y cada uno de los clientes, o sea, a la
poblacin, puede requerir mucho tiempo y recursos, ya que, la cantidad de clientes podra ser
de muchos miles, lo que podra no ser viable para la organizacin. Ahora bien, empleando una
muestra la compaa podra conseguir resultados muy confiables, que le ayuden a alcanzar su
propsito de medir la satisfaccin de los clientes, pero a un costo mucho ms bajo.
La decisin de trabajar o no con una muestra es apenas una primera decisin. Si se decide
trabajar con una muestra, debe determinar el tamao de dicha muestra. Cabe resaltar que esa
muestra que se va a emplear puede ser de apenas unos cientos de clientes, aun cuando la
compaa tenga miles de clientes. Adems, se debe emplear una tcnica que permita
seleccionar cules clientes van a ser incluidos en la muestra y cules no. Tanto un tamao
adecuado de muestra como la aplicacin de la tcnica adecuada de muestreo son importantes
para obtener datos confiables, y por tanto, tiles para la toma de decisiones.
En este captulo se expondr la importancia y necesidad de trabajar con muestras, a la vez que
se describirn algunas aplicaciones frecuentes del muestreo en el entorno empresarial. Luego
se presentarn los distintos factores que determinan el tamao de la muestra cuando se desea
estimar la media de la poblacin o la proporcin poblacional, como en el ejemplo anterior,
que se podra desear conocer la proporcin de clientes satisfechos. Finalmente, se presentarn
distintas tcnicas de muestreo, que son las que permiten establecer cules elementos de la
poblacin se van a incluir en la muestra.
En toda investigacin estadstica hay un objeto de estudio, que es la unidad de inters y sobre
la cual recae la observacin. Por ejemplo, en el control de la calidad de una fbrica de llantas,
se podran emplear pruebas de rendimiento en laboratorio bajo determinadas condiciones y
tambin pruebas en carreteras, para medir el desgaste en diferentes rutas, entre otras variables
de inters. A esta unidad de estudio tambin s ele puede llamar unidad elemental o unidad
estadstica.
As, la poblacin est constituida por el conjunto total de los elementos de inters. A este
conjunto de elementos que son objeto de estudio le llamamos poblacin o universo.
As, podramos tener que la poblacin est constituida por los clientes de una empresa, por
productos de una empresa, como las llantas producidas en un determinado periodo; por
documentos, tales como los cheques emitidos por un el departamento financiero de una
compaa; los estudiantes de la carrera de administracin de negocios de una universidad; los
empleados de una organizacin; familias bajo condiciones de pobreza; entre muchos otros.
Tal como se seal anteriormente, existen diversas razones por las que sera imposible
trabajar con toda la poblacin, o bien, demasiado costoso, y por tanto es necesario emplear
una muestra. Una muestra es una parte de la poblacin de inters, y si es bien selecciona es
representativa de esa poblacin, y las conclusiones que en ella se obtengan luego podrn ser
generalizadas al resto de la poblacin.
En los ejemplos anteriores mencionamos que se poda obtener una muestra de clientes para
determinar la proporcin de clientes satisfechos con los servicios de la empresa, o bien,
emplear una muestra para determinar el desgaste promedio de determinado tipo de llantas
bajo ciertas condiciones. Cuando se desea lanzar al mercado un nuevo producto, como parte
del estudio de mercado, generalmente, se emplea una muestra de los potenciales
consumidores para estimar la demanda del producto. Tambin un auditor puede tomar una
muestra de las cuentas por cobrar de una compaa, para verificar el cumplimiento de ciertos
requisitos.
Ahora bien, cuando se habla de muestreo se hace referencia a todo un proceso mediante el
cual se va a establecer un tamao de muestra, es decir, la cantidad de elementos que se van a
tomar en la muestra; se va a seleccionar una tcnica de muestreo, o sea, una tcnica que
permita establecer cules elementos de la poblacin se van a incluir en la muestra; y se va a
medir la confianza que tienen las estimaciones realizadas con base en esa muestra.
Tal como se ver ms adelante, existen diferentes tcnicas de muestreo, y segn la tcnica
seleccionada, adems de las caractersticas del estudio, y de los recursos e informacin
disponible se define la unidad de muestreo. Por ejemplo, si se va a efectuar un estudio sobre la
satisfaccin de los empleados de una empresa, entonces la unidad de muestreo y la unidad de
estudio coinciden, y seran un empleado de la compaa, en este caso.
Ahora bien, cuando se efecta el estudio, muchas veces la persona que proporciona la
informacin no es la misma unidad de muestreo. Por ejemplo, en una encuesta de hogares,
donde la unidad de muestreo puede ser el hogar, la unidad de informacin podra ser el jefe
del hogar. O bien, en un estudio sobre empresas, la unidad de informacin o informante puede
ser un gerente de cada una de las empresas seleccionadas en la muestra.
Estudiar la poblacin sera muy costoso. Esta es una de las principales razones para
emplear muestras. Suponga que un candidato presidencial desea conocer la proporcin de
votantes que votaran por l. Para dar un ejemplo, en Costa Rica el padrn electoral super
los 2.800.000 electores para las elecciones presidenciales del 2010. Imagine el costo de
entrevistar a tal cantidad de personas distribuidas a lo largo y ancho de todo el pas.
Estudiar la poblacin requerira demasiado tiempo. Si una empresa desea lanzar un
nuevo producto al mercado, y cuenta con un equipo de 5 personas para efectuar el estudio
de mercado. Si hubiera un milln de potenciales clientes, cunto tiempo duraran las 5
personas en encuestar a ese milln de personas? El estudio durara aos, de modo que
cuando obtengan los resultados, la informacin ya no sera til.
La poblacin se destruye al ser observada. Por ejemplo, si una fbrica de bombillos
desea estimar la vida til de su producto, si decidiera emplear la poblacin para hacer esta
estimacin, tendra que probar todos los bombillos que produce, lo cual significara
destruir toda su produccin, y por tanto, sera imposible estudiar la poblacin.
Muestras e inferencia
La finalidad de hacer un estudio estadstico es conocer informacin sobre la poblacin. Tal
como se ha sealado, se emplea la muestra para efectuar la estimacin de los parmetros
poblacionales. Entonces, si en un estudio se desea conocer el desgaste promedio de cierto tipo
de neumticos bajo determinadas condiciones, entonces el valor de ese promedio para la
poblacin es un parmetro poblacional.
Dado que normalmente no se conocen los parmetros, entonces se emplea la muestra para
estimarlos. Por ejemplo, se toma una muestra de neumticos y se determina el desgaste
promedio. Ese valor muestral es un estimador que se emplea para estimar el promedio
poblacional.
ESTIMADOR Medida descriptiva de la muestra y que sirve como una estimacin del
parmetro poblacional correspondiente.
Cuando se han determinado los estimadores, entonces lo que se debe hacer es un proceso
mediante el cual se generalizan los resultados de la muestra a la poblacin. Esto es lo que se
conoce como la inferencia estadstica.
estimacin. Para poder realizar la inferencia es fundamental que la muestra sea tomada
aleatoriamente.
Dentro del muestreo aleatorio hay distintas tcnicas de muestreo, las cuales se diferencian por
sus distintos procedimientos aleatorios, o sea, que asignan diferentes probabilidades a las
unidades bajo estudio de ser seleccionadas en la muestra. As, se tiene el muestreo simple al
azar, el muestreo estratificado, el muestreo en etapas, el muestreo sistemtico y el muestreo
por conglomerados.
La principal ventaja del muestreo aleatorio es que limita el sesgo de seleccin y permite la
cuantificacin y control del error de muestreo. Las muestras no aleatorias no permiten medir
ni controlar el error de muestreo. Es por eso que en trminos generales se va a preferir el
muestreo aleatorio sobre los muestreos no aleatorios. Solo en ciertos casos especiales, se
considera que el muestreo de juicio puede lograr muestras ms representativas. Esto cuando
se toma una muestra pequea seleccionada de una poblaciones muy heterognea, pues el
juicio del experto podra ayudar a obtener una muestra representativa.
El error de muestreo tiene la gran ventaja de que puede ser medido y controlado. Por ejemplo,
si se desea reducir la magnitud del error de muestreo, se puede incrementar el tamao de la
muestra.
Por otro lado, cualquier error que no se deba al azar tambin ocasiona que el valor estimado
no sea igual al valor verdadero, pero no es un error de muestreo, sino un sesgo.
SESGO Error sistemtico, no debido al azar, y que ocasiona diferencias entre el valor
estimado a travs de la muestra y el valor verdadero.
Los sesgos son de naturaleza sistemtica y no pueden ser medidos. Los sesgos deben ser
prevenidos a travs de distintas medidas administrativas. Algunas de las principales fuentes de
sesgos son las siguientes:
promedio en que los operarios de una fbrica realizan una actividad, el peso promedio de las
latas de leche condensada envasadas en una empresa, entre muchos otros posibles casos.
Es por eso que expondremos los determinantes del tamao de muestra cuando se desea
estimar la media poblacional y la forma en que se calcula el tamao de muestra, tanto cuando
la poblacin es infinita como cuando es finita.
En la prctica existe un factor que es muy importante, y aunque las frmulas no lo toman en
cuenta debe ser valorado por cualquier investigador, el cual es el costo. Efectuar un estudio en
una muestra grande puede ser muy caro y es posible no contar con los recursos suficientes.
Por supuesto que si por cuestiones de costo se reduce el tamao de la muestra, se podra estar
sacrificando la confianza y la precisin de las estimaciones realizadas posteriormente. Esta es
una decisin que debe ser tomada con mucho cuidado.
Del mismo modo, es importante tener en cuenta el nmero esperado de no respuestas que se
puedan obtener. Por ejemplo, si por experiencia previa se pudiera estimar que el 25% de los
encuestados no contesta el cuestionario, entonces sera necesario tomar una muestra un 25%
ms grande con el objetivo de poder entrevistar al nmero adecuado de personas.
z
2
Ejemplo Suponga que se desea estimar el gasto promedio diario que realizan los
turistas estadounidenses cuando visitan el pas. Por un estudio anterior se
sabe que esta variable tiene una desviacin estndar de $46,6. Adems, se
desea que la estimacin tenga un error mximo de $10 y con una confianza
del 95%. Qu tamao de muestra se necesita?
Solucin Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. As que se plantea:
z 46,6 1,96
2 2
n 83,42 84
E 10
Ejercicio Se desea estimar el salario promedio de los operarios industriales del pas.
Se conoce que la desviacin estndar de estos salarios es de $236. Se
de requiere una estimacin con un error mximo de $50 y una confianza del
revisin 99%. De qu tamao debe ser la muestra?
n0
FACTOR DE CORRECCIN n
PARA POBLACIONES FINITAS n
1 0
N
z
2
Ejemplo Una empresa posee un total de 800 camiones que se emplean para repartir
sus productos a nivel nacional. Se desea estimar mediante una muestra
aleatoria de los camiones para determinar la cantidad de kilmetros
recorridos mensualmente. Por otro estudio realizado hace un tiempo, se
conoce que esta variable tiene una desviacin estndar de 380 kilmetros.
La estimacin debe tener un error mximo de 30 kilmetros y una
confianza del 95%. Qu tamao de muestra se necesita?
Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. As que se plantea:
z 380 1,96
2 2
n 616,36 617
E 30
n0 617
n 348,34 349
n0 617
1 1
N 800
1. Asegurar que cuando se enva un lote, este satisfaga los requisitos del
cliente.
2. Asegurar que cuando se recibe un lote, se acepte solo si cumple los
requerimientos.
Si, por ejemplo, de una muestra de 50 clientes, 30 afirman estar dispuestos a adquirir el nuevo
producto, entonces la proporcin se obtendr como el nmero de xitos entre el nmero de
elementos en la muestra. En esta situacin esta proporcin ser 30/50, que equivale a 0,60 o
60%. Si se denota por p la proporcin de la muestra, X es el nmero de xitos y n es el tamao
de la muestra, entonces la proporcin muestral se calcula como:
X
PROPORCIN MUESTRAL p
n
X
PROPORCIN POBLACIONAL
N
Precisin deseada o nivel mximo de error permitido: Del mismo modo que en la
determinacin del tamao, el investigador debe establecer un nivel de error mximo
permitido. En este caso sera expresado como un porcentaje de divergencia entre el
verdadero valor de la proporcin y el valor estimado p. A este nivel de error se le
denotar por E.
Nivel de confianza que se desea tener: Del mismo modo que cuando se determina el
tamao de muestra para estimar la media, el investigador debe indicar el nivel de
confianza deseado para la estimacin. Los niveles de confianza ms usuales son del 95% y
del 99%, cuyos valores de z son 1,96 y 2,58, respectivamente.
Aproximacin de la proporcin poblacional: Se requiere conocer un valor aproximado
de la proporcin poblacional. Cuando no se conozca dicho valor, puede emplearse el valor
de 0,5, pues es el valor que maximiza el tamao de la muestra, dado un nivel de precisin
y de confianza, y es mejor emplear una muestra ms grande que una pequea.
2
FRMULA DEL TAMAO DE MUESTRA z
PARA LA PROPORCIN POBLACIONAL
n p(1 p)
E
Solucin Con base en los datos anteriores, se tiene que para el nivel de confianza del
99% corresponde un valor de z de 2,58. Adems, como no se tiene una
estimacin de p, se emplear el valor de 0,5. Entonces se plantea:
2 2
z 2,58
n p(1 p) 0,5(1 0,5) 1.849
E 0,03
Caso de poblaciones finitas Del mismo modo que en la determinacin del tamao de
muestra para estimar la media, la frmula dada anteriormente se aplica a poblaciones infinitas,
pero en poblaciones finitas cuando se trabaja con reemplazo o en poblaciones finitas cuando
el tamao de la muestra n es muy pequeo con respecto al tamao de la poblacin N puede
realizarse un ajuste empleando el mismo factor de correccin:
n0
FACTOR DE CORRECCIN n
PARA POBLACIONES FINITAS n
1 0
N
2
z
donde n0 es el resultado dado por la frmula n p(1 p) y N es el tamao de la
E
poblacin.
Ejemplo Una empresa desea conocer la proporcin de sus empleados que estaran
de acuerdo en un nuevo programa de beneficios. La compaa tiene un
total de 350 colaboradores y quiere hacer la estimacin con un error
mximo de 5% y una confianza del 95%. Se estima, por un estudio piloto,
que esta proporcin podra ser del 40%. Qu tamao de muestra se
necesita?
Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. Los datos del problema son:
2 2
z 1,96
n p(1 p) 0,4(1 0,4) 368,79 369
E 0,05
n0 369
n 179,58 180
n0 369
1 1
N 350
Tcnicas de muestreo
Tal como se ha expuesto a lo largo de este captulo, cuando se toma una muestra es necesario
tomar ciertas decisiones. Una de ellas es el tamao de la muestra, pero otra muy importante es
establecer el modo para escoger cules elementos se van a incluir en la muestra. Es por eso
que se habla de diferentes tcnicas de muestreo.
La decisin sobre la tcnica de muestreo a emplear depende de varios factores, entre los que
estn la existencia de un marco muestral bien definido, la conveniencia, el costo, la ubicacin
geogrfica de las unidades de estudio, entre otros.
En otros casos el marco muestral puede ser un mapa de una determinada zona geogrfica, el
cual se emplea para identificar y seleccionar viviendas, esto en un estudio sobre viviendas, o
en un estudio donde la unidad estadstica sea la familia, asumiendo que en cada vivienda va a
habitar una familia.
En otras situaciones el marco muestral puede ser una gua telefnica, listados de distintos
tipos, archivos, registros, entre otros.
Suponga que una compaa desea conocer cul es la opinin de sus empleados acerca de la
posibilidad de impartir cursos de capacitacin a travs de internet. Para esto desea aplicar una
encuesta a una muestra de 60 empleados. El departamento de recursos humanos ha elaborado
una lista de los 670 empleados que laboran en la empresa a la fecha, la cual servir de marco
muestral. En la lista a cada empleado se le ha otorgado un nmero, iniciando en 1 y
terminando en 670. Para elegir a las 60 personas de la muestra, empleando un muestreo
simple al azar, se requiere un mecanismo que le d a cada uno de los 670 empleados la misma
probabilidad de ser incluido en la muestra.
Una alternativa echar en una caja 670 papelitos, cada uno con un nmero distinto entre 1 y
670, los cuales se mezclan bien, y sin mirar el nmero, se seleccionan 60 papelitos. Despus
se toma el nmero indicado en cada papelito y de ese modo se selecciona la persona
correspondiente en la lista elaborada por recursos humanos.
Una alternativa ms conveniente es emplear una tabla de nmeros aleatorios. Las tablas de
nmeros aleatorios, como la del apndice 10 de este libro, es un cuadro con nmeros que han
sido generados mediante un proceso aleatorio. El cuadro siguiente muestra un ejemplo.
Para emplear la tabla de nmeros aleatorios se requiere un punto de inicio aleatorio. Para
obtenerlo usted puede simplemente cerrar los ojos y dejar caer el lpiz sobre la tabla y tomar
como punto inicial el que marque la punta del lpiz.
Suponga en la tabla siguiente que el lpiz cay en la segunda columna y la quinta fila, donde
se encuentra el nmero 61722. Como usted necesita nmeros entre 1 y 670, entonces puede
tomar los primeros 3 dgitos de ese nmero, o sea, 617. Por tanto, selecciona al empleado
#617 en la lista. A partir de ah puede avanzar en la tabla hacia la derecha o hacia abajo, pero
siempre de la misma manera. Entonces, si se avanza hacia la derecha, el segundo nmero
seleccionado es el 291, el tercero es el 013, es decir, 13, el cuarto es el 130 (ntese que el
elemento 891 est fuera del rango buscado, pues la empresa solo posee 670 empleados), y el
quinto es el 357. Del mismo modo se contina en la siguiente lnea hasta completar los 60
miembros de la muestra.
Los nmeros aleatorios tambin pueden generarse en Excel, Minitab u otros paquetes de
software, e incluso calculadoras cientficas.
Ejemplo Un auditor desea verificar si todos los cheques emitidos en una compaa
satisfacan los requerimientos de control establecidos por la gerencia.
Durante el mes pasado se emitieron 81 cheques y la muestra debe contener
10 cheques. Cules cheques se seleccionaran si se aplica un muestreo
simple al azar y usando la tabla de nmeros aleatorios anterior (tome como
punto inicial la primera columna y segundo rengln de la tabla)?
Ejemplo Utilice Excel para generar una muestra simple al azar de 5 unidades de una
poblacin total de 20 unidades.
= ALEATORIO.ENTRE(1;20)
Para emplear este tipo de muestreo es necesario determinar una constante de espaciamiento k:
N
CONSTANTE DE ESPACIAMIENTO k
n
Ejemplo Una empresa tiene 700 empleados y se desea tomar una muestra de 20 de
ellos para aplicar un cuestionario sobre la opinin de los colaboradores
sobre los resultados obtenidos luego de la implementacin de un nuevo
sistema informtico. Cmo se seleccionaran los miembros de la muestra
si se emplea el muestreo aleatorio sistemtico?
preparado una lista con los nombres de los 700 empleados, la cual servir
de marco muestral.
N 700
k 35
n 20
se elige un nmero aleatorio entre 1 y 175. Suponga que en la tabla de nmeros aleatorios se
obtiene el 83. Ahora se repiten los mismos pasos que se efectuaron cuando k es entero; es
decir, se va sumando la constante de espaciamiento k para ir obteniendo cada nuevo elemento
de la muestra:
83
83 + 175 = 258
258 + 175 = 433
433 + 175 = 608
6650 + 175 = 6825
Posteriormente se divide cada uno de estos nmeros entre 10 (ya que se haba multiplicado
por 10) y se redondea cada resultado:
Entonces, se selecciona a los elementos nmero 8, 26, 43, 61, , 683 de la poblacin para ser
incluidos en la muestra.
Ahora bien, hay que tener tambin algunas precauciones. Si la lista que sirve de marco
muestral sigue algn patrn o ciclo particular, entonces la muestra obtenida podra no ser
representativa. Si, por ejemplo, la lista de los 700 empleados ha sido ordenada siguiendo el
orden hombre mujer, entonces podra obtenerse una muestra de solo mujeres, lo cual hara
que la muestra no fuera representativa, pues la poblacin tambin contiene hombres.
Este tipo de muestreo es muy til en poblaciones muy heterogneas, las cuales pueden
dividirse en estratos ms homogneos gracias al conocimiento previo que el investigador tiene
acerca de la poblacin.
Tal como se mencion, los estratos pueden ser de muchos tipos. Por ejemplo, en un estudio
realizado en una universidad, cada uno de los estratos podra corresponder a los estudiantes de
cada una de las carreras que se imparten, y adems, otro estrato podra estar compuesto por el
personal docente y otro por el personal administrativo. Este tipo de muestreo asegurara que
en la muestra va a haber representacin para cada uno de los estratos, lo cual no
necesariamente ocurre con el muestreo simple al azar.
Luego de que se han definido los estratos, entonces es necesario efectuar la afijacin. La
afijacin es la distribucin del total de la muestra entre cada uno de los estratos establecidos.
Cabe aclarar que esta imagen solo ilustra la conformacin de la muestra a partir de los estratos
ya establecidos. No ilustra el modo en que deben ser establecidos los estratos en la poblacin.
Solucin Para establecer cuntos empleados deben seleccionarse de cada uno de los
estratos establecidos, si se emplea la afijacin proporcional, primero se
debe determinar la frecuencia relativa de cada uno de los estratos en la
poblacin:
Estrato 1: 0,20 x 50 = 10
Estrato 2: 0,50 x 50 = 25
Estrato 3: 0,30 x 50 = 15
La suma de los tamaos de muestra por estrato debe ser igual al tamao de
la muestra total, que en este caso es 50.
muestreo simple al azar. Adems, los clculos son ms sencillos al no requerirse factores de
ponderacin.
Observe que en este tipo de muestreo inicialmente no se seleccionan las unidades de estudio,
sino que se seleccionan unidades primarias, es decir, se seleccionan primero regiones, o
barrios, o colegios, entre otros posibles conglomerados. Cabe sealar que no todos los
conglomerados son muestreados en esta tcnica.
En ciertos casos no se posee un marco muestral que indique todas las unidades de estudio,
pero s se puede contar con una lista de los conglomerados. Por ejemplo, tal vez no se
tenga una lista de todos los empleados de las micro y pequeas empresas del pas, pero s
podra tenerse una lista de dichas empresas. As podra seleccionarse al azar una muestra
de las empresas, y en cada empresa obtener una muestra al azar de algunos de sus
empleados.
Este tipo de muestreo permite disminuir los costos, especialmente en cuanto al recurso
humano. El hecho de que las unidades estn agrupadas dentro de los conglomerados es lo
que facilita la reduccin de los costos.
Las unidades individuales dentro de cada "conglomerado", por lo general, tienden
usualmente a ser similares. Por ejemplo, las familias de altos ingresos viven en el mismo
barrio, mientras que las familias de clase media viviran en otra zona.
Muestreo no aleatorio
Existen otras tcnicas de muestreo aleatorio como el muestreo por etapas (multietpico),
muestreo proporcional al tamao, entre otros. De igual manera existen diversos tipos de
muestreo no aleatorio, tales como:
Muestreo de juicio: En este tipo de muestreo las unidades son seleccionadas mediante el
juicio personal del investigador. Esta persona usualmente es un experto en la materia
relacionada con la investigacin. Este tipo de muestra no es una muestra probabilstica,
pues este mtodo est basado en el punto de vista subjetivo de una persona, lo cual
ocasiona que la teora de la probabilidad no pueda ser aplicada para medir el error de
muestreo.
Muestreo por conveniencia: En este caso el investigador selecciona para conformar la
muestra aquellas unidades que sean ms fciles de acceder. En otras palabras, la muestra
se elige de acuerdo con la comodidad del investigador. En este tipo de muestreo la
representatividad la determinara el investigador de modo subjetivo, por lo que tampoco se
puede emplear la teora de la probabilidad para determinar el nivel de error.
Otros tipos de muestreo no aleatorio. En ocasiones se habla del muestreo por cuotas, de
las muestras autogeneradas, entre otras formas de obtener una muestra no probabilstica.
Todos estos mtodos tienen la desventaja de que no es posible establecer la
representatividad de la muestra de forma objetivo, es decir, no se puede determinar un
nivel de confianza y medir el margen de error de la estimacin.
Aplicacin Auditora
Aunque existen muchos tipos de auditora, en este captulo se har nfasis
en la auditora financiera. La informacin financiera es fundamental para
la toma de decisiones tanto para usuarios internos de la empresa, la
gerencia, por ejemplo, como para usuarios externos, como los acreedores,
el fisco e inversionistas, entre otros. Es por eso que es fundamental que los
estados financieros de la empresa sean fiel reflejo de la realidad econmica
y financiera de una empresa.
organizacin, sea esta una empresa privada, una entidad sin fines de lucro
o una institucin pblica, entre otras. Entonces, dentro del trabajo del
auditor est el obtener las evidencias suficientes para poder ofrecer una
opinin objetiva sobre la veracidad y confiabilidad de la informacin
financiera presentada.
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios siguientes (las respuestas a los ejercicios se encuentran en la pgina de
internet del texto: www.auladeeconomia.com/raeep.html).
1. Un investigador est interesado en conocer ciertos datos relacionados con la calidad de vida
de un pueblo en una zona rural del pas. Entre las variables que desea estimar est el nivel de
caloras que en promedio consumen los nios de 7 a 12 aos de esa poblacin por da.
Conoce, por un estudio anterior, que la desviacin estndar de la citada variable es 185
caloras. Adems sabe que habitan en ese poblado 745 nios. Segn datos del gobierno local
el consumo medio de caloras de los nios de esa edad es de 1170 caloras por da, pero el
investigador duda de la veracidad de dicha informacin. El desea que sus estimaciones tengan
altos niveles de confiabilidad (por lo menos el 99%), entonces decide realizar un estudio
estadstico. Toma una muestra de 27 nios y evala su situacin nutricional.
2. Una asociacin de profesionales desea fomentar el uso de las tecnologas entre sus
afiliados. Para lograr dicho objetivo, se quiere establecer un convenio con alguna empresa
vendedora de equipo de cmputo, para posteriormente poder un sistema de financiamiento
para los miembros de la asociacin. A fin de poder realizar la negociacin, primero se quiere
estimar la proporcin de profesionales afiliados que estaran interesados en adquirir una
computadora, tanto para el trabajo como para el hogar. Por esta razn, solicita un estudio por
muestreo.
3. En los siguientes casos, cul puede ser la razn principal por la cual se va a emplear una
muestra?
a) Una fbrica de refrescos desea conocer si el nivel de azcar en los refrescos que se
producen est dentro de los niveles aceptables.
b) Un banco desea evaluar la satisfaccin de sus clientes.
c) Una tienda en lnea desea saber la proporcin de usuarios del internet que creen que es
seguro efectuar pagos en lnea.
d) Un gestor ambiental desea conocer el nivel de determinados contaminantes que se
encuentran en las aguas de un ro.
4. En los siguientes casos, cul puede ser la razn principal por la cual se va a emplear una
muestra?
5. Se desea realizar un estudio para determinar los gastos familiares mensuales promedio en
educacin que efectan los empleados de una compaa. El gerente desea tener un 95% de
confianza de que los gastos no difieran en ms de $40 con respecto al valor verdadero.
6. Una asociacin de profesionales desea fomentar el uso de las tecnologas entre sus
afiliados. Para lograr dicho objetivo, se quiere establecer un convenio con alguna empresa
vendedora de equipo de cmputo, para posteriormente poder un sistema de financiamiento
para los miembros de la asociacin. A fin de poder realizar la negociacin, primero se quiere
estimar la proporcin de profesionales afiliados que estaran interesados en adquirir una
computadora, tanto para el trabajo como para el hogar. Por esta razn, solicita un estudio por
muestreo. Cul debera ser el tamao de muestra, si el margen de error mximo permitido es
3,5%, la asociacin posee 5.000 afiliados actualmente y se quiere un nivel de confianza del
95%?
8. El encargado de capacitacin de una institucin con 3.200 empleados desea hacer una
encuesta que le sirva para detectar diversas necesidades de capacitacin en el rea de idiomas.
b) Si considerara el tamao de muestra anterior muy grande con relacin a los recursos que
dispone, en qu direccin (aumentar o disminuir) tiene que cambiar el nivel de confianza
o el error muestral para disminuir el tamao de la muestra?
9. Se realiza un estudio para estimar la proporcin de residentes de una zona rural del pas que
estn a favor de la construccin de una mina. De qu tamao debe ser la muestra, si se
requiere una confianza de al menos de 95%, de que la estimacin estar dentro del 0.04 de la
proporcin real de residentes de esta zona que estn a favor de la construccin de la mina?
10. Un agente de seguros est realizando una encuesta entre gerentes de empresas pblicas y
privadas para determinar la proporcin de ellos que estaran dispuestos a comprar seguros de
gastos mdicos y cunto es el nivel de gastos mensuales promedio en salud que realizan. En
una encuesta realizada hace un ao se determin que un 15% estaran anuentes a comprar
seguros de gastos mdicos y que la desviacin estndar de los gastos mensuales en salud era
de $145. Si se desea una confianza del 95% en las estimaciones:
a) Calcule el tamao de muestra para estimar la media de los gastos mensuales en salud con
un margen de error mximo de $100.
b) Calcule el tamao de muestra para estimar la proporcin de gerentes que compraran un
seguro de gastos mdicos con un margen de error mximo de 3 puntos porcentuales.
11. Se desea realizar una encuesta a entre los 10.500 profesionales en mercadeo que hay en el
pas para preguntarles si desean asistir a un congreso sobre marketing relacional. Si en la
encuesta se desea un margen de error mximo del 4% y si no se conoce algn estudio previo,
determine el tamao de muestra necesario para hacer la encuesta.
12. El comedor de un albergue infantil quiere estimar el peso promedio de los nios. Un
estudio anterior de diez nios mostr que la desviacin estndar de sus pesos es de 6,05
kilogramos. Qu tan grande debe ser una muestra para que el administrador tenga un 95% de
confianza de que el error de estimacin es a lo ms de 2 kilogramos?
13. El gerente de una empresa desea estimar las horas mensuales que trabajan los empleados
de la empresa bajo presin, ya que la entrega del entregable de los proyectos que se realizan
tiene que estar listo al final del da. Un estudio piloto revel que la desviacin estndar es de
24 horas.
a) De qu tamao se necesita una muestra si se desea tener 96% de confianza que la media
real est dentro de un margen de error de 10 horas de la media real?
b) De qu tamao debera ser la muestra si en lugar de tener un error de estimacin de 10
horas slo se requiere un error de 5 horas?
c) Suponga que se tiene una poblacin de 300 empleados, de qu tamao debe de ser la
muestra, si se desea una confianza de 96% y un error mximo de 5 horas?
14. El gerente de recursos humanos de una organizacin est analizando una serie de nuevas
polticas con el fin de mejorar el desempeo e incrementar la productividad. Por tal razn
desea conocer el rendimiento de los 230 operarios de la empresa segn la ms reciente
evaluacin del desempeo. Para ello debe seleccionar una muestra y hacer una estimacin del
desempeo medio de los empleados. De qu tamao debe ser la muestra si se quiere tener
una confianza de 90% de que el error no ser mayor de 4 puntos, conociendo que la
desviacin estndar es de 22 puntos?
15. Una organizacin desea conocer cuntos de sus 3000 empleados estn satisfechos en su
puesto de trabajo. Para ello debe seleccionar una muestra y hacer una estimacin de la
proporcin de empleados que si se sienten satisfechos. De qu tamao debe ser la muestra si
se quiere tener una confianza de 95% de que el error no ser mayor de 3 puntos?
16. En un estudio anterior entre 500 familias que tienen televisores en una ciudad, se encontr
que 340 estn suscritas a algn servicio de televisin por cable. Qu tan grande se requiere
que sea una muestra si se quiere tener 95% de confianza de que la estimacin de la proporcin
de familias que posee algn servicio de cable est dentro de 0,02?
17. La tabla siguiente contiene los nombres de 30 empleados del departamento de inversiones
de una aseguradora. Se va a tomar una muestra de 6 de empleados. Con base en la
informacin anterior, determine, si se emplea un muestreo simple al azar:
18. Tomando como base el ejercicio de 17, se extraer una muestra de tamao 6 empleando la
tcnica de muestreo aleatorio sistemtico:
19. Tomando como base el ejercicio de 17, se extraer una muestra de tamao 8 empleando la
tcnica de muestreo aleatorio sistemtico:
b. Ahora utilice la tabla de nmeros aleatorios del apndice 10 para generar su propia
muestra.
20. Una empresa tiene 2.000 empleados y desea tomar una muestra de 200 de colaboradores
para aplicar un cuestionario para conocer su disposicin a participar en comits de educacin
y gestin ambiental. Explique cmo se seleccionaran los miembros de la muestra si se
emplea el muestreo aleatorio sistemtico.
21. Un investigador desea conocer el nivel nutricional de los jvenes que ingresan a las
secundarias del pas. Se requiere una muestra total de 3.600 estudiantes de primer ao de
secundaria (no se posee una lista de todos los estudiantes de secundaria del pas). Explique
cmo podra obtenerse la muestra en este estudio.
25. Segn una revista sobre salud, en una encuesta a 20 familias, se encontr que las primas
anuales de seguros promediaron $10.979 con una desviacin estndar de $1.000. De qu
tamao debe ser la muestra debe ser la muestra para que la media poblacional se encuentre
dentro de un margen de $250 con 99% de confianza?
4. Un banco est estudiando el nivel de satisfaccin de los clientes con sus servicios y para tal
fin realizar un estudio por muestreo. Al respecto el investigador a cargo expres que:
5. Una trabajadora social desea investigar algunos aspectos relacionados con la calidad de
vida de los adultos mayores que residen en hogares de ancianos. Para tal fin selecciona una
muestra aleatoria y visita varios hogares de ancianos para valorar si dichas organizaciones
poseen planes e infraestructura adecuados. Al respecto la trabajadora social considera que:
6. Una nutricionista est investigando la calidad de la nutricin que reciben los nios de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los nios y
entrevista a sus padres. Con relacin a esta situacin la nutricionista considera que:
7. Una nutricionista est investigando la calidad de la nutricin que reciben los nios de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los nios y
entrevista a sus padres. Con relacin a esta situacin la nutricionista considera que:
8. Una nutricionista est investigando la calidad de la nutricin que reciben los nios de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los nios y
entrevista a sus padres. Con relacin a esta situacin la nutricionista considera que es
necesario emplear una muestra porque:
A. Visitar todos los hogares de todos los nios de la escuela requiere demasiado tiempo.
B. El estudio de la variable en cuestin implica la destruccin de la unidad de inters.
10. Una fbrica de fusibles prueba la calidad de su producto terminado. El ingeniero a cargo
afirma que es estrictamente necesario emplear un muestreo porque:
(a) Estudiar la poblacin requerira demasiado tiempo
11. Una ___________ es una coleccin de todos los elementos de un grupo. Una coleccin de
algunos de esos elementos es una ___________. Las opciones que mejor completan la frase
anterior son:
(a) muestra, poblacin
(b) poblacin, muestra por conveniencia
(c) poblacin, muestra aleatoria
(d) poblacin, muestra
13. Con respecto al tamao de muestra un investigador realiz las siguientes dos
afirmaciones:
14. Con respecto al uso de muestras un investigador realiz las siguientes dos afirmaciones:
15. Se desea estimar la media poblacional de una variable x. Se conoce que la desviacin
estndar es de 87 unidades. Se requiere una confianza en la estimacin del 90% y que el error
no sea mayor que 20 unidades. Entonces, el tamao de muestra requerido es:
(a) 520 (b) 73 (c) 52 (d) Ninguna de las anteriores
16. Se desea estimar la media poblacional de una variable x. Se conoce que la desviacin
estndar es de 87 unidades y que la poblacin est compuesta por 200 unidades. Se requiere
una confianza en la estimacin del 95% y que el error no sea mayor que 15 unidades.
Entonces, el tamao de muestra requerido es:
(a) 130 (b) 92 (c) 79 (d) Ninguna de las anteriores
17. Se desea estimar una proporcin poblacional para una cierta variable. Se cuenta con una
estimacin previa del 20%. Se requiere una confianza en la estimacin del 95% y que el error
no sea mayor que 5%. Entonces, el tamao de muestra requerido es:
(a) 174 (b) 246 (c) 385 (d) Ninguna de las anteriores
18. Se desea estimar una proporcin poblacional para una cierta variable. Se requiere una
confianza en la estimacin del 99% y que el error no sea mayor que 3,5%. Entonces, el
tamao de muestra requerido es:
(a) 1105 (b) 1355 (d) 867 (d) Ninguna de las anteriores
19. Se desea estimar una proporcin poblacional para una cierta variable. La poblacin tiene
un tamao de 220 individuos. Se requiere una confianza en la estimacin del 90% y que el
error no sea mayor que 3%. Entonces, el tamao de muestra requerido es:
(a) 171 (b) 752 (c) 457 (d) 149
20. En un estudio por muestreo se desea estimar la talla promedio de las 400 mujeres que
laboran en una empresa. Por un estudio previo se sabe que la desviacin estndar es de 22 cm
y se ha establecido una precisin de 5 cm con una confianza del 99%. Entonces, el tamao de
muestra requerido es, en nmero de mujeres:
(a) 98 (b) 129 (c) 105 (d) 84
21. En un estudio por muestreo se desea estimar la proporcin de las 400 mujeres que laboran
en una empresa que poseen hijos menores de 10 aos. Se ha establecido una precisin de 5%
con una confianza del 95%. Entonces, el tamao de muestra requerido es, en nmero de
mujeres:
(a) 385 (b) 271 (c) 162 (d) 197
22. Un noticiero en la televisin decide realizar una encuesta sobre la calidad de la educacin
en el pas. Los televidentes que desean participar llaman a un nmero telefnico y votan por la
opcin que consideran ms apropiada. Durante el noticiero votaron 5.500 personas, y el 75%
considera que la educacin del pas debe mejorarse. El tipo de muestreo empleado por este
noticiero es:
(a) Aleatorio
(b) Por conveniencia
(c) Voluntario
(d) De juicio
23. Un noticiero en la televisin decide realizar una encuesta sobre la calidad de la educacin
en el pas. Los televidentes que desean participar llaman a un nmero telefnico y votan por la
opcin que consideran ms apropiada. Durante el noticiero votaron 5.500 personas, y el 75%
considera que la educacin del pas debe mejorarse. Con respecto a este muestreo es falso
que:
(a) Es una muestra representativa por ser muy grande
(b) Se presenta un posible sesgo de seleccin
(c) Es un muestreo no aleatorio
(d) La muestra no es representativa a pesar de su tamao
25. La discrepancia, debida al azar, entre la estimacin de una caracterstica obtenida a travs
de una muestra y su verdadero valor en la poblacin corresponde al concepto de:
(a) Sesgo de seleccin
(b) Error de muestreo
(c) Sesgo de medicin
(d) Aleatoriedad
26. El error sistemtico, no debido al azar, y que ocasiona que diferencias entre el valor
estimado a travs de la muestra y el valor verdadero corresponde al concepto de:
(a) Sesgo
(b) Error de muestreo
(c) Variabilidad
(d) No aleatoriedad
27. Un gerente est haciendo un estudio de mercado. Ha seleccionado una muestra aleatoria
de 385 consumidores, pero hubo 50 de ellos que no contestaron el cuestionario. Esta
situacin:
(a) No es problema porque la mayora s lo contestaron
(b) Es un problema porque el tamao de la muestra efectivamente tomada es menor
(c) Es un problema, pero se resuelve sustituyendo los valores faltantes por sus valores
esperados
(d) No es un problema porque no fue causado intencionalmente por el investigador
28. Con respecto al muestreo un investigador realiz las siguientes dos afirmaciones:
32. Con respecto a una muestra sea representativa de una poblacin es correcto que:
(a) Basta con que sea del tamao apropiado
(b) Debe ser obtenida al azar sin importar su tamao
(c) Debe al menos el 20% de la poblacin
(d) Ninguna de las anteriores
1. b 2. d 3. c 4. a 5. c
6. c 7. b 8. d 9. d 10. c
11. d 12. c 13. a 14. d 15. c
16. c 17. b 18. b 19. a 20. a
21. d 22. c 23. a 24. b 25. b
26. a 27. b 28. d 29. b 30. a
31. c 32. d
10 .
Pruebas de hiptesis
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Plantear las hiptesis nula y alternativa en problemas de decisin con respecto a la media o
la proporcin poblacional
2. Identificar los posibles errores que se pueden cometer al tomar decisiones con base en
muestras
3. Describir los pasos del procedimiento de prueba de hiptesis
4. Calcular los estadsticos de prueba adecuados segn el tipo de problema
5. Tomar decisiones con base en el procedimiento de prueba de hiptesis
Digamos que en el ejemplo de la media del proceso, sta debe ser 250 gramos, por lo tanto
para tratar de confirmarlo el ingeniero toma la informacin de una muestra de 40 bolsas
salidas de esta mquina. Supngase que la media de la muestra es de 255 gramos por lo que se
decide que la mquina requiere ajustes. Dado que la decisin se basa en una muestra podr
ocurrir que, aunque la media muestral sea mayor, la media de la poblacin sea realmente de
250 gramos. Incluso podra ser que la media del proceso sea mayor de 255, por ejemplo de
260 gramos. Para evitar la toma de decisiones errneas, en vez de tomar la decisin basndose
en los resultados de una muestra se debe realizar un proceso formal mediante una prueba de
hiptesis. Aunque nunca se sabe con certeza absoluta la verdad o falsedad de una hiptesis, a
menos que se examine toda la poblacin, el proceso es mucho ms seguro que si la decisin
se basa en una muestra.
Algunas definiciones
Los siguientes son algunos de los trminos usados con ms frecuencia en el contexto de las
pruebas de hiptesis:
HIPTESIS NULA Es cualquier hiptesis que se desea probar. Se denota por H0.
Tomando el ejemplo anterior, el ingeniero cree que la mquina podra estar llenando las
bolsas con una cantidad superior a la especificada, as que esa es su hiptesis de investigacin,
y para decidir si debe realizar ajustes, entonces toma la muestra. El valor especificado
constituir su hiptesis nula. La hiptesis nula es aquello que se desea probar. En este caso el
ingeniero desea probar si el peso promedio de las bolsas es efectivamente igual a 250 gramos.
Esta hiptesis nula podra ser aceptada o rechazada. En caso de rechazarla, entonces tomar
aceptar la hiptesis alternativa. La evidencia que posee sugiere que las bolsas tienen un peso
superior a 250 gramos, por lo que su hiptesis alternativa sera que el peso de las bolsas es
mayor que 250 gramos.
Ejemplo Se sabe por estudios previos que los recin nacidos de cierta poblacin
tienen una talla promedio de 49,5 cm. Una enfermera estudi un grupo de
40 recin nacidos, y obtuvo una media de 53,4 cm.
Pero los datos recopilados sugieren que este promedio podra ser mayor
que 49,5 cm, por lo que, de descartar la hiptesis nula anterior, se aceptara
la hiptesis alternativa:
H1: La talla media de los recin nacidos es mayor que 49,5 cm.
H0: = 49,5
H1: > 49,5
Solucin 1. En esta situacin se indica que el peso promedio de las cajas en que
viene el material es 17 libras, por tanto se querr verificar que se satisface
esta especificacin, de manera que la hiptesis nula ser que el peso
promedio es 17 libras. Por otro lado, en la muestra de 86 cajas se obtuvo
un peso promedio inferior, lo cual tambin sugiere la pregunta, entonces la
hiptesis nula ser que la media es inferior a 17 libras. En resumen:
H0: = 17
H1: < 17
H0: = 4,2
H1: < 4,2
H0: = 75
H1: < 75
H0: = 15,6
H1: > 15,6
Las pruebas de hiptesis pueden hacer referencia a una media de una poblacin, como en el
ejemplo anterior, pero tambin podran referirse a una proporcin. Este sera el caso en el cual
lo que se desea probar es una afirmacin que se relaciona con el porcentaje de ciudadanos que
votaran por un determinado candidato, la tasa de prevalencia de una enfermedad, la
proporcin de artculos defectuosos en una produccin, la tasa de desempleo, entre otros casos
de distintas proporciones poblacionales.
Solucin El empresario desea probar que si es cierto que el 74% de los usuarios de
internet han realizado compras por internet en el ltimo trimestre, por
tanto, su hiptesis nula ser:
Pero los datos recopilados indican que ese porcentaje podra ser menor,
por lo que, de descartar la hiptesis nula anterior, se aceptara la hiptesis
alternativa:
H0: P = 0,74
H1: P < 0,74
Ahora bien, en las pruebas de hiptesis las decisiones se toman con base en datos muestrales.
Suponga que se toman varias muestras aleatorias de una misma poblacin y se calcula cada
una de las medias muestrales. La media en cada muestra va a ser distinta. Estas diferencias se
deben al azar. Entonces, simplemente por el azar, a veces el valor de muestra va a estar muy
cercano al verdadero valor poblacional, y otras veces, tambin por el azar, el valor muestral
estar alejado del valor verdadero. Esto significa que en las pruebas de hiptesis existe el
riesgo de tomar una decisin equivocada, cuando sea alguno de esos casos en los cuales la
media muestral queda muy alejada del valor verdadero. Es decir, podra cometerse un error en
la decisin a la cual conduce la prueba. El nico modo de eliminar dicha posibilidad sera
estudiar toda la poblacin, lo cual podra ser demasiado costo, e incluso, imposible.
Entonces, al realizar pruebas de hiptesis se pueden cometer dos tipos de errores, llamados
error tipo I y error tipo II.
ERROR TIPO I Es el error que se comete cuando se rechaza una hiptesis que es
correcta y la probabilidad de cometer este error se denota por .
ERROR TIPO II Es el error que se comete cuando se acepta una hiptesis que es
incorrecta y la probabilidad de cometer este error se denota .
Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra y
probar la hiptesis nula de que los bombillos tienen una vida media de
1000 horas, contra la hiptesis alterna de que la vida media de los
bombillos es menor que dicha especificacin. Cmo podran darse y qu
significan los errores tipo I y tipo II en esta situacin?
Solucin En esta situacin los errores tipo I y tipo II podran darse si la muestra no
representa bien a la poblacin. Esto puede darse de los modos siguientes:
Se explicar el procedimiento general para realizar una prueba de hiptesis realizando una
prueba para una media aritmtica mediante el siguiente ejemplo:
Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra de
50 bombillos y desea probar que los bombillos tienen una vida media de
1000 horas. La media obtenida a partir de la muestra es de 970 horas. Se
conoce que la desviacin estndar es 60 horas. Determine, a un nivel de
significacin del 5%, si la media poblacional de estos bombillos es
efectivamente de 1000 horas.
Solucin Paso 1. Plantear las hiptesis. Toda prueba inicia planteando las hiptesis.
La hiptesis nula se plantea como H0: = o, donde o es el valor a probar
(en este caso 1000 horas), y la hiptesis alternativa podra ser como alguna
de las siguientes:
H1: > o
H1: < o
H1: o
H0: = 1000
H0: = 1000
H1: < 1000
x
zc con n 30 con conocida o con n < 30 y conocida
/ n
x
zc con n 30 con desconocida
s/ n
x
tc con n < 30 y desconocida
s/ n
x 970 1000
zc 3,54
/ n 60 / 50
En trminos de t sera:
Como |Zc| = 3,54 > |Zt| = 1,645, entonces Zc cae en zona de rechazo de la
H0.
Ejercicio Una institucin del gobierno peridicamente verifica que las empresas y
los comercios no realicen prcticas abusivas contra los consumidores.
de Recientemente ha verificado una muestra de 200 latas de atn cuya
revisin etiqueta indica que contienen 130 grs. como peso escurrido. El promedio
en la muestra fue 112 grs. como peso escurrido Por un estudio anterior se
conoce que la desviacin estndar es 20,5 grs.
distribucin normal para realizar la prueba, sino que se utiliza la distribucin t, segn el caso
con una o dos colas, y n 1 grados de libertad.
Solucin Se tiene que hay un peso especificado para los frascos de mantequilla de
man de 250 gramos, por lo que 0 = 250 y adems n = 8.
x 252 250
tc 1,72
s/ n 3,3 / 8
Los pasos para la realizacin de estas pruebas de hiptesis son los mismos expuestos
anteriormente.
Ho: P = p0
H1: P > p0
H1: P < p0
H1: P p0
ESTADSTICO DE PRUEBA x nP
z
PARA LA PROPORCIN POBLACIONAL nPQ
Una vez que se tiene bien definida la naturaleza del problema, entonces se
siguen los mismos 5 pasos expuestos para el caso de las pruebas de
hiptesis sobre la media poblacional.
H0: P = 0,20
Por otro lado, los datos muestrales indican que de los 1200 adultos
encuestados, 215 realizaron ejercicio fsico la semana pasada, por lo que se
tendra una proporcin muestral equivalente a:
H0: P = 0,20
H1: P < 0,20
La mayora de los paquetes de cmputo calculan el valor P, adems de los otros estadsticos
de prueba, por lo que su uso en la investigacin y en la industria es frecuente. Un ejemplo de
un software til para realizar la prueba de una hiptesis es Minitab.
Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra de
50 bombillos y desea probar que los bombillos tienen una vida media de
1000 horas. La media obtenida a partir de la muestra es de 970 horas. Se
conoce que la desviacin estndar es 60 horas. Utilice Minitab para
determinar, a un nivel de significacin del 5%, si la media poblacional de
estos bombillos es efectivamente de 1000 horas.
Solucin Como en cualquier prueba de hiptesis, se inicia por plantear las hiptesis.
Tal como se expuso anteriormente, las hiptesis son:
H0: = 1000
H1: < 1000
Puede verse que Minitab indica que el valor del estadstico de prueba Zc es
3,54, que coincide con el valor calculado anteriormente en este captulo.
De la tabla de la curva normal, o bien, del mismo Minitab se calcula el
valor Zt, que es 1,645, por lo que Zc cae en zona de rechazo de la H0.
Adems, observe que Minitab calcul el valor P, que en este caso es 0,000,
un valor inferior al nivel de significancia del 5%, por lo que se rechazara
la hiptesis nula.
Cuando el estadstico de prueba sea t, entonces la opcin del men Estadsticas > Estadstica
bsica que se emplea es t de una Muestra, y cuando la prueba se refiere a una proporcin,
entonces se elige 1 Proporcin.
H0: P = 0,20
H1: P < 0,20
podra aceptarse la hiptesis nula. Pero si el valor hipottico est fuera de dicho intervalo,
entonces podra rechazarse la hiptesis nula.
Solucin Se inicia por plantear las hiptesis. Se desea probar que el tiempo medio
para resolver los requerimientos de los usuarios es de 28 das, por lo que
esa ser la hiptesis nula. Por otro lado, la evidencia muestral indica que
dicho tiempo se ha disminuido, pero algunos empleados opinan lo
contrario, por lo que se podra plantear la hiptesis alternativa como que el
tiempo medio es diferente de 28 das. En resumen, las hiptesis son:
H0: = 28
H1: 28
22,62
x t s / n 26,9 2,779 8 27
31,18
x 26,9 28
tc 0,714
s/ n 8 / 27
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
1. Un cierto material viene en cajas de peso promedio 17 libras y desviacin estndar 0,4
libras. Se recibe un cargamento grande y se tiene la sospecha de que el peso promedio de las
cajas es inferior al usual. Para verificar la sospecha se toma una muestra al azar de 86 cajas y
se pesan, obtenindose un promedio de 16,5 libras. Se puede afirmar que efectivamente el
peso de las cajas es inferior al acostumbrado? Use un nivel de significancia de 5%.
2. En una granja bastante grande se producen pollos. Segn los estndares establecidos, el
peso medio de los pollos debe ser de 4,2 Kg. con varianza 1,96. Se desea determinar si es
cierta la queja de un grupo de clientes de que el peso medio ha disminuido durante las ltimas
semanas. Para verificar tal afirmacin se contrata un ingeniero avcola, el cual toma una
muestra de 65 pollos, y encuentra un peso medio de 3,86 Kg. Significa esto que
efectivamente el peso medio es inferior al usual? Use un nivel de significancia de 0,01.
4. Segn un estudio los nios de los estratos socio econmicos medios y altos inician alguna
prctica de cuidado de su salud buco dental a los 15,6 meses. En una muestra de 35 nios de
familias de estratos bajos se encontr una edad media de inicio de la higiene bucal a los 18,2
meses, con una desviacin estndar de 8,5 meses. Puede considerarse, a una significancia del
1%, que la edad de los nios de familias de estratos bajos es mayor que 15,6 meses?
6. El gerente de una empresa procesadora de caf est preocupado porque sus proveedores le
entregan con frecuencia caf verde. Se tomaron como muestras 36 probetas de 250 ml cada
una y encontr que en promedio se entreg 30 ml de grano verde por probeta con una
desviacin de 10 ml. A un nivel de significacin de 98%, se cumple la especificacin de que
la cantidad de grano verde por probeta no supere 25 ml?
7. Un investigador est interesado en conocer ciertos datos relacionados con la calidad de vida
de una poblacin, entre ellos se interesa por el nivel de caloras que en promedio consumen
los nios de 7 a 12 aos de esa poblacin por da. Conoce, por un estudio anterior, que la
desviacin estndar de la citada variable es 185 caloras, adems sabe que habitan en ese
poblado 745 nios. Segn datos del gobierno local el consumo medio de caloras de los nios
de esa edad es de 1170 caloras por da, pero el investigador duda de la veracidad de dicha
informacin. El desea que sus estimaciones tengan altos niveles de confiabilidad (por lo
menos el 97%), entonces decide realizar un estudio estadstico. Toma una muestra de 27 nios
y evala su situacin nutricional. Si una vez realizado el estudio en muestra de 27 nios,
8. Se sabe que para cierto tipo de bombillo elctrico, que su duracin media es de 1250 horas.
Se introduce una nueva tcnica que pretende mejorar su duracin, y luego se somete a una
prueba una muestra al azar de 60 bombillos fabricados con el nuevo procedimiento,
obtenindose una duracin media de 1271 horas y varianza de 3600. Existe base para pensar
que el nuevo procedimiento aumenta la duracin de los bombillos?
9. El gerente de una empresa procesadora de caf est preocupado porque considera que la
mitad de las veces sus proveedores le entregan demasiado caf verde. Se tomaron como
muestras 36 probetas de 250 ml cada una y encontr que en 125 de ellas haba una cantidad
de grano verde que superaba lo especificado. A un nivel de significacin de 99%, puede
considerarse que la mitad de las veces los proveedores entregan ms grano verde del
establecido?
10. En una muestra de 10 distintas acciones de empresas tecnolgicas elegidas al azar entre
todas las acciones que se negocian en la Bolsa de Valores de Nueva York se obtuvo una razn
promedio de precio/utilidades (p/u) de $12,89 con una desviacin estndar de $6,98. Si se
sabe que la tasa precio/utilidades promedio para todas las empresas que cotizan en la bolsa fue
de $10,97. Es esta evidencia suficiente para concluir, a un nivel de significancia del 5%, que
la tasa precio/utilidades promedio para las empresas tecnolgicas es superior al resto de
acciones negociadas en la Bolsa?
11. Un laboratorio afirma que el tiempo promedio de eliminacin del ibuprofeno en sujetos
sanos es de 2,3 horas. Para determinar la validez de esa afirmacin se tom una muestra de 15
personas y se obtuvo un tiempo medio de 2,9 horas. Se conoce que la desviacin estndar es
1,1 horas. A qu conclusin se llega a un nivel de significancia del 5%?
12. Una persona considera que los habitantes de nuestro pas tienen un cociente intelectual
superior a 100 puntos, pues los niveles educativos han mejorado en aos recientes. Los
siguientes datos corresponden a una muestra de personas que aplicaron un test para medir su
cociente intelectual: 102, 99, 96, 100, 99, 112, 125, 85, 83, 105, 98, 129, 78, 109, 116, 101,
112, 101, 96, 100, 103, 97, 104, 97, 98, 99, 113, 102, 95, 121, 98, 100, 98, 99, 111, 102, 99,
103, 108. Indicar estos datos que esa persona tiene razn, al nivel de significancia de 5%?
13. En un artculo reciente de una revista se compar el costo de adopcin de nios en China
y en Rusia. En una muestra de 16 adopciones en China, el costo medio fue de $11045, con
desviacin estndar de $835. En una muestra de 18 adopciones de nios en Rusia, el costo
medio fue de $12840, con una desviacin estndar de $1545. Se puede concluir que el costo
medio de adoptar un nio es mayor en Rusia? Utilice el nivel de significancia del 5%.
14. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es menor que 3,13?
16. Un arquitecto considera que actualmente las casas tienen un rea construida inferior a la
de hace dos o ms dcadas. En una muestra de 15 viviendas construidas en el transcurso de
los dos ltimos aos se encontr un rea construida promedio de 92 metros cuadrados y una
desviacin estndar de 30 metros cuadrados. A un nivel de significancia de 5%, qu puede
concluirse si se sabe, por otro estudio, que las viviendas construidas hace dos dcadas o ms
tenan un rea construida promedio de 130 metros cuadrados?
17. Un ingeniero ha recopilado datos sobre la vida til de una muestra de filtros de gasolina
del mismo tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15,
10, 12, 13, 15, 16. Pruebe la hiptesis de que la vida media de los filtros es de 15000
kilmetros. Use un nivel de significancia del 5%.
18. El cable coaxial RG-174 debe tener un dimetro de 2,6 mm. En una muestra de 25 metros
de cable coaxial RG-174 fabricado por una empresa se obtuvo un dimetro medio de 2,65
mm. Se sabe que la desviacin estndar es 0,9 mm. Est cumplindose la especificacin?
Use un nivel de significancia del 5%.
19. Un contador est realizando una auditora de los cheques extendidos por una compaa.
En una muestra de 20 cheques se obtuvieron los siguientes montos, en miles dlares:
15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6, 8, 12, 19, 11, 12
20. El director financiero considera que el monto promedio de los cheques de la compaa es
$11 mil dlares y el jefe del departamento contable cree que la proporcin de cheques con
montos superiores a $12 mil dlares no es mayor que 45%.
21. El ingreso medio de los habitantes del pas es $10.420 y la distribucin del ingreso se
comporta normalmente. Una muestra aleatoria de 10 residentes de una ciudad presenta una
media de $8.540 con una desviacin estndar de $3.560. A un nivel de significancia del 5%,
existe evidencia suficiente para considerar que los habitantes de esta ciudad tienen ingresos
inferiores a la media nacional?
23. En una muestra de 12 motores para automvil de cierto tipo se obtuvo una vida til
promedio de 320000 kilmetros. La desviacin estndar muestral es de 90000 kilmetros. Si
el vendedor ofrece una vida til de 350000 kilmetros, podra considerarse que engaa a los
clientes? Use un nivel de significancia de 1%.
24. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. El objetivo es que estas mujeres lograran incrementar los ingresos de sus
microempresas. Luego de implementadas las capacitaciones se compararon los ingresos de
una muestra de 12 microempresas y se registraron los siguientes ingresos (en dlares al mes):
1 2 3 4 5 6 7 8 9 10 11 12
Antes 320 290 421 510 210 402 625 560 360 431 506 505
Despus 340 285 475 510 210 500 631 560 365 431 525 619
25. El gerente de una empresa considera que el 70% de sus clientes estaran dispuestos a
efectuar compras a travs de internet. Para comprobar esta afirmacin se efecta una encuesta
entre 20 clientes, de los cuales 11 dijeron que no estaban dispuestos a comprar por este medio.
Se puede decir que el gerente tena razn o que el resultado de la encuesta se debe a
fluctuaciones del muestreo? Use a = 1%.
26. El encargado de reclutamiento y seleccin de personal de una empresa considera que las
habilidades sociales, como la buena comunicacin y un adecuado manejo de los conflictos,
son fundamentales para lograr un buen desempeo en la compaa, y considera que menos del
25% de las personas han desarrollado estas destrezas a un nivel suficiente para laborar en la
organizacin. En las entrevistas y pruebas que aplican a los candidatos para los puestos que
demanda la empresa se evalan estas destrezas. En una muestra aleatoria de 45 candidatos, se
encontr que 19 haban obtenido una evaluacin suficientemente buena. Puede concluirse
que el encargado de reclutamiento y seleccin est equivocado? Use un nivel de significancia
del 5%.
27. Un candidato de un partido poltico considera que el 54% de los electores indecisos tienen
una opinin favorable acerca de sus planteamientos. Para comprobar si su expectativa es
acertada, se decidi efectuar una encuesta entre un grupo de electores, de los cuales 210
dijeron no haber definido su candidato para las prximas elecciones, y se logr determinar
que 80 de esas personas tienen cierta simpata por este candidato. Puede el candidato
mantener vigente su expectativa, o ms bien esta informacin muestra lo contrario? Use =
0,05.
28. De acuerdo con un artculo publicado en una revista cientfica la vasectoma es exitosa en
el 99% de los casos. Un investigador seleccion 2400 casos realizados recientemente en el
pas y encontr 29 fallos. Puede considerarse que la tasa de xito es inferior a 99%? Use una
significancia de 5%.
30. Segn un artculo publicado en una revista cientfica la miopa podra afectar al 25% de la
poblacin de un pas como Estados Unidos. Un investigador desea saber si a nivel nacional
esa tasa podra ser similar. En una muestra de 120 adultos residentes en nuestro pas se
encontr que 18 personas tenan miopa. Son estos datos evidencia suficiente de que la
poblacin de nuestro pas se ve menos afectada por la miopa? Use una significancia del 5%.
32. Segn un estudio solo el 40% de los nios entre los 3 y 5 aos de edad tienen hbitos de
cuidado de su salud bucal. Luego de una campaa se tom una muestra de 25 nios y se
determin que 13 de ellos posea buenos hbitos en este sentido. Podra concluirse que la
campaa fue exitosa? Utilice un nivel de significancia de 1%.
34. Una institucin de asistencia social indic que el ao pasado el 44% de los nios de sexto
grado que asisten a la escuela de una localidad solicitaron una beca para continuar sus
estudios de secundaria. A inicios de este mes se seleccion una muestra de 200 nios de sexto
grado de la misma escuela y se descubri que 96 solicitaran la beca. Hubo un incremento
significativo en el porcentaje de nios que solicitaran la beca en la secundaria? Lleve a cabo
la prueba al 5%.
35. Una empresa pauta publicidad en televisin todos los meses. Recientemente ha lanzado
una campaa muy agresiva, y se espera que al menos el 55% de los consumidores de menos
de 40 aos recuerden el anuncio de la empresa. Se ha tomado una muestra de 120
consumidores de menos de 40 aos y el 48% dijeron que recordaban el anuncio de la empresa.
Puede considerarse, al 5% de significancia, que se ha alcanzado la meta?
1. Cuando se debe decidir, con base en evidencia experimental, si una afirmacin hecha
acerca de un parmetro es falsa o verdadera, es necesario realizar:
(a) Una estimacin por intervalos
(b) Una prueba de hiptesis
9. El gerente de una empresa espera que el 60% de sus clientes actuales estn dispuestos a
efectuar compras a travs de internet. Para comprobar esta afirmacin se efecta una encuesta
entre una muestra de clientes, en la cual se encuentra que solo el 40% de los clientes
efectuaran compras por internet. Segn los estudios financieros de la empresa, se requiere
que al menos el 60% de los clientes actuales realicen compras en lnea para que valga la pena
implementar dicha modalidad de negocios. Con respecto a esta situacin se han realizado dos
afirmaciones:
10. Un candidato de un partido poltico considera que al menos el 40% de los electores tienen
una opinin favorable acerca de sus planteamientos y, por tanto, votaran por l en las
prximas elecciones. Para comprobar si su expectativa es acertada, decidi efectuar una
encuesta entre un grupo de 200 electores, de los cuales 70 dijeron tener simpata por este
candidato. Las elecciones se ganan con al menos el 40% de los votos y el candidato
participar solo si posee posibilidades de contar con al menos el 40% de los votos. Con
respecto a esta situacin se han realizado dos afirmaciones:
A. Cometer el error tipo II significara no participar en una eleccin que pudo haber
ganado.
B. Cometer el error tipo I significara gastar muchos recursos en propaganda en una
eleccin que no ganara.
11. Las autoridades sanitarias consideran que los recin nacidos procedentes de zonas rurales
deberan pesar al menos 2500 gramos al nacer, en promedio. De presentarse una media
inferior, valdra la pena implementar un programa para la mejora de la atencin prenatal en
las zonas rurales. Se decide hacer un estudio por muestreo para valorar esta decisin. Con
respecto a esta situacin se han realizado dos afirmaciones:
12. Con respecto al nivel de significancia usado en las pruebas de hiptesis se han realizado
dos afirmaciones:
A. Generalmente es de 1% o de 5%.
B. Representa la posibilidad de aceptar una hiptesis incorrecta.
13. Un contrato laboral exige los operarios realicen una produccin diaria no menor de 50
unidades. Una muestra de 150 das de produccin revela una media de 47,3 unidades, con una
desviacin estndar de 5,7 unidades, se cumple con la disposicin del contrato?
14. Un contrato laboral exige los operarios realicen una produccin diaria no menor de 50
unidades. Una muestra de 150 das de produccin revela una media de 47,3 unidades, con una
desviacin estndar de 5,7 unidades, se cumple con la disposicin del contrato?
15. En un colegio se estima que, cuando mucho, 25% de los estudiantes se traslada a clases en
bicicleta. Parecera esta ser una estimacin vlida si, en una muestra aleatoria de 180
estudiantes, se encuentra que 60 utilizan este transporte?
16. En un colegio se estima que, cuando mucho, 25% de los estudiantes se traslada a clases en
bicicleta. Parecera esta ser una estimacin vlida si, en una muestra aleatoria de 180
estudiantes, se encuentra que 60 utilizan este transporte?
17. Con respecto al procedimiento de prueba de hiptesis se han realizado dos afirmaciones:
18. Con respecto al valor P (que ofrecen la mayora de los programas de computacin como
parte de la prueba de hiptesis) se han realizado dos afirmaciones:
19. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 58 observaciones y se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
20. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 17 observaciones y se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
21. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 17 observaciones y no se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
22. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 90 observaciones y no se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
23. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se dice que la
prueba es de dos colas, entonces es verdadero que la hiptesis alternativa puede ser (donde 0
es el valor hipottico de la media poblacional):
(a) H1: > 0 (b) H1: < 0
(c) H1: 0 (d) H1: = 0
24. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se sabe que no se
rechaz la hiptesis nula, entonces puede ser verdadero que:
(a) zc zt (b) tc tt
(c) tc tt (d) Ninguna de las anteriores
25. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se sabe que se
rechaz la hiptesis nula, entonces puede ser verdadero que:
(a) z c z t (b) t c t t
(c) z c z t (d) Ninguna de las anteriores
26. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se sabe que se
rechaz la hiptesis nula, entonces puede ser verdadero que:
(a) z c z t (b) valor P <
(c) tc tt (d) valor P >
27. Si se realiza una prueba de hiptesis de dos colas, con un nivel de significancia del 5%,
entonces el valor z crtico es:
(a) 2,00 (b) 1,645 (c) 1,28 (d) 1,96
28. Si se realiza una prueba de hiptesis de dos colas, con un tamao de muestra de 10
observaciones y un nivel de significancia del 5%, entonces el valor t crtico es:
(a) 1,96 (b) 2,262 (c) 1,833 (d) 2,228
31. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, la hiptesis nula es:
(a) H0: = 2,86 (b) H0: = 3,13
(c) H0: < 3,13 (d) H0: = 1,2
32. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, la hiptesis alternativa es:
(a) H1: = 2,86 (b) H1: = 3,13
(c) H1: < 3,13 (d) H1: > 2,86
33. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, es cierto que:
(a) Debe calcularse z porque el tamao de muestra es menor que 30 y se desconoce
(b) Debe calcularse z porque el tamao de muestra es menor que 30 y se conoce
(c) Debe calcularse t porque el tamao de muestra es menor que 30 y se desconoce
34. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, es cierto que:
(a) Es una prueba de una cola porque en la hiptesis nula se emplea el signo <
(b) Es una prueba de una cola porque en la hiptesis alternativa se emplea el signo <
(c) Es una prueba de una cola porque en la hiptesis alternativa se emplea el signo
(d) Es una prueba de dos colas porque en la hiptesis alternativa se emplea el signo <
35. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, el valor del estadstico de prueba es:
(a) z = 1,13 (b) t = 1,13
(c) t = 1,711 (d) Ninguna de las anteriores
36. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al calcular el valor tabular crtico para hacer la prueba es cierto que:
(a) Los grados de libertad son 25
(b) Los grados de libertad son 24
(c) Los grados de libertad son 26
(d) No se necesita determinar los grados de libertad
37. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, el valor tabular crtico para hacer la prueba es:
(a) z = 1,645 (b) t = 1,711
(c) t = 1,711 (d) t = 2,064
38. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al hacer la prueba es verdadero que:
(a) Se acepta la hiptesis nula porque tc < tt
(b) Se acepta la hiptesis nula porque |tc| < |tt|
39. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al hacer la prueba se puede concluir, con respecto al tamao medio de los
hogares del rea metropolitana, que:
(a) El tamao medio es 2,86 miembros
(b) El tamao medio es 3,13 miembros
(c) No hay evidencia suficiente para decir que el tamao medio es menor que 3,13 miembros
(d) Hay evidencia suficiente para decir que el tamao medio es menor que 3,13 miembros
1. b 2. a 3. b 4. c 5. d
6. b 7. c 8. a 9. a 10. c
11. a 12. a 13. a 14. b 15. b
16. d 17. a 18. d 19. a 20. a
21. c 22. b 23. c 24. c 25. a
26. b 27. d 28. b 29. d 30. d
31. b 32. c 33. d 34. b 35. b
36. b 37. c 38. b 39. c
11 .
Tal como en el ejemplo, muchas veces es necesario decidir si la diferencia entre dos medias
muestrales se puede atribuir al azar, o si en realidad las dos muestras provienen de
poblaciones con medias diferentes. Otros ejemplos de problemas en que se comparan dos
medias se pueden referir a comparar dos mtodos de soldadura para encontrar cul es ms
resistente, comparar el rendimiento de llantas radiales versus llantas con neumtico, comparar
dos mtodos de enseanza, etc. A continuacin se expone el procedimiento que se utilizar
para probar si la diferencia observada entre las dos medias muestrales es estadsticamente
significativa.
H0: 1 2 =
donde es la diferencia que se desea probar. Este valor es una constante determinada con
base en muestras aleatorias e independientes de tamao n1 y n2. La mayor parte de las veces
se tendr que = 0, es decir, se prueba si las dos medias son iguales, por lo que la hiptesis
nula podra plantearse como:
H0: 1 = 2
H1: 1 2 >
H1: 1 2 <
H1: 1 2
( x1 x 2 )
z
12 22
n1 n2
Los criterios de aceptacin o rechazo son iguales a los de la prueba para una media.
Ejemplo Una empresa posee operaciones en dos pases distintos y en cada pas
posee una planta de produccin. En uno de los pases se tienen 2000
empleados y en el otro 3000. En ambas plantas se realizan los mismos
procesos, pero se ha observado que, segn algunos datos muestrales, la
productividad de los operarios tiende a ser mayor en uno de los pases que
en el otro.
Tamao de Desviacin
Planta de muestra Media estndar
produccin n x
En el pas 1 40 22 3,1
En el pas 2 50 31 4,2
H0: 1 2 = 0
H1: 1 2 < 0
( x1 x 2 ) (22 31) 0
z 11,69
2
2
3,12 4,2 2
1
2
n1 n2 40 50
Solucin En esta situacin se tienen los datos para los dos grupos de profesionales,
las cuales se pueden resumir del modo siguiente:
1 2
Grupo Ciencias econmicas Ingeniera
Tamao de muestra 80 70
Promedio $1.250 $980
Desviacin estndar $400 $620
Se plantean la hiptesis nula como la igual de las dos medias, o sea, que la
diferencia es cero:
H0: 1 2 = 0
H0: 1 = 2
H1: 1 > 2
H0: 1 = 2
H1: 1 > 2
( x1 x 2 ) (1250 980) 0
z 3,12
2
2
400 2 620 2
1
2
n1 n2 80 70
Solucin En esta situacin se tienen los datos para los dos grupos de profesionales,
las cuales se pueden resumir del modo siguiente:
1 2
Grupo Ciencias econmicas Ingeniera
Tamao de muestra 80 70
Promedio $1.250 $980
Desviacin estndar $400 $620
H0: 1 = 2
H1: 1 > 2
( x1 x 2 )
t
2 2
n1 n2
donde:
n1 n2 2
Los grados de libertad son gl = n1 + n2 2. Se emplea la tabla t (Apndice 7) para obtener los
valores t tabulares.
Presencial 79 88 54 81 73 56 79 64 58
En lnea 70 80 72 52 70 61
Adems, = 0,05.
H0: 1 2 = 0
H1: 1 2 > 0
H0: 1 = 2
H1: 1 > 2
2
132,42
n1 n2 2 962
Luego se calcula t:
( x1 x 2 ) (70,2 67,5) 0
t 0,45
2 2 132,42 132,42
9 6
n1 n2
Aplicando la distribucin t:
gl = n1 + n2 2 = 9 + 6 2 = 13
Ejemplo Los datos corresponden a los tiempos, en minutos, requeridos por una
muestra de empleados de dos departamentos distintos de una empresa en
un simulacro de evacuacin de las instalaciones, esto como parte de la
preparacin que se realiza ante eventuales situaciones de emergencia,
como terremotos o incendios.
Depto. 1 5 3 4 1 3 4 9 2
Depto. 2 4 2 5 4 6 3 2
H0: 1 = 2
H1: 1 > 2
2 4,176
n1 n2 2 872
Luego se calcula t:
( x1 x 2 ) (3,875 3,714) 0
t 0,152
2
2
4,176 4,176
8 7
n1 n2
Aplicando la distribucin t:
gl = n1 + n2 2 = 8 + 7 2 = 13
Ejemplo Utilice Minitab para resolver el problema: Los datos corresponden a los
tiempos, en minutos, requeridos por una muestra de empleados de dos
departamentos distintos de una empresa en un simulacro de evacuacin de
las instalaciones, esto como parte de la preparacin que se realiza ante
eventuales situaciones de emergencia, como terremotos o incendios.
Depto. 1 5 3 4 1 3 4 9 2
Depto. 2 4 2 5 4 6 3 2
Solucin Primero que todo se introducen los datos en columnas de la hoja de trabajo
de Minitab:
Resulta til calcular cada una de las medias, para saber que x1 = 3,875 y
que x 2 = 3,714, y se plantean las hiptesis como:
H0: 1 = 2
H1: 1 > 2
Observaciones pareadas
Suponga la situacin siguiente. Los empleados de un departamento de una empresa han
realizado un simulacro de evacuacin de las instalaciones, esto como parte de la preparacin
que se realiza ante eventuales situaciones de emergencia, como terremotos o incendios, y se
obtuvo, en una muestra de 8 empleados un tiempo medio de evacuacin de 5,25 minutos. Se
considera que ese tiempo es muy alto, por lo que se implementa un plan para informar al
personal sobre los planes de emergencias de la empresa. Luego de estas medidas se vuelve a
realizar el simulacro, y los mismos 8 empleados promedian 4,5 minutos. Aunque se presenta
una mejora, existe la duda de si esa diferencia es significativa estadsticamente. Para resolver
un problema de este tipo tambin debe realizarse una prueba de hiptesis para la diferencia de
dos medias, como en las secciones anteriores, pero con la diferencia de que en este caso las
observaciones son pareadas, es decir, la segunda muestra de datos corresponde a las mismas
unidades de estudio de la primera muestra, por lo que los datos de la primera muestra y la
segunda no son independientes.
Si las poblaciones de donde se toman las muestras no son independientes, como en el caso de
experimentos de antes y despus y muchas otras situaciones en las que los datos estn
naturalmente apareados, se usa la prueba t para la diferencia de los datos apareados.
xd
t
sd n
Antes 7 4 5 3 4 5 10 4
Despus 5 3 5 4 6 4 6 3
Solucin Primero se calculan las diferencias, di, entre el "antes" y el "despus" para
cada una de las observaciones, o sea, se resta el dato "antes" menos el dato
"despus":
Antes 7 4 5 3 4 5 10 4
Despus 5 3 5 4 6 4 6 3
Diferencia 2 1 0 -1 -2 1 4 1
x d = 0,75
sd = 1,832
Ho: d = 0
H1: d > 0
Se calcula t:
xd 0,75
t 1,158
sd n 1,832 8
Ejemplo La tabla muestra las cantidades producidas por hora elaboradas por 8
operarios antes de recibir un entrenamiento y las cantidades producidas
luego de la misma.
Antes 8 8 9 6 9 7 12 12
Despus 6 10 7 11 9 12 14 8
Ho: d = 0
H1: d < 0
Se calcula t:
xd 0,75
t 0,637
sd n 3,33 8
Automvil 1 2 3 4 5 6 7
Neumtico nacional 142 138 144 146 150 137 141
Neumtico importado 140 139 142 139 141 137 135
Ejemplo Utilice Minitab para resolver el siguiente problema. La tabla muestra las
cantidades producidas por hora elaboradas por 8 operarios antes de recibir
un entrenamiento y las cantidades producidas luego de la misma.
Antes 8 8 9 6 9 7 12 12
Despus 6 10 7 11 9 12 14 8
Ho: d = 0
H1: d < 0
As, cuando se trata de comparar dos proporciones, las hiptesis se pueden plantear del modo
siguiente:
Hiptesis nula:
Ho: p1 = p2
H1: p1 > p2
H1: p1 < p2
H1: p1 p2
p1 p 2
z
1 1
pq
n1 n2
p1 p 2
p
n1 n2
q = 1 p.
Ho: p1 = p2
H1: p1 > p2
Primero se calculan p y q:
p1 p 2 28 25
p 0,59
n1 n2 40 50
q = 1 0,5889 = 0,41
Luego se calcula z:
p1 p 2 0,70 0,50
z 1,92
1 1 1 1
pq 0,59 0,41
n1 n2 40 50
p1 = 18/500 = 0,036
p2 = 25/400 = 0,0625
Entonces se calcula p:
p1 p 2 18 25
p 0,0478
n1 n2 500 400
q = 1 0,0478 = 0,9522
Ho: p1 = p2
H1: p1 p2
Luego se calcula z:
p1 p 2 0,036 0,0625
zc 1,852
1 1 1 1
pq 0,0478 0,9522
n1 n2 500 400
Ejercicio Un investigador cree que las mujeres emplean la tarjeta de crdito ms que
los hombres. Para probar su hiptesis toma una muestra de 90 mujeres y
de encuentra que 64 de ellas emplea regularmente la tarjeta de crdito. Por
revisin otro lado, una muestra de 120 hombres arroj que 76 empleaban la tarjeta
de crdito con regularidad. Tiene razn el investigador? Utilice un nivel
de significancia del 1%.
p1 = 18/500 = 0,036
p2 = 25/400 = 0,0625
Ho: p1 = p2
H1: p1 p2
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
1. Un investigador desea evaluar si los pesos al nacer de los recin nacidos en una zona
urbana tienen diferencia significativa con respecto a una zona rural cercana. En una muestra
de 77 recin nacidos de la zona urbana se obtuvo una media de 3317 gramos con una
desviacin estndar de 415 gramos, mientras que en una muestra de 51 recin nacidos de la
zona rural se obtuvo una media de 3257 gramos con una desviacin estndar de 508 gramos.
A qu conclusin puede llegarse a un nivel de significancia del 5%?
58 y 57. Puede concluirse, a un nivel de significancia del 5%, que el peso promedio de las
mujeres es mayor un ao despus de la gestacin?
5. Un arquitecto considera que actualmente las casas tienen un rea construida inferior a la de
hace dos o ms dcadas. En una muestra de 15 viviendas construidas en el transcurso de los
dos ltimos aos se encontr un rea construida promedio de 92 metros cuadrados y una
desviacin estndar de 30 metros cuadrados. En otra muestra de 20 viviendas construidas
hace dos o ms dcadas se encontr un rea construida promedio de 132 metros cuadrados y
una desviacin estndar de 45 metros cuadrados. A un nivel de significancia de 5%, qu
puede concluirse que ha habido un cambio significativo en las dimensiones de las viviendas?
7. Un ingeniero ha recopilado datos sobre la vida til de filtros de gasolina de dos marcas
distintas. Los datos son los siguientes (en miles de kilmetros):
Marca 1 12 14 16 15 10 12 13 15 16
Marca 2 13 15 17 17 12 14 13 18 15
Pruebe la hiptesis de que la marca 2 tiene una vida til que excede en al menos 2 mil
kilmetros a la vida til de la marca 1. Use un nivel de significancia de 5%.
10. Un contador est realizando una auditora de los cheques extendidos por una compaa.
En una muestra de 15 cheques para agosto de este ao se obtuvieron los siguientes montos, en
miles dlares:
11. En una muestra de 10 cheques para agosto del ao pasado se obtuvieron los montos
siguientes:
12. Una persona considera que los asiticos poseen un cociente intelectual promedio superior
al de los habitantes de nuestro pas. Los siguientes datos corresponden a una muestra de
asiticos que aplicaron un test para medir su cociente intelectual: 102, 100, 97, 101, 100, 113,
126, 86, 85, 106, 99, 130, 79, 110, 117, 102, 113, 102. Los siguientes datos corresponden a
una muestra de nacionales que aplicaron un test para medir su cociente intelectual: 95, 99,
102, 96, 103, 96, 97, 98, 112, 101, 94, 120, 97, 99, 97, 98, 110, 101, 98, 102, 107. Indicar
estos datos que esa persona tiene razn, al nivel de significancia de 5%?
13. Los siguientes datos muestran el nmero promedio semanal de horas de uso internet de
estudiantes de secundaria para hacer trabajos acadmicos en una muestra de 8 estudiantes de
colegios pblicos y de 7 estudiantes de colegios privados:
Colegios pblicos 2,0 2,5 4,0 3,5 1,0 4,0 5,0 4,5
Colegios privados 1,5 2,5 5,0 3,5 4,0 2,0 3,5 5,5
Puede concluirse, a un nivel de significancia del 5%, que existen diferencias entre los niveles
de uso de internet de estudiantes de secundaria para hacer trabajos acadmicos segn el tipo
de colegio?
la misma muestra una segunda prueba para la medicin de los aprendizajes en preescolares de
5 aos. Los siguientes son los resultados de ambas pruebas:
Nio 1 2 3 4 5 6 7 8 9
Prueba 1 60 53 47 29 38 45 56 49 42
Prueba 2 110 85 88 66 60 67 72 78 76
Puede considerarse que existe diferencia significativa entre los dos resultados? Use un nivel
de significancia del 1%.
15. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. El objetivo es que estas mujeres lograran incrementar los ingresos de sus
microempresas. Luego de implementadas las capacitaciones se compararon los ingresos de
una muestra de 12 microempresas y se registraron los siguientes ingresos (en dlares al mes):
Empresaria 1 2 3 4 5 6 7 8 9 10 11 12
Antes 320 290 421 510 210 402 625 560 360 431 506 505
Despus 340 285 475 510 210 500 631 560 365 431 525 619
17. Una compaa ha desarrollado dos nuevos motores de gasolina. Para valorar su consumo
de combustible efecta 15 recorridos para cada motor. El primer motor consumi en
promedio 8,7 galones de gasolina por minuto con una desviacin estndar de 1,2 galones. El
segundo motor consumi en promedio 9,6 galones de gasolina por minuto con una desviacin
estndar de 2,1 galones. Qu se podra afirmar, con un 1% de significancia, acerca de la
diferencia en el consumo medio de combustible de estos dos motores?
18. En una muestra de 6 distintas acciones de empresas tecnolgicas elegidas al azar entre
todas las acciones que se negocian en la Bolsa de Valores de Nueva York se obtuvieron las
siguientes razones precio/utilidades (p/u) antes de la crisis financiera (en dlares): 12, 15, 17,
18, 16, 10. Luego de la crisis financiera se tomaron los datos de la razn precio/utilidad (p/u)
para esas mismas 6 empresas obteniendo los siguientes datos (en dlares y en el mismo orden
anterior): 9, 19, 12, 7, 25, 8. Es esta evidencia suficiente para concluir, a un nivel de
significancia del 5%, que la tasa precio/utilidades promedio despus de la crisis es igual a la
que se tena antes de la crisis?
19. Segn un estudio el 25% de las viviendas de zonas urbanas del pas estn en estado malo
o regular y que ese porcentaje se incrementa a 35% en las zonas rurales. Si los tamaos de
muestra fueron de 40 y 50 viviendas, respectivamente, pueden considerarse que hay
diferencias significativas en el estado de la vivienda entre ambas zonas? Use un nivel de
significancia de 1%.
21. El encargado de reclutamiento y seleccin de personal de una empresa considera que las
habilidades sociales, como la buena comunicacin y un adecuado manejo de los conflictos,
son fundamentales para lograr un buen desempeo en la compaa, y considera que hombres y
mujeres no desarrollan por igual estas destrezas. En las entrevistas y pruebas que aplican a los
candidatos para los puestos que demanda la empresa se evalan estas destrezas. En una
muestra aleatoria de 35 hombres que aplicaron para algn puesto en la empresa se obtuvo que
10 de ellos tuvieron una evaluacin satisfactoria y en una muestra aleatoria de 50 mujeres que
aplicaron para algn puesto en la empresa 18 presentaron una evaluacin satisfactoria en este
sentido. Apoyan estos datos la apreciacin del encargado de reclutamiento y seleccin de
personal de esta empresa? Utilice un nivel de significancia de 1%.
22. En un pas dos candidatos presidenciales aparecen en las encuestas con preferencias entre
los electores muy similares. En una encuesta realizada entre 1000 electores uno de los
candidatos obtuvo la preferencia de 480 personas, mientras que en otra encuesta con una
muestra de 1200 personas obtuvo la intencin de voto de 500 votantes. Existe diferencia
significativa entre los resultados de las dos encuestas? Utilice un nivel de significancia de 5%.
23. Hace un ao 120 periodistas de una muestra de 250 indicaron que no perciban que
hubiera importantes amenazas a la libertad de prensa en el pas. Luego de la aprobacin de
una ley que regula las publicaciones en medios digitales 315 periodistas de una muestra de
400 perciban la existencia de amenazas a la libertad de prensa. Podra considerarse que la
opinin de los periodistas ha cambiado? Use un nivel de significancia del 2%.
24. Una empresa pauta publicidad en televisin todos los meses. Recientemente ha lanzado
una campaa muy agresiva, sin embargo la gerencia cree que esta campaa est impactando
principalmente a los consumidores ms jvenes. Para comprobar esta creencia de la gerencia
se han tomado dos muestras, una de 80 consumidores de menos de 40 aos y otra de 90
consumidores de 40 aos o ms. El 58% de los consumidores de menos de 40 aos dijeron
que recordaban el anuncio de la empresa, mientras que solo el 42% de los consumidores de 40
aos o ms recordaban el anuncio. Puede considerarse, al 1% de significancia, que existe
diferencia entre los dos segmentos de consumidores?
25. Un asesor empresarial considera que los proyectos empresariales que implican la
participacin de miembros de ms de un departamento de la empresa fracasan con ms
frecuencia que aquellos que se realizan a lo interno de un departamento de la empresa. En una
muestra de 40 proyectos del primer tipo fracasaron 15, y en una muestra de 30 proyectos del
segundo tipo, fracasaron 9. A un nivel de significancia del 5%, a qu conclusin podra
llegarse?
26. Un fabricante de helados desarroll hace un tiempo una lnea de productos con menor
contenido de caloras, pues pensaba abarcar el mercado de personas con problemas de
obesidad. Sin embargo, muchas personas que no poseen problemas de obesidad tambin
compran este tipo de producto con regularidad. La empresa se cuestiona si su participacin de
mercado en el mercado de personas con problemas de obesidad es realmente mayor que en el
mercado de personas que no poseen este problema. Se efectu un estudio en el que se
entrevist a 80 personas con obesidad y 35 dijeron que consuman este producto con
frecuencia. Tambin se entrevist a 130 personas sin obesidad y 40 de ellas indicaron que
consuma el producto con frecuencia. A qu conclusin puede llegarse al 2% de
significancia?
27. Un economista sostiene que el monto del ingreso del deudor no es un factor que influya en
una mayor morosidad a la hora de pagar las deudas. Para comprobar su hiptesis toma una
muestra de deudores de un banco. Entre 60 deudores de bajo ingreso encontr que 5 de ellos
estaban atrasados en el pago de su deuda. En una muestra de 70 deudores de alto ingreso se
encontr 8 tenan algn grado de morosidad en sus obligaciones con el banco. Son estos
datos evidencia suficiente para darle la razn al economista? Use un nivel de significacin del
1%.
1. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En un problema como este, la hiptesis nula se podra expresar como, si 1 es la
productividad media en la primera empresa y 2 es la productividad media en la segunda
empresa:
(a) H1: 1 = 2 (b) H0: 1 > 2
(c) H0: 1 - 2 = 0 (d) H0: 1 2
2. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En un problema como este, la hiptesis alternativa se podra expresar como, si 1 es la
productividad media en la primera empresa y 2 es la productividad media en la segunda
empresa:
(a) H0: 1 > 2 (b) H1: 1 - 2 > 0
(c) H1: 1 = 2 (d) H1: 1 2
3. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En este problema, si las muestras son grandes y las varianzas poblacionales conocidas, se
emplea el siguiente estadstico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2 2 sd n
n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2
4. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En este problema, si las muestras son pequeas y las varianzas poblacionales desconocidas, se
emplea el siguiente estadstico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2 2 sd n
n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2
5. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
Con base en estos datos se puede calcular el estadstico de prueba:
(a) z = 2,09 (b) z = 1,96
(c) t = 2,09 (d) Ninguna de las anteriores
6. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
En este problema, el valor crtico o tabular para hacer la prueba es, al 5% de significancia:
(a) z = 2,09 (b) z = 1,645
(c) t = 1,96 (d) Ninguna de las anteriores
7. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
En este problema, es correcto que, al 5% de significancia:
(a) Se rechaza la hiptesis alternativa porque |zc| > |zt|
(b) Se acepta la hiptesis nula porque |zc| > |zt|
(c) Se rechaza la hiptesis nula porque |zc| > |zt|
(d) Ninguna de las anteriores
8. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente. Al realizar la prueba de hiptesis el gerente de la
primera empresa indica que "hay evidencia muestral suficiente para considerar que la msica
s tiene efecto positivo sobre la productividad", y el gerente de la segunda empresa expresa
que "la evidencia muestral seala que la diferencia entre las productividades medias entre las
dos empresas es significativa". Con respecto a estas dos afirmaciones, es correcto que, al 5%
de significancia:
9. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 10
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 15 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
Con base en estos datos se puede calcular el estadstico de prueba:
(a) t = 2,09 (b) z = 2,09
(c) t = 0,92 (d) Ninguna de las anteriores
10. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que
los operarios que realizan tareas repetitivas son ms productivos cuando oyen msica
empleando algn aparato con audfonos. El gerente de produccin de otra empresa no cree
que la msica genere ese efecto positivo. Para determinar quin tiene la razn se tom una
muestra de 10 empleados de la primera empresa y se obtuvo una productividad media de 40
unidades elaboradas por hora por operario. Se tom una muestra de 15 empleados de la
segunda empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se
conoce que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la
primera y la segunda empresa, respectivamente.
En este problema, el valor crtico o tabular para hacer la prueba es, al 5% de significancia:
(a) t = 1,714 (b) z = 1,96
(c) t = 1,645 (d) Ninguna de las anteriores
11. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que
los operarios que realizan tareas repetitivas son ms productivos cuando oyen msica
empleando algn aparato con audfonos. El gerente de produccin de otra empresa no cree
que la msica genere ese efecto positivo. Para determinar quin tiene la razn se tom una
muestra de 10 empleados de la primera empresa y se obtuvo una productividad media de 40
unidades elaboradas por hora por operario. Se tom una muestra de 15 empleados de la
segunda empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se
conoce que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la
primera y la segunda empresa, respectivamente.
En este problema, es correcto que, al 5% de significancia:
(a) Se acepta la hiptesis alternativa porque |tc| < |tt|
(b) Se acepta la hiptesis nula porque |tc| < |tt|
(c) Se rechaza la hiptesis nula porque |tc| < |tt|
(d) Ninguna de las anteriores
12. Con respecto a los problemas cuando n1 o n2, o ambas, son menores de 30 y se
desconocen las varianzas poblacionales, se afirma que:
12 22
A. Se usa el estadstico z ( x1 x 2 )
n1 n2
B. Se usa el estadstico t si se puede suponer que las poblaciones son normales y que
1 = 2 = .
13. Con respecto a los problemas cuando n1 o n2, o ambas, son menores de 30 y se
desconocen las varianzas poblacionales, se afirma que:
(n1 1) s12 (n2 1) s 22
A. Se calcula la varianza como 2
n1 n2 2
B. Los grados de libertad son gl = n1 + n2 2.
14. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8
15. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8
16. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8
17. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8
18. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8
19. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
En este problema se puede plantear la hiptesis nula, donde d es la media de las diferencias
entre los tiempos con y sin uso del celular:
(a) Ho: d = 0 (b) Ho: d 0
(c) H1: d = 0 (d) Ninguna de las anteriores
20. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
En este problema no se puede plantear la hiptesis alternativa del modo siguiente, donde d es
la media de las diferencias entre los tiempos con y sin uso del celular:
(a) H1: d < 0 (b) H1: d 0
(c) H1: d > 0 (d) Ninguna de las anteriores
21. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
22. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
23. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
24. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
25. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema, la hiptesis nula se puede plantear como:
(a) H1: P1 = P2 (b) H0: P1 > P2
(c) H0: P1 - P2 = 0 (d) H0: P1 P2
26. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
27. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema, si las muestras son grandes, se emplea el siguiente estadstico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2
2
sd n
n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2
28. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema se emplea el siguiente estadstico de prueba:
(a) z = 1,07 (b) z = 1,96
(c) z = 1,10 (d) Ninguna de las anteriores
29. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema el clculo agrupado de p da por resultado:
(a) 0,25 (b) 0,2429
(c) 0,4857 (d) Ninguna de las anteriores
30. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema, al 1% de significancia, se puede concluir con respecto a la diferencia entre
la proporcin de clientes actuales que compraran el nuevo modelo y la proporcin de los que
no son usuarios actuales que tambin compraran el nuevo modelo que:
(a) Existe diferencia significativa entre ambas proporciones.
(b) Ambas proporciones son iguales.
(c) La evidencia muestral no indica que haya diferencia significativa.
(d) Ninguna de las anteriores
1. c 2. b 3. d 4. a 5. a
6. b 7. c 8. a 9. c 10. a
11. b 12. d 13. a 14. c 15. a
16. c 17. b 18. c 19. a 20. d
21. a 22. c 23. c 24. d 25. c
26. b 27. c 28. a 29. a 30. c
12 .
Se investiga si las personas que tienen un elevado consumo de sal en las comidas tambin
tienen una presin arterial ms elevada.
Se trata de encontrar si un fenmeno como la desigualdad social se relaciona con mayores
niveles de inseguridad y criminalidad en los pases.
Se examina si el ingreso de la economa est relacionado con mayores niveles de consumo
y ahorro.
Ahora bien, a nivel de la empresa y la industria tambin hay muchas relaciones que los
tomadores de decisiones desean estudiar:
Cuando se tienen dos variables cuantitativas resulta necesario conocer cmo es la relacin
establecida en cuanto a dos aspectos principales:
Correlacin lineal
Tal como se expuso anteriormente, es posible establecer qu tanto es el grado de asociacin
estadstica entre dos variables. Generalmente se trata de determinar el grado de correlacin
lineal entre dos variables, es decir, qu tanto se aproxima la relacin entre las variables a una
lnea recta. Para ilustrar este tema emplearemos un caso hipottico.
Solucin En este caso el investigador analiza la relacin entre las dos variables
mencionadas, nmero de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadstica (variable x) y la nota que cada uno
de ellos obtiene en dicha prueba (variable y).
Una herramienta til para observar si existe algn grado de correlacin entre dos variables
cuantitativas es el diagrama o grfico de dispersin. En este grfico cada eje representa una
variable y se dibujan puntos que asocian cada valor de x con su correspondiente valor de y.
8 12 50
Solucin Para construir el diagrama de dispersin se trazan primero los dos ejes
cartesianos, y luego cada par de valores (x, y) se representa como un punto
en el grfico. En este caso, por ejemplo, el punto que se encuentra ms arriba
a la derecha representa al estudiante nmero 1, que estudi 21 horas para su
examen y obtuvo una calificacin de 80 puntos. El punto que se encuentra
ms a la izquierda representa al estudiante nmero 7, que estudi solo 6
horas y obtuvo una nota de 50.
90
80
Calificacin examen (Y)
70
60
50
40
30
20
10
0
0 5 10 15 20 25
Horas de estudio (X)
Ejemplo Construya el diagrama de dispersin, usando Excel y Minitab, para los datos
recopilados en el caso del investigador que analiza la relacin entre el
nmero de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadstica y la nota que cada uno de ellos obtiene en dicha
prueba.
90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25
En el grfico anterior es claro que mientras ms horas dedica a prepararse cada uno de los
estudiantes, mayor tiende a ser su calificacin, por lo que se podra decir que s hay
correlacin entre las dos variables.
Si se observa el grfico siguiente resulta evidente que las dos variables x y y representadas
prcticamente no se correlacionan, pues no se muestra que sistemticamente haya algn tipo
de variacin en la variable x que se asocie con su correspondiente variacin en la variable y.
Ahora bien, muchas veces se observa que los puntos en el diagrama de dispersin se acercan a
una lnea recta, tal como se muestra en la grfica siguiente. En estos casos puede decirse que
existe correlacin lineal.
90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25
La correlacin lineal puede medirse a travs del coeficiente de correlacin lineal de Pearson,
denotado por r.
Los siguientes intervalos pueden ser empleados para definir el grado de intensidad de la
relacin, aunque no existe un criterio nico para determinar a partir de cul valor la relacin
es fuerte o dbil:
X X
X X
X
X
X X
La siguiente figura resume los conceptos expuestos anteriormente sobre la interpretacin del
coeficiente de correlacin lineal de Pearson r:
cada uno de los valores de X, y Y2 es la sumatoria de los cuadrados de cada uno de los
valores de Y.
X Y XY X2 Y2
1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50
Total
X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total
X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total 108 480 6870 1620 30000
X Y XY X2 Y2
N XY ( X )( Y )
r
( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )
r = 0,885
=COEF.DE.CORREL(matriz1;matriz2)
=COEF.DE.CORREL(A2:A9;B2:B9)
40
N
35
30
Rendimiento (%)
25
20
15 M
10
5
0
0 1 2 3 4 5 6 7 8
Tiempo
Es importante indicar que algunas investigaciones son de nivel correlacional, y por tanto solo
buscan establecer la existencia de correlacin entre las variables de estudio. Pero otras
investigaciones son de nivel explicativo, y por tanto buscan determinar no solo correlacin,
sino la existencia de relaciones causa efecto. Cuando se trata de establecer causalidad entre
las variables resulta importante emplear algunos criterios que permitan diferencias aquellas
1. La asociacin entre X y Y debe ser fuerte. Esto es que haya un coeficiente de correlacin
alto entre las variables X y Y.
2. La asociacin entre X y Y debe ser consistente y replicable. La relacin entre las variables
debe poder constatarse en diferentes pocas y lugares.
3. Mayores dosis de X deben producir mayor efecto en Y. Mayores cambios en la variable
X debera asociarse sistemticamente con cambios mayores (positivos o negativos) en la
variable Y.
4. Relacin temporal, es decir, la causa X debe preceder en el tiempo al efecto Y.
5. Coherencia o plausibilidad terica o biolgica. La relacin entre las variables debe poder
sustentarse en la teora disponible.
6. Especificidad. Los cambios en una variable deben provocar cambios especficos en la otra
variable.
Diversos autores han planteado otros criterios para establecer relaciones causales, sin
embargo los 6 anteriores son algunos de los ms utilizados por los investigadores.
Cabe sealar que en este captulo solo se expone la regresin lineal simple, es decir, la
variable Y en trminos de solo una variable independiente X, pero es posible expresar a Y en
trminos de varias variables independientes. En ese caso se habla de regresin mltiple.
Adems, la relacin entre Y y X podra ser cuadrtica, cbica u otras formas matemticas, en
cuyo caso se hablara de regresin no lineal.
Para el caso de la regresin lineal simple, la ecuacin de regresin es la ecuacin de una lnea
recta tiene una forma algebraica dada por la expresin:
y = a + bx
Ecuacin de la recta: Y = a + bX
b = Pendiente de la recta
Interseccin
con el eje Y a
X
Ejemplo Para el caso del investigador que desea analizar la relacin entre el nmero
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadstica y la nota que cada uno de ellos obtiene en dicha prueba.
Cul sera el modelo que se podra plantear?
Solucin En este caso el investigador analiza la relacin entre las dos variables
mencionadas, nmero de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadstica (variable x) y la nota que cada
uno de ellos obtiene en dicha prueba (variable y).
y = a + bx
(Y Y )
i 1
i i
2
y as obtener la recta que mejor se ajusta a los pares (x, y) dados. Los coeficientes de la
ecuacin de la recta a y b se obtienen por las frmulas siguientes:
Ejemplo Construya el modelo de regresin lineal para los datos recopilados en el caso
del investigador que analiza la relacin entre el nmero de horas que un
grupo de estudiantes dedica a prepararse para un examen de estadstica y la
nota que cada uno de ellos obtiene en dicha prueba.
X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total 108 480 6870 1620 30000
X Y XY X2 Y2
N XY ( X )( Y )
b
N X 2 ( X ) 2
b = 2,41
a
Y b X
N N
480 108
a 2,41
8 8
a = 27,5
y = 27,5 + 2,41x
Ejemplo Construya, usando Excel y Minitab, el modelo de regresin lineal para los
datos recopilados en el caso del investigador que analiza la relacin entre el
nmero de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadstica y la nota que cada uno de ellos obtiene en dicha
prueba.
=INTERSECCION.EJE(conocido_y;conocido_x)
=INTERSECCION.EJE(B2:B9;A2:A9)
=PENDIENTE(conocido_y;conocido_x)
=PENDIENTE(B2:B9;A2:A9)
Aplicacin Econometra
Muchas veces vemos en los medios de comunicacin noticias que hablan
de diversas proyecciones econmicas. Se ha preguntado usted cmo se
realizan esas proyecciones? Los economistas se basan en la teora
econmica, pero para poder aplicarla se requieren datos sobre las variables
que esa teora abarca. Por ejemplo, se desea conocer cules factores
influyen sobre el consumo de bienes y servicios del pas. La teora indica
que el ingreso disponible puede ser un factor determinante y que la
relacin entre ambas variables se puede describir a travs de una funcin
lineal. Entonces se rene informacin sobre ambas variables y se emplea la
regresin lineal para determinar si efectivamente se presenta el
comportamiento esperado.
Mientras ms cercano a uno sea este coeficiente indica un mejor ajuste de la recta. Es por eso,
que tambin se puede interpretar este coeficiente como la proporcin de la variabilidad
explicada por el modelo.
Ejemplo Para el caso del investigador que desea analizar la relacin entre el nmero
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadstica y la nota que cada uno de ellos obtiene en dicha prueba, y
R2 = r2 = (0,885)2 = 0,7832
Interpolacin y extrapolacin
La ecuacin de regresin se puede emplear para obtener valores de Y correspondientes a
nuevos valores de X que no fueron observados en la muestra. Cuando se obtienen esos nuevos
valores de Y se dice que se est interpolando o extrapolando. La interpolacin es cuando, para
calcular el nuevo valor de Y, se toma un valor de X que se encuentra en el rango de valores de
X observados. La extrapolacin es cuando, para calcular el nuevo valor de Y, se toma un valor
de X que no se encuentra en el rango de valores de X observados.
Ejemplo Para el caso del investigador que desea analizar la relacin entre el nmero
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadstica y la nota que cada uno de ellos obtiene en dicha prueba, en el
cual se haba obtenido el modelo y = 27,5 + 2,41x, donde y es la nota en el
examen, y x es el nmero de horas de preparacin para la prueba:
y = 27,5 + 2,41x
y = 27,5 + 2,41 * 13
y = 58,83
y = 27,5 + 2,41x
y = 27,5 + 2,41 * 25
y = 87,75
Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).
2. Un equipo de investigadores est realizando un estudio entre la poblacin adulta mayor del
pas. En el Hogar de Ancianos La Florida, que solo posee 12 ancianos actualmente, se ha
recopilado la siguiente informacin:
Tomando como base la informacin anterior se desea relacionar la presin arterial con la
edad:
a. Construya el diagrama de dispersin que muestre la relacin entre las dos variables.
b. Calcule el coeficiente de correlacin lineal de Pearson.
c. Interprete el resultado del coeficiente de correlacin lineal de Pearson.
d. Determine la ecuacin de regresin que permita predecir el nivel de presin arterial
segn la edad del anciano.
e. Si uno de estos ancianos tiene una edad de 85 aos, cul sera su nivel esperado de
presin sangunea?
f. Calcule el coeficiente de determinacin.
g. Interprete el coeficiente de determinacin.
satisfaccin del paciente. Los siguientes datos corresponden a una muestra de 10 pacientes. La
satisfaccin se mide a travs de un cuestionario en una escala de 0 a 20 puntos y el tiempo de
espera est medido en minutos.
Paciente 1 2 3 4 5 6 7 8 9 10
Satisfaccin 11 12 5 8 15 16 18 12 15 14
Tiempo espera 30 45 60 55 20 25 30 40 20 25
4. En una muestra de 12 personas con miopa elevada superior a 12,00 D se midieron algunos
parmetros biomtricos de sus ojos, como la longitud axial y el equivalente esfrico. Los
resultados fueron los siguientes:
5. Con base en estos datos se desea determinar qu tanta relacin existe entre la longitud axial
y el grado de miopa de estos pacientes. Para esto efecte lo siguiente:
a. Construya el diagrama de dispersin y observe qu tipo de correlacin se presenta
entre las dos variables.
b. Calcule e interprete el coeficiente de correlacin lineal entre la longitud axial y el
equivalente esfrico.
c. Calcule la ecuacin de regresin entre la longitud axial y el equivalente esfrico.
d. Calcule e interprete el coeficiente de determinacin.
%HRR 50 55 60 65 70 75 90 45 80 75 85 45
%VO2max. 55 50 65 75 75 60 95 40 90 80 80 50
7. Los siguientes datos muestran el rea construida de una muestra de 8 viviendas nuevas en
la ciudad capital y su respectivo precio. El rea se expresa en metros cuadrados y el precio en
miles de dlares.
Vivienda 1 2 3 4 5 6 7 8
rea construida 180 250 100 120 75 150 300 210
Precio 200 350 90 145 80 120 300 250
8. Los siguientes datos muestran el nmero de artculos defectuosos por da obtenidos en una
fbrica en una muestra de 8 das y el nmero de horas extra laboradas ese da en la fbrica.
Da 1 2 3 4 5 6 7 8
Unidades defectuosas 5 12 8 2 16 24 13 4
Horas extra 6 20 16 6 25 30 20 10
9. Los siguientes datos muestran el presupuesto destinado a seguridad informtica (en miles
de dlares) en una muestra de 8 bancos y el nmero de empleados de la empresa (en miles).
Banco 1 2 3 4 5 6 7 8
Presupuesto 100 145 80 180 125 130 75 240
Nmero de empleados 3,5 7,0 2,4 12,1 6,2 5,7 4,8 10,6
10. Los siguientes datos muestran el nmero de mensajes mensuales enviados por los usuarios
de telfonos celulares en una muestra de 8 personas y edad del usuario del telfono.
Usuario 1 2 3 4 5 6 7 8
Nmero de mensajes 342 249 128 61 12 37 98 166
Edad 15 23 34 48 62 40 29 19
11. La tabla presenta los reportes de ventas anuales y los aos de experiencia de 10
vendedores de una prestigiosa empresa.
Aos experiencia 1 3 4 4 6 8 10 10 11 13
Ventas (miles $/ao) 80 97 92 102 103 111 119 123 117 136
a. Establezca e interprete la ecuacin de regresin que permita predecir las ventas con
base en la experiencia del vendedor.
b. En qu proporcin este modelo explica las variaciones en las ventas?
c. Estime las ventas de un vendedor con 7,5 aos de experiencia.
d. Cuntos aos de experiencia se esperara que tenga un vendedor que logre vender
$100.000?
12. Un banco que se especializa en crditos para la vivienda intenta analizar el mercado,
midiendo el poder explicativo que las tasas de inters tienen sobre el nmero de casas
vendidas en el rea. Se compilaron los datos para un perodo de seis aos:
Semestre 1 2 3 4 5 6 7 8 9 10
Inters 12,3 10,5 15,6 9,5 10,5 9,3 8,7 14,2 15,2 12,0
Casas 196 285 125 225 248 303 265 102 105 114
( 1 ) Por cada ao de experiencia se espera que sus ventas aumenten en $2 mil al mes.
( 2 ) Si tuviera cero experiencia, se esperara que venda $0,3 mil.
15. Un contador est analizando el comportamiento de los costos de produccin con respecto
al volumen total producido. Ha reunido informacin para varios periodos segn la tabla
siguiente:
16. Usted ha logrado obtener la siguiente informacin relacionada con el nivel medio de
ingreso de los consumidores, la cantidad demandada de un cierto producto y las tasas de
inters.
a. Qu tanta relacin lineal existe entre las variables demanda y tasas de inters?
Conteste en trminos del coeficiente de correlacin lineal. Interprete claramente los
resultados. Trace el diagrama de dispersin.
b. Determinar una ecuacin lineal para poder estimar la cantidad demandada del
artculo en funcin del ingreso del consumidor. Interprete los componentes de la
ecuacin de regresin. Trace la recta de la ecuacin calculada.
c. Qu tan bien se ajustan los datos obtenidos a la ecuacin obtenida en el inciso b?
d. Con base en la ecuacin del inciso b, si se espera que para el 2011 el nivel de
ingreso sea de 1575 mil por consumidor, Cul sera la cantidad demandada segn
este modelo?
d. A qu nivel tendra que aumentar el ingreso para poder vender 130.000 unidades
en el 2011?
e. Obtenga una ecuacin de regresin que permita predecir la tendencia de la cantidad
demandada del producto (o sea, solo en funcin del tiempo). Qu puede decirse de la
calidad de los pronsticos elaborados con base en esa ecuacin?
17. Un analista considera que la demanda de los diferentes tipos de seguros (de vida,
automviles, etc.) se relaciona con el producto interno bruto (PIB) del pas. Para comprobar
su hiptesis reuni datos de ambas variables para varios aos (PIB en miles de millones de
dlares y ventas de seguros en millones de dlares):
Ao 1 2 3 4 5 6 7 8 9
PIB 1438 1575 1642 1739 1891 2041 2097 2076 2176
Ventas 1238 1382 1512 1680 1705 1914 1945 1965 2010
18. Se ha establecido que la relacin entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), est dada por Y = 4,3 + 1,5X,
entonces:
Nio 1 2 3 4 5 6 7 8 9
Prueba 1 60 53 47 29 38 45 56 49 42
Prueba 2 110 85 88 66 60 67 72 78 76
Determine qu tanta correlacin hay entre los resultados de las dos pruebas. Calcule para ello
el coeficiente de correlacin de Pearson e interprete su resultado.
20. Los siguientes datos muestran el nmero promedio semanal de horas de uso internet de
estudiantes de secundaria para hacer trabajos acadmicos en una muestra de 8 estudiantes y
edad del estudiante.
Estudiante 1 2 3 4 5 6 7 8
Horas de uso 2,0 2,5 4 3,5 1,0 4,0 5,0 4,5
Edad 13 15 17 16 14 12 13 15
a. Qu tanta relacin lineal existe entre las variables ingreso y aos de educacin
formal del jefe del hogar? Se puede afirmar que existe una alta correlacin entre las
variables o no? Qu tipo de relacin se da entre las variables? Trace el diagrama de
dispersin.
b. Una ecuacin para poder estimar la el nmero de hijos del hogar en funcin de su
ingreso.
c. Qu tan bien se ajustan los datos obtenidos a la ecuacin obtenida en el inciso b?
d. Si se analiza una familia cuyo ingreso es de $630, cuntos hijos se esperara que
tuviera segn este modelo?
e. Comente sobre la relacin existente entre el nivel de ingreso y la cantidad de hijos
habidos en el hogar. Qu otras variables influyen y que pueden afectar la validez del
modelo? Explique por qu.
22. Una persona considera que mientras ms aos se estudia, mayor ser el cociente
intelectual. Para probar esta relacin se toma una muestra de 12 personas, que han estudiado
las siguientes cantidades de aos (aos de estudios formales): 11, 9, 8, 15, 18, 10, 14, 16, 20,
5, 17, 16. Estas mismas personas realizaron un test para medir su cociente intelectual (los
resultados corresponden al mismo orden anterior): 102, 100, 97, 101, 110, 113, 116, 96, 115,
106, 99, 104. Con base en estos datos:
23. Se ha establecido que la relacin entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), est dada por Y = 4,3 + 1,5X,
entonces:
24. Los siguientes datos muestran el volumen mensual de ventas de una compaa (en
millones de dlares) en una muestra de 9 meses. Cada mes la empresa mide la exposicin de
los consumidores a los comerciales pautados por medio de una encuesta y determina el
porcentaje de ellos que indican recordar los anuncios de la compaa.
Mes 1 2 3 4 5 6 7 8 9
Ventas 18 19 23 32 27 22 19 26 30
Exposicin 40 42 45 46 43 45 38 40 42
25. El gobierno del pas est preocupado por las crticas que las personas realizan a travs de
las redes sociales en Internet, por lo que decide tratar de contrarrestarlas publicando en esos
mismos medios informacin relacionada con sus actividades y logros. Cada tres meses se
realiza una encuesta en la que se evala la imagen del gobierno. La tabla muestra el nmero
de publicaciones realizadas a su favor por el gobierno en las redes sociales en cada trimestre
(X) y la opinin de los ciudadanos sobre su gestin (Y, medida como porcentaje de opiniones
favorables en la encuesta al final de cada trimestre):
Trimestre 1 2 3 4 5 6 7 8 9 10
X 12 18 36 42 77 112 130 100 92 150
Y 29 36 40 42 40 46 38 35 31 24
2. Con relacin a la determinacin del grado de asociacin estadstica entre dos variables, un
investigador efectu las siguientes dos afirmaciones:
3. Con relacin a la determinacin del grado de asociacin estadstica entre dos variables, un
investigador efectu las siguientes dos afirmaciones:
A. Una fuerte relacin entre dos variables implica que exista causalidad.
B. Una fuerte relacin entre dos variables es condicin necesaria de la existencia de
causalidad entre ellas.
4. Con relacin a la determinacin del grado de asociacin estadstica entre dos variables, un
investigador efectu las siguientes dos afirmaciones:
5. Con relacin a la determinacin de la causalidad entre dos variables, sera falso que la
variable x causa a la variable y, si:
(a) El coeficiente de correlacin entre x y y es cercano a 1.
(b) Las variaciones en x en un periodo podran asociarse con las variaciones de y en el periodo
siguiente.
(c) Cambios de mayor magnitud en x no se asocian con cambios mayores en y.
(d) Existe teora que respalda la relacin causal entre x y y.
X 2
16. Si se correlacionan las tasas de inters de los prstamos con la cantidad de viviendas
vendidas por periodo, entonces se esperara que el coeficiente de correlacin entre estas dos
variables sea:
(a) Cercano a cero.
(b) Positivo y cercano a uno.
(c) Negativo.
(d) Ninguna de las anteriores.
18. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76
19. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el nmero de casos de neumona que se presentaron en un determinado
periodo:
X 86 88 93 91 90 87 88 90
Y 11 9 15 17 10 13 16 17
20. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el nmero de casos de neumona que se presentaron en un determinado
periodo:
Humedad relativa 86 88 93 91 90 87 88 90
Casos de neumona 11 9 15 17 10 13 16 17
21. Al observar la grfica, donde la lnea corresponde a la recta de regresin obtenida por el
mtodo de mnimos cuadrados, podra afirmarse que es falso que:
100
Y
90
80
70
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16
22. Al observar la grfica, donde la lnea corresponde a la recta de regresin obtenida por el
mtodo de mnimos cuadrados, la variable x es el nmero semanal de unidades producidas en
una fbrica y la variable y corresponde a los costos totales de produccin, entonces es falso
que:
100
Y
90
80
70
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16
24. Se ha establecido que la relacin entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), est dada por Y = 4,3 + 1,5X, entonces
es verdadero que:
(a) Si la empresa no gasta en publicidad, entonces sus ventas seran de $1,5 millones.
(b) Si la empresa gasta $1 milln ms en publicidad, se esperara que sus ventas aumenten en
$4,3 millones.
(c) El coeficiente de correlacin lineal entre el gasto en publicidad y las ventas de la empresa
es positivo.
(d) Ninguna de las anteriores.
25. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el nmero de casos de neumona que se presentaron en un determinado
periodo:
Humedad relativa 86 88 93 91 90 87 88 90
Casos de neumona 11 9 15 17 10 13 16 17
26. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76
29. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76
30. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 14 18 11 20 23 14 17 19 15 16
Y 65 72 60 75 80 63 70 74 66 64
Otros temas .
Los siguientes temas slo se encuentran desarrollados en la pgina de internet de este texto:
Regresin mltiple
Nmeros ndice
Apndice .
Tablas y frmulas
Medidas de posicin:
Datos sin agrupar Datos agrupados
Media aritmtica: Media aritmtica:
n
x i k
x i 1
x i fi
n x i 1
n
Media aritmtica ponderada:
a. Caso de valores repetidos:
k Mediana:
x i fi
x i 1
n
n Fi 1
b. Caso de valores con diferente importancia: Med Li c 2
fi
k
x w i i
x i 1
k Moda:
wi
i 1
d1
Media geomtrica: M o Li c
d1 d 2
Mg n x1 x2 ... xn
Moda: Percentiles:
Valor que se repite ms veces
Mediana:
m
PMed
N 1 100 n Fi 1
2 Pm Li c
fi
Percentiles:
Pm 100
m
n 1
Medidas de variabilidad
Datos sin agrupar Datos agrupados
Varianza: Varianza:
Poblacin Poblacin
N
(x i )2 N
2 i 1
(x i )2 fi
N 2 i 1
N
Muestra
n Muestra
(x i x )2
s2 i 1 n
n 1 (x i x )2 fi
s2 i 1
Desviacin estndar: n 1
Poblacin
Frmula alternativa para calcular la varianza:
N
(x )2 n
2
xi f i
i
i 1
2
xi f i i 1
n
N
2
n
s 2 i 1
Muestra n 1
n Desviacin estndar:
(x i x) 2
Poblacin
s i 1
s2
n 1 2
Frmula alternativa para calcular la Muestra
desviacin estndar:
2
n s s2
xi
i 1
n
x
2
i
n
s i 1
Coeficiente de variacin:
n 1
Poblacin:
Coeficiente de variacin:
Poblacin: CV 100
CV 100
Muestra:
Muestra:
s
s CV 100
CV 100 x
x
n! = n (n1) (n2) 2 1 0 P( A) 1
Permutaciones: P( E C ) 1 P( E )
n!
P(n, r )
(n r ) ! P( AB )
P( B / A)
P( A)
Combinaciones:
Reglas de adicin de probabilidad:
n!
C (n, r )
r ! (n r ) ! P( A B) P( A) P( B)
n!
n1 ! n2 !... nk ! Reglas de multiplicacin de probabilidad:
P( AB) P( A) P( B)
Definicin clsica de probabilidad:
a P( AB) P( A) P( B / A)
P( A)
N
Teorema de Bayes:
Frecuencia relativa como probabilidad:
P( A) P( Bi ) P( A / Bi )
F ( A)
P( A) Fr ( A)
N
P( B) P( A / B)
P( B / A)
P( B) P( A / B) P( B ) P( A / B )
E ( X ) xi P ( x i ) 2 ( xi E ( X )) 2 P( xi )
Distribuciones discretas:
Distribucin binomial: Distribucin hipergeomtrica:
P( X / n, p) C (n, x) p x q n x N a a
n X X
n! P ( X / N , a, n)
p x q n x N
x !( n x ) !
n
= np
Distribucin geomtrica:
g ( x, p) p(1 p) x1
npq
x e f ( x1 , x2 ,..., xk )
n! x x x
P( X / ) p1 1 p 2 2 ... p k k
X! x1 ! x2 ! ... xk !
Distribuciones continuas:
Distribucin exponencial: Distribucin normal:
P 1 e x
z
Pe
Aproximacin de la binomial por la normal:
1
E ( x) x x np
z
1 npq
V ( x)
2
= np
2 = npq
N n
Error estndar x x
n n N 1
Z / 2
2
Tamao de muestra en
poblaciones infinitas n n = P(1 - P) (Z / E)2
E
n
Tamao de muestra en n0
n
poblaciones finitas 1
N
Prueba de hiptesis para la x x
media con n 30 o zc zc
conocida / n s/ n
Prueba de hiptesis para la x
media con n < 30 y tc
desconocida s/ n
x nP
Prueba de hiptesis para una z
proporcin nPQ
( x1 x2 )
Prueba de hiptesis para la z
diferencia de dos medias con 12 22
n 30 o conocida
n1 n2
( x1 x2 )
Prueba de hiptesis para la t (n1 1) s12 (n2 1) s22
diferencia de dos medias con 2 2 2
n < 30 y desconocida n1 n2 2
n1 n2
Prueba de hiptesis para la xd
diferencia de dos medias con t
datos pareados sd n
p1 p2
z x1 x 2
Prueba de hiptesis para la p
1 1
diferencia de dos proporciones pq n1 n2
n1 n2
N XY ( X )( Y )
r
( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )
a
Y b X
N N
a Y bX
N XY ( X )( Y )
b
N X 2 ( X ) 2
Coeficiente de determinacin:
R2 = r2
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
Valores de alfa
gl 0,995 0,990 0,975 0,900 0,500 0,100 0,050 0,025 0,010 0,005
1 0,00 0,00 0,00 0,02 0,45 2,71 3,84 5,02 6,63 7,88
2 0,01 0,02 0,05 0,21 1,39 4,61 5,99 7,38 9,21 10,60
3 0,07 0,11 0,22 0,58 2,37 6,25 7,81 9,35 11,34 12,84
4 0,21 0,30 0,48 1,06 3,36 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,61 4,35 9,24 11,07 12,83 15,09 16,75
6 0,68 0,87 1,24 2,20 5,35 10,64 12,59 14,45 16,81 18,55
7 0,99 1,24 1,69 2,83 6,35 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 3,49 7,34 13,36 15,51 17,53 20,09 21,95
9 1,73 2,09 2,70 4,17 8,34 14,68 16,92 19,02 21,67 23,59
10 2,16 2,56 3,25 4,87 9,34 15,99 18,31 20,48 23,21 25,19
11 2,60 3,05 3,82 5,58 10,34 17,28 19,68 21,92 24,72 26,76
12 3,07 3,57 4,40 6,30 11,34 18,55 21,03 23,34 26,22 28,30
13 3,57 4,11 5,01 7,04 12,34 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 7,79 13,34 21,06 23,68 26,12 29,14 31,32
15 4,60 5,23 6,26 8,55 14,34 22,31 25,00 27,49 30,58 32,80
16 5,14 5,81 6,91 9,31 15,34 23,54 26,30 28,85 32,00 34,27
17 5,70 6,41 7,56 10,09 16,34 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 10,86 17,34 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 11,65 18,34 27,20 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 12,44 19,34 28,41 31,41 34,17 37,57 40,00
21 8,03 8,90 10,28 13,24 20,34 29,62 32,67 35,48 38,93 41,40
22 8,64 9,54 10,98 14,04 21,34 30,81 33,92 36,78 40,29 42,80
23 9,26 10,20 11,69 14,85 22,34 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,40 15,66 23,34 33,20 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 16,47 24,34 34,38 37,65 40,65 44,31 46,93
26 11,16 12,20 13,84 17,29 25,34 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 18,11 26,34 36,74 40,11 43,19 46,96 49,64
28 12,46 13,56 15,31 18,94 27,34 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 19,77 28,34 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 20,60 29,34 40,26 43,77 46,98 50,89 53,67
gl (numerador)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 161,4 199,5 215,7 224,6 230,2 234 236,8 238,9 240,5 241,9 243 243,9 244,7 245,4 245,9
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,42 19,43
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,73 8,71 8,70
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,89 5,87 5,86
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,66 4,64 4,62
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,98 3,96 3,94
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,55 3,53 3,51
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,26 3,24 3,22
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,05 3,03 3,01
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,89 2,86 2,85
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,76 2,74 2,72
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,66 2,64 2,62
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,58 2,55 2,53
gl (denominador)
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,51 2,48 2,46
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,45 2,42 2,40
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,40 2,37 2,35
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,35 2,33 2,31
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,31 2,29 2,27
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,28 2,26 2,23
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,25 2,22 2,20
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,22 2,20 2,18
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,20 2,17 2,15
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,18 2,15 2,13
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,15 2,13 2,11
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,14 2,11 2,09
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,12 2,09 2,07
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,10 2,08 2,06
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,09 2,06 2,04
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,08 2,05 2,03
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,06 2,04 2,01
INDICE:
Distribucin geomtrica, 239
Distribucin hipergeomtrica, 223
A Distribucin muestral, 296
Anlisis de varianza, ANOVA, 488 Distribucin multinomial, 237
Aproximacin de la distribucin de Poisson a la binomial, Distribucin normal, 259
235 Distribucin normal estndar, 260
Aproximacin de la distribucin normal a la binomial, Distribucin t, 301, 310, 382
276 Distribuciones continuas de probabilidad, 259
Asimetra, 93 Distribuciones de probabilidad, 210
Distribuciones discretas de probabilidad, 215
B
E
Bondad de ajuste, 466
Ecuacin de regresin, 459
Entrevista personal, 26
C Entrevista telefnica, 26
Clculo del tamao de la muestra, 337, 344 Error de estimacin, 303
Campana de Gauss, 260 Error de muestreo, 20, 334
Caractersticas, 16 Error estndar, 299
Causalidad, 458 Error tipo I, 376
Error tipo II, 376
Escala de intervalo, 31
Ch Escala de razn, 31
Chi-cuadrado, 488 Escala nominal, 29
Escala ordinal, 30
Escalas de medida, 29
C Espacio muestral, 178
Coeficiente de correlacin de Spearman, 488 Esperanza matemtica, 212
Coeficiente de correlacin lineal de Pearson, 450 Estadstica, 12
Coeficiente de determinacin, 466 Estadstica descriptiva, 12
Coeficiente Q, 488 Estimador, 333
Coeficientes de la ecuacin de la recta, 461 Evento complementario, 191
Combinaciones, 183 Eventos, 178
Confiabilidad, 27 Eventos dependientes, 194
Confianza, 303 Eventos excluyentes, 188
Conglomerados, 355 Eventos independientes, 193, 194
Constante de espaciamiento, 350 Eventos mutuamente excluyentes, 188
Conteo, 179 Eventos no excluyentes, 188
Correccin por continuidad, 277 Experimento estadstico, 210
Correlacin, 445 Extrapolacin, 467
Correlacin en variables cualitativas, 488
Correlacin espuria, 458 F
Correlacin lineal, 444
Correo, 26 Factor de correccin, 299, 339, 345
Criterios de causalidad, 459 Factorial, 180
Cuadros estadsticos, 46 Frmula de Sturges, 150
Cuantilos, 97 Fuentes de informacin, 24
Cuartiles, 97, 164 Fuentes primarias, 25
Cuestionario, 28 Fuentes secundarias, 25
Funciones de la estadstica, 14
D
G
Deciles, 98
Desviacin cuartil, 111 Grados de libertad, 312
Desviacin estndar, 116, 166 Grfica de caja, 106
Diagrama de dispersin, 66, 445 Grficas lineales, 62
Dispersin, 114 Grfico circular, 60
Distribucin binomial, 215 Grfico de barra 100 %, 56
Distribucin de frecuencias, 149 Grfico de barras comparativas, 54
Distribucin de Poisson, 230 Grfico de barras compuestas, 57
Distribucin exponencial, 280 Grfico de barras de doble direccin, 59
T V
Tabla de nmeros aleatorios, 347 Validez, 27
Tamao de la muestra, 336 Valor esperado, 212
Tcnicas de muestreo, 346 Valor P, 385
Teorema de Bayes, 195 Valores atpicos o extremos, 110
Teorema de Chebyshev, 311 Variabilidad, 114
Teorema de Chebyshev, 123 Variabilidad relativa, 126
Teorema del lmite central, 300 Variable continua, 16
Tercer cuartil, 98 Variable discreta, 16
Test, 26 Variables, 16
Variables aleatorias, 210
Variables aleatorias continuas, 210
U Variables aleatorias discretas, 210
Unidad de informacin, 332 Variables cualitativas, 16
Unidad de muestreo, 332 Variables cuantitativas, 16
Unidad estadstica, 15, 330 Varianza, 116, 166, 212
Unidades primarias, 355