Vous êtes sur la page 1sur 249

1 Estadística Descriptiva 201901

MA460
Estadística Descriptiva

α
β Π
l


Cuaderno de trabajo
Los profesores del curso

Área de Ciencias - Marzo 2019


2 Estadística Descriptiva 201901

RNotas importantes
Unidad 1. Muestreo 3

Contenido

Razonamiento cuantitativo ......................................................................................................... 6


Muestreo ......................................................................................................................... 7
Definición de Estadística ............................................................................................................. 8
Definiciones ................................................................................................................................ 9
Unidad elemental, variables datos y observación .......................................................................................... 9
Población y muestra ..................................................................................................................................... 10
Escalas de medición de las variables ............................................................................................................ 12
Tipos de variables según su naturaleza ........................................................................................................ 14
Parámetro ..................................................................................................................................................... 15
Estadístico..................................................................................................................................................... 15
Estudios estadísticos..................................................................................................................................... 18
Errores en la adquisición de datos................................................................................................................ 18
Fuentes de datos .......................................................................................................................................... 19
Ventajas y desventajas del muestreo frente al censo .................................................................................. 20
Muestreo probabilístico ............................................................................................................ 21
Muestreo aleatorio simple ........................................................................................................ 22
Muestreo sistemático................................................................................................................ 26
Muestreo estratificado .............................................................................................................. 31
Unidad 2. Organización de datos ................................................................................................... 38
Estadística descriptiva ............................................................................................................... 39
Frecuencias absolutas, relativas y porcentuales .......................................................................................... 39
Distribución de frecuencias .......................................................................................................................... 39
Título de una distribución de frecuencias o gráfico de una variable ............................................................ 39
Distribución de frecuencias de variables cualitativas ................................................................. 40
Gráficos estadísticos.................................................................................................................. 41
Recomendaciones sobre la presentación de gráficos................................................................................... 41
Gráfico de barras .......................................................................................................................................... 42
Diagrama circular.......................................................................................................................................... 42
Frecuencias acumuladas, absolutas relativas y porcentuales ...................................................................... 44
Diagrama de Pareto ...................................................................................................................................... 44
Tabulaciones cruzadas............................................................................................................... 47
Título de un gráfico de una tabla de contingencia ....................................................................................... 48
Gráfico de tabulaciones cruzadas de dos variables ...................................................................................... 48
Resumen de datos cuantitativos................................................................................................ 52
Distribución de frecuencias de variables discretas ....................................................................................... 52
Gráfico de bastones ...................................................................................................................................... 52
Distribución de frecuencias de variables continuas ..................................................................................... 54
Gráficos de datos cuantitativos ................................................................................................. 57
Ejercicios de la Unidad 2 ............................................................................................................................... 62

RNotas importantes
4 Estadística Descriptiva 201901
Unidad 3. Medidas descriptivas .................................................................................................... 68
Datos simples y datos agrupados ................................................................................................................. 69
Medidas de tendencia central ................................................................................................... 69
Media............................................................................................................................................................ 70
Mediana ........................................................................................................................................................ 75
Moda ............................................................................................................................................................ 78
Media ponderada ......................................................................................................................................... 80
Cuantiles ................................................................................................................................... 81
Cuartiles ........................................................................................................................................................ 81
Quintiles ....................................................................................................................................................... 81
Deciles .......................................................................................................................................................... 81
Percentiles .................................................................................................................................................... 81
Percentil........................................................................................................................................................ 82
Medidas de variabilidad ............................................................................................................ 86
Varianza ........................................................................................................................................................ 86
Desviación estándar ..................................................................................................................................... 86
Coeficiente de variación ............................................................................................................................... 89
Rango ............................................................................................................................................................ 91
Rango intercuartil ......................................................................................................................................... 92
Medidas de asimetría ................................................................................................................ 92
Coeficiente de asimetría de Pearson ............................................................................................................ 92
Diagrama de cajas ..................................................................................................................... 94
Ejercicios de la Unidad 3 ............................................................................................................................. 100
Unidad 4. Teoría de la probabilidad ............................................................................................ 107
Experimentos, reglas de conteo y asignación de probabilidades .............................................. 108
Experimento aleatorio ................................................................................................................................ 108
Espacio muestral......................................................................................................................................... 108
Evento ......................................................................................................................................................... 108
Probabilidad de un evento ......................................................................................................................... 108
Definición clásica de la probabilidad de un evento .................................................................................... 109
Algunas relaciones básicas de probabilidad ............................................................................................... 110
Complemento (AC) ...................................................................................................................................... 110
Unión de eventos (A È B) ........................................................................................................................... 110
Intersección de eventos (A ∩ B) ................................................................................................................. 111
Diferencia de eventos (A - B) ...................................................................................................................... 111
Diferencia simétrica de eventos (A ∆ B) ..................................................................................................... 111
Eventos mutuamente excluyentes ............................................................................................................. 112
Reglas de conteo y combinaciones .......................................................................................... 113
Axiomas de la probabilidad ........................................................................................................................ 115
Ley aditiva para eventos cualesquiera........................................................................................................ 115
Probabilidad condicional ......................................................................................................... 117
Ley multiplicativa para eventos cualesquiera ............................................................................................. 122
Árbol de probabilidades ............................................................................................................................. 123
Partición del espacio muestral ................................................................................................................... 123
Teorema de la probabilidad total ............................................................................................................... 123
Teorema de Bayes ................................................................................................................... 123
Eventos independientes .......................................................................................................... 129
Ley de la multiplicación para eventos independientes .............................................................................. 129
Ejercicios de la Unidad 4 ............................................................................................................................. 131
RNotas importantes
Unidad 1. Muestreo 5
Unidad 5: Variables aleatorias..................................................................................................... 135
Variable aleatoria.................................................................................................................... 136
Rango o recorrido de una variable aleatoria .............................................................................................. 136
Tipos de variable aleatoria ......................................................................................................................... 136
Variable aleatoria discreta ...................................................................................................... 136
Distribución de probabilidad de una variable aleatoria discreta ................................................................ 136
Valor esperado de una variable aleatoria discreta ..................................................................................... 138
Valor esperado de una función de variable aleatoria discreta ................................................................... 139
Varianza de una variable aleatoria discreta................................................................................................ 140
Desviación estándar de una variable aleatoria discreta ............................................................................. 140
Distribuciones de probabilidad de variables discretas ............................................................. 145
Distribución binomial.................................................................................................................................. 145
Distribución hipergeométrica ..................................................................................................................... 149
Distribución de Poisson .............................................................................................................................. 152
Variable aleatoria continua ..................................................................................................... 156
Función de densidad de una variable aleatoria continua ........................................................................... 156
Función de distribución acumulada de probabilidad ................................................................................. 159
Valor esperado de una variable aleatoria continua.................................................................................... 162
Valor esperado de una función de variable aleatoria continua.................................................................. 162
Varianza y desviación estándar de una variable aleatoria continua........................................................... 163
Distribuciones de probabilidad de variable continua ............................................................... 164
Distribución uniforme ................................................................................................................................. 164
Distribución normal .................................................................................................................................... 168
Distribución exponencial ............................................................................................................................ 173
Ejercicios de la Unidad 5 ............................................................................................................................. 175
Unidad 6 : Distribuciones muestrales .......................................................................................... 181
Propiedad reproductiva de la normal ...................................................................................... 182
Distribución muestral de un estadístico................................................................................... 187
Distribución de la media muestral ........................................................................................... 187
Teorema central del límite ...................................................................................................... 188
Ejercicios de la Unidad 6 ............................................................................................................................. 192
Evaluaciones de ciclos anteriores ............................................................................................ 193
Tablas estadísticas .................................................................................................................. 246
Índice alfabético ...................................................................................................................... 248

RNotas importantes
6 Estadística Descriptiva 201901

Razonamiento cuantitativo
Es la capacidad para interpretar, representar, comunicar y utilizar información cuantitativa diversa en
situaciones de contexto real.
Implica calcular, razonar, emitir juicios y tomar decisiones con base en esta información cuantitativa.

Interpretación Representación Cálculo Análisis Argumentación

Dimensiones Indicación sobre lo que hará el estudiante

Identifica el problema a resolver en el contexto de la situación.

Interpretación

Representa el problema usando los datos e indica lo que va a calcular y las variables
involucradas.

Representación

Realiza los cálculos necesarios para obtener los indicadores para sustentar el análisis.

Cálculo

Analiza e interpreta los resultados de las diversas opciones que muestra el caso.

Análisis

Explica los resultados y da recomendaciones para la solución del caso.

Argumentación

RNotas importantes
Unidad 1. Muestreo 7

Muestreo
Logro de la unidad 1

Al finalizar la unidad 1,
el estudiante interpreta con rigurosidad tablas y gráficos,
a partir de datos reales dentro del ámbito de su carrera.

Temario
• Conceptos básicos
• La Estadística y sus subdivisiones.
• Definiciones de población, muestra, variables, clasificación de variables, parámetros y estadísticos.
• La investigación estadística. Metodología.
• Muestreo: Conceptos y definiciones básicas: Población, marco muestral, muestra
• Censo y muestreo ventajas y desventajas.
• Diseño de la encuesta por muestreo.
• Tipos de muestreo: No probabilístico y probabilístico (aleatorio simple, aleatorio estratificado y
sistemático)

RNotas importantes
8 Estadística Descriptiva 201901

Definición de Estadística

Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,


organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recolección Organización Presentación Análisis

Subdivisión de la Estadística
La Estadística se puede dividir en Estadística descriptiva y Estadística inferencial.

Estadística Son métodos y técnicas de recolección, caracterización, resumen y presentación que


descriptiva permiten describir apropiadamente las características de un conjunto de datos.

Comprende el uso de gráficos, tablas, diagramas y criterios para el análisis.

Estadística Son métodos y técnicas que hacen posible estimar una o más características de una
inferencial población o tomar decisiones sobre población basadas en el resultado de muestras.

Estas conclusiones no son totalmente válidas y tienen cierto margen de error.

Indique si los siguientes enunciados corresponden al uso de la Estadística descriptiva o de la Estadística


inferencial.

“La aprobación del titular del “En la segunda vuelta de las “Según el Sistema de
Parlamento, Daniel Salverry, elecciones 2016, el 50,12% de Estadística Agraria del
llegó a 28%, la menor desde los votantes lo hizo por Ministerio de Agricultura y
diciembre, según la encuesta Peruanos por el Kambio, según Riego, la media del consumo
de Pulso Perú de marzo del los resultados definitivos anual per cápita de huevos en
2019, elaborada por Datum” proporcionados por la ONPE” Lima Metropolitana será de
276 unidades en el 2019”

Descriptiva o Inferencial o Descriptiva o Inferencial o Descriptiva o Inferencial o

RNotas importantes
Unidad 1. Muestreo 9

Definiciones
Unidad elemental, variables datos y observación

Dato es el
Unidad Variables son las Observación es
resultado de
elemental es la características el conjunto de
medir una
entidad acerca de interés de las mediciones de
variable de una
de la cual se unidades una unidad
unidad
reúne los datos elementales elemental
elemental

Ejemplo 1
• A una persona (unidad elemental) se le pregunta su género y edad (variables). Ella responde (dos
datos): “Soy mujer y tengo 19 años” (observación).
• En una fábrica (unidad elemental) se pregunta su distrito, tamaño de la empresa y su rubro
(variables). Se registra (tres datos): “Jesús María, mediana empresa y metalmecánica”
(observación).

Los teens de hoy son parte de la nueva generación que se


abre paso y vive la era del Internet y los dispositivos móviles
aún con más intensidad que sus predecesores, los millenials.
Aunque denominan a esta generación Z o iGen. Es una
generación sobreexpuesta a la información, multipantallas y
los primeros en socializar a través de la tecnología. Datum
realizó una encuesta de Datum a 402 jóvenes de 13 a 19 años
en el Perú. Los adolescentes declaran navegar en Internet en
promedio 4 horas al día, por estudio o por entretenimiento. El cuestionario constó de 35 preguntas.
Fuente: http://www.datum.com.pe/new_web_files/files/pdf/GeneracionZ.pdf

Indique la unidad elemental en la investigación.

Indique la cantidad de observaciones y datos obtenidos.

RNotas importantes
10 Estadística Descriptiva 201901

Población y muestra
Población es el conjunto de todas las unidades elementales de interés en determinado estudio. Es un
conjunto de personas, objetos, conceptos, etc. de los cuales se sacan conclusiones a partir de una o
más características observables de naturaleza cualitativa o cuantitativa.
Muestra es un subconjunto de la población. Será representativa si se parece a la población de la que
proviene.

Ejemplo 2
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo. La
universidad cuenta con quince facultades y un total de 7500 alumnos, de los cuales 830 han decidido
rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra aleatoria
de 200 alumnos. Defina la población y la muestra
Solución
La población son los 830 alumnos que han decidido dar exámenes de recuperación ese ciclo. La
muestra son los 200 alumnos que han decidido dar exámenes de recuperación ese ciclo.

Popularidad de Vizcarra cae de 60% a 56% principalmente en


Lima y en la zona sur
El 83% de los peruanos considera que la reacción del Gobierno frente a los huaicos
y lluvias ha sido regular o mala, de acuerdo a la última encuesta del Instituto de
Estudios Peruanos (IEP).

Ficha técnica
Encuestadora : Instituto de Estudios Peruanos (IEP)
Número de registro : 0393-REE/JNE. Febrero 2019
Persona jurídica que contrato la encuesta : La República
Objetivo del estudio : Recoger las opiniones sobre diferentes temas políticos y sociales.
Tamaño de la población : Hombres y mujeres de 18 años a más con DNI (22'017,030)
Tamaño de la muestra: 1,260 personas distribuidas en 17 departamentos, 24 provincias y 78 distritos
https://gestion.pe

Indique la población, la muestra y la unidad elemental para esta investigación.

RNotas importantes
Unidad 1. Muestreo 11

Fuente: https://es.statista.com/
Indique la población, la muestra y la unidad elemental para esta investigación.

Capeco: El 70% de viviendas en Lima son informales y


vulnerables a un terremoto
Estas viviendas no tramitaron licencia de construcción y no
fueron supervisadas, advirtió la Cámara Peruana de la
Construcción.
Fuente: RPP

Indique la población, la muestra y la unidad elemental para esta


investigación.

RNotas importantes
12 Estadística Descriptiva 201901

Escalas de medición de las variables


Son los tipos de valores asignados a las unidades elementales para una variable definida.
La escala de medición permite determinar la cantidad de información que contienen los datos y el
análisis estadístico más apropiado.

Escalas de
medición

Nominal Ordinal Intervalo Razón

•Una variable está medida en escala nominal cuando los datos son
Nominal etiquetas que se emplean para definir un atributo del elemento.

•Una variable está medida en escala ordinal cuando los datos son
etiquetas y el orden es significativo.
•Se pueden ordenar, de tal manera que puedan expresar grados de
la característica medida.
Ordinal
•No tiene sentido medir la distancia entre los valores de la variable
ni realizar operaciones aritméticas con ellos pues no toman valores
numéricos específicos ni existe proporcionalidad entre categorías
vecinas.

•Una variable está medida en escala de intervalo si los datos tienen


propiedades de datos ordinales y el intervalo entre observaciones
se expresa en términos de una unidad fija de medida.
Intervalo •Los datos de intervalo siempre son numéricos.
•El cero es relativo, es decir, no indica la ausencia de la
característica medida.

•Una variable está medida en escala de razón si los datos tienen


todas las propiedades de los datos de intervalo y se puede realizar
cualquier operación aritmética (suma, resta, multiplicación y
Razón división) y lógica (comparación y ordenamiento).
•El cero es absoluto, es decir, indica la ausencia total de la
característica medida.

RNotas importantes
Unidad 1. Muestreo 13
Ejemplo 3
Nominal
• El género de las personas
• El estado civil de los empleados de una empresa
• Las carreras profesionales universitarias
Ordinal
• El orden de mérito de los atletas en una competición
• El grado de instrucción de los clientes de un banco
Intervalo
• Las escalas de temperatura. Las temperaturas en grados centígrados 0ºC, y 20ºC equivalen a,
en grados Fahrenheit, 32ºF, y 68ºF
Razón
• El sueldo de los empleados de una empresa
• El tiempo en terminar un examen
• El peso de un perro

Indique la escala de medición de cada variable.


Variable Nominal Ordinal Intervalo Razón

Equipo de fútbol preferido

Número de personas en un estadio

Precio de una entrada, en dólares

Edad del árbitro principal


Año en que el Perú se clasificó a un
Mundial de Fútbol
Número de goles en un partido
Posición de un equipo en la tabla de
posiciones
Número de asiento (Fila A Asiento1,
Fila A Asiento 2,…)
Temperatura en el campo en °C
Opinión respecto al partido: malo
regular, bueno, muy bueno
Color preponderante de la camiseta del
arquero
Minuto en que se mete el primer gol de
un partido
Altura sobre el nivel del mar de la
ciudad donde se juega el partido

RNotas importantes
14 Estadística Descriptiva 201901

Tipos de variables según su naturaleza


Las variables se pueden clasificar en cualitativas o cuantitativas.

Variable Variable
cualitativa cuantitativa

Es una variable que Es una variable que A su vez, la variable


puede ser expresada puede ser medida en cuantitativa se
en escala nominal u escala de intervalo o clasifica en discreta o
ordinal. de razón. continua.

Variable discreta
Tiene un número finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.

Variable continua
Tiene un número infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.

Ejemplo 4
Variables Tipo de variable Escala de medición
Marca de computadora personal que utiliza Cualitativa Nominal
Tiempo que usa la computadora por semana Cuantitativa continua Razón
Número de perros en una casa Cuantitativa discreta Razón
Número de granos de arena en una gran playa Cuantitativa discreta Razón

Indique la escala de medición y tipo de las siguientes variables.


Variable Tipo de variable Escala de medición

Número de asistentes a un concierto

Nombre de la canción con la que cierra el concierto

Precio de una entrada a un concierto

Tipo de entrada (Super VIP, VIP, General)

RNotas importantes
Unidad 1. Muestreo 15

Parámetro
Parámetro es cualquier resumen de la población.

Estadístico
Estadístico es cualquier resumen de la muestra.

Ejemplo 5
En un estudio entre alumnos de la UPC, se registró la edad de todos los alumnos de la UPC. La media
de la edad fue de 19,3 años. Además, de una muestra de aleatoria de 300 alumnos se encontró que el
12% trabaja. Indique lo siguiente.

Medida de resumen Variable Valor Parámetro o estadístico

Media Edad 19,3 años Parámetro

Porcentaje Condición de trabajo 12% Estadístico

Complete los espacios en blanco para el caso de San Isdro.

Solución
La población a estudiar es ………………….……………………………………………………………………………………………….
La muestra a seleccionar es ………………….……………………………………………………………………..…………………….
La unidad elemental es ………………….…………………………………………………….…………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
La medida de resumen calculada es ……………………………………….……………. cuyo valor es ……..……………….
Esta medida de resumen es un …………………………………….………… pues ………………….………………….……………

RNotas importantes
16 Estadística Descriptiva 201901

Ficha técnica estudio de opinión sobre drogas en población urbana peruana. Cedro. 2017
• Las unidades primarias de muestreo fueron centros poblados urbanos.
• Las unidades secundarias de muestreo fueron los conglomerados que tienen en promedio 120
viviendas particulares.
• Las unidades terciarias de muestreo fueron las viviendas particulares.
• En cada vivienda se encuestó a una persona entre 12 y 65 años seleccionada aleatoriamente.
• La muestra es de tipo probabilística, estratificada, trietápica e independiente en cada ciudad.
• Fueron seleccionadas 9,261 viviendas a nivel nacional; en ellas se seleccionó 8,618 personas entre
12 y 65 años y se encuestó a 8,352 personas.
• La tasa de respuesta total entre viviendas y personas fue del 91%.
• Los resultados tienen un nivel de confianza del 95%.

Un gráfico de dicha investigación es la siguiente.

Fuente: Encuesta sobre opinión sobre drogas en población urbana peruana. Cedro. 2017

Solución
La población a estudiar es ………………….……………………………………………………………………………………………….
La muestra a seleccionar es ………………….……………………………………………………………………..…………………….
La unidad elemental es ………………….…………………………………………………….…………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
La medida de resumen calculada es ……………………………………….……………. cuyo valor es ……..……………….
Esta medida de resumen es un ………………………………………………………………………...……………………….…………
pues ………………….……………………………………………………………………………………………………..…………….……………

RNotas importantes
Unidad 1. Muestreo 17

Los resultados del Censo Nacional de Población Penitenciaria 2016 revelan que el 60,0% de internos
logró estudiar algún año de educación secundaria y 25,2% educación primaria. Las personas privadas
de libertad han logrado estudiar algún año de educación superior (superior no universitaria 7,2% y
superior universitaria 5,2%).

Usando esta información, complete los espacios en blanco.

Solución
La población a estudiar es ………………….……………………………………………………………………………………………….
La muestra a seleccionar es ………………….……………………………………………………………………..…………………….
La unidad elemental es ………………….……………………………………………………….………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
La medida de resumen calculada es ………………………………………………………………………………………………………
…………….……………….………. cuyo valor es ……..……………….
Esta medida de resumen es un…………………………………….………… pues ………………….………………….……………

RNotas importantes
18 Estadística Descriptiva 201901

Estudios estadísticos
Los datos se obtienen mediante la realización de un estudio estadístico. A esos estudios se les clasifica
como experimentales u observacionales.
Estudio experimental
En un estudio experimental, se identifican las variables de interés, las cuales son controladas por el
investigador. Luego, se identifican otras variables que influyan en las variables de interés.

Estudio observacional
En un estudio observacional, no se trata de controlar las variables de interés, ni de influir sobre ellas,
por ejemplo, en una encuesta.

Tomado de https://es.vecteezy.com/arte-vectorial/98290-generaciones

Errores en la adquisición de datos


Un error en adquisición de datos se presenta cuando el valor obtenido de los datos no es igual al valor
real que se hubiera obtenido con un procedimiento correcto.
Se debe comprobar la consistencia interna de los datos.
También se analiza la existencia de valores demasiado grandes o demasiado pequeños, conocidos
atípicos, que son datos candidatos a posibles errores.

RNotas importantes
Unidad 1. Muestreo 19

Fuentes de datos
Los siguientes sitios web son ejemplos donde conseguir datos de fuente secundaria.

Fuentes •Los datos se obtienen por medio de encuestas y estudios


experimentales realizados con el objeto de recolectar nuevos
primarias datos.

Fuentes •Los datos se han compilado y están disponibles para el análisis


secundarias estadístico.

Fuentes públicas: bases de datos de ministerios y de oficinas gubernamentales de estadística, como


por ejemplo.
Instituto Nacional de Estadística e Informática www.inei.gob.pe
Banco Central de Reserva del Perú www.bcrp.gob.pe/
Ministerio de Salud del Perú www.minsa.gob.pe

Fuentes privadas: bases de datos de las empresas, bases de datos que se compran a empresas de
estudios de mercado, bases de datos en Internet, como por ejemplo.
Datum Perú www.datum.com.pe/
Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe/
Instituto de Opinión Pública PUCP www.pucp.edu.pe/iop/

Luego de la encuesta realizada por Felipe se tiene una base de datos. Parte de los resultados se muestra
en la siguiente tabla:

Número de viajes Precio


Pasajero Edad Género Nacionalidad Motivo de viaje Destino Queja
realizados pagado
1 20 M Peruana Negocios México DF 1 $899,00 Desinformación
2 43 M Chileno Turismo Cusco 2 $399,00 Precio
…..

¿Qué podemos hacer para resumir esta información?

RNotas importantes
20 Estadística Descriptiva 201901

Elemento
• Es el objeto sobre el cual se hace la medición. También llamada unidad
elemental.

Población muestreada
• Es la colección de todos los elementos posibles que podrían extraerse en
una muestra.

Marco muestral
• Es una lista de los elementos que están disponibles para su elección en la
etapa de muestreo.

Censo
• Es el estudio completo de todos los elementos de la población.

Parámetro
• Es un resumen de una característica de una población.

Estadístico
• Es un resumen de una característica de una muestra.

Ventajas y desventajas del muestreo frente al censo

Ventajas del muestreo


• Ahorro de dinero debido a que se consideran menos unidades para trabajar.
• Ahorro de tiempo, dado que el número de mediciones solo es de una parte representativa de la
población.
• Mayor precisión, la muestra puede ser más precisa porque reduce la magnitud de los errores no
muestrales, debido a que:
• Existe menos personal necesario para hacer las mediciones (u observaciones).
• Hay personal con mejor preparación.
• Puede variar las condiciones del estudio si se demora su ejecución.
• Conveniencia, es conveniente el uso de una muestra si el estudio ocasiona la destrucción de la
unidad estudiada.

Desventajas del muestreo


• Las estimaciones resultantes del muestreo están afectas al inevitable error de muestreo.
• La información proveniente de una muestra no proporciona información tipo inventario para cada
uno de los elementos de la población.
• Las estimaciones no pueden subdividirse para pequeños dominios de análisis, considerando que
no todos ellos pueden estar representados debidamente en la muestra.
• Requiere de personal especializado y experimentado.

RNotas importantes
Unidad 1. Muestreo 21

Muestreo probabilístico
En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas
matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y conocida
de ser seleccionados. Existen diversos métodos de muestreo probabilístico como, por ejemplo:
Muestreo aleatorio simple
Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una
población que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles
tiene la misma probabilidad de ser elegida.

Muestreo sistemático
Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la
muestra cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa
de los elementos de la población.

Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos
elementos tienen características similares. El objetivo de estratificar la población es buscar
homogeneidad entre los estratos.

RNotas importantes
22 Estadística Descriptiva 201901

Muestreo aleatorio simple


En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de
muestreo de una población que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.
Pasos a seguir para seleccionar una muestra simple aleatoria
1. Enumere las unidades del marco muestral con números sucesivos.
2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.

El muestreo aleatorio simple presenta dos propiedades:


Representativo: Cada unidad tiene las mismas posibilidades de ser escogida.
Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.


Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias
veces a los que tienen varios números.

Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente,
información acerca del ingreso mensual (en soles) y años cumplidos en la empresa de cada uno de sus
trabajadores.
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las columnas C4,
C8, C11 y C15 de la tabla de números aleatorios.
Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las columnas C11,
C6, C1 y C9 de la tabla de números aleatorios.

RNotas importantes
Unidad 1. Muestreo 23
Trabajadores registrados
Ingreso Ingreso Ingreso Años en la
Nº Años en la empresa Nº Años en la empresa Nº
(en soles) (en soles) (en soles) empresa
1 2300 5 51 2100 13 101 2400 16
2 2800 11 52 2100 9 102 1700 0
3 2400 4 53 1800 1 103 2500 12
4 2500 2 54 2000 9 104 1700 3
5 2300 3 55 2100 10 105 2400 17
6 2100 2 56 1900 4 106 2400 16
7 1700 2 57 2000 10 107 1900 7
8 2000 0 58 2300 11 108 1700 1
9 2200 7 59 2000 7 109 2100 6
10 2100 4 60 1700 1 110 2000 5
11 1700 0 61 1900 6 111 2000 3
12 2500 2 62 2000 9 112 2500 13
13 2800 13 63 2400 17 113 1700 0
14 2400 9 64 1700 0 114 2500 19
15 1700 1 65 1700 2 115 1700 3
16 2400 9 66 2400 17 116 2600 19
17 2200 10 67 2500 13 117 1600 1
18 2200 4 68 2600 16 118 1800 6
19 2300 10 69 2100 14 119 2100 10
20 2800 11 70 1900 7 120 1700 0
21 2100 7 71 2000 9 121 2400 16
22 1700 1 72 1800 7 122 2600 17
23 2500 6 73 2100 10 123 2100 10
24 2400 9 74 2300 12 124 2100 8
25 2700 17 75 2700 20 125 2400 17
26 1700 0 76 2800 20 126 1700 1
27 1600 2 77 1800 3 127 2600 20
28 2600 17 78 1700 5 128 2400 16
29 2500 13 79 1700 4 129 2700 17
30 2500 16 80 1700 0 130 2100 12
31 2700 17 81 1700 1 131 1600 0
32 1700 1 82 2100 6 132 2100 15
33 1600 1 83 2600 17 133 1900 5
34 2400 11 84 2400 9 134 2100 12
35 1900 3 85 2600 19 135 2200 12
36 1800 5 86 1900 7 136 2400 13
37 1800 3 87 1600 0 137 1800 4
38 2400 14 88 1900 3 138 2600 17
39 2600 16 89 2100 14 139 2700 20
40 2700 18 90 1700 0 140 2500 16
41 2100 11 91 2100 15 141 2500 16
42 2300 14 92 1700 1 142 1900 6
43 1700 0 93 2300 14 143 2100 15
44 2200 13 94 2500 16 144 1700 9
45 2900 20 95 2600 18 145 1500 0
46 1800 5 96 1900 3 146 1800 18
47 2100 16 97 2500 19 147 2100 10
48 2000 12 98 1800 6 148 2700 19
49 2000 12 99 1700 2 149 1800 9
50 2900 20 100 2000 10 150 2100 15

RNotas importantes
24 Estadística Descriptiva 201901
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las columnas C4,
C8, C11 y C15 de la tabla de números aleatorios.
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios. Como el marco muestral tiene 150 elementos usemos las
columnas C4, C5 y C6, para elegir números de tres cifras y luego C8, C9 y C10.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Los elementos seleccionados son:


Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149

RNotas importantes
Unidad 1. Muestreo 25
Seleccione una muestra de doce trabajadores usando muestreo simple aleatorio. Use las columnas C10,
C4, C2 y C1 de la tabla de números aleatorios.

Los elementos seleccionados son:


Posición

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9

RNotas importantes
26 Estadística Descriptiva 201901

Muestreo sistemático

En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo comenzando
por un valor aleatorio. Este muestreo supone que se cuenta con una enumeración completa de los
elementos de la población.

Procedimiento para seleccionar una muestra sistemática

1. Calcule el valor de k, donde k = N . El valor de k se redondea al valor del entero menor.


n

2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A).

3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado
del marco muestral y así sucesivamente hasta completar la muestra.

RNotas importantes
Unidad 1. Muestreo 27
Ejemplo 6
Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo
sistemático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12.
Solución

Calculemos el valor de k, donde k = N = 12 = 3. El valor de k se redondea al valor del entero menor,


n 4
luego k = 3.
Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A).
Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la quinta
posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.

Ejemplo 7
Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo
sistemático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1.

Solución

Calculemos el valor de k, donde k = N = 15 = 2,5. El valor de k se redondea al valor del entero menor,
n 6
luego k = 2.

Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A).


Observando la columna C4 de la tabla de números aleatorios tenemos que A = 1.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la tercera
posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11.

RNotas importantes
28 Estadística Descriptiva 201901
Ejemplo 8
Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra
aleatoria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos
seleccionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.
Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Solución

Calculemos el valor de k, donde k = N = 40 = 5


n 8
El valor de k se redondea al valor del entero menor, luego k = 5.
Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque aleatorio (A).
Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la décima
posición (5+5 = 10) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es
decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40.
Los elementos seleccionados son:

Posición 5 10 15 20 25 30 35 40

RNotas importantes
Unidad 1. Muestreo 29

Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que
se muestra a continuación información acerca de las variables: ingreso mensual (en soles), nivel de
educación y años cumplidos en la empresa.
Ingreso Nivel de Años en Ingreso Nivel de Años en Ingreso Nivel de Años en
Nº Nº Nº
(soles) educación empresa (soles) educación empresa (soles) educación empresa
1 2300 Secundaria 5 51 2100 Técnica 13 101 2400 Técnica 16
2 2800 Secundaria 11 52 2100 Técnica 9 102 1700 Técnica 0
3 2400 Secundaria 4 53 1800 Técnica 1 103 2500 Técnica 12
4 2500 Secundaria 2 54 2000 Técnica 9 104 1700 Técnica 3
5 2300 Secundaria 3 55 2100 Técnica 10 105 2400 Técnica 17
6 2100 Secundaria 2 56 1900 Técnica 4 106 2400 Técnica 16
7 1700 Secundaria 2 57 2000 Técnica 10 107 1900 Técnica 7
8 2000 Secundaria 0 58 2300 Técnica 11 108 1700 Técnica 1
9 2200 Secundaria 7 59 2000 Técnica 7 109 2100 Técnica 6
10 2100 Secundaria 4 60 1700 Técnica 1 110 2000 Técnica 5
11 1700 Secundaria 1 61 1900 Técnica 6 111 2000 Superior 3
12 2500 Secundaria 2 62 2000 Técnica 9 112 2500 Superior 13
13 2800 Secundaria 13 63 2400 Técnica 17 113 1700 Superior 0
14 2400 Secundaria 9 64 1700 Técnica 0 114 2500 Superior 19
15 1700 Secundaria 1 65 1700 Técnica 2 115 1700 Superior 3
16 2400 Secundaria 9 66 2400 Técnica 17 116 2600 Superior 19
17 2200 Secundaria 10 67 2500 Técnica 13 117 1600 Superior 1
18 2200 Secundaria 4 68 2600 Técnica 16 118 1800 Superior 6
19 2300 Secundaria 10 69 2100 Técnica 14 119 2100 Superior 10
20 2800 Secundaria 11 70 1900 Técnica 7 120 1700 Superior 0
21 2100 Secundaria 7 71 2000 Técnica 9 121 2400 Superior 16
22 1700 Secundaria 1 72 1800 Técnica 7 122 2600 Superior 17
23 2500 Secundaria 6 73 2100 Técnica 10 123 2100 Superior 10
24 2400 Secundaria 9 74 2300 Técnica 12 124 2100 Superior 8
25 2700 Secundaria 17 75 2700 Técnica 20 125 2400 Superior 17
26 1700 Secundaria 0 76 2800 Técnica 20 126 1700 Superior 1
27 1600 Secundaria 2 77 1800 Técnica 3 127 2600 Superior 20
28 2600 Secundaria 17 78 1700 Técnica 5 128 2400 Superior 16
29 2500 Secundaria 13 79 1700 Técnica 4 129 2700 Superior 17
30 2500 Secundaria 16 80 1700 Técnica 0 130 2100 Superior 12
31 2700 Secundaria 17 81 1700 Técnica 1 131 1600 Superior 0
32 1700 Secundaria 1 82 2100 Técnica 6 132 2100 Superior 15
33 1600 Secundaria 1 83 2600 Técnica 17 133 1900 Superior 5
34 2400 Secundaria 11 84 2400 Técnica 9 134 2100 Superior 12
35 1900 Secundaria 3 85 2600 Técnica 19 135 2200 Superior 12
36 1800 Secundaria 5 86 1900 Técnica 7 136 2400 Superior 13
37 1800 Secundaria 3 87 1600 Técnica 0 137 1800 Superior 4
38 2400 Secundaria 14 88 1900 Técnica 3 138 2600 Superior 17
39 2600 Secundaria 16 89 2100 Técnica 14 139 2700 Superior 20
40 2700 Secundaria 18 90 1700 Técnica 0 140 2500 Superior 16
41 2100 Técnica 11 91 2100 Técnica 15 141 2500 Superior 16
42 2300 Técnica 14 92 1700 Técnica 1 142 1900 Superior 6
43 1700 Técnica 0 93 2300 Técnica 14 143 2100 Superior 15
44 2200 Técnica 13 94 2500 Técnica 16 144 1700 Superior 9
45 2900 Técnica 20 95 2600 Técnica 18 145 1500 Superior 0
46 1800 Técnica 5 96 1900 Técnica 3 146 1800 Superior 18
47 2100 Técnica 16 97 2500 Técnica 19 147 2100 Superior 10
48 2000 Técnica 12 98 1800 Técnica 6 148 2700 Superior 19
49 2000 Técnica 12 99 1700 Técnica 2 149 1800 Superior 9
50 2900 Técnica 20 100 2000 Técnica 10 150 2100 Superior 15

RNotas importantes
30 Estadística Descriptiva 201901
Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados. Elabore un listado
con el número seleccionado. Utilice la columna C5, C9, y C12 de la tabla de números aleatorios. Calcule
el porcentaje muestral de trabajadores con ingresos mayores a 2000 soles.
Solución
N
Calculemos el valor de k, donde k = = = ………………………...
n
El valor de k se redondea al valor del entero menor, luego k = ……………..……..

Seleccionemos aleatoriamente un número entero entre 1 y k, llamado arranque aleatorio (A).

Observando la columna C5 y C6 de la tabla de números aleatorios tenemos que A = …………….....

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k) del listado del
marco muestral y así sucesivamente hasta completar la muestra.

Los elementos seleccionados son:

Posición

Ingreso

El porcentaje muestral de trabajadores con ingresos mayores a 2000 soles es:

RNotas importantes
Unidad 1. Muestreo 31

Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus
elementos.
El objetivo de estratificar la población es buscar homogeneidad dentro de los estratos.
Pasos a seguir para seleccionar una muestra estratificada
1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos
los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Calcule la cantidad de elementos a seleccionar en cada estrato.
3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas


• Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén
relacionadas entre sí.
• No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho
estratos.
• Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser
considerados.

RNotas importantes
32 Estadística Descriptiva 201901
Ejemplo 9
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso en soles, nivel de educación y años en la empresa.

Años
Ingreso Años Ingreso Ingreso Años
Nivel de Nivel de cumplidos Nivel de
Nº (en cumplidos Nº (en Nº (en cumplidos
educación educación en la educación
soles) en la empresa soles) soles) en la empresa
empresa
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15

RNotas importantes
Unidad 1. Muestreo 33
Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como variable
de estratificación el nivel educacional. Elabore un listado identificando el número de dato
seleccionado.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para
el estrato 3 use las columnas C4, C3, C5 y C7.

Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son:
secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos
muestras aleatorias simples.

Números de Posiciones
Estratos elementos en el Cantidad seleccionada por estrato nh = Nh ´ n
estrato Nh (desde – hasta) N

N1 30
1. Secundaria N1 = 30 1 – 30 n1 = ´n = ´ 16 = 4
N 120
N2 50
2. Técnica N2 = 50 31 – 80 n2 = ´n = ´ 16 = 6,67 » 7
N 120
N3 40
3. Superior N3 = 40 81 – 120 n3 = ´n = ´ 16 = 5,33 » 5
N 120
Total N = 120 n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5.
Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria Posición 2 16 29 13

RNotas importantes
34 Estadística Descriptiva 201901
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11.
Observemos que las posiciones de los elementos a elegir están entre el 31 y el 80.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Estrato Técnica Posición 54 62 66 77 48 67 44

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7.
Observemos que las posiciones de los elementos a elegir están entre el 81 y el 120.

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior Posición 114 81 97 105 83

RNotas importantes
Unidad 1. Muestreo 35

La siguiente tabla muestra a los 120 alumnos de la especialidad de administración, de la universidad El


Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana
que la escucha.

Posición Radio Horas Posición Radio Horas Posición Radio Horas


1 Studio 92 6 41 Oxígeno 6 81 Oxígeno 4
2 Studio 92 10 42 Oxígeno 6 82 Oxígeno 3
3 Studio 92 4 43 Oxígeno 8 83 Oxígeno 3
4 Studio 92 2 44 Oxígeno 9 84 Oxígeno 5
5 Studio 92 3 45 Oxígeno 4 85 Oxígeno 5
6 Studio 92 6 46 Oxígeno 6 86 Oxígeno 8
7 Studio 92 7 47 Oxígeno 7 87 Planeta 7
8 Studio 92 6 48 Oxígeno 9 88 Planeta 6
9 Studio 92 8 49 Oxígeno 8 89 Planeta 9
10 Studio 92 9 50 Oxígeno 10 90 Planeta 9
11 Studio 92 11 51 Oxígeno 12 91 Planeta 4
12 Studio 92 3 52 Oxígeno 9 92 Planeta 2
13 Studio 92 4 53 Oxígeno 9 93 Planeta 11
14 Studio 92 2 54 Oxígeno 8 94 Planeta 2
15 Studio 92 6 55 Oxígeno 4 95 Planeta 3
16 Studio 92 4 56 Oxígeno 6 96 Planeta 8
17 Studio 92 9 57 Oxígeno 7 97 Planeta 6
18 Studio 92 5 58 Oxígeno 8 98 Planeta 7
19 Studio 92 2 59 Oxígeno 7 99 Planeta 9
20 Studio 92 7 60 Oxígeno 3 100 Planeta 4
21 Studio 92 4 61 Oxígeno 6 101 Planeta 8
22 Studio 92 6 62 Oxígeno 9 102 Planeta 7
23 Studio 92 7 63 Oxígeno 2 103 Planeta 7
24 Studio 92 8 64 Oxígeno 5 104 Planeta 9
25 Studio 92 9 65 Oxígeno 1 105 Planeta 6
26 Studio 92 10 66 Oxígeno 4 106 Planeta 7
27 Studio 92 5 67 Oxígeno 7 107 Planeta 9
28 Studio 92 4 68 Oxígeno 6 108 Planeta 8
29 Studio 92 7 69 Oxígeno 7 109 Planeta 3
30 Studio 92 8 70 Oxígeno 8 110 Planeta 11
31 Studio 92 4 71 Oxígeno 4 111 Planeta 13
32 Oxígeno 6 72 Oxígeno 5 112 Planeta 14
33 Oxígeno 7 73 Oxígeno 3 113 Planeta 9
34 Oxígeno 5 74 Oxígeno 6 114 Planeta 8
35 Oxígeno 8 75 Oxígeno 5 115 Planeta 6
36 Oxígeno 9 76 Oxígeno 8 116 Planeta 5
37 Oxígeno 4 77 Oxígeno 7 117 Planeta 7
38 Oxígeno 5 78 Oxígeno 9 118 Planeta 3
39 Oxígeno 2 79 Oxígeno 10 119 Planeta 6
40 Oxígeno 9 80 Oxígeno 3 120 Planeta 5

RNotas importantes
36 Estadística Descriptiva 201901

Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable radio
de su preferencia como variable de estratificación.

Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C5, C9 y C7, para el
estrato 2 use las columnas C3, C10, C12 y C9 y para el estrato 3 use las columnas C1, C4, C10; C7, C12, y C13.

Posición Nh
Estrato Nh nh = ´n
(desde – hasta) N

N1= n1=

N2= n2=

N3= n3=

Total

Estrato 1:
Posición
Studio 92

Estrato 2:
Posición
Oxígeno

Estrato 3:
Posición
Planeta

RNotas importantes
Unidad 1. Muestreo 37
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

RNotas importantes
38 Estadística Descriptiva 201901

Unidad 2. Organización de datos


Logro de la unidad 2

Al finalizar la unidad 2,
el estudiante interpreta con rigurosidad tablas y gráficos,
a partir de datos reales dentro del ámbito de su carrera.

Temario
Métodos de organización y presentación de datos:
• Datos cualitativos
• Datos cuantitativos
• Tablas de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto)
• Tablas de doble entrada

RNotas importantes
Unidad 2. Organización de Datos 39

Estadística descriptiva
Frecuencias absolutas, relativas y porcentuales
•de una clase es la cantidad de elementos que pertenecen a esa
Frecuencia absoluta (fi)
clase
•de una clase es la proporción de elementos que pertenecen a
Frecuencia relativa (hi)
esa clase
Frecuencia porcentual
•de una clase es la frecuencia relativa multiplicada por 100%
(pi)

Se tiene que:
frecuencia absoluta f i
frecuencia relativa (hi ) = =
número de casos n
frecuencia absoluta f
frecuencia porcentual (pi = hi % ) = ´ 100% = i ´ 100%
número de casos n

Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolu-
tas, relativas y porcentuales en cada una de varias clases que no se traslapan.

Distribución de <unidades elementales> según <variable>


Categorías Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi = hi%
f1 f1
Categoría 1 f1 h1 = p1 = ´ 100%
n n
f f
Categoría 2 f2 h2 = 2 p2 = 2 ´ 100%
n n
… … … …

fk fk
Categoría k fk hk = pk = ´ 100%
n n
Fuente: ………………………

Título de una distribución de frecuencias o gráfico de una variable


Siguiendo indicaciones del INEI, en este curso, usaremos el siguiente esquema para escribir el título:

Distribución de <unidades elementales> según <variable>


Puede ver más en la “Guía para la presentación de gráficos estadísticos” en
https://www.inei.gob.pe/media/MenuRecursivo/metodologias/libro.pdf

RNotas importantes
40 Estadística Descriptiva 201901

Distribución de frecuencias de variables cualitativas


Distribución de <unidades elementales> según <variable>
Categorías Frecuencia absoluta fi Frecuencia relativa hi
f1
Categoría 1 f1 h1 =
n
f
Categoría 2 f2 h2 = 2
n
… … …

fk
Categoría k fk hk =
n
Fuente: …………………………

En los Censos Nacionales 2017 ejecutados por el INEI se preguntó a todos los peruanos el idioma o
lengua con el que aprendió hablar, obteniéndose los siguientes resultados.
Perú. Distribución de peruanos según idioma o lengua con el que aprendió hablar. 2017
Idioma o lengua con que aprendió a hablar Casos Porcentaje Porcentaje acumulado
Castellano 23 178 478 82,94% 82,94%
Quechua 3 799 780 13,60% 96,54%
Aimara 450 010 1,61% 98,15%
Ashaninka 73 567 0,26% 98,41%
Lengua de señas peruanas 10 447 0,04% 98,45%
Otro lengua extranjera 49 876 0,18% 98,63%
Otra lengua nativa u originaria 179 601 0,64% 99,27%
No sabe / No responde 204 301 0,73% 100,00%
Total 27 946 060 100,00% 100.00%
Fuente INEI. Censos Nacionales 2017
Si se quiere hacer programas de televisión que sean pasados en la televisión nacional en lenguas
diferentes al castellano y, que por lo menos, para el 4% de la población sea su idioma con el que
aprendió a hablar. Indique las lenguas que se elegirán.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
Unidad 2. Organización de Datos 41
Análisis

Argumentación

Gráficos estadísticos
“Un gráfico puede valer más que mil palabras,
pero puede tomar muchas palabras para hacerlo”
John Wilder Tukey (1915-2000)
Gran estadístico del siglo XX, con gran influencia en la visualización de información
William Playfair (1759-1823), economista e ingeniero escocés es considerado el pionero de la
estadística gráfica. Fue el creador del gráfico circular, de sectores y de barras. Los principios de su
trabajo fueron los siguientes:

El método gráfico es una Las personas Un gráfico es El método gráfico ayuda al


forma de simplificar lo ocupadas necesitan más accesible cerebro, ya que permite
tedioso y lo complejo ayuda visual que una tabla entender y memorizar mejor.

Recomendaciones sobre la presentación de gráficos


Descripción del diagrama
El título del gráfico siempre debe ser indicado.
En los ejes, siempre se debe indicar explícitamente las variables que se está representando y las res-
pectivas unidades.
Las fuentes de donde se obtuvieron los datos que permitieron su construcción, así como quiénes o qué
entidad elaboró el diagrama y cualquier otra información se deben indicar siempre que sea relevante.

RNotas importantes
42 Estadística Descriptiva 201901
Elección de la base de comparación
• Si se va a representar gráficamente los datos de solo una muestra, el mismo diagrama sirve para
representar las frecuencias absolutas y relativas.
• Si se va a comparar el comportamiento de una variable en dos o más poblaciones distintas, pero
solo se tiene muestras representativas de las poblaciones, entonces es conveniente usar la fre-
cuencia relativa.
• Si se va a comparar el comportamiento de una variable en dos o más poblaciones y se tiene los
datos de las poblaciones, entonces se puede realizar la comparación por separado de las frecuen-
cias absolutas y de las relativas.
• Si bien es totalmente factible comparar gráficamente dos o más series de datos que han sido agru-
pados en intervalos distintos en amplitud y límites, es preferible para facilitar la comparación que
todas las series de datos utilicen los mismos intervalos.
Uso adecuado de la escala de los ejes
• La escala utilizada en los ejes debe mantenerse. El cambio de proporciones distorsiona el propósito
de usar gráficos, el cual consiste en ver rápidamente la proporción con que se está distribuyendo
la variable.
• Si se ha utilizado una escala especial en alguno de los ejes del diagrama, por ejemplo, escala loga-
rítmica, esta se debe indicar.
• Debe hacer que los valores de la variable abarquen adecuadamente la longitud de cada eje.
Eliminación de ruido
• Los excesivos adornos y la inclusión de figuras, muchas veces, en lugar de aclarar más los diagra-
mas, terminan confundiendo o dificultando su rápida comprensión.
• El uso de algunas figuras en lugar de barras o columnas puede distorsionar visualmente la real
proporción de las magnitudes que se están representando.
Uso del punto inicial del eje vertical
• El punto de inicio del eje vertical debe empezar con un cero para no distorsionar la impresión visual
respecto de la magnitud.
• El cambio de punto de inicio distinto de cero debe estar completamente justificado.

Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de frecuencias.
En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje, se puede usar
una escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada indicador
de clase de una altura proporcional a la frecuencia correspondiente.
Las barras deben estar separadas para enfatizar el hecho de que cada clase es diferente de otra.

Diagrama circular
Cuando se utiliza el gráfico circular, también llamado pastel, cada sector circular representa la frecuen-
cia observada de una clase o categoría.
El sector circular que representa a una determinada clase de la variable tiene un ángulo en el centro
proporcional a la frecuencia relativa de dicha clase. El ángulo que le corresponde a cada clase se ob-
tiene multiplicando 360º por la respectiva frecuencia relativa.

RNotas importantes
Unidad 2. Organización de Datos 43

A partir de los siguientes gráficos de la investigación sobre feminicidios en el Perú el año 2017, com-
plete el gráfico siguiente y ponga títulos a los diagramas.
Solución
Distribución de ………………………………………… según ………………………………………………………………………….

Distribución de ………………………………………… según ………………………………………………………………………….

Feminicidios en el Perú
El lugar más frecuente en el que se cometen los feminicidios es
………………………………………………………...
El ……..…...% de los feminicidios son perpretados por las parejas,
convivientes, esposos; actuales o anteriores.

RNotas importantes
44 Estadística Descriptiva 201901

Frecuencias acumuladas, absolutas relativas y porcentuales


Frecuencia
•de una clase es la cantidad de elementos que pertenecen hasta esa
acumulada absoluta clase
(Fi)
Frecuencia
•de una clase es la proporción de elementos que pertenecen hasta
acumulada relativa esa clase
(Hi)
Frecuencia
•de una clase es la frecuencia acumulada relativa multiplicada por
acumulada
100%
porcentual (Pi)
Se tiene que:
frecuencia absoluta acumulada Fi
frecuencia relativa acumulada ( Hi ) = =
número de datos n
frecuencia absoluta acumulada F
frecuencia porcentual acumulada ( Pi ) = ´ 100% = i ´ 100%
número de datos n

Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayoría
de las consecuencias, lo que se podría resumir como “pocos factores son vitales y muchos son
triviales”. Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos surgen
de un número pequeño de causas. Los pasos para realizar un gráfico de Pareto son los siguientes:

Construya la
distribución de La categoría “Otros” es
Dibuje dos ejes
frecuencias. Ordene las colocada en la última
verticales y uno
categorías en forma posición. No importa
horizontal.
descendente respecto a cuán grande sea.
la frecuencia.

En el eje vertical
derecho, marque una En el eje horizontal:
marque los espacios Elabore el diagrama de
escala de 0% a 100%.
donde estarán barras y dibuje la línea
En el eje vertical dibujadas las barras de frecuencias
izquierdo, marque una para cada una de las acumuladas
escala de 0 hasta el categorías, incluida la (Curva de Pareto)
número de observa- categoría “Otros”.
ciones o de 0% a 100%.

RNotas importantes
Unidad 2. Organización de Datos 45
Ejemplo 10
El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema. Al extraer una muestra aleatoria de productos fallados,
obtuvo los siguientes resultados:
Distribución de productos según problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado Número de ocurrencias (fi)
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción
Elabore el diagrama de Pareto.
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.
Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Distribución de productos según problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado fi hi Fi Hi
Superficie rugosa 71 0,355 71 0,355
Medidas fuera de norma 50 0,250 121 0,605
Color inadecuado 28 0,140 149 0,745
Forma no simétrica 16 0,080 165 0,825
Desprendimiento de capa protectora 12 0,060 177 0,885
Bordes afilados 9 0,045 186 0,930
Otros 14 0,070 200 1,000
Fuente: Gerencia de Producción
Se puede realizar el gráfico usando las frecuencias relativas hi y las frecuencias relativas acumuladas
Hi.
Distribución de productos según problemas reportados de asientos de fibra de vidrio

RNotas importantes
46 Estadística Descriptiva 201901

La siguiente tabla fue desarrollada con información de los Censos Nacionales 2017. Se quiere realizar
un comentario a partir de un gráfico que muestre que en pocos tipos de materiales de construcción en
las paredes se concentra la mayor cantidad de viviendas.

Distribución de ……………………………………….según ……………………………………………………………………………


Material de construcción predominante en las paredes Casos Porcentaje Porcentaje acumulado
Ladrillo o bloque de cemento 4 298 274 55.83% 55.83%
Adobe 1 791 829 23.27% 79.10%
Madera (pona, tornillo etc.) 727 778 9.45% 88.56%
Tapia 356 665 4.63% 93.19%
Triplay / calamina / estera 239 012 3.10% 96.29%
Otro material 285 342 3.71% 100.00%
Total 7 698 900 100.00% 100.00%
Solución
Interpretación

Representación
La unidad elemental es ………………….……………………………………………..……….…………………………………………….
La variable en estudio es ………………………….…………………………………….…………………………………………………….
El gráfico más adecuado es …………………………………………………….……………….…………………………………….…….
Cálculo
Distribución de ……………………………………….según ……………………………………………………………………………
100%
7 000 000 90%

Porcentaje acumulado de viviendas


6 000 000 80%
Número de viviendas

70%
5 000 000
60%
4 000 000 50%

3 000 000 40%

30%
2 000 000
20%
1 000 000
10%

0 0%
Ladrillo o bl oque Adobe Madera (pona, Tapia Triplay / calamina Otro material
de cemento tornillo etc.) / estera

Fuente: Censos Nacionales 2017. INEI Material predominante en las paredes

Comentario

RNotas importantes
Unidad 2. Organización de Datos 47

Tabulaciones cruzadas
También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simul-
tánea los datos para dos variables.

En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a las peruanas de 12 a más años por la cantidad de hijos que han tenido vivos, obteniéndose
los siguientes resultados. Si dentro de las mujeres de 18 o 19 años, el porcentaje que ha tenido hijos
es mayor al 15% el Ministerio de Salud hará un programa de educación sexual especialmente diseñado
para este grupo etáreo. Indique si se hará dicho programa.
Perú. Distribución de mujeres según edad de la mujer y número de hijos nacidos vivos
Número total de hijos/a que ha tenido nacidos vivos
Edad de la mujer Cero hijos Un hijo Dos hijos Tres hijos Cuatro hijos Total
12 años 298,985 1,028 300,013
13 años 284,650 1,162 285,812
14 años 285,732 1,638 734 288,104
15 años 283,045 4,909 994 288,948
16 años 247,888 12,358 922 576 261,744
17 años 231,839 24,243 2,280 636 258,998
18 años 216,999 38,938 5,089 586 481 262,093
19 años 193,952 52,797 9,273 1,118 496 257,636
Total 2,043,090 137,073 19,292 2,916 977 2,203,348
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

Solución
Interpretación

Representación
La unidad elemental es ………………….…………………………………………………….…………………………………………….
Las variables son en………………………………….…………………………………….……………………………………………………

Cálculo

Análisis

Argumentación

RNotas importantes
48 Estadística Descriptiva 201901

Título de un gráfico de una tabla de contingencia


Siguiendo indicaciones del INEI, en este curso, usaremos el siguiente esquema.

Si el gráfico presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al total, el
título será:
Distribución de <elementos> según <variable 1> y <variable 2>

Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:
Distribución de <elementos> según <variable 1> por <variable 2>

Gráfico de tabulaciones cruzadas de dos variables

Distribución de <elementos> según Distribución de <elementos> según


<variable 1> y <variable 2> <variable 1> por <variable 2>

Todas las frecuencias Todas las frecuencias En cada columna, las


suman n o 100% suman n o 100% frecuencias suman 100%
Gráfico de barras Gráfico de barras Gráfico de barras
agrupadas apiladas apiladas al 100%

Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.

Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada catego-
ría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es el mismo para cada categoría.

RNotas importantes
Unidad 2. Organización de Datos 49

Ponga título a los siguientes gráficos.

Solución

Distribución de peruanos según ………….……………………………………………………………………………………………


40%

35%

30%
18.33%
Porcentaje de personas

25%

20% 13.54% 13.04% Mujer


15% Hombre

10% 20.14%
13.17% 12.65%
5%
2.81% 3.00% 0.54%
0%
1.36% 1.05% 0.37%
Conviviente Separado/a Casado/a Viudo/a Divorciado/a Soltero/a
Estado civil

Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda 2017

Distribución de peruanos según ……………………….…..………………………………..……………………………………….

Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda 2017

RNotas importantes
50 Estadística Descriptiva 201901

Distribución porcentual de peruanos según ……………………………………………………………………………………

Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda 2017

A fin de conocer hacia dónde se dirigen los limeños durante el día, El Comercio accedió a un estudio
de la Autoridad Autónoma del Tren Eléctrico (AATE), que empleó la tecnología Big Data –movimiento
del GPS de los celulares de forma anónima– que esta institución adscrita al Ministerio de Transporte y
Comunicaciones usa para planificar el futuro del transporte público integrado.

Distribución de ………………….………………………………………………………………………………….…………………………

RNotas importantes
Unidad 2. Organización de Datos 51
Caso Aerolínea Wayra
Objetivo: Identificar el porcentaje de pasajeros que siendo de nacionalidad peruana viajan al
extranjero y porcentaje de pasajeros que siendo de nacionalidad extranjera viajan al interior de
nuestro país.
A continuación, se muestra la información para las variables lugar de destino y nacionalidad.
Distribución de pasajeros según su lugar de destino y nacionalidad
Nacionalidad
Lugar de destino Total
Peruana Extranjero
Arequipa 18 18 36
Cuzco 25 30 55
Miami 20 10 30
México D.F 22 10 32
Piura 12 7 19
Río de Janeiro 23 5 28
Total 120 80 200
Fuente: Aerolínea Wayra

Solución
Interpretación

Representación
La unidad elemental es ………………….…………………………………………………….…………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
El gráfico que se realizará es …………………………………………………………………………………………………………………
Cálculo
Distribución de pasajeros según su lugar de destino ………………..nacionalidad
100%

80%

60%

40%

20%

0%

Análisis

RNotas importantes
52 Estadística Descriptiva 201901

Resumen de datos cuantitativos


Distribución de frecuencias de variables discretas
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el
número de elementos (frecuencia) que la componen. Es un cuadro que se calcula de la siguiente
manera.
Distribución de <unidades elementales> según <variable>
Valores de la variable Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
discreta absoluta fi relativa hi acumulada Fi acumulada Hi
f1
x1 f1 h1 = F1 = f1 H1 = h1
n
f
x2 f2 h2 = 2 F2 = f2 + F1 H2 = h2 + H1
n
… … … … …

fk
xk fk hk = Fk = fk + Fk -1 Hk = hk + Hk -1
n
Fuente: ………………………..……………..

Gráfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, relativas o
porcentuales, en el eje ordenado.

Distribución de alumnos de pregrado según número de veces


que postuló a la universidad donde estudia
700,000
576,215
600,000
Número de alumnos

500,000

400,000

300,000

200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI

RNotas importantes
Unidad 2. Organización de Datos 53

Objetivo: Determinar si debe hacer una promoción para Fiestas Patrias.

Para Fiestas Patrias, la empresa está dispuesta a realizar una promoción, si el porcentaje de pasajeros
que haya realizado como mínimo cuatro viajes supera el 70%. Indique lo que hará la empresa. Se
cuenta con la siguiente información y se desea hacer un gráfico.
Distribución de ……………………………………………………. según ……………………………….…………………………
Número de viajes Número de pasajeros pi Fi Pi
1 15
2 12%
3 38%
4 30
6 150
Fuente: Aerolínea Wayra

Solución
Interpretación

Representación
La unidad elemental es ………………….…………………………………………………….…………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
Se hará el gráfico de ………………….……………… pues …………………...………………………………………..…………………
Cálculo

Distribución de …………………………………. según ……………………………………


45%
Porcentaje de pasajeros

40%
35%
30%
25%
20%
15%
10%
5%
0%
0 1 2 3 4 5 6 7
Número de viajes
Fuente: Aerolínea Wayra

Análisis

Argumentación

RNotas importantes
54 Estadística Descriptiva 201901

Distribución de frecuencias de variables continuas


Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen.

Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuantitativos son
los siguientes:
1. Determine la cantidad de clases
2. Determine el ancho de cada clase
3. Determine los límites de cada clase

Cantidad de clases
Se recomienda usar entre 5 y 20 clases, inclusive.
La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas que varias
contendrían unos cuantos elementos.
Para determinar el número de clases se usa la regla de Sturges, k = 1 + 3,322 log n. Si la estimación
tiene decimales, se toma el entero más próximo.

Amplitud de cada clase


Se usa el mismo ancho para todas las clases.

Se calcula de la siguiente manera:


rango
Amplitud =
k

La amplitud se redondea al número inmediato superior de acuerdo con la cantidad de decimales que
tienen los datos o según la precisión con que se desea trabajar.

Límites de cada clase


Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y sólo a
una.
El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase. El límite
superior de clase es el valor máximo posible de los datos que se asigna a la clase.
La marca de clase es el punto medio de los límites de cada intervalo.

RNotas importantes
Unidad 2. Organización de Datos 55
Ejemplo 11
El jefe de la Oficina de Rentas de una Municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en soles, en el 2017 de 48
viviendas elegidas al azar.

145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

Elabore la tabla de frecuencias para la variable: pago por impuestos municipales año 2017.

Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145, 1 = 206

Siguiendo la regla de Sturges, el número de intervalos es:

k = 1 + 3,322 log10n = 1 + 3,322 log10(48) = 6,585 » 7

El ancho del intervalo es:


r 206
w= = = 29,429 @ 29,5 (Redondeo por exceso a un decimal)
k 7

Distribución de frecuencias del pago de impuestos municipales del año 2017


Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48 1,0000
Fuente: …………………………..

RNotas importantes
56 Estadística Descriptiva 201901

Se seleccionó una muestra de clientes que compró papas nativas en una feria de productos agrarios.
Peso de papas nativas, en kilogramos, que un cliente compra en una visita a una feria
1,0 1,0 1,7 1,8 2,0 2,3 2,5 2,8 2,8 2,8 3,1 3,2 3,2 3,3 3,3 3,3 3,3
3,3 3,4 3,6 3,7 3,9 4,0 4,1 4,2 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6
4,6 4,6 4,8 4,9 5,0 5,0 5,1 5,2 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,9 5,9 5,9 5,9 5,9 6,0 6,1 6,1 6,1 6,2 6,2
Solución
Interpretación

Representación
La unidad elemental es ………………….…………………………………………………….…………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
Se hará la distribución de frecuencias por intervalo pues …………………...………………………………………..………
Se usará la regla de Sturges.
Cálculo
El valor máximo es ……………….…………..…… y el valor mínimo es ……………….…………...………………….
Luego, el rango es ……………………………..………………….
Siguiendo la regla de Sturges, la cantidad de intervalos es igual a k = 1 + 3,322 log(……….) esto es igual
a …………………..………………….
Como, la cantidad de intervalos es un número entero, entonces k = ……………….
La amplitud es igual al rango entre la cantidad de intervalos, esto es, w = ……………………..
El valor de la amplitud se redondea por exceso a ……………………… decimal(es), pues los datos tienen
………………… decimal(es), entonces la amplitud (w) es ………………………………
Distribución de ………………….…………..………………………… según ………………..……………………..……………….
Intervalo Marca de clase fi hi Fi Hi
[ , ]
] , ]
] , ]
] , ]
] , ]
] , ]
] , ]
Fuente: Feria agropecuaria ecológica

f4

H3

RNotas importantes
Unidad 2. Organización de Datos 57

Gráficos de datos cuantitativos

Usa los intervalos de clase y las


Usa los intervalos de clase y las Usa las marcas de clase y las
frecuencias acumuladas:
frecuencias: absolutas fi, frecuencias: absolutas fi,
absolutas Fi, relativas Hi o
relativas hi o porcentuales pi. relativas hi o porcentuales pi
porcentuales Pi

Histograma Polígono de frecuencias Ojiva

Histograma
Un histograma es una representación gráfica de una variable en forma de barras, donde la altura de
cada barra es proporcional a la frecuencia de los valores representados.
Se coloca la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobre
el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta, relativa o
porcentual). Los rectángulos adyacentes se tocan entre sí.

Polígono de frecuencias
Un polígono de frecuencias es un gráfico de líneas que une los puntos asociados a las marcas de clase
de una variable. La altura del punto asociado a cada marca de clase es proporcional a la frecuencia de
dicho valor.
Se realiza uniendo con segmentos de recta los puntos de intersección de las marcas de clase con las
frecuencias (absolutas, relativas o porcentuales).
Los polígonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del primer intervalo
y uno después del último.
Si los intervalos creados toman valores que pueden no ser reales, igual se crea el intervalo, como,
ejemplo, tiempos negativos.

Ojiva
La ojiva es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
La ojiva usa los límites de los intervalos y no las marcas de clase.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que corresponden
a un intervalo determinado.

RNotas importantes
58 Estadística Descriptiva 201901

Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias porcentuales con los datos
de la muestra del ejercicio anterior.

Distribución de clientes según cantidad de papas nativas compradas en una visita a la feria
30

25

20

15

10

0
0 1 2 3 4 5 6 7 8 9

Fuente: Feria agropecuaria ecológica


Distribución de clientes según cantidad de papas nativas compradas en una visita a la feria
30

25

20

15

10

0
0 1 2 3 4 5 6 7 8 9

Fuente: Feria agropecuaria ecológica


Distribución de clientes según cantidad de papas nativas compradas en una visita a la feria
30

25

20

15

10

0
0 1 2 3 4 5 6 7 8 9

Fuente: Feria agropecuaria ecológica

RNotas importantes
Unidad 2. Organización de Datos 59
Distribuciones de frecuencias de dos o más grupos de datos con intervalos comunes
La idea básica para distribuciones de frecuencias de dos o más grupos de datos es tener intervalos
comunes, es decir, que los límites de los intervalos para ambas distribuciones sean iguales. Para ello,
debemos seguir los siguientes pasos:
• Hallar el mínimo de todos los datos y el máximo de todos los grupos de datos, y usarlos para
calcular el rango.
• Calcular el número de categorías, el número de datos es el máximo número de datos de cada
grupo. Tener en cuenta que no es la suma de ambos tamaños muestrales. Siguiendo la regla de
Sturges, el número de intervalos es
k = 1 + 3,322 log10n
Ejemplo 12
La empresa de investigación de mercado A lleva a cabo un estudio para obtener indicadores que le
permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios, redondeado
al entero más próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho estudio,
sustentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó los
siguientes resultados:
Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de distribución
de frecuencias que permita comparar los datos.
Solución
Hallar el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas ciudades, y
usarlos para calcular el rango. Calcular el número de categorías, el número de datos es el máximo
número de datos (40) entre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños
muestrales. Siguiendo la regla de Sturges, el número de intervalos es:
k = 1 + 3,322 log10n = 1 + 3,322 log10(40) = 6,322 » 6 (Redondeo simple)

Distribución de clientes según consumo eléctrico


Consumo de energía Marca de clase
[217 ; 292] 254,5
]292 ; 367] 329,5
]367 ; 442] 404,5
]442 ; 517] 479,5
]517 ; 592] 554,5
]592 ; 667] 629,5
Fuente: Empresa A

RNotas importantes
60 Estadística Descriptiva 201901
Caso Aerolínea Wayra
Objetivo: Comparar el peso del equipaje de los pasajeros según tipo de pasajero.
Con este fin se extrajeron dos muestras aleatorias, la primera de 80 pasajeros de clase económica y la
segunda de 60 pasajeros de clase ejecutiva. Indique la clase que tenga valores concentrados en los
valores bajos.
Peso del equipaje de mano en clase económica Peso del equipaje de mano en clase ejecutiva
7,9 8,9 9,8 10,8 11,2 11,8 12,3 13,2 7,0 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 7,0 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 7,0 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 7,0 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 7,0 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 7,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,6 8,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,8 8,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 14,8 8,2 8,4 8,8 9,6 10,5 13,3
8,8 9,7 10,8 11,2 11,7 12,3 13,1 14,9 8,2 8,4 8,8 9,7 10,6 13,4
Fuente: Aerolínea Wayra

Solución
Interpretación

Representación
La unidad elemental es ………………….…………………………………………………….…………………………………………….
La variable en estudio es ………………………….…………………………………….……………………………………………………
Se hará la distribución de frecuencias con intervalos comunes pues …………………...……………………………….
Se usará la regla de Sturges.
Cálculo
El valor máximo de todos los datos es …………………… y el mínimo es ………………………...………………….
Luego, el rango de todos los datos es ……………………………..………………….
Siguiendo Sturges, la cantidad de intervalos es igual a k = 1 + 3,322 log(……….) esto es igual a ……………….
La amplitud es igual al rango entre la cantidad de intervalos, esto es, w = ……………………..
Distribución de pasajeros de clase económica según peso de equipaje
Intervalo Marca de clase Frecuencia absoluta fi
[ , ]
] , ]
] , ]
] , ]
] , ]
] , ]
] , ]
Fuente: Aerolínea Wayra

RNotas importantes
Unidad 2. Organización de Datos 61
Distribución de pasajeros de clase ejecutiva según peso de equipaje
Intervalo Marca de clase Frecuencia absoluta fi
[ , ]
] , ]
] , ]
] , ]
] , ]
] , ]
] , ]
Fuente: Aerolínea Wayra

Distribución porcentual de los pasajeros


según el peso de equipaje por clase
100%
90%
80%
Porcentaje de pasajeros

70%
60%
50%
40%
30%
20%
10%
0%
20 24 28 32 36 40 44
Fuente: Aerolínea Wayra Peso, en kilogramos

Análisis

Argumentación

RNotas importantes
62 Estadística Descriptiva 201901

Ejercicios de la Unidad 2
1. El objetivo de una investigación es estimar la media, en años, de la edad de los egresados de la
UPC. Indique el elemento, una variable a medir y una posible observación.
Rpta: Un egresado de la UPC, edad, 23 años
2. Según el estudio “Rumores de oficina”, el 42% de los ejecutivos limeños considera que los rumores
influyen mucho en el clima laboral de la oficina. Indique el elemento, una variable a medir y una
posible observación. Rpta: Un ejecutivo limeño, opinión sobre influencia de
rumores en clima laboral, no.
3. En una investigación, se quiere estimar el promedio del número de asistentes a los conciertos de
artistas internacionales realizados en Lima durante el año 2018. Indique el elemento, una variable
a medir y una posible observación. Rpta: Un concierto de artista internacional en Lima en el
2018, número de asistentes, 10 000.
4. El objetivo de una investigación en la ciudad de Lima es determinar la ocupabilidad en hoteles de
4 y 5 estrellas en Cusco durante el día de año nuevo del 2018, es decir, el porcentaje de habitacio-
nes ocupadas durante ese día. Indique la población y la muestra.
Rpta: Todas las habitaciones en hoteles de 4 y 5 estrellas
en Cusco en el día de año nuevo del 2018, algunas habitaciones en hoteles de 4 y 5 estrellas en Cusco en el año nuevo
del 2018.
5. El objetivo de una investigación en el Perú es determinar el promedio de la edad de las mujeres en
edad fértil que usan métodos anticonceptivos. Defina la población, muestra, elemento y variable.
El INEI considera a la edad fértil en las mujeres desde los 15 hasta los 49 años.
Rpta: Todas las mujeres en el Perú en edad fértil que
usan métodos anticonceptivos, algunas mujeres en el Perú en edad fértil que usan métodos anticonceptivos, una mujer
en el Perú en edad fértil que usan métodos anticonceptivos, edad.
6. Según los Censos Nacionales XI de Población y VI de Vivienda 2007 ejecutados por el INEI, el 50,30%
de los peruanos son mujeres. Indique si este dato es un parámetro o un estadístico.
Rpta: Parámetro
7. La nueva lista roja de aves de 2014, confeccionada con datos de BirdLife, muestra que, de las 10
425 especies de aves identificadas en el mundo, el 13% están amenazadas de extinción. Estas listas,
dice Juan Carlos Atienza, de SEO BirdLife, contribuyen establecer prioridades a la hora de favorecer
políticas de conservación y declarar nuevos espacios protegidos. Indique si este valor corresponde
a un parámetro o a un estadístico. Rpta: Estadístico
8. El gráfico muestra la evolución de la inflación desde el año 1980 al 2013. Indique si el índice de
precios al consumidor IPC que obtiene el INEI es un parámetro o un estadístico.

Rpta: Estadístico
9. El objetivo de una investigación es estimar el porcentaje de peruanos que aprueban la gestión de
del presidente de la República, para lo cual se tomó una muestra aleatoria de personas de 18 a 70
años y se les preguntó por su opinión. Los resultados son los siguientes.

RNotas importantes
Unidad 2. Organización de Datos 63
Desaprueba Aprueba Desaprueba Aprueba Desaprueba Desaprueba Desaprueba
No sabe Aprueba Aprueba Desaprueba Aprueba Aprueba Aprueba
Desaprueba Desaprueba Aprueba Aprueba Desaprueba No sabe Desaprueba
Aprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba Aprueba
Desaprueba Desaprueba Desaprueba Desaprueba Aprueba Desaprueba Desaprueba
Aprueba No sabe Desaprueba Desaprueba Aprueba Desaprueba No sabe
Aprueba Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba
Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba
Aprueba Desaprueba No sabe Aprueba Desaprueba Desaprueba Aprueba
Aprueba Aprueba Aprueba Desaprueba Desaprueba Desaprueba Desaprueba
Construya la distribución de frecuencias de los datos. Interprete los valores f2 y h1.
Rpta: f2 = 38 encuestados desaprueban la gestión del presidente
h1 = 0,3857, 3l 38,57% aprueban la gestión del presidente
Opinión fi hi
Aprueba 27 0.3857
Desaprueba 38 0.5429
No sabe 5 0.0714

10. Se tiene como objetivo mostrar la composición porcentual de alumnos universitarios en el Perú
por tipo de institución educativa al final de la secubdaria, para lo cual se tomó como referencia los
datos del II Censo Universitario 2010 realizado por el INEI, donde se preguntó a los alumnos
universitarios por el tipo de institución educativa donde terminaron su educación secundaria. Los
resultados se muestran en la siguiente tabla.
Tabla. …………………………………….………………………………………………………………………
Tipo de institución fi hi Ángulo
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789
Realice un diagrama circular con dichos datos.
Rpta:
Distribución de estudiantes de pregrado según institución donde
terminaron la secundaria
No escolarizado Otro
0.94% 0.07%
Particular religioso
12.38%

Estatal
54.05%
Particular
32.56%

Fuente: II Censo Universitario 2010 INEI Perú

RNotas importantes
64 Estadística Descriptiva 201901
11. Observe el siguiente gráfico e indique un posible error.

Rpta: El tamaño de la barra de Lima no es proporcional a la cantidad.


12. Observe los dos gráficos siguientes e indique la posible diferencia de interpretación entre ambos.

Rpta: Los ejes verticales tienen diferentes inicios y puede parecer haber más variabili-
dad en el gráfico de la izquierda, aunque los datos son los mismos.
13. En la agencia de viajes A se realizó una encuesta a 330 clientes respecto a las principales quejas
que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales se detallan en
el siguiente cuadro:
Agencia A. Distribución de clientes según principales quejas de clientes
Queja Número de quejas
Cambio de fecha de los vuelos 120
El hotel no era de la categoría que se veía en el folleto 94
Los hoteles no incluyen bebidas premium 61
La comida de los hoteles no es de calidad excelente 23
Otros 25
Que les venden otros servicios como tiempo compartido 7
Fuente: Dirección de Atención al cliente. Agencia A
Realice el diagrama de Pareto correspondiente a estos datos. Rpta:
Distribución de clientes según principales quejas de clientes
100% 90.3% 92.4% 100%
83.3%
Porcentaje acumulado
Porcentaje de clientes

90% 100.0% 90%


80% 80%
70% 64.8% 70%
60% 60%
50% 36.4% 50%
40% 28.5% 40%
30% 36.4% 18.5% 30%
20% 7.0% 7.6% 20%
10% 2.1% 10%
0% 0%
Cambio de El hotel no Los hoteles La comida de Que les Otros
fecha de los era de la no incluyen los hoteles venden otros
vuelos categoría bebidas no es de servicios
que se veía premium calidad
en el folleto excelente
Principal queja
Fuente: Agencia A

RNotas importantes
Unidad 2. Organización de Datos 65
14. Uno de los objetivos de una investigación en la empresa A es mostrar la composición porcentual
del número de cursos de capacitación dadas a sus trabajadores. Los siguientes datos muestran el
número de capacitaciones que 48 trabajadores han recibido en el presente año.
3 3 1 2 1 1 2 2 1 6 3 1 3 1 3 2 3 2 2 3 2 2 1 1
1 1 1 1 3 2 2 4 1 2 2 2 1 3 1 2 1 2 2 2 2 1 6 2
Construya el gráfico de bastones de frecuencias porcentuales para la variable “número de
capacitaciones”.
15. El objetivo de una investigación sobre la lúcuma, de la empresa A en el presente mes, es establecer
la distribución de su peso para la exportación. La lúcuma es originaria de las regiones tropicales de
Sudamérica. Es empleada, sobre todo, en la preparación de dulces, postres y helados. En el
siguiente cuadro se muestra el peso, en gramos, de una muestra de 60 frutos.
167 172 173 180 182 182 183 183 183 184 185 186
186 186 187 189 190 191 191 192 193 194 194 194
194 195 195 195 197 197 199 201 201 201 201 201
203 204 205 207 207 207 207 209 210 212 212 213
213 214 218 218 218 219 220 222 223 226 228 232
Realice la tabla de distribución de frecuencias de los datos.
16. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del último
mes de los empleados de la empresa A. Complete la tabla.
Empresa. A. Distribución de trabajadores según salarios, en soles, del último mes
Clase Marca de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
clase absoluta fi relativa hi acumulada Fi acumulada Hi
[1200 - ] 120
] - ] 1 800 300 0,42
] - ] 780
] - ] 150
] - ]
Fuente. Gerencia de Recursos Humanos. Agosto 2017. Empresa A
17. En economía, la prima de riesgo es el sobreprecio que paga un país para financiarse en los
mercados en comparación con otros países. Cuanto mayor es el riesgo país, más alta será su prima
de riesgo. Significa la confianza de los inversores en la solidez de una economía. La prima de riesgo
de los países de la Unión Europea se calcula respecto de Alemania porque su deuda pública es la
que tiene menor riesgo de impago. Para el caso de España, la agencia de calificación de riesgos A
ha medido la prima de riesgo durante 50 días desde junio del 2017.
España. Distribución de días según prima de riesgo. Junio y julio del 2017
Prima de riesgo Marca de clase fi hi Fi Hi
[ 120 ; 130 ] 125 1 0,0200 1 0,0200
] 130 ; 140 ] 135 3 0,0600 4 0,0800
] 140 ; 150 ] 145 11 0,2200 15 0,3000
] 150 ; 160 ] 155 14 0,2800 29 0,5800
] 160 ; 170 ] 165 12 0,2400 41 0,8200
] 170 ; 180 ] 175 6 0,1200 47 0,9400
] 180 ; 190 ] 185 3 0,0600 50 1,0000
Fuente: Agencia de Calificación de Riesgos A.
Grafique el histograma, el polígono de frecuencias y la ojiva de frecuencias relativas.

RNotas importantes
66 Estadística Descriptiva 201901
18. Indique el tipo y escala de medición de las siguientes variables y su escala de medición.
• Número de personas que van a ver una película Rpta: Cuantitativa discreta, razón
• Género de una película (drama, comedia, acción, etc.) Rpta: Cualitativa, nominal
• Duración de una película Rpta: Cuantitativa continua, razón
• Opinión sobre la película (buena, regular, mala) Rpta: Cualitativa, ordinal
19. En el II Censo Nacional Universitario del año 2010 realizado por el INEI se preguntó a los alumnos
del Perú por su tipo de universidad y su género. Los datos se muestran en el siguiente cuadro.
Perú. Distribución de alumnos de pregrado por género y tipo de universidad. 2010
Género Pública Privada Total
Mujer 135 082 247 743 382 825
Hombre 174 093 226 052 400 145
Total 309 175 473 795 782 970
Fuente: INEI. II Censo Universitario. 2010
a. Interprete el valor “135 082” de la tabla.
b. Elabore un gráfico comparativo que permita ver la composición porcentual según género y
tipo de universidad.
c. Elabore un gráfico comparativo que permita ver la composición porcentual según género por
tipo de universidad.
d. Elabore un gráfico comparativo que permita ver la composición porcentual según tipo de
universidad por género.
Rpta: c. y d.
Distribución de alumnos según género por tipo de
universidad
100%
90%
Porcentaje de alumnos

80%
56.31% 47.71%
70%
60%
50%
Hombre
40%
30% Mujer
52.29%
20% 43.69%
10%
0%
Pública Privada
Tipo de universidad
Fuente: INEI. II Censo Universitario 2010

20. Indique si son verdaderas o falsas las siguientes afirmaciones.


a. El valor de un parámetro se puede conocer solamente si se realiza un censo
b. En un estudio observacional se controlan las variables de interés
c. Solo las variables cuantitativas continuas pueden toman valores con decimales
d. Variable es el conjunto de mediciones obtenido de un elemento particular
e. Para graficar las ojivas se usan las marcas de clase
f. Con la ojiva se puede estimar el porcentaje de observaciones que corresponde a un intervalo
determinado
g. Para el polígono de frecuencias solamente se usa las frecuencias relativas
h. Los cuadros de doble entrada usan exclusivamente variables ordinales o nominales.
i. En un gráfico circular, el ángulo que le corresponde a cada parte se obtiene multiplicando 360º por la
respectiva frecuencia absoluta dividida entre la cantidad de datos.
j. La frecuencia porcentual de una clase es la proporción de elementos que pertenecen a esa clase.
k. En un gráfico de barras apiladas al 100%, el alto de las barras es igual en cada categoría.
Rpta: V, F, F, F, F, V, F, F, V, F, V

RNotas importantes
Unidad 2. Organización de Datos 67
21. Se ha tomado un examen a 100 personas y registrado el tiempo empleado en terminarlo. Indique
si son verdaderas o falsas las siguientes afirmaciones con respecto al gráfico.

Distribución porcentual de alumnos


según el tiempo en resolver un examen
100

Frecuencia acumulada
100
80 80
60 72

40 30 40
20
0
0 20 40 60 80 100
Tiempo (en minutos)
Fuente: Calidad Educativa Universidad A
a. El número de personas que tarda 20 minutos o menos es 30 Rpta: V
b. El número de personas que tarda más de 20 pero menos o igual a 70 minutos es 42 Rpta: V
c. El porcentaje de personas que tarda más de 60 minutos es 28% Rpta: V
d. El porcentaje de personas que tarda 25 minutos o menos es 40% Rpta: F
e. El porcentaje de personas que tarda 20 minutos es 30% Rpta: F
22. ¿Por qué se usan los gráficos de bastón para variables discretas en vez de un gráfico de barras?
23. ¿Por qué se redondea por exceso la amplitud en las distribuciones de frecuencias de datos
continuos? Rpta: Para que todos los valores estén incluidos en un intervalo.
24. Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda la
aerolínea. Teniendo en cuenta la siguiente información, elabore el diagrama de Pareto.
Distribución de pasajeros según principal queja del servicio de la aerolínea Wayra
Principal queja Número de pasajeros pi Fi Pi
Mucho tiempo en cola en el counter 124
La comida no es buena 59
Impuntualidad de los vuelos 25
Pocos vuelos 16
Tarifas muy caras 9
Otros 17
Fuente: Wayra S.A n = 250

Rpta:

RNotas importantes
68 Estadística Descriptiva 201901

Unidad 3. Medidas descriptivas

Logro de la unidad 3

Al finalizar la unidad 3,
el estudiante analiza el comportamiento de datos reales
aplicando las medidas de resumen de datos.

Temario
• Medidas de tendencia central: media aritmética, mediana, moda, media ponderada
• Medidas de posición: cuartiles, deciles, percentiles
• Medidas de dispersión: varianza, desviación estándar, coeficiente de variación
• Medidas de asimetría
• Diagramas de cajas

RNotas importantes
Unidad 3. Medidas descriptivas 69

Datos simples y datos agrupados

Datos simples Datos agrupados


Se denomina datos simples (datos no Se denomina datos agrupados a los valores que
agrupados) a los valores que no están están agrupados en distribuciones de
agrupados en distribuciones de frecuencia. frecuencia.

Ejemplo de datos simples Ejemplo de datos agrupados por intervalos


Distribución de obreros según descuentos en su planilla
10,6 14,5 17,2 12,8 13,6 11,6 Descuentos, en soles Marca fi hi Fi Hi
11,8 16,1 16,8 18,8 14,8 14,0 [204,1 ; 233,6] 218,85 16 0,208 16 0,333
]233,6 ; 263,1] 248,35 12 0,250 28 0,583
]263,1 ; 292,6] 277,85 7 0,145 35 0,729
]292,6 ; 322,1] 307,35 7 0,145 42 0,875
]322,1;351,6] 336,85 6 0,125 48 1,000
Total 48 1,000
Fuente: RRHH Empresa A

Si se tienen datos simples no se construye la distribución de frecuencias para calcular la media, la


mediana o cualquier estadístico, se prefiere el cálculo con los datos simples.

Luego de una investigación se tiene muchos datos, con ellos se puede realizar algunos gráficos y dis-
tribuciones de frecuencias, pero ¿cómo resumir alguna característica de la información en un solo nú-
mero?

Medidas de tendencia central


Una medida de localización o de tendencia central se refiere al valor central que representa a los datos
de una determinada variable.

Media Mediana Moda

RNotas importantes
70 Estadística Descriptiva 201901

Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos
valores dividida entre el número de valores.

Según los Censos Nacionales del 2017 en el Perú, la media de la edad de los peruanos es 31,51 años.
Interprete este valor.

En 2018, la media del consumo anual per cápita de carne de pollo en Lima Metropolitana fue de 80,5
kilogramos. Interprete este valor.

Se muestra un gráfico del CIES Football Observatory sobre la media de estatura de las 32 selecciones
que participaron en el Mundial de Rusia 2018. Bélgica es el equipo con mayor altura y Perú es la 31°.
Interprete el valor en el caso peruano.

RNotas importantes
Unidad 3. Medidas descriptivas 71
Cálculo de la media aritmética
La fórmula para la media poblacional es:
N

åx i
µ= i =1

N
Las fórmulas para la media muestral son:

Caso Aerolínea Wayra


A una muestra de tripulantes de la aerolínea Wayra se les preguntó el tiempo, en años, que venían
trabajando en Wayra. Si la media muestral es mayor a 3,5 años, se implementará un programa de
incentivo para que los tripulantes postulen a ascensos. Indique lo que hará la compañía.
3,8 4,7 7,0 4,4 6,5 4,1 2,5 0,8 6,3 7,1 1,4 1,2

Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
72 Estadística Descriptiva 201901

A una muestra de compradores frecuentes de la librería A se les preguntó por el número de libros que
compró en el en el último mes. Si la media muestral del número de libros comprados en el último mes
es mayor 1,5; se hará un descuento especial a este grupo de compradores.

Distribución de ……………………………………………………………..………………………………………………………….
Número de libros fi

0 30
1 255
2 146
3 47
4 32
Fuente: Librería A

Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 3. Medidas descriptivas 73
Caso Aerolínea Wayra
A una muestra de 500 pasajeros premium se les preguntó por la cantidad de dinero que estarían dis-
puestos a pagar por un menú gourmet durante un vuelo nacional. Si la media muestral es mayor a 40
soles, se ofrecerá dicho menú a los viajeros premium. Indique lo que se hará.
Distribución de viajeros premium según lo que pagarían por menú gourmet en vuelo nacional
Dinero (en soles) Marca de clase fi hi Fi Hi
[ , ] 40 0,05
] , ] 225
] , ] 50 0,75
] , ]
Fuente: Wayra

Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

Calcule la media de los siguientes grupos de números.


Grupo 1 1 2 3 4 5 6 7

Grupo 2 1 2 3 4 5 6 700

¿Qué nota al calcular la media de cada grupo?

RNotas importantes
74 Estadística Descriptiva 201901
Características de la media
- Se puede calcular para datos medidos en escala de intervalo o razón.
- El cálculo de la media es sencillo y es una medida muy conocida.
- El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy
grandes o muy pequeños con respecto a los demás.
- Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes, entonces,
la media de los n valores yi es:
𝑦" = 𝑎𝑥̅ + 𝑏

En una empresa ha decidido hacer dos ofertas a su sindicato sobre el aumento de sueldo anual a sus
trabajadores:
- Aumento general del 4%.
- Aumento del 2,5% más un bono de 90 soles.
Si el sueldo promedio es de 4600 soles, ¿cuál de las dos ofertas debe aceptar el sindicato si lo que
desea es hacer máximo el sueldo medio de los trabajadores?
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 3. Medidas descriptivas 75

Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.

Según los Censos Nacionales del 2017 en el Perú, la mediana de la edad de los hombres es 28 años.
Interprete este valor.

El Ministerio de Trabajo y el INEI ejecutaron la “Encuesta Nacional Especializada de Trabajo Infantil


2015” cuyo objetivo fue caracterizar el trabajo infantil en el Perú. La población tuvo de 5 a 17 años de
edad. La mediana del tiempo que trabajan a la semana fue de 14 horas. Interprete este valor.

Cálculo de la mediana

RNotas importantes
76 Estadística Descriptiva 201901
Caso Aerolínea Wayra
A una muestra de pasajeros se les registró el tiempo, en minutos, que demoraron en la cola hasta ser
atendidos en los counters del aeropuerto. Los datos se muestran en la tabla siguiente.

20 17 21 17 15 17 5 12 19 14 17 14 10 21 15 16

Si el 50% de los encuestados espera 15 minutos o menos no se aumentará la cantidad de personas en


los counters de atención del aeropuerto. Indique lo que hará la compañía.
Solución
Interpretación

Representación
La variable es ………………………………..………………………………y de esta variable se calculará ………………..……

Cálculo
Primero, …………………………….………………………………………………

13 16 18 17 18 17 5 12 19 14 17 14 10 21

Luego, calculamos la posición de la mediana.

Finalmente, calculamos el valor de la mediana.

Análisis

Argumentación

RNotas importantes
Unidad 3. Medidas descriptivas 77
Caso Aerolínea Wayra
De una muestra de 50 vuelos, se ha registrado el número de personas que pierden su vuelo por
presentarse tarde al counter del aeropuerto. Los datos se muestran a continuación.

Distribución de vuelos según número de personas que pierden el vuelo por llegar tarde
Número de pasajeros fi hi% Hi%

0 9 18% 18%
1 17 34% 52%
2 13 26% 78%
3 7 14% 92%
5 4 8% 100%
Fuente: Wayra

Calcule e interprete la mediana muestral.

Calcule la mediana de los siguientes grupos de números.


Grupo 1 7 10 11 13 16 17 18

Grupo 2 7 10 11 13 16 17 700

¿Qué concluye al calcular la mediana de cada grupo?

Características de la mediana
- Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
- La mediana no se ve afectada por valores extremos, por lo que se prefiere como medida de
tendencia central cuando hay datos extremos o la distribución de frecuencias no es simétrica.

RNotas importantes
78 Estadística Descriptiva 201901

Moda
La moda de un conjunto de datos de una variable es el valor que se presenta con mayor frecuencia.

Según los Censos Nacionales del 2017 en el Perú, la moda de la edad de los peruanos es 8 años.
Interprete este valor.

En el año 2016 se realizó el primer censo nacional penitenciario del Perú. Según este
censo, de la población penitenciaria que consumió alguna sustancia antes de cometer
el delito, el 79,1% consumió alcohol, marihuana 10,6% y pasta básica de cocaína 9,5%.
Interprete el valor de la moda.

Cálculo de la moda

Para datos en distribuciones de frecuencia por intervalo,


- si la moda está en el primer intervalo, entonces d1 es igual a la primera frecuencia.
- si la moda está en el último intervalo, entonces d2 es igual a la última frecuencia.

RNotas importantes
Unidad 3. Medidas descriptivas 79

Calcule la moda de los siguientes grupos de números.

Grupo 1 1 2 2 3 4 4 5

Grupo 2 1 2 2 3 4 4 500

¿Qué concluye al calcular la moda?

Características de la moda
- La moda se puede calcular para cualquier escala de medición.
- El valor de la moda no se ve afectada por valores extremos.
- La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
modas (multimodal). Algunas series de datos no tienen moda.
Caso Aerolínea Wayra
La empresa desea lanzar una promoción de pasajes a Bogotá. Va a establecer un precio 20% menor al
precio más frecuente pagado por una muestra aleatoria de pasajeros que hayan viajado a Bogotá en
los últimos seis meses. Indique el valor que establecerá la compañía.
Distribución de pasajeros según precio de pasajes a Bogotá, en dólares
Precios de pasajes Marca de clase Número de encuestados
300 453
1243
2189
500 976
Fuente Aerolínea Wayra S.A.
Interpretación

Representación
La variable es ………………………………………..………….……….. y de esta variable se va a calcular ……………………..
Cálculo

Análisis y argumentación

RNotas importantes
80 Estadística Descriptiva 201901

Media ponderada
Permite calcular el valor medio considerando la importancia o peso de cada valor sobre el total.
Cálculo de la media ponderada
n

åx w i i
La fórmula es: xw = i =1
n

åw
i =1
i

donde:
xi: Observación individual
wi: Peso asignado a cada observación

Las notas de un alumno de Estadística Descriptiva son:


DD1 DD2 PC1 PC2 Examen parcial Examen final

16 14 16 15 13 9

Si las evaluaciones de desempeño pesan…………………………………………………., la práctica calificada 1 y la


práctica calificada 2 …………………………………………….., el examen parcial …….……………, el examen final
………………… Si aprobó el curso con más de 14, el siguiente ciclo se matriculará en siete cursos. Indique
lo que hará el alumno.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 3. Medidas descriptivas 81

Cuantiles
Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que
comprenden el mismo número de valores. Los más usados son: cuartiles, quintiles, deciles, y
percentiles.

Cuartiles
Un cuartile se refiere a cada uno de los tres valores que dividen un grupo de datos (clasificados con
una relación de orden) en cuatro partes iguales, de manera que cada parte representa un cuarto de la
población.

Q1 Q2 Q3

25% 25% 25% 25%

Quintiles
Un quintil se refiere a cada uno de los cuatro valores que dividen un grupo de datos (clasificados con
una relación de orden) en cinco partes iguales, de manera que cada parte representa un quinto de la
población.

Qu1 Qu2 Qu3 Qu4

20% 20% 20% 20% 20%

Deciles
Un decil se refiere a cada uno de los nueve valores que dividen un grupo de datos (clasificados con una
relación de orden) en diez partes iguales, de manera que cada parte representa un décimo de la
población.

D1 D2 D3 D4 D5 D6 D7 D8 D9

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

Percentiles
Un decil se refiere a cada uno de los 99 valores que dividen un grupo de datos (clasificados con una
relación de orden) en cinco partes iguales, de manera que cada parte representa un 1% de la población.

P1 P2 P3 P97 P98 P99



1% 1% 1% 1% 1% 1%

RNotas importantes
82 Estadística Descriptiva 201901

Percentil
El percentil k-ésimo Pk es un valor tal que por lo menos k por ciento de las observaciones son menores
o iguales que este valor.
Mínimo Máximo
valor Percentil k (Pk) valor

El k% de los datos son El (100 – k)% de los datos


menores o iguales a Pk son mayores a Pk

Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es 11 años.
Interprete este valor.

Según la Asociación de AFP en el Perú el percentil 75 de las pensiones de personas con más de 20 años
de aporte es de S/2,464. Interprete dicho valor.

Cálculo del percentil

RNotas importantes
Unidad 3. Medidas descriptivas 83

Calcule el percentil 65 de los siguientes grupos de números.


Grupo 1 10 12 13 14 15 16 17

Grupo 2 10 12 13 14 15 16 17 700

¿Qué concluye al calcular dicho percentil?

Características de los percentiles


- Se puede calcular en variables medidas en escala ordinal, de intervalo y razón.
- El valor del percentil no se ve afectado por valores extremos.
Caso Aerolínea Wayra
Objetivo. Analizar el precio de los pasajes de clase económica de Lima a Miami para realizar una oferta
a los pasajeros que pagaron más.
Distribución de pasajes de clase económica a Miami según precio, en dólares
Precios de pasajes Marca de clase hi% Hi%
; 19,4% 19,4%
]600 ; 31,2% 50,6%
; 18,2% 68,8%
; 700 18,2% 87,0%
; 13,0% 100,0%
Fuente: Aerolínea Wayra S.A.
Se desea dar de cortesía un upgrade a primera clase a aquellos pasajeros que hayan pagado pasajes
que estén en el décimo superior de precio, siempre y cuando, el precio mínimo de un pasaje para
recibir el upgrade a primera clase sea mayor a 700 dólares. Indique si se hará el upgrade.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
84 Estadística Descriptiva 201901
Análisis

Argumentación

Caso Aerolínea Wayra


Objetivo. Analizar el porcentaje de pasajes con un precio superior a 500 dólares.
Distribución de pasajes de clase económica a Medellín según precio, en dólares
Precios de pasajes Marca de clase fi hi Fi Hi
; 45 0,225 45 0,225
; 500 85 0,425 130 0,650
; 35 0,175 165 0,825
; 600 25 0,125 190 0,950
; 10 0,050 200 1,000
Fuente: Aerolínea Wayra S.A.
Si el porcentaje de pasajes que han costado más de 500 dólares es mayor al 40% se hará una rebaja
para competir con las aerolíneas low cost. Indique lo que hará la compañía.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 3. Medidas descriptivas 85
Ejemplo 13
La siguiente tabla corresponde a la distribución de frecuencias de los 200 trabajadores de la empresa
A según salario, en dólares, del último mes.

Distribución de empleados según salario del último mes


Salario (en soles) fi hi Fi Hi
[450 – 650] 32 0,160 32 0,160
]650 – 850] 40 0,200 72 0,360
]850 – 1 050] 60 0,300 132 0,660
]1 050 – 1 250] 48 0,240 180 0,900
]1 250 – 1 450] 20 0,100 200 1,000
Fuente: Empresa A
Si el salario mínimo para estar en el 15% de los trabajadores mejores pagados es menor a 1200 dólares
se subirá el salario a dicho grupo de trabajadores.
Solución
Interpretación
Se debe establecer el salario mínimo del 15% de los trabajadores mejores pagados y compararlo con
1200 dólares.

Representación
Se va a calcular el percentil 85 del salario del último mes.

Cálculo
Usando las frecuencias absolutas se tiene:
w æ n ´ 85 ö æ 200 öæ 200 ´ 85 ö
P85 = Li + ç - F4 -1 ÷ = 1050 + ç ÷ç - 132 ÷ = 1208,33
f4 è 100 ø è 48 øè 100 ø
Usando las frecuencias relativas se tiene:
w æ 85 ö æ 200 ö æ 85 ö
P85 = Li + ç - H4 -1 ÷ = 1050 + ç ÷ ç - 0,66 ÷ = 1208,33
h4 è 100 ø è 0,24 ø è 100 ø
El sueldo mínimo para estar en el 15% de los trabajadores mejores pagados es 1208,33 dólares.

Análisis
El sueldo mínimo para estar en el 15% de los trabajadores mejores pagados no es menor a 1200
dólares.

Argumentación
Por lo tanto, la empresa no hará el aumento de salario a este grupo de trabajadores.

RNotas importantes
86 Estadística Descriptiva 201901

Medidas de variabilidad
Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y, por lo tanto, permiten evaluar la confiabilidad de ese valor central.
Si la medida de dispersión:
- tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central,
- tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia central.
Las medidas de variabilidad que estudiaremos son:

Desviación Coeficiente de Rango


Varianza Rango
estándar variación intercuartil

Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
Las unidades de la varianza son las unidades de los datos al cuadrado.
Cálculo de la varianza
N

å( x - µ )
2
i
La fórmula para la varianza poblacional es s2 = i =1

La fórmula para la varianza muestral es:

Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza.
La desviación estándar poblacional se denota por s y la muestral por s.

RNotas importantes
Unidad 3. Medidas descriptivas 87

Calcule la desviación estándar de los siguientes grupos de números.

Grupo 1 1 2 3 4 5 6 7

Grupo 2 1 2 3 4 5 6 700

¿Qué concluye al calcular dicha medida de dispersión?

Características de la varianza y la desviación estándar


- La varianza y la desviación estándar se ven afectadas por valores extremos.
- La varianza y la desviación estándar son números reales no negativos.
- Se pueden calcular para variables medidas en escala de intervalo o razón.
- La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que, la
desviación estándar es expresada en las mismas unidades de los datos.
- Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes, entonces,
la varianza de los n valores yi es:
SY2 = a2 SX2 SY = a SX

Caso Aerolínea Wayra


En una empresa se hace dos ofertas a su sindicato sobre el aumento de sueldo a sus trabajadores:
- Oferta 1: Aumento general del 4%.
- Oferta 2: Aumento del 2,5% más un bono de 90 soles.
Si el sindicato desea elegir la opción con la menor desviación estándar, indique la oferta que elegirá si
la antigua desviación estándar de los sueldos era de 650 soles.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
88 Estadística Descriptiva 201901
Análisis

Argumentación

Calcule la desviación estándar de los siguientes grupos de números.

Grupo 1 1 2 3 4 5 6 7

Grupo 2 1001 1002 1003 1004 1005 1006 1007

¿Los dos grupos de datos tienen la misma variabilidad?

Solución

Observe las dos imágenes siguientes.

Foto tomada de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas en
ambos grupos.
En el grupo de la izquierda hay mayor ……………………………………..……………. en el peso de las manzanas.
En el grupo de la izquierda hay menor ……………………………………..…………….en el peso de las manzanas.
En el grupo de la derecha hay mayor ……………………………………..…………….en el peso de las manzanas.
En el grupo de la derecha hay menor ……………………………………..…………….en el peso de las manzanas.

RNotas importantes
Unidad 3. Medidas descriptivas 89

Coeficiente de variación
El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la desviación
estándar en comparación con la media.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones
estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.

Es una medida de variabilildad relativa.

Cálculo del coeficiente de variación


)
La fórmula para el coeficiente de variación poblacional es CV = * x 100%

+
La fórmula para el coeficiente de variación muestral es CV = ,̅ x 100%

Seguramente en el grupo de manzanas a la derecha, el coeficiente de variación del peso de las


manzanas es …..……………………….…….…….. al coeficiente de variación del grupo a la izquierda.

Si un grupo de datos tiene un coeficiente de variación del 10%. Interprete dicho valor.

Características del coeficiente de variación


- El coeficiente de variación se calcula en variables medidas en escala de razón.
- Se debe calcular solo para valores positivos.

RNotas importantes
90 Estadística Descriptiva 201901
Caso Aerolínea Wayra
Objetivo: Analizar si la compra con promociones genera mayor variabilidad de los tiempos de espera
en la compra de un pasaje.

Distribución de pasajeros según tiempos de espera para adquirir un boleto


por condición de compra
40%
35% 36.3%
Porcentaje de pasajeros

Sin promoción
30% 30.0% Con promoción
26.7%
25% 23.3% 25.0%
20% 20.0%
17.5%
15%
10% 11.3%
5% 2.5%
3.8% 1.3% 2.5%
0.0%
0%
7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5
Tiempos de espera, en minutos
Fuente: Aerolínea Wayra S.A.

Se hará una oferta para la condición de compra (sin o con promoción) con mayor variabilidad en el
tiempo de espera.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 3. Medidas descriptivas 91
Ejemplo 14
Los siguientes datos representan resúmenes del número de mediciones de resistencia a la tracción de
cierto artículo que realizaron dos grupos de técnicos.
Grupo 1: media = 3 y desviación estándar = 1,10
Grupo 2: media = 5 y desviación estándar = 1,66
En el grupo con las mediciones que presenten mayor dispersión, se revisará exhaustivamente el
proceso de producción.
Solución
Interpretación
Se debe tener qué grupo tiene las mediciones más dispersas.

Representación
Como los promedios son diferentes, se usa como indicador de dispersión al coeficiente de variación.

Cálculo
1,10
CV1 = ´ 100% = 36,67%
3
1,66
CV2 = ´ 100% = 33,20%
5
Análisis
Las mediciones son más dispersas en el grupo 1, pues su coeficiente de variación es mayor.

Argumentación
Se revisará exhaustivamente el proceso de producción del grupo 1.

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el
dato mayor y el dato menor.
Cálculo del rango
Rango = R = Xmáximo - Xmínimo
Mínimo valor Máximo valor

Rango = Xmáx - Xmín


donde Xmáximo y Xmínimo son los valores máximo y mínimo observados de la variable

Características del rango


- Se puede calcular en variables medidas en escala de intervalo o razón
- Se ve muy afectado por valores extremos.

RNotas importantes
92 Estadística Descriptiva 201901

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Cálculo del rango intercuartil
Rango intercuartil = RIC = Q3 – Q1= P75 – P25

25% 50% 25%

P25 P
75
RIC = P75- P25
Características del rango intercuartil
- Se puede calcular en variables medidas en escala de intervalo o razón.
- No se ve afectado por valores extremos.

Medidas de asimetría

Coeficiente de asimetría de Pearson


Mide si los datos aparecen ubicados simétricamente o no respecto de la media.

Cálculo del coeficiente de asimetría de Pearson


El coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:
æ x - Mediana ö
As = 3ç ÷
è s ø

Si el coeficiente de simetría As es:

positivo, indica sesgo a la igual a cero, la distribución negativo, indica sesgo a la


derecha (cola derecha). es simétrica alrededor de la izquierda (cola izquierda).
La media es mayor a la media. La media es menor a la
mediana. La media es igual a la mediana.
mediana.

RNotas importantes
Unidad 3. Medidas descriptivas 93

Complete los siguientes textos.


Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores …………………………………………

Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores …………………………………………

En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asimetría
…………………..…….., porque …………………………………………………..…………………..…………………………………………

En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen un
coeficiente de asimetría …………………………………..….………….., porque …………………………….……………………..
………………………………………………………………………………………………………….………………

Observe la imagen siguiente.


PERÚ: Distribución porcentual de peruanos según edad por sexo. 2007 Y 2017

Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda.

Complete los siguientes textos, con respecto a las edades de la población del Perú.
En el grupo de los hombres y mujeres existe una mayor concentración en las edades con valores
…………………………………………………..

En el grupo de los hombres y mujeres existe una menor concentración en las edades con valores
…………………………………………………..

Seguramente en el grupo de los hombres y mujeres, las edades tiene coeficiente de asimetría
…………………………………………………..

RNotas importantes
94 Estadística Descriptiva 201901

Diagrama de cajas
Un diagrama de cajas es una gráfica que describe la distribución de un conjunto de datos tomando
como referencia los valores de los cuartiles como medida de posición y el valor del rango intercuartil
como medida de referencia de dispersión. Además, nos permite apreciar visualmente el tipo de
distribución de los datos (simétrica o asimétrica) y la identificación de valores extremos (datos
atípicos).
Dato atípico
Es un dato inusualmente grande o pequeño con respecto a los
otros datos. Se considera dato atípico a cualquier punto que esté:
- a más de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
- a más de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil

Pasos para trazar un diagrama de cajas

En la caja se traza una recta vertical en el


Se traza un rectángulo con los extremos en lugar de la mediana. Así, la línea de la
el primer y tercer cuartil mediana divide los datos en dos partes
iguales

Se ubican los límites mediante el rango


intercuartil,
Se trazan los bigotes desde los extremos de
el límite superior está a 1,5 RIC arriba (o a la
las cajas hasta los valores mínimo y máximo
derecha) de Q3
dentro de los límites inferior y superior
el límite inferior está a 1,5 RIC debajo (o ala
izquierda) de Q1

Se marcan con un asterisco (*) las


localizaciones de los valores atípicos

RNotas importantes
Unidad 3. Medidas descriptivas 95

Se quiere comparar los tiempos para realizar una cierta tarea, con y sin capacitación. ¿Se podría afirmar
que la capacitación reduce el tiempo de realizar la tarea?
Tiempo, en minutos, para realizar una tarea, sin o con capacitación
Sin 8 12 15 16 23 25 27 30 35 35 34 40 43 46 48 49 52 54 60 80
Con 8 11 13 13 15 20 23 24 25 26 30 31 32 34 35 37 40 42 70
Solución
Interpretación

Representación

Cálculo
Estadísticos Sin capacitación Con capacitación
Percentil 25
Percentil 50
Percentil 75
Rango intercuartil
Largo máximo del bigote = 1,5 RIC
Límite inferior = P25 – 1,5 RIC
Límite superior = P75 + 1,5 RIC
Mínimo
Máximo

Distribución de trabajadores según ……………………………………… por ………………………………………… …….


90
80
70
60
50
40
30
20
10
0
Sin capacitación Con capacitación
Condición de capacitación
Fuente: Empresa A

Análisis

RNotas importantes
96 Estadística Descriptiva 201901
Ejemplo 15
Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la
variabilidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos
policiales en la estación (invierno o verano) que presente mayor cantidad de delitos.
Solución
Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.
Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.
Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos
simples. No calcule la distribución de frecuencias.
Estadísticos Invierno Verano
Percentil 25 7,5 9,0
Percentil 50 16,0 20,0
Percentil 75 20,5 26,5
Rango intercuartil 20,5 – 7,5 = 13,0 26,5 – 9,0 = 17,50
Largo máximo del bigote = 1,5 RIC 1,5 x 13 = 19,5 1,5 x 17,5 = 26,25
Límite inferior = P25 – 1,5 RIC 7,5 – 19,5 = -12,0 9,0 – 26,25 = -17,25
Límite superior = P75 + 1,5 RIC 20,5 + 19,5 = 40 26,5 + 26,25 = 52,75
Para el invierno, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como máximo a 22.
Para el verano, de acuerdo con los datos, los bigotes llegan como mínimo a 5 y como máximo a 28.

Análisis
La mediana es mayor en verano, el RIC es más grande en invierno, no hay valores atípicos, pues ningún
está fuera de los límites.
Argumentación
De acuerdo al gráfico se debe destinar más efectivos policiales en verano.

RNotas importantes
Unidad 3. Medidas descriptivas 97

Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase mencionada.

Frase Se debe calcular o realizar:

“Calcule el valor más frecuente de los datos”

“Determine el grupo que tenga mayor variabilidad en el


50% de los valores centrales”

“Encuentre el grupo que tenga valores concentrados en


los valores más pequeños”

“Determine el grupo que tenga mayor variabilidad de los


datos”

“Haga un gráfico que muestre la distribución porcentual


según la variable 1 por la variable 2”

“Calcule el valor mínimo para estar en el cuarto superior


de los datos”

“Calcule la mejor medida de tendencia central (media o


mediana) cuando hay mucha asimetría”

“Realice un gráfico que permita visualizar los valores


atípicos”

“Calcule el valor para el cual los valores están alrededor”

“Calcular el valor que está en el centro de los datos”

“Haga un gráfico que muestre que pocos factores son


vitales y muchos son triviales”

“Calcule el valor máximo para estar en el quinto inferior


de los datos”

“Calcule un estadístico que se pueda calcular en todas


las escalas de medición”

“Haga un gráfico que muestre las frecuencias


acumuladas”

“Si la medida de variabilidad es igual a 15%, nos


referimos a…”

“Si la medida de variabilidad de la estatura de un grupo


de personas es igual a 10 cm, nos referimos a…”

RNotas importantes
98 Estadística Descriptiva 201901

Frase Se debe calcular o realizar:


“Si la medida de variabilidad de la estatura de un grupo
de personas es igual a 100 cm2, nos referimos a…”
“Realice un gráfico adecuado para una variable ordinal”

“A cada alumno de esta sección le preguntamos su


nombre, edad y sexo. Indique una observación”
“Si hacemos un censo, podemos calcular diversos ………,
como por ejemplo, ……………………………..”

Empareje los siguientes enunciados y conceptos.


Enunciado Concepto

A. El tipo de película más visto fue comedia. I. Parámetro

B. El número de personas que fueron al cine hoy. II. Media

C. El 80% de los días asistieron al cine 1350 personas o me-


III. Percentil 20
nos.

D. Hoy día fueron 320 personas al cine. IV. Coeficiente de variación

E. Todos los días en que se proyectan una película. V. Moda

F. La variabilidad del número de espectadores por día es


VI. Variable continua
204,5 espectadores.
G. La media de los espectadores por día fue de 689 especta-
VII. Mediana
dores durante toda la temporada.
H. El número de espectadores por día en esta semana estuvo
VIII. Percentil 80
alrededor de 710.
I. La variabilidad del número de espectadores por día en el
IX. Rango intercuartil
50% central es 64,5 espectadores.

J. El 50% de los días fueron al cine más de 812 personas. X. Dato

K. La duración de una película. XI. Población

L. El 80% de los días asistieron al cine más de 625 personas. XII. Desviación estándar

M. La variabilidad del número de espectadores por día es de


XIII. Observación
18,2%
N. El día 8 de marzo asistieron 3234 personas, se proyectó 8
XIV. Variable discreta
películas, se vendió 1245 combos, etc.

RNotas importantes
Unidad 3. Medidas descriptivas 99

Marque con una equis las medidas de resumen que se pueden calcular con una variable medida en
cada escala de medición.

Medida de resumen Nominal Ordinal Intervalo Razón


Media

Mediana

Moda

Percentil

Varianza

Desviación estándar

Coeficiente de variación

Rango

Rango intercuartil

Coeficiente de asimetría

RNotas importantes
100 Estadística Descriptiva 201901

Ejercicios de la Unidad 3
1. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.
1,67 1,70 1,83 1,65 1,70 1,65 1,60 1,70 1,61 1,69
Rpta: 1,68 m.
2. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años.
Distribución de una muestra de peruanos de 18 años, según su estatura
Estatura (en metros) fi hi
1,60 50 0,2778
1,63 78 0,4333
1,66 28 0,1556
1,70 14 0,0778
1,75 10 0,0556
Fuente: MINSA
Calcule e interprete la media de la estatura de la muestra. Rpta: 1,638 metros
3. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años. Complete la distribución de frecuencias.
Distribución de una muestra de peruanos de 18 años, según su estatura
Estatura (en metros) Marca de clase fi hi Fi Hi

[ , ] 155 0,48

] , ] 0,32

] , ] 167 0,95

] , ] 600
Fuente: MINSA
Calcule e interprete la media de la estatura de la muestra. Rpta: 159,62 soles
4. Una tienda rebaja los precios, en 12%, a toda su línea de casacas. Si la media de los precios de las
casacas antes de la rebaja era de 155 soles. Calcule la nueva media de los precios.
Rpta: 136,4 soles
5. En una empresa el sueldo medio es 2500 soles. La gerencia, luego de la negociación con el sindi-
cato, decide realizar un aumento del 3,5% y un bono de 150 soles a cada trabajador. Calcule el
nuevo sueldo medio. Rpta: 2737,5 soles
6. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos clientes del
supermercado A.
5,3 2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5
Calcule e interprete el valor de la mediana. Rpta: 5,4 minutos
7. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a las madres peruanas que fueron menores de edad cuando nació su primer hijo(a)
nacido vivo, obteniéndose los siguientes resultados.

RNotas importantes
Unidad 3. Medidas descriptivas 101
Perú. Distribución de peruanas según edad al nacer su primer hijo(a) vivo. 2007
Edad de la madre fi hi Fi Hi
12 años 6,380 0,0054 6,380 0,0054
13 años 13,840 0,0118 20,220 0,0173
14 años 62,898 0,0537 83,118 0,0710
15 años 210,250 0,1795 293,368 0,2505
16 años 366,822 0,3132 660,190 0,5636
17 años 511,133 0,4364 1,171,323 1,0000
Fuente: PERÚ, INEI. Censos Nacionales 2007
Calcule e interprete la mediana de la variable en estudio. Rpta: 16 años
8. En una ciudad, se tomó una muestra aleatoria de 1000 personas y se les preguntó por su ingreso
mensual, en dólares, obteniéndose los siguientes resultados.
Distribución de personas según ingreso mensual
Ingreso (en dólares) Marca de clase fi hi Fi Hi
[ 300 , 700 ] 500 104 0,104 104 0,104
] 700 , 1 100 ] 900 224 0,224 328 0,328
] 1 100 , 1 500 ] 1 300 437 0,437 765 0,765
] 1 500 , 1 900 ] 1 700 151 0,151 916 0,916
] 1 900 , 2 300 ] 2 100 84 0,084 1000 1,000
Fuente: Empresa A

Calcule e interprete la mediana de la variable en estudio. Rpta: 1257,44 dólares


9. En la empresa A se tomó un examen de conocimientos sobre los procesos administrativos. Los
resultados se muestran en la siguiente tabla:
Distribución de trabajadores según resultados del examen de conocimientos
Puntaje del examen Marca de clase fi hi Fi Hi
[ 20 , 40 ] 30 54 0,3103 54 0,3103
] 40 , 60 ] 50 60 0,3448 114 0,6552
] 60 , 80 ] 70 48 0,2759 162 0,9310
] 80 , 100 ] 90 12 0,0690 174 1,0000
Fuente: Empresa A
Calcule e interprete la moda del puntaje. Rpta: 46,673 puntos
10. Complete los siguientes textos:
“La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho
conjunto. El …………………………………………….. son menores o igual a la mediana.”
“Usar la mediana como medida de tendencia central es preferible a usar la media
cuando…………………………………………………….………………………”
11. Calcule e interprete la moda de los siguientes datos, que corresponden al número de errores
ortográficos por correo electrónico que cometen algunos gerentes de una empresa en una
comunicación escrita.
2 2 5 2 3 3 2 3 2 1 2 0 0 1 3 0 3 2 1 2
4 2 1 3 1 1 3 3 3 1 2 4 2 0 1 4 2 2 2 2

RNotas importantes
102 Estadística Descriptiva 201901
12. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. La mediana se puede calcular solo en variables cuantitativas
b. La media es un valor que siempre está entre el mínimo valor y el máximo valor de los datos
c. Si se tienen datos simples se construye la distribución de frecuencias para calcular la mediana
d. La media se puede calcular solo en variables medidas en escala de razón Rpta: F, V, F, F
13. Los siguientes datos corresponden a consumos, en soles, de alumnos en la cafetería de una
universidad. Calcule la desviación estándar y la varianza. Rpta: 2,945 y 8,67
3,0 7,5 5,5 12,0 6,5 2,7 2,0 4,5 8,0 4,0 2,5 3,0 1,5 7,0
14. Los datos corresponden a las notas de 327 alumnos en la primera práctica de Estadística
Descriptiva del ciclo anterior. Calcule la desviación estándar muestral.
Distribución de alumnos según notas de la primera práctica de Estadística Descriptiva
Nota fi hi Fi Hi
12 110 0,3364 110 0,3364
14 136 0,4159 246 0,7523
15 44 0,1346 290 0,8869
16 37 0,1131 327 1,0000
Fuente: Secretaría Académica. Universidad A
15. Los datos muestran las ventas de 90 vendedores de una empresa en el último mes.
Distribución de vendedores según volumen de venta en el último mes
Ventas, en miles de dólares Marca de clase fi hi Fi Hi
[5,0 - 7,8] 6,4 13 0,144 13 0,144
]7,8 - 10,6] 9,2 20 0,222 33 0,367
]10,6 - 13,4] 12,0 38 0,422 71 0,789
]13,4 - 16,2] 14,8 19 0,211 90 1,000
Fuente: Empresa A
Calcule la desviación estándar muestral.
16. En una tienda, la desviación estándar de los precios de los jeans es de 20 soles, calcule la nueva
desviación estándar de los precios de los jeans si se realiza:
a. una rebaja del 6% de todos los precios, Rpta: 18,8 soles
b. una oferta y se rebaja ocho soles a cada precio. Rpta: 20,0 soles
17. El siguiente cuadro muestra la distribución de los sueldos mensuales, en soles, de los empleados
de las empresas A y B.
Distribución de empleados según salario mensual de las empresas A y B
Sueldos Empresa A Marca de clase fi Sueldos Empresa B Marca de clase fi
[1 500 – 2 500] 2 000 120 [3 000 – 3 500] 3 250 150
]2 500 – 3 500] 3 000 80 ]3 500 – 4 000] 3 750 120
]3 500 – 4 500] 4 000 77 ]4 000 – 4 500] 4 250 45
]4 500 – 5 500] 5 000 63 ]4 500 – 5 000] 4 750 55
Fuente: Empresa A Fuente: Empresa B
¿Cuál de los grupos presenta mayor variabilidad de salarios?

RNotas importantes
Unidad 3. Medidas descriptivas 103
Si en la empresa A hay un aumento de sueldo del 6%, mientras que en la empresa B se da un
aumento de sueldo del 4% y una bonificación de 120 soles. Luego de los aumentos, ¿qué grupo
presenta mayor variabilidad de salarios?
18. Los siguientes datos representan las notas de la primera práctica de alumnos de Estadística
Descriptiva. Calcule e interprete el percentil 25 de los siguientes datos.
Distribución de alumnos según notas de la primera práctica de Estadística Descriptiva
xi fi hi Fi Hi
12 5 0,025 5 0,025
13 46 0,230 51 0,255
14 109 0,545 160 0,800
16 40 0,200 200 1,000
Fuente: Secretaría Académica. Universidad A
19. Las notas de un curso de capacitación sobre tributación se muestran en la siguiente distribución
de frecuencias.
Distribución de empleados según notas del curso de capacitación
Notas Marca de clase fi hi Fi Hi
[08 – 10] 9 15 0,1056 15 0,1056
]10 – 12] 11 48 0,3380 63 0,4437
]12 – 14] 13 60 0,4225 123 0,8662
]14 – 16] 15 12 0,0845 135 0,9507
]16 – 18] 17 7 0,0493 142 1,0000
Fuente: Empresa A. Gerencia de RRHH
Calcule la nota mínima para estar en el quinto superior.
Calcule la nota máxima para estar en el 10% de las notas más bajas.
Calcule el porcentaje de personas que tuvo notas menores o iguales a 13.
Calcule el porcentaje de personas que tuvo notas mayores a 12 y menores o iguales a 15,5.
20. Dados los siguientes datos, calcule e interprete el percentil 30 y el percentil 75.
38 45 20 20 10 12 18 28 18 23 11 15 3 5 6 4 3 5 5
21. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la
siguiente tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6
22. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. El percentil 90 es siempre mayor al percentil 10 Rpta: F
b. El cuartil 2 es igual al decil 5 Rpta: V
c. El percentil siempre se expresa en porcentaje Rpta: F
d. Si todos los pesos son iguales, la media ponderada es igual a la media aritmética Rpta: V
e. La media ponderada no tiene unidades Rpta: F

RNotas importantes
104 Estadística Descriptiva 201901
f. El coeficiente de asimetría tiene unidades las mismas unidades que los datos Rpta: F
g. Si a cada valor de un grupo de datos se le aumenta en 10%, el coeficiente de asimetría no varía
Rpta: V
h. Si a cada valor de un grupo de datos se le aumenta 10 unidades, el coeficiente de asimetría no varía
Rpta: V
i. En un diagrama de cajas siempre se puede conocer el máximo y mínimo de un grupo de datos
Rpta: V
j. El coeficiente de variación se puede calcular en escalas de intervalo y de razón Rpta: F
k. Si las unidades de los datos son minutos, la varianza se expresa en minutos al cuadrado Rpta: V
l. El rango intercuartil se ve muy afectado por valores muy grandes o muy pequeños Rpta: F
m. El coeficiente de variación tiene las mismas unidades que la varianza Rpta: F
23. La siguiente tabla muestra información de los precios del artículo A (en soles) en establecimientos
elegidos al azar en el distrito de La Molina.
Distribución de establecimientos de la Molina según precios del artículo A
Intervalo de Marca de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
clase clase absoluta relativa acumulada acumulada
– 4
– 0,150
– 0,300 22
– 8,35 8
– 0,900
– 40
Fuente: Indecopi
Complete la tabla anterior si se sabe que el rango intercuartil es 0,8.
24. De datos sacados de la Intranet de la Universidad A, se desea comparar el resultado de la primera
práctica de tres horarios de un curso de estadística, para lo cual, se tienen los siguientes resultados.
H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2 4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18
H3 9 9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17
Construya un diagrama de cajas que permita comparar el resultado de los horarios.
Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil y el
horario donde existen valores atípicos.
25. Complete el siguiente texto:
“Los datos atípicos se define como ……………………….……………………………………………………..”
“Se trazan los bigotes desde los … ……………………... de las cajas hasta los valores mínimo y máximo
……………..……………. de los límites inferior y superior.
26. En un examen de Estadística Descriptiva se tomó la siguiente pregunta:
Con la intención de conocer los hábitos y preferencias de los estudiantes acerca de los productos
naturales, se contrató los servicios de la consultora Data Mining Today S.A. la cual elaboró una
encuesta para el estudio de mercado y se aplicó a 400 estudiantes de diferentes instituciones
educativas. Algunos resultados fueron:
- El 70% de los encuestados prefiere consumir productos naturales enlatados.
- La fruta más consumida es la manzana, seguida por el plátano y la pera.

RNotas importantes
Unidad 3. Medidas descriptivas 105
- El gasto promedio por semana en productos naturales es de 25 soles con una desviación
estándar de 5 soles.
- El 15% de los encuestados gasta más de 28 soles semanales en productos naturales.
- El 50% de los encuestados tiene una edad superior a 20 años.
- El número promedio de vasos de yogurt consumidos durante la semana es de 6.
En base a esta información indique: (4,0 puntos)
Población
Variable cuantitativa continua
Variable cuantitativa discreta

Variable Nombre del estadístico Valor del estadístico


Tendencia central
Dispersión
Posición

Lo siguiente es la respuesta de un alumno, póngale nota.


Población Los 400 estudiantes de diferentes instituciones educativas

Cuantitativa continua Gasto promedio semanal en productos naturales

Cuantitativa discreta Número promedio de vasos de yogurt consumidos durante la semana

Variable Nombre del estadístico Valor del estadístico

Tendencia Manzana, plátano y


Fruta consumida Moda
central pera
Gasto promedio semanal en
Dispersión Desviación estándar 5 soles
productos naturales
Posición Tipo de producto preferido Percentil 70
Rpta: Nota cero
27. El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:
13 12 13 14 15 15 15 18 23 24 24 25 25 36 42 48 60
Calcule el coeficiente de asimetría de Pearson.
28. Se muestra la distribución de los sueldos mensuales de los empleados de las empresas A y B.
Distribución de empleados según de sueldos mensuales en la empresa A y B
Sueldos Empresa A Marca de clase fi Sueldos Empresa B Marca de clase fi
[1 500 – 2 500] 2 000 45 [3 000 – 3 500] 3 250 18
]2 500 – 3 500] 3 000 148 ]3 500 – 4 000] 3 750 70
]3 500 – 4 500] 4 000 60 ]4 000 – 4 500] 4 250 70
]4 500 – 5 500] 5 000 15 ]4 500 – 5 000] 4 750 18
Fuente: Empresa A Fuente: Empresa B
Calcule la asimetría de los dos grupos. Realice una conclusión. Rpta: AsB = 0

RNotas importantes
Unidad 4. Teoría de la probabilidad

Logro de la unidad 4

Al finalizar la unidad 4,
el estudiante analiza situaciones reales de incertidumbre,
utilizando conceptos relacionados con probabilidades.

Temario
• Reglas de conteo y combinaciones
• Probabilidad: concepto, experimento aleatorio, espacio muestral y evento
• Operaciones con eventos
• Probabilidad condicional
• Probabilidad total
• Teorema de Bayes
• Diagrama del árbol
• Eventos independientes
108 Estadística Descriptiva 201901

Experimentos, reglas de conteo y asignación de probabilidades


La probabilidad mide o cuantifica la posibilidad de ocurrencia de un evento.

Marque con un aspa, asignando una opción a la situación de acuerdo con su posibilidad de ocurrencia.
Muy poco Poco Igualmente probable Bastante Muy
Situación
probable probable que ocurra o no probable probable
Una mujer será la próxima
presidenta del Perú
Habrá un terremoto en
Lima en el presente año
Perú clasificará al Mundial
Qatar 2022
Aprobaré este curso

Experimento aleatorio
Es todo proceso que genera dos o más resultados bien definidos sin que se pueda predecir con certeza
cuál de ellos será observado u ocurrirá en cada realización del proceso. En cualquier repetición simple
de un experimento, ocurrirá uno y solo uno de los posibles resultados experimentales.

Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales. Se le suele
simbolizar por S o Ω.

Evento
Un evento es un subconjunto del espacio muestral. Al realizar un experimento, diremos que el evento
A ha ocurrido si el resultado obtenido es un elemento del evento A.

Probabilidad de un evento
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la
probabilidad es una medida del grado de incertidumbre asociado con un evento.
Los valores de la probabilidad siempre se asignan en una escala de 0 a 1. Una probabilidad cercana a
0 indica que es difícil que el evento ocurra, mientras que, una probabilidad cercana a 1 indica que es
casi seguro que el evento ocurra.

Poca probabilidad Alta probabilidad


de ocurrencia de ocurrencia

0 0,5 1
La ocurrencia del evento es
tan probable como improbable

RNotas importantes
Unidad 4. Teoría de Probabilidad 109

Complete el siguiente cuadro asignando probabilidades según su parecer.


Experimento aleatorio Espacio muestral Un evento Probabilidad

Nicolás Maduro dejará la


S={ A={ P(A) =
presidencia antes de fin de año.

El producto bruto interno (PBI) en


el Perú crecerá al menos 4% en el S={ A={ P(A) =
presente año.

Definición clásica de la probabilidad de un evento


Sea un experimento aleatorio cuyo correspondiente espacio muestral S está formado por un número
n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la
probabilidad de un evento como:
n(A ) número de casos favorables al evento A
P(A) = =
n(S ) número total de casos

Complete el siguiente cuadro.


Experimento Espacio muestral Evento Probabilidad
aleatorio

Se lanza un dado,
-(/)
calcule la probabilidad S = {1, 2, 3, 4, 5, 6} A = {3 ,5} P(A) =
-(1)
= =
de que salga 3 ó 5.

Se lanzan dos dados,


calcule la probabilidad S = {(1,1); (1,2); (1,3); -(/)
A={ P(A) = = =
de que la suma sea ....; (6,6)} -(1)
mayor a 7.

Se saca una carta de


un mazo de 52 naipes, S = {…………………….………
calcule la probabi- …………………………………... -(/)
A={ P(A) = -(1) = =
llidad de que salga una …………………………….……..
carta mayor a 8 o de …………………………………..}
espadas.
Se saca una bola de
una urna con tres S = {…………………….………
bojas rojas y cuatro …………………………………... -(/)
A={ P(A) = -(1) = =
rojas, calcule la …………………………….……..
probabilidad de que …………………………………..}
sea roja.

RNotas importantes
110 Estadística Descriptiva 201901

Algunas relaciones básicas de probabilidad


Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual
emplear la notación de conjuntos para describir los eventos construidos de esta forma.
Sea e un experimento aleatorio y S el espacio muestral asociado. Si A y B son dos eventos definidos
en S, se define las siguientes operaciones con eventos.

Complemento (AC)
Para un evento A cualquiera se define su complemento AC como el evento
consistente en todos los puntos de S que no están en A.

Se tiene que P(A) = 1 - P(AC)


AC se expresa como: “El evento A no ocurre”.

Escriba el evento complementario al evento A:= Keiko Fujimori es puesta en libertad este año.

Una gerente toma diez decisiones en su empresa. Escriba el evento complementario al evento A:= La
gerente tiene razón en cuatro o menos de las decisiones.

Complete los espacios en blanco.


La probabilidad de que una empresa gane una licitación es 0,60, por lo tanto, la probabilidad de que
no la gane ……………………….
La probabilidad de que una persona gane la Tinka con una jugada es del 0,0000123%, por lo tanto, la
probabilidad de que no la gane en una jugada es …………………………%.

Unión de eventos (A È B)
Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen todos los
puntos de S que pertenecen a A o a B o a ambos.

A È B se expresa como: “Al menos uno de los eventos A o B ocurre”.

RNotas importantes
Unidad 4. Teoría de Probabilidad 111

Intersección de eventos (A ∩ B)
Para dos eventos A y B, la intersección de los eventos A y B es el evento que contienen todos los puntos
de S que pertenecen tanto a A como a B.

A Ç B se expresa como: “Ambos eventos, A y B ocurren a la vez”.

Diferencia de eventos (A - B)
Para dos eventos A y B, la diferencia de los eventos A y B es el evento que contienen todos los puntos
de S que pertenecen a A y no pertenecen a B.

A – B se expresa como: “Ocurre el evento A pero no el evento B”.

Diferencia simétrica de eventos (A ∆ B)


Para dos eventos A y B, la diferencia simétrica de los eventos A y B es el evento que contienen todos
los puntos de S que pertenecen solo a A o aquellos que solo pertenecen a B.

A D B se expresa como: “Ocurre solo uno de los eventos A o B”

RNotas importantes
112 Estadística Descriptiva 201901

Un financista invierte en fondos mutuos y en la Bolsa de Valores. Se definen los eventos:


A:= que el financista tenga éxito en la inversión de fondos mutuos.
B:= que el financista tenga éxito en la inversión en la Bolsa de Valores.
Escriba los siguientes eventos en función de los eventos A y B. Además, grafique dicho evento en un
diagrama de Venn.
Solución
Evento Notación Diagrama de Venn

que el financista tenga éxito en las dos


A ………... B
inversiones

que el financista no tenga éxito en la Bolsa de


Valores

que el financista tenga éxito en, al menos una,


de sus inversiones

que el financista tenga éxito solamente en una


de sus inversiones

que el financista tenga éxito en la Bolsa de


Valores, pero no en los fondos mutuos

Eventos mutuamente excluyentes


Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de S en común. Los eventos
A y B son mutuamente excluyentes si y solo si A Ç B = f.

Indique si los siguientes eventos son mutuamente excluyentes.


Solución
A: Estudio mucho el curso Estadística, B: Desapruebo el curso Estadística …….………………
A: Apruebo el curso Estadística, B: Desapruebo el curso Estadística……………….................
A: Hoy estudio Administración y Negocios internacionales en la UPC, B: Hoy estudio Administración y
Marketing en la UPC ……………….................

RNotas importantes
Unidad 4. Teoría de Probabilidad 113

Reglas de conteo y combinaciones


Regla de la adición
Si A y B son eventos mutuamente excluyentes, entonces:
n(A U B) = n(A) + n(B)

Una persona puede elegir solo una de dos opciones para almorzar: una
de cinco diferentes hambuerguesas o una de diez pizzas diferentes. ¿De
cuántas maneras diferentes puede almorzar dicha persona?

Regla de la multiplicación
Si un experimento se realiza por una sucesión de k pasos, en el primer paso tiene n1 resultados posibles,
el segundo tiene n2 resultados posibles y así sucesivamente, entonces el número total de resultados
del experimento es n1 x n2 x … x nk.

Un pasajero puede elegir, en el menú de Iberia business,


uno de seis entrantes, uno de tres platos principales y uno
de dos postres. ¿De cuántas maneras diferentes puede
elegir un pasajero su menú?

RNotas importantes
114 Estadística Descriptiva 201901
Regla de conteo para combinaciones
La cantidad de formas de seleccionar x objetos de un total de n objetos distinguibles sin tomar en
cuenta el orden es:
n!
C xn =
x!(n - x )!

En un vuelo, la aerolínea ha sobrevendido pasajes, por lo que tendrá que


ofrecer premios a pasajeros para que no viajen en ese vuelo. Si hay 15
pasajeros que viajan solos y están dispuestos a no viajar y recibir los
premios ¿De cuántas maneras diferentes se puede elegir a solo ocho de
ellos?

Objetivo específico: Establecer una política de inspección exhaustiva de pasajeros.

En cada vuelo se elegirá al azar al 5% de los pasajeros de los viajeros solos


para realizar una inspección exhaustiva, la cual detecta si una persona
lleva sustancias ilegales. Si en un vuelo de 70 personas que viajan solas,
hay dos personas que llevan sustancias ilegales. Calcule la probabilidad de
detectar al menos a una de ellas.
Interpretación

Representación

Cálculo

RNotas importantes
Unidad 4. Teoría de Probabilidad 115

Axiomas de la probabilidad
Sea un experimento aleatorio, S el espacio muestral asociado a dicho experimento aleatorio y A un
evento definido en S, entonces la probabilidad del evento A, denotada por P(A), es aquel número que
cumple los siguientes axiomas:

Axioma 3
Axioma 1 Axioma 2 Si A y B son dos eventos
mutuamente excluyentes
0 £ P(A) £ 1 P(S) = 1 entonces:
P(A È B) = P(A) + P(B)

Ley aditiva para eventos cualesquiera


Sean A, B y C tres eventos cualesquiera, se cumple que:
P(A È B) = P(A) + P(B) – P(A Ç B)

P(A È B È C)= P(A) + P(B) + P(C) - P(A Ç B) - P(A Ç C) - P(B Ç C) + P(A Ç B Ç C)

Caso Aerolínea Wayra


La probabilidad que la aerolínea Wayra quiebre en los próximos dos años es de 0,3 y que su empresa
rival quiebre en esos dos años es de 0,5; mientras que la probabilidad de que no quiebre ninguna de
las dos empresas en esos dos años es 0,4. Calcule la probabilidad de que ocurran los siguientes eventos.
Solución
Defina los eventos necesarios para resolver este problema:
A:= ………………………………………………………………………………………………………………
B:= ………………………………………………………………………………………………………………

RNotas importantes
116 Estadística Descriptiva 201901
Calcule la probabilidad de que ocurran los siguientes eventos.
Evento Probabilidad Diagrama de Venn
que quiebre alguna de las dos aerolíneas P(A …… B)=

que quiebre solo una de las aerolíneas P(A …… B)=

que quiebre solo la aerolínea rival de Wayra P(A …… B)=

que no quiebre alguna de las dos aerolíneas P(A …… B)=

En el presente año, la probabilidad de que una persona viaje a Miami es 0,40; a Máncora es 0,5 y
Madrid es 0,37. Además, la probabilidad de viajar a Miami y Máncora es 0,15; a Miami y Madrid es
0,10 y de Máncora y Madrid es 0,12. Si la probabilidad de que la persona viaje a por lo menos a una
ciudad es 0,95; calcule la probabilidad de que la persona viaje a una sola ciudad.
Solución
Defina los eventos necesarios para resolver este problema:
A:= ………………………………………………………………………………………………………………
B:= ………………………………………………………………………………………………………………
C:= ………………………………………………………………………………………………………………

RNotas importantes
Unidad 4. Teoría de Probabilidad 117

Probabilidad condicional
La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo cierta
información (condición).
P (A Ç B )
P (A B ) =
P(B)

Ejemplo 16
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesionales de acuerdo
con la siguiente tabla.
Hombres (H) Mujeres (M) Total
Profesionales (P) 1 2 3
No profesionales (N) 7 10 17
Total 8 12 20
Si se elige una mujer al azar, calcule la probabilidad de que sea profesional.

Solución
Primero, definamos los eventos necesarios para resolver este problema:
M:= Que la persona escogida sea mujer
P:= Que la persona escogida sea profesional mujer

RNotas importantes
118 Estadística Descriptiva 201901
Caso Aerolínea Wayra
Objetivo específico: Analizar el comportamiento de los clientes considerando el destino de viaje, el
tipo de cliente y el modo de compra. Se ha obtenido la siguiente tabla.
Destino de viaje nacional Destino de viaje internacional
Compra Compra por Compra Compra por Total
Tipo de cliente presencial Internet presencial Internet
Premiun 12 28 38 13 91
Frecuente 8 25 12 23 68
Ocasional 7 15 9 10 41
Total 27 68 59 46 200
a. Si se elige al azar a un cliente que compra por Internet, calcule la probabilidad de que sea un viajero
premium.
b. Si se elige al azar a un cliente frecuente, calcule la probabilidad de que compre pasajes con destino
nacional.
Solución
a. Si se elige al azar a un cliente que compra por Internet, calcule la probabilidad de que sea un viajero
premium.
Defina los eventos necesarios para resolver este problema:
……………:= ………………………………………………………………………………………………………………
……………:= ………………………………………………………………………………………………………………

b. Si se elige al azar a un cliente frecuente, calcule la probabilidad de que compre pasajes con destino
nacional.
Solución
Se define los eventos necesarios para resolver este problema.
……………:= ………………………………………………………………………………………………………………
……………:= ………………………………………………………………………………………………………………

RNotas importantes
Unidad 4. Teoría de Probabilidad 119
Ejemplo 17
El gerente de Wallmarket al distribuir los productos en las diferentes tiendas toma una muestra de 250
unidades de los tres productos y en los dos tipos de envases, del almacén con la idea de distribuirlos
aleatoriamente en las tiendas. La distribución de los productos es la siguiente:

Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250

a. Si se elige un producto al azar, para una de las tiendas, calcule la probabilidad de que sea jugo de
maracuyá y en frasco.
Solución
Lo primero es definir los eventos necesarios.
J:= que el producto elegido sea jugo
F:= que la presentación elegida sea frasco

En la tabla observamos que lo pedido es:


Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
62
𝑃(𝐽 ∩ 𝐹) = = 0,248
250
b. ¿Cuál es la probabilidad de que sea mermelada o el envase sea de sachet?
Interpretación
Se debe calcular la probabilidad de que sea mermelada o el envase sea de sachet.
Representación
Sean los eventos
M:= que el producto elegido sea mermelada
S:= que la presentación elegida sea sachet

En la tabla observamos que lo pedido es:


Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
88 120 50
𝑃(𝑀 ∪ 𝑆) = 𝑃(𝑀) + 𝑃(𝑆) − 𝑃(𝑀 ∩ 𝑆) = + − = 0,632
250 250 250

RNotas importantes
120 Estadística Descriptiva 201901
c. Si el envase es sachet, ¿cuál es la probabilidad de que sea esencia?

Sean los eventos:


E:= que el producto elegido sea esencia
S:= que la presentación elegida sea sachet

En la tabla observamos que lo pedido es:


Tipo de presentación
Tipo de producto Total
Frasco Sachet
Jugo 62 50 112
Mermelada 38 50 88
Esencia 30 20 50
Total 130 120 250
20
𝑃(𝐸/𝑆) = = 0,167
120
Ejemplo 18
La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97
octanos. Con frecuencia, alguna de cada está enriquecida con un aditivo. La tabla siguiente ilustra los
porcentajes de clientes que prefieren cada tipo.
90 octanos (B) 95 octanos (C) 97 octanos (D) Total
Con aditivo (A) 0,05 0,10 0,05 0,20
Sin aditivo (AC) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina.
Solución
a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?

P(A È CC) = P(A) + P(CC) – P(A Ç CC) = 0,20 + 0,50 – (0,05 + 0,05) = 0,60

b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado


gasolina de 97 octanos?
P(D Ç C c ) 0,30
( )
P D Cc = = = 0,60
P Cc ( ) 0,50

c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado


gasolina sin aditivo?

) P(A )
c
Ç Bc
(
P Ac Bc = =
0,65
= 0,8125
( )
PB c
0 ,80

RNotas importantes
Unidad 4. Teoría de Probabilidad 121
Ejemplo 19
Los productos de Expórtame, una empresa exportadora de producto agrícolas, tienen buena acogida
en el mercado nacional. El supermercado Súper adquiere un lote pero conoce que algunos envases
están defectuosos. La distribución de los productos en el lote se muestra en las siguientes gráficas:
Distribución de productos por tipo

Esencia
28% Jugo
35%

Mermelada
37%
Fuente: Supermercados Súper

La distribución de los productos en el lote que son defectuosos se muestran en la siguiente gráfica

Distribución de productos según estado del envase por tipo de producto


100%
80%
Porcentaje

60%
98% 98,5% 96,0%
40% Buen estado
20% Defectuoso
2,0% 1,5% 4,0%
0%
Jugo Mermelada Esencia
Tipo de producto
Fuente: Supermercados Súper

Si se elige un producto al azar y el porcentaje de envases defectuosos es menor al 4%, el gerente de


Súper decidirá adquirir un lote mayor al actual. ¿Qué decisión tomará el gerente de Súper?
Solución
Interpretación
Se debe determinar si el porcentaje de envases defectuosos es menor al 4%.
Representación
Para resolver este problema usaremos el teorema de la probabilidad total.
Cálculo
Producto Defectuoso (D) Buen estado Total
Jugo 0,00700 0,343 0,35
Mermelada 0,00555 0,364 0,37
Esencia 0,01120 0,269 0,28
Total 0,02375 0,976 1,00
P(D) = 0,35 x 0,02 + 0,37 x 0,015 + 0,28 x 0,04 = 0,02375
Análisis
El porcentaje de envases defectuosos es menor al 4%.
Argumentación
El gerente decidirá adquirir un lote mayor de productos.

RNotas importantes
122 Estadística Descriptiva 201901

Ley multiplicativa para eventos cualesquiera


La ley multiplicativa se usa para calcular la probabilidad de una intersección de eventos.

P(A Ç B) = P(A) P(B / A) = P(B) P(A / B)

Un sistema de seguridad en un máquina tiene dos componentes. La probabilidad de que el primer


componente falle es 0,75% y la probabilidad de que el segundo componente falle si el primero ha
fallado es 1,35%. El sistema falla si ambos componentes fallan. Si la probabilidad de que falle el sistema
de seguridad es mayor al 0,1% se pondrá un tercer componente de seguridad. Indique lo que se hará.
Solución
Interpretación

Representación
Los eventos y el árbol de probabilidades necesarios para resolver este problema son:
….:= ………………………………………………………………………………………………………………
….:= ………………………………………………………………………………………………………………
Para resolver este problema usaremos ……………………………………………………………………………………………..
Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 4. Teoría de Probabilidad 123

Árbol de probabilidades

A) P(A∩B) = P(A) P(B/A)


P(B/
P(B C
) / A)
P(A
P(A∩BC) = P(A) P(BC/A)
C)
/A P(AC∩B) = P(AC) P(B/AC)
P(A C P(B
) P(B C
/A C
)
P(AC∩BC) = P(AC) P(BC/AC)

Si los eventos Ai y Bi son independientes, el árbol de probabilidades se simplifica dado que las
probabilidades condicionales serían iguales a las probabilidades simples correspondientes.

Partición del espacio muestral


Sean los k eventos A1, A2, A3,..., Ak mutuamente excluyentes y tales que entonces constituyen una
partición del espacio muestral S.

Teorema de la probabilidad total


Sean los k eventos A1, A2, A3,..., Ak, mutuamente excluyentes y que constituyen una partición del
espacio muestral S, entonces para cualquier evento B de S se cumple:
P(B) = P(B Ç A1) + P(B Ç A2) + P(B Ç A3) + … + P(B Ç Ak)

Por la ley multiplicativa de eventos cualesquiera, se tiene finalmente que:


P(B) = P(A1) P(B / A1) + P(A2) P(B / A2) + P(A3) P(B / A3) + … + P(Ak) P(B Ç Ak)

Teorema de Bayes
Si los k eventos A1, A2, A3, ..., Ak, constituyen una partición del espacio muestral S, entonces para
cualquier evento B de S tal que P(B) > 0, se cumple:
P (Ai Ç B)
P (Ai B) =
P(B)
Por definición de probabilidad condicional y probabilidad total se tiene que:
P (Ai )P (B / Ai )
P (Ai B) =
P (A1 )P (B / A1 ) + P (A2 )P (B / A2 ) + ... + P (Ak )P(B / Ak )

El teorema de Bayes establece una relación muy importante en la teoría de probabilidades y es la base
para la revisión de la asignación de probabilidades a la luz de información adicional.

RNotas importantes
124 Estadística Descriptiva 201901

En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un día ha llegado tarde
a trabajar el 2% de las mujeres y el 4% de los hombres.
a. Si se elige, al azar, a un trabajador calcule la probabilidad de que haya llegado tarde.
b. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de que sea elegido
una mujer.
Solución
Los eventos y el árbol de probabilidades necesarios para resolver este problema son:
H:= ………………………………………………………………………………………………………………
M:= ………………………………………………………………………………………………………………
T:= ………………………………………………………………………………………………………………
Para resolver este problema usaremos ……………………………………………………………………………………………..
Cálculo

H) P(H∩T) = P(H) P(T/H)


P(T/

) P(T C
/ H)
P(H
P(H∩TC) = P(H) P(TC/H)
)
/M P(M∩T) = P(M) P(T/M)
P(M P(T
)
P(T C
/M)
P(M∩TC) = P(M) P(TC/M)

a. Si se elige, al azar, a un trabajador calcule la probabilidad de que haya llegado tarde.

b. Si se elige, al azar, a un trabajador que no ha llegado tarde, calcule la probabilidad de que se haya
elegido una mujer.

RNotas importantes
Unidad 4. Teoría de Probabilidad 125

Una persona va al médico el cual cree que la persona puede tener la enfermedad A con probabilidad
0,7; la enfermedad B con probabilidad 0,2 y la enfermedad C con probabilidad 0,1. El médico manda
al paciente a realizarse unos exámenes, los cuales salen positivos con probabilidad 0,95 si el paciente
tiene la enfermedad A, con probabilidad 0,7 si tiene la enfermedad B y 0,6 si tiene la enfermedad C. Si
los resultados salieron negativos ¿Para qué enfermedad se le mandará tratamiento al paciente?
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
126 Estadística Descriptiva 201901
Ejemplo 20
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 2% de las usuarias y el 0,8% de
los usuarios han sufrido de algún tipo de robo durante el uso del Metropolitano.
Si se elige un usuario al azar que ha sido víctima de robo, calcule la probabilidad de que sea hombre y
la probabilidad de que sea mujer. Se va a establecer una oficina de protección al usuario y se pondrá
énfasis a los usuarios cuyo sexo tengan más probabilidad de sufrir algún tipo de robo.
Solución
Interpretación
Se va a determinar el sexo que tenga más probabilidad entre los que han sufrido un robo.

Representación
Sean los eventos
R:= Que el usuario sea víctima de robo
H:= Que el usuario sea hombre.
M:= Que el usuario sea mujer
Usaremos el teorema de la probabilidad total y el teorema de Bayes.

Cálculo
Por el teorema de la probabilidad total.

P(R) = P(H) P(R/H) + P(M) P(R/M) = 0,55 x 0,008 + 0,45 x 0,020 = 0,0134

Por teorema de Bayes, calculemos cada probabilidad.


J(K)×J(M ⁄K) N,OO × N,NNP
𝑃(𝐻 ⁄𝑅) = J(M)
= = N,NQRS
= 0,3284
J(T)×J(M ⁄T) N,SO × N,NUN
𝑃(𝑀⁄𝑅) = = = = 0,6716
J(M) N,NQRS

Análisis
Entre los que han sufrido algún tipo de robo, las mujeres tienen una mayor probabilidad.

Argumentación
Se pondrá énfasis en la protección de las mujeres.

RNotas importantes
Unidad 4. Teoría de Probabilidad 127
Ejemplo 21
Si Expórtame, una empresa que exporta productos alimenticios, distribuye sus productos de la
siguiente manera: 45% en jugo, 35% en mermelada y el resto en esencia. Además, se sabe que la
probabilidad de que un jugo esté en mal estado es 4%, una mermelada es 2% y una esencia es 3%. Si
de los productos en mal estado se selecciona uno al azar, determine el tipo de producto que sea más
probable. Para dicho producto se establecerá un nuevo esquema de control de calidad.
Solución
Interpretación
Se debe determinar el tipo de producto que es más probable que esté en mal estado.

Representación
Sean los siguientes eventos:
J:= que el producto elegido sea jugo
M:= que el producto elegido sea mermelada
E:= que el producto elegido sea esencia
B:= que el producto elegido esté en buen estado
Para resolver este problema usaremos el teorema de Bayes.

Cálculo
Completemos el cuadro con los datos del problema.

Producto Mal estado (BC) Buen estado (B) Total


Jugo (J) 0,018 0,432 0,45
Mermelada (M) 0,007 0,343 0,35
Esencia (E) 0,006 0,194 0,20
Total 0,031 0,969 1,00

Por el teorema de la probabilidad total, se tiene que:


𝑃(𝐽)𝑃(𝐵W ⁄𝐽) + 𝑃(𝑀)𝑃(𝐵W ⁄𝑀) + 𝑃(𝐸)𝑃(𝐵W ⁄𝐸 ) = 0,018 + 0,007 + 0,006 = 0,031

Por el teorema de Bayes, se tiene que:


JXY∩Z [ \ N,NQP
𝑃(𝐽⁄𝐵W ) = JXZ [ \
= N,NRQ = 0,5806
JXT∩Z [ \ N,NN]
𝑃(𝑀⁄𝐵W ) = JXZ [ \
= N,NRQ = 0,2258
JX^∩Z [ \ N,NN_
𝑃(𝐸 ⁄𝐵W ) = JXZ [ \
= N,NRQ = 0,1936
Análisis
El producto más probable es el jugo.

Argumentación
Se establecerá un nuevo esquema de control de calidad para los jugos.

RNotas importantes
128 Estadística Descriptiva 201901
Ejemplo 22
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,3; 0,3 y 0,4. La probabilidad de
que una venta sea por más de $50, es igual a 0,2 si ésta es en efectivo, es igual a 0,9 si ésta es con
cheque y es igual a 0,6 si ésta es al crédito. Si compra por más de $50, ¿qué es más probable que haya
pagado en efectivo, con cheque o al crédito?
Solución
Interpretación
Determinar si las compras son por más de $50, identificar la forma de pago más probable, efectivo,
con cheque o al crédito.
Representación
Sean los eventos:
E: La compra se realiza con dinero en efectivo
CH: La compra se realiza con cheque
C: La compra se realiza al crédito
M: La compra es por más de $ 50
MC: La compra no es por más de $ 50
Con la información proporcionada, construimos el siguiente diagrama de árbol:

Cálculo
Por el teorema de la probabilidad total, se tiene que:
P(M) = 0,3 x 0,2 + 0,3 x 0,9 + 0,4 x 0,6 = 0,57
Por el teorema de Bayes, se tiene que:
0,30 ´ 0,20 2
P (E / M ) = = = 0,1053
0,57 19
0,30 ´ 0,90 9
P ( CH / M ) = = = 0,4737
0,57 19
0,40 ´ 0,60 8
P (C / M ) = = = 0,4211
0,57 19
Análisis y argumentación
Se observa que es más probable la compra se haya hecho con cheque.

RNotas importantes
Unidad 4. Teoría de Probabilidad 129

Eventos independientes
Si P(A) ¹ 0, los eventos A y B son independientes si y solo si:
P(A/B) = P(A)

Ley de la multiplicación para eventos independientes


Si dos eventos A y B son independientes se cumple que:
P(A Ç B) = P(A) P(B)

Si tres eventos A, B y C son independientes se cumple que:


P(A Ç B) = P(A) P(B) P(A Ç C) = P(A) P(C) P(B Ç C) = P(B) P(C)
P(A Ç B Ç C) = P(A) P(B) P(C)

Si dos eventos A y B son independientes, indique el diagrama de Venn correspondiente.

Caso Aerolínea Wayra


La probabilidad que un cliente premium compre un pasaje usando Internet es 13% y, que un cliente
frecuente haga la compra por esta vía es 46%. Si un día cualquiera, dos clientes (uno de cada tipo) que
no se conocen (por lo tanto, la decisión de compra de uno no influye en el otro), deciden comprar un
pasaje. Si la probabilidad que por lo menos uno de los clientes compre su pasaje vía Internet es menor
a 0,3; se rebajará el costo de los pasajes. ¿Qué decisión se tomará?
Solución
Interpretación

Representación

Cálculo

RNotas importantes
130 Estadística Descriptiva 201901
Análisis

Argumentación

Un vendedor de artefactos eléctricos en una tienda por departamentos sabe que por experiencia que
el 3% de las personas que preguntan por un televisor finalmente lo compran. El vendedor ha decidido
que si no vende al menos un televisor ese día renunciará a su trabajo. Calcule la probabilidad de que
no renuncie si ese día preguntaron 30 clientes por un televisor.

Interpretación

Representación

Cálculo

RNotas importantes
Unidad 4. Teoría de Probabilidad 131

Ejercicios de la Unidad 4
29. Indicar, para cara uno de los siguientes experimentos aleatorios, los respectivos espacios
muestrales: lanzar una moneda, jugar un partido de fútbol, jugar un partido de tenis, lanzar un
dado, lanzar dos dados.
30. Un experimento consiste en lanzar primero un dado para después lanzar una moneda, siempre y
cuando el número del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos
veces. Determine el espacio muestral de este experimento.
31. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a siete.
Rpta: 0,4167
32. Un fabricante de teléfonos celulares acaba de lanzar dos modelos de smartphones económicos: el
L720 y el L520. La probabilidad de que el modelo L720 tenga éxito es 0,70 y en el modelo L520 es
0,60. La probabilidad de que al menos uno de los modelos tenga éxito es 0,90. Determine la
probabilidad de que se tenga éxito solo en uno de los modelos. Rpta: 0,5
33. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin importar
el orden. ¿De cuántas maneras diferentes se puede elegir a esas dos personas? Rpta: 45
34. Al fin del ciclo, los 30 alumnos de una sección deben elegir a tres de ellos al azar para que organicen
un “compartir”. ¿Cuántos grupos diferentes de tres personas se pueden elegir? Rpta: 4060
35. De 50 conductores, nueve no tienen los papeles en regla. Si un policía escoge al azar a cinco
conductores y les pide sus papeles,
a. calcule la probabilidad de que elija a dos que no tengan los papeles en regla. Rpta: 0,1811
b. calcule la probabilidad de que elija al menos un conductor sin papeles en regla. Rpta: 0,6463
36. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.
a. ¿Cuál es la probabilidad de que el polo sea azul o blanco? Rpta: 0,7742
b. ¿Cuál es la probabilidad de que no sea azul? Rpta: 0,7097
37. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y
su área de residencia, obteniéndose los siguientes resultados:

Servicios con que los cuenta el hogar Urbano Rural Total


Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen teléfono fijo 480 831 6 170 487 001
Solo tienen teléfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671
Tienen teléfono fijo e Internet 15 684 31 15 715
Tienen teléfono fijo y TV por cable 117 733 186 117 919
Tienen teléfono celular e Internet 9 970 84 10 054
Tienen teléfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen teléfono fijo, teléfono celular e Internet 93 103 110 93 213
Tienen teléfono fijo, teléfono celular y TV por cable 326 181 468 326 649
Tienen teléfono fijo, Internet y TV por cable 19 732 9 19 741
Tienen teléfono celular, Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074

RNotas importantes
132 Estadística Descriptiva 201901
Si se selecciona al azar un hogar:
a. de zona urbana, ¿cuál es la probabilidad de que tenga cuatro servicios? Rpta: 0,05825
b. con tres servicios, ¿cuál es la probabilidad de que sea de zona urbana? Rpta: 0,99860
c. de zona rural, ¿cuál es la probabilidad de que cuente con tres servicios por lo menos?
Rpta: 0,00005
d. de zona urbana, ¿cuál es la probabilidad de que no tenga ningún servicio? Rpta: 0,32788
e. ¿cuál es la probabilidad de que sea de zona urbana y los cuatro servicios? Rpta: 0,04426
f. ¿cuál es la probabilidad de que sea de zona rural o no cuente con servicio alguno?
Rpta: 0,48936
38. Según el II Censo Universitario, en el año 2010, 63 900 alumnos ingresaron a las universidades
públicas y 194 151 a las universidades privadas. De ellos, en las universidades públicas, 28 798
ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942. Si se elige al azar a una
ingresante, calcule la probabilidad de que estudie en una universidad privada. Rpta: 0,77456
Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que sea mujer.
Rpta: 0,50961
39. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan actividades
de responsabilidad social en la empresa. El total de mujeres en la empresa es de 57.
a. Si elegimos al azar a un trabajador hombre, calcule la probabilidad de que realice actividades
de responsabilidad social. Rpta: 0,2688
b. Si elegimos al azar a un trabajador que no realice actividades de responsabilidad social, calcule
la probabilidad de que sea mujer. Rpta: 0,2444
c. Si elegimos al azar a un trabajador que realice actividades de responsabilidad social y que sea
mujer. Rpta: 0,2333
40. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola blanca.
Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola blanca gana.
¿Quién lleva más ventaja: el primero, el segundo o el tercero? Rpta: Nadie
41. Una empresa que fabrica polos mediante tres máquinas, A, B y C, producen el 25%, 30% y 45%,
respectivamente, del total de los polos producidos en la fábrica. Los porcentajes de producción
defectuosa de estas máquinas son del 2%, 4% y 3% respectivamente.
a. Si se elige un polo al azar; calcule la probabilidad de que sea no defectuoso. Rpta: 0,9695
b. Tomamos, al azar, un polo y resulta ser defectuoso; calcule la probabilidad de haber sido
producido por la máquina B. Rpta: 0,3934
42. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es
del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en dichos trabajos es
independiente entre sí.
a. ¿Cuál es la probabilidad de que al menos sea aceptado en uno de los trabajos? Rpta: 0,85
b. ¿Cuál es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?
Rpta: 0,50
43. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una
chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma independencia
entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos con una de
ellas. Rpta: 0,8046
44. El pulpo Paul es un octópodo que ha sido empleado como oráculo para predecir los resultados de
la selección alemana de fútbol en el Mundial de Fútbol 2010, acertando los ocho emparejamientos
que se le propusieron, los siete partidos de Alemania en la Copa Mundial de Fútbol de 2010 y la
final entre España y Holanda. Antes de cada partido, a Paul se le presentaron dos contenedores
RNotas importantes
Unidad 4. Teoría de Probabilidad 133
idénticos con comida: uno de ellos estaba marcado con una bandera, usualmente la de Alemania
y el otro con la bandera del equipo oponente. La elección de Paul se interpretaba como el equipo
que lograría la victoria. Si el pulpo Paul, en realidad, escogió los contenedores al azar, calcule la
probabilidad de acertar en los resultados de los ocho los partidos que le propusieron. Asuma
independencia entre cada elección. Rpta: 0,0039
45. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. El teorema de Bayes determina que la probabilidad de un determinado evento se deba a una
causa específica Rpta: V
b. La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo cierta
información (condición) Rpta: V
C
c. Si P(A/B) = 0,3; entonces, se cumple que P(A /B) = 0,7 Rpta: V
C
d. Si P(A/B) = 0,3, entonces, se cumple que P(A/B ) = 0,7 Rpta: F
e. Si dos eventos son independientes, entonces serán también mutuamente excluyentes
f. Si dos eventos son independientes, entonces P(A/B) = P(B) Rpta: F
g. Si dos eventos son independientes entonces la ocurrencia de uno de ellos no influye en la
ocurrencia del otro evento Rpta: V
h. Si P(A/B) = P(A) esto implica que A y B son eventos mutuamente excluyentes Rpta: F
i. Si P(A/B) = P(A) esto implica que A y B son eventos independientes Rpta: V
j. El espacio muestral es el conjunto de todos los posibles eventos de un experimento aleatorio
Rpta: F
k. En un experimento aleatorio nunca aparece un modelo definido de regularidad
Rpta: F
l. En algunos casos especiales la probabilidad de un evento podría ser mayor que uno
Rpta: F
m. Un evento es un subconjunto del experimento aleatorio. Rpta: F
n. Si dos eventos son mutuamente excluyentes entonces la ocurrencia de uno de ellos no influye
en la ocurrencia del otro Rpta: F
o. El complemento del evento A no es mutuamente excluyente con el evento A Rpta: F
p. Si dos eventos A y B son mutuamente excluyentes, entonces P(A) + P(B) = 1 Rpta: F

RNotas importantes
Unidad 5: Variables aleatorias

Logro de la unidad 5

Al finalizar la unidad 5,
el estudiante toma decisiones responsables
en un escenario real de investigación,
aplicando conceptos de variable aleatoria, valor esperado y probabilidad.

Temario
• Definición de variable aleatoria discreta y continua.
• Función de probabilidad de una variable aleatoria discreta.
• Función de densidad y función de distribución acumulada de una variable aleatoria continua.
• Valor esperado y varianza de variables aleatorias discretas y continuas.
• Estudio de propiedades de las siguientes distribuciones: binomial, hipergeométrica, Poisson,
uniforme, continua, normal, t-Student
136 Estadística Descriptiva 201901

Variable aleatoria
Se denomina variable aleatoria a una descripción numérica del resultado de un experimento.

La variable aleatoria
Lo que es aleatorio
atribuye a cada evento
es el experimento
un número
sobre cuyo espacio muestral
que no es aleatorio o imprevisible,
se define la variable aleatoria.
sino fijo y predeterminado.

Rango o recorrido de una variable aleatoria


Se llama rango o recorrido de una variable aleatoria X y lo denotaremos RX, al conjunto de los valores
reales que la variable aleatoria puede tomar.

Tipos de variable aleatoria


Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numerable de valores
diferentes.
Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.

Indique el tipo de la variable aleatoria y su rango.


Variable aleatoria Tipo Rango
X = número de veces que un alumno lleva un curso
RX =
en la UPC
Y = cantidad de horas que dedica un alumno a es-
RY =
tudiar un curso en la última semana
Z = número de créditos aprobados hasta el mo-
RZ =
mento por un alumno.

Variable aleatoria discreta


Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
P(X = x).
Por ejemplo: número de alumnos matriculados por curso, cantidad de preguntas correctamente
contestadas en una evaluación de personal, cantidad de clientes que visitan un centro comercial en un
día determinado.

Distribución de probabilidad de una variable aleatoria discreta


La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de
que X asuma ese valor, esto es:
f(x) = P(X = x)

Toda función de probabilidad debe cumplir que:


- f(x) ³ 0
n
- å f (x ) = 1
i =1
i
Unidad 5. Variables aleatorias 137

Sea S el espacio obtenido al lanzar una moneda dos veces y observar si sale cara (c) o sello (s) cada vez.
Completar los espacios en blanco.
El espacio muestral es S = {(..… , ..…), (..… , ..…), (….. , …..), (….. , …..)}.
Sea X el número de caras obtenidas, luego el rango de la variable X es RX = {…. , .…, .…}.
El evento (X = 0) = {(….., …..)}
El evento (X = 1) = {(….., ..…), (..…, ..…)}
El evento (X = 2) = {(….., …..)}
Entonces, la probabilidad de que ocurra cada evento es:
f(0) = P(……………..) = ……………………………………………..
f(1) = P(……………..) = ……………………………………………..
f(2) = P(……………..) = ……………………………………………..
Por lo tanto, el valor de caras más probable es ………………..
La grafica de f(x) es:

Se lanza un dado, sea la variable aleatoria X igual al número de la cara superior del dado. Determine y
grafique la función de probabilidad de la variable X.
Interpretación

Representación

Cálculo

RNotas importantes
138 Estadística Descriptiva 201901
Ejemplo 23
Calcule a para que la siguiente función sea una función de probabilidad. Grafique f(x)
f(x) = ax x = 10, 15, 20, 25
Solución
Tiene que cumplir dos condiciones:
La primera condición, f(x) > 0, se cumple cuando a es mayor que cero, puesto que x > 0.
n
La segunda condición, å f (x ) = 1, se cumple si a10 + 15a + 20a + 25a = 1 , esto se cumple cuando 70a
i =1
i

=1, luego a =1/70


0.5
0.4
0.3
f(x)

0.2
0.1
0.0
0 5
X

Ejemplo 24
Sea X el número de lanzamientos de un dado hasta que salga el primer seis. Determine la función de
probabilidad de la variable X y calcule P( X > 3)
Solución
Sea la variable aleatoria X:= número de lanzamientos de un dado hasta que salga el primer seis.
El rango o recorrido de X es RX = {1, 2, 3,…} = Z+.
f(1) = P(X = 1) = 1/6
f(2) = P(X = 2) = 5/6 x 1/6
f(3) = P(X = 3) = 5/6 x 5/6 x 1/6

Luego, la función de probabilidad de la variable X es:


x -1
æ 5ö 1
f (x ) = P ( X = x ) = ç ÷ ´ ; Rx = 1, 2, 3,....
è6ø 6
æ1 5 25 ö
P( X > 3) = 1 - P( X £ 3) = 1 - ( f (1) + f (2) + f (3)) = 1 - ç + + ÷ = 0,5787
è 6 36 216 ø

Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución de
probabilidad de X se denota E(X).
n
µ X = E ( X ) = å x i f (x i ) = x1 f (x1 ) +x2 f (x2 ) + ... + x n f (x n )
i =1

RNotas importantes
Unidad 5. Variables aleatorias 139
Caso Aerolínea Wayra
Objetivo específico: Estimar la media del número de personas que no se presentan al vuelo.
El número de personas que no se presentan a un vuelo se modela con una variable aleatoria X con la
siguiente función de probabilidad.

X 0 1 2 3 4 5 6
f(x) 0,20 0,25 0,22 0,15 0,10 0,05 a

Si la media es mayor a 2, se comenzará a mandar un correo electrónico a los pasajeros recordándoles


el viaje. Indique la acción a tomar.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

Valor esperado de una función de variable aleatoria discreta


Sea G(X) una función de la variable aleatoria X. El valor esperado de G(X) es:
n
E ( G ( X ) ) = å G ( xi ) f ( xi ) = G ( x1 ) f ( x1 ) +G ( x2 ) f ( x2 ) + ... + G ( xn ) f ( xn )
i =1

RNotas importantes
140 Estadística Descriptiva 201901
Ejemplo 25
La demanda mensual de uno de los productos Expórtame varía grandemente de un mes a otro. Con
base a la información de los últimos 24 meses se estimó las probabilidades para la demanda mensual
del producto jugo en frasco.

X:= Número de frascos vendidos 80 90 100 120 130 140


f(x) 0,15 0,25 0,35 0,10 0,10 0,05

Calcule el valor esperado del número de frascos de jugo demandados.


E(X) = 101,5
Cada frasco tres soles y lo vende cinco soles. Si en un mes determinado, ha solicitado al distribuidor
140 frascos. Sea U(X) la utilidad del dueño de la tienda. Calcule la utilidad esperada.
Solución
x 80 90 100 120 130 140
U(x) -20 30 80 180 230 280
f(x) 0,15 0,25 0,35 0,10 0,10 0,05

E(U(X)) = 87,5

Varianza de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X se calcula por:

V(X) = E(X2) – (E(X))2

La varianza de la variable aleatoria X, V(X), también se denota por s2.

Desviación estándar de una variable aleatoria discreta


La desviación estándar de X es la raíz cuadra de la varianza de X.
La desviación estándar de la variable aleatoria X se denota por s.

Caso Aerolínea Wayra


Objetivo específico: Comparar el grado de dispersión del número de cancelaciones en vuelos, tanto
nacional e internacional.
La distribución de probabilidades de las variables X: número de cancelaciones en vuelo nacional e Y:
número de cancelaciones en vuelo internacional se muestran a continuación:
x 1 2 3 4 5
f(x) 0,25 0,42 0,15 0,10 a

y 0 1 2 3 4
f(y) 0,27 0,37 0,18 0,12 b
La empresa implementará cambios en aquel tipo de vuelo, nacional o internacional, cuyo número de
cancelaciones sea más variable. ¿En qué tipo de vuelo se harán los cambios?

RNotas importantes
Unidad 5. Variables aleatorias 141
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

Propiedades del valor esperado en variables aleatorias


Si X1 y X2 son dos variables aleatorias, y a1 y a2 son dos constantes, entonces:
• E(a1) = a1
• E(a1X1 + a2X2) = a1 E(X1)+ a2 E(X2)
• Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, . . ., an son n constantes, entonces:
E(a1X1 + a2X2 + … + anXn) = a1 E(X1)+ a2 E(X2) + … + an E(Xn)
• Si X1, X2, X3, ... , Xn son n variables aleatorias con la misma función de probabilidad, entonces se
cumple que E(Xi) = µ y, por lo tanto:
E(X1 + X2 + …. + Xn) = nµ
Propiedades de la varianza en variables aleatorias
• Si Y = aX + b, con a y b son constantes, entonces sY2 = a2s X2
• Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n constantes,
entonces:
V(a1X1 + a2X2 + … + anXn) = a12 V(X1) + a22 V(X2) + … + an2 V(Xn)
• Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de probabilidad,
entonces se cumple que V(Xi) = s 2 y, por lo tanto:s
V(X1 + X2 + …. + Xn) = ns2

RNotas importantes
142 Estadística Descriptiva 201901

Si X1 y X2 son dos variables aleatorias, de tal manera de µ1 = 3, µ2 = 5, s12 =6, s12 = 9. Inque el valor de
la media y la varianza de las siguientes variables:

S = X1 + X2

S = X1 - X2

S = 3X1 - X2

Ejemplo 26
Sea la variable aleatoria X el número de frascos vendidos en un supermercado por semana, con la
siguiente función de probabilidad:
1
f (x) = k - (x - 3)2 para x =1 ,2 , 3 , 4 , 5 , 6
38
Solución
Calcule el valor de k.
k = 0,25

X 12 24 36 48 60 72
f(x) 0,1447 0,2237 0,2500 0,2237 0,1447 0,01316

Calcule la probabilidad de vender por lo menos tres docenas de frascos.


P(X ≥ 3) =1 - P(X ≤ 2) = 1 - 0.36842105 = 0,6316

Si la utilidad por docena de frascos vendido (en soles) viene dada por la función: U(X) = 10X – 5,
expresada en soles, calcule la utilidad esperada mensual y su varianza?

E(X) = 3,0396
E(U(X)) = E(10X – 5) = 10 E(X) - 5 = 25,396

RNotas importantes
Unidad 5. Variables aleatorias 143
Ejemplo 27
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcular el valor esperado de X2
ìax 1, 2, 3, 4, 5
f ( x) = í
î 0 en otro caso
Solución
5
Lo primero es determinar a, planteamos que å f ( x ) = 1, de donde a = 1/15.
i =1
i

Nos piden E ( X 2 ) = å xi2 f ( xi ) = 12 1 +22 1 + 32 1 + 42 1 + 52 1 = 15


5

i =1 15 15 15 15 15
Ejemplo 28
Sea X una variable aleatoria con la siguiente función de probabilidad. Calcule la varianza de X.
ìx
ï 1, 2, 3, 4, 5
f (x) = í 15
ïî 0 en otro caso

Solución
5
1 2 3 4 5 55
El esperado de X es E ( X ) = å xi f ( xi ) = 1 ´ +2 ´ + 3 ´ + 4 ´ + 5 ´ =
i =1 15 15 15 15 15 15
2
Se tiene que E ( X 2 ) = 15. Luego se tiene que V ( X ) = E ( X 2 ) - ( E ( X ) ) = 15 - æç 55 ö÷ = 1,556
2

è 15 ø
Ejemplo 29 Caso Metropolitano
Se define la variable aleatoria X definida como el número de recargas de la tarjeta de los usuarios del
Metropolitano a la semana con la siguiente función de probabilidad.

X: número de recargas 0 1 2 3 4
f(x) 0,10 4k 0,30 k 0,10

Si un usuario recargó una vez su tarjeta en una semana, calcule la probabilidad de que dicho usuario
recargue su tarjeta por lo menos una vez más en esa semana.
Solución
Para que f(x) sea una función de probabilidad debe cumplir que ∑SN 𝑓(𝑥) = 1. Determinemos el valor
de k para que f(x) sea función de probabilidad.
Por lo tanto, f(0) + f(1) + f(2) + f(3) + f(4) = 0,10 + 4k + 0,30 + k + 0,10 = 1, de donde k = 0,1

La función de probabilidad es:


X:= Número de recargas 0 1 2 3 4
f(x) 0,10 0,40 0,30 0,10 0,10

J(deU) N,ON
Se pide 𝑃(𝑋 ≥ 2⁄𝑋 ≥ 1) = J(deQ) = N,fN = 0,5556
Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios, determine el
monto esperado semanal por recargas.

𝐸(𝑋) = ∑S,gN 𝑥𝑓(𝑥) = 1,7. El esperado del monto será 1,7 x 5 x 560 000 = 4 760 000 soles

RNotas importantes
144 Estadística Descriptiva 201901

RNotas importantes
Unidad 5. Variables aleatorias 145

Distribuciones de probabilidad de variables discretas


Distribución binomial
Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija antes de realizar
el experimento.

Las pruebas son independientes


Las pruebas son idénticas y
entre sí La probabilidad de éxito
cada una de ellos puede
por lo que el resultado de un es constante
resultar en uno de dos posibles
intento en particular de una prueba a otra
resultados que denotan éxito o
no influye en el resultado de y la denotamos como p.
fracaso.
cualquier otro.

Entonces para n intentos y la probabilidad p de éxito en cualquier intento, la probabilidad de tener x


éxitos en los n intentos está dada por:

f ( x ) = P ( X = x ) = C xn px (1 - p )
n- x
x = 0, 1, 2,..., n

La variable binomial cuenta el número de éxitos en n repeticiones semejantes e independientes con


probabilidad de éxito constante.

Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p, se denota X ~
B (n, p).

Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para valores p > 0,5
tiene sesgo izquierdo, independientemente de los valores de n.

Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores relevantes
de probabilidad, la distribución es prácticamente simétrica.

Media: µ = E(X) = np
Varianza: s2 = V(X) = np(1 – p)

RNotas importantes
146 Estadística Descriptiva 201901
Caso Aerolínea Wayra
Objetivo específico: Estimar la probabilidad de tener una emergencia médica durante el viaje.
La aerolínea sabe por experiencias pasadas que el 0,2% de los pasajeros tendrá alguna emergencia
médica durante el vuelo. Asuma independencia entre un pasajero y otro. Si en un vuelo hay 160
pasajeros,
a. calcule la probabilidad de que ningún pasajero tenga una emergencia médica durante el viaje.
b. calcule la probabilidad de que, como máximo un pasajero tenga una emergencia médica.
c. calcule la probabilidad de que por lo menos dos pasajeros tengan una emergencia médica.
d. calcule el valor esperado del número de pasajeros que tengan una emergencia médica.
Solución
La variable en estudio X es ………………….…………………………………….…………………………………..
El rango o recorrido de la variable X es …………………..…………………….………………..………..……
La distribución de la variable es …………………………………………………………..
Sus parámetros son ………………………..…………………………………….…..………..

a. calcule la probabilidad de que ningún pasajero tenga una emergencia médica durante el viaje.

La probabilidad pedida es
P(X…………) = f(………) = ………………………….………….......……… ……………….

b. calcule la probabilidad de que, como máximo, un pasajero tenga una emergencia médica.

La probabilidad pedida es
P(X…………) = ……………………………………………..……………..........……… ……………….

c. calcule la probabilidad de que por lo menos dos pasajeros tengan una emergencia médica durante
el viaje.

La probabilidad pedida es
P(X…………) = …………………………..………………………………........……… ……………….

d. calcule el valor esperado del número de pasajeros que tengan una emergencia médica durante el
viaje.

El valor pedido es E(X) = ………………….………..…………….......……… ……………….

RNotas importantes
Unidad 5. Variables aleatorias 147
Ejemplo 30
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por
investigaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.
Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal estado es
mayor al 30%, ¿qué decisión se debe de tomar?
Solución
Lo primero es definir la variable que nos permitirá resolver el problema.
Definamos la variable X:= número de envases en mal estado.
La variable X se tiene una distribución binomial con parámetros: n= número de ensayos = 60 y p =
probabilidad de éxito = 0,01.
El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 60.
Entonces, X ~ B(n = 60; p = 0,01)
Nos piden:
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)
=1− 𝐶N_N 0,01N 0,99_N
+ 𝐶Q_N 0,01Q 0,99Of +𝐶U_N 0,01U 0,99OP
= 0,0224

Como la probabilidad pedida es menor al 30%, entonces los productos no serán rechazados.

Calcule el valor esperado y varianza del número envases en mal estado.


E(X) = n p = 60 x 0,01 = 0,6
V(X) = n p (1-p) = 60 x 0,01 x (1 – 0,01) = 0,594

Ejemplo 31
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de
los usuarios han sufrido de algún tipo de robo durante el uso del Metropolitano. Si el sistema tiene 560
mil usuarios, calcule el número esperado de usuarios que han sido víctimas de robo durante el uso del
Metropolitano. Defina la variable necesaria y determine su distribución.
Solución
Representación
Sean los eventos:
R:= Que el usuario sea víctima de robo
H:= Que el usuario sea hombre
M:= Que el usuario sea mujer
Usaremos la distribución binomial y el teorema de la probabilidad total
Cálculo
𝑃(𝑅) = 𝑃(𝐻). 𝑃(𝑅⁄𝐻 ) + 𝑃(𝑀). 𝑃(𝑅⁄𝑀)= 0,0044 + 0,0045 = 0,0089
Sea la variable aleatoria Y:= número de usuarios que han sido víctima de robo.
Y ~ B(n = 560 000; p = 0,0089)
E(Y) = np = 560 000 x 0,0089 = 4 984 usuarios

RNotas importantes
148 Estadística Descriptiva 201901
Ejemplo 32
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al azar
80 usuarios.

Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones.
Solución
Representación
Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra
X ~ B(n = 80; p = 0,12)
El rango de X es Rx = {0,1,…,80}
Cálculo
P(8 ≤ X ≤ 9) = f(8) + f(9) = 0,2623

Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560 mil usuarios.
Calcule el valor esperado y varianza de Y.

Solución
Y ~ B(n = 560 000; p = 0,12)

Cálculo
E(Y) = np = 560 000 x 0,12 = 67 000.
V(Y) = np(1-p) = 59 136

RNotas importantes
Unidad 5. Variables aleatorias 149

Distribución hipergeométrica
Consideremos N elementos, de los cuales r son considerados éxitos y por lo tanto N - r como fracasos.
Como en el caso de la distribución binomial estamos interesados en saber la probabilidad de obtener
x éxitos en una muestra de n elementos.

El experimento hipergeométrico consiste en extraer al azar y sin sustitución n elementos de un


conjunto de N elementos, r de los cuales son éxitos y N - r son fracasos.

La probabilidad de obtener de x éxitos en la muestra de n elementos es:

C xr CnN--xr
f (x) = , x = max{0, n - (N - r )},...,min{n, r }
CnN

El rango de X en la mayoría de los casos va de 0 a n, pero no siempre, por lo que se debe analizar en
cada caso.

La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño n, tomada de una
vez de una población de tamaño N donde hay r éxitos.

Se dice que la variable aleatoria X sigue una distribución hipergeométrica con parámetros N, r y n y se
denota X ~ H (n, r, N)

n
Media µ = E(X) = 𝑛 o
n n or-
Varianza s2 = V(X) = 𝑛 o p1 − oq p orQq

RNotas importantes
150 Estadística Descriptiva 201901
Caso Aerolínea Wayra
En un vuelo se van a servir 130 comidas. La oficina de control de calidad de los alimentos durante el
vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado. Dentro de las 130 comidas,
hay cuatro que no están en perfecto estado. Si se encuentre más de una comida que no esté en per-
fecto estado; se cambiará de proveedor. Calcule la probabilidad de que se cambie de proveedor.
Solución
Interpretación

Representación
La variable en estudio X es ………………….…………………………………….…………………………………..
El rango o recorrido de la variable X es …………………..…………………….………………..………..……
La distribución de la variable es …………………………………………………………..
Sus parámetros son ………………………..…………………………………….…..………..
Cálculo
La probabilidad pedida es:
P(X…………) = f(………) = ………………………………………..…………….......……………………….

Un grupo de 20 amigos van a una discoteca, pero tres de ellos no tienen la edad permitida para ingresar.
Si la persona encargada en la puerta pedirá cuatro identificaciones al azar. Si a alguno de los menores
de edad se le pide la identificación, nadie en el grupo entratrá a la discoteca. Calcule la probabilidad
de que todos entren a la discoteca.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
Unidad 5. Variables aleatorias 151
Ejemplo 33
Luego de embalar un contenedor de envases de productos de Expórtame, se tienen 60 envases, de los
cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases para el control de calidad.
Calcule la probabilidad de que ocho envases sean de frasco.
Solución
Representación
Definamos la variable X:= número de envases de frasco seleccionados.
La variable X se tiene una distribución hipergeométrica con parámetros:
N= 60 tamaño de la población
r = 25 número de éxitos en la población
n = 20 tamaño de la muestra.
El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 20. Entonces, X
~ H(N = 60; r = 25; n = 20) y Rx = {0, 1,…,20}
Cálculo
La probabilidad pedida es
𝐶PUO × 𝐶QU
RO
𝑃(𝑋 = 8) = _N = 0,2153
𝐶UN

Calcule la variabilidad relativa de X respecto a la media.


Solución
Lo que nos piden es calcular el coeficiente de variación de X. Primero, hallemos el esperado y la
varianza de X.
𝑟 25
𝜇 = 𝐸(𝑋) = 𝑛 = 20 = 8,333
𝑁 60
𝑟 𝑟 𝑁−𝑛 25 25 60 − 25
𝑉(𝑋) = 𝑛 p1 − q w x = 20 w1 − x w x = 2,8337
𝑁 𝑁 𝑁−1 60 60 60 − 1

El coeficiente de variación de X es
y𝑉(𝑋) √2,8337
𝐶𝑉(𝑋) = × 100% = × 100% = 21,79%
𝐸 (𝑋 ) 8,3333
Ejemplo 34
La actriz Magaly Solier es la décima séptima mujer en denunciar una agresión sexual en un bus del
Metropolitano, desde noviembre del 2012. De las 17 denuncias, solo una está cerca de recibir
sentencia. El agresor podría recibir de dos a cuatro años de prisión suspendida, cumplir trabajos
comunitarios o pagar reparación civil. Si se eligen al azar tres de las denuncias de las 17 existentes.
Calcule la probabilidad de elegir el caso que está cerca de recibir sentencia.
Solución
Sea X = número de casos que están cerca de recibir sentencia
X ~ H(N= 17; n = 3; r = 1) y Rx = {0,1}
P(X = 1) = f(1) = 0,1765

RNotas importantes
152 Estadística Descriptiva 201901

Distribución de Poisson
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina
proceso de Poisson y posee las siguientes propiedades:
• El número de resultados que ocurre en un intervalo o región de espacio cualquiera es
independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.
• La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o región muy
pequeña es proporcional a la longitud del intervaloo al tamaño de la región y no depende del
número de resultados que ocurren fuera del intervalo o región.
• La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga en tal región
pequeña es insignificante.

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:

e - l lx
f (x ) = P ( X = x ) = x = 0, 1, 2,...
x!

x = número de éxitos por unidad de tiempo o región.


l = número esperado de éxitos por unidad de tiempo o región.
e = 2,71828…

0.16
0.14
0.12
0.10
f(x)

0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X

Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro l y se denota
X~P(l).

Siempre es una distribución sesgada a la derecha. A medida que l aumenta y tomando en cuenta sólo
los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.

Media: µ = E(X) = l

Varianza: s2 = V(X) = l

RNotas importantes
Unidad 5. Variables aleatorias 153
Caso Aerolínea Wayra
El número de llamadas hacia una azafata por los pasajeros durante un vuelo se modela con una varia-
ble Poisson con una media de 0,25 llamadas cada diez minutos.
a. Calcule la probabilidad de que una azafata no reciba ninguna llamada en un viaje de 50 minutos.
b. Calcule la probabilidad de que una azafata reciba más de una llamada en un viaje de 50 minutos.
c. Si una azafata ya recibió una llamada durante los primeros minutos del viaje, calcule la probabili-
dad de que reciba dos llamadas más durante dicho viaje de 50 minutos.
Solución
a. Calcule la probabilidad de que una azafata no reciba ninguna llamada en un viaje de 50 minutos.
Solución
Interpretación

Representación
La variable en estudio X es ………………….…………………………………….…………………………………..
El rango o recorrido de la variable X es …………………..…………………….………………..………..……
La distribución de la variable es …………………………………………………………..
Sus parámetros son ………………………..…………………………………….…..………..
Cálculo
La probabilidad pedida es P(X…………) = f(………) = ………………………….......……….……………….

b. Calcule la probabilidad de que una azafata reciba más de una llamada en un viaje de 50 minutos.
Solución
La probabilidad pedida es P(X…………) = …………………………..…………….......………. ……………….

c. Si una azafata ya recibió una llamada durante los primeros minutos del viaje, calcule la probabili-
dad de que reciba dos llamadas más durante dicho viaje de 50 minutos.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
154 Estadística Descriptiva 201901
Ejemplo 35
Suponga que el número de llamadas que llegan a una central telefónica es 0,5 por minuto en promedio.
Calcule la probabilidad de que en un minuto no lleguen llamadas
Solución
X:= número de llamadas / minuto l = 0,5 llamadas / minuto
e-0.5 0,50
P ( X = 0) = = 0,6065
0!

Calcule la probabilidad de que en un minuto lleguen más de tres llamadas


Solución
P(X > 3) = 1 – P(X ≤ 3) = 1 – (0,6065 + 0,3033 + 0,0758 + 0,0126) = 0,9982

Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas


Solución
Y:= número de llamadas / 3 minutos l = 1,5 llamadas / 3 minutos
P(Y < 5) = 0,2231 + 0,3347 + 0,2510 + 0,1255 + 0,0471 = 0,98142

Calcule la probabilidad de que en cinco minutos lleguen más de dos llamadas


Solución
W:= número de llamadas / 5 minutos l = 2,5 llamadas / 5 minutos
P(W > 2) = 1 – P(W ≤ 2) = 1 – (0,0821 + 0,2052 + 0,2565) = 0,45652

Ejemplo 36
El administrador de un almacén ha observado que en promedio ingresan al establecimiento 20
personas cada 30 minutos. ¿Cuál es la probabilidad de que en seis minutos ingresen al almacén a lo
más 5 clientes pero más de 3?
Solución
Representación
Lo primero es definir la variable adecuada, sea X:= número de personas que entren al establecimiento
en un periodo de seis minutos.
Como nos dicen que la variable cuenta las llegadas por unidad de tiempo, se tiene que X ~ P(l).
Luego, debemos determinar el valor de l, para lo cual vamos a hacer una regla de tres simple, pues es
una propiedad de la distribución Poisson.
Si en 30 minutos llegan en promedio 20 personas, entonces en 6 minutos llegarán, en promedio, l,= 4
personas. Se tiene que X ~ P(l = 4).
Cálculo
Nos piden
e-4 44 e-4 45
P ( 3 < X £ 5) = P ( X = 4 ) + P ( X = 5) = + = 0,3517
4! 5!

RNotas importantes
Unidad 5. Variables aleatorias 155
Ejemplo 37
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos por los cuales
este puede ser seccionado. ¿Cuál es la probabilidad de que en un tramo de 13,5 metros se encuentren
cinco puntos de seccionamiento?
Solución
Sea X:= número de puntos de seccionamiento. Como nos dicen que la variable cuenta puntos por
unidad de longitud, se tiene que X ~ P(l).
Debemos determinar el valor de l. Si en 100 metros hay en promedio 80 puntos de seccionamiento,
entonces en 13,5 metros hay, en promedio, l,= 10,8 puntos. Se tiene que X ~ P(l = 10,8)
Cálculo
| }~•,€ QN,P}•
Nos piden 𝑃(𝑋 = 5) = = 0,025
O!
Observe que si lambda l sale un valor que no es entero, no se debe redondear a un entero.

Ejemplo 38
El número de unidades envasados por una persona se modela con una variable Poisson con un
promedio 10 unidades por cada 20 minutos.
a. ¿Cuál es la probabilidad de que en 20 minutos se envasen 12 productos?
P(X = 12) = 0,095
b. Si la máquina funciona durante dos horas consecutivas, calcule la probabilidad de que se hayan
envasado 50 productos.
l1 = 60 unidades en dos horas. Luego, P(X = 50) = 0,0233

Ejemplo 39 Caso Metropolitano


El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o
reclamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una
variable aleatoria Poisson con una media de ocho correos por día. Calcule la probabilidad que en medio
día llegue más de tres correos con consultas, sugerencias, quejas o reclamos. Si esta probabilidad es
mayor a 0,8 se destinará a una persona para que conteste los correos diariamente.
Solución
Interpretación
Determinar si la probabilidad de que lleguen más de tres correos es mayor a 0,8.

Representación
Sea X:= número de correos electrónicos llegados a la cuenta de correo del Metropolitano en medio
P ƒ„nn|„+
día. l = Q …í‡ x 0,5 día. Luego, X ~ P(l = 4 correos)

Cálculo
| }ˆ S ‰
P(X > 3) = 1 – P(X ≤ 3) = 1 – ∑R,gN ,!
= 1 – (0,0183 + 0,0733 + 0,1465 + 0,1954) = 1 – 0,4335 = 0,5665
Análisis
La probalidad de que lleguen más de tres correros es 0,5665 que es menor a 0,8.

Argumentación
Como no es mayor a 0,8 no se destinará a una persona para que conteste los correos diariamente.

RNotas importantes
156 Estadística Descriptiva 201901

Variable aleatoria continua


Es una variable cuyo rango es un conjunto infinito no numerable de valores.
Por ejemplo: peso, en kilos, de una persona, tiempo en resolver la primera pregunta del examen parcial
de un curso o volumen, en decibeles, en una discoteca a una hora determinada.

Función de densidad de una variable aleatoria continua


Se denomina función de densidad de probabilidad f(x) de una variable aleatoria continua a la función
que satisface:
f ( x ) ³ 0 para todo x Î R

ò f ( x ) dx = 1

Se tiene que:
b
P ( a £ X £ b ) = ò f ( x ) dx
a

P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b)

Una variable aleatoria continua tiene la siguiente función de densidad de probabilidad:


ìax 0< x<7
f (x ) = í
î 0 en otro caso
Solución
Representación
La variable en estudio X es ………………….…………………………………….…………………………………..
El rango o recorrido de la variable X es …………………..…………………….………………..………..……
Cálculo
Determine el valor de a.

Calcule la probabilidad de P(4,5 < X < 6,5)

RNotas importantes
Unidad 5. Variables aleatorias 157
Ejemplo 40
Para cierto negocio por correo electrónico la proporción de los pedidos procesados en 24 horas tiene
la función de densidad de probabilidad.
f(x) = 2 (1 - x) 0£x£1
Compruebe si f(x) es una función de densidad.

Solución
Se debe comprobar que:
- f(x) ³ 0 para todo x Î R. Este se cumple pues para 0 £ x £ 1, es f(x) = 2 (1 - x) ³ 0

- ò f ( x ) dx = 1. Existen dos formas de responder esta pregunta.

Integrando la función de densidad f(x) y verificando que el área es igual a 1 y que cada f(x) sea positivo
1
x2
f (x )dx = ò 2 (1 - x) dx = 2 x - 2
1 1 1
ò0 0 2
= 2x - x 2
0
0

Ahora debemos evaluar en 0 y en 1


=(2 x 1 – 12) – (2 x 0 – 02) = 1
Calculando el área del triángulo a partir de la gráfica y verificando que el área es igual a 1 y que cada
f(x) sea positivo.
b ´ h 1´ 2
Área = = =1
2 2
¿Cuál es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de 24 horas?
Solución
Existen dos formas de responder esta pregunta.
Integrando la función de densidad f(x) de 0,8 a 1.

ò 2(1 - x ) = (2 ´1 - 1 ) - (2 ´ 0,8 - 0,8 ) = 0,04


1
2 2
0,8

Calculando el área de triángulo desde 0,8 a 1.


b ´ h (1 - 0,8 ) ´ ( 2 (1 - 0,8 ) )
Área =
= = 0,04
2 2
Observe que para la segunda forma de resolución, se usó la función de densidad para hallar la altura
del triángulo.

Si el porcentaje de pedidos procesados en 24 horas es mayor al 80%, calcular la probabilidad de que


sea mayor a 90%.
Solución
P(X > 0,9 / X > 0,8) = (0,1 x 0,2 / 2) / (0,2 x 0,4 / 2) = 0,25

RNotas importantes
158 Estadística Descriptiva 201901
Ejemplo 41 Caso Metropolitano
La distancia, en metros, que recorre un usuario caminando para llegar a una estación del
Metropolitano se modela con la variable aleatoria X con la siguiente función de densidad.
𝑥
0 < 𝑥 < 500
𝑓(𝑥) = Š 250000
𝑥
𝑎− 500 ≤ 𝑥 < 1000
250000

Calcule el esperado y la varianza de X.


Solución
Representación

Cálculo
Primero hallemos a
ONN QNNN
𝑥 𝑥
Œ 𝑑𝑥 + Œ 𝑎 − 𝑑𝑥 = 1
250000 250000
N ONN

De donde a = 1/250.

Ahora calculemos el esperado y la varianza de X.


ONN QNNN
𝑥 1 𝑥
𝐸(𝑋) = Œ 𝑥 𝑑𝑥 + Œ 𝑥 − 𝑑𝑥 = 500
250000 250 250000
N ONN

ONN QNNN
𝑥 U
1 𝑥
𝑉(𝑋) = Œ 𝑥 𝑑𝑥 + Œ 𝑥 U − 𝑑𝑥 − 500U = 41 666,7
250000 250 250000
N ONN

Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar a una estación.
Solución
ONN ]NN
𝑥 1 𝑥
𝑃(300 < 𝑋 < 700) = Œ 𝑑𝑥 + Œ − 𝑑𝑥 = 0,64
250000 250 250000
RNN ONN

RNotas importantes
Unidad 5. Variables aleatorias 159

Función de distribución acumulada de probabilidad


La función de distribución acumulada de una variable aleatoria continua X con función de densidad f(x)
se define por:
F(x) = P(X £ x) para - ¥ < x < + ¥
Se tiene que:
P(a < X ≤ b) = F(b) – F(a)

Propiedades

dF ( x )
= f (x)
• dx
• F(x) es una función que siempre está entre 0 y 1 (0 ≤ F(x) ≤ 1), pues es igual a una probabilidad.
• F(x) es una función que nunca decrece, lim F ( x ) = 0 y lim F ( x ) = 1.
x ®-¥ x ®+¥

1.0
F(x)
0.8
0.6
0.4
0.2
0.0
-2 -1 0 1 2 3 4 5

Sea F(x) la función de distribución acumulada de la variable X.


ì 1 x >2
ï
F ( x ) = íx - 1 1 £ x £ 2
ï 0 x <1
î
Calcule la probabilidad de que X esté entre 1,3 y 1,7.

RNotas importantes
160 Estadística Descriptiva 201901

Sea X una variable aleatoria que modela la cantidad de tiempo en minutos que una persona tarda en
responder una pregunta de un examen y que tiene la siguiente función de densidad
ìa(6 - x ) 0< x <6
f( x) = í
î 0 en otro caso
Determine y grafique la función de distribución acumulada de la variable aleatoria X.

Use la función de distribución acumulada de la variable X para calcular la probabilidad de que una
persona se tarde hasta 3 minutos en responder un pregunta.

Use la función de distribución acumulada de la variable X para calcular la probabilidad de que una
persona se tarde más de 4 minutos en responder un pregunta.

Use la función de distribución acumulada de la variable X para calcular la probabilidad de que una
persona se tarde entre 3 y 5 más minutos en responder un pregunta.

RNotas importantes
Unidad 5. Variables aleatorias 161
Ejemplo 42
Encuentre el rango intercuartil de X, si X es el tiempo de vida de un sistema es una variable aleatoria,
en años, cuya función de distribución acumulada es:

ì 0 x£5
ï
F ( x ) = í 25
ïî1 - x 2 x >5

Solución
Sea X:= tiempo, en años, de vida de un sistema.

Para calcular el rango intercuartil, debemos hallar el cuartil 1 y el cuartil 3, para esto hay dos
posibilidades: integrar la función de densidad f(x) o reemplazar en la función de distribución
acumulada.

Por definición de cuartil 3, el 75% de los datos es menor o igual a él, es decir P(X ≤ Q3) = 0,75, o lo que
es lo mismo F(Q3) = 0,75
25
F ( Q3 ) = 0,75 = 1 - de donde Q3 = 10.
Q32
25
Haciendo lo mismo para el cuartil 1. F ( Q1 ) = 0,25 = 1 - de donde Q1 = 5,77.
Q12
Luego el RIC = Q3 – Q1 = 4,23.

Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior, ¿cuál es la


probabilidad que pertenezca al quinto superior?
Solución
Como nos dicen que “ya se sabe que está en el cuarto superior”, es una probabilidad condicional.
P ( X > P80 ) 0,20
P ( X > P80 X > P75 ) = = = 0,80
P ( X > P75 ) 0,25

RNotas importantes
162 Estadística Descriptiva 201901

Valor esperado de una variable aleatoria continua


El valor esperado o esperanza matemática de una variable aleatoria X o media de una variable aleatoria
X se denota E(X).

µX = E ( X ) = ò x f ( x ) dx

Valor esperado de una función de variable aleatoria continua


Sea G(X) una función de la variable aleatoria X. El valor esperado de G(X) es:

E éëG ( X ) ùû = ò G ( x ) f ( x ) dx

Propiedades del valor esperado en variables aleatorias


• E(b) = b
• Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, a3, . . ., an son n constantes, entonces:
E(a1X1 + a2X2 + … + anXn) = a1 E(X1) + a2 E(X2) + … + an E(Xn)
• Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma función de densidad, entonces se cumple
que E(Xi) = µ, por lo tanto:
E(X1 + X2 + … + Xn) = nµ

Caso Aerolínea Wayra


El tiempo, en minutos, que se tarda una persona en ser atendido en el counter del aeropuerto se
modela con una variable aleatoria X:
ì kx 0<x<4
ï
f (x ) = ík (8 - x ) 4£ x <8
ï 0 en otro caso
î
Determine la media de la variable aleatoria X.

RNotas importantes
Unidad 5. Variables aleatorias 163

Varianza y desviación estándar de una variable aleatoria continua

𝜎dU = V(X) = E(X2) – (E(X))2

La desviación estándar de X es la raíz cuadrada de la varianza de X.


Propiedades de la varianza en variables aleatorias
• Si Y = aX + b, con a y b son constantes, entonces 𝜎•U = 𝑎U 𝜎dU
• Si X1, X2, ..., Xn son n variables aleatorias independientes, y a1, a2, ..., an son n constantes, entonces:
V(a1X1 + a2X2 + … + anXn) = a12 V(X1) + a22 V(X2) + … + an2 V(Xn)
• Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma función de densidad,
entonces se cumple que V(Xi) = s2 y, por lo tanto:
V(X1 + X2 + … + Xn) = ns2
Caso Aerolínea Wayra
El sobrepeso, en kilos, del equipaje de mano de un pasajero se modela con una variable aleatoria X
con la siguiente función de densidad de probabilidad:
ìk (8 - x ) 4£ x <6
f( x) = í
î 0 en otro caso
Si la desviación estándar de la variable aleatoria del sobrepeso es mayor a medio kilo, se va a restringir
el sobrepeso permitido en el equipaje de mano. Indique lo que se hará.
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
164 Estadística Descriptiva 201901

Distribuciones de probabilidad de variable continua

Distribución uniforme
Función de densidad
ì 1
ï a£x£b
f (x) = íb - a
ï
î 0 en otro caso

Se dice que X tiene una distribución uniforme y se denota X ~ U (a, b).

(‡•‘)
Media: 𝜇= U
U (‘r‡)’
Varianza: 𝜎 = QU

La función de distribución acumulada de una variable uniforme es:


ì 0 x <a
ïx -a
ï
F (x) = í a£x£b
ïb -a
ïî 1 x >b

RNotas importantes
Unidad 5. Variables aleatorias 165
Caso Aerolínea Wayra
Objetivo específico: Determinar si se revisarán los protocolos de salida de un avión.

El tiempo en el que un avión llega a su destino con respecto a su hora programada se modela con una
variable aleatoria uniforme de parámetros -10 y 20. De tal manera que los valores negativos indican
que el avión llegó antes de la hora programada y los valores positivos indican que el avión llegó después
de la hora programada. Si la probabilidad de que un avión llegue con un retraso mayor a 10 minutos
es mayor al 20%, se revisarán los protocolos de salida de un avión. Indique lo que se hará.
Solución
Interpretación

Representación
Sea la variable X:= …………………………………………………………………………………
La distribución es ………………………………………………………………………………………

Cálculo

Análisis

Argumentación

Calcule la probabilidad de que la diferencia entre la hora de llegada programada y la hora de llegada
sea mayor a seis minutos.

RNotas importantes
166 Estadística Descriptiva 201901
Si se escoge al azar 20 vuelos, calcule la probabilidad de que, como máximo, se tenga un vuelo con
retraso mayor a ocho minutos.

Ejemplo 43
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia es una variable
aleatoria cuya distribución es uniforme con a = -0,025 y b = 0,025.
¿Cuál es la probabilidad de que tal error esté entre 0,010 y 0,015?
Solución
Sea X:= error al determinar la densidad de una sustancia
La variable X ~ U(a = -0,025, b = 0,025) tiene la siguiente función de densidad
ì 1
ï -0,025 £ x £ 0,025
f (x) = í 0,025 - (-0,025)
ï 0 en otro caso
î
ì 1
ï - 0,025 £ x £ 0,025
f (x) = í 0,05
ï 0 en otro caso
î
Nos piden P(0,010 £ X £ 0,015) . Existen dos formas de calcular esta probabilidad: integrando la
función de densidad f(x) o calculándola a partir del área del rectángulo.
0,015
1 1
P(0,010 £ X £ 0,015) = ò dx = ( 0,015 - 0,010 ) = 0,10
0,010
0,050 0,050
b. ¿Cuál es el error esperado cometido?
Solución
La variable X ~ U(a = -0,025, b = 0,025) tiene el siguiente número esperado de errores

µ=
( a + b ) = ( -0,025+0,025) = 0
2 2

RNotas importantes
Unidad 5. Variables aleatorias 167
Ejemplo 44
La llegada de cada uno de los empleados a su centro de labores se produce independientemente, de
acuerdo a la distribución uniforme en el intervalo comprendido entre las 8:00 y 8:25 am. De una
muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos hayan llegado entre las 8:15
y 8:20 AM.

Solución
Interpretación
Se debe calcular la probabilidad de que cuatro de ellos hayan llegado entre las 8:15 y 8:20 AM.
Representación
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al centro de
trabajo, luego X ~ U (0, 25)
1
f (x) = ; 0 £ x £ 25
25
Se define la variable Y:= número de empleados que llegan al centro de trabajo entre 8:15 y 8:20 AM.
Debe calcularse la probabilidad de éxito p de que un empleado llegue al centro de trabajo entre 8:15
y 8:20 AM esto es:
20 - 15
p= = 0,20
25
Entonces Y ~ B(10; 0,20)

P(Y = y) = f(y) = 𝐶“QN (0,2)y(0,80)10 – y, y = 0, 1,…, 10


Cálculo
Se pide
P(Y = 4) = f(4) = 𝐶SQN (0,2)4(0,80)6 = 0,0881

RNotas importantes
168 Estadística Descriptiva 201901

Distribución normal

Función de densidad
2
1æ x -µ ö
1 - ç
s ÷ø
f (x) = e 2è
s 2p
Se dice que la variable aleatoria X sigue una distribución normal con parámetros µ y s.
Se denota X ~ N (µ, s2).

La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia
central coinciden.
El rango de la variable normal es toda la recta real, esto es, de –¥ a + ¥.

Estandarización
Se toma como referencia una distribución normal estándar (µ = 0 y s2 = 1). Se trabaja con la distancia
entre x y µ en función de la desviación estándar, tal como se muestra.
X -µ
Z=
s

RNotas importantes
Unidad 5. Variables aleatorias 169
Ejercicio de cálculo
Si Z ~ N(µ = 0, s2 = 1), calcular

P(Z < 1,13) =

P(Z > 0,93) =

P(0,30 < Z < 1,15) =

Hallar c para que P(Z < c) = 0,82121

Tabla de la distribución normal estándar


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147

RNotas importantes
170 Estadística Descriptiva 201901

La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable aleatoria
que tiene una distribución normal con una media igual a 400 soles y una desviación estándar igual a
80 soles.
Calcule la probabilidad de que un cliente ahorre menos de 460 soles en un mes.

Calcule la probabilidad de que un cliente ahorre más de 350 soles mensuales.

Calcule la probabilidad que el ahorro mensual de un cliente esté entre 400 y 550 soles.

¿Cuál es el ahorro mínimo mensual para estar en el 25% de los clientes que más ahorran?

RNotas importantes
Unidad 5. Variables aleatorias 171
¿Cuál es el ahorro máximo mensual para estar en el 10% de los clientes que menos ahorran?

Si se elige al azar a 6000 clientes, calcule el valor esperado del número de clientes que ahorran más de
480 soles.

Ejemplo 45
El gasto mensual de un usuario en el Metropolitano se modela con una variable normal con media de
100 soles y una desviación estándar de cinco soles. Se elige un usuario al azar.
Calcule la probabilidad de que gaste entre 90 y 110 soles.
Solución
Sea X = gasto mensual en soles. X ~ N(100; 52)
P(90 ≤ X ≤ 110) = P( X ≤ 110) - P(X ≤ 90) = 0,9772 – 0,0228 = 0,9545

¿Cuál es la probabilidad de que gaste más de 105 soles?


Solución
P(X > 105) = 1 - P( X ≤ 105) = 1 - 0,8413 = 0,1587

Determine el gasto mensual mínimo para que esté en 10% de los que más gastan.
Solución
‡rQNN
𝑃(𝑋 ≤ 𝑎) = 𝑃 p𝑍 ≤ O
q = 0,9)
‡rQNN
Buscando en la tabla, O
= 1,28. Luego, a = 106,4.

RNotas importantes
172 Estadística Descriptiva 201901
Ejemplo 46
En Buck Café, la máquina surtidora de refrescos está ajustada de tal forma que sirve en promedio 250
mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue, aproximadamente, una
distribución normal con una desviación estándar de 10 mililitros. ¿Qué proporción de los vasos
servidos contendrán entre 240 y 255 mililitros de refresco?
Solución
Sea X:= cantidad de refresco servido por vaso, X ~ N(µ = 250, s 2 = 102)
Se pide P(240 ≤ X ≤ 255). Estandarizando se tiene:
æ 240 - µ X - µ 255 - µ ö æ 240 - 250 255 - 250 ö
Pç £ < ÷ = Pç £Z< ÷
è s s s ø è 10 10 ø
= P ( -1 £ Z < 0,5) = F ( 0,5) - F ( -1) = 0,6915 – 0,1587 = 0,5328

Ejemplo 47
Se informa que la cantidad X de azúcar de los paquetes marcados con un kilo, tiene distribución normal
con media µ kilogramos y desviación estándar 0,02 kilogramos. Hallar el valor de µ si la cantidad de
azúcar que contiene cada paquete es menor o igual a 0,95 kilos con probabilidad 0,102.
Solución
Sea X:= pesos de los paquetes de azúcar, en kilogramos. X ~ N(µ , s 2 = 0,022)
Se pide P(X £ 0,95) = 0,102.
Estandarizando se tiene
æ X - µ 0,95 - µ ö
Pç £ ÷ = 0,102
è s s ø
æ 0,95 - µ ö
Pç Z £ = 0,102
è 0,02 ÷ø
Usando la tabla normal estándar para calcular el valor z correspondiente.
0,95 - µ
= -1,27 . De donde µ = 0,9754
0,02

RNotas importantes
Unidad 5. Variables aleatorias 173

Distribución exponencial
En variables que representan los tiempos de vida útil, tiempos de sobrevivencia, en tiempos de ocu-
rrencia en procesos de Poisson se suele utilizar la distribución exponencial.
La variable aleatoria X tiene una distribución exponencial con parámetro β (β > 0) si su función de
densidad de probabilidad es:
x
1 -
b
f ( x) = e ; x³0
b

Se denota X ~ Exp(β) y se lee que la variable aleatoria X sigue una distribución exponencial con pará-
metro β.
La probabilidad de que la variable aleatoria X tome valores en el intervalo [c,d] es numéricamente igual
al área sombreada, y se calcula de la siguiente manera:
d
P (c £ X £ d ) =
- b1 t
ò c be
1
dt

Media de X: µ = E(X) = b
Varianza de X: s2 = V(X) = b2

Función de distribución acumulada de X



r
F(x) = 1 – 𝑒 – x³0


r
Se cumple que P(X > x) = 𝑒 –

RNotas importantes
174 Estadística Descriptiva 201901
Caso Aerolínea Wayra
El tiempo de vida útil de tipo de una llanta de avión se modela con una variable aleatoria con distribu-
ción exponencial, cuya media es 20 días.
Calcule la probabilidad de que la vida útil de una llanta sea menor a 16 días. Si dicha probabilidad es
menor a 0,3 se cambiará de proveedor del mantenimiento de neumáticos. Indique lo que se hará.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

Calcule la probabilidad de que la vida útil de una llanta esté entre 21 y 25 días.

Si una llanta ya duró 23 días, calcule la probabilidad de que su vida útil sea de al menos cinco días más.

RNotas importantes
Unidad 5. Variables aleatorias 175

Ejercicios de la Unidad 5
46. En un lote de 30 polos hay tres defectuosos. Se toma una muestra aleatoria de cinco polos y se
define la variable aleatoria X como el número de polos defectuosos en la muestra.
a. Determine y grafique la función de probabilidad de la variable X.
0.6

0.5

0.4

0.3

0.2

0.1

’˜
W‰— W•}‰ 0

Rpta: 𝑓(𝑥) = —• RX = {0, 1, 2, 3} 0 1 2 3

W•

b. Calcule la probabilidad de tener dos polos defectuosos en la muestra. Rpta: 0,06158


c. Calcule la probabilidad de tener al menos un polo defectuoso en la muestra.
Rpta: 0,43350
47. La demanda diaria de un producto es una variable aleatoria X cuya distribución de probabilidades
es simétrica y está dada por la tabla siguiente:
x 1 2 3 4 5
f(x) a 0,20 b c 0,05
La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la cantidad
demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 soles por
unidad demandada de producto.
a. Calcule el valor de a, b y c. Rpta: 0,05; 0,50 y 0,20
b. Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Rpta: 0,75
c. Calcule el valor esperado de la utilidad por la demanda diaria de productos.
Rpta: 338,25 soles
48. Indique si son verdaderas o falsas las siguientes afirmaciones.
a. Se denomina variable aleatoria a una descripción numérica del resultado de un experimento.
Rpta: V
b. El valor esperado es el valor más probable de ocurrencia. Rpta: F
c. El valor esperado es un valor que puede ser mayor que el máximo de los valores del rango de
la variable aleatoria. Rpta: F
d. El valor esperado es un valor que siempre es igual a uno de los valores del rango de la variable.
Rpta: F
e. Variable aleatoria continua es una variable cuyo rango es un conjunto infinito numerable de
valores. Rpta: V
f. La función de distribución acumulada es siempre mayor a la función de densidad para
cualquier valor de la variable aleatoria. Rpta: F
g. El esperado de la suma de dos variables aleatorias es igual a la suma de los dos esperados de
las variables aleatorias. Rpta: V
h. La varianza de una variable aleatoria puede ser menor a cero. Rpta: F
i. El mayor valor del rango de la variable hipergeométrica es siempre menor o igual a n.
Rpta: V
j. En un proceso de Poisson el número de resultados que ocurre en un intervalo es dependiente
del número que ocurre en cualquier otro intervalo del espacio disjunto.Rpta: F
k. La variable binomial cuenta el número de éxitos en n repeticiones independientes con la
misma probabilidad de fracaso en cada repetición. Rpta: V

RNotas importantes
176 Estadística Descriptiva 201901
l. La variable hipergeométrica cuenta el número de éxitos en una muestra de tamaño n de una
población N que tiene r éxitos y donde el muestreo es con reemplazo. Rpta: F
m. La media de una variable normal puede ser negativa. Rpta: V
n. Si Z es una variable normal estándar P(Z > c) = 0,025, entonces c = -1,96.
Rpta: F
o. Si X es una variable normal se cumple que P(X < c) = P (X ≤ c) Rpta: V
p. Si Z es una variable normal estándar se cumple que P(Z < -c) = 1 - P (Z < c)
Rpta: V
q. Si X es una variable normal se cumple que P(X < -c) = 1 - P(X < c) Rpta: F
r. El rango de toda variable normal es igual a toda la recta real Rpta: V
s. La función de densidad de la distribución normal toma su mayor valor en X = µ.
Rpta: V
t. La función de densidad de la distribución normal en algunos casos no es simétrica.
Rpta: F
u. El esperado de una variable normal es siempre igual a µ. Rpta: V
49. Un examen consta de 100 preguntas. Cada pregunta tiene cinco opciones para marcar y solo una
respuesta correcta Por cada respuesta correcta se le otorga al postulante un punto, mientras que
si la respuesta es incorrecta al postulante se le resta un cuarto de punto. Si un postulante contesta
todas las preguntas del examen al azar, calcule el valor esperado del puntaje obtenido.
Rpta: 37,5 puntos
50. Se lanza un dado una vez, sea la variable aleatoria X igual al número de la cara superior. Calcule la
media, varianza y desviación estándar de la variable X. Rpta: 3,5; 2,9167; 1,7078
51. Se lanzan dos dados y sea la variable aleatoria X igual a la suma de los números de las caras
superiores. Calcule la media y la varianza de la variable X. Rpta: 7; 5,83333
52. El número de ensaladas demandadas al día en un restaurante se modela con una variable aleatoria
X que tiene la siguiente distribución de probabilidad.
x 10 15 17 18 20 25
f(x) a 0,12 0,35 2a 0,14 0,09
El costo de cada ensalada es de seis soles y las vende a diez soles. Toda ensalada no vendida en el
día se desecha. Calcule la media y desviación estándar de la utilidad diaria, si el restaurante prepara
20 ensaladas por día. Rpta: 49,5; 27,654
53. Una compañía de comida rápida sabe que el 90% de sus tiendas por franquicia tendrán éxito
comercial. Si el éxito de cada tienda se puede considerar independiente de las demás tiendas.
Calcule la probabilidad de que al menos dieciocho tiendas tengan éxito, si la compañía va a instalar
20 tiendas en el presente año. Rpta: 0, 6769
54. Según la Asociación para el Fomento de la Infraestructura Nacional el 48% de los hogares de Lima
no tienen acceso a agua potable de calidad, por no contar con la dosificación adecuada de cloro o
comprarla de manera informal a los camiones cisternas. Si se eligen al azar a diez hogares de Lima,
calcule la probabilidad de que cinco de ellos no tengan acceso agua potable de calidad.
Rpta: 0,2441
55. La empresa San Fernando ha lanzado su campaña “Plato calato no”. Si de un total de 60 personas,
donde 34 recuerdan la campaña, se eligen al azar a ocho personas para entrevistarlos, calcule la
probabilidad de elegir al menos a tres personas que recuerden la campaña.
Rpta: 0,9402
56. En una distribuidora hay 25 televisores de los cuales seis son de tecnología OLED. Si se seleccionan
al azar diez televisores, calcule la probabilidad de que se haya seleccionado por lo menos dos te-
levisores de tecnología OLED. Rpta: 0,8022
RNotas importantes
Unidad 5. Variables aleatorias 177
57. Un comerciante recibe un lote de 30 computadoras portátiles. Para protegerse de una mala
remesa, el comerciante revisará diez computadoras y rechazará todo el lote si encuentra una o
más computadoras defectuosas. Si en el lote hay tres computadoras defectuosas, ¿cuál es la
probabilidad de que rechace el lote? Rpta: 0,7192
58. En una pastelería, el número demandado de un cierto tipo de torta se modela con una variable
Poisson con una media de tres tortas al día. La pastelería, siempre, produce tres tortas diarias.
Cada torta cuesta producirla 50 soles y se vende a 80 soles. Toda torta no vendida en el día se
remata en 20 soles y siempre las compran todas las tortas a ese precio. Calcule el valor esperado
de la utilidad por dicho concepto. Rpta: 49,67 soles
59. La duración (en minutos) de una llamada telefónica en la sala de profesores puede modelarse por
una variable aleatoria X con la siguiente función de densidad
ìa ( 3 - x ) 0< x £3
f (x) = í
î 0 en otro caso
a. Determine el valor de a. Rpta: 0,2222
b. Calcule la probabilidad de que una llamada dure menos de un minuto y medio.
Rpta: 0,75
c. Si una llamada ya duró un minuto, calcule la probabilidad de que dure más de dos minutos.
Rpta: 0,25
60. La proporción de personas que responden a una encuesta enviada por correo electrónico se
modela con una variable aleatoria X con la siguiente función de densidad
ì 2x + 9
ï 0 < x £1
f ( x ) = í 10
ïî 0 en otro caso
a. Determine y grafique la función de distribución acumulada de la variable aleatoria X.
0 𝑥≤0 1
0.9

, ’ •f,
Rpta: 𝐹(𝑥) =™
0.8

QN
0<𝑥<1 0.7
0.6

1 𝑥≥1
0.5
0.4

0.3
0.2
0.1

b. Use la función de distribución acumulada para calcular la probabilidad


0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

de que respondan entre 60% y 80% de las personas a la encuesta. Rpta: 0,208
c. Use la función de distribución acumulada para calcular la mediana de X.
Rpta: 0, 0.52493
61. El gerente comercial de la sucursal de Surco informa que el gasto mensual, en cientos de soles, por
la venta de libros a sus clientes es una variable aleatoria que tiene la siguiente función de densidad:
1
𝑓(𝑥) = š8 𝑥 + 𝒂 2 ≤ 𝑥 ≤ 6
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Calcule el valor esperado del gasto mensual en libros. Rpta: 467 soles
62. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcular los
parámetros de la función de densidad. Rpta: a = 18, b = 30
63. La función de Excel =ALEATORIO() genera un número con distribución uniforme con parámetros a
igual a cero y b igual a uno. Sea X una variable aleatoria definida como el número generado por
dicha función.
a. Calcule la probabilidad de que la función genere un número aleatorio entre 0,2 y 0,7.
Rpta: 0,50

RNotas importantes
178 Estadística Descriptiva 201901
b. Use la función de distribución acumulada para calcular P(0,15 < X < 0,55).
Rpta: 0,40
64. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse
por una variable aleatoria uniforme con parámetros 10 y 38. Si la pizza se tarda más de 30 minutos
en ser entregada, el cliente no la pagará.
a. Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Rpta: 0,2857
b. Si la familia pide una pizza diaria durante diez días seguidos, calcule la probabilidad de que por
lo menos una de ellas le salga gratis. Rpta: 0,9654
c. Una familia pidió una pizza hace 25 minutos y aún no ha llegado, ¿cuál es la probabilidad de
que le salga gratis? Rpta: 0,6154
65. Una compañía ha comprado una prueba para seleccionar personal. Los que han diseñado la prueba
saben que las notas siguen una distribución normal con una media de 75 puntos y una desviación
estándar de diez puntos. Calcule la probabilidad de que una persona que rinda esta prueba
obtenga una nota superior a 90 puntos. Rpta: 0,06681
66. En una ciudad se estima que la temperatura máxima en un día del mes de enero puede modelarse
con una variable normal con media 30°C y desviación estándar 2°C.
a. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima sea menor a 31°C. Rpta: 0,69146
b. Si se escoge al azar un día del mes de enero, calcule la probabilidad de que la temperatura
máxima esté entre 28,5 y 32°C. Rpta: 0,61472
c. Calcule el número esperado de días en el mes de enero en que la temperatura máxima es
mayor a 33°C. Asuma independencia entre las temperaturas de un día y otro.
Rpta: 2,07
67. Marque la opción correcta.
La moda de una variable aleatoria normal X es:
a. Igual a cero
b. El esperado de X
c. Aquel valor para el cual f(Me) = 0,5, donde f es la función de densidad de X
d. No se puede determinar sin saber la desviación estándar.
e. Es el valor que acumula más del 50% del área Rpta: b
68. Objetivo específico: Analizar el tiempo de vida de los vehículos de la empresa Taxi Satelital antes
de que se presente una falla mecánica.
El tiempo, en días, que transcurre desde la adquisición de un vehículo nuevo hasta que se presenta
la primera falla mecánica se modela con una variable aleatoria exponencial con media de 500 días.
1 r ,
𝑓(𝑥) = 𝑒 ONN 𝑝𝑎𝑟𝑎 𝑥 ≥ 0
500
a. Calcule e interprete el cuartil 3 del tiempo que transcurre desde la adquisición de un vehículo
nuevo hasta que se presenta la primera falla mecánica. Rpta: 693,14 días
b. Calcule la probabilidad de que un vehículo, elegido al azar, presente la primera falla mecánica
después de los 700 días. Si esta probabilidad es menor del 80% se considera una falla
importante y se solicitará el pago de la garantía al proveedor de la flota. ¿Cuál será la decisión?
Rpta: 0,2466
c. El proveedor de vehículos a la empresa Taxi Satelital afirma que el 90% de los vehículos tiene
su primera falla mecánica después de los 200 días. ¿Es cierta tal afirmación?
Rpta: 0,6703

RNotas importantes
Unidad 5. Variables aleatorias 179
d. Se elige al azar un vehículo, se observa que han pasado 300 días y no se ha presentado ninguna
falla mecánica, calcule la probabilidad de que pasen como máximo 200 días más antes de que
se presente la primera falla mecánica. Rpta: 0,3297
69. La vida útil, en meses, de un artefacto eléctrico es una variable aleatoria con distribución
exponencial con parámetro β. El fabricante afirma que el 90% de estos componentes tienen una
vida útil que supera los 60 meses. ¿Cuál es la media de la vida útil de estos componentes?
Rpta: 569,47 meses
70. Objetivo específico. Analizar el cumplimiento de la empresa Taxi Satelital con relación tiempo
ofrecido para brindar un servicio.
Se ha observado que un servicio muy solicitado es llevar clientes de Jesús María a San Isidro. Se
define la variable uniforme X: diferencia entre el tiempo programado y el tiempo real de llegada
del taxi, en minutos. Los parámetros de X son -5 a 15, donde el signo negativo indica que el vehículo
llegó antes del tiempo estimado y el valor positivo indica que demoró más del tiempo estimado.
𝑓(𝑥) = 𝑎 − 5 ≤ 𝑥 ≤ 15
a. Calcule la probabilidad que uno de estos servicios haya tenido un retraso mayor a cinco
minutos. Rpta: 0,50
b. Calcule el tiempo mínimo para pertenecer al 20% de los clientes que más demoran en llegar a
su destino. Si este tiempo es mayor a los 10 minutos se realizará un análisis de los tiempos
reales para cumplir con este servicio. ¿Qué decisión se tomará? Rpta: 11 minutos
c. Se elige aleatoriamente a diez de estos servicios, calcule la probabilidad de que cuatro lleguen
antes del tiempo programado. Rpta: 0,14600

RNotas importantes
Unidad 6 : Distribuciones muestrales

Logro de la unidad 6

Al finalizar la unidad 6,
el estudiante toma decisiones frente a situaciones reales de incertidumbre,
utilizando las distribuciones muestrales en el cálculo de probabilidades.

Temario

• Propiedad reproductiva de la distribución normal


• Distribución muestral de un promedio
• Teorema central del límite
182 Estadística Descriptiva 201901

Propiedad reproductiva de la normal


Si X1, X2, X3,..., Xn son n variables independientes, tales que Xi ~ N(µi, si2), para cada i = 1, 2, 3, ... , n;
entonces, la variable aleatoria
S = c1X1 + c2X2 + … + cnXn
donde c1, c2, c3,..., cn son constantes, se distribuye normal, tal que:

S ~ N(c1µ1 + c2µ2 + … + cn µn ; c12s12 + c22s22 + … + cn2sn2)

µS = Media de S sS2 = Varianza de S

• Si X1, X2 son dos variables normales independientes, tales que X1 ~ N(µ1, s12) y X2 ~ N(µ2, s22),
entonces,
S = X1 + X2 ~ N(µ1 + µ2 ; s12 + s22)

µS = Media de S sS2 = Varianza de S

• Si X1, X2,..., Xk son n variables normales independientes, tales que Xi ~ N(µ, s2), para i = 1, 2,..., n,
entonces,
S = X1 + X2 + … + Xn ~ N( nµ ; ns2 )

µS = Media de S sS2 = Varianza de S

Si X1, X2 son dos variables normales, tales que X1 ~ N(µ1 = 10, s12 = 9) y X2 ~ N(µ2 = 6, s22 = 16) indique
la distribución de la variable S y sus parámetros.
S = X1 + X2

S = X1 - X2

S = 2X1 - 5X2

RNotas importantes
Unidad 6. Distribuciones muestrales 183
Caso Aerolínea Wayra
Objetivo específico: Analizar el peso de los pasajeros.

El peso de los pasajeros adultos de un avión se modela con una variable normal:
• en mujeres, con media 65 kilos y desviación estándar 15 kilos.
• en hombres, con media 80 kilos y desviación estándar 20 kilos.
Si la probabilidad de que 10 pasajeras mujeres y 10 pasajeros hombres pesen más de 1500 kilos es
mayor a 0,3 se va a restringir la cantidad de pasajeros en las avionetas pequeñas. Indique lo que hará
la compañía.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
184 Estadística Descriptiva 201901
Caso Aerolínea Wayra
El peso de los pasajeros adultos de un avión se modela con una variable normal:
• en mujeres, con media 65 kilos y desviación estándar 15 kilos.
• en hombres, con media 80 kilos y desviación estándar 20 kilos.
En un avión donde el 60% de los pasajeros son entre 70 y 80 mujeres. Si la probabilidad de que una
persona pese más de 75 kilos es mayor a 0,3 se restringirá el peso de los equipajes de mano. Indique
lo que se hará.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Unidad 6. Distribuciones muestrales 185
Ejemplo 48
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente de una compa-
ñía de investigación de mercado estimó que las ventas diarias (en miles de dólares) de los dos super-
mercados se distribuyen normalmente con medias de 15 y 17 y desviaciones estándar de 3 y 4 respec-
tivamente. Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el
primer supermercado en el primer día.
Solución
Interpretación
Se debe calcular la probabilidad de que el segundo supermercado venda más que el primero.
Representación
Sean las variables:
X: Ventas diarias del primer supermercado X ~ N(15, 9)
Y: Ventas diarias del segundo supermercado Y ~ N(17, 16)
Se pide: P(Y > X) o su equivalente: P(Y – X > 0)
Cálculo
Sea W = Y – X, por la propiedad reproductiva de la distribución normal, se tiene:
W ~ N(17 – 15, 16 + 9), es decir: W ~ N(2, 25)
P(Y – X > 0) = P(W > 0)
æW - µ 0 -2 ö
P(W > 0) = P ç > ÷
è s 5 ø
P(W > 0) = P ( Z > -0,40 )
P(W > 0) = 0,6554
Ejemplo 49
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente de una compa-
ñía de investigación de mercado estimó que las ventas diarias (en miles de dólares) de los dos super-
mercados se distribuyen normalmente con medias de 15 y 17 y desviaciones estándar de 3 y 4 respec-
tivamente. Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermerca-
dos no supere los 1000 dólares.
Solución
Interpretación
Se debe calcular la probabilidad de la diferencia entre las ventas de los supermercados sea menor o
igual a 1000 dólares.
Representación
Sea W = Y – X, por la propiedad reproductiva de la distribución normal.
Cálculo
Sea W = Y – X, por la propiedad reproductiva de la distribución normal, se tiene:
W ~ N(17 – 15, 16 + 9), es decir: W ~ N(2, 25)
En este caso se pide calcular:

(WW£££11)1)=)==PPP((-(--111£££WWW£££111)))===PPPæçæçæç---1155--22 ££ Ws- µ £ 1 -5-522ö÷ö÷==PPP((---0,6


PP(P(W 0,6 0,2))=)==0,1465
0,6£££ZZZ£££---0,2
0,2 0,1465
0,1465
èèè øø

RNotas importantes
186 Estadística Descriptiva 201901
Ejemplo 50 Caso Metropolitano
El peso de un usuario hombre del Metropolitano se modela con una variable normal con media de 75
kilos y desviación estándar de 15 kilos, mientras que para una usuaria mujer con media de 60 kilos y
desviación estándar de 10 kilos. Si en un bus hay 50 hombres y 30 mujeres.
Si se elige una persona al azar, calcule la probabilidad de que pese más de 70 kilos.
Solución
Interpretación
Se debe calcular la probabilidad de que una persona pese más de 70 kilos.
Representación
Sean los eventos:
A: = una persona pese más de 70 kilos
H:= Que el usuario sea hombre
M:= Que el usuario sea mujer
Sean las variables aleatorias:
X = peso de un hombre X ~ N(75; 152)
Y = peso de una mujer Y ~ N(60; 102)
Usaremos teorema de la probabilidad total P(A) = P(H) P(A/H) + P(M) P(A/M)
Cálculo
Calculemos cada una de las probabilidades condicionadas
𝑃(𝐴⁄𝐻 ) = 𝑃(𝑋 > 70) = 1 − 𝑃(𝑍 < −0,33) = 0,6293
𝑃(𝐴⁄𝑀 ) = 𝑃(𝑌 > 70) = 1 − 𝑃(𝑍 < 1) = 0,1587
Luego,
50 30
𝑃(𝐴) = 𝑃(𝐻). 𝑃(𝐴⁄𝐻) + 𝑃(𝑀). 𝑃(𝐴⁄𝑀) = × 0,6293 + × 0,1587 = 0,4528
80 80

Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.
Solución
Interpretación
Se debe calcular la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere 5500 kilos.
Representación
Sea Y := el peso total de los 50 hombres y 30 mujeres
ON RN

𝑌 = £ 𝑋¤ + £ 𝑌¤
¤gQ ¤gQ

Cálculo
Por propiedad reproductiva de la normal, 𝑌~𝑁(50 × 75 + 30 × 60; 50 × 15U + 30 × 10U )
es decir, 𝑌~𝑁(5 550; 14 250).
Nos piden
𝑃(𝑌 > 5 500) = 𝑃(𝑍 > 0,42) = 1 − 𝑃(𝑍 ≤ 0,42) = 1 − 0,66276 = 0,33724.

RNotas importantes
Unidad 6. Distribuciones muestrales 187

Distribución muestral de un estadístico


Es la lista de posibles valores de un estadístico y la probabilidad asociada a cada valor.

Distribución de la media muestral


Es la lista de todas las medias posibles de tamaño n tomadas de una población específica y sus proba-
bilidades asociadas.
d •d •⋯•d¨ )’
𝑋" = ~ ’- ~ ?( µ ; -
)

Media de 𝑋" Varianza de 𝑋"

Según los Censos Nacionales del 2017, la media de la edad de los peruanos es 31,51 años y la desviación
estandar es 1,76. Si se toma una muestra de 4000 viviendas, calcule la probabilidad de que la media
muestral esté entre 2,85 y 2,95 habitaciones. Asuma normalidad.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
188 Estadística Descriptiva 201901

Teorema central del límite


Si X1, X2,..., Xk son n variables independientes e igualmente distribuidas, tales que Xi con media µ y
varianza s2, entonces la variable aleatoria S tiene una distribución aproximadamente normal a medida
que n crece, independientemente de la distribución de la población.
S = X1 + X2 + … + Xn » N( nµ ; ns2 )

µS = Media de S sS2 = Varianza de S


Se considera una buena aproximación a la distribución normal si n ³ 30.

Se deduce que la distribución muestral de la media (𝑋") se aproxima a la distribución normal si n ³ 30.
d •d •⋯•d¨ )’
𝑋" = ~ ’- » N( µ ; -
)

Media de 𝑋" Varianza de 𝑋"

Según los Censos Nacionales del 2017, la media de la edad de los peruanos es 31,51 años y la desviación
estandar es 21,27. Si se toma una muestra de 5000 personas, calcule la probabilidad de que la media
muestral esté entre 30 y 32 años.
Solución
Interpretación

Representación

Cálculo

RNotas importantes
Unidad 6. Distribuciones muestrales 189
Caso Aerolínea Wayra
Objetivo específico: Analizar el tiempo de entrega de alimentos en un avión.

El tiempo, en segundos, que tarda un auxiliar de vuelo, en segundos, en servir las bebidas a un pasajero
se modela con una variable aleatoria X con la siguiente función de densidad:
ìa(20 - x ) 10 < x < 20
f (x ) = í
î 0 en otro caso
Calcule la probabilidad de que un auxiliar de vuelo se demore más de 20 minutos al servir a 100
pasajeros. Si esta probabilidad es mayor a 0,7 se adelantará el momento de entregar las bebidas.
Indique la decicisón.
Solución
Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
190 Estadística Descriptiva 201901
Ejemplo 51 Caso Metropolitano
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia, queja o
reclamo. El número de correos electrónicos que llegan a la cuenta de correo se modela como una
variable aleatoria Poisson con una media de ocho correos por día.
Si se eligen al azar 100 días, calcule la probabilidad que la cantidad total de correos recibidos en esos
100 días esté entre 790 y 810.
Solución
Interpretación

Representación
Sea Xi = número de correos electrónicos que llegan a la cuenta de correo del Metropolitano en el día, i
= 1,…,100
Sea Y := cantidad total de correos en los 100 días
QNN

𝑌 = £ 𝑋¤
¤gQ
Usaremos el teorema central del límite.

Cálculo
Por teorema central del límite, 𝑌 ≈ 𝑁(𝑛𝜇 = 100 × 8; 𝑛𝜎 U = 100 × 8), es decir, 𝑌 ≈ 𝑁(800; 800).
Nos piden:
𝑃(790 < 𝑌 < 810) = 𝑃(−0,35 < 𝑍 < 0,35) = 0,2737.

También se puede calcular usando la distribución de la media muestral.


Nos piden
𝑃(790 < 𝑌 < 810) = 𝑃(7,9 < 𝑋" < 8,1)
) ’ P
Por teorema central del límite, 𝑋" ≈ 𝑁 p𝜇 = 8, = q, es decir, 𝑋" ≈ 𝑁(8; 0,08).
- QNN

Luego, 𝑃(790 < 𝑌 < 810) = 𝑃(7,9 < 𝑋" < 8,1) = 0,2737.

Ejemplo 52 Caso Metropolitano


Se define la variable aleatoria X: número de días a la semana que un usuario usa el Metropolitano. Esta
variable presenta la siguiente función de probabilidad.

X: Número de días 0 1 2 3 4 5 6 7
f(x) 0,05 0,10 0,15 0,15 0,20 0,25 0,05 0,05

Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la media muestral del
número de días que usan el Metropolitana esté entre 3,5 y 3,6 días. Si esta probabilidad supera a 0,6
entonces se mantendrá la cantidad de buses actual.

RNotas importantes
Unidad 6. Distribuciones muestrales 191
Solución
Interpretación
Se debe calcular la probabilidad de que la media muestral esté entre 3,5 y 3,5 días.

Representación
La variable aleatoria X: número de días a la semana que un usuario usa el Metropolitano.

Cálculo
Usando la calculadora, E(X) = 3,55 y V(X) = 3,1475.
) ’
R,QS]O
Por teorema central del límite, 𝑋" ≈ 𝑁 p𝜇 = 3,55, - = QNNN q, es decir, 𝑋" ≈ 𝑁(3,55; 0,0031475).

Nos piden 𝑃(3,5 < 𝑋" < 3,6) = 𝑃(−0,89 < 𝑍 < 0,89) = 0,6272.

Análisis
La probabilidad pedida es mayor a 0,6.

Argumentación
Por lo tanto, se mantendrá la cantidad de buses actual.

Ejemplo 53 Caso Metropolitano


El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con
parámetros 0 y 10 minutos. Si se elige al azar a 500 usuarios, calcule la probabilidad de que la media
del tiempo de espera de esos 500 usuarios esté en 4,8 y 5,2 minutos.
Solución
Interpretación
Se debe calcular la probabilidad de que la media del tiempo de espera de esos 500 usuarios esté en
4,8 y 5,2 minutos.

Representación
Usaremos el teorema central del límite. La variable es el tiempo de espera de un usuario.

Cálculo
Por propiedad de la variable uniforme,
µ = (a + b)/2 = (0+10)/2 = 5
σ2= (10 - 0)2/12 = 8,3333
Por teorema central del límite,
) ’ P,RRRR
𝑋" ≈ 𝑁 p𝜇 = 5, - = ONN q, es decir, 𝑋" ≈ 𝑁(5; 0,01667)
Nos piden,
P(4,8 < 𝑋" < 5,2) = 𝑃(−1,55 < 𝑍 < 1,55) = 0,8789.

RNotas importantes
192 Estadística Descriptiva 201901

Ejercicios de la Unidad 6
71. En un estudio de evaluación de la atención de un servicio de cafeterías, los tiempos, en minutos,
que tardan en atender a un cliente las cafeterías A y B se modelaron con las variables aleatorias X
~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente. Si en cada cafetería son aten-
didas 20 personas, halle la probabilidad de que el tiempo total de atención en la cafetería B sea
mayor que el de la cafetería A. Rpta. 0,81327
72. Lima y El Cairo son las dos principales ciudades del mundo situadas en zonas desérticas y con
extremo estrés hídrico. En París, Zurich o Berlín, el consumo medio por persona de agua bordea
los 130 litros por día. Sin embargo, en Lima el consumo medio por persona es de 250 litros por día
con una desviación estándar de 60 litros por día. Si se toma una muestra en Lima de 100 personas,
calcule la probabilidad de que el consumo total muestral en un día sea menor a 24 mil litros.
Rpta. 0,04746
73. La cantidad de mango que exporta una empresa mensualmente se modela con una variable
aleatoria con media de 25 toneladas y desviación estándar de cuatro toneladas. Encontrar la
probabilidad de que la cantidad exportada en tres años sea menor a 920 toneladas. Asuma
independencia entre las cantidades mensuales exportadas. Rpta. 0,79673
74. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede mode-
larse como una variable normal. Al menor se le da en media 23,5 soles por semana con una des-
viación estándar de 3 soles, al segundo hijo se le da el doble que al menor y al mayor se le da el
triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total recibida en
propinas por los tres sume más de 600 soles. Rpta. 0,15866
75. Marque la afirmación correcta.
El teorema del límite central afirma que:
a. A medida que el tamaño poblacional crece, la distribución de la media poblacional tiende a una
distribución normal
b. A medida que el tamaño poblacional crece, la distribución de la media muestral tiende a una
distribución normal
c. A medida que el tamaño muestral crece, la distribución de la media poblacional tiende a una
distribución normal
d. A medida que el tamaño muestral crece, la distribución de la media muestral tiende a una
distribución normal. Rpta: d.
El teorema del límite central afirma que:
a. La suma de variables aleatorias normales independientes es una variable normal
b. La suma de más de 30 variables aleatorias normales independientes es una variable normal
c. La suma de más de 30 variables aleatorias independientes es una variable normal
d. La suma de más de 30 variables aleatorias independientes es aproximadamente una variable
normal Rpta: d.
76. El número de vuelos nacionales cancelados en un día se modela con la variable aleatoria X con la
siguiente función de probabilidad:
x 0 1 2 3 4 5
f(x) 0,40 0,25 0,15 0,10 0,05 0,05
Se toma una muestra de 100 días, calcule la probabilidad de que se cancelen entre 125 a 135
vuelos nacionales. Rpta: 0,26931

RNotas importantes
Evaluaciones de ciclos anteriores 193

Evaluaciones de ciclos anteriores

ESTADÍSTICA DESCRIPTIVA – MA460


EXAMEN PARCIAL (AC)
Ciclo 2018 01
Profesores : Todos
Secciones : Todas
Duración : 170 minutos
Indicaciones:
1. Sólo serán calificadas las respuestas desarrolladas en los espacios indicados para cada pregunta,
donde debe aparecer el procedimiento.
2. No está permitido el uso de celulares ni cualquier otro dispositivo electrónico, solo calculadora.
3. Los alumnos deberán dejar todas sus pertenencias debajo de la pizarra.
4. El uso de los útiles es personal, no se permite su intercambio.
5. No se permite el uso de libros ni apuntes de clase.
6. Trabaje mínimo con cuatro decimales en los cálculos previos.
PARTE 1: CONCEPTOS BÁSICOS

1. A cualquier medida que resume la información de una población se le llama ……………………………. ,


y la que resume la información de una muestra se le llama …………………………. (0,5 punto)
2. ¿Cuál es el título del siguiente gráfico? (0,5 punto)

100%
4.8% 8.3%
90% 14.3%
Porcentaje de alumnos

80% 20.8%
70% 23.8%
60% 25.0%
50% Economía
40% Música
30% 57.1% Derecho
20% 45.8% Medicina
10%
0%
Mujeres Hombres
Fuente: UPC Género
3. En un muestreo estratificado, si N = 500, N1 = 200 y n = 36, el valor de n1 es ………… (0,25 punto)
4. En un muestreo aleatorio simple, si N = 1500, n = 30 y se pide usar las columnas: C3, C5, C6, C9 y
C10; la posición del primer elemento encontrado es ……………………….………. (0,25 punto)
5. Para un muestreo sistemático, se tiene el siguiente marco muestral: (0,50 punto)

Posición 1 2 3 4 5 6 7 8 9 10 11
Edad 23 35 42 33 41 25 36 19 22 30 41

Si n = 4 y se pide usar la columna C7 para el arranque, el valor de A es ………..

RNotas importantes
194 Estadística Descriptiva 201901
PARTE 2: CASO ALBUM MUNDIALITO

El grupo Figurex es una empresa transnacional fundada en Bélgica en el año 1980. Figurex tiene
presencia en más de 60 países donde comercializa el álbum Mundialito, el cual cuenta con la licencia
oficial del evento deportivo más importante del mundo. La versión clásica del álbum Mundialito 2018
ha tenido un rotundo éxito en el mercado peruano, es por ello que el gerente de Figurex planea lanzar
en el Perú una versión el álbum Mundialito Platinum, en el que aparecerán los jugadores de las
selecciones nacionales que forman parte de la lista definitiva que participará en el Mundial 2018.

Para el lanzamiento del álbum Mundialito Platinum, se realizará previamente un estudio basado en la
experiencia de la comercialización del álbum Mundialito Clásico. Es por ello que Figurex ha contratado
a Ronald Mesinas para que realice dicho estudio, y así se puedan tomar importantes decisiones.

Para el estudio se seleccionó una muestra de 120 coleccionistas peruanos del álbum Mundialito Clásico
y se tomaron en cuenta las variables siguientes:

Edad: Edad del coleccionista


Género: Género del coleccionista
Número: Número de figuras coleccionadas hasta este momento.
Lugar de compra: Kiosco, tiendas por departamento, librería, tiendas por conveniencia,
supermercados, bodegas.
Queja: Principal queja: precio, escasez de figuras, pocos lugares de venta, baja calidad de
las figuras, muchas figuras repetidas, etc.
Gasto: Gasto, en soles, realizado hasta este momento
Monto: Monto, en soles, que está dispuesto a gastar hasta completar el álbum
Distrito: Distrito de residencia
Opinión: Opinión sobre la calidad del servicio del lugar de compra
Tiempo: Tiempo, en días, que lleva coleccionando el álbum

Objetivo general: Determinar acciones importantes para el lanzamiento del álbum Mundialito
Platinum a partir del análisis de los resultados de las ventas del álbum Mundialito Clásico.

Objetivos específicos:
OE1: Elegir el material que se utilizará en las figuras del álbum Mundialito Platinum.
OE2: Elegir el lugar de compra al que se brindará mayor prioridad.
OE3: Determinar el precio de venta del combo álbum más paquetón.
OE4: Elegir el distrito donde se lanzará la preventa del álbum Mundialito Platinum.
OE5: Elegir en qué lugar de compra se brindarán promociones especiales.

Dimensiones Indicación sobre lo que hará el estudiante


Interpretación Identifica el problema en el contexto de la situación y las variables involucradas.

Representación Bosqueja/representa el problema usando los datos e indica que va a calcular.


Cálculo Realiza los cálculos necesarios para obtener los indicadores para sustentar el análisis.

Análisis Analiza e interpreta los resultados de las diversas opciones que muestra el caso.

Argumentación Explica los resultados y da recomendaciones para la solución del caso.

RNotas importantes
Evaluaciones de ciclos anteriores 195
OE1: Elegir el material que se utilizará en las figuras del álbum Mundialito Platinum.

Ronald Mesinas propondrá que se utilice un papel couché de 100 gramos para la elaboración de las
figuras del álbum Mundialito Platinum (el del álbum clásico fue de 70 gramos), solo en el caso de que
la baja calidad de las figuras sea una de las principales quejas. Para ello, Ronald quiere identificar los
problemas que se deben solucionar para resolver el 70% de la problemática. (2,5 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25 p) Representación (0,25 p) Cálculo (1 p) Análisis (0,5 p) Argumentación (0,5 p)

RNotas importantes
196 Estadística Descriptiva 201901
OE2: Elegir el lugar de compra al que se brindará mayor prioridad.

El gerente del grupo Figurex considera que si un lugar de compra tiene como mínimo el 75% de
coleccionistas que opinan que el servicio es bueno o muy bueno, entonces éste sería el principal canal
de distribución del álbum Mundialito Platinium. Para identificar el lugar de compra que cumpla con la
condición mencionada se tiene la siguiente información: (2,5 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25 p) Representación (0,25 p) Cálculo (1 p) Análisis (0,5 p) Argumentación (0,5 p)

RNotas importantes
Evaluaciones de ciclos anteriores 197
OE3: Determinar el precio de venta del combo álbum más paquetón.

El precio del combo álbum Mundialito Platinum más paquetón que propondrá Ronald Mesinas, será
mayor que el 60% del monto más frecuente que están dispuestos a pagar los coleccionistas hasta
completar el álbum, pero menor que el 70% de la media de dicha variable. ¿Qué precio podría
proponer Ronald? Puede dar como respuesta un valor único para el precio, no necesariamente un
intervalo. (4,0 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25 p) Representación (0,25 p) Cálculo (2,5 p) Análisis (0,5 p) Argumentación (0,5 p)

RNotas importantes
198 Estadística Descriptiva 201901
OE4: Elegir el distrito donde se lanzará la preventa del álbum Mundialito Platinum.

El gerente de Figurex considera que debe lanzarse una preventa del álbum Mundialito Platinum en el
distrito que cumpla las siguientes condiciones:
Condición 1: Los tiempos que llevan coleccionando el álbum son más homogéneos.
Condición 2: Hay una concentración en valores altos para la variable tiempo que llevan
coleccionando el álbum.
Si no se encuentra ningún distrito que cumpla con las condiciones señaladas, no se lanzará la preventa.
(5,0 puntos)
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5 p) Representación (0,5 p) Cálculo (3 p) Análisis (0,5 p) Argumentación (0,5 p)

RNotas importantes
Evaluaciones de ciclos anteriores 199
OE5: Elegir en qué lugar de compra se brindarán promociones especiales.

El gerente del grupo Figurex considera se debe lanzar promociones especiales en el lugar de compra
donde el 50% central de datos que corresponde al número de figuras coleccionadas, en cientos, tenga
menor dispersión y mayor concentración de datos en valores grandes. ¿En cuál de los tres lugares de
compra se brindarán promociones especiales? (4,0 puntos)
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25 p) Representación (0,25 p) Cálculo (2 p) Análisis (1 p) Argumentación(0,5 p)

RNotas importantes
200 Estadística Descriptiva 201901
Anexos: Tablas y gráficos

Gráfico 1: Distribución porcentual acumulada de coleccionistas según


monto que están dispuestos a gastar hasta completar el álbum 100.0%
95.0%
100%
80.0%
Porcentaje acumulado de

80%
coleccionistas

60% 52.5%
35.0%
40%
22.5%
20% 12.5%
5.0%
0%
150 250 350 450 550 650 750 850 950
Monto (soles)
Fuente: Grupo Figurex

Gráfico 2: Distribución de coleccionistas según el tiempo que llevan


coleccionando el álbum en Miraflores
20
16
Cantidad de coleccionistas

15 12

10 8
6
4 3
5
1
0
2 10 18 26 34 42 50 58 66
Tiempo (días)
Fuente: Grupo Figurex

Gráfico 3: Distribución porcentual de coleccionistas según opinión por


lugar de compra
100% 2.6% 3.2% 2.0%
7.7% 9.7% 12.0%
Porcentaje de coleccionistas

80%

60% 30.8% Muy malo


35.5% 26.0% Malo
40% Regular
46.2% Bueno
20%
32.3% Muy bueno
0%
Kiosco Librería Supermercado
Lugar de compra
Fuente: Grupo Figurex

RNotas importantes
Evaluaciones de ciclos anteriores 201

Gráfico 4: Distribución de coleccionistas según principal queja


120 100%

Porcentaje acumulado de coleccionistas


Número de coleccionistas 90%
100 80%
80 70%
60%
60 50%
40%
40 30%
20 20%
36 12
24 15 6 10%
0 00%
Escasez de Precio Baja calidad Pocos Muchas Otros
figuras de las figuras lugares de figuras
venta repetidas
Principal queja
Fuente: Grupo Figurex

Gráfico 5: Distribución de coleccionistas según número de figuritas


coleccionadas por lugar de compra

4.8
Número de figuritas en cientos

4.4
4.0 4.0 4.1
* 3.9 3.8
3.6 3.5 P25
3.2 3.1 Mínimo
3.0
2.8
2.5 2.6 P50
2.4 2.4
2.2 2.2 Máximo
2.0 2.0
1.8
1.6 P75
1.4 1.4
1.2
Supermercado Librería Kiosco
Lugar de compra
Fuente: Grupo Figurex

Tabla 1: Medidas estadísticas del tiempo, en días, que llevan coleccionando el álbum en los
distritos Comas y Lince
Medida estadística Comas Lince
Media 37 42
Moda 32
Percentil 50 37
Desviación estándar 13 14
Coeficiente de variación 33,33%
Coeficiente de asimetría 0,4615
Fuente: Grupo Figurex

RNotas importantes
202 Estadística Descriptiva 201901

Tabla 2: Distribución porcentual de coleccionistas según lugar de compra por opinión


Lugar de compra
Opinión Kiosco Librería Supermercado
Muy bueno 37,5% 20,8% 41,7%
Bueno 33,3% 30,6% 36,1%
Regular 23,8% 28,6% 47,6%
Malo 25,0% 25,0% 50,0%
Muy malo 33,3% 33,3% 33,3%
Fuente: Grupo Figurex

Tabla 3: Número de figuras coleccionadas (en cientos) - Kiosco


1.52 2.25 2.27 2.8 2.82 2.95 3.15
3.45 3.45 3.46 3.5 4.1 4.2 4.92

RNotas importantes
Evaluaciones de ciclos anteriores 203

ESTADÍSTICA DESCRIPTIVA – MA460


EXAMEN PARCIAL (AC)
Ciclo 2018 02
Profesores : Todos
Secciones : Todas
Duración : 170 minutos
Indicaciones:
1. Sólo serán calificadas las respuestas desarrolladas en los espacios indicados para cada pregunta,
donde debe aparecer el procedimiento.
2. No está permitido el uso de celulares ni cualquier otro dispositivo electrónico, solo calculadora.
3. Trabaje mínimo con cuatro decimales en los cálculos previos.
PARTE 1: Conocimientos

1. A la media, mediana y moda se les llama………………………………………………………………….., y a los


cuartiles, deciles y percentiles se les llama ………………………………………………….….. (0,5 punto)

2. Para evaluar la preferencia por los fondos mutuos, se realizó una encuesta a los inversionistas del
banco BMC, una de las preguntas ¿qué tipo de inversionista se considera?, los resultados se
muestran en el siguiente gráfico a partir de una muestra, ¿cuál es el título del siguiente gráfico?,
complete e interprete la frecuencia faltante. (0,5 punto)

Título: ..................................................................................................

60.0%
Porcentaje de inversioistas

50.0% 7.8%
5.2%
40.0% 5.7% Conservador
11.7%
30.0% 15.2% Moderado
20.0% Audaz
10.0% 19.6% 21.7% Retador del peligro
0.0%
Mujeres Hombres
Fuente: BMC Género

3. En un muestreo estratificado, si N = 1000, N1 = 100, N3 = 400 y n = 80, el valor de n2 es:


(0,25 punto)

4. En un muestreo aleatorio simple, si N = 2500, n = 50 y se pide usar las columnas: C15, C16, C17,
C18 y C20; la posición del primer elemento encontrado es: (0,25 punto)

RNotas importantes
204 Estadística Descriptiva 201901

5. Para evaluar el cumplimiento de las obligaciones tributarias de las pequeñas empresas se necesita
realizar un experimento aleatorio, que consiste en elegir a tres pequeñas empresas al azar. Si se
define: cumple con obligaciones tributarias (C), no cumple (N). por lo tanto, los elementos del
espacio muestral son: (1,0 punto)

6. Si de un grupo de ocho pequeñas empresas, se sabe que dos no cumplen con sus obligaciones
tributarias. La Sunat, decidirá una revisión a todas las pequeñas empresas sobre el cumplimiento
de sus tributos, si la probabilidad de que al seleccionar tres empresas por lo menos una no cumpla
con sus obligaciones tributarias supere a 0,62, ¿qué le recomendaría usted a la Sunat?
(1,5 punto)

PARTE 2: Lanzamiento de nuevo empaque de arándanos


Composal es una empresa transnacional que ofrece alimentos frescos,
saludables y de alta calidad a consumidores de todo el mundo. Composal está
involucrada en la cosecha, el proceso y la comercialización de productos
agrícolas, tales como paltas, arándanos, langostinos, mandarinas, uvas que son
exportados, a más de 40 países.
Felipe, gerente de Composal, plantea a su equipo impulsar la comercialización
de los arándanos, fruta con más cantidad de antioxidantes, los que ayudan a
reducir el riesgo de infartos y enfermedades cardiovasculares. Para ello, planea lanzar en el Perú una
nueva presentación de envases de arándanos, para este propósito encarga el estudio a la consultora
Arthur&B realizar el estudio basado en la experiencia de la comercialización del envase clásico. La
consultora seleccionó una muestra de 150 consumidores de arándanos en el envase clásico y se
midieron las siguientes variables:
Edad: Edad del consumidor
Género: Género del consumidor
Número: Número de veces que compra por mes.
Lugar de compra: Mercado, supermercado, ambulantes, tiendas por conveniencia, bodegas
Queja: Principal queja (precio, poca ventilación en los envases, baja calidad del producto,
pocos lugares de venta, peso no adecuado, etc.)
Gasto: Gasto, en soles, realizado por semanas
Monto: Monto, en soles, que está dispuesto a pagar por una mejor presentación.
Distrito de residencia: Surco, San Miguel y Miraflores
Opinión: Opinión sobre la calidad del servicio del lugar de compra
Tiempo: Tiempo, en días, que lleva en consumir los arándanos.
Motivo: Motivo por que compra los arándanos (es una fruta muy nutritiva, evita el riesgo
de enfermedades cardiovasculares, es muy agradable, es ideal para los niños)

RNotas importantes
Evaluaciones de ciclos anteriores 205
Objetivo general: Determinar acciones importantes para el lanzamiento de la nueva presentación del
envase de arándanos a partir del análisis de los resultados de las ventas del envase clásico.

Dimensiones Indicación sobre lo que hará el estudiante

Interpretación Identifica el problema a resolver en el contexto de la situación

Representa el problema usando los datos e indica lo que va a calcular y las variables
Representación involucradas.

Cálculo Realiza los cálculos necesarios para obtener los indicadores para sustentar el análisis.

Análisis Analiza e interpreta los resultados de las diversas opciones que muestra el caso.

Argumentación Explica los resultados y da recomendaciones para la solución del caso.

Felipe decidirá lanzar la nueva presentación del envase de arándanos si demuestra que se cumple por
lo menos cuatro de las siguientes recomendaciones planteadas por la consultora.

1. Utilizar láminas plásticas PET bañadas en aceite de anís para combatir de forma activa el hongo en
los arándanos (el del envase clásico no contiene este aceite de anís), solo en el caso de que la baja
calidad del producto sea una del 70% de las principales quejas.

2. Orientar la publicidad del nuevo envase a los consumidores indistintamente del género siempre
que los motivos de compra de los arándanos sea la misma para hombres y mujeres.

3. Entregar un recetario de arándanos con el nuevo envase si más del 28% de los consumidores
compra por lo menos 3 veces al mes y el número de veces que compra al mes está próximo a 2,64
veces.

4. Establecer una estrategia de precio para promocionar el nuevo envase, si se demuestra que en el
50% de los valores centrales la variabilidad del precio a pagar por el nuevo envase es más
homogénea en el distrito de Miraflores que en los distritos de San Miguel y Surco, y si se
comprueba la presencia de precios extremos en el distrito de Miraflores.

5. Lanzar la promoción del nuevo envase vía online si el monto mínimo de compra del 30% de los
consumidores del género masculino que más gastan es menor a 38 soles y los montos de compra
de los consumidores del género femenino se concentran en valores pequeños.

6. Establecer un precio diferenciado por distrito, si el monto de gasto de los consumidores es más
heterogéneo en el distrito de San Miguel que en el distrito de Miraflores.

Se le solicita usted apoye a Felipe en la verificación de las recomendaciones planteadas y realice un


informe que destaque sus hallazgos.

RNotas importantes
206 Estadística Descriptiva 201901
Recomendación 1: Utilizar láminas plásticas PET bañadas en aceite de anís para combatir de forma
activa el hongo en los arándanos (el del envase clásico no contiene este aceite de anís), solo en el caso
de que la baja calidad del producto sea una del 70% de las principales quejas. (1,5puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25) Representación(0,25) Cálculo (0,25) Análisis (0,25) Argumentación (0,5)

RNotas importantes
Evaluaciones de ciclos anteriores 207
Recomendación 2: Orientar la publicidad del nuevo envase a los consumidores indistintamente del
género siempre que los motivos de compra de los arándanos sea la misma para hombres y mujeres.
(2,0 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25) Representación(0,25) Cálculo (1,00) Análisis (0,25) Argumentación (0,25)

RNotas importantes
208 Estadística Descriptiva 201901
Recomendación 3: Entregar un recetario de arándanos con el nuevo envase si más del 28% de los
consumidores compra por lo menos 3 veces al mes y el número de veces que compra al mes está
próximo a 2,64 veces. (2,5 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25) Representación(0,25) Cálculo (1,0) Análisis (0,5) Argumentación (0,5)

RNotas importantes
Evaluaciones de ciclos anteriores 209
Recomendación 4: Establecer una estrategia de precio para promocionar el nuevo envase si demuestra
que en el 50% de los valores centrales la variabilidad del precio a pagar por el nuevo envase es más
homogénea en el distrito de Miraflores que en los distritos de San Miguel y Surco, y si se comprueba
la presencia de precios extremos en el distrito de Miraflores. (3,0 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25) Representación(0,25) Cálculo (1,5) Análisis (0,5) Argumentación (0,5)

RNotas importantes
210 Estadística Descriptiva 201901
Recomendación 5: Lanzar la promoción del nuevo envase vía online si el monto mínimo de compra del
30% de los consumidores del género masculino que más gastan es menor a 38 soles y los montos de
compra de los consumidores del género femenino se concentran en valores pequeños.
(4,0 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25) Representación(0,25) Cálculo (2,5) Análisis (0,5) Argumentación (0,5)

RNotas importantes
Evaluaciones de ciclos anteriores 211
Recomendación 6: Establecer un precio diferenciado por distrito, si el monto de gasto de los
consumidores es más heterogéneo en el distrito de San Miguel que en el distrito de Miraflores.
(1,5 puntos)

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,25) Representación(0,25) Cálculo (0,5) Análisis (0,25) Argumentación (0,25)

RNotas importantes
212 Estadística Descriptiva 201901
Redacte el informe que usted plantea a Felipe (1,5 puntos)

Interpretación Representación Cálculo Análisis Argumentación (1,5)

Anexos

Gráfico 1: Distribución de consumidores según principal queja


92% 100% 100%

Porcentaje acumulado de consumidores


140 87% 90%
120 74% 80%
Número de consumidores

70%
100
55% 60%
80
50%
60 33% 40%
30%
40 33
28 20%
50 20
20 12
7 10%
0 0%
Precio Poca Baja calidad del Pocos lugares Peso no Otros
ventilación de producto de venta adecuado
Fuente: Arthur&B los envases Principal queja

Gráfico 2: Distribución porcentual de consumidores según número de


veces que compra por mes
50%
Porcentaje de consumidores

40%
40%

30%
20%
20%
16%
10% 8%
10%
6%

0%
0 1 2 3 4 5 6 7
Número de veces que compra por mes
Fuente: Arthur&B

RNotas importantes
Evaluaciones de ciclos anteriores 213

Gráfico 3: Distribución porcentual de consumidores según género por motivo


de compra
Porcentaje de clientes 100%
80% 38.5% 43.5%
62.5%
60% 73.7%

40%
61.5% 56.5%
20% 37.5%
26.3%
0%
Es una fruta muy Evita el riesgo de Es muy agradable, Es ideal para los niños
nutritiva enfermedades
cardiovasculares
Fuente: Arthur&B Motivo de compra
Masculino Femenino

Gráfico 4: Distribución porcentual de consumidores según motivo de compra por


género
60%
50%
50%
Porcentaje de clientes

¿? Es una fruta muy nutritiva


40%

30% 26% Evita el riesgo de enfermedades


21% cardiovasculares
19%
20% 15% 16% Es muy agradable,
10%
10%
Es ideal para los niños
0%
Masculino Femenino
Género
Fuente: Arthur&B

Medidas descriptivas del monto de gasto por distrito

Distrito Media n
-

Miraflores 24.5 £(𝑋𝑖 − 𝑋")U = 925 38


¤gQ

San Miguel 18.2 Desviación estándar s = 15 44

Monto de gasto en arándanos en soles_ distrito de Miraflores


39,8 48,3 49,2 58,3 59,5 60,2
60,8 62,4 64,5 68,2 69,6 69,8
70,2 71,1 74,3 79,6 81,3 92,5

RNotas importantes
214 Estadística Descriptiva 201901

Gráfico 5: Distribución de consumidores según monto de gasto en


90 arándanos por distrito
80

70
Monto de gasto en soles

60
50
50
42
40 44,3
35,6 31,9
30 32,4
24,8
20 23,2
19,4
10 10,1

0
Surco San Miguel Miraflores

Fuente: Arthur&B
Distrito

Gráfico 6: Distribución porcentual de consumidores del género masculino


según monto de compra 100%
100% 87%
90% 80%
Porcentaje de clientes

80%
70% 57%
60%
50%
40% 30%
30%
20% 10%
10%
0%
20.4 24.3 28.2 32.1 36.0 39.9 43.8
Fuente: Arthur&B Monto de compra en soles

Tabla 1 : Distribución de consumidores del género femenino según monto de compra


Intervalos Marca de clase fi hi%
44.7 46.4 45.55 1 4%
46.4 48.1 47.25 4 16%
48.1 49.8 48.95 3 12%
49.8 51.5 50.65 5 20%
51.5 53.2 52.35 7 28%
53.2 54.9 54.05 5 20%

RNotas importantes
Evaluaciones de ciclos anteriores 215

ESTADÍSTICA DESCRIPTIVA – MA460


EXAMEN PARCIAL
Ciclo 2019 00 (AC)

Secciones : Todas
Profesores : Todos
Duración : 110 minutos
Indicaciones:
• Sólo serán calificadas las respuestas desarrolladas en los espacios indicados para cada pregunta,
donde debe aparecer el procedimiento. Trabaje mínimo con cuatro decimales.
• No está permitido el uso de teléfonos celulares o de cualquier otro aparato electrónico durante el
examen, los cuales deben permanecer apagados y guardados.
• Se permite el uso de calculadoras simples o científicas que no sean programables ni ClassPad.
• Los alumnos deberán dejar todas sus pertenencias debajo de la pizarra.
• El uso de los útiles es personal, no se permite su intercambio
• No está permitido el uso de libros ni apuntes de clase.

Dimensiones Indicación sobre lo que hará el estudiante

Interpretación Identifica el problema a resolver en el contexto de la situación


Representa el problema usando los datos e indica que va a calcular y las variables
Representación
involucradas.
Realiza los cálculos necesarios para obtener los indicadores para sustentar el
Cálculo
análisis.
Análisis Analiza e interpreta los resultados de las diversas opciones que muestra el caso.

Argumentación Explica los resultados y da recomendaciones para la solución del caso.

Caso: TravelMax
Hace un año el Banco JJF adicionó a todas sus tarjetas de crédito (Clásica, Oro y Platinum) el beneficio
de ser tarjetas TravelMax. Es así que los tarjetahabientes tienen la posibilidad de acumular “kilómetros
TravelMax” al realizar sus compras, los cuales pueden ser canjeados por pasajes en vuelos nacionales
e internacionales.
El gerente financiero del Banco JJF desea verificar el éxito del lanzamiento de la nueva tarjeta
TravelMax; para ello se encuestó a 220 clientes que utilizaron las tarjetas de crédito del banco JJF por
más de dos años.
Para llevar a cabo este estudio recoge datos de las siguientes variables:
• Sucursal del banco: Sucursal donde se afilió (Miraflores, La Molina y Surco).
• Tipo de tarjeta: Clásica, Oro y Platinum.
• Monto anual sin TravelMax: Monto anual comprado con la tarjeta antes de que se convierta en
TravelMax (en soles).
• Monto anual con TravelMax: Monto anual comprado con la tarjeta luego de que se convierta en
TravelMax (en soles).

RNotas importantes
216 Estadística Descriptiva 201901
• Monto última compra: Monto de la última compra con la tarjeta TravelMax (en soles).
• Kilómetros TravelMax: Kilómetros acumulados por compras con la tarjeta TravelMax.
• Tarjeta adicional: Si cuenta o no con una tarjeta adicional TravelMax.
• Género del cliente: Masculino, femenino.
• Estado civil del cliente: Soltero, casado y conviviente.
• Ingreso mensual: Ingreso del último mes (en soles)
• Número de pasajes: Número de pasajes canjeados el último año con los kilómetros
TravelMax.
• Destino: Destino preferido del cliente para usar sus kilómetros TravelMax.
• Principal problema: Principal problema para el cliente de la tarjeta TravelMax.
• Año de afiliación: Año en que se afilió a la tarjeta de crédito del banco JJF.
• Nivel de satisfacción: Satisfacción del cliente con tarjeta TravelMax hacia el servicio
brindado por el banco JJF (Muy bajo, Bajo, Regular, Alto, Muy alto).
Objetivo general: Analizar las principales características de los clientes que usan por más de dos años
las tarjetas de crédito del banco JJF, para determinar el éxito de la nueva tarjeta TravelMax.
Se tienen los siguientes resultados:
Principal queja
Tabla 1
Principal problema La Molina Miraflores Surco Total
Poca información sobre beneficios 4 4 16 24
Alto costo de membresía 16 18 11 45
Pocos kilómetros TravelMax por compras 10 12 5 27
Pocos destinos para elegir 6 6 15 27
Altos intereses 22 34 15 71
Otros 12 6 8 26
Total 70 80 70 220
Fuente: Banco JJF

Gráfico 1
100%
90%
Porcentaje de clientes

80%
70%
60%
50%
40% Surco
30%
20%
Miraflores
10% La Molina
0%
Poca Alto costo de Pocos Pocos destinos Altos intereses Otros
información membresía kilómetros para elegir
sobre TravelMax por
beneficios compras
Principal queja
Fuente: Banco JJF

RNotas importantes
Evaluaciones de ciclos anteriores 217
Gráfico 2
100%
90% Otros
80%
Porcentaje de clientes

70% Altos intereses


60%
50%
Pocos destinos para elegir

40%
Pocos kilómetros TravelMax por
30%
compras
20%
Alto costo de membresía
10%
0% Poca información sobre
La Molina Miraflores Surco beneficios
Fuente: Banco JJF Distrito

Kilómetros TravelMaX
• Para los clientes de la tarjeta Oro la media de la cantidad de kilómetros TravelMax es 1545,2
kilómetros; la mediana es 1490,2 kilómetros y la varianza es 160 400 kilómetros2.

• Para los clientes de la tarjeta Platinum se tienen los siguientes datos de kilómetros TravelMax de
16 clientes:
1600 1450 1200 886 1250 1400 1551 1420 1420 1443 1650 1515 1450 1800 1900 1800

• Para los clientes de la tarjeta Clásica se tiene la siguiente gráfica.

Gráfico 3. Distribución de clientes con tarjeta Clásica según kilómetros


TravelMax
40%
35.0%
35%
Porcentaje de clientes

30% 26.4%
25%
20%
16.2%
15% 13.2%
9.2%
10%
5%
0%
[500; 800] ]800; 1100] ]1100; 1400] ]1400; 1700] ]1700; 2100]
Fuente: Banco JJF Kilometros TravelMax

RNotas importantes
218 Estadística Descriptiva 201901
Número de pasajes canjeados

Gráfico 4. Distribución de clientes según número de pasajes canjeados


30%
27.73%
25%
Porcentaje de clientes

20% 20.00%
16.82% 17.27%
15%

10% 10.45%

5% 5.00%
2.73%
0%
0 1 2 3 4 5 6 7
Número de pasajes
Fuente: Banco JJF

Montos de compra
Montos de compra, en soles, de clientes con la tarjeta Platinum
200 400 410 500 515 540 573 588 594 620 620
630 643 653 656 668 681 710 713 745 775 780
795 810 815 815 820 824 870 923 948 960 960
965 967 1000 1021 1026 1062 1092 1122 1169 1182 1190
1190 1192 1204 1234 1260 1268 1289 1310 1400 1500 2000

Distribución de clientes según monto de compra, en soles, por tipo de tarjeta

2000
*
1800
1723
1723
1600
1400 1390 1363
Monto de compra

1200
1086 1080 1122
1000 980
896
822
800 798
706
600 653

400 406 375 377


200
0
Oro Clásica Platinum
Tipo de tarjeta
Fuente: Banco JJF

RNotas importantes
Evaluaciones de ciclos anteriores 219
Conceptos (0,5 puntos cada uno, 4 puntos)
Interpretación (4,0) Representación Cálculo Análisis Argumentación

a. Indique el título del gráfico 1.

b. Indique la escala de la variable discreta en estudio.

c. Si se afirma que una medida de variabilidad del número de kilómetros TravelMax es para clientes
de la tarjeta Oro es 29,2%, indique el nombre de dicha medida de variabilidad.

d. Si la población en estudio fue de 8 525 clientes de la tarjeta Oro, 15 345 de la tarjeta Clásica y 7
650 de la tarjeta Platinum y se realizó un muestreo estratificado para seleccionar los 220 clientes.
Indique la cantidad de clientes elegidos con la tarjeta Clásica.

e. Indique el nombre de todos los estadísticos de la variable <principal queja> que se pueden calcular
a partir de la muestra.

f. Indique el nombre de todos los gráficos que se pueden realizar de la variable <kilómetros
TravelMax>.

g. Interprete el valor del cuartil 3 del monto de compra del último mes de clientes con tarjeta Oro.

h. Si a cada uno de los clientes de la tarjeta Oro en la muestra se le aumenta un 30% de kilómetros
TravelMax, indique el porcentaje en que se modificará el coeficiente de variación de dicha
variable. Justifique.

RNotas importantes
220 Estadística Descriptiva 201901
Objetivo 1: Identificar la sucursal o las sucursales en las que se destinará recursos económicos para
resolver los problemas de los clientes.

Se destinará recursos económicos en aquellas sucursales cuyo principal problema tiene un porcentaje
de clientes mayor al 35% en esa sucursal. Para su informe el gerente necesita un gráfico adecuado.
Además, indique la decisión del gerente.

Interpretación (0,25) Representación (0,5) Cálculo (2,0) Análisis (0,25) Argumentación (0,5)

RNotas importantes
Evaluaciones de ciclos anteriores 221
Objetivo 2: Determinar el distrito en el que se implementa la campaña cero intereses en compras de
seis cuotas con la tarjeta.

Según el reporte de atención al cliente en la sucursal del distrito de:


• La Molina, el 80% de los clientes está al día en sus pagos,
• Miraflores, el 90% de los clientes está al día en sus pagos,
• Surco, el 70% de los clientes está al día en sus pagos.
De todos los clientes, el 32% son de la sucursal del distrito de la Molina, el 37% del distrito de Miraflores
y el resto del distrito de Surco.
Entre todos los clientes de la muestra que están al día se va a elegir a un cliente al azar y se hará una
campaña cero intereses en seis cuotas en aquel distrito (Miraflores, La Molina, Surco) con mayor
probabilidad. Plantee los eventos y probabilidades necesarias para establecer el distrito donde se
implementará la campaña.
Interpretación (0,25) Representación (0,5) Cálculo (2,0) Análisis (0,25) Argumentación (0,5)

RNotas importantes
222 Estadística Descriptiva 201901
Objetivo 3: Identificar el tipo de tarjeta a la que se lanzará una campaña especial por el día del
comprador

El gerente financiero del banco sugiere lanzar una campaña especial por el día del comprador a los
clientes con el tipo de tarjeta (Clásica, Oro o Platinum) que presente mayor variabilidad en el 50%
central de los montos de compra. Para el informe el gerente necesita un gráfico. Indique la decisión
del gerente.
Interpretación (0,25) Representación (0,5) Cálculo (2,0) Análisis (0,25) Argumentación (0,5)

RNotas importantes
Evaluaciones de ciclos anteriores 223
Objetivo 4: Identificar el tipo de tarjeta a la que se lanzará un catálogo especial.

El gerente financiero del banco sugiere lanzar un catálogo especial especial a los clientes con el tipo de
tarjeta (Clásica, Oro o Platinum) que presente mayor variabilidad en el número de kilómetros
TravelMax. Indique la decisión del gerente financiero.

Interpretación (0,25) Representación (0,5) Cálculo (2,0) Análisis (0,25) Argumentación (0,5)

RNotas importantes
224 Estadística Descriptiva 201901
Objetivo 5: Identificar si se exonerará el costo de membresía.

Si el porcentaje de clientes que han canjeado más de tres pasajes es mayor al 24%, se propondrá al
directorio exonerar el costo de membresía a todos esos clientes. Indique lo que se propondrá al
directorio.

Interpretación (0,25) Representación (0,25) Cálculo (1,0) Análisis (0,25) Argumentación (0,25)

RNotas importantes
Evaluaciones de ciclos anteriores 225

ESTADÍSTICA DESCRIPTIVA – MA460


EXAMEN FINAL
Ciclo 2018 01
Profesores : Todos
Secciones : Todas
Duración : 170 minutos
Indicaciones:
1. Sólo serán calificadas las respuestas desarrolladas en los espacios indicados para cada pregunta,
donde debe aparecer el procedimiento.
2. No está permitido el uso de celulares ni cualquier otro dispositivo electrónico, solo calculadora.
3. Los alumnos deberán dejar todas sus pertenencias debajo de la pizarra.
4. El uso de los útiles es personal, no se permite su intercambio.
5. No se permite el uso de libros ni apuntes de clase.
6. Trabaje mínimo con cuatro decimales en los cálculos previos.
PARTE 1: CONCEPTOS BÁSICOS

Sea X ~ U(a, b) si el valor esperado de X es 50 y su varianza es 300, determine el valor de a.


(1,0 punto)

Sea X1 ~ N(µ1 = 5; 𝜎QU = 16) y X2 ~ N(µ2 = 7; 𝜎UU = = 25); si Y = 3X1 – 4 X2 siendo X1 y X2 variables aleatorias
independientes. Determine el valor de la varianza de Y. (1,0 punto)

Sea X ~ N(µ = 50; s2 = 100) y n = 25, calcule la probabilidad de que la media muestral sea menor a 51.
(1,0 punto)

RNotas importantes
226 Estadística Descriptiva 201901
PARTE 2: CASOS

Para la solución de las preguntas de cada caso, incluya las cinco dimensiones del siguiente cuadro:

Dimensiones Indicación sobre lo que hará el estudiante


Identifica el problema en el contexto de la situación y define las variables
Interpretación
involucradas.
Representa el problema usando los datos e indica lo que va a calcular y las
Representación
herramienta estadística que usará.
Realiza los cálculos necesarios para obtener los indicadores que se requieren en el
Cálculo
análisis.

Análisis Analiza e interpreta los resultados obtenidos en su cálculo.

Explica los resultados y da recomendaciones para la solución del caso, justificando


Argumentación
adecuadamente.

CASO I: POLOS INTI

La empresa INTI PERÚ fue creada por egresados de la facultad de


negocios de una universidad de Lima. La idea original era
aprovechar la gran demanda de camisetas de la selección
peruana. En un principio comercializó polos, pero luego,
pudieron comprar máquinas y alquilar un local para la fabricación
de las prendas en el emporio comercial de Gamarra. INTI PERÚ
ha ganado un espacio en el mercado, gracias a los diseños
originales de sus polos.

Actualmente, Abel Morales, gerente de la empresa, requiere tomar importantes decisiones; es por ello
que ha contratado a Luis Pardo, analista de una reconocida compañía de consultoría estadística.

Objetivo general:
Determinar acciones importantes que debe tomar la empresa INTI PERÚ para la próxima campaña de
fiestas patrias.

Objetivos específicos

OE1: Elegir el género que recibirá descuentos especiales en la campaña de fiestas patrias.
OE2: Elegir la máquina que se debe enviar a servicio técnico.
OE3: Determinar si se debe contratar más personal para la atención de pedidos por teléfono.
OE4: Elegir el regalo que se va a entregar a los clientes por sus compras.

RNotas importantes
Evaluaciones de ciclos anteriores 227
OE1: Elegir el género que recibirá descuentos en la campaña de fiestas patrias. (3,0 puntos)
El gerente INTI PERÚ propone otorgar descuentos en la campaña de fiestas patrias a los clientes cuyo
género que cumpla la siguiente condición: Tenga una mayor probabilidad de que un polo corresponda
a motivo deportivo, si se sabe que fue vendido en el Jockey Plaza. Para ello se resumió la información
de la cantidad de polos vendidos el último fin de semana.

Hombre (H) Mujer (M)


Motivo\Tienda Jockey Plaza (J) Lima Sur (L) Gamarra (G) Jockey Plaza (J) Lima Sur (L) Gamarra (G)
Deportivo (D) 38 40 52 34 28 32
Paisajes (P) 18 20 35 15 24 33
Otros (O) 27 18 28 14 20 24
¿A qué género se le darán descuentos en la campaña de fiestas patrias? Formalice la probabilidad.

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
228 Estadística Descriptiva 201901
OE2: Elegir la máquina que se debe enviar a servicio técnico. (3,0 puntos)

Abel Morales debe detectar a qué máquina es más probable que corresponda un polo que ha
encontrado con defecto de costura; para ello dispone de la siguiente información:

Distribución de polos según Distribución de polos según presencia de


máquina defecto de costura por máquina
100%

80%

Porcentaje de polos
Máqui
Máqui Sin defecto de
na A 60%
na C 25% 95% 96% costura
97%
40% Con defecto de
40%
costura
Máqui
na B 20%
35%
0% 5% 4% 3%
Máquina A Máquina B Máquina C
Fuente: INTI PERÚ Fuente: INTI PERÚ Máquina

Se solicitará el servicio de técnico para aquella máquina detectada por Abel Morales. ¿Qué máquina
se debe enviar a servicio técnico?
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
Evaluaciones de ciclos anteriores 229
OE3: Determinar si se debe contratar más personal para la atención de pedidos por teléfono.
(3,0 puntos)
La empresa INTI PERÚ vende sus productos en su cadena de tiendas, además, por su página de Internet
y vía telefónica. En promedio se reciben 30 pedidos por teléfono cada hora. Abel Morales ha propuesto
contratar una persona más para que atienda los pedidos por teléfono solo si se verifica que la
probabilidad de que se atiendan 3 o más pedidos en 10 minutos supera el 50%. ¿Qué decisión tomará
Abel Morales?

Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
230 Estadística Descriptiva 201901
OE4: Elegir el regalo que se va a entregar a los clientes por sus compras. (3,0 puuntos)

La principal tienda de polos de INTI PERÚ se encuentra en el Jockey Plaza. Para la campaña por fiestas
patrias se quiere elegir un regalo, con el logo de la marca, para los clientes que realizaron alguna
compra. A continuación se muestra las distribución de probabilidad de la variable número de polos
comprados por los clientes.

x 1 2 3 4 5
f(x) 0,5 4a 3a 2a a

Además, se sabe que por cada polo vendido se tiene una utilidad de 20 soles. Si la utilidad esperada es
menor o igual a 30 soles se les regalará un lapicero a los clientes que realicen alguna compra, pero si
la utilidad esperada es mayor a 30 soles, se les regalará un tomatodo. ¿Qué regalo se elegirá para los
clientes que realicen alguna compra en la campaña por fiestas patrias?
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
Evaluaciones de ciclos anteriores 231
CASO II: Inversión de capital (5,0 puntos)
Abel, Betty y Carlos son tres socios que desean invertir 30 mil soles en alguna de las siguiente tres
opciones para la utilidad ganada en un año por una inversión de 30 mil soles:
Opción 1 (Acciones): La utilidad es una variable aleatoria que sigue una distribución normal
con una media de 10 mil soles y una desviación estándar de 4 mil soles.
Opción 2 (Fondos mutuos): La utilidad es una variable aleatoria que sigue una distribución
exponencial con una media de 10 000 soles.
Opción 3 (Negocio propio): La utilidad es una variable aleatoria que sigue una distribución
uniforme con 𝑎 = −2 mil y media igual a 10 mil.
- Abel prefiere la opción con menor probabilidad de que la utilidad sea menor a 2 mil soles.
- Betty prefiere la opción con mayor probabilidad de que la utilidad sea mayor a 12 mil soles.
- Carlos, el más conservador de los socios, observa que las tres opciones tienen el mismo valor
esperado y prefiere elegir la opción que muestre menor variabilidad.
Los socios van a invertir el capital en la opción que prefieran dos o más socios.
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,5p) Cálculo (3p) Análisis (0,5p) Argumentación (0,5p)

RNotas importantes
232 Estadística Descriptiva 201901

ESTADÍSTICA DESCRIPTIVA – MA460


EXAMEN FINAL
Ciclo 2018 02 (AC)
Secciones : Todas
Profesores : Todos
Duración : 170 minutos
Indicaciones:
1. Solo serán calificadas las respuestas desarrolladas en los espacios indicados para cada pregunta,
donde debe aparecer el procedimiento.
2. No está permitido el uso de celulares ni cualquier otro dispositivo electrónico, solo calculadora
simple o científica no programable.
3. No se permite el uso de libros ni apuntes de clase.
4. Trabaje mínimo con cuatro decimales en los cálculos previos.
PARTE 1: CONCEPTOS BÁSICOS (4,0 puntos)

Tabla 1. Medidas estadísticas del gasto en hospedaje en soles por noche para los turistas
nacionales y extranjeros en la ciudad de Arequipa (Julio – 2018)
Medida estadística Nacionales Extranjeros Medida estadística Nacionales Extranjeros
Media 90 100 Cantidad de datos atípicos 3 7
Mediana 85 108 Desviación estándar 10 15
Moda 80 120 Coeficiente de variación 11,11% 15,00%
Rango 110 160 Coeficiente de asimetría 1,50 -1,60
Rango intercuartil 30 50

La tabla 1 que presenta resúmenes de los datos de 100 turistas nacionales y 80 extranjeros que
visitaron la ciudad de Arequipa en julio del 2018 y complete los espacios en blanco a continuación:
a. El gasto en hospedaje por noche que se repite con mayor frecuencia para los turistas nacionales
fue ……….….

b. El 50% de los turistas extranjeros gastaron como máximo …………………….…

c. Considerando el total de datos de cada grupo, los gastos en hospedaje más homogéneos
corresponden a los turistas ………………………., por tener menor …………………………….

d. Existe una mayor variabilidad en el 50% central de los datos para los turistas…………….……., pues
tienen mayor ………………..….

e. Para los turistas extranjeros, los gastos en hospedaje se concentran en valores ……………………..…….,
porque tienen ………………………..…………….

RNotas importantes
Evaluaciones de ciclos anteriores 233
PARTE 2: CASOS

Para la solución de las preguntas de cada caso, incluya las cinco dimensiones señaladas en el siguiente
cuadro.

Dimensiones Indicación sobre lo que hará el estudiante


Interpretación Redacta el problema, con un lenguaje sencillo, como pregunta u objetivo.
Define la variable en estudio, indica qué herramienta estadística utilizará en la
Representación
solución del problema o formaliza correctamente las probabilidades a calcular.
Cálculo Muestra los cálculos realizados para dar respuesta al problema.

Análisis Indica con qué valor calculado responde el problema.

Argumentación Redacta la decisión que tomará a partir del resultado de su análisis.

CASO I: TIENDA DE CONVENIENCIA NEXT

A nivel mundial, las tiendas de conveniencia continúan su expansión, teniendo como principales
clientes a las personas que buscan productos de la forma rápida. Algunos de los líderes en este formato
son las cadenas OXXO y 7-Eleven. En el Perú, existe un boom de las tiendas de conveniencia, como
Tambo, Listo, Mass, entre otras; las cuales han ido respondiendo a los intereses de los consumidores.

NEXT es una cadena de tiendas de conveniencia creada hace un año, cuenta con tiendas en Miraflores,
Lince y Surco. NEXT ha ganado un espacio en el mercado gracias a la variedad de productos y servicios
que ofrece. Sus clientes pueden pagar sus recibos de servicios, recargar sus celulares, comprar un café
caliente, un helado y llevar a casa productos de primera necesidad. NEXT busca convertirse en una
marca líder, es por ello que realizará estrategias para alcanzar dicho objetivo.

Objetivo general: Determinar acciones que debe tomar la empresa NEXT en el presente año.

Objetivos específicos:

OE1: Determinar a qué tipo de cliente (los que pagan en efectivo o con tarjeta) en el distrito de Lince
se le ofrecerá descuentos especiales por la compra de alimentos.
OE2: Determinar el distrito en el que se lanzará una nueva marca de caramelos.
OE3: Determinar si debe abrir una caja extra para la atención de pagos en la tienda de Surco.
OE4: Elegir el tipo de caja registradora que se utilizará en las tiendas.

RNotas importantes
234 Estadística Descriptiva 201901
OE1: Determinar a qué tipo de cliente (los que pagan en efectivo o con tarjeta) en el distrito de Lince
se le ofrecerá descuentos especiales por la compra de alimentos. (3,0 puntos)
NEXT quiere mejorar las ventas en Lince. Para ello hará descuentos en el consumo de alimentos al tipo
de cliente (los que pagan en efectivo o a los que pagan con tarjeta) que tenga la mayor probabilidad
de compra de alimentos. Para ello se resumió la información de una muestra de 276 clientes que
pagaron en efectivo y 224 clientes que pagaron con tarjeta el último fin de semana.

Tipo de cliente: Efectivo (E) Tipo de cliente: Tarjeta (T)


Producto Miraflores (M) Lince (L) Surco (S) Miraflores (M) Lince (L) Surco (S)
Alimentos (A) 38 40 52 34 28 32
Bebidas (B) 18 20 35 15 24 33
Golosinas (G) 27 18 28 14 20 24
¿A qué tipo cliente de Lince se le hará descuentos en la campaña navideña? Formalice la probabilidad.
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
Evaluaciones de ciclos anteriores 235
OE2: Determinar el distrito en el que se lanzará una nueva marca de caramelos. (3,0 puntos)

El gerente de NEXT considera que un buen criterio para determinar el distrito donde se lanzará una
nueva marca de caramelos es aquel donde es más probable que corresponda un cliente que ha
comprado golosinas. Para ello dispone de la siguiente información:

Distribución de clientes según Distribución de clientes según tipo de


distrito Miraflo producto por distrito
res 100%
(M),
90% 17.6%
Surco 30.6%
80%
(S), 30% 50.0%
70%
36% 35.3%
60%
50% 38.8%
40%
30% 30.0%
20% 47.1%
30.6%
10% 20.0%
0%
Lince Miraflores (M) Lince (L) Surco (S)
(L), Distrito
Fuente: NEXT 34% Fuente: NEXT

¿En qué distrito se lanzará la nueva marca de caramelos?


Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
236 Estadística Descriptiva 201901
OE3: Determinar si se debe abrir una caja extra para la atención de pagos de los clientes de la tienda
de Surco. (3,0 puntos)

A una de las tiendas de NEXT ubicada en Surco, llegan en promedio 20 clientes cada media hora a la
cola de una caja para realizar sus pagos de los productos adquiridos. El administrador de la tienda ha
propuesto abrir una caja extra si se verifica que la probabilidad de que lleguen más de dos clientes en
tres minutos es mayor que 0,3. ¿Qué decisión tomará el administrador?
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
Evaluaciones de ciclos anteriores 237
OE4: Elegir el tipo de caja registradora que se utilizará en las tiendas. (3,0 puntos)

NEXT quiere decidir qué tipo de caja registradora usar en las tiendas. Tiene dos opciones, la que usa
papel normal y la que usa papel térmico. Las cajas que usan papel térmico son más costosas, pero
ahorran al momento de imprimir recibos largos. A continuación, se muestra la distribución de
probabilidad de la variable número de artículos vendidos en cada compra:
x 1 2 3 4 5 6 7
f(x) 0,05 0,25 a 2𝑎 3𝑎 0,05 0,05
El costo de un recibo impreso en papel normal es de C(X) = 5 + 0,5X centavos (donde X es el número
de artículos vendidos en una compra). Solo si el valor esperado del costo de un recibo es mayor a 6,5
centavos, se decidirá usar cajas que usan papel térmico, pues se esperaría que los recibos impresos
sean más baratos. ¿Qué tipo de caja registradora sugiere usted utilizar en las tiendas?
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,25p) Cálculo (1,5p) Análisis (0,25p) Argumentación (0,5p)

RNotas importantes
238 Estadística Descriptiva 201901
CASO II: Premiación (4,0 puntos)
Se premiará al administrador de una de las tiendas con un paquete turístico en una playa del Caribe.
Para decidir a cuál administrador premiar, se tendrá en cuenta las ventas diarias de las tiendas.
Miraflores: Las ventas diarias se modelan con una variable aleatoria que sigue una distribución
normal con una media de 20 000 soles y una desviación estándar de 2000 soles.
Lince: Las ventas diarias se modelan con una variable aleatoria que sigue una distribución
exponencial con una media de 20 000 soles.
Surco: Las ventas diarias se modelan con una variable aleatoria que sigue una distribución
uniforme con a = 17 000 soles y b = 23 000 soles.
Indique el ganador si se premiará al administrador de la tienda cumpla dos de las condiciones:
• tener la menor probabilidad de que las ventas diarias sean menores a 18 miles de soles.
• tener la mayor probabilidad de que las ventas diarias sean mayores a 22,5 miles de soles.
• tener la menor variabilidad en la distribución de la variable ventas diarias.
Interpretación

Representación

Cálculo

Análisis

Argumentación

Interpretación (0,5p) Representación (0,5p) Cálculo (2p) Análisis (0,5p) Argumentación (0,5p)

RNotas importantes
Evaluaciones de ciclos anteriores 239

ESTADÍSTICA DESCRIPTIVA – MA460


EXAMEN FINAL
Ciclo 2019 00 (AC)

Secciones : Todas
Profesores : Todos
Duración : 170 minutos
Indicaciones:
• Sólo serán calificadas las respuestas desarrolladas en los espacios indicados para cada pregunta,
donde debe aparecer el procedimiento. Trabaje mínimo con cuatro decimales en los cálculos
previos.
• No está permitido el uso de teléfonos celulares o de cualquier otro aparato electrónico durante el
examen, los cuales deben permanecer apagados y guardados.
• Se permite el uso de calculadoras científicas que no sean programables ni ClassPad.
• Los alumnos deberán dejar todas sus pertenencias debajo de la pizarra.
• El uso de los útiles es personal, no se permite su intercambio
• No está permitido el uso de libros ni apuntes de clase.
Dimensiones Indicación sobre lo que hará el estudiante

Interpretación Identifica el problema a resolver en el contexto de la situación

Representa el problema usando los datos e indica que va a calcular y las variables
Representación
involucradas.
Realiza los cálculos necesarios para obtener los indicadores para sustentar el
Cálculo
análisis.
Análisis Analiza e interpreta los resultados de las diversas opciones que muestra el caso.

Argumentación Explica los resultados y da recomendaciones para la solución del caso.

Caso: TravelMax
Hace un año el Banco JJF adicionó a todas sus tarjetas de crédito (Clásica, Oro y Platinum) el beneficio
de ser tarjetas TravelMax. Es así que los tarjetahabientes tienen la posibilidad de acumular “kilómetros
TravelMax” al realizar sus compras, los cuales pueden ser canjeados por pasajes en vuelos nacionales
e internacionales.
El gerente financiero del Banco JJF desea verificar el éxito del lanzamiento de la nueva tarjeta
TravelMax; para ello se encuestó a 220 clientes que utilizaron las tarjetas de crédito del banco JJF por
más de dos años.
Para llevar a cabo este estudio recoge datos de las siguientes variables:
• Sucursal del banco: Sucursal donde se afilió (Miraflores, La Molina y Surco).
• Tipo de tarjeta: Clásica, Oro y Platinum.
• Monto anual sin TravelMax: Monto anual comprado con la tarjeta antes de que se convierta en
TravelMax (en soles).

RNotas importantes
240 Estadística Descriptiva 201901
• Monto anual con TravelMax: Monto anual comprado con la tarjeta luego de que se convierta en
TravelMax (en soles).
• Gasto en el último mes: Gasto en el último mes con la tarjeta TravelMax (en soles).
• Kilómetros TravelMax: Kilómetros acumulados por compras con la tarjeta TravelMax.
• Tarjeta adicional: Si cuenta o no con una tarjeta adicional TravelMax.
• Género del cliente: Masculino, femenino.
• Estado civil del cliente: Soltero, casado y conviviente.
• Ingreso mensual: Ingreso del último mes (en soles)
• Número de pasajes: Número de pasajes canjeados el último año con los kilómetros
TravelMax.
• Destino: Destino preferido del cliente para usar sus kilómetros TravelMax.
• Principal problema: Principal problema para el cliente de la tarjeta TravelMax.
• Año de afiliación: Año en que se afilió a la tarjeta de crédito del banco JJF.
• Nivel de satisfacción: Satisfacción del cliente con tarjeta TravelMax hacia el servicio
brindado por el banco JJF (Muy bajo, Bajo, Regular, Alto, Muy alto).

Objetivo general: Analizar las principales características de los clientes que usan por más de dos años
las tarjetas de crédito del banco JJF, para determinar el éxito de la nueva tarjeta TravelMax.

Conceptos (1,0 puntos cada uno, 8 puntos)

a. De un grupo de clientes, 15 tienen tarjeta Oro y 10 Clásica. Se elige una muestra de tamaño 18 al
azar y se cuenta el número de clientes elegidos que tienen tarjeta Oro en la muestra. Indique el
rango de dicha variable.

b. La cantidad de kilómetros TravelMax que un cliente de la tarjeta Clásica acumula al mes se modela
como una variable normal con desviación estándar 100 kilómetros. Si la cantidad de kilometros
más frecuente de esta variable es 300 kilómetros, indique el valor de su media. Justifique.

c. La probabilidad de que un cliente de la tarjeta Oro esté al día en sus pagos es de 0,93. Si se eligen
al azar a dos mil clientes con dicha tarjeta, indique la media y desviación estándar de la variable
<número de clientes que estén al día en sus pagos en esos dos mil clientes>

RNotas importantes
Evaluaciones de ciclos anteriores 241
d. El monto de compra en una operación por Internet de un cliente se modela como una variable
uniforme X con media 300 soles y varianza 7500 soles2. Indique el valor de los parámetros de X.

e. La cantidad de kilómetros TravelMax que un cliente de la tarjeta Oro acumula al mes se modela
como una variable normal con media 800 kilómetros y desviación estándar 200 kilómetros. Si una
pareja de esposos suman sus kilómetros en un mes, indique la media y varianza de la variable
<suma de los kilómetros TravelMax de esa pareja>

f. La probabilidad de que un cliente con tarjeta Oro compre una entrada a un concierto es del 15%
y que un cliente con tarjeta Clásica haga lo mismo es del 8%. Si los clientes no se conocen entre sí
Calcule la probabilidad de que solo uno de ellos compre entrada a dicho concierto.

g. El número de quejas que recibe el call center de las tarjetas se modela como una distribución
Poisson con una media 8,35 llamadas en cinco minutos. Indique la media y desviación estándar
del número de quejas que se reciben en 30 minutos.

h. El monto de compra en un restaurante en un día de un cliente se modela como una distribución


uniforme X con parámetros 100 soles y 300 soles. Indique y grafique la función de distribución
acumulada de X.

RNotas importantes
242 Estadística Descriptiva 201901
Objetivo 1: Identificar si se realizará una promoción a los clientes que más acumulan en kilómetros
Travel Max.

Se desea hacer una promoción entre los clientes que pertenezcan al quinto superior de clientes que
más acumulan en kilómetros TravelMax con tarjeta Oro, siempre y cuando el valor mínimo de
kilómetros que acumula al mes dicho quinto superior sea mayor a 1000 km. La cantidad de kilómetros
TravelMax que un cliente de la tarjeta Oro acumula al mes se modelacomo distribución normal con
media 800 kilómetros y desviación estándar 200 kilómetros. Indique si se hará la promoción.

Interpretación (0,25) Representación (0,5) Cálculo (1,5) Análisis (0,25) Argumentación (0,5)

Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Evaluaciones de ciclos anteriores 243
Objetivo 2: Determinar si se va a exonerar la membresía a los clientes de la tarjeta Clásica.

El número de compras al mes que un cliente hace con la tarjeta de crédito Clásica se modela con una
variable X con la siguiente función de probabilidad.

x 0 1 2 3 4 5 6 7
f(x) a 2a 3a 4a 2a a a a
Para decidir si se va a exonerar de la membresía a los clientes de este tipo de tarjeta, se sacará una
muestra de 100 clientes, se calculará la probabillidad de que, entre todos los clientes de la muestra, el
número de compras total sea mayor a 300 compras. Si dicha probabillidad es mayor a 0,5; se exonerará
de la membresía a los clientes. Indique lo que hará la compañía.
Interpretación (0,25) Representación (0,5) Cálculo (1,5) Análisis (0,25) Argumentación (0,5)

Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
244 Estadística Descriptiva 201901
Objetivo 3: Determinar si se regalará una suscripción a Spotify a los clientes con tarjeta Platinum.

El tiempo que un cliente conserva su tarjeta Platinum se modela como una distribución exponencial
con media de 24 meses. Para los clientes de la tarjeta Platinum que la tengan durante 20 meses, se
piensa regalar un año de suscripción a Spotify si de esos clientes el porcentaje que mantiene su tarjeta
al menos cinco meses más es mayor a 0,7. Indique lo que hará la compañía

Interpretación (0,25) Representación (0,5) Cálculo (1,5) Análisis (0,25) Argumentación (0,5)

Interpretación

Representación

Cálculo

Análisis

Argumentación

RNotas importantes
Evaluaciones de ciclos anteriores 245
Objetivo 4: Realizar un perfil del gasto de un cliente con tarjeta de crédito Clásica.

Se cuenta con la siguiente información del gasto del útimo mes de los clientes con tarjeta Clásica.

Distribución de clientes con tarjeta Clásica según gasto del último mes
100% 95%
91%
100%
90%
80%
80%

63%
Porcentaje de clientes

70%

60%

50% 42%
40%

30%

20%

10%

0%
0 200 400 600 800 1000 1200

Fuente: Banco JJF Gasto del último mes, en soles

Perfil del gasto de un cliente con tarjeta de crédito Clásica en el último mes

• El 75% de los clientes tuvo un gasto de ……………………..……………………………………


• El gasto de de los clientes estuvo alrededor de ………………………………….……………
• El gasto más frecuente de los clientes fue …………………………………………….…………

Interpretación Representación (0,75) Cálculo (2,25) Análisis Argumentación

Representación

Cálculo

RNotas importantes
246 Tablas Estadísticas

Tablas estadísticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]
z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350

-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275

-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Tablas Estadísticas 247
Tabla de la distribución normal estándar
Área bajo la curva normal: [P(Z £ z ) = a ]

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Índice alfabético

de barras, 42
—A— de barras agrupadas, 48
de cajas, 94
Axiomas de la probabilidad, 115 de Pareto, 44
Histograma, 57
—C— Ojiva, 57
Polígono de frecuencias, 57
Cuartiles, 81
—M—
—D—
Media, 70
Deciles, 81 ponderada, 80
Desviación estándar, 86 Mediana, 75
Distribución Moda, 78
binomial, 144 Muestreo
de frecuencias, 39, 52, 54 aleatorio simple, 22
de la media muestral, 185 estratificado, 31
de probabilidad, 136 probabilístico, 21
hipergeométrica, 148 sistemático, 26
normal, 167
Poisson, 151
uniforme continua, 163
—P—
Parámetro, 15
—E— Percentiles, 81, 82
Población, 10
Escalas de medición, 12 Propiedad reproductiva de la normal, 180
Espacio muestral, 108
Estadística
Definición, 8
—Q—
Subdivisión, 8 Quintiles, 81
estadístico, 15
Estadístico, 15
Evento, 108 —T—
Complemento, 110 Teorema
Eventos de Bayes, 123
independientes, 129 del límite central, 186
Intersección de, 111
mutuamente excluyentes, 112
Unión de, 110 —V—
Experimento aleatorio, 108 Valor esperado
de una función de una variable aleatoria, 139, 161
—F— Variable, 14
aleatoria continua, 155
Función aleatoria discreta, 136
de densidad, 155 Varianza, 86
de distribución acumulada, 158 de una variable aleatoria, 140, 162

—G—
Gráfico
circular, 42

Vous aimerez peut-être aussi