Vous êtes sur la page 1sur 85

1

La Estadstica siempre ha sido una herramienta importante en la toma de


decisiones. Actualmente con el desarrollo de la Informtica, los mtodos
estadsticos se hacen ms accesibles y fciles de implementar, y su utilizacin se
ha transformado en un requisito indispensable para el proceso de toma de
decisiones en la Banca y en el comercio.

Conocer el comportamiento de los consumidores, sus preferencias, hbitos de


consumo y las tendencias de los mismos, se convierte en conocimiento
importante para planificar y orientar el camino de una empresa.

En este curso, se revisarn los diversos enfoques a los casos empresariales ms


comunes que involucran situaciones en donde el manejo exitoso de la
incertidumbre permite a las empresas salir airosas de los problemas financieros a
los que se enfrentan. Diversos mtodos y procedimientos como el manejo de
datos y archivos, reportes, tablas y grficos se realizarn usando el EXCEL,
software que ofrece todas estas herramientas de una manera sencilla.

Ing. Jorge Serna Fernndez

Prof. Ing. Jorge Serna Fernndez 2


3

INDICE

Captulo 1: Introduccin. 5

1.1 Introduccin. 5
1.2 Clasificacin de la estadstica. 5
1.3 Poblacin y muestra. 6
1.4 Unidad elemental. 7
1.5 Variables. 7
1.6 Medidas de resumen. 8
1.8 Parmetro y estadgrafo 9
1.9 Ejercicios 10

Captulo 2: Organizacin de datos 14

2.1 Introduccin.
14
2.2 Resumen de datos cualitativos. 14
Diagrama de Pareto. 16
2.3 Resumen de datos cuantitativos. 18
2.4 Diagrama Tallo- Hojas 25
2.5 Problemas. 25

Captulo 3: Estadstica Descriptiva: Mtodos numricos. 37

3.1 Introduccin. 37
3.2 Medidas de tendencia central. 37
3.2.1 Media aritmtica. 37
Media ponderada. 39
Media geomtrica. 42
3.2.2 Mediana. 45
3.2.3 Moda. 47
Anexo: Herramientas del Excel para el anlisis estadstico. 52
3.2.4 Cuantiles 54
Cuartiles. 54
Deciles. 54
Percentiles. 55
Procedimiento para el clculo de cuantilas (Datos no agrupados). 55
Procedimiento para el clculo de cuantilas (Datos agrupados). 56
3.3 Medidas de asimetra y curtosis 60
3.4 Diagrama de cajas. 62
3.3 Medidas de dispersin. 64
Rango 64
Rango intercuartil. 64
Varianza. 64
Desviacin estndar 65
Coeficiente de variacin. 66
Captulo 4: Regresin lineal 75

Anexo: Mtodos de muestreo 80


Prof. Ing. Jorge Serna Fernndez 3
4

ESTADSTICA DESCRIPTIVA
Datos no Tabulados Datos Tabulados
X n1 n impar
2 n
2 Fi 1
1 Mediana
Me
21 X n X n n par
Me L i c
2 1
2 fi

d1
2 Moda El valor que ms se repite M 0 L i c
d1 d 2
d1 fi fi1
d 2 fi fi1
n k
3 Media Aritmtica xi x f i i
x i 1
x i 1

n n
n1x1 n 2 x 2 .... n k x k
4 Media Total xT
n1 n 2 .... n k

n
5 Media Geomtrica X G t FC1 x FC 2 x ... FCt Val proyect: Xp = (ultimo dato)(XG)

Tasa prom. de crecim. = ( X G - 1)* FC= 1 + %


100% FC= X f / X i

kn
i(n 1) 100 Fi 1
6 Percentiles Posicin del Percentil:
100 Pk L i c
fi
Li parte decimal ( Ld Li )
n k

7 Varianza Muestral:
x i2 nx 2 x 2
i f i nx 2
(S2)
S2 i 1
S2 i 1
n1 n1
k

11 Varianza Total
n (x i
2
i Vi (x))
VT (X) I 1
x T2
n
S
12 Coeficiente de CV *100
Variacin x

Cambio Nueva Nueva


Media Desv.Est.
X C X C S(X)
CX CX C* S(X)
CX B CX B C* S(X)

Prof. Ing. Jorge Serna Fernndez 4


5

Estadstica 1
Captulo 1
1.1 Introduccin
El trmino estadstica se deriva de la palabra latina status, que significa estado. Los
primeros usos de la estadstica tienen que ver con la recopilacin de datos y la elaboracin
de grficas para describir diversos aspectos de un estado o un pas. En 1662, Jhon Graunt
public informacin estadstica acerca de los nacimientos y los decesos. Al trabajo de
Graunt siguieron estudios de tasas de mortalidad y de enfermedad, tamao de poblaciones,
ingresos y tasas de desempleo. En la actualidad los hogares, gobiernos y empresas se
apoyan en la estadstica para dirigir sus acciones.

Uno de los aspectos ms importantes en estadstica es la posibilidad de obtener


conclusiones basadas en los datos observados. Este proceso se conoce como inferencia
estadstica.

1.2 Clasificacin de la estadstica


Estadstica descriptiva
La estadstica descriptiva comprende un conjunto de mtodos y tcnicas de recoleccin,
organizacin, resumen y presentacin que permiten describir apropiadamente las
caractersticas de un conjunto de datos obtenidos desde una muestra o desde una
poblacin. Comprende el uso de grficos, tablas, diagramas y criterios para el anlisis.

Estadstica inferencial
La estadstica inferencial comprende un conjunto de mtodos y tcnicas que hacen posible
estimar una o ms caractersticas de una poblacin basados en el resultado de muestras. En
un procedimiento de esta naturaleza siempre existe la posibilidad de error, nunca podr
tenerse el 100% de seguridad sobre una afirmacin que se base en la inferencia estadstica.
Sin embargo, lo que hace que la estadstica sea una ciencia, separndola del arte de
adivinar la fortuna, es que existe una medida de confiabilidad medida en trminos de
probabilidad.
PROCESO ESTADSTICO

Prof. Ing. Jorge Serna Fernndez 5


6

1.3 Poblacin y muestra

PORQU SE USAN LAS MUESTRAS?


La imposibilidad fsica de revisar todos los elementos de la poblacin.

El costo que involucra realizar el estudio en todos los elementos de la poblacin.

El tiempo que demanda realizar el estudio en la poblacin.

La naturaleza destructiva de ciertos tipos de estudio.


6
Prof. Ing. Jorge Serna Fernndez
7

1.4.- Unidad elemental.-

1.5 Variables
Una variable es una caracterstica observable que vara entre las unidades elementales
de una poblacin. La informacin que disponemos de cada unidad elemental es
resumida en variables.

Tipos de variables

7
Prof. Ing. Jorge Serna Fernndez
8

1.6 Medidas de Resumen


Son los valores que explican cmo se comporta un conjunto de datos.
Son los valores que resumen los datos en un solo valor para cada variable.
Dependiendo de los datos, las medidas de resumen pueden ser: Medias, medianas,
varianzas, proporciones, desviaciones estndar, etc.

POBLACIONAL MUESTRAL
(Parmetro) (Estadstico
o Estadgrafo)
-Media x
Variables Cuantitativas: -Varianza 2 s2
-Desviacin estndar s
-Proporcin p
- etc

Variables Cualitativas: -Proporcin p

MEDIDAS DE RESUMEN
8
Prof. Ing. Jorge Serna Fernndez
9

Ejemplo:

1.6 Parmetro y estadgrafo (estimador)


El objetivo de las tcnicas de muestreo es asegurar que cada observacin en la
poblacin tenga oportunidad de ser incluida en la muestra. Tales procesos de muestreo
conducen a una muestra aleatoria. Los datos de la muestra aleatoria se usan para
calcular ciertas caractersticas de la muestra denominadas estadsticas. Las estadsticas
se usan como base para hacer inferencias acerca de alguna caracterstica de la
poblacin, que recibe el nombre de parmetro.
Ejemplo.
Segn los Censos Nacionales XI de Poblacin y VI de Vivienda 2007 ejecutados
por el INEI, el 50,30% de los peruanos son mujeres, este dato es un parmetro o
una estadstica? ______________________________________________________
El 5 de marzo del 2011 Datum Internacional public una encuesta sobre intencin
de voto presidencial, la cual registr un 29% para Alejandro Toledo, este dato es
un parmetro o una estadstica?__________________________________________

9
Prof. Ing. Jorge Serna Fernndez
10

Ejemplo. Clasifica las siguientes variables:

Variable Tipo
Banco preferido por un cliente X.
Prstamo bancario otorgado a un cliente (S/.).
Nmero de clientes que incurren en mora.
Tipo de tarjeta de crdito (clasic, gold, oro, platinum)

Ejemplos
Alpha Soft es una compaa que brinda servicios informticos a los bancos que
deseen tener una presencia firme en la red. Se dedica al tendido de redes LAN (Local
area network), instalacin de equipos, servidores, etc. Como parte de un estudio, se
analiza la informacin correspondiente a las siguientes variables:

I. Tipos de lenguajes de programacin (Cobol, Java, Informixs-4gl, etc.)


II. Cantidad de servidores por banco.
III. Costo de las licencias de software (en dlares)
IV. Versin instalada de Office (Office XP, Office 2007, Office 2010)
Para la lista anterior identifique el tipo de variable.

Variable Tipo
I.
II.
III.
IV.

Marque con una X segn la escala de medicin de las siguientes variables:

Variable Discreta Contnua


Lnea de crdito de un cliente.
Crdito disponible en efectivo.
Medios de pago(efectivo, tarjeta, cheque)
Nro de tarjetas de crdito y/o dbito

1.8 Ejercicios
1. La empresa BETA BUSINESS BANK llev a cabo un estudio entre los usuarios de
Banca por Internet en Lima para poder analizar el mercado de posibles compradores
a travs de este servicio. Como parte del estudio realizado se analiz la informacin
correspondiente a una muestra de 1500 usuarios con relacin a las siguientes variables:

I. Edad del principal cliente.


II. Nmero de cajeros automticos.
III. Calidad del servicio de ventanilla (bueno, regular, deficiente).
IV. Tiempo promedio de atencin en ventanilla.
V. Marca de la computadora con mayor uso del servicio de Internet.

De acuerdo al enunciado anterior identificar la poblacin, muestra y el tipo de


Prof. Ing. Jorge Serna Fernndez 10
11

variable.
2. WALLMART, la ms importante cadena de supermercados del mundo realiz un
estudio para determinar algunos indicadores socioeconmicos de los peruanos antes de
instalarse en el pas. El estudio se llev a a cabo aplicando encuestas a una muestra de
400 ciudadanos. Algunas de las preguntas del cuestionario fueron las siguientes:

I. Nivel educativo alcanzado.


II. Nivel de ingresos.
III. Presenta alguno de los siguientes problemas? (indocumentado, analfabetismo,
vivienda no adecuada, salud y otros).
IV. Acceso al crdito.

De acuerdo al enunciado anterior identificar poblacin y muestra. Para las


respuestas generadas por cada una de las preguntas mostradas identificar el tipo de
variable.
3. Prevenir la propagacin de virus informticos es un elemento importante de la
seguridad en las entidades del sistema financiero. En un estudio de ingeniera para
investigar los reportes ms comunes por fallas presumiblemente debidas a la
propagacin de estos elementos se obtuvo lo Sgte:
I. El 35% de los clientes fueron vctimas de clonacin en cajeros.
II. El 74% present problemas con sus claves secretas.
III. El 40% fueron vctimas de robo de sus documentos incluyendo la tarjeta de
crdito/dbito.
IV. El tiempo promedio de demora en la denuncia fue de 4 horas.
V. Nmero promedio de tarjetas por persona es 3.8
Para la lista anterior identifique, la poblacin, muestra, unidad elemental y el tipo de
variable.

4. Clasifique las siguientes caractersticas en variables categricas (nominal, ordinal) o


numricas (continua, discreta):
a) Tiempo de servicio de los empleados de una empresa.
b) Nivel de educacin de los empleados bancarios.
c) Lugar de nacimiento de las personas que viven en Lima.
d) Orden de llegada de los clientes de un banco.
e) Nmero de quejas por demora en la atencin.
f) Ingreso familiar promedio mensual de las familias de Lima.

5. La gerencia de Marketing de PROCTER & GAMBLE desea lanzar al mercado limeo


un nuevo detergente comercializado slo en el Cono Norte de Lima, para lo cual ha
realizado un estudio de mercado, seleccionando aleatoriamente 2000 hogares del
distrito de Comas, consultndoles sobre la marca de detergente que usan, consumo de
detergente semanal (Kg), nmero de personas por hogar. De una de las muestras
estudiadas se encontr que el consumo promedio semanal de detergente era de
1,5Kg. Otros valores recopilados fueron: Kg, Kg., Ace, Ariel, 4 personas, etc.
a) Identifique la unidad elemental.
b) Identifique la poblacin y la muestra
c) Identifique las variables en estudio y especifique su tipo.
d) Seale un estadstico y tres datos.

Prof. Ing. Jorge Serna Fernndez 11


12

6. PROMPEX, entidad estatal dedicada a promover las exportaciones, tiene registradas a


5 000 empresas exportadores del sector Textil de las cuales el 40% se encuentran en
Lima. Selecciona 100 empresas y registra el valor de sus exportaciones anuales en
millones de dlares, dando como resultado que en promedio exportan 12 millones de
dlares anuales.
a) Indique la unidad elemental.
b) Indique la poblacin y la muestra.
c) Indique la variable de estudio y su tipo.
d) Indique el estadstico.
7. Un cliente de INTERBANK, requiere un crdito hipotecario por lo que tiene que llenar
una solicitud. A continuacin se presenta alguna de las variables y los datos que lleno
el cliente.
Clasifique cada una de las respuestas de acuerdo con el tipo de variable .

Variable Respuesta Tipo de variable


Edad (en aos cumplidos) 36
Estado Civil Casado
Nmero de hijos 2
Tipo de vivienda actual Alquilada
Nivel de instruccin Superior
Gasto familiar mensual (en soles) 1,350.56
Ingresos mensual (en soles) 4,880.78
Responsabilidad en la empresa Jefe de planta
Nmero de aos en el empleo 4
Crdito solicitado (en dlares) 45,000
Plazo de hipoteca (aos) 10
Tarjeta de crdito Si
8. Indicar el tipo de variable que corresponde cada uno de los siguientes casos:
a. Estado civil :
b. Sueldo :
c. Nivel socioeconmico :
d. Nmero de hijos :
9. Indicar el tipo de variable que corresponde cada uno de los siguientes casos:
a. Grado de instruccin :
b. Ingreso por ventas :
c. Gnero :
d. Nmero de hermanos:
10. Identifique las variables en el siguiente relato y antelas, marcando su clasificacin en
el cuadro siguiente: En una poblacin se seleccion una muestra de 100 familias para
estudiar la edad, el grado de instruccin y estado civil de cada padre de familia.
Tambin se pregunt sobre el total de hijos en cada familia.
Variable identificada Cualitaiva Cuantitativa
Nominal Ordinal Discreta Continua
EDAD
GRADO DE INSTRUCCIN
ESTADO CIVIL
TOTAL DE HIJOS

Prof. Ing. Jorge Serna Fernndez 12


13

11. Se realiza una votacin en el Distrito de SAN ISIDRO, donde el 50% de la poblacin
electoral son hombres, para determinar las preferencias de los electores durante una
eleccin presidencial. Con este fin se entrevistan 1600 electores registrados. De ellos el
40% estn a favor del Candidato A.
Del enunciado responda lo siguiente:
a) Qu constituye la muestra?
b) Indique la poblacin .
c) Identifique un parmetro :
d) Identifique un estadstico:
e) Cul es la variable en estudio? Indicar su tipo.

12. SUPERMERCADOS PERUANOS realiz un estudio de mercado en el distrito de La


Molina, con la finalidad de analizar las posibilidades de instalar un hipermercado
PLAZA VEA. Seleccion una muestra de 200 hogares encuestndoles sobre lo
siguiente: ingreso familiar, nmero de miembros de la familia, grado de instruccin del
jefe de la familia, si tienen Internet en el hogar. Del estudio de la muestra se encontr
que el ingreso familiar promedio es de 2500 soles y el 30% de hogares tiene Internet.
Responda lo siguiente:
a. Cul es la unidad elemental :
b. Identifique la poblacin:
c. Identifique la muestra :
d. Identifique la variable indicando su tipo.
e. Seale los estadsticos.
13. RADIOSHACK es una empresa que fabrica y comercializa piezas electrnicas. Con la
finalidad de conocer si la produccin se mantiene bajo un control estadstico de
proceso, se eligi de la produccin una muestra aleatoria de 150 piezas, registrndose
la siguiente informacin:
i. Si la pieza electrnica cumple o no con las especificaciones tcnicas
ii. El costo de fabricacin de cada pieza electrnica
iii. El tiempo de vida de cada pieza electrnica
De acuerdo al enunciado identifique: la poblacin, muestra, unidad elemental y el tipo
de variable.

14. Con la finalidad de estudiar algunos indicadores socioeconmicos, la empresa de


investigacin de mercados IMASEN extrae una muestra representativa de 850
personas mayores de 20 aos repartida en los diferentes estratos socioeconmicos de
la ciudad de Arequipa. Algunos de los resultados publicados fueron:
El 35% se opone a la ejecucin del proyecto Nueva Arequipa
El tiempo promedio que se encuentra sin trabajo es 12 aos
El 35% tiene instruccin primaria, 25% instruccin superior, 40% instruccin
secundaria y el resto ninguna.
a) Identifique: poblacin, muestra, variable y tipos de variables.
b) Determine (si existieran) los estadgrafos y/ parmetros a partir del enunciado
propuesto.

Prof. Ing. Jorge Serna Fernndez 13


14

Por qu muestrear la poblacin?

Que es inferir, es deducir de la muestra a la poblacion. Por cuestion de


costos, tiempo.
Naturaleza destructiva de algunas pruebas (vino, resistencia de acero,
semillas)
Imposibilidad fsica de revisar todos los integrantes de la poblacin.
El costo de estudiar a todos los integrantes de la poblacin
normalmente es prohibitivo.
Lo adecuado de los resultados de la muestra.
Tiempo requerido para entrevistar a toda la poblacin.

Prof. Ing. Jorge Serna Fernndez 14


15

Captulo 2
Organizacin de Datos
2.1 Introduccin
Este captulo presenta algunos procedimientos bsicos para resumir un conjunto de
datos cualitativos y cuantitativos. Estos resmenes tabulares y grficos pueden verse en
informes anuales, artculos periodsticos y estudios de investigacin. De alguna manera
estamos familiarizados con este tipo de presentaciones por lo que es importante
comprender como se preparan y aprender a interpretarlos de forma correcta.

2.2 Resumen de datos cualitativos


Tablas de distribucin de frecuencias
Cuando se trabaja con grandes conjuntos de datos cualitativos es til organizarlos y
resumirlos por medio de la construccin de una tabla que muestre las diferentes
categoras de la variable en estudio junto al nmero de veces que cada una de ellas se
repite.
Ejemplo 2.1: En una encuesta tomada a un grupo de 50 personas sobre el banco
preferido se obtuvo los Sgtes resultados:
BCP Interbank Financiero Continental Continental
BCP BCP Continental Interbank Scotiabank
Interbank Scotiabank Financiero Interbank Interbank
BCP Scotiabank Scotiabank BCP Interbank
Interbank Interbank Financiero BCP Continental
Scotiabank Interbank BCP Financiero BCP
Continental Scotiabank Scotiabank Scotiabank BCP
Scotiabank BCP Scotiabank Scotiabank Interbank
BCP BCP Continental Continental Scotiabank
BCP Scotiabank Scotiabank Financiero Financiero
Donde:
f Frecuencia absoluta simple.
h Frecuencia relativa simple, h f n .
p Frecuencia porcentual simple, p 100 h .

Prof. Ing. Jorge Serna Fernndez 15


16

Diagrama de barras
Un diagrama de barras es una grfica para representar un conjunto de datos cualitativos
que se han resumido en una distribucin de frecuencias absolutas, relativas o
porcentuales. En uno de los ejes de la grfica, por lo general el eje horizontal, se
colocan las categoras de la variable y en el otro eje de la grfica (por lo general el eje
vertical) se pueden usar las frecuencias absolutas, relativas o porcentuales. Luego, se
construye una barra de ancho fijo en cada categora y cuya altura corresponda a la
frecuencia utilizada en el grfico. Las barras deben estar separadas para enfatizar el
hecho que las categoras no se superponen.

Ejemplo 2.2: El
diagrama de barras para
los datos del Ejemplo 2.1
se muestra a
continuacin.

TUTORIAL EN INTERNET PARA LA CONSTRUCCIN DE UNA TABLA DE


FRECUENCIA DE VARIABLE CUALITATIVA:
http://youtu.be/xPxh-iLNN0E
Diagrama circular
El diagrama circular, tambin llamado diagrama de pie, es otra forma de representar la
distribucin de frecuencias relativas o porcentuales. Para su construccin primero se
traza un crculo y luego se divide en sectores circulares de forma proporcional a la
frecuencia relativa de cada categora. Puesto que todo el crculo representa un ngulo de
360 en total cada sector es el porcentaje correspondiente de dicho total, es decir, el
ngulo del sector que le corresponde a cada categora se obtiene multiplicando 360 por
la respectiva frecuencia relativa.

Ejemplo 2.3: El diagrama


circular para los datos del
Ejemplo 2.1 se muestra a
continuacin.

Fuente: Elaboracin propia

Tanto la Tabla de frecuencias como cualquiera de los grficos, nos muestran que el banco
preferido es Scotiabank.
Prof. Ing. Jorge Serna Fernndez 16
17

2.3 Resumen de datos cuantitativos


Tablas de distribucin de frecuencias para datos cuantitativos
discretos
Si los datos son cuantitativos discretos y no existen muchos valores diferentes es posible
construir la tabla de distribucin de frecuencias haciendo una lista ordenada e individual
de los valores y sus respectivas frecuencias.

X fi hi pi FI HI PI
1 4 0.1 10% 4 0.1 10%
2 14 0.35 35% 18 0.45 45%
3 10 0.25 25% 28 0.7 70%
4 8 0.2 20% 36 0.9 90%
5 2 0.05 5% 38 0.95 95%
6 2 0.05 5% 40 1 100%
TOTAL 40 1 100%

Prof. Ing. Jorge Serna Fernndez 17


18

TUTORIAL PARA LA CONSTRUCCIN DE UNA TABLA DE FRECUENCIA DE VARIABLE


CUANTITATIVA DISCRETA:
http://youtu.be/OWTqPCC-nHo
Ejemplo 2.5: Los datos corresponden al nmero de interrupciones registradas en
las 52 semanas del ao 2013 en el sistema de red de cajeros automticos. La tabla
de distribucin de frecuencias para estos datos se muestra continuacin.
Nmero de interrupciones semanales
Nro interrupciones fi hi pi Fi Hi Pi
0 20 0.38461538 38% 20 0.38461538 38%
1 15 0.28846154 29% 35 0.67307692 67%
2 8 0.15384615 15% 43 0.82692308 83%
3 6 0.11538462 12% 49 0.94230769 94%
4 2 0.03846154 4% 51 0.98076923 98%
5 1 0.01923077 2% 52 1 100%
Total general 52

H3=
p4 =
F5 =
f3 =
P5 =

Diagrama de lneas
El diagrama de lneas, tambin llamado grfico de bastones o varas, es una
representacin grfica para un conjunto de datos cuantitativos discretos resumidos en
una distribucin de frecuencias. En el eje horizontal se colocan los diferentes valores
ordenados de la variable y en el eje vertical se pueden utilizar las frecuencias
absolutas, relativas o porcentuales. Este grfico se construye de manera similar al
diagrama de barras con la diferencia que en lugar de columnas se utilizan lneas.

Ejemplo 2.6: El diagrama de lneas para los datos del Ejemplo 2.5 se muestra a
continuacin.

Prof. Ing. Jorge Serna Fernndez 18


19

Ejemplo 2.7: Para ocupar tres vacantes de digitadoras, se evaluaron a 30 candidatas


para ello se tomaron varias pruebas, el objetivo de una de ellas era evaluar el nmero de
errores cometidos en la escritura de un texto, se ha registrado nmero de errores de las
participantes:
2 0 2 4 3 4 5 1 6 6
2 3 2 3 4 3 3 6 5 4
4 3 3 4 3 5 4 5 1 4
2 1 3 5 3 5 4 5 1 6
Construya una tabla de frecuencias y un diagrama con la informacin anterior e
interprete el resultado.

Tablas de distribucin de frecuencias para datos


cuantitativos continuos
Cuando se trabajan con datos cuantitativos continuos los valores no tienden a repetir
con mucha frecuencia. En este caso es preferible agrupar los datos usando intervalos de
clase y considerando la cantidad de datos que se encuentran dentro de ellos. Los pasos
necesarios para definir estos intervalos de clase son:

1. Calcular el rango ( R ) o amplitud como la diferencia entre el valor ms grande y el

ms pequeo en el conjunto de datos que se desea agrupar. R xmx xmn


2. Determinar el nmero de intervalos segn la regla de Sturges: K = 1+ 3.3*logn
, donde n es el nmero de datos a agrupar. El valor obtenido debe ser redondeado al
entero ms cercano.

3. Determinar el ancho de los intervalos segn w R / k . El valor obtenido


debe redondearse por exceso a la misma cantidad de decimales que tienen los datos.

3. Determinar los lmites inferior (LI) y superior (LS) de los intervalos


LI1 = Xmin
LIi = LIi-1 + w
LSi = LIi+1 = LSi-1 + w

4. Para evitar que una observacin pueda ser considerada en ms de un intervalo, cada
uno de los intervalos se considera abierto a la izquierda y cerrado a la derecha.

5. Finalmente, dado que los datos originales se pierden, ser necesario calcular un
valor que sea representativo de todas las observaciones que pertenecen a un
intervalo. A este valor se le denomina marca de clase y su clculo es:
Xi = (LIi + LSi) / 2
Ejemplo 2.8: La Superintendencia de Banca y Seguros hace un estudio sobre el monto
adeudado (en miles de soles) por los clientes del sistema financiero. Para ello selecciona
una muestra preliminar de 70 clientes.
8.05 8.51 8.65 8.68 8.72 8.78 8.80 8.80 8.82 8.82
8.83 9.14 9.19 9.27 9.35 9.36 9.37 9.39 9.43 9.48
9.49 9.54 9.55 9.55 9.60 9.63 9.64 9.70 9.70 9.73
9.75 9.80 9.80 9.84 9.84 9.85 9.87 9.87 9.87 9.95
9.95 9.97 9.98 10.00 10.01 10.01 10.02 10.03 10.03 10.05
10.05 10.05 10.05 10.09 10.10 10.12 10.12 10.12 10.15 10.15
10.15 10.15 10.25 10.26 10.26 10.28 10.29 10.31 10.32 10.55
Prof. Ing. Jorge Serna Fernndez 19
20

R 10, 55 8, 05 2, 5
7.1294 7 intervalos de clase

w 2, 5 7 0, 3571 0, 36

Clculo de los lmites

LI1 = 8,05 LS1= 8,05 + 0,36 = 8,41


LI2 = 8,41 LS2= 8,41 + 0,36 = 8,77
LI3 = 8,77 LS3= 8,77 + 0,36 = 9,13
.
.
.
LI7 = 10,21 LS7= 10,21 + 0,36 = 10,57

Clculo de las marcas de clase

X1 = (8,05 + 8,41) / 2 = 8,23


X2 = (8,41 + 8,77) / 2 = 8,59
X3 = (8,77 + 9,13) / 2 = 8,95
.
.
.
X7 = (10,21 + 10,57) / 2 = 10,39

Distribucin de las lecturas de la seal de grabacin


LI LD X fi hi pi FI HI PI
[8.05 - 8.41> 8.23 1 0.01428571 1% 1 0.01428571 1%
[8.41 - 8.77> 8.59 4 0.05714286 6% 5 0.07142857 7%
[8.77 - 9.13> 8.95 6 0.08571429 9% 11 0.15714286 16%
[9.13 - 9.49> 9.31 9 0.12857143 13% 20 0.28571429 29%
[9.49 - 9.85> 9.67 15 0.21428571 21% 35 0.5 50%
[9.85 - 10.21> 10.03 27 0.38571429 39% 62 0.88571429 89%
[10.21 - 10.57] 10.39 8 0.11428571 11% 70 1 100%
70 1 100%

A partir de la tabla de frecuencias interpretar lo siguiente:

1. X2 , f3 , F4 , H5 , F6
X2 : 8,59 es el valor representativo del segundo intervalo.
f3 : 6 de los encuestados tienen una deuda mayor a S/.8,77 y a menor a S/.9,13.
F4 :20 de los encuetados tienen una deuda menor a S/.9,49 .
H5 :
F6 :

2. Cuntos personas tienen una deuda mayor a S/. 9,49 y menor o igual a S/. 10,21 ?

15 + 27 = 42 registros
Prof. Ing. Jorge Serna Fernndez 20
21

3. Se desea estimar que porcentaje de personas tienen una deuda mayor a S/.10,21?
1- H6= 1- 0,8857 = 0,1143 => 11,43%
TUTORIAL EN INTERNET PARA LA CONSTRUCCIN DE UNA TABLA DE FRECUENCIA DE
VARIABLE CUANTITATIVA CONTNUA:
http://youtu.be/zgZAS0HLz9s

Histograma
El histograma es la representacin por medio de barras rectangulares cuya base de cada
barra proporcional a la amplitud de la clase, su centro es la marca de clase y la altura
la su frecuencia absoluta o relativa simple. En el eje horizontal se coloca la variable
de inters y en el vertical la frecuencia correspondiente.

TUTORIAL EN INTERNET PARA LA CONSTRUCCIN DE UN HISTOGRAMA


http://youtu.be/RjeptBTMEj0
Ejemplo 2.10: El histograma para los datos agrupados del Ejemplo 2.8 se
muestra a continuacin.

MONTO ADEUDADO

101,3 105,4 105,4 107,1 107,6 108,6 108,6 110,5 112,9 113,2
114,7 115,0 115,1 115,9 117,8 117,8 120,0 120,0 121,8 123,8
123,8 124,8 127,5 128,2 132,8 133,6 134,2 135,3 136,3 136,6
139,2 139,2 139,4 140,1 141,6 145,7 145,9 148,5 149,5 149,5
150,2 150,3 150,4 150,8 154,0 158,0 158,4 158,6 159,1 163,7
164,1 165,3 166,3 168,7 168,8 169,9 170,8 172,9 174,5 178,0
179,7 179,8 179,9 180,0 181,5 183,0 183,3 184,9 186,6 186,7
187,0 187,9 188,0 188,2 189,6 190,0 194,4 196,4 198,3 198,5
Prof. Ing. Jorge Serna Fernndez 21
22

Polgono de frecuencias
El polgono de frecuencias es una representacin grfica por medio de una figura
poligonal cerrada. Se obtiene uniendo con segmentos de recta el punto de interseccin
de cada marca de clase y su frecuencia relativa simple correspondiente.

El polgono de frecuencias para los datos agrupados del Ejemplo 2.8 se muestra a
continuacin.

Polgono de frecuencias de la distribucin porcentual del


monto adeudado
50%

40% 39%
Porcentaje

30%
21%
20% 13%
6% 9% 11%
10%
0% 1%
0% 0%
7.87 8.23 8.59 8.95 9.31 9.67 10.03 10.39 10.75
Monto adeudado (miles de S/.)
Fuente: Alpha System

Ojiva
La Ojiva es la representacin grfica para las frecuencias relativas acumuladas. Se
obtiene uniendo con segmentos de recta el punto de interseccin del lmite superior
de cada intervalo y su frecuencia relativa acumulada respectiva. La Ojiva permite
obtener, de manera aproximada, la proporcin de los datos que pertenece a un intervalo
cualquiera.

Ejemplo 2.11:La Ojiva para los datos agrupados del Ejemplo 2.8 se muestra a
continuacin.

Distribucin porcentual acumuladas de los


montos adeudados (S/.)
100.0%
100%
88.6%
80%
Porcentaje

60% 50.0%
40% 28.6%
15.7%
20% 7.1%
0.0% 1.4%
0%
8.05 8.41 8.77 9.13 9.49 9.85 10.21 10.57

Fuente: Alpha System Lecturas (Voltios)

Prof. Ing. Jorge Serna Fernndez 22


23

MEDIDAS ESTADSTICAS

Clasificacin Tabla de Tipo de Medida de Medida de Medida de


de variables frecuencia grficos Centralizacin Dispersin Deformacin
Moda
Cualitativa Frecuencias
Nominal simples: Absoluta
(fi), relativa (hi),
porcentual (pi) Grfico de
barras
Grfico de
sectores Moda
Frecuencias circulares Mediana
Cualitativa simples: Absoluta
Ordinal (fi), relativa (hi),
porcentual (pi)

Frecuencias
simples: Absoluta
(fi), relativa (hi), Bastn
porcentual (pi).
Cuantitativa
Discreta
Frec. Acumuladas:
Varianza
Absoluta (Fi), Escalonada Coeficiente de
relativa (Hi), o escalera Moda Asimetra
porcentual(Pi) Desviacin
Estndar
Mediana Curtosis
Frecuencias
simples: Absoluta Histograma
Cuantitativa (fi), relativa (hi), Polgono de Media Coeficiente
Continua o porcentual (pi) frecuencias de
muchos y marca de clase Variacin
valores (X)
discretos
Frecuencias
Acumuladas:
Absoluta, relativa, Ojiva
porcentual y marca
de clase
24

DIAGRAMA TALLO-HOJAS

2.4 Problemas
Bajar la hoja de Excel en :

https://docs.google.com/file/d/0B5yYjHMGRyCCSHBmU0htSlVP
OWc

1. Los sistemas de cmputo colapsan por muchas razones, entre ellas las fallas de
hardware o software, errores del operador, sobrecargas del sistema mismo y a otras causas.
Los resultados obtenidos en un estudio acerca de las causas de colapso en una muestra
de 200 sistemas de cmputo se encuentran en la hoja Colapso. Suponga que se debe
priorizar entre las dos principales causas de colapso de los sistemas de cmputo. Elaborar
un grfico adecuado que permita establecer una estrategia apropiada.

2. El tiempo de inactividad es la cantidad del tiempo en el que un sistema de computadora no


opera debido a una falla de hardware y software. Cuando el sistema se encuentra inactivo
durante ms de una hora todos los archivos de trabajo actuales se pierden. Los datos
agrupados en la hoja Inactividad corresponden a los tiempos de inactividad (en minutos)
registrados en una muestra de 30 y 28 sistemas de computadoras del turno maana y tarde
respectivamente.

Tiempo de Marca de Turno maana Turno tarde


i
inactividad clase f h f h
1 20,5 25,5 23 1 1
2 25,5 30,5 28 3 6
3 30,5 35,5 33 0 3
4 35,5 40,5 38 2 12
5 40,5 45,5 43 20 6
6 45,5 50,5 48 4 0
30 28

a. Construir el polgono de frecuencias para los datos agrupados del turno maana y tarde
en un solo grfico.
25

b. Elaborar un informe sustentado en el grfico obtenido en el punto anterior.

3. 52 personas tomadas al azar se les encuest sobre el nmero de tarjetas de crdito


posedas. Los datos en la hoja Tarjetas muestra el nmero de tarjetas que posee cada
una de las 52 personas. Construir una tabla de distribucin frecuencias para la
variable en estudio.

4. Se quiere comparar los resultados obtenidos por tres operadores, en cuanto a los
tiempos (en minutos) utilizados en el restablecimiento de servicio de redes en el sistema
de una importante entidad bancaria. Los resultados obtenidos se encuentran en la hoja
Operador.

a. Construir las tablas de distribucin de frecuencias para los tres operadores por
separado. Use la regla de Sturges.
b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada
grfico.
c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.

5. El jefe del rea de sistemas de una empresa realiz un estudio para analizar el
tiempo que demoran los empleados en detectar y resolver un problema informtico de
software o hardware. El estudio trata de estudiar las diferencias de tiempos en los turnos
de trabajo A y B de una empresa. La hoja Tiempo muestra los datos obtenidos
para una muestra de 40 problemas informticos presentados en el turno A y 100
problemas informticos presentados en el turno B.

a. Construir la tabla de distribucin de frecuencias para el turno A. Use la regla de


Sturges.
b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada
grfico.
c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.

6. A partir de la siguiente grfica


estadstica de gustos deportivos:
a. Indique cul es la variable y su tipo.
b. Construya la tabla de frecuencias.
A qu porcentaje de las personas
no le gusta el ciclismo?

7. Para conocer las preferencias de los


clientes a los distintos canales de
atencin que ofrecen los bancos , se
hizo una encuesta y se obtuvo los Sgtes
resultados:
Cajeros Agentes Celular Agencias Agentes Agentes Cajeros
Cajeros Cajeros Cajeros Oficinas Agencias Agencias Oficinas
Agentes Internet Internet Agentes Agencias Internet Cajeros
Oficinas Agentes Cajeros Cajeros Oficinas Cajeros Otros
Internet Oficinas Celular Cajeros Agentes Internet Otros

a) Construir una tabla de frecuencias para representar este conjunto de datos.


b) Representar al conjunto de datos con un grfico de barras porcentuales.
c) Indique la variable y su tipo.
26

8. Se realiz una encuesta a un grupo de


personas para comprobar si haban solicitado
un crdito este ao. Los resultados se reflejan
en la grfica:
a. Indique cul es la variable y su tipo.
b. Cuntas personas contestaron a la
encuesta?
c. Elabora la tabla de frecuencias
correspondiente
d. Indique la variable y su tipo.

9. En una encuesta a 35 personas se les


preguntaba sobre sus preferencias a la
hora de leer novelas. Los resultados se
recogieron en la siguiente grfica:
Construya una tabla de frecuencia para la
variable en estudio, indique cul es la
variable y de que tipo es.

10. La gerencia del hotel LOS DELFINES


desea evaluar la calidad de mil cajas de jabones PALMOLIVE que intenta comprar
(cada caja contiene 24 unidades); el gerente dispone revisar al azar 80 cajas y evaluar
la calidad de los jabones en estas cajas. El supervisor encargado le informa: En el
65% de las cajas no se encontr jabones malogrados, en el 20% se encontr un jabn
malogrado, en el 10% de cajas se encontraron dos jabones malogrados y en el resto
de cajas se encontraron tres jabones malogrados. Se pide identificar:
a) La poblacin objetivo.
b) La muestra.
c) La variable estudiada.
d) La tabla de frecuencia.
11. Se desea hacer una fiesta para recaudar fondos para el viaje de promocin. Se
encuest a los 35 alumnos sobre el gnero musical que prefieren, y respondieron lo
siguiente:
Cumbia C
Siendo: R C S P R L S R E
Electrnica E
S S P C L R L P R
Hip Hop H
S C E L P H S L H Latin L
E S L S C R H S C Pop P
P C R E S R S C S Rock R
Salsa S
a. Construya una tabla de distribucin de frecuencias.
b. Si se elegirn slo tres gneros para la fiesta, cules son los tres tipos de msica
que se pondrn?

12. La siguiente grfica recoge la cantidad de parejas de zapatos de mujer vendidas en la


tienda PASARELLA a lo largo del da:
27

35

N de pares vendidos
30
25
20
15
10
5
0
36 37 38 39 40
N de zapato

a. Cul es la variable y de que tipo es?


b. Cuntas parejas de zapatos del nmero 37 se han vendido?
c. Pasa los datos a una tabla de frecuencias absolutas.
d. Cmo se llama la grfica que nos han dado?
e. Qu porcentaje de zapatos vendidos eran nmeros del 39 o 40?
f. Dibuja un polgono de frecuencias absolutas acumuladas.

13. Para conocer el nmero de veces en el ao en que 0 0 1 3 2 1 2 1 4 5


los estudiantes de ESAN realizan un viaje al 2 2 4 2 4 3 5 0 0 0
interior del pas se seleccion una muestra de 50 5 2 1 0 1 2 1 2 3 1
estudiantes y se obtuvo los siguientes resultados 0 1 1 2 3 1 3 1 1 0
Se pide: 1 0 3 3 1 0 2 4 3 1

a) La variable X es ..
b) La muestra est formada por.
c) Construir una tabla de frecuencias para representar este conjunto de datos.
d) Representar al conjunto de datos con un grfico de barras.

14. La gerencia general de VISA est interesada en conocer el nmero de tarjetas


habientes en la ciudad de Lima. VISA, por tanto dispone evaluar al nmero de
colocaciones mensuales realizadas durante los 25 ltimos meses. El nmero
colocaciones por mes que efectuaron en este perodo es:

3 4 1 2 1 2 2 5 2 1 2 3 0 1 0 3 3 2 0 2 1 3 4 1 2
Construya una tabla de frecuencia y en base a esta tabla responda a las siguientes
preguntas:
a. Cul es la variable y de que tipo es?
b. Cuntos meses VISA realiz entre 2 y 4 colocaciones?
c. Cuntos meses VISA realiz menos de 3 colocaciones?
d. Qu porcentaje de los meses realiz ms de 4 colocaciones?
e. Qu porcentaje de los meses realiz ms de 2 colocaciones?

15. Las calificaciones obtenidas por los 32 alumnos de una clase de GERENCIA en una
prueba de Matemticas vienen dadas por la siguiente tabla:

Nota 2 3 4 5 6 7 8 9 10
Alumnos 1 2 4 5 4 6 5 4 1
a. Cul es la variable y de que tipo es?
b. Elabora la tabla de frecuencias completa.
c. Qu porcentaje de alumnos aprueba la materia?
d. Qu porcentaje obtiene ms de 8 puntos?
e. Dibuja un diagrama de barras de frecuencias relativas.
f. Dibuja un polgono de frecuencias acumuladas.
28

16. El siguiente cuadro muestra las notas obtenidas por 1 3 3 4 5 5 5 5


un grupo de empleados de BACKUS para acceder a
7 7 8 8 9 9 10 10
un ascenso.
a. Construya una tabla de distribucin de 10 11 12 12 12 13 13 13
frecuencias considerando 6 intervalos. 13 13 13 13 14 14 14 15
b. Cul es la variable y de qu tipo es? 15 15 15 16 17 18 19 19
c. Teniendo en cuenta que ahora la nota aprobatoria
es 13. Cuntos obtuvieron un ascenso y qu % representan?
d. Identifique f1, h3 , p4, F4, H5 y P4.
17. Una empresa comercializadora de automviles MITSUBISHI ha registrado el nmero
de automviles vendidos por da en los ltimos 40 das, tal como aparece en la
siguiente tabla:
8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10
11 11 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13 13 13 13
a) Indique la variable que es objeto de estudio y su tipo.
b) Construya una tabla de distribucin de frecuencias.
c) Cuntos das se vendieron a lo ms 10 autos?
d) Qu porcentaje de los das se vendieron por lo menos 11 autos?
e) Si se considera un da ptimo de ventas cuando se han colocado 10 11 autos,
cuntos das se tuvo ptimas ventas?
18. Con el propsito de obtener algunas caractersticas numricas importantes acerca del
gasto mensual de sus principales clientes durante el mes pasado, el BANCO
FALABELLA tomo una muestra de 25 clientes y obtuvo la siguiente informacin:
En este problema:

a) El rango R es 3000 4000 5850 5200 3800


b) Cul es la variable y de qu tipo 5700 3250 3550 3750 4000
es? 4250 4500 4500 4750 4800
c) El nmero de intervalos K 3600 4900 5150 5000 4850
es. 5250 5500 4250 4650 3700
d) La amplitud del intervalo C es
e) Construir la tabla de frecuencias que corresponde a este conjunto de datos
f) A partir de la tabla construida calcule e interpretar f2 , h4, p3, F4, H2 y P5.
g) Construya el histograma de frecuencias absolutas correspondiente.

19. La comisara de LINCE desea establecer los niveles de velocidad que corresponderan
al pasar por la garita de control, para tal fin establecen un punto de control de
velocidad y miden las velocidades de 30 vehculos que transitan por dicho punto de
control, estas
60 30 38 60 45 20 35 20 40 54 38 35 40 10 45
velocidades
son: 60 49 30 55 46 29 38 80 40 28 15 82 72 105 85
a. Construya la tabla de distribucin de frecuencias absolutas y relativas.
b. Cul es la variable y de qu tipo es?
c. Grafique el histograma y el polgono de frecuencias correspondiente
d. A partir de la tabla construida calcule e interpretar f2 , h4, p3, F4, H2 y P5.

20. Del histograma presentado a continuacin:

a) Identifique la variable.
b) Luego de construir la tabla de frecuencias, Interprete f2 , h4, p3, F4, H2 y P5
29

21. La gerencia del restaurante MC DONALDS desea implementar acciones que motiven
a sus clientes a aumentar el monto de sus consumos los fines de semana, por tal
motivo desea analizar el monto de las 40 facturas correspondientes a los consumos
realizados en el ltimo fin de semana, estos son:

121 130 138 140 141 201 251 388 401 410
414 417 451 459 476 479 484 486 510 518
518 549 571 575 576 648 655 676 679 702
710 749 749 750 755 784 875 948 978 981

Construya una tabla de frecuencia y en base ella responda a las siguientes preguntas:
a. Cul es la variable y de qu tipo es?
b. A partir de la tabla construida calcule e interprete f2 , h4, p3, F4, H2 y P5.

22. El gerente del hotel MARRIOTT desea llevar un mayor control sobre el tiempo de las
llamadas internacionales que realiza su personal de promocin. Preliminarmente se
plantea la idea que estas 1 1 1 1.2 1.5 2.1 2.1 2.2 3.1 3.1
llamadas deben tener un lmite 3.2 3.2 3.3 4 4 4 4 4 4 4.1
de 10 minutos. Para examinar 4.5 4.5 5 5.1 5.1 5.1 5.1 5.2 5.4 6
ms esta idea la gerencia 6 6.1 6.1 6.2 6.2 6.4 6.5 7 7.1 7.1
solicita le alcancen la relacin 8 8.5 9 9 10 11 12 12.1 14.2 16
de tiempos utilizados por las
50 llamadas internacionales realizadas por el hotel durante el mes de Febrero 2010 El
listado de estos tiempos (en minutos) usados por cada llamada es:
a. Construya una tabla de frecuencia clasificando estos datos en 5 intervalos.
b. Cul es la variable y de qu tipo es?
c. Construya el histograma de frecuencia y el polgono respectivo.
d. Qu porcentaje de llamadas duraron entre 4 y 10 minutos?
Responda aproximadamente:
e. A partir de la tabla construida calcule e interpretar f2 , h4, p3, F4, H2 y P5.
23. En la primera prctica de ESTADSTICA DESCRIPTIVA del ciclo anterior, las notas de
los 50 alumnos fueron:
5.5 6 6.5 7 7.5 7.5 8 8 8.5 8.5
a. Cul es la variable y de qu
tipo es? 8.5 9 9 9 9.5 9.5 9.5 9.5 10 10
b. Construya una tabla, 10 10 10.5 10.5 10.5 10.5 11 11 11 11
histograma y polgono de 11.5 11.5 11.5 11.5 12 12 12 12 12.5 12.5
frecuencia clasificando estos 12.5 13 13 13 13.5 13.5 14 14 14.5 17.5
30

datos en 6 intervalos En base la tabla de frecuencia construida:


c. Cul es la calificacin que corresponde al tercio superior en las notas registradas?
d. Qu porcentaje de alumnos est comprendido entre las notas 9.5 y menos de 13.5?

24. Los siguientes datos representan los aos laborados en una empresa de SERVICIOS
FINANCIEROS

a) Cul es la variable y de qu tipo es?.


b)Qu porcentaje tiene menos de 18 aos cumplidos?
c)Qu porcentaje tiene menos de 45 aos cumplidos?
d)Que cantidad de trabajadores tiene entre 12 y 15 aos cumplidos?

25 .- El Banco SCOTIABANK desea ofrecer una nueva tarjeta de crdito a los


trabajadores de la empresa omega. La informacin sobre el sueldo neto mensual
de los Sgtes. trabajadores se muestra a continuacin.

ingreso marca f h F H
1581.87 1667.74 1624.805 9 0.018 9 0.018
1667.74 1753.61 1710.675 19 0.038 28 0.056
1753.61 1839.48 1796.545 42 0.084 70 0.14
1839.48 1925.35 1882.415 70 0.14 140 0.28
1925.35 2011.22 1968.285 122 0.244 262 0.524
2011.22 2097.09 2054.155 108 0.216 370 0.74
2097.09 2182.96 2140.025 71 0.142 441 0.882
2182.96 2268.83 2225.895 43 0.086 484 0.968
2268.83 2354.70 2311.765 11 0.022 495 0.99
2354.70 2440.57 2397.635 5 0.01 500 1

a) Identifique la variable y construya el histograma e interprete: f2, h4, F4,F9, y H9.


31

25. En el grfico mostrado:

a) Identifique la variable.
b) Si en total hay 2000 trabajadores, construya la tabla de frecuencias e identifique e
interprete: f2, F5, h4, h9, F4,F9, H2 y F3.

27. El siguiente grafico nos muestra la distribucin de las calificaciones obtenidas en la


primera prctica del curso de Estadstica General por un grupo de estudiantes en el
ciclo anterior:
Histograma de Calificaciones
6
6

5 5
5
Nmero de estudiantes

4
4

3
3

2
2

0
6,0 8,1 10,2 12,3 14,4 16,5 18,6
Calificaciones obtenidas

a) Cul es la proporcin de estudiantes que obtuvo por lo menos 14.4?


b) Por el grado de dificultad de la prctica, se considera a un estudiante dentro de la
categora de sobresaliente si obtuvo una calificacin de por lo menos 16. Qu
porcentaje de estudiantes sern considerados dentro de esta categora?
c) Cul es la calificacin mxima para estar considerado dentro del 25% de
estudiantes que obtuvieron las menores calificaciones?
d) Cul es la variable y de qu tipo es?

28. La gerencia del restaurante ASTRID Y GASTN desea implementar acciones que
motiven a sus clientes a aumentar el monto de sus consumos los fines de semana, por
tal motivo desea analizar el monto de las 50 facturas (en Soles) correspondientes a los
consumos realizados en el ltimo fin de semana, estos son:

121 130 138 140 141 201 251 388 401 410
414 417 451 459 476 479 484 486 510 518
518 549 571 575 576 648 655 676 679 702
710 749 749 750 755 760 770 800 910 925
990 1000 1020 1050 1075 1080 1085 1085 1090 1105
32

a. Construya una tabla de distribucin de frecuencias considerando 6 intervalos.


b. Cul es la variable y de qu tipo es?
c. Explique el significado de f5, h2, H3, h5, f4, F3.
d. Si se considera un cliente VIP a aquel que consume por lo menos S/. 800, que
porcentaje de clientes estn en este grupo?
29. A continuacin se presenta el histograma de los prstamos obtenidos por un grupo
de clientes VIP de SCOTIABANK.

a) Cul es la variable y de qu tipo es?


b) Si para aprobar el curso se necesitan por lo menos 75 puntos. Cul es el
porcentaje de estudiantes aprobados?

30. El gerente del hotel WESTIN desea analizar el perfil de los clientes que prefirieron al hotel
durante el mes pasado, por tal motivo solicita a la recepcin informacin de los clientes
atendidos durante la ltima semana del mes pasado. La informacin solicitada es:

CLIENTE NACIONALIDAD EDAD NUMERO DE DIAS DE MONTO DE


ACOMPAANTES PERMANENCIA FACTURA
1 Norteamericana 25 1 2 201
2 Norteamericana 27 1 2 251
3 Norteamericana 29 1 2 388
4 Norteamericana 35 1 5 401
5 Francesa 36 2 5 417
6 Francesa 39 2 5 484
7 Francesa 38 2 5 459
8 Francesa 45 2 5 479
9 Alemana 56 2 5 518
10 Alemana 68 3 5 670
11 Canadiense 25 2 2 280
12 Canadiense 24 2 2 305
13 Canadiense 30 2 7 749
14 Canadiense 35 2 7 679
15 Italiana 38 2 7 695

a. Construya una tabla de frecuencias y su respectivo grfico para cada variable.


33

b. Construya una tabla de frecuencias y su histograma utilizando 4 intervalos de clase para


describir el monto de las facturas pagadas por los clientes del hotel durante esta semana.
c. Utilizando la tabla de frecuencia construida en la pregunta b estime el porcentaje de
clientes cuyas facturas fueron por montos entre S/ 500 y menos de S/ 800 aprox.
d. La gerencia plantea hacer un obsequio a los clientes cuyas facturas corresponden al 20%
de los mayores montos. Cul es el monto a partir del cual se hara el obsequio al cliente?
e. Utilizando la tabla de frecuencia construida en la pregunta b determine el monto de factura
que comprende al 50% de los clientes que gastaron menos.
f. Indique cada una de las variables y su tipo (Cuantitativa o cualitativa).

31. La gerencia general del hotel CONQUISTADORES, preocupada por la calidad del
servicio que estn recibiendo los 95 clientes atendidos actualmente, dispone que se
consulte la opinin sobre la calidad del servicio a una muestra de 20 clientes hospedados:
Numero de Opinin sobre el servicio
Cliente Nacionalidad Edad Sexo atenciones en Nivel de Educacin recibido en la ltima atencin
el ao
1 Peruana 25 Masculino 2 Superior Buena
2 Peruana 23 Femenino 3 Superior Buena
3 Peruana 50 Masculino 2 Superior Buena
4 Americana 48 Femenino 1 Secundaria Mala
5 Americana 28 Masculino 1 Secundaria Mala
6 Peruana 28 Femenino 2 Secundaria Regular
7 Americana 36 Masculino 1 Superior Regular
8 Americana 35 Femenino 1 Superior Regular
9 Argentina 25 Masculino 1 Superior Buena
10 Argentina 23 Femenino 1 Superior Buena
11 Europea 39 Masculino 2 Secundaria Regular
12 Americana 43 Femenino 2 Superior Buena
13 Europea 55 Femenino 1 Secundaria Mala
14 Americana 28 Masculino 2 Superior Regular
15 Americana 41 Masculino 2 Superior Buena
16 Peruana 33 Femenino 3 Secundaria Buena
17 Europea 48 Masculino 1 Superior Regular
18 Americana 50 Femenino 1 Superior Regular
19 Europea 36 Femenino 2 Secundaria Buena
20 Americana 42 Femenino 2 Superior Mala
Con respecto al conjunto de datos.

a. Identifique: la Poblacin, muestra, unidad elemental


b. Identifique las variables y establezca su naturaleza.
c. Cual es la observacin para la variable edad del cliente 7 de esta base de datos?.
d. Cul es el parmetro que corresponde para la edad de los clientes?.
e. Cul es el estadstico que corresponde para la edad de los clientes?.
f. Cul es parmetro que corresponde a la nacionalidad de los clientes?.
Elabore los siguientes TABLAS DE DOBLE ENTRADA:

g. Nmero de clientes segn su opinin del servicio por nacionalidad del cliente
h. Nmero de clientes segn su opinin del servicio por sexo del cliente
i. Nmero de clientes segn su opinin por el nmero de atenciones recibidas de hotel

32. Para estudiar las principales caractersticas descriptivas de los 850 clientes que est
atendiendo el gimnasio GOLDS GYM se elige una muestra de 25 clientes y a cada
cliente elegido se le solicita la informacin siguiente: Nacionalidad, sexo, edad (aos),
34

peso (kg), das que trabaj la semana anterior, nmero de veces que vino al gimnasio en
el mes anterior y si est haciendo dieta.

Cliente Nacionalidad Sexo Edad Peso Das Veces Dieta


1 Peruana Masculino 18 54.3 6 5 No
2 Peruana Masculino 19 63.2 5 25 No
3 Peruana Masculino 17 62.5 6 10 No
4 Peruana Masculino 19 53.3 6 20 No
5 Peruana Masculino 30 66.8 7 15 No
6 Peruana Masculino 41 74.5 6 15 No
7 Peruana Femenino 20 52.2 6 15 Si
8 Peruana Femenino 18 53.6 6 5 Si
9 Peruana Femenino 18 61.5 4 25 Si
10 Peruana Femenino 18 55.8 6 10 Si
11 Panamea Masculino 59 74.3 6 20 No
12 Panamea Masculino 17 63.2 5 15 No
13 Panamea Masculino 49 72.5 4 15 No
14 Panamea Masculino 20 73.3 6 15 No
15 Panamea Femenino 21 56.8 7 15 No
16 Panamea Femenino 20 54.5 6 15 Si
17 Panamea Femenino 18 52.2 6 15 Si
18 Colombiana Masculino 38 63.6 6 15 No
19 Colombiana Masculino 39 71.5 4 15 No
20 Colombiana Masculino 20 65.8 6 20 No
21 Colombiana Femenino 21 52.2 5 20 Si
22 Colombiana Femenino 20 43.6 6 10 Si
23 Ecuatoriana Masculino 48 71.5 4 10 No
24 Ecuatoriana Masculino 18 65.8 7 25 No
25 Ecuatoriana Femenino 20 54.3 6 5 No

a. Determine la unidad de anlisis, la poblacin y la muestra en esta investigacin.


b. Establezca el tipo de variable incluida en la investigacin.
c. Elabore las tablas de frecuencias para las variables Nacionalidad y Das y un
cuadro de resumen de doble entrada de las variables nacionalidad vs sexo. Haga
un grfico para mostrar la estructura porcentual respecto al sexo de los clientes.

33. Para caracterizar a los 120 estudiantes matriculados en Estadstica General de ESAN se
eligen 20 estudiantes y se les pide la informacin siguiente: Especialidad, colegio de
procedencia, edad, promedio ponderado, nmero de cursos en que est matriculado, horas
de clase a la semana que debe asistir y si repite el curso.

Alumno Especialidad Colegio Edad Promedio Cursos Horas Repite


1 Hotelera Particular 18 14.3 6 30 No
2 Hotelera Particular 19 13.5 5 25 No
3 Hotelera Particular 17 12.5 6 30 No
4 Hotelera Particular 19 13.6 6 30 No
5 Hotelera Particular 20 16.8 7 35 No
6 Hotelera Particular 22 14.5 6 30 No
7 Hotelera Nacional 21 12.5 6 30 Si
8 Hotelera Nacional 18 13.6 6 30 Si
9 Hotelera Nacional 18 11.0 4 20 Si
10 Hotelera Nacional 18 15.1 6 30 Si
11 Turismo Particular 19 14.3 6 30 No
12 Turismo Particular 17 13.2 5 25 No
13 Turismo Particular 19 12.5 4 20 No
35

14 Turismo Particular 22 13.3 6 30 No


15 Turismo Nacional 21 16.5 7 35 No
16 Turismo Nacional 24 14.5 6 30 Si
17 Turismo Nacional 18 12.2 6 30 Si
18 Comunicaciones Particular 18 13.6 6 30 No
19 Comunicaciones Particular 19 11.5 4 20 No
20 Comunicaciones Particular 20 15.8 6 30 No

a) Determine cul es la unidad de anlisis, la poblacin, la muestra y la naturaleza de


cada variable.
b) Elabore una tabla de frecuencias para la variable Colegio, otra tabla para la
variable Promedio con sus grficas respectivas.
c) Elabore un cuadro de doble entrada de contemple a las variables Especialidad vs
Cursos con su grfica respectiva.
d) Elabore una tabla de frecuencias del promedio ponderado de los estudiantes.
34. Considerando la tabla de frecuencias de la parte (e) del problema anterior, conteste las
siguientes preguntas:
a) Cul es el porcentaje de estudiantes cuyo promedio ponderado es menor a 15.5?
b) Cul es el puntaje total que acumulan los 25 estudiantes entrevistados?
c) Cul es el porcentaje de estudiantes cuyo promedio es menor a 15.5 pero mayor a
13.5?
d) A partir de qu promedio ponderado se considerara al 20% superior de estudiantes?

35. La representacin tallo hoja del tiempo (en minutos y con un decimal) requerido por los
estudiantes para responder cierta pregunta de razonamiento matemtico es :

N Tallo Hoja
17 1 00012233334444444
44 1 555556666666667777888899999
76 2 00000011111111222222222222333333
106 2 555556666666666666777778889999
(29) 3 00000000011111111222233333344
90 3 55566666667788888899999999
64 4 0001111112222222333444
42 4 55555667778888
28 5 000001111122233444
10 5 5567899
3 6 04
1 7 0
( La suma de los tiempos registrados es: 713.3 minutos)

Construya una tabla de frecuencias para los datos observados.


a. Considerando 5 intervalos.
b. Aplicando la regla Sturges (muestre slo frecuencias absolutas).
Utilizando la tabla de frecuencia que incluye 5 intervalos determine:
c. Qu porcentaje de alumnos utiliz entre 3 y menos de 5 minutos para responder?.
d. Cul es el tiempo que comprende al tercio de alumnos que demor menos?.
36

Captulo 3
Estadstica Descriptiva: Mtodos
numricos
3.1 Introduccin
En este captulo se presentan algunos mtodos numricos de la estadstica descriptiva
que proporcionan algunas alternativas para resumir datos. Las medidas numricas de
tendencia central y dispersin se calculan a partir de los valores de los datos. Si estos
datos pertenecen a una muestra se denominan estadsticos mientras que si se
calculan a partir de los datos de una poblacin se denominan parmetros.

3.2 Medidas de tendencia central.

3.2.1 Media aritmtica


Es quizs la medida numrica ms importante de localizacin. La media, media
aritmtica o promedio de un conjunto de datos es la suma de dichos valores dividida
entre el nmero total de datos.
DATOS NO TABULADOS DATOS TABULADOS
Media paramtrica (): Media muestral( x ): TABLAS DE FRECUENCIA
k
N
f x
n

x j x j
j 1
j j


j 1
x
j 1
x
N n n
donde f representa la frecuencia
n = tamao de la muestra y x los valores de la variable o
N = tamao de la poblacin las marcas de clase, esto ltimo
si estn por intervalos.
37

Ejemplos:
1. Datos no tabulados:

Las notas de un alumno son: 14, 17, 8, 13, 16. Encuentre la media de sus notas
n

X i
14 17 8 13 16
X i 1
13.6 puntos
n 5

2. Datos tabulados (Tablas simples)

Los siguientes datos corresponden al nmero de tarjetas de crdito que tienen 32


personas elegidas al azar:
N tarjetas N clientes
Calcule la media del nmero de tarjetas de los clientes: 1 10
2 12
Tarjetas/cliente 3 10
Total 32

3. Datos tabulados (Tablas con intervalos) SUELDOS Xi fi


[90-120] 105 11
Calcule el sueldo medio de 80 trabajadores: [120-150] 135 13
[150-180] 165 20
105 x11 135 x13 x... x 285 x1
X 174 .375 soles / trabajador [180-210] 195 17
80 [210-240] 225 15
[240-270] 255 3
NOTA: Seleccione la frmula a usar de acuerdo al tipo de datos.
[270-300] 285 1
80

3.2.2.- Media Total: Se usa para promediar grupos de datos.

Suponga que existen dos secciones que llevan el curso de Estadstica, una seccin con
una nota media de 15 con 3 alumnos y otra seccin con nota media 13 y 2 alumnos.

Si se desea la nota media de las dos secciones juntas, se calculara .

n1 X 1 n2 X 2 3x15 2 x13 Nombre Nota


XT 14.2 puntos Nombre Nota
n1 n2 5 Juan 15
Mara 12
Carlos 12
Cecilia 14
Propiedades de la media Felipe 18
1. La media aritmtica se ve afectada por valores extremos.
2. La media aritmtica de una cantidad constante es la misma constante:

Media(k) = k
3. La media de una variable a la que se le suma o resta una constante equivale a la
media de la variable ms o menos dicha constante:
38

Media(X k) = Media(X) k
4. La media de una variable multiplicada por una constante equivale a la media de la
variable multiplicada por dicha constante:

Media(kX) = kMedia(X)

5. En general, para dos constantes a y b tenemos:

Media(aX b) = aMedia(X) b

Ejemplo 3.1: Se sabe que los ingresos mensuales que perciben los empleados de la
Caja Municipal Piura tienen un promedio de 2800 nuevos soles, determine el
nuevo ingreso promedio que se obtendra luego de realizar los siguientes aumentos:

a. Los ingresos de los trabajadores se incrementan en 250 nuevos soles.


b. Los ingresos se incrementan en un 20%
c. Los ingresos se incrementan en un 12% ms una bonificacin de 125
nuevos soles.

Solucin
En cada caso el ingreso se denotar por X y el nuevo ingreso ser representado por Y.

a) Y = X + 250
Media (Y) = Media(X) + 250
Media (Y) = 2800 + 250 = 3050 nuevos soles.

b) Y = X + 0,20X = 1,2X
Media (Y) = Media (1,2X)
Media (Y) = (1,2)(2800) = 3360 nuevos soles.

c) Y = 1,12X + 125,
Media (Y) = Media (1,12X +125)
Media (Y) = (1,12)(2800)+ 125 = 3261 nuevos soles.

Media ponderada
Se utiliza cuando los datos a promediar no tienen la misma importancia relativa dentro
del conjunto total, es decir, algunos datos tiene mayor importancia, peso ponderacin
dentro del conjunto de observaciones. Se usar la siguiente expresin para su clculo:

xi : Dato individual.
wi : Peso asignado a cada dato
39

Ejemplo 3.2: La Superintendencia de Banca y Seguros (www.sbs.gob.pe) clasifica una


muestra de 50 clientes segn su comportamiento crediticio segn el cuadro:

Categoras de Clasificacin Cantidad de clientes


Categora Normal 20
Categora con Problemas Potenciales 12
Categora Deficiente 8
Categora Dudoso 7
Categora Prdida 3

Asimismo, el monto promedio adeudado por los clientes de la categora Normal es de


S/.12000,por los clientes de categora Problemas Potenciales es de S/.8000, por los clientes
de categora Deficiente es de S/.9000, por los de la categora Dudoso es de S/.4000 y por
los de categora Prdida es de S/.10000.
Cul es el monto de la deuda promedio de todos los clientes de la muestra analizada?

Solucin

20(12000) 12(8000) 8(9000) 7(4000)+3(10000)


xw 9320
20+12+8+7+3

El monto promedio de deuda es de S/. 9320.

Ejemplo 3.3: Scotiabank tiene tres turnos de trabajo en sus dos formatos:
Crediscotia y Banco Scotiabank. Los trabajadores de la agencia principal en cada uno de
estos turnos participan de acuerdo a la siguiente tabla:

Salario por Nmero de horas trabajadas


Turno hora (n.s.) Crediscotia Banco Scotiabank
Maana 25 50 40
Tarde 35 20 35
Noche 38 10 25

El salario promedio por hora en cada local es:

25 50 35 20 38 10
Crediscotia: x w 29.13 nuevos soles
50 20 10
25 40 35 35 38 25
Banco Scotiabank: x w 31.75 nuevos soles
40 35 25
40

Ejemplo 3.4: Un artculo es producido en tres etapas, cortado, armado y acabado. Para
la etapa de cortado se requiere dos horas, cuatro para el armado y tres para el acabado;
los costos por hora en cada etapa son de 2, 4,5 y 6,5 dlares.
a) Calcule el costo promedio de produccin por hora de dicho artculo
b) Cada artculo se vende a un precio de 6,2 dlares; cul es la utilidad promedio si
se producen y venden 5000 de estos artculos?

Ejemplo 3.5: Los datos siguientes corresponden al nmero de interrupciones


semanales en el sistema de red de un conocido banco registrado el ltimo ao. Calcule e
interprete la media del nmero de interrupciones semanales.
Interrupciones f
Nmero de interrupciones semanales 0 2
1 01
0(20) 1(15) 2(8) 3(6) 4(2) 5(1) 2 58
Solucin xw 1,19
3 6
20 15 8 6 2 1
4 2
5 1
El nmero medio de interrupciones semanales es de 1,19 en promedio.
Total 5
2
Ejemplo 3.6: El tiempo de duracin de los crditos de consumo de un grupo de
consumidores entrevistados se muestra en la tabla Sgte:

Duracin (aos) X f
1,2 1,8 12
1,8 2,4 18
2,4 3,0 36
3,0 3,6 42
3,6 4,2 31
4,2 4,8 17
4,8 5,4 8

Determine el tiempo promedio de duracin de un crdito de consumo.


Solucin
Primero de calcula la marca de clase, el cual es el valor representativo de cada intervalo

Duracin (aos) X f
1,2 1,8 1,5 12
1,8 2,4 2,1 18
2,4 3,0 2,7 36
3,0 3,6 3,3 42
3,6 4,2 3,9 31
4,2 4,8 4,5 17
4,8 5,4 5,1 8

1, 5(12) 2,1(18) 2, 7(36) 3, 3(42) 3, 9(31) 4, 5(17) 5,1(8)


xw 3, 2
12 18 36 42 31 17 8

La duracin promedio de un crdito de consumo es de 3,2 aos.


41

Media Geomtrica
Se emplea frecuentemente para promediar variables tales como porcentajes, tasas de
crecimiento, nmeros ndices, tipos de inters anuales, inflacin, etc.

En nuestro curso mayormente nos centramos en determinar el porcentaje promedio


( %promedio) de incremento en Ventas, Produccin u otras series econmicas
de un perodo a otro.

X G t FC 1 x FC 2 x ... FC t .......... ...(1)


Xf
XG t .......... .......... .......... ......( 2)
Xi
FC = 1 + %
FCi Factor de crecimiento de un perodo a otro
FC = X f / X i
%promedio ( X G 1) *100 %
Val proyect : Xp = (ultimo dato)(1 %promedio)^ n
n : Nmero de perodos de crecimiento, por ejemplo del ao 2000
al 2005 , entonces n 5
X f Dato del ltimo perodo de tiempo
X i Dato del primer perodo de tiempo

Ejercicios:
1.- El gerente PLAZA VEA decidir abrir una sucursal solo si el incremento promedio de
sus ventas mensuales es superior al 10%, para tomar esta decisin, tiene los
siguientes datos:

MES MAR. ABR. MAY. JUN. JUL. AGO.


VENTAS (S/.) 4352 4713 4420 5370 5649 6320

Cul sera la decisin del gerente?

Solucin.-
MES VENTAS F.C.
MARZO 4352 ------------
ABRIL 4713 1.08295
MAYO 4420 0.93783 **
JUNIO 5370 1.21493
JULIO 5649 1.05195
AGOSTO 6320 1.11878
** Indica una tasa de crecimiento negativa, en efecto las ventas han disminuido de un mes
al otro.
42

5
1.08295 x0.93783 x1.21493 x1.05195 x1.11878
1.0775
Tasa crec. prom : (1.0775 1)100 7.75%
Entonces el Gerente no abrira la sucursal.

2. Supngase que se cuenta con la informacin diaria de los incrementos porcentuales de


las acciones de una minera cotizada en la Bolsa de Valores de Lima segn la siguiente
tabla:
Crecimiento
Mes porcentual (%)
enero 10%
febrero 20%
marzo 30%

Determine la tasa promedio de crecimiento en el precio de las acciones de dicha


minera.

a) Calcular los factores de crecimiento.


FC = 1 + %

Mes Crecimiento porcentual (%) FC


enero 10% 1+10%=1.1
febrero 20% 1+20%=1.2
marzo 30% 1+30%=1.3

XG=
3
1.10 *1.20 *1.30 = 1.1647

Tasa crec. prom : (1.1657 1)100 16.57%


3. Las ventas de una empresa durante los ltimos cuatro aos han mostrado el siguiente
comportamiento. En el ao 2004 se observ un incremento del 100% respecto del ao
anterior, en los aos 2004 y 2005 las ventas en centenas de miles de nuevos soles
fueron 4 y 8 respectivamente, y en el ao 2006 hubo una disminucin del 25%
respecto del ao anterior. Halle la tasa promedio de crecimiento anual de las ventas de
la empresa durante el perodo 2003 al 2006. Si la tasa se mantiene constante. Qu
ventas se esperaran en el ao 2009?

Ao Ventas F.C.
2003 2 -----
2004 4 2
2005 8 2
2006 6 0.75

X G 3 2 x 2 x0.75 1.4422 44.22%


VENTAS 2009 6 x 1.4422 3 18 miles de n.s.
43

4. El nmero de intentos de fraude en todos los cajeros del BCP en el mes de Diciembre
del 2006, fue de 165. Calcule e interprete la tasa promedio de crecimiento mensual del
nmero de intentos de fraude, en el perodo de Junio a Diciembre del 2006, si en el
mes de junio del mismo ao se registraron 148 intentos de fraude.
Se emplear la media geomtrica.
165
X G 6 1.018
148

%promedio = (1.018 1)*100%

%promedio = 1.8%

5- La Poblacin de una ciudad en 1994 era de 2 700 000 habitantes y el 2004 alcanz a
24 000 000 habitantes, suponiendo una tasa de crecimiento constante, calcular:
a) El factor de crecimiento promedio anual
b) La tasa de crecimiento promedio anual.
c) La Poblacin para el 2010.

Solucin:

En este ejercicio se busca la tasa de crecimiento promedio en habitantes de esta


ciudad, desde 1994 hasta el 2004.
24000000
Factor de crecimiento promedio anual: X G 10 1.244
2700000

Tasa de crecimiento promedio anual : (1.244-1) x 100 = 24.4 %

Poblacin para el 2010: (usando la frmula de inters compuesto)

P2010 P2004 (1 0.244)6 24 000 000 (1.244)6 8 8 947 454 habi tan tes

5. Estime e interprete el nmero de intentos de fraude para el mes de Setiembre del 2007.
Asuma que la tasa promedio de crecimiento mensual, permanece constante.
Nro prom.Set.2007 165 x(1 1.8%) 9 193.74 int .

NOTAS:

a) Una tasa de crecimiento puede ser negativa, pero los factores decrecimiento
siempre son positivos.
Ej: Las ventas de Enero son 30 mil dlares y las de Febrero son 15 mil dlares, la
tasa de crecimiento es -50 %, pero el factor de crecimiento es : 15/30=0.5 (factores
de crecimiento menores a 1, indican tasa de crecimiento negativa.

b) Hay un factor de crecimiento equivalente para cada tasa de crecimiento .


c) Se puede transformar una tasa en su factor de crecimiento equivalente y viceversa.

De F.C. a T.C.: Restar 1 y multiplicar por 100

De T.C. a F.C. Dividir entre 100 y sumar 1


44

3.2.2 Mediana
La mediana es el valor del dato que ocupa la posicin central una vez que todo el
conjunto de valores se encuentra ordenado de forma ascendente. Con un nmero impar
de datos siempre es posible encontrar un valor que ocupa la posicin central. Cuando el
nmero de datos es par existen dos valores ocupando las posiciones centrales.

a) Datos no agrupados

Como primer paso, los datos deben ser ordenados en orden creciente decreciente,
luego se bebe determinar el valor que se ubica en la posicin central. En caso de no
coincidir el valor central con un dato, se tomar el promedio de los datos centrales. Si
denotamos las observaciones ordenadas por x[1], x[2], x[3], ... , x[n], entonces:

Para un nmero impar de datos, la mediana es el valor que ocupa la posicin


central.

me x n 1 Si n es impar, la mediana es el dato que ocupa la posicin



2
[(n+1)/2]

Para un nmero par de datos, la mediana es el promedio de los dos valores que
ocupan las posiciones centrales.

1
me x n x n Si n es par, la mediana es el promedio de los datos que se
2 2 2 1

encuentran en las posiciones [n/2] y [(n/2)+1]

Ejemplo 3.7: La tabla Sgte. muestra el ao de nacimiento de un grupo de 12 clientes de


Interbank. Calcule la mediana de dichas edades.
92 88 95 76 80 82 89 92 93 95 83 82
Solucin

Primero ordenar los datos

76 80 82 82 83 88 89 92 92 93 95 95

El total de observaciones es 12 (nmero par)

El 50% de los clientes tiene ao de nacimiento mayor a 1988,5 y el otro 50% es menor
1988,5.
45

Ejemplo 3.8: Si la muestra del ejemplo 3.7 hubiese sido la siguiente:


92 88 95 76 82 89 93 95 83
Cul sera la mediana?
Solucin
Primero se ordena los datos
76 82 83 88 89 92 93 95 95
El total de observaciones es 9 (nmero impar)
me x 91 = x5= 89 = 1989.
2

El 50% de los clientes tiene ao de nacimiento mayor a 1989 y el otro 50% es menor a
1989.
b) Para datos tabulados en tablas de frecuencia por intervalos

1er mtodo: Interpolacin. Se desarrollar en clase.

2do mtodo: Frmula:


1. Calcule n / 2
2. Baje por la columna Fi, buscando el valor que iguale o exceda a ( n / 2) , una vez
que encontremos un valor con esas caractersticas hay que marcar el intervalo que
se encuentra en esa fila, se le llamar clase mediana, porque la mediana
pertenece a ese intervalo.
1
3. Use la frmula: c ( n Fi 1 )
Me Li 2
f i

Donde: L i = Lmite inferior de la clase mediana

n= Nmero de datos

Fi-1 = Frecuencia absoluta acumulada de la clase pre-mediana

fi = Frecuencia absoluta de la clase mediana.

c= Ancho de clase.

Ejercicio: Calcular la mediana de:


n 36 EDAD fi hi pi Fi Pi
18 [ 5-10> 3 0.083333 8% 3 8%
2 2
Bajando por la columna Fi , nos det enemos en 25 , [10-15> 7 0.194444 19% 10 28%
pues 25 es mayor a 18. [15-20> 15 0.416667 42% 25 69%
La clase mediana es : [15 20 [20-25> 9 0.25 25% 34 94%
18 10 [25-30> 2 0.055556 6% 36 100%
Me 15 5 17.67 aos
15

Propiedades de la mediana
1. Divide a un conjunto de observaciones de dos partes iguales. El 50% con valores
mayores a la mediana y el otro 50% con valores menores a la mediana.
2. La mediana no se ve afectada por valores extremos.
46

3.2.3 Moda
Una tercera medida de tendencia central es la moda y se define como el valor del dato
que se repite o presenta con mayor frecuencia.
a) Para datos no agrupados:

Ubicar el valor que se repite ms (pueden darse empates)

Determine la moda en:

1) 4, 7, 6, 6, 9, 8, 10, 15, 6, 7
Mo = 6

2) 8, 4, 7, 8, 4, 6, 9, 8, 6, 10, 15, 4, 8, 6, 4, 8, 9, 3
Mo= 8 (se repite cinco veces)

3) 2, 3, 10, 10, 1, 3, 15, 5


Dos modas, 3 y 10 (Distribucin bimodal)

4) 4, 7, 6, 4, 6, 7, 7, 6, 4
Tres modas, 4, 6 y 7 (Todos se repiten tres veces, distribucin multimodal)

b) Para datos agrupados en tablas de frecuencia por intervalos

1. Halle la CLASE MODAL (Busque el intervalo con la mayor frecuencia absoluta).


2. Use la frmula:
d1
Mo Li c ( ) d1 f i f i 1 ; d 2 f i f i 1
d1 d 2

Donde: L i = Lmite inferior de la clase modal

d1= Exceso de la frecuencia modal sobre la frecuencia de la clase pre-modal.

d2= Exceso de la frecuencia modal sobre la frecuencia de la clase post-modal.

Ejercicio: EDAD fi

Calcular la moda en: [3-5> 7


[5-7> 3
La frecuencia mxima es 15, por lo tan to la clase mod al
es [7 9 [7-9> 15
Mo 7 2 12128 8.2 aos [9-11> 7
[11-13< 5

Propiedades de la moda
1. No se ve afectada por valores extremos.
2. Se aplica tanto a informacin de variable cuantitativa como a cualitativa.
3. Es una medida inestable puesto que cambia de valor de una muestra a otra.
47

Ejemplo:

1. Las notas de prctica del aula A de Matemticas son:


Unidad de hoja: 0.1
Determine:
a) La nota promedio, mediana y modal del aula A. Tallo Hoja
9 10 x 4 11x5 12 x 4 13 x3 15 x3 16 1 9 0
X 12 puntos
21 5 10 0000
Me X 211 X 11 12 puntos 10 11 00000
2 (4) 12 0000
Mo 11 puntos 7 13 000
4 15 000
b) Si el profesor agregara 2 puntos a cada estudiante del saln 1 16 0
A: Cul sera la nueva nota promedio, mediana y modal del aula A?.
nueva X 12 2 14 puntos
nueva Me 14 puntos
nueva Mo 13 puntos
2.- En la ciudad de AREQUIPA las utilidades de las cajas rurales durante cuatro meses es
segn el siguiente cuadro parcialmente publicado:
CRECIMIENTO
MES UTILIDAD
PORCENTUAL
SETIEMBRE $30000 3.80%
OCTUBRE .... 5.30%
NOVIEMBRE .... 6.90%
DICIEMBRE .... 12.30%

a) Determine el nivel de utilidad para los meses que no aparece registrada.


b) Cul es el nivel de utilidad promedio? Interprete su resultado.
c) Halle e interprete el significado del factor de crecimiento en el mes de Diciembre.
d) Halle la tasa promedio de crecimiento interprete su resultado.
Cul ser el nivel de utilidad para Marzo del ao siguiente?.

3.- Un informe en 2013 deca lo siguiente: En lo que va del ao pudo observarse la trayectoria
de la produccin agropecuaria (PBI agropecuario) peruana encontrndose que los
resultados de su evolucin se deben principalmente a factores como el fenmeno del
nio, la escasez de crdito y las plagas, todo ello ocasion la disminucin de la
produccin en dicho sector. Los datos muestran lo siguiente:

MES ENE FEB MAR ABR MAY JUN JUL


Tasa de 8% 1.2% -1.5% -7.7% -12.5% -11.6% -11.9%
Crecimiento
48

a) Interprete la Tasa de Crecimiento (TC) de los meses de Febrero y de Marzo.


b) Indique la variable y su tipo.
c) Cul ser el promedio de crecimiento del PBI agropecuario durante los siete
meses presentados en el informe?
d) Supongamos que en enero del 2009 el PBI agropecuario fue de 800 millones de
soles. Si el promedio de crecimiento del PBI agropecuario permanece constante.
Cul ser el PBI agropecuario que se registrar en Agosto del 2009?

4.- El INSTITUTO NACIONAL DE ESTADSTICA E INFORMTICA muestra en su pgina


web (www.inei.gob.pe) las utilidades (en millones de dlares) de las financieras
instaladas en los ltimos aos:
AO 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
PRODUCC 1141,6 1203,2 1459,8 1548,8 1955 1885,7 2040,9 2118,6 2139,1 1816,6
a) Determine e interprete la tasa promedio de crecimiento de las utilidades para los
aos considerados.
b) Indique la variable y su tipo.
c) Asumiendo que la tasa promedio de crecimiento se mantiene constante, determine
la utilidad que se espera para el ao 2017.

5.- El gerente DINERS CLUB DEL PER ha determinado que el nivel de colocaciones de las
tarjetas de crdito DINERS CLUB MILES han tenido las siguientes tasas de crecimiento,
durante el ao 2013: en Agosto con respecto a Julio 12%, en Septiembre con respecto a
Agosto 14%, en Octubre con respecto a Septiembre 18%, en Noviembre con respecto a
Octubre 22% y en Diciembre con respecto a Noviembre 26%.
a) Cul es la tasa promedio de crecimiento de las colocaciones de esta compaa?.
b) Si en el mes de Julio se colocaron 1000 tarjetas y suponiendo que la tasa promedio
calculada se mantiene, Cul ser el nivel de colocaciones para abril del prximo
ao?.
c) Indique la variable y su tipo.
6.- En una empresa productora de cosmticos EBEL se tiene una mquina Inyectora que ha
tenido baja produccin desde que fue adquirida,. El Gerente recibi del Jefe de
Mantenimiento la promesa de que durante el ao 2010 se incrementara la produccin
por lo menos en un 5% mensual, al mes de Septiembre, l desea saber si se ha cumplido
con lo ofrecido, para ello ha solicitado las producciones de los primeros 6 meses del
2010.
Mes Enero Febrero Marzo Abril Mayo Junio
Produccin (Ton) 7 8.2 8.6 9.2 8.3 9.5

Se ha cumplido la promesa del Jefe de Mantenimiento? Indique la variable y su tipo.

7.- La empresa DAEWOO lleva un registro del kilometraje de todos sus vehculos. A
continuacin presentamos registros del kilometraje semanal:

810 450 756 789 210 657 589 488 876 689
1 450 560 469 890 987 559 788 943 447 775

a) Calcule la mediana del kilometraje que recorre un camin.


49

b) Calcule la media para el kilometraje de los 20 camiones.


c) Identifique las medidas de curtosis y de asimetra. Interprete.
d) Indique la variable y su tipo.

8.- La gerencia del hotel LOS DELFINES ha dispuesto efectuar un mayor control sobre el
tiempo de las llamadas internacionales que utiliza el personal del rea de promocin; por
tal motivo, el gerente solicita la informacin sobre los tiempos utilizados durante las
ltimas 50 llamadas internacionales que realiz el personal de promocin.

Determine el tiempo promedio, moda y mediana de las llamadas realizadas. Estos


tiempos tienen la distribucin siguiente:

Nmero de llamadas internacionales segn el tiempo utilizado

Tiempo en minutos Nmero de llamadas


De 1 a menos de 3 2
De 3 a menos de 5 13
De 5 a menos de 7 24
De 7 a menos de 9 7
De 9 a 11 4
Respuestas: 5.92, 5.79, 5.83

9.- Las remuneraciones de los empleados de las tiendas EWONG y METRO que pertenecen
a la empresa CENCOSUD se presentan en las tablas de frecuencia siguientes:
Tiendas EWONG Tiendas METRO
Sueldo Nmero Sueldo (soles) Nmero
(soles) Empleados Empleados
400-800 60 500-1000 10
800-1200 35 1000-1500 30
1200-1600 5 1500-2000 10
Total 100 Total 50

a) Determine el sueldo promedio de los empleados en la empresa CENCOSUD.


b) Se acuerda aumentar los sueldos del hotel EWONG un 5% ms una gratificacin de
S/ 100, para el hotel METRO, acord en aumento de 10%. Determine los nuevos
sueldos promedios para cada hotel
c) Determine los nuevo sueldos promedio de los empleados en la empresa CENCOSUD
luego de los aumentos.
d) Determine los sueldos medianos luego de los aumentos.

10.- Un examen de aptitud acadmica de la PUCP (con una puntuacin de 0 a 100) fue
rendido por 3 secciones A, B y C, los promedios fueron 52, 75 y 90 respectivamente.
Posteriormente se decidi incrementar la nota a los alumnos de la seccin A en un 5%,
otorgar 5 puntos adicionales a los alumnos de la seccin B, y a los de la seccin C no
modificarles la nota. Determine el promedio de notas de todos los alumnos luego de las
modificaciones si se sabe que el nmero de alumnos en las secciones A, B y C fue 30,
40 y 45 respectivamente.

11.- La agencia de viajes de PROMPER compr la primera semana del mes de Abril 40
pasajes areos Lima- Bogot a $ 60 cada pasaje, la segunda semana 10 pasajes
areos Lima- Caracas a $ 62 cada pasaje, la tercera semana 10 pasajes Lima
Santiago a $ 65 y la cuarta semana compr 5 pasajes Lima Montevideo a $ 61.
Cul es el precio promedio que se pag por estos pasajes areos?.
50

12.- Complete:
a. Si un encuestador pregunta por los sueldos de un grupo de personas y estos le
responden: 3800, 900, 3200, 3400, 760, 3900, 10000,3850 y 15000 nuevos soles;
entonces el promedio que mejor representara a estos nmeros es:

b. La media que se utiliza cuando se quiere determinar el incremento o disminucin
promedio porcentual en casos de inflacin, ventas mensuales o anuales, tasas de
mortalidad o natalidad, etc. es:..

13.- En el distrito SAN MARCOS en Cajamarca hay 13 hoteles cuyo nmero de habitaciones
es:
10 11 11 12 12 13 13 13 14 15 17 18 20
a) Halle el nmero de habitaciones promedio, mediano, modal .

14.- En la siguiente tabla se recoge el nmero de transacciones que los clientes hacen en un
banco SCOTIABANK durante el ao 2013. N de transaciones N de personas
hechas en el banco
a) Cuntas personas han hecho 7
transacciones en el ltimo ao?Cuntas han 1 10
hecho 4 transacciones? 3 25
b) Qu porcentaje de personas ha hecho ms 5 43
de 6 transacciones? 7 31
c) Calcular la moda y el nmero medio de
10 12
transacciones hechas en el ao.
d) Dibujar un diagrama correspondiente. 12 4

15.- El nmero de clientes de CONEYPARK durante el mes de Enero se muestran en la


siguiente tabla:
Nro clientes 190 200 210 220 230 240
Nmero de das 7 9 6 4 3 2
a. Cuntos das hubo por encima de 210? Cuntos por debajo de 230?Cuntos das
hubo la cantidad mxima?
b. Calcula la media, la moda y la mediana.

16. Parece ser que una mquina automtica que llena recipientes, est trabajando de
manera errtica. Una verificacin de los pesos del contenido de un cierto nmero de
latas revel lo siguiente:
Peso (gr) 130-140 140-150 150-160 160-170 170-180 180-190 190-200 200-210
Nmero de latas 2 8 20 15 9 7 3 2
a. Estime la media aritmtica del peso del contenido de una lata e interprete.
b. Encuentre la mediana y moda e interprete el resultado.

17. Los ahorros en 2 bancos: BCP y Scotiabank estn distribudos de la Sgte. manera:
BCP Scotiabank
Nota Nmero alumnos Nota Nmero alumnos
500-1000 4 400-450 8
1000-1500 16 450-500 10
1500-2000 5 500-550 16
Total 25 550-600 6
Total 40
Determine el monto promedio ahorrado.
51

20. El hotel SHERATON compr la primera semana del mes de Abril 40 pasajes areos Lima-
Chiclayo a $ 60 cada pasaje, la segunda semana 10 pasajes areos Lima- Chiclayo a $
62 cada pasaje, la tercera semana 10 pasajes a $ 65 y la cuarta semana compr 5
pasajes a $ 61.
Cul es el precio promedio que se pag por estos pasajes areos?. Rpta. $ 61.1538

Ejemplo 3.9: Considerar el problema 5 del Captulo 2. El jefe del rea de sistemas de
una empresa realiz un estudio para analizar el tiempo que demoran los empleados en
detectar y resolver un problema informtico de software o hardware. El estudio trata de
estudiar las diferencias de tiempos en los turnos de trabajo A y B de una empresa. La
hoja Tiempo muestra los datos obtenidos para una muestra de 40 problemas
informticos presentados en el turno A y 100 problemas informticos presentados en el
turno B.

El conjunto de valores para el turno A y B corresponde a un conjunto de datos no


agrupado, en este caso la media mediana y moda se pueden obtener con Excel.

Utilizando la opcin de Anlisis de datos del men Datos seleccionamos Estadstica


descriptiva.
Hoja de problemas:

https://docs.google.com/file/d/0B5yYjHMGRyCCc2pqYnRTUDJwQk0

Herramientas del Excel para anlisis estadstico


La Herramienta de anlisis estadstico es un programa de complemento de Excel que est
disponible al instalar Excel., para usarlo es necesario cargarlo primero.

Si el comando Anlisis de datos no est disponible, deber cargar el programa de complemento

Herramientas para anlisis

En Excel ir a Opciones

Dentro de opciones ir a Complemento y buscar Herramienta para anlisis


52

Haga clic en Ir

Marcar con un check Herramientas


para anlisis y luego haga clic en
Aceptar

Ahora ya se activ Anlisis de datos en Datos


53

Ejemplo 3.10: Considerar el problema 2 del Captulo 2. El tiempo de inactividad es la


cantidad del tiempo en el que un sistema de computadora no opera debido a una falla de
hardware y software. Cuando el sistema se encuentra inactivo durante ms de una hora
todos los archivos de trabajo actuales se pierden. Los datos agrupados en la hoja
Inactividad corresponden a los tiempos de inactividad (en minutos) registrados en una
muestra de 30 turno maana.

https://docs.google.com/file/d/0B5yYjHMGRyCCc2pqYnRTUDJwQk0

Tiempo de Marca de Turno maana


i inactividad clase f h F H
1 20,5 25,5 23 1 0,0333 1 0,0333
2 25,5 30,5 28 3 0,1000 4 0,1333
3 30,5 35,5 33 0 0,0000 4 0,1333
4 35,5 40,5 38 2 0,0667 6 0,2000
5 40,5 45,5 43 20 0,6667 26 0,8667
6 45,5 50,5 48 4 0,1333 30 1,0000
30

3.2.4 Cuantiles

Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5
coincide con la mediana.
54

Percentiles
Los percentiles representan los valores de la variable que estn por debajo de un
porcentaje, el cual puede ser un valor de 1% a 100% (en otras palabras, el total de los
datos es divido en 100 partes iguales).

La notacin empleada ser: Pk

Donde k es equivalente al porcentaje de datos acumulados y Pk es el valor de la variable


que representa dicho porcentaje. Por ejemplo, P8 es el valor de la variable que deja por
debajo el 8% de los datos. P55 ser entonces el valor que agrupa el 55% de los datos

CUARTIL PERCENTIL DECIL


P10 D1
P20 D2
Q1 P25
P30 D3
P40 D4
Q2 P50 D5 Me
P60 D6
P70 D7
Q3 P75
P80 D8
P90 D9

PROCEDIMIENTO PARA CALCULO DE CUANTILAS PARA


DATOS NO AGRUPADOS.
1. Ordenar los datos en forma ascendente.

2. Hallar la posicin de la cuantila buscada con :

Posicin Percentil j-simo: j ( n 1)


100
Posicin Decil j-simo: j ( n 1)
10
Posicin Cuartil j-simo: j ( n 1)
4
j es el decil, cuartil percentil buscado. Ej: para P10 , j=10
55

3. Ubicar la cuantila buscada en la posicin hallada, si sta es un nmero entero o si no lo es


calcularla en forma proporcional con la frmula:

Li parte decimal x ( Ld Li )
Ejercicio:
Dado el siguiente conjunto de datos, calcular los tres cuartiles:

LUGAR 1 2 3 4 5
DATO 2 4 13 15 19

Q1 X 1( 51) X 1.5 2 0.5(4 2) 3


4

Q2 X 2 ( 51) X 3 13
4

Q3 X 3( 51) X 4.5 15 0.5(19 15) 17


4
Interpretacin: 17 es el valor de la variable mayor al 75% de los otros valores.

Ejercicio:
Dados los siguientes datos, calcular: D2, D9, P50, P80

LUGAR 1 2 3 4 5 6 7 8 9 10 11 12
DATO 0 3 3 4 4 8 9 10 10 15 18 20

D2 X 2 (12 1) X 2.6 3 0.6(3 3) 3


10

D9 X 9 (12 1) X 11.7 18 0.7( 20 18) 19.4


10

P50 X 50 (12 1) X 6.5 8 0.5(9 8) 8.5


100

P80 X 80 (12 1) X 10.4 15 0.4(18 15) 16.2


100

PROCEDIMIENTO PARA CLCULO DE CUANTILAS PARA DATOS


AGRUPADOS.
1. Para datos agrupados se recomienda interpolar con las frecuencias porcentuales
acumuladas Fi.

PROBLEMAS.-

1 Hallar el cuartil que limita el 75% superior


2 Determine el percentil que limita el 20% superior
3 Determine el percentil que limita el 30% inferior
4 Determine el percentil que limita el 10% superior
56

5 Hallar el cuartil que limita el 75% superior


6 Hallar el decil que limita el 20% inferior
7 Hallar el cuartil que limita el 75% inferior
8 Determine el decil que limita el 20% superior
9 Hallar el decil que limita el 80% inferior
10 Hallar el cuartil que limita el 75% inferior
11 Determine el percentil que limita el 5% superior
12 Hallar el percentil que limita al tercio superior.
13 Hallar el percentil que limita al quinto superior.

2. Las notas de prctica del aula A de Matemticas son: Tallo Hoja


Determine:
1 9 0
a) A partir de qu nota est el tercio superior (alumnos con las 5 10 0000
notas mayores) del aula A?. 10 11 00000
(4) 12 0000
Asumamos que el tercio SUPERIOR equivale 7 13 000
al 33 % de los mayores valores 4 15 000
1 16 0
por ello buscaremos el P67
P67 X 67 ( 211) X 14.74 12 0.74 (13 12) 12.74 puntos
100

3.- Se tiene los resultados de los estadsticos descriptivos en el software Minitab de los
costos en dlares de un cierto producto fabricado por tres tecnologas diferentes A, B y C

Descriptive Statistics: CostoA, CostoB, CostoC


Variable Count Mean Q1 Median Q3
CostoA 8 1638 1208 1380 2208
CostoB 13 1264 1025 1250 1510
CostoC 10 1300 1180 1265 1395
a) Cul es la tecnologa que tiene el mayor costo en el mnimo del 25% de los
mayores costos?. Cul es el valor de ese costo?
b) Cul es la tecnologa que tiene el mayor costo en el mximo del 25% de los
menores costos?. Cul es el valor de ese costo?
4.- La siguiente tabla refleja la cantidad de TARJETAS DE CRDITO en un grupo de 30
personas:
Nro de tarjetas de crdito 2 4 5 6 7 8 9 10
N personas 2 5 8 7 2 3 2 1
a. Indique la variable.
b. Indique las medidas de tendencia central.
c. Halle y explique el P30 , Q1 y D4.

5.- La tabla de frecuencias correspondiente a los hoteles del distrito San Isidro clasificados
segn el nmero de sus empleados es la siguiente:
57

Nmero de hoteles del distrito San Isidro segn el nmero de empleados en Enero
2009
Nmero de empleados Nmero de hoteles
De 6 a menos de 8 4
De 8 a menos de 10 6
De 10 a menos de 12 25
De 12 a menos de 14 30
De 14 a menos de 16 23
De 16 a menos de 18 8
De 18 a 20 4
a) Determine el promedio, mediana y moda para el nmero de empleados por hotel
de la ciudad. Rpta: 13.04, 13, 12.83.
b) El municipio de la ciudad ha dispuesto que todos los hoteles que tengan un nmero
de empleados menor al primer cuartil no pagarn impuesto predial Cul es este
nmero de empleados?. Rpta: 11
c) El municipio de la ciudad ha dispuesto que todos los hoteles que tengan un nmero
de empleados mayor al octavo decil pagar el impuesto selectivo Cul es este
nmero de empleados?. Rpta: 15.3

6.- El histograma adjunto muestra la distribucin del tiempo que demoran 32 personas para
leer el diario PUBLMETRO.
a) Calcule e interprete la media, mediana y moda
b) Encuentre cual es el tiempo mximo para pertenecer al 30% de los lectores ms
rpidos

7.- Los ahorros en 2 bancos: BCP y Scotiabank estn distribudos de la Sgte. manera:
BCP Scotiabank
Nota Nmero alumnos Nota Nmero alumnos
500-1000 4 400-450 8
1000-1500 16 450-500 10
1500-2000 5 500-550 16
Total 25 550-600 6
Total 40
a) Qu monto limita el 20% superior de los ahorros en los 2 bancos?
b) Qu monto limita el 10% inferior de los ahorros en los 2 bancos?
c) Qu monto limita el 50% central de los ahorros en los 2 bancos?
58

8.- La gerencia del restaurante ASTRID Y GASTN desea implementar acciones que
motiven a sus clientes a aumentar el monto de sus consumos los fines de semana, por tal
motivo desea analizar el monto de las 50 facturas (en Soles) correspondientes a los
consumos realizados en el ltimo fin de semana, estos son:

121 130 138 140 141 201 251 388 401 410
414 417 451 459 476 479 484 486 510 518
518 549 571 575 576 648 655 676 679 702
710 749 749 750 755 760 770 800 910 925
990 1000 1020 1050 1075 1080 1085 1085 1090 1105

a) Hallar el monto de consumo que limita al 20% superior de los consumos.


b) Hallar el monto de consumo que limita al 25% inferior de los consumos.

9.- El gerente del hotel MARRIOTT desea llevar un mayor control sobre el tiempo de las
llamadas internacionales que realiza su personal de promocin. Preliminarmente se
plantea la idea que estas llamadas deben tener un lmite de 10 minutos. Para examinar
ms esta idea la gerencia solicita le alcancen la relacin de tiempos utilizados por las 50
llamadas internacionales realizadas por el hotel durante el mes de Febrero 2010 El listado
de estos tiempos (en minutos) usados por cada llamada es:

1 1 1 1.2 1.5 2.1 2.1 2.2 3.1 3.1


3.2 3.2 3.3 4 4 4 4 4 4 4.1
4.5 4.5 5 5.1 5.1 5.1 5.1 5.2 5.4 6
6 6.1 6.1 6.2 6.2 6.4 6.5 7 7.1 7.1
8 8.5 9 9 10 11 12 12.1 14.2 16

a) Cul es el tiempo que comprende al 20% de las llamadas que duraron ms?
b) Cul es el tiempo que comprende al 50% de las llamadas que duraron menos?
10.- A continuacin se presenta el histograma de las calificaciones obtenidas por un grupo
de estudiantes del curso de ingles del instituto de idiomas BRITNICO:

Histograma de calificaciones
7
7

6
6
Numero de estudiantes

5
5

4
4

3
3

0
68.0 73.4 78.8 84.2 89.6 95.0
Calificaciones obtenidas

a) Si el 5% de los estudiantes con las mayores calificaciones recibirn una beca. Cul es
la calificacin mnima para estar considerado dentro de este grupo?

b) Si el 20% de los estudiantes con las menores calificaciones sern eliminados. Cul
es la calificacin mxima para estar considerado dentro de este grupo?
59

EN EXCEL:
Ejemplo 3.11: Calcular el percentil 20 en el conjunto de datos no agrupados
del Ejemplo 3.7. La tabla Sgte. muestra el ao de nacimiento de un grupo de 12 clientes
de Interbank.
92 88 95 76 80 82 89 92 93 95 83 82

P20 =82 haciendo uso del EXCEL = PERCENTIL.INC(rango,0.2)


Aproximadamente el 20% de llos aos de nacimiento es menor a 1982 y el 80%
fueron mayores a 1982.

Cul es el valor mnimo para estar considerado dentro del 30% superior de los aos de
nacimiento?

P70 = 92 haciendo uso del EXCEL = PERCENTIL.INC(rango, 0.7)


El valor mnimo para estar considerado dentro el 30% superior del ao de
nacimiento es 1992.

RELACIN ENTRE MEDIA, MEDIANA Y MODA MEDIDAS DE


ASIMETRA

(COEFICIENTE DE ASIMETRA DE PEARSON)

3( Me )
Paramtrico : As

3(x me )
Muestral : as
s

La relacin entre estas medidas depende de la asimetra de los datos.


Si la distribucin es simtrica las tres coinciden.
Si la distribucin es asimtrica:

cola a la derecha: Mo Me X As > 0

cola a la izquierda: X Me Mo As < 0

cola a la izquierda: As < 0

As < 0 As = 0 As > 0
60

Distribucin simtrica: Me Mo
Distribucin asimtrica positiva o a la derecha: Me Mo
Distribucin asimtrica negativa o a la izquierda: Me Mo

CURTOSIS ( O GRADO DE APUNTALAMIENTO)

Ku > 0.263 Ku= 0.263 Ku< 0.263

Para medir la Curtosis se emplea el coeficiente de CURTOSIS:

P75 P25
KU
2( P90 P10 )
1. Los datos en la hoja Supermercados corresponden a los montos y el tipo de
pago (cheque, efectivo y tarjeta) realizados por una muestra de clientes de una
cadena de supermercados. Los directivos de esta empresa pidieron tomar la
muestra para conocer el comportamiento de los pagos de sus clientes.
a. Construya en un mismo grfico los diagramas de cajas para los montos
segn el tipo de pago indicando la presencia de datos atpicos en la muestra.
Rpta. Cheque: Dos valores atpicos 5 y 95; Efectivo: No hay valores
atpicos; Tarjeta: Un valor atpico 94,36
b. Determinar el tipo de simetra que presentan los montos segn el tipo de
pago segn lo observado en el grfico anterior.
Rpta. Cheque: Asimtrica positiva; Efectivo: Asimtrica positiva; Tarjeta:
Asimtrica Negativa
c. Obtenga las medidas de tendencia central y de dispersin para los montos
pagados en cheque, efectivo y tarjeta e intrprete.
61

Cheque Efectivo Tarjeta

Media 43.38 Media 8.84 Media 43.18


Error tpico 2.63 Error 0.86 Error 4.00
Mediana 41.34 tpico
Mediana 7.41 tpico
Mediana 46.19
Moda No Moda No existe Moda No existe
Desv.est. existe
16.62 Desv.est. 5.28 Desv.est. 18.75
Varianza 276.06 Varianza 27.88 Varianza 351.50

CV = 38.3% 59.7% 43.4%

3.4 Diagrama de Cajas


Un diagrama de cajas es un resumen grfico de los datos con base en el resumen de
cinco nmeros: el valor mnimo, el primer cuartil, la mediana, el tercer cuartil y el
valor mximo. Los pasos para elaborar un diagrama de cajas son los siguientes:

1. Se dibuja una caja rectngulo cuyos extremos se localicen en el primer y tercer


cuartil. Esta caja contiene el 50% central de los datos.

2. En el punto donde se localiza la mediana se traza una lnea.

3. Usando el rango intercuartil se localizan los lmites. En un diagrama de cajas stos se


encuentran 1,5*RIC abajo del primer cuartil y 1,5*RIC arriba del tercer cuartil.

Lmite inferior: Q1 1,5 RIC Lmite superior: Q3 + 1,5 RIC

4. Un dato se considera atpico si es mayor que el lmite superior o si es menor al


lmite inferior.
Se marcan con asterisco (*) las localizaciones de los datos atpicos.

5. Si no existen valores atpicos, los bigotes van desde los extremos de la caja hasta los
valores menor y mayor dentro de los lmites calculados en el paso anterior.

Si existen valores atpicos, estos se ubican primero y luego los bigotes van desde los
extremos de la caja hasta los valores menor y mayor (excluyendo los valores atpicos).

El diagrama de cajas permite determinar, en forma grfica lo siguiente:

Comparar las medianas de dos conjuntos de datos.


Observar el tipo de distribucin de los datos (simetra o asimetra).
Determinar la dispersin del 50% central de los datos (tendencia central).
Identificar la presencia de valores extremos (datos atpicos).
62

Ejemplo 3.15:
El grfico de cajas para conjunto de datos del problema 4 del captulo 2 se
muestra a continuacin.
Los valores calculados para el grfico fueron

Operador 1 Operador 2 Operador 3


Valor Mnimo 5,60 0,10 6,16
Percentil 25 7,34 1,81 7,16
Percentil 50 7,81 4,71 8,09
Percentil 75 8,55 8,65 9,02
Valor Mximo 10,05 31,91 9,91

Operador 1 Operador 2 Operador 3


RIC 1,22 6,84 1,86
LI 5,515 - 8,456 4,37
LS 10,375 18,913 11,81

Para el caso del operador 2, el bigote inferior se extiende hasta el valor mnimo
mayor o igual al LI = -8,456 (para este caso el tiempo no puede ser negativo por lo
que se puede considerar como LI= 0 minutos). El bigote superior se extiende hasta
18.73 (ordenar de mayor a menor la base de datos y observar este registro) que es
el dato mximo menor o igual al LS = 18,913. Existe tres valores mayores a 18,913
estos son: 19,5 ; 24,7 ; 31,91. Estos tres datos con marcados como valores
extremos con los asteriscos. Para los operadores 1 y 3 los datos se encuentran
dentro del LI y LS.
63

3.3 Medidas de dispersin.- Miden el grado de separacin ,


dispersin o heterogeneidad de los datos entre s.

Rango
El rango o amplitud es la medida de dispersin ms elemental. Se define como la
diferencia entre el dato ms grande y el ms pequeo.

Rango poblacional: R = dato mximo dato mnimo


Rango muestral: r = dato mximo dato mnimo

Rango Intercuartlico (RIC)


Con frecuencia se dividen los datos en cuatro partes, cada una con aproximadamente el
25% de las observaciones. A los puntos de divisin se les denomina cuartiles y se
definen como:
Primer cuartil Q1 = P25
Segundo cuartil Q2 = P50
Tercer cuartil Q3 = P75

Una medida de dispersin que elimina la influencia de los valores extremos o atpicos
de los datos es el rango intercuartil (RIC). Esta medida se define como la diferencia
entre el tercer y primer cuartil. En otras palabras, el rango intercuartil mide la amplitud
en el 50% central de los datos

RIC = Q3 Q1

Ejemplo 3.12:Calcule el RIC en el conjunto de datos agrupados del Ejemplo 3.7.

P25 =82 haciendo uso del EXCEL = PERCENTIL.INC(rango,0.25)


P75 =92,25 haciendo uso del EXCEL = PERCENTIL.INC(rango,0.75)

RIC = Q3 Q1 = P75 P25 = 92,25 82 = 10,25


Varianza
La varianza es una medida de dispersin que emplea todos los datos. Se basa en la
diferencia entre cada dato y la media de los mismos, lo que se conoce como desviacin
respecto a la media. Para calcular la varianza las desviaciones respecto a la media se
elevan al cuadrado.
64

Datos no agrupados

Datos agrupados:

Ejemplo 3.13:Calcule la varianza de los datos del ejemplo 3.7. La tabla


Sgte. muestra el ao de nacimiento de un grupo de 12 clientes de Interbank. Determine
la varianza.
92 88 95 76 80 82 89 92 93 95 83 82

Haciendo uso del EXCEL = VAR.S(rango)


41,29 54 No tiene interpretacin

Ejemplo 3.14.- Los montos depositados de los 500 clientes VIP del Banco de Comercio se
encuentran ordenados en la Sgte tabla:

Jornal (S/.) xi fi Fi hi Hi Xi*fi Xi2*fi


[ 80 90 [ 0.10
[ 90 100[ 110 0.22
[100 110[ 120
[110 120[ 80
[120 130[ 70
[130 140[ 60 490
[140 150]

Halle la varianza.

Desviacin estndar
Las unidades al cuadrado asociadas con la varianza hacen difcil una interpretacin de
su valor numrico. La desviacin estndar se define como la raz cuadrada positiva de
la varianza y, por consiguiente, tiene las unidades originales de los datos.
65

Desviacin estndar poblacional: 2


Desviacin estndar muestral: s s 2

Coeficiente de variacin
El coeficiente de variacin es una medida relativa de variabilidad por que evala la
desviacin estndar en relacin con la media. Esta medida sirve para
comparar dispersin en conjuntos de datos aun cuando las unidades fuesen
diferentes.

Coeficiente de variacin poblacional: CV 100%

s
Coeficiente de variacin muestral: CV 100%
x

Coeficiente de Grado de variabilidad


variacin
0% < CV < 5% Datos muy homogneos
5% CV < 10% Datos homogneos
10% CV < 15% Datos regularmente homogneos
15% CV < 20% Datos regularmente heterogneos
20% CV < 25% Datos heterogneos
CV 25% Datos muy heterogneos

Ejemplo 3.14: Considerar el problema 5 del Captulo 2. El jefe del rea


de sistemas de una empresa realiz un estudio para analizar el tiempo que demoran
los empleados en detectar y resolver un problema informtico de software o hardware.
El estudio trata de estudiar las diferencias de tiempos en los turnos de trabajo A y B de
una empresa. La hoja Tiempo muestra los datos obtenidos para una muestra
de 40 problemas informticos presentados en el turno A y 100 problemas informticos
presentados en el turno B.
https://docs.google.com/file/d/0B5yYjHMGRyCCSHBmU0htSlVPOWc
66

Las medidas de dispersin para el conjunto de datos no agrupados tambin pueden


obtenerse con Excel, a excepcin del coeficiente de variacin que se obtiene a
partir de los resultados previos

Tiempo Turno A Tiempo Turno B

Media 14.957 Media 14.69804


Error tpico 0.05819506 Error tpico 0.0065148
Mediana 15.0025 Mediana 14.695
Moda 14.872 Moda 14.682
Desviacin estndar 0.3680579 Desviacin estndar 0.06514799
Varianza de la muestra 0.13546662 Varianza de la muestra 0.00424426
Curtosis 35.5173975 Curtosis -0.4749107
Coeficiente de asimetra -5.74874508 Coeficiente de asimetra 0.0909497
Rango 2.695 Rango 0.297
Mnimo 12.75 Mnimo 14.546
Mximo 15.445 Mximo 14.843
Suma 598.28 Suma 1469.804
Cuenta 40 Cuenta 100

Turno A

Rango muestral: r = 15,445 12,75 = 2,695 minutos


Varianza muestral: s2 = 0,135466 minutos2
Desviacin estndar: s = 0,36805 minutos

s 0,36805
El coeficiente de variacin es CV = x100 2,460 |
x 14,957
Turno B

Rango muestral: r = 14,843 14,546= 0,297 minutos


Varianza muestral: s2 = 0,004244 minutos2
Desviacin estndar: s = 0,06514 minutos

S 0,06514
El coeficiente de variacin es CV =
X 14,698 X 100 0,4431
67

a. Se puede afirmar que el sueldo es ms homogneo en los trabajadores de la planta B?


Rpta. EL sueldo es ms homogneo en la planta A. CVA = 26,4% y CVB = 35,6%

b. Los resultados anteriores son poblacionales o mustrales?


Rpta. Los resultados anteriores son poblacionales.

2. La central telefnica de una empresa desea conocer el gasto mensual en que incurre
debido a las llamadas que efectan sus empleados luego de las 6 p.m., hora en que
finalizan las labores. Para esto registra al azar y durante el mes de enero el
tiempo de duracin (en minutos) de las llamadas efectuadas entre las 6 p.m. y las
7 p.m. Los datos obtenidos, segn el tipo de telfono al que se llama, se encuentran
en la hoja Llamadas.
https://drive.google.com/file/d/0B5yYjHMGRyCCal9hQzViNzR4NnM/
a. Cul es la duracin mnima de una llamada hacia un telfono celular para
considerarla dentro del grupo del 15% de las llamadas que le ocasionan mayor
gasto a la empresa? Rpta. 10 minutos

b. Se puede afirmar que existe mayor homogeneidad en la duracin de las llamadas


realizadas hacia un telfono celular en comparacin a las realizadas hacia un
telfono fijo? Rpta. No, hay mayor homogeneidad en la duracin de
llamadas a telfono fijo. CVfijo = 22,5% y CVcelular = 28,6%

c. Use el diagrama de cajas para detectar la presencia de valores atpicos en la


duracin de las llamadas realizadas hacia un telfono celular.
Rpta. Existen 4 valores atpicos 1, 2, 12 y 12.

3. Una empresa ensambladora de productos electrnicos se encuentra evaluando la


duracin (en horas) de cierta marca de dispositivos electrnicos antes de utilizarlos.
Se realiz el seguimiento a una muestra de 80 unidades. Los resultados obtenidos se
encuentran en la hoja Duracin y se muestran a continuacin.
i Duracin (horas) f F
1 20 25 8
2 25 30 12
3 30 35 12
4 35 40 18
5 40 45 14
6 45 50 11
7 50 55 5
80
a. Calcule la media, varianza, desviacin estndar y coeficiente de variacin para la
duracin de los dispositivos electrnicos.
Rpta. Media = 36,4; Varianza = 74,05; Desviacin Estndar = 8,6 y C.V = 23,3%

4 .- Los siguientes datos corresponden a los tiempos (en minutos) empleados en


atender a los clientes en una agencia bancaria del BCP.

Tiempo (min) 0.5 1.5 1.5 2.5 2.5 3.5 3.5 4.5 4.5 5.5
Frec. Absoluta 6 9 12 9 6
68

a) Si en otra agencia bancaria B, el tiempo promedio de atencin es de 4 minutos


con una desviacin estndar de 0.5894 minutos. A qu agencia bancaria
preferira ir Ud.?
5. En el distrito SAN LUIS hay 13 hoteles cuyo nmero de habitaciones es:
10 11 11 12 12 13 13 13 14 15 17 18 20
Descriptive Statistics: habitaciones
Variable Mean StDev Variance CoefVar
Habitaciones 13.769 2.976 ------ ----------
a) Halle los tres cuartiles.
b) Complete la salida de Minitab.
6. El siguiente cuadro muestra la distribucin de la renta anual (en miles de soles) en
que incurren 50 viviendas:

Marca de Clase 18.85 21.55 24.25 26.95 29.65 32.35 35.05


N de Viviendas 3 2 7 7 12 10 9

a) Calcule el coeficiente de variabilidad.


b) Halle el 3er decil en el nivel de renta

7. El cuadro de pagos en dos fbricas para el mes pasado fue as:


FABRICA A FABRICA B
Salario medio 960 980
Desviacin estndar 26 28

a) Cul de los dos conjuntos de datos es ms homogneo?


b) Si en la fbrica A, a todos los trabajadores se les aumenta 200 soles.
Cul sera su nuevo coeficiente de variacin?
c) Si en la fbrica B, a todos los trabajadores se les incrementa su salario en 20%.
Cul sera su nuevo coeficiente de variacin?

8. Los sueldos de 50 empleados de una empresa se muestran a continuacin:

Sueldos (soles) 600-700 700-800 800-900 900-1000


Empleados 16 14 12 8
Adems, la desviacin estndar = s = 107.97

Se plantean dos alternativas de aumento: la primera, consiste en un aumento general


de 50 soles. La segunda consiste en un aumento general del 30% del sueldo ms
una bonificacin de 10 soles.
Cul de las dos propuestas conviene a los trabajadores

a) Si el inters es subir la media de los sueldos?


b) Si el inters es bajar la dispersin de los sueldos?
9. En una empresa el jornal diario de sus obreros tiene una media de $10 y una
desviacin estndar de $2. Si se hace un incremento de 20% a cada jornal con una
bonificacin adicional de $3, Se increment la variabilidad de los salarios?.
10. Los siguientes datos se refieren a la utilidad diaria (en soles) de tres tiendas
dedicadas a la venta de artculos de ferretera; esta informacin se tom durante los
ltimos diez das:
69

10 10 10

x 4000 ; x 1625000 x 6000


2
Tienda A: i i Tienda B: CV = 6.7%; i
i 1 i 1 i 1

Tienda C: Varianza = 2025; x 770


a) Cul de las tiendas tiene mejor nivel de ventas diarias? Justifique su respuesta.
b) Cul de las tiendas es ms estable en el nivel de ventas diarias?
11. Una mquina envasadora A ha llenado 500 botellas, otra mquina B llen 300 botellas y
otra mquina C llen 200 botellas. El peso promedio y la desviacin estndar de los
pesos de las botellas llenadas por A, B y C, respectivamente son las siguientes:
X A = 753 grs. X B = 758 grs. X C = 762 grs.
SA = 8 grs. SB = 12 grs. SC = 10 grs.
a) Indique usted qu mquina est mejor regulada.
b) Si dichas producciones se renen en un mismo lote, determine la media del lote.
12. En una empresa donde los salarios tienen una media de 100000 soles y una desviacin
estndar de 20000 soles el sindicato solicita que cada salario Xi se transforme en Yi,
mediante la siguiente relacin Yi=3,5Xi+10. Se pide calcular la media aritmtica y la
varianza de la nueva distribucin de salarios.
13. En una empresa, hay 15 empleados cuyo sueldo promedio es S/.1200 con una
desviacin estndar de S/.300. Los 30 obreros de esta misma empresa ganan en
promedio S/.900 con una desviacin estndar de S/.250. Mediante una negociacin los
obreros obtienen un aumento del 10% ms una bonificacin de S/.50, mientras que los
empleados obtienen un incremento de S/.120. Calcular el coeficiente de variacin de los
sueldos, en toda la empresa, luego de realizados los aumentos.

14. En una empresa el jornal diario de sus obreros tiene una media de $10 y una desviacin
estndar de $2. Si se hace un incremento de 20% a cada jornal con una bonificacin
adicional de $3, Se increment la variabilidad de los salarios?.
15. El siguiente reporte de Minitab muestra las estadsticas de resumen de los costos
unitarios de produccin de tres diferentes empresas A, B y C
Descriptive Statistics: CostoA, CostoB, CostoC
Total
VariableCount Mean StDev Variance CoefVar Q1 Media Q3
CostoA 27 21.360 2.661 7.082 12.46 19.710 21.330 22.275
CostoB 33 26.639 1.757 3.086 6.59 25.000 26.000 27.500
CostoC 20 13.530 1.556 2.421 11.50 13.000 14.000 14.400
a) Ordene estas empresas segn sus costos de la menos homognea a la ms
homognea.
b) En la empresa A, cual es el monto del cuarto superior de los costos unitarios de
produccin.

16. Un estudio de investigacin de mercado busca obtener algunos indicadores relacionados


a los hbitos de consumo de tres sectores representativos de la economa. Realizado el
estudio se obtuvo 3 muestras, una de cada sector, y se analiz los sueldos mensuales de
los entrevistados. En el informe publicado al respecto se mencionan los siguientes
resultados:
Sector Muestra Promedio ($) Coef. De Variacin
1 n1 = 300 620 0.3
2 n2 = 45 850 0.25
3 n3 = 25 1500 0.15
a) Cul de los tres sectores presenta mayor homogeneidad en los sueldos
mensuales?, explique el significado del coeficiente de variacin del sector 3.
70

b) Si en la muestra 1, del primer sector, los valores de la variable sueldo mensual, son
incrementados en 7.5% ms una bonificacin de $12. Determine e interprete el
coeficiente de variacin de los sueldos que se obtiene luego de realizadas las
modificaciones en este sector.
17. Si en la muestra 1 los valores de la variable, sueldo mensual, se incrementan en 10%
ms una bonificacin de $15, en la muestra 2 se disminuye en 5% y en la muestra 3
se aumenta en 10% y se hace un descuento de $20. Determine e interprete un solo
valor que represente el coeficiente de variacin que se obtiene luego de realizadas las
modificaciones.
18. En una empresa el jornal diario de sus obreros tiene una media de $10 y una
desviacin estndar de $2. Si se hace un incremento de 20% a cada jornal con una
bonificacin adicional de $3, Se increment la variabilidad de los salarios?.
19. La distribucin de los ingresos obtenidos diariamente por una entidad recaudadora en
un ao ha sido la que se muestra en la primera tabla. Al ao siguiente se introdujo una
modificacin en el sistema de tramitacin de los recibos, consistentes, bsicamente en
emitirlos y enviarlos a los clientes a lo largo del tiempo. La distribucin en el ao de la
modificacin es la que se muestra en la segunda tabla.
Tabla 1 Tabla2
Miles S/. N de das 295 295
recaudados fi X i 2 947937500 ; X i 517750
0 500 92 i 1 i 1
500 1000 26 n=295
1000 1500 25
1500 2000 19 a) Calcular el coeficiente de variacin de los
ingresos antes de la modificacin en el
2000 2500 15
sistema de tramitacin de los recibos.
2500 3000 35
b) Ha cambiado la variabilidad?
3000 - 3500 83

20. Dos empresas del mismo rubro, que cuentan con igual nmero de trabajadores en el
rea de produccin, estn interesadas en obtener algunas caractersticas numricas
de los sueldos de sus trabajadores. Para esto, cada una toma una muestra de igual
tamao y obtienen los siguientes resultados:
Empresa 1 Empresa 2
Sueldo promedio ( x ) 1500 1600
Desviacin estndar (s) 120 120

a) Cul de las dos empresas tiene los sueldos ms homogneos?... Justifique.


b) Si en la empresa 2, todos los trabajadores reciben un aumento del 10% de sus
sueldos ms una bonificacin de 40 soles. Cul es el nuevo coeficiente de variacin?
c) El gerente de la empresa 1 est interesado en disminuir la variabilidad de los sueldos;
por lo que, ha decidido aumentarles a todos los trabajadores la misma cantidad. Si
est quiere que el nuevo coeficiente de variacin sea igual a 5%. Cul debe ser el
aumento?

21.- La gerencia del hotel WESTIN ha dispuesto efectuar un mayor control sobre el tiempo
de las llamadas internacionales que utiliza el personal del rea de promocin; por tal
motivo, el gerente solicita la informacin sobre los tiempos utilizados durante las
ltimas 50 llamadas internacionales que realiz el personal de promocin. Estos
tiempos tienen la distribucin siguiente:
Nmero de llamadas internacionales segn el tiempo utilizado
71

Tiempo en minutos Numero de llamadas


De 1 a menos de 3 2
De 3 a menos de 5 13
De 5 a menos de 7 24
De 7 a menos de 9 7
De 9 a 11 4

a) Evale la desviacin estndar y coeficiente de variacin del tiempo utilizado por


estas llamadas. Respt: 1.8935, 0.3198.
b) Se amonestar a las llamadas cuya duracin sea mayor al cuartil superior, Cul es
este valor?. Cuntas llamadas recibiran esta amonestacin?. Rpta: 6.875, 12.5
c) Evale el grado de asimetra del tiempo utilizado por estas llamadas.
d) Evale el grado de Curtosis del tiempo utilizado por estas llamadas.
e) Haga un grfico de cajas para el tiempo utilizado para estas llamadas.
f) Si el gerente dispone que no se pagarn las llamadas cuyo tiempo haya excedido al
promedio ms una desviacin estndar Cuntas llamadas quedaran
afectadas?.Rpta: 8

22. Una sucursal bancaria del BCP emplea ocho trabajadores. Los aos de experiencia de
cada trabajador son: 1, 7, 9, 15, 9, 17, 15, 5.
a. Calcule la desviacin estndar y el coeficiente de variacin. Qu indica el coeficiente
de variacin?
b. Cmo cambia la desviacin estndar si al grupo de 8 trabajadores se incorpora otro
que tiene 8 aos de experiencia?

23. Una empresa tiene como trabajadores a 5 mujeres y a 10 hombres, a continuacin se


indican sus edades y sueldos (dlares):
Mujeres Hombres
Edad 28 23 25 23 24 20 25 24 30 22 30 30 27 28 30
Sueldo 3440 4500 3000 4080 4050 6000 4000 5000 3080 4100 3500 3800 4000 4000 3500

a) Halle el coeficiente de variacin de la distribucin de edades de las mujeres.


b) Halle el coeficiente de variacin de la distribucin de sueldos de los hombres.
c) Es la distribucin de sueldos de los trabajadores hombres ms homognea que la
distribucin de sueldos de las mujeres?
d) Es homognea la distribucin de edades de los trabajadores de la compaa?

24. La distribucin actual de ingresos de los 150 trabajadores de una empresa es tal que el
ingreso promedio mensual es S/.1200, el ingreso mediano S/.1100 y la desviacin
estndar S/.200. Con base en esta informacin se puede afirmar que:
a) La planilla mensual asciende a ________________________ soles.
b) El 50% de los trabajadores tienen un ingreso mensual menor que _______________
soles.
c) El actual coeficiente de variacin de la distribucin de ingresos es
____________________.
d) Si el mes siguiente se incrementa en el 10% el sueldo de cada trabajador, y adems a
cada uno se le otorga una bonificacin de S/.100, la planilla se habr incrementado en
______________________ soles y la nueva distribucin de ingresos ser ms
_________ que la actual.

25. El siguiente cuadro muestra la distribucin de sueldos de los empleados en una


compaa:

Sueldo (soles) Nmero empleados


72

[1500, 1700[ 4
[1700, 1900[ 5
[1900, 2100[ 26
[2100, 2300[ 35
[2300, 2500] 10
a) Calcule e interprete la media y la mediana.
b) Calcule la desviacin estndar y el coeficiente de variacin. La distribucin de sueldos
en dicha empresa es homognea? Por qu?
c) Calcule e interprete el valor del coeficiente de asimetra de Pearson.
d) La empresa decide incrementar el sueldo de cada empleado en el 20%, ms una
bonificacin de S/.400. Calcule e interprete el coeficiente de variacin de la nueva
distribucin de sueldos.

26. La siguiente tabla de frecuencias corresponde a los jornales, en soles, de los obreros de
una fbrica que cuenta con 500 obreros:

Jornal (soles) xi fi Fi hi Hi
[ 80 90 [ 0.10
[ 90 100[ 110 0.22
[100 110[ 120
[110 120[ 80
[120 130[ 70
[130 140[ 60 490
[140 150]

a) Calcule e interprete la media y la mediana.


b) Calcule la desviacin estndar.
c) Calcule e interprete el coeficiente de variacin.
d) Calcule e interprete el coeficiente de asimetra de Pearson.
e) Se decidi otorgar un aumento a todos los obreros del 30% de su jornal ms una
bonificacin por concepto de pasajes de 25 soles, cul es la nueva varianza y el nuevo
coeficiente de variacin de los salarios?

27. A continuacin se presenta los sueldos de un grupo de personas encuestadas en tres


distritos:
Ingreso Hombres Mujeres
(dlares) La Molina Surco San Isidro La Molina Surco San Isidro
[400 500[ 45 34 28 67 55 34
[500 600[ 78 56 67 89 46 45
[600 700] 59 25 44 56 25 55

a) Calcule la desviacin estndar de los sueldos de las personas encuestadas que vivan
en Surco.
b) Calcule el coeficiente de variacin de los sueldos de las mujeres encuestadas.
c) Calcule la desviacin estndar de los sueldos de los hombres encuestados que vivan
en San Isidro.
d) Calcule el coeficiente de variacin de los sueldos de las mujeres encuestadas que vivan
en La Molina.
28. Una central de riesgo crediticio va elegir a cul de los 2 bancos que se presentan otorgar
la calificacin +BBB

Banco A BancoB
Monto(mil $) Nro. Acreedores Monto($) Nro. acreedores
[12 16[ 2 [10 14[ 1
[16 20[ 4 [14 18[ 4
73

[20 24[ 3 [18 22[ 7


[24 28] 1 [22 26] ?

a) Si se encontr que el promedio de las acreencias en ambos bancos es el mismo.


Determine el tamao de muestra de los acreedores del Banco B.
b) Cul de los dos bancos deber ser favorecido por la calificacin +BBB?
c) En cul de las marcas, la distribucin de frecuencias es ms asimtrica? Indique el tipo
de asimetra para cada marca. (USE COEFICIENTE DE ASIMETRA)

29. En una fbrica, el personal de planta est dividido en supervisores, operarios calificados y
asistentes. Se cuenta con la siguiente informacin:

Supervisores Operarios calificados Asistentes


Salario promedio 2000 1200 800
Desviacin estndar 300 240 200

a) Qu grupo de trabajadores tiene los salarios ms homogneos?


b) Se decide incrementar aumentar los salarios del personal de planta de la siguiente
manera:
Supervisores: 30% de su salario actual
Operarios Calificados: S/.650
Asistentes: 20% de su salario actual, ms S/.200.
Despus de los incrementos, qu grupo de trabajadores tiene los salarios ms
homogneos?

30. En la agencia INTERBANK del Jockey Plaza hay 15 empleados cuyo sueldo promedio es
S/.4200 con una desviacin estndar de S/.300. En la agencia de SCOTIABANK del
mismo centro comercial hay 30 empleados que tienen un sueldo promedio de S/.3900 con
una desviacin estndar de S/.250. Mediante una negociacin los de INTERBANK
obtienen un aumento del 10% ms una bonificacin de S/.50, mientras que los DE
SCOTIABANK obtienen un incremento de S/.120. Calcule el coeficiente de variacin de
los sueldos, tanto para los de INTERBANK como para los de SCOTIABANK, qu grupo
de trabajadores tiene los sueldos ms homogneos?

31. Las edades en aos de los asistentes a cierto curso fueron: 39, 37, 35, 41, 37, 40, 38, 25,
39., despus de dos aos volvieron a reunirse.
a) Qu cambio han sufrido las edades de estas personas?
b) Qu cambios han sufrido la media y las medidas de variabilidad, despus de los 2 aos?
Los resultados se muestran a continuacin:
Variable Mean StDev Variance CoefVar Minimum Q1 Median Q3 Variable Maximum
edades 36.78 4.76 22.69 12.95 25.00 36.00 38.00 39.50 edades 41.00
edades1 38.78 4.76 22.69 12.29 27.00 38.00 40.00 41.50 edades1 43.00
74

Captulo 4
Regresin Lineal.
Introduccin.-
Una empresa quiere evaluar el consumo en miles de kilowatts-hora, para una casa de seis
habitaciones. El sabe que hay relacin entre el consumo de energa y el nmero de
habitaciones de las residencias unifamiliares.

Una importante aerolnea piensa que hay relacin entre el nmero de pasajeros y el peso
total del equipaje almacenado en el compartimiento correspondiente. Puede concluirse
que existe una relacin positiva entre las dos variables.
75

EL COEFICIENTE DE CORRELACIN

Es la raz cuadrada del coeficiente de determinacin.


r = r2
o Sus valores oscilan entre -1 y 1
o Cuando r es positivo, indica que X e Y estn directamente
relacionados.
o Cuando r es negativo, indica que X e Y estn inversamente
relacionados.
o El coeficiente r tiene el mismo signo que el coeficiente b1
en la ecuacin de regresin
Ejercicio 9. Diagrama de dispersin y coeficiente de
correlacin
El siguiente ejercicio tiene por objetivo mostrar paso a paso las herramientas
proporcionada por Excel para la construccin de los diagramas de dispersin y el clculo
del coeficiente de correlacin.

Un curso de estadstica tiene tres horarios y el coordinador del curso y los profesores
estn interesados en construir grficos que le permita analizar las notas de las distintas
evaluaciones y en los distintos horarios. Los datos se encuentran en el archivo:
Base_Datos_2.xlsx.

Realice un diagrama de dispersin y calcule el coeficiente de correlacin entre las


variables notas de la primera prctica y notas del parcial.

Solucin

Elaborando el diagrama de dispersin.

Seleccione los datos, active Insertar y elija Dispersin

Seleccione la primera opcin y aparecer el siguiente grfico.


76

Aadir el ttulo y rotular los ejes

Marque cualquiera de los puntos azules y de botn derecho. Marque la


opcin Agregar lnea de tendencia del men desplegable.

Y luego cerrar. Aparecer de la siguiente forma:


77

1) En una investigacin se desea conocer en que medida el peso de una persona depende
de su estatura, para ello se tomaron las estaturas redondeadas en pulgadas y los pesos
en libras de una muestra de 12 estudiantes tomada al azar entre los estudiantes de 1er
ao en la escuela de administracin:
Estatura (pulg.) 70 63 72 60 66 70 74 65 62 67 65 68
Pesos (lb.) 155 150 180 135 156 168 178 160 132 145 139 152
. Obtener un diagrama de dispersin para esos datos.

(a) Si R = 0.7452 , es bueno o malo el ajuste de datos?


(b) Si la recta de regresin que exprese la relacin entre ambas variables es:
Y = -59,3513 + 3,1948 X , estimar el peso de un estudiante que mide 63 pulg.

2) Considerando a X como la variable independiente X 3 5 6 8 9 11


Y 2 3 4 6 5 8
(a) Si la recta de regresin es Y = -0,3333 + 0,7143 Hallar Y
cuando X = 5 y cuando es X = 6 .

3) La tabla siguiente presenta las notas


lgebra 75 80 93 65 87 71 98 68 84 77
en lgebra y fsica de 10 estudiantes
Fsica 82 78 86 72 91 80 95 72 89 74
elegidos al azar entre un grupo muy
numeroso, el objetivo es determinar si las notas de fsica dependen de los resultados
obtenidos en lgebra.
(a) Graficar los datos y analcelos.
(b) Si la ecuacin de regresin es Y = 29,1290 + 0,6613 X que indica la pendiente?
(c) Si un estudiante tiene 75 puntos en lgebra. Cul es su nota esperada en fsica?

4) Suponga que usted tiene a su


Suministro de dinero (X) Producto Nacional Bruto (Y)
cargo el dinero de la regin
2,0 5,0
Ancash. Se le dan los
2,5 5,5
siguientes datos de
3,2 6,0
antecedentes sobre el
3,6 7,0
suministro de dinero y el
producto regional bruto (ambos 3,3 7,2
en millones de dlares): 4,0 7,7
4,2 8,4
. 4,6 9,0
(a) Si la ecuacin de regresin 4,8 9,7
es Y = 1,1681 + 1,7156 X 5,0 10,0
78

Cmo interpreta la pendiente de la lnea de regresin?.


(b) Pronostique el PNB cuando X sea 6.

5) Un estudio hecho por el departamento de transporte de la MUNICIPALIDAD DE LIMA


METROPOLITANA, acerca del efecto de los precios de los boletos de los autobuses
sobre el nmero de pasajeros produjo los siguientes resultados:
Precio del boleto (centavos) 25 30 35 40 45 50 55 60
Pasajeros por 100 millas 800 780 780 660 640 600 620 620

(a) Represente grficamente los datos.


(b) Si la ecuacin de regresin es : y = -6.2381x + 952.62 . Pronostique el nmero de
pasajeros por 100 millas si el precio del boleto fuera de 50 centavos.
(c) Si R = 0.8246 Es bueno o malo el ajuste?
6) El gerente de mercadotecnia de la cadena de supermercados PLAZA VEA desea
determinar el efecto del espacio de anaqueles en las ventas de comida para mascotas.
Se seleccion una muestra aleatoria de tiendas del mismo tamao con los siguientes
resultados:

Espacio en anaquel (pies) 5 5 5 10 10 10 15 15 15 20 20 20


Ventas Semanales 160 220 140 190 240 260 230 270 280 260 290 310
a) Analice a travs de un diagrama de dispersin si ambas variables estn relacionadas
linealmente.
b) Suponga una relacin lineal Ventas Semanales = 145 + 7,4 Espacios en anaqueles.
c) Interprete el significado de la pendiente.
d) Pronostique las ventas semanales promedio de comida para mascotas con 8 pies de
espacio en anaqueles para ello.
e) Si r2 =0,684. Existe un buen ajuste?

7) Suponga que el gerente de una cadena de servicios de entrega de paquetera desea


desarrollar un modelo para predecir las ventas semanales (en miles de dlares) para las
tiendas individuales basado en el nmero de clientes que realizan compras. Se
seleccion una muestra aleatoria entre todas las tiendas de la cadena con los siguientes
resultados:

Clientes 907 926 506 741 789 889 874 510 529 420
Ventas 11,2 11,05 6,84 9,21 9,42 10,08 9,45 6,73 7,24 6,12
a) Realice el diagrama de dispersin y analcelo.
b) Calcule la recta de regresin lineal. Interprete el significado de la pendiente de la recta
en el problema.
Sol: Y = 0,009X + 2,21
c) Pronostique las ventas semanales para las tiendas que tienen 600 clientes.
79

ANEXO
MTODOS DE MUESTREO
Ejemplo1:
Suponga que estamos investigando sobre el porcentaje de alumnos que
trabajan de una poblacin de 20 alumnos de la Universidad de Lima.
Base de datos de la poblacin:
Nombre Alumno Trabaja? Nombre Alumno Trabaja?
Juan SI Mara NO
Alicia NO Fernanda NO
Pedro NO Julio SI
Marcos NO Rosa NO
Alberto SI Fabin NO
Jorge SI Ana NO
Jos NO Laura NO
Carlos NO Enrique NO
Miguel NO Carmen SI
Victoria SI Marcelo SI

a. Elija una muestra aleatoria simple de tamao n=4 de esta


poblacin. Use la tabla de nmeros aleatorios adjunta,
empiece en la fila 1 columna 1 y contine seleccionando hacia
la derecha. Indique los pasos para elegir la muestra.
Tabla de nmeros aleatorios:
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672
Respuesta: Primero:
Asignamos nmero a cada alumno del 1 al 20:

Nombre Nombre
Nmero Trabaja? Nmero Trabaja?
Alumno Alumno
1 Juan SI 11 Mara NO
2 Alicia NO 12 Fernanda NO
3 Pedro NO 13 Julio SI
4 Marcos NO 14 Rosa NO
5 Alberto SI 15 Fabin NO
6 Jorge SI 16 Ana NO
7 Jos NO 17 Laura NO
8 Carlos NO 18 Enrique NO
9 Miguel NO 19 Carmen SI
10 Victoria SI 20 Marcelo SI

Segundo:
Buscamos en la tabla de nmeros aleatorios 4 nmeros, de dos
80

dgitos, entre el 1 y el 20, sin repetir.

Tabla de nmeros aleatorios:


columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

Los nmeros seleccionados son: 10, 1, 11, 20. Por lo tanto, la muestra est
compuesta por:
*10: Victoria que SI trabaja.
*1: Juan que SI trabaja.
*11: Mara que NO trabaja.
*20: Marcelo que SI trabaja.

b. Indique cul es el Parmetro y cul es el Estadstico en (a).


Respuesta:
El Parmetro es el porcentaje de alumnos que trabajan en la
poblacin de tamao N=20 alumnos, es decir:

c. Elija una muestra estratificada de tamao n=4 de esta


poblacin. Use la tabla de nmeros aleatorios, en cada
alternativa empiece en la fila 1 columna 1 y contine
seleccionando hacia la derecha. Indique los pasos para elegir la
muestra.

Nombre Alumno Trabaja? Nombre Alumno Trabaja?


Juan SI Mara NO
Alicia NO Fernanda NO
Pedro NO Julio SI
Marcos NO Rosa NO
Alberto SI Fabin NO
Jorge SI Ana NO
Jos NO Laura NO
Carlos NO Enrique NO
Miguel NO Carmen SI
Victoria SI Marcelo SI

Respuesta:
Para elegir una muestra estratificada, primero se dividen los
81

hombres de las mujeres y se asignan nmero de identificacin a cada


estrato:

Estrato Hombres Estrato Mujeres


Nmero Nombre Alumno Nmero Nombre Alumno
1 Juan 1 Alicia
2 Pedro 2 Victoria
3 Marcos 3 Mara
4 Alberto 4 Fernanda
5 Jorge 5 Rosa
6 Jos 6 Ana
7 Carlos 7 Laura
8 Miguel 8 Carmen
9 Julio
10 Fabin
11 Enrique
12 Marcelo
Usando la tabla de nmeros aleatorios, se elige una muestra
aleatoria simple de tamao n=2 de los hombres, buscando nmeros
del 1 al 12. Se parte de la fila 1 columna 1. Se usan dos dgitos.
Tabla de nmeros aleatorios:
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50
Fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

Los nmeros elegidos son: 10 y 1.


Por lo tanto la muestra del estrato de hombres queda constituida por Fabin
y Juan. Fabin NO trabaja y Juan SI trabaja.

Usando la tabla de nmeros aleatorios, se elige una muestra aleatoria


simple de tamao n=2 de las mujeres, buscando nmeros del 1 al 8.
Se parte de la fila 1 columna 1. Se usa un dgito.

Tabla de nmeros aleatorios:


columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50
Fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672

Los nmeros elegidos son: 1 y 4.

Por lo tanto, la muestra del estrato de mujeres queda constituida por Alicia y
Fernanda. Alicia y Victoria NO trabajan.
82

Por lo tanto, la muestra final queda constituida por Fabin, Juan, Alicia
y Fernanda.
Finalmente, la proporcin de alumnos que trabaja en la muestra
estratificada es de 25%.

a. Seleccione una muestra aleatoria simple de tamao n=6 de esta


poblacin. Use la tabla de nmeros aleatorios, empezando en
la fila 10 columna 21 y contine seleccionando hacia la
derecha. Describa la muestra seleccionada. Genere etiquetas
desde 01.
Respuesta:

Primero:
Asignamos etiqueta a cada persona del 1 al 22:
Etiqueta Nombre Droga Etiqueta Nombre Droga
01 Felipe Alcohol 12 Antonio Alcohol
02 Wilma Marihuana 13 Gerardo Marihuana
03 Jos Pasta Base 14 Carmen Alcohol
04 Viviana Cocana 15 Pamela Cocana
05 Pablo Alcohol 16 Mara Pasta Base
06 Rodrigo Marihuana 17 Alejandra Extasis
07 Carlos Extasis 18 Eduardo Neoprn
08 Catherine Alcohol 19 Ronal Relevon
09 Claudia Marihuana 20 Susana Herona
10 Valentina Neoprn 21 Hugo Marihuana
11 Enrique Marihuan 22 Hernn Alcohol

Segundo:
Buscamos en la tabla de nmeros aleatorios 6 nmeros, de dos
dgitos, entre el 1 y el 22, sin repetir. Se parte de la fila 10 y
columna 21.
83

Tabla de nmeros aleatorios:


Columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
Fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 114 58 18593 64952
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 90511 33703 90322
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104

Los nmeros seleccionados son: 6, 5, 8, 15, 16, 14.


Por lo tanto, la muestra est compuesta por:
*6: Rodrigo que consume Marihuana.
*5: Pablo que consume Alcohol.
*8: Catherine que consume Alcohol.
*15: Pamela que consume Cocana.
*16: Mara que consume Pasta Base.
*14: Carmen que consume Alcohol.

b. Suponga que estamos investigando sobre el porcentaje de


personas consumidoras de alcohol, calcule el parmetro y el
estadstico adecuado.
Respuesta:
El Parmetro es el porcentaje de personas que consumen Alcohol en la
poblacin de tamao N=22 personas, es decir:
P=(Nmero de personas que consumen Alcohol)/N=
=6/22=0.2727 27.27%.
El Estadstico es el porcentaje de personas que consumen Alcohol en la
muestra de tamao n=6 personas, es decir:
p=(Nmero de personas que consumen Alcohol)/n=
=3/6=0.50 50%.

c. Seleccione y describa una muestra estratificada de tamao 6 de


esta poblacin. Use la tabla de nmeros aleatorios y en cada
estrato reasigne etiquetas (genere etiquetas desde 1 01
segn corresponda) comenzando en la fila 19 columna 11
y contine hacia la derecha. Determine el porcentaje de
personas consumidoras de alcohol en la muestra.
84

Usando la tabla de nmeros aleatorios, se elige una muestra


aleatoria simple de tamao n=3 de los hombres, buscando
nmeros del 1 al 12. Se parte de la fila 19 columna 11. Se usan dos
dgitos.
Tabla de nmeros aleatorios:
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 90511 33703 90322
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 97628 33787 09998 42698 06691 76988 51851 46104 88916 19509 25625 58104

Los nmeros elegidos son: 7, 5 y 2.


Por lo tanto la muestra del estrato de hombres queda constituida por
Antonio, Carlos y Jos. Antonio consume Alcohol, Carlos consume
Extasis y Jos consume Pasta Base.

Usando la tabla de nmeros aleatorios, se elige una muestra


85

aleatoria simple de tamao n=3 de las mujeres, buscando nmeros del 1


al 10.
Se parte de la fila 19 columna 11. Se usan dos dgitos.

Tabla de nmeros aleatorios:

columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 90511 33703 90322
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104

Los nmeros elegidos son: 7, 5 y 4.

Por lo tanto, la muestra del estrato de mujeres queda constituida por


Pamela, Valentina y Viviana. Pamela y Viviana consumen Cocana,
en cambio, Valentina consume Neoprn.

Por lo tanto, la muestra final queda constituida por Antonio, Carlos,


Jos, Pamela, Valentina y Viviana.
Finalmente, la proporcin de personas que consume Alcohol en la
muestra estratificada es de 16.67%.

Vous aimerez peut-être aussi