Vous êtes sur la page 1sur 84

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA

INDICE

RESUMEN HOJA DE VIDA.................................................................................................................................4

IMPORTANCIA DE LA ESTADÍSTICA..............................................................................................................5
A. OBJETIVO GENERAL DE LA ASIGNATURA:............................................................................................7
B. CONTENIDOS.....................................................................................................................................................7
PRIMER BIMESTRE..............................................................................................................................................9
UNIDAD I..................................................................................................................................................................9
C. CONTENIDOS.....................................................................................................................................................9

D. ASESORÍA DIDÁCTICA I.............................................................................................................................10

PREGUNTAS DE AUTOEVALUACION..........................................................................................................10

(LAS RESPUESTAS ESTÁN AL FINAL DEL CAPÍTULO)...........................................................................10

1.LA POBLACIÓN ES EL CONJUNTO DE TODOS LOS ELEMENTOS EN ESTUDIO A)


VERDADERO B) FALSO...................................................................................................................................10

2.PARA CONSTRUIR UN POLÍGONO DE FRECUENCIA ES NECESARIO PRIMERO REALIZAR


UN HISTOGRAMA ............................................................................................................................................10

A) VERDADERO B) FALSO..............................................................................................................................10

3.CUANDO SE CONSTRUYE UNA TABLA DE FRECUENCIAS, EL NÚMERO DE CLASES DE


INTERVALOS DEPENDE DEL A) TAMAÑO DE LA MUESTRA B) DE QUE SEAN NÚMEROS
REALES O ENTEROS........................................................................................................................................10

4.UNA PARTE DE LA POBLACIÓN EN ESTUDIO RECIBE EL NOMBRE DE …………………….......10

5.UNA GRÁFICA CUYA DISTRIBUCIÓN ES ACUMULATIVA RECIBE EL NOMBRE DE


……………………................................................................................................................................................10

6.INDIQUE CON SUS PROPIAS PALABRAS LA DIFERENCIA ENTRE VARIABLES ALEATORIAS


CONTINUAS Y DISCRETAS. PONGA UN EJEMPLO DE CADA UNO.....................................................10

MAT. MAURICIO GARCIA PAG 1


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
7.SE DESEA TOMAR UNA MUESTRA DE LAS OPINIONES DEL DESEMPEÑO DE LOS 130
ASAMBLEISTAS SOBRE LA NUEVA CONSTITUCIÓN. INDIQUE A) ¿CUÁL ES LA MUESTRA? B)
¿CUÁL ES LA POBLACIÓN? ...........................................................................................................................10

8.EL VALOR QUE RECIBE MÁS FRECUENTEMENTE SE REPITE SE CONOCE COMO MEDIANA
................................................................................................................................................................................10

A) VERDADERO B) FALSO.............................................................................................................................10

9. LAS MEDIDAS DE DISPERSIÓN DE UN CONJUNTO DE DATOS MIDE EL PUNTO CENTRAL


DE ÉSTOS............................................................................................................................................................10

A) VERDADERO B) FALSO.............................................................................................................................10

10. ORDENE LOS SIGUIENTES PASOS PARA EL CÁLCULO DE LA MEDIANA DE UN CONJUNTO


DE DATOS A) OBTENER LA MEDIA ARITMÉTICA DE LOS VALORES CENTRALES B)
ORDENAR DE MENOR A MAYOR LOS DATOS C) NINGUNO DE LOS ANTERIORES......................10

11. ¿CUÁL DE LAS SIGUIENTES MEDIDAS SON DE CENTRALIZACIÓN: A) MEDIANA B) MODA


C) MEDIA D) TODAS ...................................................................................................................................10

LAS ANTERIORES ......................................................................................................................................10

12. PUEDE DARSE EL CASO DE QUE LA MEDIA ARITMÉTICA SEA NEGATIVA A) VERDADERO
B) FALSO. ¿PORQUÉ?.......................................................................................................................................10

13. PUEDE DARSE EL CASO DE QUE LA DESVIACIÓN TÍPICA SEA NEGATIVA A) VERDADERO
B) FALSO. ¿PORQUÉ?.......................................................................................................................................11

14. LA DIFERENCIA ENTRE EL VALOR MÁS ALTO Y MÁS BAJO RECIBE EL NOMBRE DE
…………………....................................................................................................................................................11

15. BAJO QUE CONDICIÓN ES MÁS CONFIABLE LA MEDIANA QUE LA MEDIA EN LO QUE
RESPECTA A SUS DATOS................................................................................................................................11

A) POR EL TAMAÑO DE LA MUESTRA B) POR LA GRAN DISPERSIÓN QUE PRESENTA LA


MUESTRA C) POR SER TENER VARIABLES CUALITATIVAS..............................................................11

1. INTRODUCCION..............................................................................................................................................11
2.CONSTRUCCIÓN DE INTERVALOS DE CLASE.....................................................................................................................12
3.HISTOGRAMAS ...........................................................................................................................................................14
4. GRÁFICA DE DISTRIBUCIÓN ACUMULADA (OJIVAS).......................................................................................................20
5. DIAGRAMAS POR SECTORES. DIAGRAMA DE PASTEL (PIE)...............................................................................................21
5.DIAGRAMA DE TALLO Y HOJA......................................................................................................................................25
7. REPRESENTACIÓN DE LAS DISTRIBUCIONES.....................................................................................................................27
1.MEDIDAS DE CENTRALIZACIÓN.....................................................................................................................................28
8.1 Media Aritmética..............................................................................................................................................28

MAT. MAURICIO GARCIA PAG 2


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
8.2 Mediana ..........................................................................................................................................................29
8.3 Moda.................................................................................................................................................................30
8.4 Medidas de Dispersión....................................................................................................................................33
8.5 El coeficiente de variación ............................................................................................................................34
8.6 Diagrama de Caja y Bigote ..............................................................................................................................36

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION..................................................................39

UNIDAD II...............................................................................................................................................................39
INTRODUCCIÓN A LA PROBABILIDAD........................................................................................................39

PREGUNTAS DE AUTOEVALUACION..........................................................................................................39

2.1 TEORÍA DE LAS PROBABILIDADES...............................................................................................................................40


2.2 PROPIEDADES DE LAS PROBABILIDADES.......................................................................................................................40
2.3 COMBINACIONES...........................................................................................................................................46
2.4 PERMUTACIONES...........................................................................................................................................50

ACTIVIDADES DE APRENDIZAJE II.............................................................................................................51

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION...................................................................53

UNIDAD III..........................................................................................................................................................53

II. DISTRIBUCIÓN DE PROBABILIDADES DISCRETAS Y CONTINUAS................................................53

PREGUNTAS DE AUTOEVALUACION..........................................................................................................53

A. VARIABLES DISCRETAS...............................................................................................................................54
1. DISTRIBUCIÓN BINOMIAL............................................................................................................................................55
2. DISTRIBUCIÓN DE POISSON.........................................................................................................................................57
3. DISTRIBUCIÓN HIPERGEOMÉTRICA................................................................................................................................58
B. DISTRIBUCIONES CONTINUAS.................................................................................................................62
4. DISTRIBUCIÓN NORMAL............................................................................................................................................62

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION...................................................................67

UNIDAD IV.............................................................................................................................................................67
IV. DISTRIBUCIONES DE MUESTREO...........................................................................................................68
PREGUNTAS DE AUTOEVALUACION............................................................................................................68
1.EL PARÁMETRO ES UNA CARACTERÍSTICA DE LA MUESTRA A) VERDADERO B) FALSO.......................................................68
2.SERÁ FÁCIL OBTENER LA DESVIACIÓN TÍPICA DE LA POBLACIÓN Σ A) VERDADERO B) FALSO ¿POR QUÉ?............................68
3.LA MEDIA DE TODAS LAS MEDIAS MUESTRALES DE UNA DISTRIBUCIÓN MUESTRAL ES LLAMADA
………………………………………………….......................................................................................................68
4. EL ERROR MUESTRAL ES LA DIFERENCIA ENTRE EL ESTADÍSTICO Y EL PARÁMETRO DESCONOCIDO ....................................68
A) VERDADERO B) FALSO..............................................................................................................................................68
5.DEFINIR Y PONER UN EJEMPLO DE DISTRIBUCIÓN MUESTRAL...........................................................................................68

MAT. MAURICIO GARCIA PAG 3


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
ASESORÍA DIDÁCTICA IV.................................................................................................................................68
A. DISTRIBUCIÓN DE MUESTREO.....................................................................................................................68
B. TEOREMA DEL LÍMITE CENTRAL................................................................................................................69

ACTIVIDADES DE APRENDIZAJE IV...........................................................................................................69

ACTIVIDADES DE APRENDIZAJE IV...........................................................................................................71

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION...................................................................71

BIBLIOGRAFIA:.............................................................................................................................................84

RESUMEN HOJA DE VIDA

El tutor de esta materia se llama Mauricio García Oquendo, su profesión es Matemático. En el


sistema modalidad a distancia trabaja desde hace 8 años, ha dictado las asignaturas de Matemática
Básica, Matemática Superior, Estadística Descriptiva y Estadística Inferencial varias veces en este
lapso de tiempo.
Durante siete años fue Jefe del Departamento de Ciencias Exactas, de la Universidad Tecnológica
Equinoccial. Actualmente es el Subdirector del Sistema de Educación a Distancia de la Universidad
Tecnológica Equinoccial.

MAT. MAURICIO GARCIA PAG 4


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Tiene una experiencia de 20 años en la Universidad Tecnológica Equinoccial dictando las cátedras
de Matemática Básica, Matemática Superior, Estadística Descriptiva, Estadística Inferencial,
Estadística Matemática, Probabilidad y Estadística, Cálculo Diferencial e Integral, Álgebra Lineal,
Cálculo Aplicado, Estadística Aplicada.
Ha dictado por varias ocasiones las asignaturas de Matemáticas Aplicadas y de Estadística Aplicada,
en la Maestría de Contabilidad y Auditoría que ofrece la Universidad Tecnológica Equinoccial.
Maneja el programa estadístico computacional SPSS, existiendo varias versiones, la última versión
16, y potencia el uso de la hoja electrónica Excel.
Trabajó por cerca de cinco años en el Consejo Nacional de Ciencia y Tecnología, como Técnico IV
en Ciencia y Tecnología, en dicha dependencia, suscrito a la Vicepresidencia de la República.

• INFORMACIÓN DE LA ASIGNATURA

Estamos seguros de que al finalizar este curso, el estudiante será capaz de manejar los conceptos de
Estadística Descriptiva que le permitirán realizar posteriormente la toma de decisiones.

IMPORTANCIA DE LA ESTADÍSTICA

Históricamente el crecimiento y desarrollo de la estadística moderna puede trazarse desde dos


fenómenos separados: la necesidad del gobierno de obtener información sobre los ciudadanos y el
desarrollo de las matemáticas, de la teoría de las probabilidades.
A lo largo de la historia registrada se han recabado datos. Durante las civilizaciones egipcia, griega y
romana, los datos se obtenían principalmente con fines de impuestos y reclutamiento militar. En la Edad
Media, las instituciones eclesiásticas a menudo mantenían registros de nacimientos, muertes y
matrimonios. En América se mantuvieron diversos registros y comenzando en 1790, la Constitución de
E.E.U.U requirió el levantamiento de censo cada diez años. Actualmente estos datos se usan para
muchos propósitos, incluyendo, prorrateo del Congreso y la asignación para fondos del presupuesto
nacional.

La complejidad de nuestro mundo, se hace más difícil tomar decisiones informadas e inteligentes. Con
frecuencia, estas decisiones se han de tomar con un conocimiento imperfecto de la situación y un grado
considerable de incertidumbre, sin embargo, las soluciones pertinentes son esenciales para nuestro
bienestar e incluso para nuestra supervivencia. Estamos expuestos a la presión constante de problemas
económicos angustiosos, como una inflación galopante, un sistema fiscal engorroso, oscilaciones
excesivas del ciclo económico, una deuda externa opresiva, un alto índice de delincuencia, tipos de
interés impredecibles.

• UTILIDAD PRÁCTICA DE LA MATERIA

MAT. MAURICIO GARCIA PAG 5


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Casi todos los campos de la investigación se pueden beneficiar del análisis estadístico. Los responsables
de la toma de decisiones sobre política económica asesores del presidente y de otros cargos públicos,
tienen en la estadística una herramienta muy útil. Únicamente con ayuda del análisis estadístico pueden
tomar decisiones inteligentes en relación con los tipos tributarios, los programas de desarrollo social, los
subsidios, los salarios y muchas cuestiones más. Es fundamental también para los empresarios, en su
búsqueda incansable del beneficio. “Las actividades de control de calidad, minimización de costes,
combinación de productos y existencias, y multitud de otros aspectos empresariales se pueden gestionar
con eficacia mediante procedimientos estadísticos contrastados”.
Otra de las aplicaciones de la estadística, es en la investigación de mercados, para determinar el grado
de posicionamiento de un producto y determinar si tendrá éxito, así como también para asesores
financieros que han de evaluar las oportunidades de inversión. Contadores, jefes departamentales,
fabricantes utilizan también el análisis estadístico y la medicina, se beneficia de esta disciplina.
“1Las respuestas suelen ser muy evidentes una vez que se han hecho las preguntas correctas. El análisis
estadístico demostrará ser de gran utilidad en la formulación adecuada de esas preguntas esenciales “.
En términos de áreas funcionales de negocios, la estadística puede aplicarse en:
Contabilidad

 Seleccionar muestras con propósitos de auditoría


 Para comprender los derroteros de costos en contabilidad de costos

Finanzas
 Para estar al tanto de medidas financieras en el transcurso del tiempo
 Para desarrollar formas de pronósticos de valores de estas medidas en momentos futuros
Administración
 Para describir características de empleados dentro de una organización
 Para mejorar la calidad de los productos o de los servicios procurados en la organización

Mercadeo
 Para estimar la proporción de clientes que prefieren un producto en vez del otro y la razón de
esto
 Para sacar conclusiones respecto a estrategias de publicidad que sería más útil para el incremento
de ventas de un producto

Los empresarios saben que los complejos problemas con que se enfrentan en el mundo de hoy exigen
soluciones cuantitativas y que tienen que estar acompañadas de dichos datos para tomar decisiones en
1
Tomado del libro “Estadística aplicada a la Empresa y Economía” de Allen Webster, 1998

MAT. MAURICIO GARCIA PAG 6


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
casi todas las disciplinas se exigen el empleo del razonamiento estadístico tales como en la economía, en
la investigación operativa, en las finanzas (los financieros aplican técnicas estadísticas para hallar
soluciones viables y realizar la toma de decisiones), marketing, ingenieros industriales.
En el mercado actual de trabajo los empresarios se resisten a emplear o retener a analfabetos
estadísticos. En sus aspiraciones profesionales se encaminan tanto a la industria privada como a la
administración. Se encontrarán respaldados si tienen fundamentos sólidos de análisis estadísticos.
Algunos pueden creer que el tipo de trabajo que aspiran no exige el conocimiento del análisis
estadístico, se deberá tener un mínimo de conocimientos en la formación de este campo con la
finalidad de diseñar soluciones adecuadas para la mejor toma de decisión. Una vez conocidos estos
aspectos del análisis estadístico se sorprenderá de las variadas formas de que éste puede ayudar a
resolver conflictos que se producen en el mundo laboral.
Dentro de pocos años se dejará la seguridad relativa de nuestro entorno académico y se deberá lanzar al
mundo competitivo.
El empresario esperará que el profesional que queremos formar para una empresa haga dos cosas:

1. Tomar decisiones.
2. Resolver problemas.
Estos dos aspectos pueden llevarse a cabo siguiendo procedimientos estadísticos.

A. OBJETIVO GENERAL DE LA ASIGNATURA:

Resolver problemas de recolección, organización, presentación e interpretación de datos numéricos con


la finalidad de realizar una toma de decisiones más efectiva. Esto es:
 Manejar los conceptos estadísticos eficientemente.
 Diseñar cuestionarios eficientemente, con la mayor claridad posible.
 Procesar una encuesta realizada, con la ayuda de al menos un paquete estadístico computacional.
 Interpretar los resultados obtenidos de una encuesta para la mejor toma de decisiones.

B. CONTENIDOS

I. RECOLECCIÓN DE DATOS

Al finalizar el presente capítulo los estudiantes estarán en capacidad de:

 Organizar datos originales en una distribución de frecuencias.


 Organizar un conjunto de datos en una distribución de frecuencias

MAT. MAURICIO GARCIA PAG 7


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

 Construir los distintos diagramas y gráficos estadísticos


 Determinar el método más eficiente para presentar un conjunto de datos
 Representar la distribución de frecuencias en un histograma, o polígono de frecuencias acumuladas
 Desarrollar una representación de “tallo y hoja”
 Calcular las medidas de centralización : la media aritmética, la mediana, la moda.
 Explicar las desventajas y ventajas de cada una de las medidas de centralización.
 Identificar la posición de la media aritmética, la mediana y la moda, tanto para distribuciones
simétricas como asimétricas o sesgadas
 Explicar varias medidas de dispersión (rango, rango intercuartílico, desviación media, desviación
estándar ) para datos agrupados y no agrupados
 Calcular varias medidas de dispersión para datos agrupados y sin agrupar

II. INTRODUCCIÓN A LA PROBABILIDAD

Al finalizar el presente capítulo los estudiantes estarán en capacidad de:

 Utilizar las propiedades de las probabilidades para hallar determinada probabilidad


 Conocer los principios básicos de la Probabilidad
 Distinguir entre eventos mutuamente excluyentes y no excluyentes
 Establecer la diferencia entre eventos dependientes e independientes
 Manejar las reglas de adición y multiplicación de probabilidades
 Aplicar el teorema de Bayes
 Distinguir entre Permutaciones y Combinaciones
 Determinar el número de posibles permutaciones y combinaciones.

III. DISTRIBUCIÓN DE PROBABILIDADES DISCRETAS Y CONTINUAS

Al finalizar el presente capítulo los estudiantes estarán en capacidad de:

✓ Definir una distribución de probabilidad o probabílistica

MAT. MAURICIO GARCIA PAG 8


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
✓ Distinguir entre una distribución probabílistica discreta y una
distribución probabilística continua
✓ Elaborar una distribución binomial, una distribución hipergeométrica,
una de Poisson, una Uniforme y una Exponencial
✓ Determinar que distribución emplear en una situación dada
✓ Explicar y aplicar la distribución normal
✓ Usar la tabla de la curva normal
✓ Manejar el parámetro Z

IV. DISTRIBUCIONES DE MUESTREO

Al finalizar el presente capítulo los estudiantes estarán en capacidad de:

 Explicar por qué en muchas situaciones una muestra es la única forma posible de tener conocimiento
acerca de una población
 Definir una distribución de muestreo de medias muestrales
 Elaborar una distribución de muestreo de medias muestrales
 Explicar el “teorema del límite central” y su importancia en la inferencia estadística.
 Describir las características, forma, propiedades de las distribuciones T de student, F de Fisher y
Chi- Cuadrado
 Manejar las tablas de las distribuciones continuas T de student, F de Fisher y Chi- Cuadrado.

PRIMER BIMESTRE
UNIDAD I

C. CONTENIDOS

I. RECOLECCIÓN DE DATOS

1.1. Introducción a la estadística:


Tipos de muestra
Edición, Codificación
Recolección de datos

1.2. Distribución de frecuencias de una muestra:


Clasificación ordenada

MAT. MAURICIO GARCIA PAG 9


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Tabulación de datos
1.3. Construcción de tablas de frecuencia:
Número apropiado de agrupamientos de clase
1.4. Representación gráfica de datos agrupados y sin agrupar:
Histogramas
Polígonos de frecuencia
Diagrama de tallo y hojas
1.5. Medidas de Tendencia Central:
Media aritmética, Mediana, Moda
1.6. Medidas de dispersión y asimetría:
Diagrama de Pareto
Diagrama de caja y bigote
1.7. Percentiles

D. ASESORÍA DIDÁCTICA I

PREGUNTAS DE AUTOEVALUACION
(Las respuestas están al final del capítulo)

1. La población es el conjunto de todos los elementos en estudio a) Verdadero b) Falso


2. Para construir un polígono de frecuencia es necesario primero realizar un Histograma
a) Verdadero b) Falso
3. Cuando se construye una tabla de frecuencias, el número de clases de intervalos depende del
a) tamaño de la muestra b) de que sean números reales o enteros.
4. Una parte de la población en estudio recibe el nombre de ……………………
5. Una gráfica cuya distribución es acumulativa recibe el nombre de ……………………
6. Indique con sus propias palabras la diferencia entre variables aleatorias continuas y discretas.
Ponga un ejemplo de cada uno.
7. Se desea tomar una muestra de las opiniones del desempeño de los 130 asambleistas sobre la
nueva constitución. Indique a) ¿cuál es la muestra? b) ¿Cuál es la población?
8. El valor que recibe más frecuentemente se repite se conoce como mediana
a) Verdadero b) Falso
9. Las medidas de dispersión de un conjunto de datos mide el punto central de éstos.
a) Verdadero b) Falso
10. Ordene los siguientes pasos para el cálculo de la mediana de un conjunto de datos a) Obtener
la media aritmética de los valores centrales b) ordenar de menor a mayor los datos c)
Ninguno de los anteriores.
11. ¿Cuál de las siguientes medidas son de centralización: a) mediana b) moda c) media d) todas
las anteriores
12. Puede darse el caso de que la media aritmética sea negativa a) Verdadero b) Falso. ¿Porqué?

13. Puede darse el caso de que la desviación típica sea negativa a) Verdadero b) Falso. ¿Porqué?
14. La diferencia entre el valor más alto y más bajo recibe el nombre de ………………….

MAT. MAURICIO GARCIA PAG 10


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
15. Bajo que condición es más confiable la mediana que la media en lo que respecta a sus datos
a) por el tamaño de la muestra b) por la gran dispersión que presenta la muestra c) por ser tener
variables cualitativas

1. INTRODUCCION

Definición. FRECUENCIA ABSOLUTA O FRECUENCIA ( f)

Representa el número de veces que más frecuentemente aparece un valor determinado x del conjunto de
datos, previamente deben ordenarse dicho conjunto de datos.

Definición. FRECUENCIA RELATIVA ( fr)

Se obtiene dividiendo cada valor de la columna de la frecuencia por el tamaño de muestra.

Definición. FRECUENCIA ACUMULADA (fa.)


En esta columna van todos aquellos valores de X que corresponden a la frecuencia, y que se van
acumulando o sumando con los valores anteriores
Definición. FRECUENCIA RELATIVA ACUMULADA (f.r.a)
Se obtiene dividiendo cada valor de la frecuencia acumulada por el tamaño de la muestra.
Ejemplos.
1. Una de las preguntas realizadas en una encuesta a 36 personas, se refiere al número de teléfonos
móviles que ha tenido, y los resultados son los siguientes:

1 5 1 3 3 2 3 3 0
3 2 2 3 0 1 1 0 2
1 4 2 3 3 0 4 4 2 Determine la distribución de
1 2 3 3 2 1 4 5 2
frecuencias f, fr y fra, de los
siguientes datos sin agrupar, pero antes, especifique el tipo de variable que se estudia.
Solución: La variable que se estudia es el número de teléfonos que posee cada encuestado.
A continuación se tiene el siguiente cuadro de frecuencias, previamente ordenado dicho conjunto de
datos:

NÚMERO DE TELEFONOS MOVILES

MAT. MAURICIO GARCIA PAG 11


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
FRECUENCIA
FRECUENCIA FRECUENCIA RELATIVA
MUESTRA FRECUENCIA RELATIVA ACUMULADA ACUMULADA
0 4 0,11 4 0,11
1 7 0,19 11 0,31
2 9 0,25 20 0,56
3 10 0,28 30 0,83
4 4 0,11 34 0,94
5 2 0,06 36 1,00
TOTAL 36 1

Se puede observar claramente que existen 10 personas que manifestaron poseer hasta tres teléfonos
móviles, esto representa el 27.8%, además el 83.35% de los encuestados indicó que tuvieron entre 0 a 3
teléfonos móviles. Los demás resultados se interpretan de manera análoga.
Observaciones:
a) Se puede indicar del ejercicio anterior que la suma de la columna de la frecuencia siempre deberá ser
igual a tamaño de la muestra, a manera de comprobación.
b) Además la suma de la columna de la frecuencia relativa, debe dar siempre uno.
c) El último valor de la frecuencia acumulada debe ser siempre igual al del tamaño de la muestra
d) El último valor de la columna de la frecuencia relativa acumulada, siempre, debe ser de 1 o 100%.

2. Construcción de Intervalos de Clase

En el caso que se deseen agrupar los datos, datos agrupados, existen varias maneras de elegir los
límites de clase. Indicaremos un conjunto de pasos para la elección del número de clases. Se
decidirá el número de clases que interesa, esto dependerá del número del tamaño de la muestra.
1. Número recomendado de clases de acuerdo al tamaño de la muestra,

Tamaño de la Muestra No de Clases


Menos de 16 Datos insuficientes
De 16 - 31 5
De 32 – 63 6
De 64 – 127 7

De 128 – 255 8
De 256 - 511 9
De 512 - 1023 10
De1024 - 2047 11
De 2048 - 4095 12
De 4096 - 8190 13

MAT. MAURICIO GARCIA PAG 12


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

2. Se calcula el rango de los datos que es la diferencia entre el máximo y el mínimo.


3. Se divide el rango para el número de intervalos elegidos aproximándolo al entero
inmediatamente superior, llamado h. Luego se sugiere que si los datos son enteros, se deben
disminuir 0.5 al valor mínimo y aumentar 0.5 al valor más alto, con la finalidad de asegurar que
todos los datos se encuentren en dichos intervalos. En caso de que los datos contengan un
decimal, se sugiere disminuir al valor mínimo 0.05 y aumentar 0.05 al valor más alto, y así
sucesivamente.
4. Los límites de cada clase restante, se obtienen al sumar el valor mínimo restado 0.5 con el valor
de h y así sucesivamente hasta llegar al valor máximo sumado 0.5, claro está si el conjunto de
datos es enteros.

Utilice los datos del ejemplo siguiente, para realizar una tabla de datos agrupados.
2. Los siguientes datos representan el número de horas semanal, trabajadas por 50 personas
encuestadas.
35 38 40 40 40
40 34 36 45 42
39 47 48 33 40
38 36 39 39 42
31 38 40 36 41
31 31 47 38 38
38 32 39 34 44
48 45 38 46 40
39 44 43 47 40
38 43 35 34 42

Para nuestro caso tenemos: que el valor superior es 48 y el valor inferior es 31, de acuerdo a los pasos

( 48 − 31)
anteriormente descritos, tenemos, = 2.83 ≈ 3 . Por tanto se puede comenzar en 30.5 a 33.5,
6
luego de33.5 a 36.5, etc., disminuimos 0.5 en el primer valor, para asegurarnos de que éste se incluya,
asimismo al último valor le sumamos 0.5 con el mismo fin, además debemos ir sumando tres en cada
nuevo intervalo de clase, obteniendo:

MAT. MAURICIO GARCIA PAG 13


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Datos agrupados de las horas trabajadas semanalmente

Porcentaje Porcentaje
Frequencia Porcentaje valido acumulativo
30.5 a 33.5 5 10,0 10,0 10,0
33.5 a 36.5 8 16,0 16,0 26,0
36.5 a 39.5 13 26,0 26,0 52,0
39.5 a 42.5 12 24,0 24,0 76,0
42.5 a 45.5 6 12,0 12,0 88,0
45.5 a 48.5 6 12,0 12,0 100,0
Total 50 100,0 100,0

Los comandos para transformar datos sin agrupar a datos agrupados son :

TransformeRecodeInto Different VariableSe selecciona la lista de variables por ejemplo


(Servicio)

En Output VariableSe escribe el nuevo nombre de la variable por ejemplo (horas1) Change
Luego hacer clic en Old and New Values....

Recodificamos la variable con los siguientes intervalosEn Range hacemos clic


Va el límite inferior hasta luego límite superior, va de 30.5 incluido el 33.5 por ejemplo, en New
ValuePoner 1, luego límite inferior 33.5 Through luego límite superior 36.5 en New ValuePoner 2
y así sucesivamentecontinueOK

3. Histogramas

Si se tiene un gran conjunto de datos, se puede utilizar los llamados histogramas, que son una
representación gráfica de barras verticales u horizontales.
Consiste en una serie de rectángulos que tienen su base en el eje horizontal con centros en las marcas
de clase, de longitud de igual tamaño y que son superficies proporcionales a las frecuencias de clase.
Definición: La marca de clase se obtiene sumando el límite inferior y superior dividiéndolos por
dos.

Con sólo observar la forma del histograma permite una idea de la familia de variables aleatorias a la
cual pertenece la variable que se analiza.
3. Utilice los datos de la tabla de datos agrupados anteriormente, para realizar un Histograma, para
lo cual tenemos:

MAT. MAURICIO GARCIA PAG 14


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

14

13
12
12

10

8
8

6
6 6
5
4

0
1,0 2,0 3,0 4,0 5,0 6,0

Datos agrupados de las horas trabajadas semanalmente

En el SPSS se tiene:
El comando sería: GraphsHistogra.... Variable (Servic4) OK

MAT. MAURICIO GARCIA PAG 15


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 16


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
30

26

20

18 18

14

10
10
8
6
Percent

0
1,00 2,00 3,00 4,00 5,00 6,00 7,00

VAR00001

Interpretación:

Se puede observar que el 26% de los departamentos pagan entre $160 a $ 180 mensualmente.

AnalyzeDescriptive StatisticsExplorePlotsMarcar histogram y eliminar gráfico de tallo y


hojaOK

MAT. MAURICIO GARCIA PAG 17


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

y luego el siguiente cuadro:

y se obtiene el mismo gráfico anterior.

Además se puede graficar el polígono de frecuencia que consiste en unir los puntos medio de las
bases de los rectángulos, obteniéndose

14
NUMERO DE HORAS TRABAJADAS

12

10

4
30.5-33.5 33.5-36.5 36.5-39.5 39.5-42.5 42.5-45.5 45.5-48.5

DATOS AGRUPADOS

MAT. MAURICIO GARCIA PAG 18


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Para realizar el polígono de frecuencia en el SPSS tenemos:

GraphsLine..

DefineCategoria (Servic4) OK

30
PORCENTAJE DE ENCUESTADOS

20

10

0
1,00 2,00 3,00 4,00 5,00 6,00 7,00

SERVICIO4

MAT. MAURICIO GARCIA PAG 19


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

4. Gráfica de Distribución Acumulada (Ojivas)

Se puede estar interesado en utilizar la distribución de frecuencia acumulada de los datos. Para
aproximar una función de distribución acumulativa (fa), se puede usar la distribución acumulativa de
una variable aleatoria.

A partir de esta gráfica se puede responder preguntas como: ¿cuál es el porcentaje aproximado de la
variable en estudio durante las primeras n horas, n kilos, etc?., para lo cual se puede localizar dicho
punto en el eje horizontal y proyectar una línea horizontal hasta la ojiva y luego otra horizontal hasta el
eje vertical. Pero también se puede preguntar el proceso inverso, es decir, ¿qué tiempo o cantidad, etc,
representa el punto medio en el sentido de que la mitad de la variable en estudio falla en dicho momento
antes de llegar a él?

4. ¿Cuál es el porcentaje aproximado de horas trabajadas semanalmente durante las primeras 35 horas
de trabajo, del ejercicio anterior?

Solución: Al localizar el punto 35 en el eje horizontal y proyectar una línea vertical hasta la ojiva y
luego otra horizontal hasta el eje vertical como se ilustra en el gráfico, el porcentaje que interesa es
aproximadamente el 42%.

¿Además qué tiempo representa el punto medio en el sentido de que la mitad de las horas trabajadas
antes de llegar a 35 horas .
Esta pregunta se contesta al localizar 0.5 ( o 50%) en el eje vertical e invertir el proceso, la respuesta es
un poco más de 38 horas.

MAT. MAURICIO GARCIA PAG 20


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
120

100
frecuecia relativa acumulada

80

60

40

20

0
30.5 a 33.5 33.5 a 36.5 36.5 a 39.5 39.5 a 42.5 42.5 a 45.5 45.5 a 48.5

Horas trabajadas a la semana datos agrupados

5. Diagramas por Sectores. Diagrama de Pastel (Pie)

Se utilizan para representar distribuciones de frecuencia de variables cualitativas. Se representan en un


círculo cuyas porciones o sectores circulares tienen un área proporcional a las frecuencias absolutas a las
modalidades de la variable.
Se lo obtiene el ángulo central alfa α de la modalidad i-ésima cuya frecuencia absoluta es ni, y puede
expresarse como αi = 360 fi.
Otra forma habitual de construir gráficos de sectores consiste en asignar al sector circular un porcentaje
igual al tanto por ciento, que se puede expresar de la siguiente manera: pi = 100 fr.
5. Realice un diagrama de pastel para el siguiente conjunto de datos:

MAT. MAURICIO GARCIA PAG 21


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

y el resultado es:

Total de migrantes durante los últimos cinco años ( en porcentaje)

Otros

13,90

Italia
7,40

49,50
España

21,90

EEUU

Grafico 1

Para realizar el gráfico en el SPSS, debemos tener en cuenta:


1.
2. Ingresar los datos esto es :

MAT. MAURICIO GARCIA PAG 22


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Nos vamos a:

Luego

MAT. MAURICIO GARCIA PAG 23


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

y luego tenemos:

y el resultado es:

Total de migrantes durante los últimos cinco años ( en porcentaje)

Otros

13,90

Italia
7,40

49,50
España

21,90

EEUU

Grafico 1

MAT. MAURICIO GARCIA PAG 24


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

5. Diagrama de Tallo y Hoja

El diagrama de tallo y hoja permite determinar la idea de cómo se comporta ese


conjunto de datos, especialmente cuando el tamaño de muestra es moderado.
Existen varias formas de construir la distribución de una variable aleatoria continua. Una de ellas es
el diagrama de tallo y hoja creado por J. Tukey, el mismo que consta de una serie de filas
horizontales de números el cual tiene como rótulo un número llamado tallo, en tanto que los demás
números de las filas se llaman hojas. Existen distintas maneras de construir este tipo de diagramas,
para su construcción se sugiere:
1. Tratar que el primer dígito o los dos primeros dígitos de la muestra sean los que trabajen como
tallos.
2. Se escriben las filas con los tallos seleccionados.
3. Se reproduce gráficamente el conjunto de datos mediante el registro del dígito que sigue al tallo
como una hoja.
4. Para darse cuenta de la forma de la distribución se acuesta la gráfica sobre uno de sus lados.
Cuando los conjuntos de datos son grandes o no existe mucha variabilidad en los datos se utilizan
diagramas llamados de doble tallo y hoja, es decir, se trata de usar dos veces cada tallo.
6.. Los siguientes datos representan la cantidad de tiempo (en segundo) para llegar de 0 a 60 mph
durante una prueba de caminos para una muestra de 22 modelos de automóviles alemanes y una
muestra de 30 modelos de automóviles japoneses:
a) Desarrolle la clasificación ordenada b) Forme el diagrama de tallo y hoja.

Automóviles Alemanes

10 7.9 7.1 8.6


6.4 6.9 8.7 8.3
8.5 6.4 7.5 6.7
5.5 6 5.4 6.9
5.1 4.9 8.5 8.8
10.9 8.9

MAT. MAURICIO GARCIA PAG 25


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Automóviles japoneses
9.4 9.3 5.7 8.2
8.9 6.3 8.3 9.7
6.7 9.1 9.5 11.7
7.2 6.8 8 6.5
8.5 7.1 9.5 10.5
12.5

Solución: Escogeremos a los números enteros, como el tallo y los decimales como la hoja, casos como
valores 6.3, 6.5, 6.7 y 6.8. Se escoge el número 6 como tallo y se agrupa a los decimales 3,5,7 y 8 como
se muestra en la gráfica .

MODELO JAPONÉS

FREC. TALLO & HOJA

1,00 5. 7
4,00 6 . 3578
2,00 7 . 12
5,00 8 . 02359
6,00 9 . 134557
1,00 10 . 5
1,00 11 . 7
1,00 12 . 5

MODELO AMERICANO

FREC. TALLO & HOJA

1,00 4. 9
3,00 5 . 145
6,00 6 . 044799
3,00 7 . 159
7,00 8 . 3556789
,00 9.
2,00 10 . 09

Interpretación:

De este diagrama de tallo y hojas se pueden sacar varias conclusiones:

1. El menor número de segundos que se demora para llegar de 0 a 60 millas por hora durante una
prueba de caminos de un carro japonés es de 5.7 segundos y el de mayor es de 12.5 segundos, en
tanto el del americano es de 4.9 segundos y 10.9 segundos respectivamente.

MAT. MAURICIO GARCIA PAG 26


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Siete carros japoneses se demoraron menos de 8 segundos en tanto 13 carros americanos se demoraron
menos de 8 segundos. La mayor concentración de autos que se demoraron es de entre 8 a 9 segundos
para los japoneses, y los americanos de 8 segundos. Se observa también que 6 carros japoneses se
demoraron entre 9.1 a 9.7 segundos en tanto existieron 7 carros americanos que se demoraron entre 8.3 y
8.9 segundos

En el SPSS, debemos hacer:

AnalyzeDescriptive StatisticsExploreEscoger variablesPlotsstem and leafcontinueOK

7. Representación de las Distribuciones

Existen términos específicos para mostrar diversos comportamientos de los datos, entre las que
tenemos:
a) Llamada curva normal ( o también campana de Gauss ó sombrero de guardián). Esta distribución
es la más importante de las distribuciones, en Estadística, pues en la mayoría de situaciones reales,
los datos, se comportan de esta manera, en la que la media, mediana y moda tienen los mismos
valores.
Como ejemplos podemos citar las estaturas de los hombres en una determinada universidad, la edad
de las mujeres de todos los colegios de un país, el peso de los niños de primer ciclo básico, en las
escuelas públicas.
b) Distribución rectangular
Tiene una frecuencia constante o igual en un intervalo dado, además de ser simétrica. Como
ejemplos tenemos: El número de nacimientos registrados en un país determinado, es
aproximadamente igual, para cada día de la semana. Asimismo el número de nacimientos registrados
en los distintos meses del año, es aproximadamente igual, del número de lanzamientos de una
moneda cuando es lanzada miles de veces, el número de caras va a ser aproximadamente el mismo
que de sellos.
c) Existen aproximadamente dos tipos de distribuciones asimétricas, la una es llamada asimétrica
positiva.
Se dice positiva cuando la curva se extiende hacia la derecha. Ejemplos de aquellos valores altos de
la distribución podrán ser la edad de los graduados, ya que la mayoría se gradúan en una
determinada edad, pero existen muy pocos que se gradúan posteriormente a esa edad. También

MAT. MAURICIO GARCIA PAG 27


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
podría mencionarse el ingreso familiar anual, pues la mayoría gana muy poco y unos pocos ganan
mucho.

Se dice negativa cuando la curva se extiende hacia la izquierda. Ejemplos de aquellos valores bajos
de la distribución podrán ser las notas obtenidas, de un examen muy elemental, pues la mayoría
tendría buena calificación y unos pocos tendrían mala calificación.

1. Medidas de Centralización

Analizaremos a continuación tres medidas. Las más importantes con la media, mediana y moda que
permitirán determinar los valores centrales de un conjunto de datos.
El símbolo Xj se lee X sub j”, y representa cualquier valor de las frecuencias de un conjunto de números
dados.
La variable j se llama subíndice o índice o variable muda y puede ser cualquier letra del alfabeto, es
decir Xr, Xk, Xp, etc. Así en la serie de números 8,4,5,7, la posición X3 es 5, y así sucesivamente.
Se utiliza la letra griega mayúscula sigma, que representa la suma de un conjunto de números dados,
n
∑ , además ∑x
i =1
i se lee sumatoria de i= 1 hasta n, de X sub i, donde i toma valores enteros desde 1 ,
2, .., n.
PROPIEDADES DE LAS SUMATORIAS
n n n
1. ∑( x
i =1
i ± y i ) = ∑ xi ±
i =1
∑y
i =1
i

n n
2. ∑ axi = a ∑ xi
i =1 i =1
n
3. ∑=
i =1
n

8.1 Media Aritmética

La media aritmética en general resulta la medida de centralización más confiable, pues permite obtener
el promedio de un conjunto de datos.
a) La fórmula para la media aritmética de datos sin agrupar, viene dada por:

MAT. MAURICIO GARCIA PAG 28


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Se representa x , se lee media aritmética y se define como las suma de todos sus valores y está dividida
por el número de elementos, esto es:
n

∑x i
x1 + x 2 + ... + x n
x= i =1
=
n n

b) La fórmula para la media aritmética de datos agrupados, viene da por:


n

∑f x i i
f1 x1 + f 2 x 2 + ... + f n x n donde fi representa las frecuencias, la xi representa las
x= i =1
=
n n
marcas de clase.

8.2 Mediana
Representa la mediana. El 50% de los datos están por debajo de un valor específico y el otro 50% por
encima, de dicho valor dado.
Se deben primeramente ordenar los valores en forma ascendente.
a) La fórmula para la mediana de datos sin agrupar, viene dada por:
 n +1 
Si los datos son impares , la mediana viene dada por :  
 2 

 n   n  
Si los datos son pares, la mediana es el promedio de las posiciones:   y   + 1
 2   2  
b) La fórmula para la mediana de datos agrupados, viene dada por:

n 
 −∑f 
Me = Li +  2 * h donde
 f clase med 
 
 
n
Primeramente se debe calcular la clase mediana, para lo cual dividimos y de la columna de la
2
frecuencia sumamos acumuladamente, hasta que supere dicho valor.
Li representa el límite real inferior, el mismo que se obtiene calculando el promedio entre el límite
inferior de la clase mediana y el límite superior anterior a la clase mediana.
∑f representa la suma acumulada antes de la frecuencia de la clase mediana.
f clase med representa la frecuencia de la clase mediana.
h representa la diferencia del límite inferior y superior de la clase mediana.

MAT. MAURICIO GARCIA PAG 29


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
8.3 Moda
La moda nos indica el número de veces que más se repite en un conjunto de datos dados. Se simboliza
con Mo, es decir no necesita de fórmula.
Además la moda no puede existir. Pueden haber una moda (unimodal), dos modas (bimodal), etc.

a) La fórmula para la moda de datos agrupados, viene dada por:


 Θ1 
Mo = Li +   * h donde
 Θ1 + Θ 2 

Primeramente se debe calcular la clase modal para lo cual se deberá tomar el valor más alto de la
frecuencia, asimismo Li representa el límite real inferior, el mismo que se obtiene calculando el
promedio entre el límite inferior de la clase modal y el límite superior anterior a la clase modal.
Θ1 representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia

inmediatamente anterior.
Θ2 representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia
inmediatamente posterior.
h representa la diferencia del límite inferior y superior de la clase modal.
Ejemplos:
1. Halle la media, moda y mediana de las preguntas realizadas en una encuesta a 36 personas en lo que
se refiere al número de teléfonos móviles que ha tenido, y los resultados son los siguientes:
1 5 1 3 3 2 3 3 0
3 2 2 3 0 1 1 0 2
1 4 2 3 3 0 4 4 2
1 2 3 3 2 1 4 5 2
Solución: Podemos resumir en el siguiente cuadro, los índices estadísticos, de los datos sin agrupar,
obteniéndose:

MAT. MAURICIO GARCIA PAG 30


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

ÍNDICES ESTADÍSTICOS

teléfonos
N Muestra 36
Media 2,25
Mediana 2,00
Moda 3
Mínimo 0
Máximo 5

La interpretación nos indica que el promedio de número de celulares que han tenido los 36 encuestados
es de aproximadamente 2, además menos del 50% de los encuestados han tenido 2 celulares y más del
50% de los encuestados ha tenido más de dos celulares. El número de celulares que más veces han
tenido los encuestados es de 3. El mínimo de celulares de los encuestados ha sido ninguno y el máximo
que han tenido es de 5 celulares.
2. La siguiente tabla representa los ingresos mensuales, en dólares, de 20 trabajadores de una empresa.
a) halle la media moda y mediana b) ¿Qué conclusiones puede sacar? c) ¿Qué tipo de distribución
representa?.

Intervalo de clase
frecuencia
(en dólares)
100,5 120,5 2
120,5 140,5 3
140,5 160,5 5
160,5 180,5 5
180,5 200,5 3
200,5 220,5 2

Solución:
a) Calcularemos previamente la media aritmética para estos datos agrupados, para lo cual tenemos
los siguientes cálculos:

MAT. MAURICIO GARCIA PAG 31


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

frecuencia
Intervalo de clase fi
Marca de clase fi*Xi
(en dólares) Xi
100,5 120,5 2 110,5 221
120,5 140,5 3 130,5 391,5
140,5 160,5 5 150,5 752,5
160,5 180,5 5 170,5 852,5
180,5 200,5 3 190,5 571,5
200,5 220,5 2 210,5 421
20 3210

Luego ∑f x i i
3210 , esto nos indica que en promedio los salarios de los encuestados
x= i =1
=
= 160 .5
n 20
es de 160.5 dólares mensualmente.

n 20
Para hallar la mediana, calcularemos la clase mediana, esto es: = = 10 por lo que tenemos la suma
2 2
acumulativa en la columna de la frecuencia que cae en el intervalo 160.5 a 180.5, es decir que

160 .5 +160 .5
Li =
2
= 160 .5 , además ∑f = 2 + 3 + 5 = 10 , también f clase med =5

Finalmente, h= 180.5-160.5=20 , reemplazándolo en la fórmula respectiva, esto es:


n 
 −∑f  10 −10 
Me = Li +  2  * h = 160 .5 + 
  * 20 =160 .5 , esto nos indica que el 50% de los
 f clase med   5 
 
 
encuestados gana hasta 160.5 dólares mensuales y el otro 50% gasta más de 160.5 dólares mensuales.

Ahora calcularemos la moda. Para ello encontraremos la clase modal de la tabla. Se puede observar que
existen 2 modas, que serían el 5 en los intervalos de 140.5 a 160.5 y de 160.5 a180.5 respectivamente,
por lo que se puede escoger cualquiera de ellos, en nuestro caso escogemos como clase modal el
intervalo entre 140.5 a 160.5 , luego tenemos:
140 .5 +140 .5
Li = = 140 .5 , además Θ1 = 5 − 3 = 2 y Θ 2 = 5 − 5 = 0 con h= 160.5-140.5=20,
2
reemplazándolo tenemos:
 Θ1   2 
Mo = Li +   * h = 140.5 +   * 20 = 160.5 , esto nos indica que el valor que más ganan los
 Θ1 + Θ 2   2+ 0
trabajadores es de 160.5 dólares.
b) La conclusión es que los tres índices estadísticos de centralización son los mismos.

MAT. MAURICIO GARCIA PAG 32


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
c) Como la media, mediana y moda dieron exactamente los mismos resultados la forma de la
distribución de los datos se comporta en forma normal ó simétrica.

8.4 Medidas de Dispersión


La dispersión permite medir el grado de variación que tiene un conjunto de datos con respecto a la
media aritmética.
Dentro de los índices estadísticos de dispersión, el más importante y confiable es la desviación estándar
para datos sin agrupar que viene dada de la siguiente manera:
n

∑(x − x)
2
i
s= i =1

n −1
Donde xi representa, la posición de las frecuencias del conjunto de datos, x representa la media
aritmética de los datos sin agrupar.
La fórmula para datos agrupados de la desviación estándar viene dada por:
n

∑ f (x − x)
2
i i
donde fi representa las frecuencias, la xi las marcas de clase, x representa la media
s= i =1

n −1
aritmética de los datos agrupados.
La varianza no es sino el cuadrado de la desviación estándar, esto es s2.
2. Calcule la desviación estándar de los ingresos mensuales del ejemplo anterior.
Realizando los cálculos pertinentes, utilizando la fórmula de la desviación estándar de datos agrupados
tenemos:

frecuencia
Intervalo de clase Marca de clase (X I -media)² fi (X I -media)²
fi
(en dólares) Xi
100,5 120,5 2 110,5 2500 5000
120,5 140,5 3 130,5 900 2700
140,5 160,5 5 150,5 100 500
160,5 180,5 5 170,5 100 500
180,5 200,5 3 190,5 900 2700
200,5 220,5 2 210,5 2500 5000
20 16400

MAT. MAURICIO GARCIA PAG 33


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
n

∑ f (x − x)
2
i i
Luego, 16400
s= i =1
= = 29.38
n −1 20 − 1
Esto nos indica que la mayoría de los empleados encuestados gana entre 131.12 y 189.88 dólares
mensuales. ( ( x ± s ) .

8.5 El coeficiente de variación


Permite medir el grado de variación de un conjunto de datos, especialmente si se compara dos tipos de
datos con unidades distintas, se expresa en tanto por ciento y viene dada por:
S
CV = * 100
X
Ahora explicaremos las medidas de posición relativa para datos sin agrupar, que no es sino el interés
que se tiene en hallar un determinado valor con un porcentaje dado dentro del conjunto de datos,
previamente deben ser ordenados de menor a mayor.
Entre estas tenemos:
El primer cuartil Q1 , representa el 25% de la posición, es decir que el 25% de los datos se encuentra
( n + 1)
por debajo del valor encontrado. Se calcula Q1 = , si la división cae en la mitad redondee al
4
entero más próximo.
El segundo cuartil Q 2 o mediana, representa el 50% de la posición, es decir cuando el 50% de los
datos se encuentra por debajo del valor encontrado y el otro 50% por encima de un valor específico,
medida está analizada.
El tercer cuartil Q3 , representa el 75% de la posición, es decir el 75% de los datos se encuentra por
3 ( n + 1)
debajo del valor hallado. Se calcula Q3 = , si la división cae en la mitad, hay que redondear al
4
entero inmediato inferior.

Los centiles ( o percentiles) son números que dividen en 100 partes iguales un conjunto de datos
ordenados, dicho conjunto tiene 99 centiles.
El k-ésimo centil, Pk., representa un valor tal que el k% de los datos, es menor o igual que un valor
hallado.
La fórmula para determinar cualquier percentil para datos agrupados viene dado por:
 n * p −∑f 
P k = L i +  * h , donde
f 
 frec del int ervalo k 

MAT. MAURICIO GARCIA PAG 34


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Primeramente se debe hallar el intervalo de clase k, para lo cual multiplicamos n*p y sumamos
acumulativamente en la columna de la frecuencia, el valor que supere a dicho valor, éste será el
intervalo de clase k.
Li representa el límite real inferior, el mismo que se obtiene calculando el promedio entre el límite
inferior de la clase del intervalo k y el límite superior anterior a la clase del intervalo k.
k
p=
100
∑f representa la suma acumulada antes de la frecuencia de la clase del intervalo k f clase med

representa la frecuencia de la clase del intervalo k y


h representa la diferencia del límite inferior y superior de la clase del intervalo k.
Nótese que, a más de pedir el punto percentil k, se puede realizar también el proceso inverso. Dada una
cantidad, encuentre el valor de k menor o igual a dicho valor dado.
3. La siguiente tabla representa los ingresos mensuales, en dólares, de 20 trabajadores de una empresa.
a) halle el percentil 80 b) ¿Qué porcentaje de trabajadores ganan menos de 150 dólares mensuales ?.
Intervalo de clase
frecuencia
(en dólares)
100,5 120,5 2
120,5 140,5 3
140,5 160,5 5
160,5 180,5 5
180,5 200,5 3
200,5 220,5 2

Solución:
k 80
a) Tenemos que calcular el percentil 80, esto es k= 80, n=20. p = = = 0.8
100 100
Luego n*p=20*0.8=16, por tanto dicho valor se encuentra en el intervalo 180.5 a 200.5, así
16 −15 
P 80 = 180 .5 +   * 20 = 187.16, es decir el 80% de los empleados gana hasta 187.333333
 3 
dólares.

b) Como el valor de 150 dólares se encuentra en el intervalo de 140.5 a 160.5, entonces tenemos que
 k 
 n * p −∑f   20 * −5 
P k = L i +  * h esto implica que, 150 =140 .5 + 100 * 20 .Despejando k,
f   5 
 frec del int ervalo k  



tenemos que k=36.875%, es decir, el 36,875% de los encuestados gana hasta 150 dólares.
Para obtener los índices estadísticos básicos, en SPSS, se pueden realizar por varios procedimientos;

1. Analyze Descriptive StatisticsFrequenciesEscoger las variables cualitativas que uno desee,


puede escoger varias o una sola  StatisticsMarcar los que uno desee ContinueOK.

MAT. MAURICIO GARCIA PAG 35


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

2. Analyze Descriptive StatisticsDescriptiveEscoger las variables cualitativas que uno desee,


puede escoger varias o una sola  Options ContinueOK.

3. Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede
escoger varias o una sola  ContinueOK. Nótese que además aquí nos calcula el intervalo de
confianza para la media poblacional.

8.6 Diagrama de Caja y Bigote


Analiza y resume un conjunto de datos de una variable dada. Permite describir si existe o no la simetría
de los datos, además permite hallar valores que no son comunes al conjunto de datos, y asimismo, se
analiza si se ajusta dicho conjunto de datos a una distribución de frecuencias determinadas.
Se utilizan cinco números, que son el mínimo, el primer cuartil, la mediana, el tercer cuartil y el
máximo, de izquierda a derecha.
Pueden existir valores atípicos (outliers) que pueden estar a la izquierda del bigote izquierdo y a la
derecha del bigote derecho.
La interpretación indica que si la mediana está en el centro de la caja (entre el primer cuartil y el tercer
cuartil) los datos se comportan en forma normal, esto es:

4. Utilice los siguientes datos, para realizar un diagrama de caja y bigote.


Los siguientes datos representan el número de horas trabajadas semanalmente por 50 personas
encuestadas.

Asimétrica hacia la derecha


35 38 40 40 40
40 34 36 45 42
39 47 48 33 40
38 36 39 39 42
31 38 40 36 41

MAT. MAURICIO GARCIA PAG 36


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
31 31 47 38 38
38 32 39 34 44
48 45 38 46 40
39 44 43 47 40
38 43 35 34 42

Calculando los índices estadísticos respectivos tenemos:

.
Índices estadísticos

NUMEROS
N Muestra 50
Valores
0
perdidos
Mínimo 31
Máximo 48
Percentiles 25 36,00
50 39,00
75 42,25

Y cuyo gráfico es:

MAT. MAURICIO GARCIA PAG 37


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Horas trabajadas semanalmente

20 30 40 50

El gráfico de caja y bigotes presenta una caja central dividida en dos áreas por una línea vertical y dos
segmentos horizontales (bigotes) que parten del centro de cada lado vertical de la caja. La caja central
encierra el 50% de la frecuencia. El sistema dibuja la mediana como una línea vertical en el interior de la
caja. Si la línea está en el centro de la caja no hay asimetría de la variable, que es este nuestro caso, por
lo tanto los datos se comportan como una distribución simétrica o normal.
Para realizar los gráficos de caja y bigote en SPSS debe tomar en cuenta :

Graph Boxplot... Summaries of separate variables Define... Escoger las variables cualitativas
que uno desee graficar, puede escoger una o varias variables OK, o también:

Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede
escoger varias o una sola  PlotMarcar caja y bigoteBorrar las demás opciones ContinueOK

MAT. MAURICIO GARCIA PAG 38


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. VERDADERO 2. VERDADERO 3. a) 4, MUESTRA 5. OJIVA 7. a) NO EXISTE b) 130


8. FALSO 9. FALSO 10. b) a) 11. d) 12. a) 13. b) NO EXISTEN RAÍCES DE NÚMEROS
NEGATIVOS EN LOS REALES 14. RANGO. 15. b)

UNIDAD II
INTRODUCCIÓN A LA PROBABILIDAD

PREGUNTAS DE AUTOEVALUACION
1. El conjunto de todos los resultados posibles se llama ……………………………
2. Una probabilidad subjetiva se puede decir que es una hipótesis bien estructurada
a) Verdadero b) Falso
3. La notación de una probabilidad condicionada viene dada por P(AB) a) Verdadero b) Falso
4. Dos sucesos son mutuamente excluyentes si cumple P(AB)=P(A)P(B) a) Verdadero b) Falso
5. La probabilidad de que al lanzar una moneda que caiga de filo es: a) 0 b) 1 c) Ninguno de los
anteriores
6 .Un suceso es una condición particular de un ………………………………………….
7. Al lanzar un par de dados, halle el evento de que su suma sea siete y su producto 12
a) (3,4) b) (4,3) c) (4,3) (3,4) d) (5,2)(2,5) e) Ninguna de las anteriores
8. La probabilidad de un evento se define como……………………………………………

2.1. Rol de la probabilidad en la estadística:


Definición de eventos y espacio muestral
Definición de probabilidad, Propiedades
2.2. Tablas de frecuencia, Tablas de probabilidades, Tablas de contingencia
2.3. Probabilidad condicional:
Árboles de decisión
Independencia estadística
2.4. Eventos independientes:
Regla de la multiplicación
2.5. Participaciones, Probabilidad total y teorema de Bayes:
2.6. Análisis combinatorio: Combinaciones y Permutaciones

ASESORÍA DIDÁCTICA II

La teoría de probabilidades nace a principios del siglo XVII como resultado de investigaciones sobre
distintos tipos de juego de azar. Entre los más destacados exponentes se encuentran Fermat, Bernoulli,
Gauss y Laplace, que dan la mayor formalidad y rigurosidad matemática a la teoría de las
Probabilidades.
Esta teoría de Probabilidades, analiza las leyes que gobiernan ciertos tipos de fenómenos llamados
fenómenos aleatorios, que buscan un modelo matemático que se acerque o se aproxime al
comportamiento de dichos fenómenos.

MAT. MAURICIO GARCIA PAG 39


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Se define el suceso o evento, de un experimento aleatorio, como una característica o particularidad del
mismo, se lo denota con cualquier letra mayúscula.
En tanto un espacio muestral, es el conjunto de todos los resultados posibles de un experimento, lo
simbolizaremos como la letra E.
Existe una manera alternativa de representar un conjunto de resultados posibles, mediante lo que se
conoce como diagrama de árbol, el mismo que se encuentra trazado como un círculo pequeño a la
izquierda, representado por el tronco del árbol.

2.1 Teoría de las Probabilidades

Definición.- Sea E un espacio muestral, mediante una función P, a todo evento de A se le asocia un
número real, llamado probabilidad de A, que se lo denota P(A), es decir
1. P: A → [ 0,1]
A  P ( A)
Esto nos indica que la probabilidad siempre variará entre 0 y 1 o entre 0% y 100%.

2. P( E ) = 1, esto nos indica que la probabilidad del espacio muestral siempre será 1 o 100%.
3. P ( A ∪ B ) = P ( A) + P ( B ) si A ∩B = Φ

2.2 Propiedades de las Probabilidades

En base a los tres axiomas anteriores se pueden deducir las siguientes propiedades:

1. P( Φ) =0 , esto nos indica que la probabilidad de un evento imposible es cero.


2. Sea A un evento cualquiera, P ( A C ) =1 − P ( A) , es decir la probabilidad de calcular 1 ó mas
eventos hasta n, se puede calcular el evento contrario y restar de 1.
3. Sean A y B, eventos cualesquiera, se tiene que:
P ( A ∩ B C ) = P( A − B ) = P ( A) − P ( A ∩ B )
4. P( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) si A ∩ B ≠ Φ
5. Si A, B, C son eventos cualesquiera se tiene que:
P( A ∪ B ∪ C ) = P( A) + P ( B ) + P (C ) − P ( A ∩ B ) − P ( A ∩ C ) − P ( B ∩ C ) + P ( A ∩ B ∩ C )
6
. Muchas veces se necesita calcular la probabilidad de un evento Una vez que se ha producido
otro, en expresiones en un experimento, tales como “dado”, “si”, “si se conoce”, “si se sabe”,etc,
se debe utilizar la probabilidad condicional, la expresión P(A/B), se lee la probabilidad de A
dado B y se define
P( A ∩ B)
P( A / B ) = si P( B) ≠ 0
P( B)
7. Dos sucesos son mutuamente excluyentes si se cumple que
P ( A ∩B ) =0

8. Dos sucesos son independientes si la ocurrencia del uno no incide en la


ocurrencia del otro evento, esto es

P ( A ∩ B ) = P ( A) * P ( B ) ó
P ( A / B ) = P ( A) ó P ( B / A) = P ( B )

MAT. MAURICIO GARCIA PAG 40


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

EJERCICIOS

1. Se lanza una moneda y se observa si cae por cara, se lanza una moneda, si cae por sello se lanza
por segunda vez.
De acuerdo a las condiciones del problema, tenemos que:

C
S
S
C
S

Luego el espacio muestral sería: E = {CC , CS , SCC , SCS , SSC , SSS }

2. Se lanza un par de dados. Encontrar la probabilidad de que el máximo de los dos


números resultantes sea mayor que 4
3. Se saca al azar de una caja que contiene 6 bolas rojas, 4 blancas y 5 azules. Determine la
probabilidad de que la bola a) no sea roja b) sea roja o blanca
4. Encuentre la probabilidad de no obtener un 7 u 11 en la suma del lanzamiento de dos dados.
5. Si P ( A ∩B ) =0.9 y P ( B) =0.6, halle P( A B)

6. Los siguientes datos representan el tiempo en segundos que se demoran 50


programas en ser compilados:

MAT. MAURICIO GARCIA PAG 41


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Valores Frecuencia
12 2
14 1
15 1
16 2
17 2
18 4
19 2
20 4
21 4
22 5
23 4
24 3
25 3
28 2
29 1
30 1
31 2
33 1
35 2
36 1
37 1
39 1
40 1

Halle la probabilidad de que un programa escogida al azar


• Dure entre 15 a 24 seg.
cf 31
Solución: definimos el evento A”. Dure entre 15 a 24 seg”, luego P( A) = cp = 50 = 0.62 ó 62%
Existe, por tanto, un 62% de probabilidades de que el programa dure entre 15 a 24 seg.

• Sea mayores de 25 seg,


Solución: definimos el evento B”, Mayor de 25 seg”, luego
cf 13
P( B) = = = 0.26 ó 26 %
cp 50
Existe, por tanto, un 22% de probabilidades de que el programa dure más de 25 seg.

• Dure entre 16 a 23 seg.

Solución: definimos el evento C” Dure entre 16 a 23 seg”, luego


cf 27
P (C ) = = = 0.54 ó 54 %
cp 50
Existe, por tanto, un 54% de probabilidades de que el programa dure entre 16 a 23 segundos.

MAT. MAURICIO GARCIA PAG 42


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
7. En un experimento para estudiar la diferencia entre hombres y mujeres que fuman o no, se
obtuvieron los siguientes datos:

No fuman Fumadores Grandes


moderados fumadores
Hombres 21 36 30
Mujeres 48 26 19

Si se elige al azar a una de estas personas, encuentre la probabilidad de que la persona


a) Sea mujer
b) Sea gran fumador
c) Sea hombre y no fume
d) Sea mujer o sea un fumador moderado
e) Si es hombre, ¿ cuál es la probabilidad de que sea fumador moderado?
Solución: a) De acuerdo a las condiciones definimos el evento A “sea mujer”
cf 93
P ( A) = = = 0.516 ó 51 .6%
cp 180
Luego, existe un 51.6% de probabilidades de que la persona escogida al azar sea mujer.
cf 49
b) Definimos el evento B “sea gran fumador” P( B) = cp = 180 = 0.27 ó 27 %
Luego, existe un 27% de probabilidades de que la persona escogida al azar sea un gran fumador.

cf 21
c) Definimos el evento C “sea hombre y no fume ” P(C ) = cp = 180 = 0.116 ó 11 .6%
Luego, existe un 11.6% de probabilidades de que la persona escogida al azar sea hombre y no fume.

d) Definimos el evento D “sea mujer ” y definimos el evento F” sea un fumador moderado” , por
tener la conjunción o, esto nos indica unión, por tanto tenemos:
93 62 26
P( D ∪ F ) = P( D) + P( F ) − P( D ∩ F ) = + − = 0.72 ó 72 %
180 180 180
Luego, existe un 72% de probabilidades de que la persona escogida al azar sea mujer o sea un fumador
moderado.

e) Definimos el evento dado que G “ es hombre ” y definimos el evento H” sea un fumador


moderado” , por tanto es una probabilidad condicional, esto es:
36
P( H ∩ G ) 180
P( H / G ) = = = 0.416
P( G ) 87
180
Por lo tanto, existe un 41,6% de probabilidades de que sabiendo de que es hombre, sea un fumador
moderado.

MAT. MAURICIO GARCIA PAG 43


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

TEOREMA DE BAYES

Una generalización para que el espacio muestral se divida en k subconjuntos, utiliza la llamada regla de
eliminación, mediante el siguiente:

Teorema. Si existen B1, B2. . . , Bk, y forman una partición o división del espacio muestral E, y cumple
que P( Bi ) ≠ 0 para i = 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, se tiene

k k
P ( A) = ∑ P ( Bi ∩ A) = ∑ P ( Bi ) P ( A / Bi )
i =1 i =1

Obsérvese que este teorema se aplica cuando se pide solamente la probabilidad de un evento simple
cualquiera.

Si ahora se considera encontrar la probabilidad condicional, se utiliza el llamado teorema de Bayes, esto
es:

Teorema. Si existen B1, B2. . . , Bk, y forman una partición o división del espacio muestral E, y cumple
que P ( Bi ) ≠ 0 para i = 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, tal que
P( Br ∩ A) P ( Br ) P ( A / Br )
P ( Br / A) = = para r = 1 ,2,...k
P ( A) ≠ 0 se tiene k k

∑ P( B
i =1
i ∩ A) ∑ P( B ) P( A / B )
i =1
i i

EJERCICIOS

8. Dentro de un grupo de empresas 2/5 son compañías anónimas y 3/5 son limitadas. De las
anónimas la mitad tiene utilidades menores a 5000 dólares, mientras que 2/3 de las limitadas
están en el mismo caso. Calcule la probabilidad de que: a) Una empresa elegida al azar tenga
más de 5000 dólares de utilidades, b) Una empresa elegida al azar tenga menos de 5000 dólares,
sea compañía limitada.

Solución: Realizaremos el diagrama de árbol,

MAT. MAURICIO GARCIA PAG 44


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

<$50000
CA
2/5
1/2 >$5000

2/3
<$5000

CL
3/5
>$5000

De acuerdo al gráfico tenemos:

a) Nótese que nos pide solamente un evento simple, por lo que aplicando el teorema de
eliminación, definiendo el evento A” más de 5000 dólares de utilidades”, buscamos el camino
que nos lleva a más de 5000 dólares de utilidades, luego
k k
2 1 3 1 2
P( A) = ∑ P( Bi ∩ A) = ∑ P( Bi ) P( A / Bi ) = * + * = = 0.40
i =1 i =1 5 2 5 3 5
Por lo que existe un 40% de probabilidades, de que la empresa tenga más de 5000 dólares de
utilidades.

b) Definamos el suceso A” menos de 5000 dólares “ y el evento B “sea compañía limitada “, es una
probabilidad condicionada, por lo que, aplicamos el teorema de Bayes, de acuerdo al gráfico
tenemos:
3 2
*
P( B ∩ A) 2
P ( B / A) = = 5 3 = = 0.66 = 66%
P( A) 2 1 3 2 3
* + *
5 2 5 3
Luego existe un 66% de probabilidades de que la empresa elegida al azar tenga menos de 5000
dólares sea compañía limitada.

i. Una compañía compra tubos de cemento a cuatro proveedores diferentes, la


compañía A proporciona 25% de los tubos, B 25%, C 35% y D 15%. La compañía A ofrece
tubos de buena calida con apenas el 4% de defectuosos, B con el 5% de defectuosos, C con el
2% y D con el 6% de defectuosos. A) ¿Cuál es el porcentaje de tubos defectuosos? b) En el
último envió, se halló un defectuoso. ¿Cuál es la probabilidad de que sea de la compañía C?

MAT. MAURICIO GARCIA PAG 45


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

ii. El departamento de crédito, reportó que el 40% de sus ventas, se pagan en


efectivo, 25% con cheque en el momento de la compra y 35% con tarjeta de crédito. Se realizan
compras por más de 80 dólares, pagándose el 30% de las compras en efectivo, 70% se las pagan
con cheque y 55% con tarjeta de crédito, usted ha comprado un artículo que cuesta $ 100. a)
¿ Cuál es la probabilidad de que haya pagado en cheque? b) en efectivo? c) con tarjeta de
crédito?

iii. Los registros de asalto en una ciudad nos indican que el 25% de ellos son muy violentos y el
75% no lo son. Se sabe también que se denuncian 90% de los muy violentos y el 70% de los no
violentos. a) cuál es la proporción total de delitos que se denuncian en la ciudad? b)¿ si se
conoce que se realizó un delito, ¿ cuál es la probabilidad de que el delito sea violento? Y cuál
que no sea violento?

2.3 COMBINACIONES

 n
Definición. Si de n objetos tomamos r a la vez, se denota
  , en el que el orden no importa. Este

 r
 n n!
  =
 r r!( − rn )!
denomina combinación, y se define

n! se lee n factorial y se define n! =n*(n-1)*(n-2)*…*3*2*1.


De acuerdo con la definición de combinación, se puede deducir las siguientes propiedades:

 n
1.
  = 1
 0
MAT. MAURICIO GARCIA PAG 46
UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

 n
2.
  = n
 1
 n
3.
  = 1
 n

 n  n 
4.
  =  
r   n− r

MAT. MAURICIO GARCIA PAG 47


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

n −  n−11 
5.
 = + 
r   r−1
EJERCICIOS

1. De un grupo de 15 contadores y 12 Financieros ¿ cuántos comités de 5 contadores y 3


financieros se pueden formar?

Solución: Se observa que el orden no importa por tanto, es una combinación, esto es:

MAT. MAURICIO GARCIA PAG 48


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

1  1! 2 5 2
 = * =6 6 0 6 6 0
53 !(1−5)3 ! 5 2
Por tanto existen 660660 formas de elegir 5 contadores de entre 15 y 3 financieros de entre 12.
2. De un grupo de 15 empresas ¿cuántos grupos de dos ó tres ó cuatro se pueden formar?
Solución: Obsérvese que el orden no importa, por tanto es una combinación, como dice la expresión
“ ó “ se suma esto es:

1 ! 1 5 5
+ = + =4 9 1 4 0
234!(1−) 34! 5
MAT. MAURICIO GARCIA PAG 49
UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Por tanto existen 49140 maneras de escoger 2 ó 3 ó 4 empresas de entre 15.

18. ¿De cuántas maneras pueden seleccionarse, 3 contadores, 4 financieros, 5


economistas con 7 contadores, 10 financieros y 8 economistas.
19. En un Campeonato de fútbol participan doce equipos, ¿ cuántos partidos deben jugarse si cada
equipo debe jugar con todos los otros?.

2.4 PERMUTACIONES

Definición: Una permutación es un arreglo de todos o parte de un conjunto de objetos o personas, en el


n!
que el orden importa, se define así: P (n, r ) = ( n − r ) !
De aquí se pueden deducir las siguientes propiedades:
1. El número de permutaciones de n objetos distintos es: P (n, n) = n !
2. El número de permutaciones de n objetos, dispuestos en forma de círculo es
(n -1) !

EJERCICIOS

iv. En una carrera intervienen 18 atletas. ¿ de cuántas maneras pueden distribuirse los
cinco primeros puestos?

Solución: Obsérvese que el orden si importa, por tanto es una permutación, luego tenemos:
18 !
P (18 ,5) = = 1028160 ,
(18 −5) !
luego existen 1028160 formas de llegar a los cinco primeros lugares.

v. Hallar cuántos números enteros de tres cifras pueden formarse con los 9 dígitos
1,2,3, …, 9 si a) los tres dígitos usados son diferentes b) los tres dígitos usados no son
necesariamente diferentes c) los enteros formados deben ser pares , permitiéndose la
repetición de dígitos.
vi. ¿De cuántas maneras posibles se pueden seleccionar 10 carpetas para un trabajo
si solamente hay cuatro vacantes posibles?
vii. En cuántas formas diferentes se pueden formarse 8 niños alrededor en un círculo

PROBABILIDAD USANDO EL ANALISIS COMBINATORIO

20. Se escoge al azar 3 empresas, de entre 15, de las cuales 5 son pequeñas empresas, hallar la
probabilidad de que: a) Ninguna sea pequeña empresa b)Exactamente una sea pequeña empresa
c) Por lo menos una sea pequeña empresa

MAT. MAURICIO GARCIA PAG 50


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
21. En una urna existen 9 bolas numeradas del 1 al 9, se extrae aleatoriamente dos bolas, cuál es la
probabilidad de que a) los dos números sean pares b) los dos sean impares c) el uno par y el otro
impar.
22. De un grupo de empresas 8 limitadas y 6 anónimas se escoge un comité de 4 para un trabajo
específico. ¿Cuál es la probabilidad de que el comité conste de de 2 compañías limitadas y 2
anónimas?

ACTIVIDADES DE APRENDIZAJE II

En el paquete estadístico SPSS se puede realizar el cruce de variables de la siguiente manera:


Analyze Descriptive Statistics Croostabs Row (variable 1) Column (variable 2) OK
Además se puede hacer el cruce de más de dos variables, por ejemplo de una base de datos tenemos:

1) Haga una clasificación cruzada de la sindicalización ( pregunta 14) con la satisfacción en el trabajo
(pregunta 9) en lo que respecta al sexo.

Analyze → Descriptive Statistics → Crosstabs…

MAT. MAURICIO GARCIA PAG 51


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Continue y luego OK, los resultados son:

Interpretación:

Nótese que existen 89 hombres que no son miembros del sindicato y que están muy satisfechos con su
satisfaccion con el trabajo * sexo del encuestado * MIEMBRO DEL SINDICATO Crosstabulation

Count
MIEMBRO DEL sexo del encuestado
SINDICATO masculino femenino Total
SI satisfaccion MUY SATISFECHO 19 9 28
con el MODERADAMENTE
trabajo 20 8 28
SATISFECHO
UN POCO SATISFECHO 7 1 8
MUY INSATISFECHO 2 3 5
Total 48 21 69
NO satisfaccion MUY SATISFECHO 89 68 157
con el MODERADAMENTE
trabajo 80 63 143
SATISFECHO
UN POCO SATISFECHO 12 7 19
MUY INSATISFECHO 4 8 12
Total 185 146 331

trabajo. Adviértase que existe una sola mujer que pertenece al sindicato y esta un poco satisfecha con su
trabajo, además existen tan sólo 21mujeres en total que pertenecen al sindicato.

MAT. MAURICIO GARCIA PAG 52


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. ESPACIO MUESTRAL 2. VERDADERO 3.FALSO 4, FALSO 5.a) 6. EXPERIMENTO 7. c)

UNIDAD III

II. DISTRIBUCIÓN DE PROBABILIDADES DISCRETAS Y CONTINUAS

PREGUNTAS DE AUTOEVALUACION

viii. Determine la diferencia en lo que corresponde a sus parámetros, al aplicar la


Distribución Binomial y la Hipergeométrica
ix. ¿Es la distribución de Poisson una variable aleatoria continua? a) verdadero b)
Falso
x. Como también es llamada la Distribución Normal …………………………
xi. Para que un conjunto de datos se considere que es normal, la media, mediana y
moda deben ser iguales a) Verdadero b) Falso
xii. El área bajo cualquier curva es 1 ó 100% a) verdadero b) Falso
xiii. La distribución que se analiza fracasos y éxitos es la distribución …………
xiv. La distribución en que el suceso es constante para cada intervalo temporal es
llamado…………………………………………
xv. La probabilidad de que el evento no es constante entre ensayos se llama
………………………..

3.1. Variables aleatorias:


Definición
Tipos
Propiedades

3.2. Distribución de probabilidad para una variable aleatoria discreta: Definición. Propiedades
Valor esperado y desviación estándar

3.3. Distribución de probabilidad binomial: de Poisson, Hipergeométrica y Binomial Negativa.


Definiciones, propiedades y características
Modelos matemáticos
Características y propiedades

3.4. Variables aleatorias continuas:


Definición
Función de densidad de probabilidad
Propiedades

MAT. MAURICIO GARCIA PAG 53


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
3.5. Distribución normal:
Naturaleza e importancia
Propiedades y modelo matemático
Manejo de la tabla

3.6. Aplicaciones de la curva normal:


Cálculo de probabilidades con la variable tipificada

ASESORÍA DIDÁCTICA III

Existen las llamadas variables aleatorias (va), que son funciones que asocian un número real a cada
elemento del espacio muestral.

Las variables aleatorias se clasifican en discretas y continuas. Las variables aleatorias discretas (vad),
son aquellas variables que toman valores enteros, y se presentan generalmente por medio de una tabla.
En cambio las variables aleatorias continuas ( vac), son aquellas variables que toman valores en una
escala continua, es decir cualquier número real en un intervalo dado, no es posible representarlas en
forma tabular.

Existen además funciones de densidad de probabilidades (fdp) tanto para vad como para vac, que deben
cumplir básicamente dos cosas: que la probabilidad varíe siempre entre 0 y 1 y que la suma de las
probabilidades sea 1 para las vad, y en el caso de las vac que el área bajo cualquier curva de siempre 1.

Analizaremos las siguientes variables aleatorias discretas:

A. VARIABLES DISCRETAS

Definición. Se dice que una variable aleatoria (v.a) es una función f: A → ℜ , donde A representa el
espacio muestral y ℜ los números reales.

Existen dos tipos de variables aleatorias, las discretas y continuas.

Definición. Un espacio que contienen un número finito de posibilidades o infinita con igual número de
elementos que números enteros, se conoce como espacio muestral discreto.

Definición. Un espacio que contienen un número infinito de posibilidades iguales número de


elementos de los números reales, se conoce como espacio muestral continuo.

Una variable aleatoria discreta toma cada uno de sus valores con alguna probabilidad, por lo que se
puede dar la siguiente:

Definición. Una función de densidad es llamada de probabilidades (f.d.a) si cumple:

MAT. MAURICIO GARCIA PAG 54


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
n
Para una variables aleatoria discreta X si : 1) 0 ≤ P ( A) ≤1 2) ∑ p ( x) = 1
i =1

+∞

b) Para una variable aleatoria continua X, si: 1) 0 ≤ P ( A) ≤1 2) ∫ p( x)dx


−∞
= 1 , recordar

que
b

∫ p( x)dx = a ≤ x ≤ b ,
a

1. Distribución Binomial

Definición: Sea x una variable aleatoria discreta (vad), en la que se realizan n pruebas independientes y
la probabilidad de que sucedan k veces un suceso viene dado por la siguiente función de densidad de
probabilidades (fdp)

  n  k n− k
   p (1 − p) , k = 0 , 1 , n, ∈ 2Ζ , 3 . . .
P( n, k, p) =   k 
 0 e on tc r ao s o

Donde n representa el tamaño de la muestra, k es el número de veces que ocurre un suceso, p la
probabilidad de ocurrencia.
Esta distribución Binomial, se aplica a) cuando cada ensayo tiene dos resultados posibles (éxito o
fracaso; si o no; verdadero o falso, etc) b) además existen n ensayos independientes repetidos c) la
probabilidad de éxitos o aciertos , permanece constante de un experimento a otro d) los experimentos
son independientes. La v.a binomial k es la cuenta del número de ensayos exitosos que ocurren, k toma
valores entre 0 y n.

Además se pueden deducir las siguientes propiedades:


1. La esperanza matemática o media ó promedio viene dado por E(x)=np
2. La desviación estándar, es S = n * p * (1 − p )

Utilice La tabla de la distribución Binomial del apéndice I, es acumulativa

La distribución binomial que presenta el programa es acumulativo es decir va desde k=0 hasta el k que
se desee. TransformeCompute y

MAT. MAURICIO GARCIA PAG 55


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Obsérvese que CDF nos permite calcular el área acumulativa dado el punto.

Ejemplo:

1. La probabilidad de que una empresa pague sus utilidades a tiempo, es de 0.3. a) Determine la
probabilidad que de 6 empresas escogidas al azar hasta 2 paguen a tiempo. b) Calcule el promedio
de empresas que paguen sus utilidades a tiempo.

Solución: De acuerdo a las condiciones de los datos tenemos: n=6; p=0.3 y k=0,1,2.
Utilizando la distribución Binomial, tenemos:

  n  k n− k
P( n, k, p) =    p (1 − p)
  k

MAT. MAURICIO GARCIA PAG 56


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

 6  0 6 1 5  6 2 4
P(6;0;0.3)+ P(6;1;0.3)+ P(6;2;0.3)=
0.3(1−)+ 0.3(1−)=7 4 4 3
0 1 2
Por tanto existe un 74.43% de las probabilidades de que hasta 2 empresas paguen sus utilidades a
tiempo.

b) Nos pide la esperanza matemática, esto es: E(x)=np= 6*0.3=1.8, por tanto el promedio del número de
empresas que paguen sus utilidades a tiempo es aproximadamente 2.

2. Distribución de Poisson

Definición: Si el tamaño de la muestra es demasiado grande y la probabilidad muy pequeña, utilizar


la distribución binomial resulta bastante tedioso, por lo que se aconseja utilizar la distribución de
Poisson que viene dada por:

 e− λ × λ k
 , k = 0 , 1 , 2. , 3 . . .
P ( k , λ ) =  k!
 0 e no t cr oa s o

Donde λ= np, e=2.718281…., k es el número de veces que ocurre un suceso.
Además, para tener un mayor grado de seguridad, en la aplicación de la Distribución de Poisson se
sugiere utilizar la siguiente regla empírica, esto es:

MAT. MAURICIO GARCIA PAG 57


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
1. Si se cumple que np≤ 5 y si n≥50, se aplica la distribución de Poisson ó
2. Si se cumple que p≤ 0.10 se aplica la distribución de Poisson, pero si no cumplen los dos,
entonces se aplica la distribución Binomial.

Además se pueden deducir las siguientes propiedades:

1. La probabilidad de ocurrencia en un intervalo dado es independiente de la ocurrencia en otro


intervalo.
2. La probabilidad de que se de resultado en un intervalo muy corto es proporcional a la magnitud
del intervalo de tiempo, y no tiene nada que ver con la cantidad de resultados que se produzcan
fuera de ese intervalo.
3. La probabilidad es despreciable cuando se produce mas de un resultado en ese intervalo.
4. La esperanza matemática o media, viene dada por E(x)=λ=np
5. La desviación estándar, es S = λ

Utilice La tabla acumulativa del la distribución de Poisson del apéndice II


La distribución de Poisson que presenta el programa es acumulativo es decir va desde k=0 hasta el k que
se desee. TransformeCompute y

Ejemplo 2.

Si la probabilidad de que una persona cometa al menos un error al declarar su impuesto a la renta, es del
0.001. Determine la probabilidad de que entre 2000 personas más de 2 cometan un error en su
declaración.

Solución: Obsérvese que se tiene que n=2000; p=0.001; y k= 3,4,…,2000


Podemos hacer cumplir las condiciones, np=0.001*2000=2≤ 5 y si n=2000≥50, se aplica entonces la
distribución de Poisson, para lo cual calcularemos el evento contrario esto es k= 0,1,2,es decir: λ=n*p=
0.001*2000=2

e −λ × λk
P ( k , λ) =  , reemplazándolo tenemos:
 k!
e −2 × 2 0 e −2 × 21 e −2 × 2 2
P ( 0,2 ) + P (1,2 ) + P( 2,2 ) = + + = 0.6767 , ahora bien como queremos el evento
0! 1! 2!
contrario tenemos1-0.6767= 0.3233, por tanto existe un 32.33%, de probabilidades de que más de dos
personas cometan al menos un error en su declaración.

3. Distribución Hipergeométrica

MAT. MAURICIO GARCIA PAG 58


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Definición: Se aplica cuando el tamaño de muestra, n, con respecto al tamaño de la población, N, no es
muy grande, además de que se tiene una característica, x, y el número de veces que ocurre un suceso, k,
se utiliza

  x  N − x
  
k  n− k +
 K= 0,12. nk x n-.k≤≤ N-xn. N∈ Ζ; . ,
P ( n, N k , x ) =   N 
  
n 

0 e o c n ta r s o o
Obsérvese que se necesita cuatro parámetros, para utilizar esta distribución.
Además se pueden deducir las siguientes propiedades:
nx
1. La esperanza matemática o media viene dada por E(x)=
N

x ( N − r ) n( N − n ) )
2. La desviación estándar, es S =
N 2 ( N − 1)

MAT. MAURICIO GARCIA PAG 59


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
También la tabla es acumulativa desde un k=0 a un k determinado,con el siguiente comando:
TransformeCompute y

Ejemplo 3.

En una clase en la que hay 20 estudiantes, 15 están insatisfechos con el texto que se utiliza. Si se le
preguntara acerca del texto a una muestra aleatoria de cuatro estudiantes, determine la probabilidad de
que exactamente tres de ellos estén insatisfechos con el texto.
Solución: De acuerdo a los datos se observa que N=20; como 4 son elegidos al azar, n=4 ; la
característica o particularidad es x=15 y k= 3,el evento a ser contestado, utilizando la distribución
Hipergeométrica, tenemos:

MAT. MAURICIO GARCIA PAG 60


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

  x N − x  1  5 5
    
k  n−k 31
=
P(4,231)=  N 20 =5.4 0 6 9 5
, por tanto existe un 46.95% de probabilidades de que tres personas estén insatisfechos

    
n  4

MAT. MAURICIO GARCIA PAG 61
UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
con el texto guía.

B. DISTRIBUCIONES CONTINUAS

4. Distribución Normal

Una de las funciones, de variables aleatorias continuas (v.a.c) más importantes en Estadística, es la
llamada Distribución Normal o Campana de Gauss o Curva Simétrica, que se presenta con frecuencia en
las aplicaciones reales, viene dada por:

Definición: Una variable aleatoria x tiene una distribución normal, llamado variable aleatoria normal
cuya función de densidad de probabilidades viene expresada por:

e −(1 / 2 ) [( x −x ) / s ] ,−
1 2

p ( x; x; s ) = ∞ ≤ x ≤ +∞ con s > 0 , π = 3.14159 ... y e = 2.71828 ... ,


s 2π
cuyo gráfico es:

Propiedades:
xvi. La moda tiene su máximo en la media aritmética
xvii. La curva es simétrica con respecto al eje y.
xviii. El área bajo la curva es de 1 ó 100%.
xix. Las colas de la curva jamás cruzan el eje de las X, es decir se aproximan en forma
asintótica al eje horizontal.
xx. La tabla a utilizarse, calcula el área del punto a la izquierda, esto es:

MAT. MAURICIO GARCIA PAG 62


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Se han tabulado sus áreas, cuando x =0 y s =1 , ya que su fórmula de densidad, no puede integrarse
directamente, es decir, se utilizará la tabla estandarizada del apéndice III, y son valores de
−∞ 1
1 − x2
∫z 2π 2 dx
e

Si se desean realizar cálculos de probabilidades relacionadas con variables aleatorias distintas de la


distribución normal estándar, usamos el siguiente

Teorema. Sea x una distribución normal con media x y desviación estándar se tiene
x−x
z= (1), tiene la distribución normal estándar.
s

Para usar las tablas de distribución normal estandarizada ( con una media 0 y una desviación estándar de
1), en el programa se debe seguir : TransformeCompute Y

Esto nos permitirá encontrar el área dado el punto. El programa nos permite calcular el área del punto a
la izquierda.
Dada una distribución normal estandarizada determine las siguientes probabilidades:
a) Z sea lo más +1.08?
Solución: a) Como se calcula el área desde el punto a la izquierda tenemos:

Obteniendo como resultado un área de 0.8599 o el 85.99%

b) Este entre –0.21 y +0.18?


Se calcula el área entre –0.21 y +0.18

MAT. MAURICIO GARCIA PAG 63


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Obteniendo como resultado un área de 0.1546 o el 15.46%.

Ejemplo 4.

Las ventas diarias de una empresa, se comportan como una distribución normal, con media de 530
dólares y una desviación típica de 120 dólares, ¡cuál es la probabilidad de que las ventas excedan de 700
dólares en un día en particular?

Solución: De acuerdo a los datos tenemos: x = $530 ; s = $130 y x = 700 ,


Gráficamente tenemos:

x − x 700 − 530
Por tanto, utilizando z = = = 1.41 , utilizando la tabla de la curva normal( ver
s 130
apéndice III) , tenemos: A(-1.41)=0.0793 ó existe apenas un 7.93% de probabilidades de que el
propietario tenga ganancias superiores a $700 diarios.

Ejemplo 5.
Se sabe que el tiempo promedio para realizar una transacción, se comporta como una aproximación
normal, con una media de 70 minutos y una desviación estándar de 12 minutos. ¿cuánto debe durar
este tipo de transacciones, si se pretende que el 90% de las personas lo terminen?
Solución: De acuerdo a los datos tenemos: x = 70 ; s = $12 y Z = 90% , cuyo gráfico es:

MAT. MAURICIO GARCIA PAG 64


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
x−x
Para lo cual debemos despejar x, de la expresión: z = despejando x = z * s + x , luego de la tabla
s
de la curva norman observamos un valor que se aproxime a 0.90, esto es Z=1.28, reemplazando
tenemos:
x = z * s + x =1.28*12+70=85.36, por tanto para que el 90% de las personas terminen sus transacciones
debe durar como máximo 85.36 minutos.

Ejemplo 6.

Un análisis estadístico de 1000 llamadas telefónicas de larga distancia indica que la duración de estas
llamadas se distribuye normalmente con un media muestral de 240 segundos y una s= 40segundos

a. Qué porcentaje de estas llamadas duró al menos 180 segundos.


b. Cuál es la probabilidad de que una llamada particular dure entre 180 y 300 segundos.
c. Cuántas llamadas duraron menos de 180 segundos o más de 300 segundos.
d. Qué porcentaje de las llamadas duró entre 110 y 180 segundos
e. Cuál es la duración de una llamada particular si solo el 1% de todas las llamadas son las cortas.

Solución: Se utilizará el comando CDF.NORMAL, el mismo que nos encontrará el porcentaje para lo
cual nos pedirá el valor de x, la media y la desviación estándar.

a) El área que nos pide es de al menos de 180 segundos, esto es:

Usando los comandos del Spss tenemos:

Obteniendo como resultado un porcentaje del 6.68%. Existe apenas un 7% de probabilidades de que las
llamadas duren menos de 180 segundos.

b) El área esta entre 180 a 300 segundos, esto es :

MAT. MAURICIO GARCIA PAG 65


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

Obteniendo como resultado un porcentaje del 86.64%. Existe un porcentaje alto de 87% de que las
llamadas duren entre 180 a 300 segundos

c) Restar de 1 del área entre 180 a 300 segundos del item anterior esto es: 1-0.8664 = 0.1336, luego el
número de llamadas será de 133.6; o 134 llamadas.

d) Calcularemos el área entre 110 y 180 llamadas.

Al ir a Transform Compute... tenemos:

Obteniendo como resultado un porcentaje del 6.622%. Existe una baja probabilidad del 7% de que las
llamadas duren entre 110 y 180.

MAT. MAURICIO GARCIA PAG 66


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
e) Aquí debemos realizar el proceso inverso, esto es dado el área encontrar el punto, para lo cual iremos
a: TransformeCompute y (se utiliza IDF.NORMAL; el mismo que nos permite calcular el punto
dado el área, la media, y desviación estándar.

luego tenemos: x = z * s + x reemplazando nos da x =−2.33 * 40 + 240 =146 .8 seg.

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION

1. EN LA DISTRIBUCION BINOMIAL SE NECESITAN TRES PARAMETROS, EN TANTO


EN LA HIPERGEOMETRICA CUATRO PARAMETROS.
2. SIMETRICA O CAMPANA DE GAUSS
3. a)
4. a)
5. BINOMIAL
6. POISSON
7. HIPERGEOMETRICA

UNIDAD IV

MAT. MAURICIO GARCIA PAG 67


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
IV. DISTRIBUCIONES DE MUESTREO

PREGUNTAS DE AUTOEVALUACION

1. El parámetro es una característica de la muestra a) Verdadero b) Falso


2. Será fácil obtener la desviación típica de la población σ a) Verdadero b) Falso ¿por qué?
3. La media de todas las medias muestrales de una distribución muestral es llamada
………………………………………………….
4. El error muestral es la diferencia entre el estadístico y el parámetro desconocido
a) Verdadero b) Falso
5. Definir y poner un ejemplo de distribución muestral

4.1. Distribución muestral de la media:


Propiedades
Error estándar
Teorema del límite central
4.2. Distribución de la media:
Muestreo de poblaciones finitas, Distribución de la proporción

ASESORÍA DIDÁCTICA IV

A. DISTRIBUCIÓN DE MUESTREO

Básicamente la Inferencia Estadística trata de generalizar o inferir los resultados de una muestra hacia la
población o de un estadístico para inferir el parámetro dado.
Definición: La distribución de probabilidad de un estadístico se conoce como distribución muestral.
Se define el error de muestreo como la diferencia existente entre el estadístico de la muestra y el
parámetro poblacional, con la finalidad de estimar el parámetro.
La distribución de las medias muestrales no es sino el conjunto de todas las medias muestrales dadas.

Lo mismo podemos definir para el error estándar de la distribución muestral, que no es otra cosa que el
grado de variación alrededor de la media poblacional.

A continuación se realizará la diferencia de notación entre los parámetros y los estadísticos.

Nombre Estadísticos( Muestra) Parámetros (Población)


Media x μ
Desviación Estándar s Σ
Varianza s2 σ2
Tamaño n N
Proporción p̂ P

MAT. MAURICIO GARCIA PAG 68


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Diferencia de medias x1 − x 2 µ1 − µ2
Diferencia de Proporciones p1 − p 2 P1 − P2

B. TEOREMA DEL LÍMITE CENTRAL

Es uno de los teoremas más importantes dentro de la Estadística , este teorema lo que nos indica es que,
a medida que el tamaño de muestra es grande, la distribución de medias muestrales se va aproximando a
x −µ
z=
una curva normal con σ
n
Teorema. Si X 1 , X 2 , ... X n forman una muestra aleatoria que tiene una población infinita con media
x −µ
z=
μ, la varianza σ entonces
2 σ cuando n → ∞, es la distribución estándar.
n
Y en la práctica, se utiliza esta aproximación cuando n ≥ 30 , sin contar la forma de la población que se
estudia.

Ejemplos

8. Los depósitos medios en un banco son de $7012, con una desviación típica de $532, y sigue una
distribución normal. Si se escoge al azar una muestra de 35 depósitos ¿cuál es la probabilidad de
que la media sea superior a $6911?

Solución. De acuerdo a los datos podemos observar que μ=$7012; σ=$532 y


x > $6911, y cuyo gráfico es:

x −µ 6911 − 7012
z= = = −1.12
por lo que utilizando σ 532 , por lo que tenemos que A(-1.12)=0.1314, es
n 35
decir, existe (1-0.1314) 86.86% de probabilidades de que los depósitos sean superiores a $6911.

ACTIVIDADES DE APRENDIZAJE IV

MAT. MAURICIO GARCIA PAG 69


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
2. Una población normal tiene una media de 180 dólares de ingreso y una desviación estándar de
36. Se selecciona al azar una muestra aleatoria de 25 personas, calcule la probabilidad de que las
medias muestrales sea: a) mayor que 185 b) Menor que 177 c) Entre 175 y 186.
3. El número medio de refrigeradoras que se venden anualmente, en una ciudad es de 950, con una
desviación estándar de 210. Si se selecciona una muestra de 70 clientes, cuál es la probabilidad
de que la media esté por debajo de 910?
4. Un auditor sobre una población de 1.000 ctas por cobrar adopta 36 de ellas, determinando que el
valor promedio de esa ctas por cobrar es de USD $ 2.600 y σ = USD $ 450,00. ¿ Cuál es la
probabilidad de que la muestra sea inferior a USD $ 2.500?.

5. El gerente de la empresa se encuentra preocupado por la cantidad de montos que adeuda a 236
proveedores sobre los cuales establece un promedio de USD $22.500 y una desviación estándar
de de USD $ 4.000. Para el efecto adopta una muestrea de 30 proveedores y se pregunta.

a. ¿Qué posibilidad existe de que las deudas sean superiores a USD $ 30.000?
b. ¿Qué posibilidad existe de que las deudas sean inferiores a USD $ 18.000?.

6. Se conoce que la desviación típica al realizar una operación manufacturera es de 10.2 minutos, con
una media de 37.2 minutos. ¿Cuál es la probabilidad de que se demore en promedio más de 35 minutos
en las últimas 32 piezas producidas?
.
DISTRIBUCIONES MUESTRALES DE PROPORCIONES

También se pueden tratar de proporciones o porcentajes de la población P, es decir, se trata de estimar


una proporción muestral p̂ , para estimar un parámetro poblacional P y su expresión viene dada por:
pˆ − P
z= x
P (1 − P ) , donde pˆ = , con x como una característica o particularidad del evento.
n
n

Ejemplo 2. Si se sabe que el 32% de las empresas tiene cuentas por cobrar, al escoger 100
empresas, ¿cuál es la probabilidad de que más de 40 tengan cuentas por cobrar?
x 40
Solución: De acuerdo a los datos tenemos: P=32%; n=100 ;, pˆ = = = 0.4 , cuyo gráfico es:
n 100

MAT. MAURICIO GARCIA PAG 70


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
pˆ − P 0.4 − 0.32
z= = = 1.71
utilizando P (1 − P ) 0.32 * (1 − 0.32 ) luego A(-1.71) = 0.0436, por tanto existe una
n 100
probabilidad bastante pequeña, de apenas el 4.32% de que más de 40 empresas tengan cuentas por
cobrar.

ACTIVIDADES DE APRENDIZAJE IV

6. Según algunos estudios, el 48% de las personas consumen dulces, con mucha frecuencia, si se
selecciona al azar a 100 personas a) cuál es la probabilidad de que la proporción muestral sea
mayor que 0.6? b) este dentro de un intervalo entre 0.40 y 0.58

7. Una fábrica genera 8% de unidades defectuosas, se compra 200 unidades. ¿Cuál es la


probabilidad de que sean defectuosas menos de 12%?

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION


1. FALSO
2. FALSO
3. LA MEDIA GENERAL
4. VERDADERO

MAT. MAURICIO GARCIA PAG 71


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

APENDICE I

Tabla Acumulada de la Distribución Binomial

MAT. MAURICIO GARCIA PAG 72


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 73


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 74


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 75


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 76


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 77


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

APENDICE II
Tabla Acumulada de la Distribución de Poisson

MAT. MAURICIO GARCIA PAG 78


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 79


UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA

MAT. MAURICIO GARCIA PAG 80


GUIA METODOLOGICA DE ESTADISTICA DESCRIPTIVA

PERÍODO OCTUBRE 2006-MARZO 2007 PÁGINA 81


GUIA METODOLOGICA DE ESTADISTICA DESCRIPTIVA

APENDICE III
Tabla Acumulada de la Distribución Normal

PERÍODO OCTUBRE 2006-MARZO 2007 PÁGINA 82


GUIA METODOLOGICA DE ESTADISTICA DESCRIPTIVA

PERÍODO OCTUBRE 2006-MARZO 2007 PÁGINA 83


GUIA METODOLOGICA DE ESTADISTICA DESCRIPTIVA

BIBLIOGRAFIA:

 Anderson, D.; Sweeney, D; Williams, T. (2.001) “Estadística para Administración y


Economía”, México, Thomson, Séptima Edición.

 Berenson, M. y Levine, D. (1996) “ Estadística Básica en la Administración ”,


México, Prentice Hall, Sexta edición.

 Webster, A. (2000) “ Estadística Aplicada a los negocios y a la Economía”,


Bogotá , Irwin McGraw-Hill, Tercera edición.

 Mason, R. y Lind, D. (1998) “ Estadística para la Administración y Economía”,


México, Alfaomega, Octava edición.

 Freund, J. y Walpole, R. (1996) “Estadística Matemática con Aplicaciones”,


México, Prentice Hall, Cuarta edición.

 Hines,W. y Montgomery, D. (1992) “ Probabilidad y Estadística para Ingeniería y


Administración”, México, CECSA, Cuarta edición.

 Mendenhall, W (1990) “Estadística para Administradores”, México, Grupo editorial


Iberoamérica.

 Gujarati, D. (1994) “ Econometría”, México, McGrawHill, Segunda edición.

 Hanke, J. y Reitsch, A. (1996) “Pronósticos en los Negocios”, México, Prentice


Hall, Quinta edición.

 Manual del paquete estadístico computacional SPSS, versión 6.0 y 8.0 para
Windows.

 Monzon, D. “ Introducción al Diseño de Experimentos”, Maracay, Segunda edición.

 Salvatore, D. (1984) “Econometría”, México, McGrawHill.

 Walpole, R. y Myers, R. (1990) “ Probabilidad y Estadística para Ingenieros ”,


México, Interamericana, Tercera edición.

PERÍODO OCTUBRE 2006-MARZO 2007 PÁGINA 84

Vous aimerez peut-être aussi