Académique Documents
Professionnel Documents
Culture Documents
ESTADÍSTICA DESCRIPTIVA
INDICE
IMPORTANCIA DE LA ESTADÍSTICA..............................................................................................................5
A. OBJETIVO GENERAL DE LA ASIGNATURA:............................................................................................7
B. CONTENIDOS.....................................................................................................................................................7
PRIMER BIMESTRE..............................................................................................................................................9
UNIDAD I..................................................................................................................................................................9
C. CONTENIDOS.....................................................................................................................................................9
PREGUNTAS DE AUTOEVALUACION..........................................................................................................10
A) VERDADERO B) FALSO..............................................................................................................................10
8.EL VALOR QUE RECIBE MÁS FRECUENTEMENTE SE REPITE SE CONOCE COMO MEDIANA
................................................................................................................................................................................10
A) VERDADERO B) FALSO.............................................................................................................................10
A) VERDADERO B) FALSO.............................................................................................................................10
12. PUEDE DARSE EL CASO DE QUE LA MEDIA ARITMÉTICA SEA NEGATIVA A) VERDADERO
B) FALSO. ¿PORQUÉ?.......................................................................................................................................10
13. PUEDE DARSE EL CASO DE QUE LA DESVIACIÓN TÍPICA SEA NEGATIVA A) VERDADERO
B) FALSO. ¿PORQUÉ?.......................................................................................................................................11
14. LA DIFERENCIA ENTRE EL VALOR MÁS ALTO Y MÁS BAJO RECIBE EL NOMBRE DE
…………………....................................................................................................................................................11
15. BAJO QUE CONDICIÓN ES MÁS CONFIABLE LA MEDIANA QUE LA MEDIA EN LO QUE
RESPECTA A SUS DATOS................................................................................................................................11
1. INTRODUCCION..............................................................................................................................................11
2.CONSTRUCCIÓN DE INTERVALOS DE CLASE.....................................................................................................................12
3.HISTOGRAMAS ...........................................................................................................................................................14
4. GRÁFICA DE DISTRIBUCIÓN ACUMULADA (OJIVAS).......................................................................................................20
5. DIAGRAMAS POR SECTORES. DIAGRAMA DE PASTEL (PIE)...............................................................................................21
5.DIAGRAMA DE TALLO Y HOJA......................................................................................................................................25
7. REPRESENTACIÓN DE LAS DISTRIBUCIONES.....................................................................................................................27
1.MEDIDAS DE CENTRALIZACIÓN.....................................................................................................................................28
8.1 Media Aritmética..............................................................................................................................................28
UNIDAD II...............................................................................................................................................................39
INTRODUCCIÓN A LA PROBABILIDAD........................................................................................................39
PREGUNTAS DE AUTOEVALUACION..........................................................................................................39
UNIDAD III..........................................................................................................................................................53
PREGUNTAS DE AUTOEVALUACION..........................................................................................................53
A. VARIABLES DISCRETAS...............................................................................................................................54
1. DISTRIBUCIÓN BINOMIAL............................................................................................................................................55
2. DISTRIBUCIÓN DE POISSON.........................................................................................................................................57
3. DISTRIBUCIÓN HIPERGEOMÉTRICA................................................................................................................................58
B. DISTRIBUCIONES CONTINUAS.................................................................................................................62
4. DISTRIBUCIÓN NORMAL............................................................................................................................................62
UNIDAD IV.............................................................................................................................................................67
IV. DISTRIBUCIONES DE MUESTREO...........................................................................................................68
PREGUNTAS DE AUTOEVALUACION............................................................................................................68
1.EL PARÁMETRO ES UNA CARACTERÍSTICA DE LA MUESTRA A) VERDADERO B) FALSO.......................................................68
2.SERÁ FÁCIL OBTENER LA DESVIACIÓN TÍPICA DE LA POBLACIÓN Σ A) VERDADERO B) FALSO ¿POR QUÉ?............................68
3.LA MEDIA DE TODAS LAS MEDIAS MUESTRALES DE UNA DISTRIBUCIÓN MUESTRAL ES LLAMADA
………………………………………………….......................................................................................................68
4. EL ERROR MUESTRAL ES LA DIFERENCIA ENTRE EL ESTADÍSTICO Y EL PARÁMETRO DESCONOCIDO ....................................68
A) VERDADERO B) FALSO..............................................................................................................................................68
5.DEFINIR Y PONER UN EJEMPLO DE DISTRIBUCIÓN MUESTRAL...........................................................................................68
BIBLIOGRAFIA:.............................................................................................................................................84
• INFORMACIÓN DE LA ASIGNATURA
Estamos seguros de que al finalizar este curso, el estudiante será capaz de manejar los conceptos de
Estadística Descriptiva que le permitirán realizar posteriormente la toma de decisiones.
IMPORTANCIA DE LA ESTADÍSTICA
La complejidad de nuestro mundo, se hace más difícil tomar decisiones informadas e inteligentes. Con
frecuencia, estas decisiones se han de tomar con un conocimiento imperfecto de la situación y un grado
considerable de incertidumbre, sin embargo, las soluciones pertinentes son esenciales para nuestro
bienestar e incluso para nuestra supervivencia. Estamos expuestos a la presión constante de problemas
económicos angustiosos, como una inflación galopante, un sistema fiscal engorroso, oscilaciones
excesivas del ciclo económico, una deuda externa opresiva, un alto índice de delincuencia, tipos de
interés impredecibles.
Finanzas
Para estar al tanto de medidas financieras en el transcurso del tiempo
Para desarrollar formas de pronósticos de valores de estas medidas en momentos futuros
Administración
Para describir características de empleados dentro de una organización
Para mejorar la calidad de los productos o de los servicios procurados en la organización
Mercadeo
Para estimar la proporción de clientes que prefieren un producto en vez del otro y la razón de
esto
Para sacar conclusiones respecto a estrategias de publicidad que sería más útil para el incremento
de ventas de un producto
Los empresarios saben que los complejos problemas con que se enfrentan en el mundo de hoy exigen
soluciones cuantitativas y que tienen que estar acompañadas de dichos datos para tomar decisiones en
1
Tomado del libro “Estadística aplicada a la Empresa y Economía” de Allen Webster, 1998
1. Tomar decisiones.
2. Resolver problemas.
Estos dos aspectos pueden llevarse a cabo siguiendo procedimientos estadísticos.
B. CONTENIDOS
I. RECOLECCIÓN DE DATOS
Explicar por qué en muchas situaciones una muestra es la única forma posible de tener conocimiento
acerca de una población
Definir una distribución de muestreo de medias muestrales
Elaborar una distribución de muestreo de medias muestrales
Explicar el “teorema del límite central” y su importancia en la inferencia estadística.
Describir las características, forma, propiedades de las distribuciones T de student, F de Fisher y
Chi- Cuadrado
Manejar las tablas de las distribuciones continuas T de student, F de Fisher y Chi- Cuadrado.
PRIMER BIMESTRE
UNIDAD I
C. CONTENIDOS
I. RECOLECCIÓN DE DATOS
D. ASESORÍA DIDÁCTICA I
PREGUNTAS DE AUTOEVALUACION
(Las respuestas están al final del capítulo)
13. Puede darse el caso de que la desviación típica sea negativa a) Verdadero b) Falso. ¿Porqué?
14. La diferencia entre el valor más alto y más bajo recibe el nombre de ………………….
1. INTRODUCCION
Representa el número de veces que más frecuentemente aparece un valor determinado x del conjunto de
datos, previamente deben ordenarse dicho conjunto de datos.
1 5 1 3 3 2 3 3 0
3 2 2 3 0 1 1 0 2
1 4 2 3 3 0 4 4 2 Determine la distribución de
1 2 3 3 2 1 4 5 2
frecuencias f, fr y fra, de los
siguientes datos sin agrupar, pero antes, especifique el tipo de variable que se estudia.
Solución: La variable que se estudia es el número de teléfonos que posee cada encuestado.
A continuación se tiene el siguiente cuadro de frecuencias, previamente ordenado dicho conjunto de
datos:
Se puede observar claramente que existen 10 personas que manifestaron poseer hasta tres teléfonos
móviles, esto representa el 27.8%, además el 83.35% de los encuestados indicó que tuvieron entre 0 a 3
teléfonos móviles. Los demás resultados se interpretan de manera análoga.
Observaciones:
a) Se puede indicar del ejercicio anterior que la suma de la columna de la frecuencia siempre deberá ser
igual a tamaño de la muestra, a manera de comprobación.
b) Además la suma de la columna de la frecuencia relativa, debe dar siempre uno.
c) El último valor de la frecuencia acumulada debe ser siempre igual al del tamaño de la muestra
d) El último valor de la columna de la frecuencia relativa acumulada, siempre, debe ser de 1 o 100%.
En el caso que se deseen agrupar los datos, datos agrupados, existen varias maneras de elegir los
límites de clase. Indicaremos un conjunto de pasos para la elección del número de clases. Se
decidirá el número de clases que interesa, esto dependerá del número del tamaño de la muestra.
1. Número recomendado de clases de acuerdo al tamaño de la muestra,
De 128 – 255 8
De 256 - 511 9
De 512 - 1023 10
De1024 - 2047 11
De 2048 - 4095 12
De 4096 - 8190 13
Utilice los datos del ejemplo siguiente, para realizar una tabla de datos agrupados.
2. Los siguientes datos representan el número de horas semanal, trabajadas por 50 personas
encuestadas.
35 38 40 40 40
40 34 36 45 42
39 47 48 33 40
38 36 39 39 42
31 38 40 36 41
31 31 47 38 38
38 32 39 34 44
48 45 38 46 40
39 44 43 47 40
38 43 35 34 42
Para nuestro caso tenemos: que el valor superior es 48 y el valor inferior es 31, de acuerdo a los pasos
( 48 − 31)
anteriormente descritos, tenemos, = 2.83 ≈ 3 . Por tanto se puede comenzar en 30.5 a 33.5,
6
luego de33.5 a 36.5, etc., disminuimos 0.5 en el primer valor, para asegurarnos de que éste se incluya,
asimismo al último valor le sumamos 0.5 con el mismo fin, además debemos ir sumando tres en cada
nuevo intervalo de clase, obteniendo:
Porcentaje Porcentaje
Frequencia Porcentaje valido acumulativo
30.5 a 33.5 5 10,0 10,0 10,0
33.5 a 36.5 8 16,0 16,0 26,0
36.5 a 39.5 13 26,0 26,0 52,0
39.5 a 42.5 12 24,0 24,0 76,0
42.5 a 45.5 6 12,0 12,0 88,0
45.5 a 48.5 6 12,0 12,0 100,0
Total 50 100,0 100,0
Los comandos para transformar datos sin agrupar a datos agrupados son :
En Output VariableSe escribe el nuevo nombre de la variable por ejemplo (horas1) Change
Luego hacer clic en Old and New Values....
3. Histogramas
Si se tiene un gran conjunto de datos, se puede utilizar los llamados histogramas, que son una
representación gráfica de barras verticales u horizontales.
Consiste en una serie de rectángulos que tienen su base en el eje horizontal con centros en las marcas
de clase, de longitud de igual tamaño y que son superficies proporcionales a las frecuencias de clase.
Definición: La marca de clase se obtiene sumando el límite inferior y superior dividiéndolos por
dos.
Con sólo observar la forma del histograma permite una idea de la familia de variables aleatorias a la
cual pertenece la variable que se analiza.
3. Utilice los datos de la tabla de datos agrupados anteriormente, para realizar un Histograma, para
lo cual tenemos:
14
13
12
12
10
8
8
6
6 6
5
4
0
1,0 2,0 3,0 4,0 5,0 6,0
En el SPSS se tiene:
El comando sería: GraphsHistogra.... Variable (Servic4) OK
26
20
18 18
14
10
10
8
6
Percent
0
1,00 2,00 3,00 4,00 5,00 6,00 7,00
VAR00001
Interpretación:
Se puede observar que el 26% de los departamentos pagan entre $160 a $ 180 mensualmente.
Además se puede graficar el polígono de frecuencia que consiste en unir los puntos medio de las
bases de los rectángulos, obteniéndose
14
NUMERO DE HORAS TRABAJADAS
12
10
4
30.5-33.5 33.5-36.5 36.5-39.5 39.5-42.5 42.5-45.5 45.5-48.5
DATOS AGRUPADOS
GraphsLine..
30
PORCENTAJE DE ENCUESTADOS
20
10
0
1,00 2,00 3,00 4,00 5,00 6,00 7,00
SERVICIO4
Se puede estar interesado en utilizar la distribución de frecuencia acumulada de los datos. Para
aproximar una función de distribución acumulativa (fa), se puede usar la distribución acumulativa de
una variable aleatoria.
A partir de esta gráfica se puede responder preguntas como: ¿cuál es el porcentaje aproximado de la
variable en estudio durante las primeras n horas, n kilos, etc?., para lo cual se puede localizar dicho
punto en el eje horizontal y proyectar una línea horizontal hasta la ojiva y luego otra horizontal hasta el
eje vertical. Pero también se puede preguntar el proceso inverso, es decir, ¿qué tiempo o cantidad, etc,
representa el punto medio en el sentido de que la mitad de la variable en estudio falla en dicho momento
antes de llegar a él?
4. ¿Cuál es el porcentaje aproximado de horas trabajadas semanalmente durante las primeras 35 horas
de trabajo, del ejercicio anterior?
Solución: Al localizar el punto 35 en el eje horizontal y proyectar una línea vertical hasta la ojiva y
luego otra horizontal hasta el eje vertical como se ilustra en el gráfico, el porcentaje que interesa es
aproximadamente el 42%.
¿Además qué tiempo representa el punto medio en el sentido de que la mitad de las horas trabajadas
antes de llegar a 35 horas .
Esta pregunta se contesta al localizar 0.5 ( o 50%) en el eje vertical e invertir el proceso, la respuesta es
un poco más de 38 horas.
100
frecuecia relativa acumulada
80
60
40
20
0
30.5 a 33.5 33.5 a 36.5 36.5 a 39.5 39.5 a 42.5 42.5 a 45.5 45.5 a 48.5
y el resultado es:
Otros
13,90
Italia
7,40
49,50
España
21,90
EEUU
Grafico 1
Nos vamos a:
Luego
y luego tenemos:
y el resultado es:
Otros
13,90
Italia
7,40
49,50
España
21,90
EEUU
Grafico 1
Automóviles Alemanes
Automóviles japoneses
9.4 9.3 5.7 8.2
8.9 6.3 8.3 9.7
6.7 9.1 9.5 11.7
7.2 6.8 8 6.5
8.5 7.1 9.5 10.5
12.5
Solución: Escogeremos a los números enteros, como el tallo y los decimales como la hoja, casos como
valores 6.3, 6.5, 6.7 y 6.8. Se escoge el número 6 como tallo y se agrupa a los decimales 3,5,7 y 8 como
se muestra en la gráfica .
MODELO JAPONÉS
1,00 5. 7
4,00 6 . 3578
2,00 7 . 12
5,00 8 . 02359
6,00 9 . 134557
1,00 10 . 5
1,00 11 . 7
1,00 12 . 5
MODELO AMERICANO
1,00 4. 9
3,00 5 . 145
6,00 6 . 044799
3,00 7 . 159
7,00 8 . 3556789
,00 9.
2,00 10 . 09
Interpretación:
1. El menor número de segundos que se demora para llegar de 0 a 60 millas por hora durante una
prueba de caminos de un carro japonés es de 5.7 segundos y el de mayor es de 12.5 segundos, en
tanto el del americano es de 4.9 segundos y 10.9 segundos respectivamente.
Siete carros japoneses se demoraron menos de 8 segundos en tanto 13 carros americanos se demoraron
menos de 8 segundos. La mayor concentración de autos que se demoraron es de entre 8 a 9 segundos
para los japoneses, y los americanos de 8 segundos. Se observa también que 6 carros japoneses se
demoraron entre 9.1 a 9.7 segundos en tanto existieron 7 carros americanos que se demoraron entre 8.3 y
8.9 segundos
Existen términos específicos para mostrar diversos comportamientos de los datos, entre las que
tenemos:
a) Llamada curva normal ( o también campana de Gauss ó sombrero de guardián). Esta distribución
es la más importante de las distribuciones, en Estadística, pues en la mayoría de situaciones reales,
los datos, se comportan de esta manera, en la que la media, mediana y moda tienen los mismos
valores.
Como ejemplos podemos citar las estaturas de los hombres en una determinada universidad, la edad
de las mujeres de todos los colegios de un país, el peso de los niños de primer ciclo básico, en las
escuelas públicas.
b) Distribución rectangular
Tiene una frecuencia constante o igual en un intervalo dado, además de ser simétrica. Como
ejemplos tenemos: El número de nacimientos registrados en un país determinado, es
aproximadamente igual, para cada día de la semana. Asimismo el número de nacimientos registrados
en los distintos meses del año, es aproximadamente igual, del número de lanzamientos de una
moneda cuando es lanzada miles de veces, el número de caras va a ser aproximadamente el mismo
que de sellos.
c) Existen aproximadamente dos tipos de distribuciones asimétricas, la una es llamada asimétrica
positiva.
Se dice positiva cuando la curva se extiende hacia la derecha. Ejemplos de aquellos valores altos de
la distribución podrán ser la edad de los graduados, ya que la mayoría se gradúan en una
determinada edad, pero existen muy pocos que se gradúan posteriormente a esa edad. También
Se dice negativa cuando la curva se extiende hacia la izquierda. Ejemplos de aquellos valores bajos
de la distribución podrán ser las notas obtenidas, de un examen muy elemental, pues la mayoría
tendría buena calificación y unos pocos tendrían mala calificación.
1. Medidas de Centralización
Analizaremos a continuación tres medidas. Las más importantes con la media, mediana y moda que
permitirán determinar los valores centrales de un conjunto de datos.
El símbolo Xj se lee X sub j”, y representa cualquier valor de las frecuencias de un conjunto de números
dados.
La variable j se llama subíndice o índice o variable muda y puede ser cualquier letra del alfabeto, es
decir Xr, Xk, Xp, etc. Así en la serie de números 8,4,5,7, la posición X3 es 5, y así sucesivamente.
Se utiliza la letra griega mayúscula sigma, que representa la suma de un conjunto de números dados,
n
∑ , además ∑x
i =1
i se lee sumatoria de i= 1 hasta n, de X sub i, donde i toma valores enteros desde 1 ,
2, .., n.
PROPIEDADES DE LAS SUMATORIAS
n n n
1. ∑( x
i =1
i ± y i ) = ∑ xi ±
i =1
∑y
i =1
i
n n
2. ∑ axi = a ∑ xi
i =1 i =1
n
3. ∑=
i =1
n
La media aritmética en general resulta la medida de centralización más confiable, pues permite obtener
el promedio de un conjunto de datos.
a) La fórmula para la media aritmética de datos sin agrupar, viene dada por:
∑x i
x1 + x 2 + ... + x n
x= i =1
=
n n
∑f x i i
f1 x1 + f 2 x 2 + ... + f n x n donde fi representa las frecuencias, la xi representa las
x= i =1
=
n n
marcas de clase.
8.2 Mediana
Representa la mediana. El 50% de los datos están por debajo de un valor específico y el otro 50% por
encima, de dicho valor dado.
Se deben primeramente ordenar los valores en forma ascendente.
a) La fórmula para la mediana de datos sin agrupar, viene dada por:
n +1
Si los datos son impares , la mediana viene dada por :
2
n n
Si los datos son pares, la mediana es el promedio de las posiciones: y + 1
2 2
b) La fórmula para la mediana de datos agrupados, viene dada por:
n
−∑f
Me = Li + 2 * h donde
f clase med
n
Primeramente se debe calcular la clase mediana, para lo cual dividimos y de la columna de la
2
frecuencia sumamos acumuladamente, hasta que supere dicho valor.
Li representa el límite real inferior, el mismo que se obtiene calculando el promedio entre el límite
inferior de la clase mediana y el límite superior anterior a la clase mediana.
∑f representa la suma acumulada antes de la frecuencia de la clase mediana.
f clase med representa la frecuencia de la clase mediana.
h representa la diferencia del límite inferior y superior de la clase mediana.
Primeramente se debe calcular la clase modal para lo cual se deberá tomar el valor más alto de la
frecuencia, asimismo Li representa el límite real inferior, el mismo que se obtiene calculando el
promedio entre el límite inferior de la clase modal y el límite superior anterior a la clase modal.
Θ1 representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia
inmediatamente anterior.
Θ2 representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia
inmediatamente posterior.
h representa la diferencia del límite inferior y superior de la clase modal.
Ejemplos:
1. Halle la media, moda y mediana de las preguntas realizadas en una encuesta a 36 personas en lo que
se refiere al número de teléfonos móviles que ha tenido, y los resultados son los siguientes:
1 5 1 3 3 2 3 3 0
3 2 2 3 0 1 1 0 2
1 4 2 3 3 0 4 4 2
1 2 3 3 2 1 4 5 2
Solución: Podemos resumir en el siguiente cuadro, los índices estadísticos, de los datos sin agrupar,
obteniéndose:
ÍNDICES ESTADÍSTICOS
teléfonos
N Muestra 36
Media 2,25
Mediana 2,00
Moda 3
Mínimo 0
Máximo 5
La interpretación nos indica que el promedio de número de celulares que han tenido los 36 encuestados
es de aproximadamente 2, además menos del 50% de los encuestados han tenido 2 celulares y más del
50% de los encuestados ha tenido más de dos celulares. El número de celulares que más veces han
tenido los encuestados es de 3. El mínimo de celulares de los encuestados ha sido ninguno y el máximo
que han tenido es de 5 celulares.
2. La siguiente tabla representa los ingresos mensuales, en dólares, de 20 trabajadores de una empresa.
a) halle la media moda y mediana b) ¿Qué conclusiones puede sacar? c) ¿Qué tipo de distribución
representa?.
Intervalo de clase
frecuencia
(en dólares)
100,5 120,5 2
120,5 140,5 3
140,5 160,5 5
160,5 180,5 5
180,5 200,5 3
200,5 220,5 2
Solución:
a) Calcularemos previamente la media aritmética para estos datos agrupados, para lo cual tenemos
los siguientes cálculos:
frecuencia
Intervalo de clase fi
Marca de clase fi*Xi
(en dólares) Xi
100,5 120,5 2 110,5 221
120,5 140,5 3 130,5 391,5
140,5 160,5 5 150,5 752,5
160,5 180,5 5 170,5 852,5
180,5 200,5 3 190,5 571,5
200,5 220,5 2 210,5 421
20 3210
Luego ∑f x i i
3210 , esto nos indica que en promedio los salarios de los encuestados
x= i =1
=
= 160 .5
n 20
es de 160.5 dólares mensualmente.
n 20
Para hallar la mediana, calcularemos la clase mediana, esto es: = = 10 por lo que tenemos la suma
2 2
acumulativa en la columna de la frecuencia que cae en el intervalo 160.5 a 180.5, es decir que
160 .5 +160 .5
Li =
2
= 160 .5 , además ∑f = 2 + 3 + 5 = 10 , también f clase med =5
Ahora calcularemos la moda. Para ello encontraremos la clase modal de la tabla. Se puede observar que
existen 2 modas, que serían el 5 en los intervalos de 140.5 a 160.5 y de 160.5 a180.5 respectivamente,
por lo que se puede escoger cualquiera de ellos, en nuestro caso escogemos como clase modal el
intervalo entre 140.5 a 160.5 , luego tenemos:
140 .5 +140 .5
Li = = 140 .5 , además Θ1 = 5 − 3 = 2 y Θ 2 = 5 − 5 = 0 con h= 160.5-140.5=20,
2
reemplazándolo tenemos:
Θ1 2
Mo = Li + * h = 140.5 + * 20 = 160.5 , esto nos indica que el valor que más ganan los
Θ1 + Θ 2 2+ 0
trabajadores es de 160.5 dólares.
b) La conclusión es que los tres índices estadísticos de centralización son los mismos.
∑(x − x)
2
i
s= i =1
n −1
Donde xi representa, la posición de las frecuencias del conjunto de datos, x representa la media
aritmética de los datos sin agrupar.
La fórmula para datos agrupados de la desviación estándar viene dada por:
n
∑ f (x − x)
2
i i
donde fi representa las frecuencias, la xi las marcas de clase, x representa la media
s= i =1
n −1
aritmética de los datos agrupados.
La varianza no es sino el cuadrado de la desviación estándar, esto es s2.
2. Calcule la desviación estándar de los ingresos mensuales del ejemplo anterior.
Realizando los cálculos pertinentes, utilizando la fórmula de la desviación estándar de datos agrupados
tenemos:
frecuencia
Intervalo de clase Marca de clase (X I -media)² fi (X I -media)²
fi
(en dólares) Xi
100,5 120,5 2 110,5 2500 5000
120,5 140,5 3 130,5 900 2700
140,5 160,5 5 150,5 100 500
160,5 180,5 5 170,5 100 500
180,5 200,5 3 190,5 900 2700
200,5 220,5 2 210,5 2500 5000
20 16400
∑ f (x − x)
2
i i
Luego, 16400
s= i =1
= = 29.38
n −1 20 − 1
Esto nos indica que la mayoría de los empleados encuestados gana entre 131.12 y 189.88 dólares
mensuales. ( ( x ± s ) .
Los centiles ( o percentiles) son números que dividen en 100 partes iguales un conjunto de datos
ordenados, dicho conjunto tiene 99 centiles.
El k-ésimo centil, Pk., representa un valor tal que el k% de los datos, es menor o igual que un valor
hallado.
La fórmula para determinar cualquier percentil para datos agrupados viene dado por:
n * p −∑f
P k = L i + * h , donde
f
frec del int ervalo k
Solución:
k 80
a) Tenemos que calcular el percentil 80, esto es k= 80, n=20. p = = = 0.8
100 100
Luego n*p=20*0.8=16, por tanto dicho valor se encuentra en el intervalo 180.5 a 200.5, así
16 −15
P 80 = 180 .5 + * 20 = 187.16, es decir el 80% de los empleados gana hasta 187.333333
3
dólares.
b) Como el valor de 150 dólares se encuentra en el intervalo de 140.5 a 160.5, entonces tenemos que
k
n * p −∑f 20 * −5
P k = L i + * h esto implica que, 150 =140 .5 + 100 * 20 .Despejando k,
f 5
frec del int ervalo k
tenemos que k=36.875%, es decir, el 36,875% de los encuestados gana hasta 150 dólares.
Para obtener los índices estadísticos básicos, en SPSS, se pueden realizar por varios procedimientos;
3. Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede
escoger varias o una sola ContinueOK. Nótese que además aquí nos calcula el intervalo de
confianza para la media poblacional.
.
Índices estadísticos
NUMEROS
N Muestra 50
Valores
0
perdidos
Mínimo 31
Máximo 48
Percentiles 25 36,00
50 39,00
75 42,25
20 30 40 50
El gráfico de caja y bigotes presenta una caja central dividida en dos áreas por una línea vertical y dos
segmentos horizontales (bigotes) que parten del centro de cada lado vertical de la caja. La caja central
encierra el 50% de la frecuencia. El sistema dibuja la mediana como una línea vertical en el interior de la
caja. Si la línea está en el centro de la caja no hay asimetría de la variable, que es este nuestro caso, por
lo tanto los datos se comportan como una distribución simétrica o normal.
Para realizar los gráficos de caja y bigote en SPSS debe tomar en cuenta :
Graph Boxplot... Summaries of separate variables Define... Escoger las variables cualitativas
que uno desee graficar, puede escoger una o varias variables OK, o también:
Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede
escoger varias o una sola PlotMarcar caja y bigoteBorrar las demás opciones ContinueOK
UNIDAD II
INTRODUCCIÓN A LA PROBABILIDAD
PREGUNTAS DE AUTOEVALUACION
1. El conjunto de todos los resultados posibles se llama ……………………………
2. Una probabilidad subjetiva se puede decir que es una hipótesis bien estructurada
a) Verdadero b) Falso
3. La notación de una probabilidad condicionada viene dada por P(AB) a) Verdadero b) Falso
4. Dos sucesos son mutuamente excluyentes si cumple P(AB)=P(A)P(B) a) Verdadero b) Falso
5. La probabilidad de que al lanzar una moneda que caiga de filo es: a) 0 b) 1 c) Ninguno de los
anteriores
6 .Un suceso es una condición particular de un ………………………………………….
7. Al lanzar un par de dados, halle el evento de que su suma sea siete y su producto 12
a) (3,4) b) (4,3) c) (4,3) (3,4) d) (5,2)(2,5) e) Ninguna de las anteriores
8. La probabilidad de un evento se define como……………………………………………
ASESORÍA DIDÁCTICA II
La teoría de probabilidades nace a principios del siglo XVII como resultado de investigaciones sobre
distintos tipos de juego de azar. Entre los más destacados exponentes se encuentran Fermat, Bernoulli,
Gauss y Laplace, que dan la mayor formalidad y rigurosidad matemática a la teoría de las
Probabilidades.
Esta teoría de Probabilidades, analiza las leyes que gobiernan ciertos tipos de fenómenos llamados
fenómenos aleatorios, que buscan un modelo matemático que se acerque o se aproxime al
comportamiento de dichos fenómenos.
Definición.- Sea E un espacio muestral, mediante una función P, a todo evento de A se le asocia un
número real, llamado probabilidad de A, que se lo denota P(A), es decir
1. P: A → [ 0,1]
A P ( A)
Esto nos indica que la probabilidad siempre variará entre 0 y 1 o entre 0% y 100%.
2. P( E ) = 1, esto nos indica que la probabilidad del espacio muestral siempre será 1 o 100%.
3. P ( A ∪ B ) = P ( A) + P ( B ) si A ∩B = Φ
En base a los tres axiomas anteriores se pueden deducir las siguientes propiedades:
P ( A ∩ B ) = P ( A) * P ( B ) ó
P ( A / B ) = P ( A) ó P ( B / A) = P ( B )
EJERCICIOS
1. Se lanza una moneda y se observa si cae por cara, se lanza una moneda, si cae por sello se lanza
por segunda vez.
De acuerdo a las condiciones del problema, tenemos que:
C
S
S
C
S
cf 21
c) Definimos el evento C “sea hombre y no fume ” P(C ) = cp = 180 = 0.116 ó 11 .6%
Luego, existe un 11.6% de probabilidades de que la persona escogida al azar sea hombre y no fume.
d) Definimos el evento D “sea mujer ” y definimos el evento F” sea un fumador moderado” , por
tener la conjunción o, esto nos indica unión, por tanto tenemos:
93 62 26
P( D ∪ F ) = P( D) + P( F ) − P( D ∩ F ) = + − = 0.72 ó 72 %
180 180 180
Luego, existe un 72% de probabilidades de que la persona escogida al azar sea mujer o sea un fumador
moderado.
TEOREMA DE BAYES
Una generalización para que el espacio muestral se divida en k subconjuntos, utiliza la llamada regla de
eliminación, mediante el siguiente:
Teorema. Si existen B1, B2. . . , Bk, y forman una partición o división del espacio muestral E, y cumple
que P( Bi ) ≠ 0 para i = 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, se tiene
k k
P ( A) = ∑ P ( Bi ∩ A) = ∑ P ( Bi ) P ( A / Bi )
i =1 i =1
Obsérvese que este teorema se aplica cuando se pide solamente la probabilidad de un evento simple
cualquiera.
Si ahora se considera encontrar la probabilidad condicional, se utiliza el llamado teorema de Bayes, esto
es:
Teorema. Si existen B1, B2. . . , Bk, y forman una partición o división del espacio muestral E, y cumple
que P ( Bi ) ≠ 0 para i = 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, tal que
P( Br ∩ A) P ( Br ) P ( A / Br )
P ( Br / A) = = para r = 1 ,2,...k
P ( A) ≠ 0 se tiene k k
∑ P( B
i =1
i ∩ A) ∑ P( B ) P( A / B )
i =1
i i
EJERCICIOS
8. Dentro de un grupo de empresas 2/5 son compañías anónimas y 3/5 son limitadas. De las
anónimas la mitad tiene utilidades menores a 5000 dólares, mientras que 2/3 de las limitadas
están en el mismo caso. Calcule la probabilidad de que: a) Una empresa elegida al azar tenga
más de 5000 dólares de utilidades, b) Una empresa elegida al azar tenga menos de 5000 dólares,
sea compañía limitada.
<$50000
CA
2/5
1/2 >$5000
2/3
<$5000
CL
3/5
>$5000
a) Nótese que nos pide solamente un evento simple, por lo que aplicando el teorema de
eliminación, definiendo el evento A” más de 5000 dólares de utilidades”, buscamos el camino
que nos lleva a más de 5000 dólares de utilidades, luego
k k
2 1 3 1 2
P( A) = ∑ P( Bi ∩ A) = ∑ P( Bi ) P( A / Bi ) = * + * = = 0.40
i =1 i =1 5 2 5 3 5
Por lo que existe un 40% de probabilidades, de que la empresa tenga más de 5000 dólares de
utilidades.
b) Definamos el suceso A” menos de 5000 dólares “ y el evento B “sea compañía limitada “, es una
probabilidad condicionada, por lo que, aplicamos el teorema de Bayes, de acuerdo al gráfico
tenemos:
3 2
*
P( B ∩ A) 2
P ( B / A) = = 5 3 = = 0.66 = 66%
P( A) 2 1 3 2 3
* + *
5 2 5 3
Luego existe un 66% de probabilidades de que la empresa elegida al azar tenga menos de 5000
dólares sea compañía limitada.
iii. Los registros de asalto en una ciudad nos indican que el 25% de ellos son muy violentos y el
75% no lo son. Se sabe también que se denuncian 90% de los muy violentos y el 70% de los no
violentos. a) cuál es la proporción total de delitos que se denuncian en la ciudad? b)¿ si se
conoce que se realizó un delito, ¿ cuál es la probabilidad de que el delito sea violento? Y cuál
que no sea violento?
2.3 COMBINACIONES
n
Definición. Si de n objetos tomamos r a la vez, se denota
, en el que el orden no importa. Este
r
n n!
=
r r!( − rn )!
denomina combinación, y se define
n
1.
= 1
0
MAT. MAURICIO GARCIA PAG 46
UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
n
2.
= n
1
n
3.
= 1
n
n n
4.
=
r n− r
n − n−11
5.
= +
r r−1
EJERCICIOS
Solución: Se observa que el orden no importa por tanto, es una combinación, esto es:
1 1! 2 5 2
= * =6 6 0 6 6 0
53 !(1−5)3 ! 5 2
Por tanto existen 660660 formas de elegir 5 contadores de entre 15 y 3 financieros de entre 12.
2. De un grupo de 15 empresas ¿cuántos grupos de dos ó tres ó cuatro se pueden formar?
Solución: Obsérvese que el orden no importa, por tanto es una combinación, como dice la expresión
“ ó “ se suma esto es:
1 ! 1 5 5
+ = + =4 9 1 4 0
234!(1−) 34! 5
MAT. MAURICIO GARCIA PAG 49
UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
Por tanto existen 49140 maneras de escoger 2 ó 3 ó 4 empresas de entre 15.
2.4 PERMUTACIONES
EJERCICIOS
iv. En una carrera intervienen 18 atletas. ¿ de cuántas maneras pueden distribuirse los
cinco primeros puestos?
Solución: Obsérvese que el orden si importa, por tanto es una permutación, luego tenemos:
18 !
P (18 ,5) = = 1028160 ,
(18 −5) !
luego existen 1028160 formas de llegar a los cinco primeros lugares.
v. Hallar cuántos números enteros de tres cifras pueden formarse con los 9 dígitos
1,2,3, …, 9 si a) los tres dígitos usados son diferentes b) los tres dígitos usados no son
necesariamente diferentes c) los enteros formados deben ser pares , permitiéndose la
repetición de dígitos.
vi. ¿De cuántas maneras posibles se pueden seleccionar 10 carpetas para un trabajo
si solamente hay cuatro vacantes posibles?
vii. En cuántas formas diferentes se pueden formarse 8 niños alrededor en un círculo
20. Se escoge al azar 3 empresas, de entre 15, de las cuales 5 son pequeñas empresas, hallar la
probabilidad de que: a) Ninguna sea pequeña empresa b)Exactamente una sea pequeña empresa
c) Por lo menos una sea pequeña empresa
ACTIVIDADES DE APRENDIZAJE II
1) Haga una clasificación cruzada de la sindicalización ( pregunta 14) con la satisfacción en el trabajo
(pregunta 9) en lo que respecta al sexo.
Interpretación:
Nótese que existen 89 hombres que no son miembros del sindicato y que están muy satisfechos con su
satisfaccion con el trabajo * sexo del encuestado * MIEMBRO DEL SINDICATO Crosstabulation
Count
MIEMBRO DEL sexo del encuestado
SINDICATO masculino femenino Total
SI satisfaccion MUY SATISFECHO 19 9 28
con el MODERADAMENTE
trabajo 20 8 28
SATISFECHO
UN POCO SATISFECHO 7 1 8
MUY INSATISFECHO 2 3 5
Total 48 21 69
NO satisfaccion MUY SATISFECHO 89 68 157
con el MODERADAMENTE
trabajo 80 63 143
SATISFECHO
UN POCO SATISFECHO 12 7 19
MUY INSATISFECHO 4 8 12
Total 185 146 331
trabajo. Adviértase que existe una sola mujer que pertenece al sindicato y esta un poco satisfecha con su
trabajo, además existen tan sólo 21mujeres en total que pertenecen al sindicato.
UNIDAD III
PREGUNTAS DE AUTOEVALUACION
3.2. Distribución de probabilidad para una variable aleatoria discreta: Definición. Propiedades
Valor esperado y desviación estándar
Existen las llamadas variables aleatorias (va), que son funciones que asocian un número real a cada
elemento del espacio muestral.
Las variables aleatorias se clasifican en discretas y continuas. Las variables aleatorias discretas (vad),
son aquellas variables que toman valores enteros, y se presentan generalmente por medio de una tabla.
En cambio las variables aleatorias continuas ( vac), son aquellas variables que toman valores en una
escala continua, es decir cualquier número real en un intervalo dado, no es posible representarlas en
forma tabular.
Existen además funciones de densidad de probabilidades (fdp) tanto para vad como para vac, que deben
cumplir básicamente dos cosas: que la probabilidad varíe siempre entre 0 y 1 y que la suma de las
probabilidades sea 1 para las vad, y en el caso de las vac que el área bajo cualquier curva de siempre 1.
A. VARIABLES DISCRETAS
Definición. Se dice que una variable aleatoria (v.a) es una función f: A → ℜ , donde A representa el
espacio muestral y ℜ los números reales.
Definición. Un espacio que contienen un número finito de posibilidades o infinita con igual número de
elementos que números enteros, se conoce como espacio muestral discreto.
Una variable aleatoria discreta toma cada uno de sus valores con alguna probabilidad, por lo que se
puede dar la siguiente:
+∞
que
b
∫ p( x)dx = a ≤ x ≤ b ,
a
1. Distribución Binomial
Definición: Sea x una variable aleatoria discreta (vad), en la que se realizan n pruebas independientes y
la probabilidad de que sucedan k veces un suceso viene dado por la siguiente función de densidad de
probabilidades (fdp)
n k n− k
p (1 − p) , k = 0 , 1 , n, ∈ 2Ζ , 3 . . .
P( n, k, p) = k
0 e on tc r ao s o
Donde n representa el tamaño de la muestra, k es el número de veces que ocurre un suceso, p la
probabilidad de ocurrencia.
Esta distribución Binomial, se aplica a) cuando cada ensayo tiene dos resultados posibles (éxito o
fracaso; si o no; verdadero o falso, etc) b) además existen n ensayos independientes repetidos c) la
probabilidad de éxitos o aciertos , permanece constante de un experimento a otro d) los experimentos
son independientes. La v.a binomial k es la cuenta del número de ensayos exitosos que ocurren, k toma
valores entre 0 y n.
La distribución binomial que presenta el programa es acumulativo es decir va desde k=0 hasta el k que
se desee. TransformeCompute y
Obsérvese que CDF nos permite calcular el área acumulativa dado el punto.
Ejemplo:
1. La probabilidad de que una empresa pague sus utilidades a tiempo, es de 0.3. a) Determine la
probabilidad que de 6 empresas escogidas al azar hasta 2 paguen a tiempo. b) Calcule el promedio
de empresas que paguen sus utilidades a tiempo.
Solución: De acuerdo a las condiciones de los datos tenemos: n=6; p=0.3 y k=0,1,2.
Utilizando la distribución Binomial, tenemos:
n k n− k
P( n, k, p) = p (1 − p)
k
6 0 6 1 5 6 2 4
P(6;0;0.3)+ P(6;1;0.3)+ P(6;2;0.3)=
0.3(1−)+ 0.3(1−)=7 4 4 3
0 1 2
Por tanto existe un 74.43% de las probabilidades de que hasta 2 empresas paguen sus utilidades a
tiempo.
b) Nos pide la esperanza matemática, esto es: E(x)=np= 6*0.3=1.8, por tanto el promedio del número de
empresas que paguen sus utilidades a tiempo es aproximadamente 2.
2. Distribución de Poisson
e− λ × λ k
, k = 0 , 1 , 2. , 3 . . .
P ( k , λ ) = k!
0 e no t cr oa s o
Donde λ= np, e=2.718281…., k es el número de veces que ocurre un suceso.
Además, para tener un mayor grado de seguridad, en la aplicación de la Distribución de Poisson se
sugiere utilizar la siguiente regla empírica, esto es:
Ejemplo 2.
Si la probabilidad de que una persona cometa al menos un error al declarar su impuesto a la renta, es del
0.001. Determine la probabilidad de que entre 2000 personas más de 2 cometan un error en su
declaración.
e −λ × λk
P ( k , λ) = , reemplazándolo tenemos:
k!
e −2 × 2 0 e −2 × 21 e −2 × 2 2
P ( 0,2 ) + P (1,2 ) + P( 2,2 ) = + + = 0.6767 , ahora bien como queremos el evento
0! 1! 2!
contrario tenemos1-0.6767= 0.3233, por tanto existe un 32.33%, de probabilidades de que más de dos
personas cometan al menos un error en su declaración.
3. Distribución Hipergeométrica
x N − x
k n− k +
K= 0,12. nk x n-.k≤≤ N-xn. N∈ Ζ; . ,
P ( n, N k , x ) = N
n
0 e o c n ta r s o o
Obsérvese que se necesita cuatro parámetros, para utilizar esta distribución.
Además se pueden deducir las siguientes propiedades:
nx
1. La esperanza matemática o media viene dada por E(x)=
N
x ( N − r ) n( N − n ) )
2. La desviación estándar, es S =
N 2 ( N − 1)
Ejemplo 3.
En una clase en la que hay 20 estudiantes, 15 están insatisfechos con el texto que se utiliza. Si se le
preguntara acerca del texto a una muestra aleatoria de cuatro estudiantes, determine la probabilidad de
que exactamente tres de ellos estén insatisfechos con el texto.
Solución: De acuerdo a los datos se observa que N=20; como 4 son elegidos al azar, n=4 ; la
característica o particularidad es x=15 y k= 3,el evento a ser contestado, utilizando la distribución
Hipergeométrica, tenemos:
x N − x 1 5 5
k n−k 31
=
P(4,231)= N 20 =5.4 0 6 9 5
, por tanto existe un 46.95% de probabilidades de que tres personas estén insatisfechos
n 4
MAT. MAURICIO GARCIA PAG 61
UNIVERSIDAD TECNOLOGICA EQUINOCCIAL GUIA DE ESTADISTICA DESCRIPTIVA
con el texto guía.
B. DISTRIBUCIONES CONTINUAS
4. Distribución Normal
Una de las funciones, de variables aleatorias continuas (v.a.c) más importantes en Estadística, es la
llamada Distribución Normal o Campana de Gauss o Curva Simétrica, que se presenta con frecuencia en
las aplicaciones reales, viene dada por:
Definición: Una variable aleatoria x tiene una distribución normal, llamado variable aleatoria normal
cuya función de densidad de probabilidades viene expresada por:
e −(1 / 2 ) [( x −x ) / s ] ,−
1 2
Propiedades:
xvi. La moda tiene su máximo en la media aritmética
xvii. La curva es simétrica con respecto al eje y.
xviii. El área bajo la curva es de 1 ó 100%.
xix. Las colas de la curva jamás cruzan el eje de las X, es decir se aproximan en forma
asintótica al eje horizontal.
xx. La tabla a utilizarse, calcula el área del punto a la izquierda, esto es:
Teorema. Sea x una distribución normal con media x y desviación estándar se tiene
x−x
z= (1), tiene la distribución normal estándar.
s
Para usar las tablas de distribución normal estandarizada ( con una media 0 y una desviación estándar de
1), en el programa se debe seguir : TransformeCompute Y
Esto nos permitirá encontrar el área dado el punto. El programa nos permite calcular el área del punto a
la izquierda.
Dada una distribución normal estandarizada determine las siguientes probabilidades:
a) Z sea lo más +1.08?
Solución: a) Como se calcula el área desde el punto a la izquierda tenemos:
Ejemplo 4.
Las ventas diarias de una empresa, se comportan como una distribución normal, con media de 530
dólares y una desviación típica de 120 dólares, ¡cuál es la probabilidad de que las ventas excedan de 700
dólares en un día en particular?
x − x 700 − 530
Por tanto, utilizando z = = = 1.41 , utilizando la tabla de la curva normal( ver
s 130
apéndice III) , tenemos: A(-1.41)=0.0793 ó existe apenas un 7.93% de probabilidades de que el
propietario tenga ganancias superiores a $700 diarios.
Ejemplo 5.
Se sabe que el tiempo promedio para realizar una transacción, se comporta como una aproximación
normal, con una media de 70 minutos y una desviación estándar de 12 minutos. ¿cuánto debe durar
este tipo de transacciones, si se pretende que el 90% de las personas lo terminen?
Solución: De acuerdo a los datos tenemos: x = 70 ; s = $12 y Z = 90% , cuyo gráfico es:
Ejemplo 6.
Un análisis estadístico de 1000 llamadas telefónicas de larga distancia indica que la duración de estas
llamadas se distribuye normalmente con un media muestral de 240 segundos y una s= 40segundos
Solución: Se utilizará el comando CDF.NORMAL, el mismo que nos encontrará el porcentaje para lo
cual nos pedirá el valor de x, la media y la desviación estándar.
Obteniendo como resultado un porcentaje del 6.68%. Existe apenas un 7% de probabilidades de que las
llamadas duren menos de 180 segundos.
Obteniendo como resultado un porcentaje del 86.64%. Existe un porcentaje alto de 87% de que las
llamadas duren entre 180 a 300 segundos
c) Restar de 1 del área entre 180 a 300 segundos del item anterior esto es: 1-0.8664 = 0.1336, luego el
número de llamadas será de 133.6; o 134 llamadas.
Obteniendo como resultado un porcentaje del 6.622%. Existe una baja probabilidad del 7% de que las
llamadas duren entre 110 y 180.
UNIDAD IV
PREGUNTAS DE AUTOEVALUACION
ASESORÍA DIDÁCTICA IV
A. DISTRIBUCIÓN DE MUESTREO
Básicamente la Inferencia Estadística trata de generalizar o inferir los resultados de una muestra hacia la
población o de un estadístico para inferir el parámetro dado.
Definición: La distribución de probabilidad de un estadístico se conoce como distribución muestral.
Se define el error de muestreo como la diferencia existente entre el estadístico de la muestra y el
parámetro poblacional, con la finalidad de estimar el parámetro.
La distribución de las medias muestrales no es sino el conjunto de todas las medias muestrales dadas.
Lo mismo podemos definir para el error estándar de la distribución muestral, que no es otra cosa que el
grado de variación alrededor de la media poblacional.
Es uno de los teoremas más importantes dentro de la Estadística , este teorema lo que nos indica es que,
a medida que el tamaño de muestra es grande, la distribución de medias muestrales se va aproximando a
x −µ
z=
una curva normal con σ
n
Teorema. Si X 1 , X 2 , ... X n forman una muestra aleatoria que tiene una población infinita con media
x −µ
z=
μ, la varianza σ entonces
2 σ cuando n → ∞, es la distribución estándar.
n
Y en la práctica, se utiliza esta aproximación cuando n ≥ 30 , sin contar la forma de la población que se
estudia.
Ejemplos
8. Los depósitos medios en un banco son de $7012, con una desviación típica de $532, y sigue una
distribución normal. Si se escoge al azar una muestra de 35 depósitos ¿cuál es la probabilidad de
que la media sea superior a $6911?
x −µ 6911 − 7012
z= = = −1.12
por lo que utilizando σ 532 , por lo que tenemos que A(-1.12)=0.1314, es
n 35
decir, existe (1-0.1314) 86.86% de probabilidades de que los depósitos sean superiores a $6911.
ACTIVIDADES DE APRENDIZAJE IV
5. El gerente de la empresa se encuentra preocupado por la cantidad de montos que adeuda a 236
proveedores sobre los cuales establece un promedio de USD $22.500 y una desviación estándar
de de USD $ 4.000. Para el efecto adopta una muestrea de 30 proveedores y se pregunta.
a. ¿Qué posibilidad existe de que las deudas sean superiores a USD $ 30.000?
b. ¿Qué posibilidad existe de que las deudas sean inferiores a USD $ 18.000?.
6. Se conoce que la desviación típica al realizar una operación manufacturera es de 10.2 minutos, con
una media de 37.2 minutos. ¿Cuál es la probabilidad de que se demore en promedio más de 35 minutos
en las últimas 32 piezas producidas?
.
DISTRIBUCIONES MUESTRALES DE PROPORCIONES
Ejemplo 2. Si se sabe que el 32% de las empresas tiene cuentas por cobrar, al escoger 100
empresas, ¿cuál es la probabilidad de que más de 40 tengan cuentas por cobrar?
x 40
Solución: De acuerdo a los datos tenemos: P=32%; n=100 ;, pˆ = = = 0.4 , cuyo gráfico es:
n 100
ACTIVIDADES DE APRENDIZAJE IV
6. Según algunos estudios, el 48% de las personas consumen dulces, con mucha frecuencia, si se
selecciona al azar a 100 personas a) cuál es la probabilidad de que la proporción muestral sea
mayor que 0.6? b) este dentro de un intervalo entre 0.40 y 0.58
APENDICE I
APENDICE II
Tabla Acumulada de la Distribución de Poisson
APENDICE III
Tabla Acumulada de la Distribución Normal
BIBLIOGRAFIA:
Manual del paquete estadístico computacional SPSS, versión 6.0 y 8.0 para
Windows.