Académique Documents
Professionnel Documents
Culture Documents
desde cero
Definicin
La ciencia que se ocupa de la recopilacin, tabulacin, anlisis, interpretacin y
presentacin de datos.
Poblacin y muestra
Poblacin es el conjunto de individuos, con alguna caracterstica comn, sobre el
que se hace un estudio estadstico.
En la prctica es frecuente tener que recurrir a una muestra para inferir datos de la
poblacin. La muestra es un subconjunto de la poblacin, seleccionada de modo
que ponga de manifiesto las caractersticas de la misma, de ah que la propiedad
ms importante de las muestras es su representatividad.
El proceso seguido en la extraccin de la muestra se llama muestreo.
Ejemplo
muestra.
Solucin
Albert Maguia R.
Tipos de
variables
Cuantitativas
Discretas
Cualitativas
Continuas
Nominales
Ordinales
Ejemplo
Tipo de variable
Definicin
Ejemplo
Nominal
Ordinal
Discreta
Continua
Albert Maguia R.
Ejercitndose
a) Marca de automvil.
b) Duracin de una cancin.
c) Nmero de temas de un CD o DVD.
d) Estado civil (soltero, casado, divorciado).
3
I.
Existen muchas formas de organizar los datos. Podemos slo colectarlos y mantenerlos en
orden; o si las observaciones estn hechas con nmeros, entonces podemos hacer una
lista de los puntos de los datos, de menor a mayor segn su valor numrico. Pero si los
datos son trabajadores especializados (como carpinteros, albailes o soldadores) de una
construccin; o los distintos tipos de automviles que ensamblan todos los fabricantes; o
los diferentes colores de suteres fabricados por una empresa dada, debemos de
organizarlos de manera distinta. Necesitaremos presentar los puntos de datos en orden
alfabtico o mediante algn principio de organizacin. Una forma comn de organizar los
datos consiste en dividirlos en categoras o clases parecidas y luego contar el nmero de
observaciones que quedan dentro de cada categora. Este mtodo produce una
Distribucin de frecuencias.
Distribucin de frecuencias
f
Xi
Variable
hi %
f1
n
x1
f1
x2
f2
f1
h1 100
h1
2
x
n
f1
f2
f
f3
n
f
2
f
f1
f2
f3
h1
fn
h
1
h1
h2
h2
h2 100
h3
hn
I
D
E
100
100
Hi
hi % 100
23
Hi %
n = Total
fi
hi
Albert Maguia R.
Ejemplo
Los siguientes datos representan el nmero de hijos por familia encuestada.
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
A partir de estos datos, construya una tabla de frecuencias.
Solucin:
Para construir la tabla de frecuencias hay que tener en cuenta que la variable en
estudio es el nmero de hijos (discreta), que toma los valores existentes entre 0 y
6 hijos y las frecuencias son el conjunto de familias, de esta forma tenemos:
Xi
fi
Fi
hi
Hi
hi %
Hi %
0
1
2
3
4
5
6
2
4
21
15
6
1
1
2
6
27
42
48
49
50
0,04
0,08
0,42
0,30
0,12
0,02
0,02
0,04
0,12
0,54
0,84
0,96
0,98
1
4
8
42
30
12
2
2
4
12
54
84
96
98
100
n = 50
fi
50
hi
hi % 100
Ejercitndose
Se realiz un sondeo entre 25 miembros de una clase de psicologa acerca del
nmero de hermanos que tenan en sus familias. A partir de estos datos, elabore
una tabla de distribuciones de frecuencias.
2
5
1
5
1
3
2
4
4
6
1
3
2
3
2
3
3
4
6
2
3
1
2
5
2
Albert Maguia R.
A menudo, los conjuntos de datos que contienen una gran cantidad de elementos
se organizan en grupos o clases. Todos los datos son asignados a la clase que les
corresponde; luego, se elabora una Distribucin de frecuencias para datos
agrupados. Estos intervalos (grupos o clases) tienen un punto medio que recibe el
nombre de marca de clase. La marca de clase se obtiene calculando el promedio
entre los lmites inferior y superior de cada intervalo.
Ejemplo
Xi
Variable
Yi
marca de clase
y1
[xi x2
y2
[x2 x3
[x
[xn
y3
xn
xi
hi
Hi
hi %
Hi %
hi
2
x2
x3
2
x3
x4
2
x
n 1
n = Total
Fi
x2
fi
fi
hi % 100
Ejercitndose
En una prueba tomada a 50 alumnos, se registraron los siguientes puntajes:
83
82
87
64
63
75
83
62
67
83
68
85
66
61
83
76
83
67
78
76
83
72
70
84
71
77
82
79
83
72
77
74
67
80
84
75
73
75
83
84
77
72
89
80
87
77
63
72
84
78
Albert Maguia R.
regla: C
mx
mn
En nuestro ejemplo, n 50
3,3log 50
xmx
6,6
89
Xi
Yi
fi
Fi
[ 61 65 >
[ 65 69 >
[ 69 73 >
[ 73 77 >
[ 77 81 >
[ 81 85 >
[ 85 89 ]
63
67
71
75
79
83
87
5
5
6
7
9
14
4
5
10
16
23
32
46
50
Total
mn
61
En consecuencia:
hi
0,10
0,10
0,12
0,14
0,18
0,28
0,08
89 61
7
Hi
hi %
Hi %
0,10
0,20
0,32
0,46
0,64
0,92
1
10
10
12
14
18
28
8
10
20
32
46
64
92
100
h
i
50
hi % 100
Albert Maguia R.
I.
En una empresa, se hizo el estudio sobre las edades de los empleados y se obtuvo
la siguiente tabla:
Edades N de empleados
[ 20 25 >
12
[ 25 30 >
15
[ 30 35 >
23
[ 35 40 >
11
[ 40 45 >
9
Donde A es el porcentaje de empleados con 30 aos o ms; B es el porcentaje
de empleados con menos de 40 aos. Calcular el valor de A + B
II.
N de jvenes
10
15
28
20
17
a)
f 4 F3
H4
b)
H 2 % h4 %
h2
c)
H 3 % h2 %
Y3
d)
f 2 F1
H5
Albert Maguia R.
Las tablas de frecuencias de los datos estadsticos muestran una informacin ordenada del
hecho que se analiza y estudia. Adems de esta forma de presentacin es til conocer la
forma de presentarlos grficamente para obtener una apreciacin global, rpida y visual
de la informacin sealada.
Grfico de Bastones
Se utiliza para describir datos cuando la variable es discreta. Su construccin se
hace levantando segmentos perpendiculares al eje de la variable y con una altura
Nmero de I.E.
Nmero de Docentes
Histograma de Frecuencias
Se utiliza para describir datos cuando la variable es continua. Su construccin se
hace levantando sobre el eje de la variable rectngulos que tengan por base la
amplitud del intervalo de clase y una altura proporcional a su frecuencia absoluta o
N de Turistas
relativa porcentual.
Gastos en Dlares
Albert Maguia R.
Polgono de Frecuencias
Se utiliza tambin para describir datos cuando la variable es continua. Su
construccin se hace uniendo los puntos medios superiores de los rectngulos en
N de Turistas
el histograma.
Gastos en Dlares
Grfico de Barras
Se utiliza para describir datos cuando la variable es cualitativa. Su construccin se
hace levantando barras proporcionales a su frecuencia absoluta o relativa
N de Personas
porcentual.
Estado Civil
Grfico de Sectores Circulares
Se utiliza tambin para describir datos cuando la variable es cualitativa. Se usa
frecuentemente cuando se desea comparar cada categora de la variable con
respecto al total. Para su elaboracin se utiliza una circunferencia, siendo
Albert Maguia R.
10
necesario que los valores absolutos y/o porcentuales sean traducidos en grados
sexagesimales.
2
4
3
3
2
5
4
4
4
3
4
4
5
3
3
1
3
4
5
3
3
5
4
3
2
500
750
650
800
890
550
780
700
850
850
600
630
740
750
950
Albert Maguia R.
11
III.
IV.
60 64
54
65
67
68
68
73 74 77
79 79 84 89
43
categora profesional?
en promedio, gana
GreciaDinamarcaSuecia
HolandaFrancia
Blgica
Alemania
EspaaSuiza
Reino Unido
AustraliaEstadosUnidos
Luxemburgo
en un sueldo mensual de
Japn
V.
Albert Maguia R.
12
f x
x
Ejemplo
Calificaciones
1
2
3
4
5
fi
3
3
6
8
9
Calificaciones fi
6
17
7
22
8
10
9
6
10
5
Albert Maguia R.
13
Calificaciones
1
2
3
4
5
6
7
8
9
10
Total
fi
3
3
6
8
9
17
22
10
6
5
89
fi . xi
3
6
18
32
45
102
154
80
54
50
544
Tenemos:
n
fi
89
f i xi
544
fx
x
544
n
x
6,11
89
fy
x
Ejemplo
Intervalos
[02]
[35]
[68]
[ 9 11 ]
[ 12 14 ]
Total
Tenemos:
fi
12
13
23
16
18
82
Intervalos
[02]
[35]
[68]
[ 9 11 ]
[ 12 14 ]
Total
fi
12
13
23
16
18
82
yi
1
4
7
10
13
-
fi . y i
12
52
161
160
234
619
fi
82
f i yi
619
fy
x
619
n
x
7,55
82
Albert Maguia R.
14
La Mediana
La mediana es la medida de tendencia central que se define como aquel valor
nominal que tiene, dentro de un conjunto de datos ordenados, arriba y abajo de l,
el mismo nmero de datos nominales. En otras palabras, es el dato que est a la
mitad, es el dato que divide en dos partes iguales a un conjunto de datos.
La Mediana para frecuencias simples
Cuando los datos recolectados han sido organizados en una tabla de distribucin
de frecuencias simples, la mediana, para poblaciones como para muestras, se
puede calcular por medio de la frmula
Fi
n
2
xi
Fi
xi
Me
Ejemplo
f
i
0
1
2
3
4
5
6
7
8
9
10
Total
1
1
3
5
6
7
11
15
25
20
23
117
F
i
1
2
5
10
16
23
34
49
74
94
117
-
Fi
117
2
xi
F74
Fi
xi
58,5
Fi
Me
74
Albert Maguia R.
15
Me
Linf
n
2
F
i 1
Fi
[ Linf
Lsup ]
Fi
Me
[ Linf
Lsup ]
Ejemplo
Linf Lsup
fi
Fi
[ 1 30 ]
[ 31 60 ]
1
1
1
2
Fi
[ 61 90 ]
3 5
[ 91 120 ] 5 10
[ 121 150 ] 6 16
[ 151 180 ] 7 23
[ 181 210 ] 11 34
[ 211 240 ] 15 49
Total
49 -
49
Fi
24,5
Fi
24,5
34
Me
29
11
[181 210]
Me
23
181
Fi
[181
34
210]
Me
184,95
La Moda
La moda es la medida de tendencia central que se define como aquel valor
nominal que tiene la frecuencia mayor. Por lo tanto, una distribucin de
frecuencias puede tener ms de una moda o, inclusive, no tener moda cuando
todos los datos tienen frecuencia 1.
La Moda para frecuencias simples
Cuando los datos recolectados han sido organizados en una tabla de distribucin
de frecuencias simples, la moda, para poblaciones como para muestras, se puede
calcular por medio de la frmula
fi
fx
xi
fi
Md
xi
Albert Maguia R.
16
Ejemplo
Xi
fi
1
2
3
8
5
13
4
5
6
Total
17
10
7
60
xi
fx
fi
17
fx
xi
fi
fi
17
xi
xi
Me
17
Me
d
1
Md
Linf
fi
d1 d2
Donde : d1
[L
fx
Lsup ]
inf
fi
fi
d2
fi
fi
Md
fi
[ Linf
Lsup ]
Ejemplo
Linf Lsup
fi
[ 10 20 >
[ 20 30 >
[ 30 40 >
5
13
[ 40 50 >
[ 50 60 >
17
10
[ 60 70 >
Total
7
60
17
fx
[40 50
17
Md
40
10
4 7
Md [40 50
40
Md
d1
17 13
d1
17 10
d2
11
Md
d
2
40
40
3,6
Albert Maguia R.
17
II.
III.
fi
0
1
2
3
4
Total
1
4
7
6
2
20
fi
[ 26 34 >
[ 34 42 >
[ 42 50 >
[ 50 58 >
[ 58 66 >
[ 66 74 >
[ 74 82 >
[ 82 90 >
Total
1
2
4
10
16
8
3
7
51
IV.
Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en
lugar del valor 12,4 se introdujo 124. Corregir la media.
V.
Albert Maguia R.
18
Media
Mediana
A
5
6
7
8
9
B
1
2
7
12
13
7
7
7
7
x
s
Ejemplo
x
1
Albert Maguia R.
19
Xi
fi
2
3
4
5
5
8
10
2
x
Xi
fi
10
Total
25
xi
2 5
3 8
4 10
2 3,36
1,36
1,8496
3 3,36
0,36
0,1296
0,64
0,4096
5 3,36 1,64
2,6896
5 2
25
4 3,36
3,36
Pero como los datos no son nicos, es decir, hay repeticiones por cada dato (frecuencias),
se tendr que multiplicar cada valor obtenido por su frecuencia respectiva. Esto es:
x
i
. fi
2
x x f
x x f
9,2480
1,0368
4,0960
5,3792
19, 76
25 1
x
2,6896 (2) = 5, 3792
fi
19,76
n 1
0,91
En el caso de que los datos sean agrupados (con intervalos) se utilizar la marca de clase
como el valor que representar a cada dato.
Albert Maguia R.
20
II.
Xi
fi
Xi
fi
0
1
2
3
4
5
6
2
4
21
15
6
1
1
[ 61 65 >
[ 65 69 >
[ 69 73 >
[ 73 77 >
[ 77 81 >
[ 81 85 >
[ 85 89 ]
5
5
6
7
9
14
4
III.
Albert Maguia R.
21
SEMANA 6 PROBABILIDADES
1
6
, 12 , 98
o como decimales
cero y uno. Tener una probabilidad de cero significa que algo nunca va a suceder; una
probabilidad de uno indica que algo va a suceder siempre.
En la teora de probabilidad, un evento es uno o ms de los posibles resultados de hacer
algo. Al lanzar una moneda al aire, si cae cruz es un evento, y si cae cara es otro. De
manera anloga si sacamos una carta de un mazo de naipes, el tomar el as de espadas es
un evento. Un ejemplo de evento que quizs est ms cercano a su quehacer diario es ser
elegido de entre 40 estudiantes para que responda una pregunta. Cuando escuchamos las
pocas gratas predicciones del ndice de mortalidad en accidentes de trnsito, esperamos
no ser uno de tales eventos.
En la teora de probabilidad, la actividad que origine uno de dichos eventos se llama
experimento. Utilizando un lenguaje formal, podramos hacer la siguiente pregunta: En
un experimento de lanzar una moneda, cul es la probabilidad del evento cara? Y desde
luego, si la moneda no est cargada y tiene la misma probabilidad de caer en cualquiera
de sus dos lados (sin posibilidades de que caiga parada), podramos responder, 12
0,5
cara , cruz
Teorema de Laplace
Este teorema debe usarse slo para eventos equiprobables (cada evento tiene la
misma posibilidad de que suceda). Laplace menciona que la probabilidad de un
evento est dada por la siguiente frmula:
Albert Maguia R.
22
Casos Favorables
P xi
Ejemplo
Casos Posibles
Casos posibles:
1,3,5
1, 2,3, 4,5,6
3
6
P xi : impar
1
2
Formalizando:
Ejercitndose
Albert Maguia R.
23
I.
Resuelva cada uno de los problemas que se le propone. No olvide que debe
justificar cada uno de sus razonamientos.
Una mquina produce 100 tornillos de los que 3 son defectuosos. Si se cogen
Una familia tiene tres hijos. Hallar la probabilidad de que los tres sean varones.
Se extrae una bola de una urna que contiene 6 bolas rojas y 4 verdes, se
observa si ha sido roja y se vuelve a introducir; luego se extrae otra bola. Cul
II.
Albert Maguia R.
24
n
P X k
p k qn
Ejemplo
La ltima novela de un autor ha tenido un gran xito, hasta el punto de que el 80%
de los lectores ya la han ledo. Un grupo de 4 amigos son aficionados a la lectura.
0,8
0, 2
0,8
P X
0,1536
0, 2
P X
P X 1
P X
Albert Maguia R.
25
4
2
0,8
0, 2
4
3
0,8
0, 2
4
4
0,8
0, 2
0,9728
Ejercitndose
a) Se afirma que el 30% de la produccin de ciertos instrumentos se realiza con
material nacional y los dems con material importado. Si se toma una
muestra aleatoria con reemplazo de 25 de estos instrumentos, calcular:
- Cul es la probabilidad de que 3 de ellos sean de material nacional?
- Cul es la probabilidad de que no ms de 3 de ellos sean de material
nacional?
- Cul es la probabilidad de que al menos 3 sean de material nacional?
- Cuntos instrumentos fabricados con material nacional se espera
encontrar en la muestra?
b) Un examen consta de 6 preguntas con 4 posibles respuestas cada una, de las
que slo una de ellas es correcta. Un estudiante que no se haba preparado la
materia responde completamente al azar marcando una respuesta aleatoria.
Calcular la probabilidad de que acierte 4 o ms preguntas.
c) La probabilidad de que un cazador novato cobre una pieza es 0,4. Si lo intenta
5 veces, calcula la probabilidad de que cobre una pieza al menos 3 veces.
d) El 53% de los trabajadores de una determinada empresa son mujeres.
Si elegimos 8 personas de esa empresa al azar, calcula la probabilidad de que:
- Haya ms de 6 mujeres
- Hallar la media y la desviacin estndar.
e) Un examen tipo test consta de 100 preguntas, cada una de las cuales se
acompaa de cuatro respuestas, una de ellas correcta y errneas las otras
tres. Si un estudiante contesta al azar, cul es la probabilidad de que acierte
ms de 30 preguntas? y menos de 15?
Albert Maguia R.
26
I.
Una urna contiene 6 bolas con nmeros pares y 9 bolas con nmeros impares. Si
hacemos diez extracciones con reemplazamiento, calcula la probabilidad de
obtener nmero impar:
- Alguna vez
- Ms de 8 veces
II.
III.
IV.
Albert Maguia R.
27
fo
fe
Donde:
f
e
fo
fe
Proceso estadstico
Para aplicar la Prueba Chi Cuadrado se debe tomar en cuenta los siguientes pasos:
1. Formulacin de la hiptesis
Ho = Hiptesis nula (no existe dependencia) H1
= Hiptesis alternativa (existe dependencia)
2. Nivel de significancia
N.C = x %
3. Grados de libertad
v
r 1 c 1
x
100
donde:
r
c
nmero de filas
nmero de columnas
4. Estadstico de prueba
2
con
v
5. Establecimiento de los criterios de decisin
Tabla
Albert Maguia R.
28
6. Clculos
fo
fe =
ri . c j
7. Decisin
2
Se acepta H o
2
Tabla
Si :
Se rechaza H
2
Tabla
8. Coeficiente de contingencia
k 1
Donde k min
i , j
adems
0,
Ejemplo
El seor Althomaro, presidente de la Compaa Nacional General Aseguradora de
Salud, se opone al seguro de salubridad nacional. Argumenta que sera muy
costoso de implantar, en particular debido a que la existencia de este sistema,
entre otras cosas, tendera a fomentar en la gente permanecer ms tiempo en los
hospitales. Althomaro tiene la creencia de que las hospitalizaciones dependen del
tipo de seguro de salud que tengan las personas. Le pide a Ral Mendoza, el
especialista en estadstica de la empresa, que verifique el asunto. Mendoza recogi
datos de una muestra aleatoria de 660 hospitalizaciones y la informacin la
Albert Maguia R.
29
Tabla 01
Datos de hospitalizaciones clasificados segn el tipo
de cobertura del seguro y el tiempo de estancia
% de costos
cubiertos por
el seguro
< 25 %
25 50 %
> 50 %
Total
Das en el hospital
<5
5 10
> 10
40
30
40
110
75
45
100
220
65
75
190
330
Total
180
150
330
660
Solucin
Paso 1 formulacin de la hiptesis
H0 = tiempo de estancia y tipo de seguro son independientes.
H1 = el tiempo de estancia depende del tipo de seguro.
Paso 2 nivel de significancia
N.C = 99%, lo cual implica
= 0,01
3 1 3 1
Tabla
con
13, 28
0,01
v 4
Paso 5 Establecimiento de los criterios de decisin
Tabla
Albert Maguia R.
30
Paso 6 Clculos
Calculando las frecuencias esperadas de cada celda de la tabla:
180 110
fe
c 40
fe
180 220
660
fec
30
75
40
65
660
150 330
fe
50
660
330 220
55
660
45
c 100
c 75
75
660
330 330
110
660
90
660
150 220
fec
25
330 110
660
150 110
30
180 330
fe
60
190
165
660
Das en el hospital
<5
5 10
Total
> 10
< 25 %
40
30
75
60
65
90
180
25 50 %
30
25
45
50
75
75
150
> 50 %
40
55
100
110
190
165
330
Total
110
40 30
220
75 60
30
65
60
90
330
30 25
90
25
45 50
660
50
75
75
75
40
55
55
100 110
110
190 165
24,32
165
Paso 7 Decisin
Como
24,32 13, 28
Albert Maguia R.
31
24,32
24,32 660
C
mx
3 1
3
0,19
C
mx
C = 0, 19
0,82
0, 41
0, 82
Dado que el valor obtenido est muy lejos del valor deseado (0,6) se concluye
que la dependencia entre la variables es baja (dbil)
Ejercitndose
Distribuidor 1
Distribuidor 2
Distribuidor 3
Total
Componentes defectuosos
16
24
9
49
Fumadores
No Fumadores
Total
Padecen la Enfermedad
12
25
37
No Padecen la enfermedad
88
25
113
Total
100
50
150
Albert Maguia R.
32
Lan Per desea determinar si existe alguna relacin entre el nmero de vuelos que
las personas toman y su ingreso. A qu conclusin llega al nivel del 1% con base
en los datos para 100 viajeros en la tabla de contingencia?
Ingreso
Menos de $ 30 000
30 000 50 000
50 000 70 000
Ms de $ 70 000
II.
Nunca
20
8
7
2
Frecuencia de vuelos
Rara vez
15
5
8
5
Con frecuencia
2
1
12
15
III.
NIVEL EDUCATIVO
Pasante de
Preparatoria
licenciatura
17
11
23
8
38
16
19
6
97
41
Profesional o
posgrado
10
12
35
28
85
No termin la
preparatoria
21
5
7
13
46
Total
59
48
96
66
269
Un educador tiene la opinin de que las calificaciones que obtienen los alumnos de
preparatoria dependen de la cantidad de tiempo que ellos pasan escuchando
msica. Ser cierta su opinin.
Horas consumidas
escuchando msica
<5
5 10
11 20
> 20
Total
A
13
20
9
8
50
PROMEDIO DE CALIFICACIONES
B
C
D
10
11
16
27
27
19
27
71
16
11
41
24
75
150
75
Total
E
5
2
32
11
50
55
95
155
95
400
Albert Maguia R.
33
2.
a) El ingreso mensual (sueldo) es por excelencia una variable cuantitativa
(continua)
b) Lo que aqu importa es el grado que cursan. Por ejemplo, en primer grado hay
25 alumnos, en segundo grado hay 37 alumnos, etc. Por lo tanto, la variable es
cualitativa (nominal)
c) El cdigo de identificacin es como el DNI (34003247, 76293045, etc.). En
consecuencia, la variable es cuantitativa (discreta), dado que, el nmero de DNI
no puede tomar decimales.
d) Los nmeros de las camisetas pueden ser 1, 2, 3, etc. Por lo tanto, la variable es
cuantitativa (discreta),
e) Dado que se refiere a la posicin, por ejemplo, el 1 significa primer puesto, el 2
significa segundo puesto y 3 el tercer puesto, es decir, posee un orden
invariable. por lo tanto, la variable es cualitativa (ordinal)
Albert Maguia R.
34
fi
Fi
hi
Hi
hi %
Hi %
Yi
12
12
0,17
0,17
17
17
22,5
[ 25 30 >
15
27
0,21
0,38
21
38
27,5
[ 30 35 >
23
50
0,33
0,71
33
71
32,5
[ 35 40 >
11
61
0,16
0,87
16
87
37,5
[ 40 45 >
70
0,13
13
100
42,5
Total
70
100
2.
Puntaje
[ 10 15 >
fi
Fi
hi
Hi
hi %
Hi %
Yi
10
10
0,11
0,11
11
11
12,5
[ 15 20 >
15
25
0,17
0,28
17
28
17,5
[ 20 25 >
28
53
0,31
0,59
31
59
22,5
[ 25 30 >
20
73
0,22
0,81
22
81
27,5
[ 30 35 >
17
90
0,19
19
100
32,5
Total
90
100
3.
Tabla 1
Tabla 2
a) 70,11
a) 90, 12
b) 257, 14
b) 294, 12
c) 2, 83
c) 3, 38
d) 27
d) 25
Albert Maguia R.
35
xi
1
2
3
4
5
fi
2
4
12
8
4
C = 600/5 = 120
LI LS
[ 400 520 >
fi
2
Albert Maguia R.
36
Estado civil
Soltero
Casado
Divorciado
Viudo
Total
Cuando la variable es
frecuencia
7
18
3
2
30
Soltero
Divorciado
Casado
Viudo
4. Dado que el problema trata, por un lado, de fechas las cuales tienen un orden
invariable y, por otro lado, del gnero o sexo; podemos afirmar lo siguiente: la
fecha corresponde a una variable cualitativa ordinal y el sexo a una variable
cualitativa nominal. En consecuencia, el grfico que le corresponde es el grfico de
barras compuestas, dado que estn presentes dos variables.
5. Este problema trata sobre el sueldo que ganan las mujeres respecto a lo que ganan
los hombres. Por ejemplo, en Japn, una mujer gana el 43% de lo que gana un
hombre (ver grfico). En este sentido si una mujer, en Suiza, tiene un sueldo de
1300, este valor equivale al 68% del sueldo de un hombre, es decir, un suizo
ganara 1911,76 (tem 1). De manera anloga, en Espaa una mujer ganara el 67%
de 1102, esto es 738,34 (tem 2)
Albert Maguia R.
37
fi
1
4
7
6
2
20
Media
Fi
1
5
12
18
20
-
0 1
Mediana
4 5
20
2
Fi
10
Fi
12
xi
Me
xi
Me
Fi
20
x
2, 2
Moda
La mayor
fi en
este caso es f3 7 ,
en consecuencia,
Md = 2
2.
Li Ls
[ 26 34 >
fi
1
Fi
1
Yi
30
[ 34 42 >
[ 42 50 >
2
4
3
7
38
46
[ 50 58 >
[ 58 66 >
[ 66 74 >
10
16
8
[ 74 82 >
[ 82 90 >
Total
17
33
41
3
7
51
Media
30 1
Fi
86 7
51
54
62
70
44
51
-
Mediana
F
i
78
86
-
Fi
26,5
33
[58
66
58 8 26,5 17
16
Me
63,10
51
2
Me
62,75
Moda
La mayor fi
58
Md
[58
66
61, 41
6 8
b c
2
23
a b c d
4
46
24
c d 96
50 ), tendramos: b = 24 y d = 28.
Albert Maguia R.
38
a
4. Sean los datos: a1 , a2 , a3 ,
a1 a2
, a125
a3
125
125
42
lugar de 12, 4 es decir, hay un exceso de: E = 124 12,4 = 111,6 pero, este exceso
se ha promediado, de acuerdo al dato del problema. En consecuencia:
111,6
125
42
0,8928
41,11 corregido
40 6, 4
10 15
4,7525
70
40 10
x
xi
0
1
2
3
4
5
6
fi
2
4
21
15
6
1
1
x
i
x
6,35
2,31
0,27
0,23
2,19
6,15
12,11
f
Li - Ls
[ 61 65 >
[ 65 69 >
[ 69 73 >
[ 73 77 >
[ 77 81 >
[ 81 85 >
[ 85 89 ]
x
0 2,52
1 2,52
2 2,52
3 2,52
4 2,52
5 2,52
6 2,52
5
5
6
7
9
14
4
Yi
63
67
71
75
79
83
87
x
63 76,44
67 76,44
71 76,44
75 76,44
79 76,44
83 76,44
87 76,44
fi
12,70
9,24
5,67
3,45
13,14
6,15
12,11
x
i
2
x
x
180,63
89,11
29,59
2,07
6,55
43,03
111,51
i
fi
62, 46
62, 46
50 1
50
1,13
fi
2648,14
fi
x
903,15
445,55
177,54
14,49
58,95
602,42
446,04
i
x
i
2648,14
50 1
7,35
Albert Maguia R.
39
Li - Ls
5 9
9 13
13 17
17 21
21 25
fi
Yi
10
8
5
4
3
7
11
15
19
23
7 12,6
11 12,6
15 12,6
19 12,6
23 12,6
x
i
31,36
2,56
5,76
40,96
108,16
313,6
20,48
28,80
163,84
324,48
fi
x
i
fi
851, 2
851, 2
30 1
30
5, 42
3.
er
1 producto
x
2,5
0,004
2
x
do
er
producto
2,8
0,006
3 producto
x
3,7
0,09
Si los promedios fueran iguales en los tres productos, se compararan de manera directa
sus desviaciones estndar. Pero en este caso, las medias son distintas. En tal sentido, es
necesario hallar el coeficiente de variacin, el cual relaciona las medias con sus
desviaciones estndar. El coeficiente de variacin se define como:
CV
er
1 producto
0,0016 <> 0,16%
do
s
x
2 producto
0,002 <> 0,2%
er
3 producto
0,024 <> 2,4%
er
do
tornillo
quedaran 99 tornillos, de los cuales solo dos son defectuosos, dado que ya se
escogi uno de ellos. En consecuencia, la probabilidad de que el segundo
tornillo resulte defectuoso es 2/99
Albert Maguia R.
40
b) Los casos posibles del evento son: { HHH, HHM, HMH, HMM, MHH, MHM,
MMH, MMM }. Entonces, la probabilidad de que sus tres hijos sean varones
es { HHH } = 1/8
c) En total hay 10 bolas (entre rojas y verdes). En este sentido, la probabilidad
de que resulte roja es 6/10, tanto para 1
ra
como para la 2
da
extraccin. Esto
ra
sea roja es 5/9 (en total quedan 9 bolas, de las cuales 5 son rojas, dado
Albert Maguia R.
41
10
0,6
P x
0,00010
0, 4
P X
0,99999
P X 10
10
=
10
0,6
0, 4
10
0,6
10
0, 4
2.
Alguno defectuoso (n = 60, p = 0,03; q = 0,97; k = 0
P X
60
0
60
0,97
0,03
P x
0,16080
P X 0
0,83920
0 = 60
1
0,03
0,97
60 0,03
0
59
0,97
60
3.
Alguna vez (n = 15, p = 0,4; q = 0,6; k = 0
P X
15
0
0, 4
15
0,6
P x
0,00047
1 P X 0
0,99953
0 = 15 0, 4
1
4. De manera anloga: P X 3
0,6 14
10
3
15 0, 4
0
0, 4
0,6
0,6
15
0, 2150
Albert Maguia R.
42
Nunca
Menos de $ 30 000
20
30 000 50 000
50 000 70 000
Ms de $ 70 000
Frecuencia de vuelos
Rara vez
13,69
12,21
15
5,18
4,62
8,91
7,26
2 11,10
12, 21
2
5 4, 62
1 4, 20
8,10
12
6,60
15 12, 21
13, 69
8
8,14
4,20
5
9,99
20 13, 69
Con frecuencia
11,10
2
8 5,18
11,10
2
9,99
15
5,18
8
8,91
4, 62
12 8,10
4, 20
2
2 8,14
8,10
Se sabe que: X 2
9,99
2
5 7, 26
8,14
0,01
v 6
16,81
7, 26
33,90
8,91
2
15 6, 60
6, 60
2.
Frecuencia con la
que leen
Nunca
Profesional o
posgrado
18,64
10
15,17
Algunas veces
12
30,33
NIVEL EDUCATIVO
Pasante de
Preparatoria
licenciatura
21,28
8,99
17
11
17,31
23
34,62
38
16
No termin la Total
preparatoria
10,09
21
59
7,32
8,21
5
14,63
48
16,42
Maana o tarde
35
Ambas ediciones
28
23,80
19
13
66
Total
85
97
41
46
269
20,86
7
10,06
96
11,29
Albert Maguia R.
43
10 18, 64
17
18, 64
21, 28
11
21, 28
12 15,17 2
21 10, 09
8,99
2
23 17,31
15,17
8,99
17,31
10, 09
7,32
7,32
8, 21 2
8, 21
32,86
2
2
35 30,33
38
30,33
34, 62
16 14, 63
34, 62
28 20,86
19
20,86
23,80
0,05
v 9
7 16, 42
14, 63
2
6 10, 06
23,80
Se sabe que: X 2
16, 42
2
13 11, 29
10, 06
11, 29
3.
Horas
consumidas
escuchando
msica
PROMEDIO DE CALIFICACIONES
A
B
6,88
C
10,31
D
20,63
10
Total
E
10,31
13
5 10
20
11 20
> 20
11
41
24
11
95
Total
50
75
150
75
50
400
11,88
11
17,81
35,63
27
19,38
29,06
19
58,13
29,06
71
10,31
5
17,81
27
27
6,88
16
6,88
<5
16
20,63
55
11,88
95
19,38
32
155
10,31
6,88
11 6,88
6,88
Se sabe que: X 2
6,88
0,01
v 12
26, 22
97,91
Albert Maguia R.
44
Albert Maguia R.
45
b) Arreglo de datos
c) Histograma
d) Ojiva
46
b) La media
c) La mediana
d) T.A.
18. Cuando nos referimos a que una curva est cargada hacia el extremo izquierdo,
podemos decir que es:
a) Simtrica
c) Positivamente sesgada
d) N. A.
19. Si un evento no se ve afectado por el resultado de otro evento, se dice que ambos
eventos son:
a) Dependientes
b) Independientes
c) Mutuamente excluyentes
d) Tanto b como c
20. Suponga que se lanza un dado dos veces consecutivas y que usted tiene que trazar
el rbol de probabilidades que muestra todos los resultados posibles de los dos
lanzamientos Cuntas ramas tendr el rbol?
a) 6
b) 12
c) 36
d) 42
e) 48
Albert Maguia R.
47
1. La tabla adjunta muestra las edades de 220 alumnos de un colegio. Cul(es) de las
siguientes afirmaciones es (son) verdadera(s)?
i.
ii.
iii.
La moda es 17 aos
La mediana es mayor que la media
La mitad de los alumnos tiene 17 o 18 aos
2. Las fichas del peso de 10 nios, marcan en promedio 20 kg. En la oficina de control
se pierde una ficha y se sabe que el promedio del resto es 19 kg. Cul es el peso
del nio al que le perdieron la ficha?
ii.
iii.
iv.
v.
Con la moda del color de ojos se determina el color de ojos que predomina
ii.
iii.
Albert Maguia R.
48
ii.
iii.
CRDITOS
El presente documento denominado ESTADSTICA DESDE CERO, es un material
hibrido en cuanto a su contenido. Algunos conceptos y problemas se extrajeron
de los materiales elaborados por DANNY PERICH CAMPANA PSU Matemtica y
RICHARD LEVIN & DAVID RUBIN Estadstica para Administradores.
Albert Maguia R.
49