Vous êtes sur la page 1sur 142

Indice general

1. An alisis de Datos 7
1.1. Introducci on . . . . . . . . . . . . . . . . . . . 7
1.2. An alisis descriptivo de datos . . . . . . . . . . . 7
1.3. An alisis inferencial . . . . . . . . . . . . . . . . 8
1.4. Conjuntos de Datos . . . . . . . . . . . . . . . 10
2. An alisis exploratorio de datos univariantes 13
2.1. Introducci on . . . . . . . . . . . . . . . . . . . 13
2.2. Presentaci on de los datos . . . . . . . . . . . . 14
2.2.1. Distribuciones de frecuencias . . . . . . 15
2.2.2. Diagramas de puntos y de tallo y hojas . 20
2.3. Representaciones gr acas . . . . . . . . . . . . 21
2.3.1. Diagramas de sectores . . . . . . . . . . 21
2.3.2. Diagrama de rect angulos . . . . . . . . . 22
2.3.3. Diagrama de Pareto . . . . . . . . . . . . 22
2.3.4. Histogramas . . . . . . . . . . . . . . . . 22
1
2 J. L. DazBarrero
2.3.5. Polgonos de frecuencies . . . . . . . . . 23
2.3.6. Diagramas de linea o cartas temporales . 23
2.4. Descripci on num erica de datos . . . . . . . . . 23
2.4.1. Par ametros de posici on . . . . . . . . . . 24
2.4.2. La media aritm etica . . . . . . . . . . . . 24
2.4.3. La Mediana . . . . . . . . . . . . . . . . 27
2.4.4. Los Percentiles . . . . . . . . . . . . . . . 28
2.4.5. La Moda . . . . . . . . . . . . . . . . . . 29
2.4.6. Par ametros de dispersi on . . . . . . . . . 29
2.4.7. Rango de un conjunto de datos . . . . . . 29
2.4.8. Rango intercuartlico . . . . . . . . . . . 30
2.4.9. Desviaciones respecto a la media . . . . . 30
2.4.10.La varianza y la desviaci on tpica . . . . . 30
2.4.11.Desviaci on media . . . . . . . . . . . . . 32
2.4.12.Coeciente de variaci on de Pearson . . . 32
2.4.13.Par ametros de simetra . . . . . . . . . . 33
2.4.14.Par ametros de forma . . . . . . . . . . . 34
2.4.15.Momentos muestrales . . . . . . . . . . . 34
2.4.16.Box-plot y detecci on de valores atpicos . 35
2.4.17.Transformaciones . . . . . . . . . . . . . 36
2.5. Problemas de An alisis exploratorio de datos . . 37
3. An alis exploratorio de datos bivariantes 45
An alisis de Datos 3
3.1. Variables bidimensionales . . . . . . . . . . . . 45
3.2. Ajuste mnimo-cuadr atico . . . . . . . . . . . . 47
3.3. Problemas de An alisis Exploratorio de Datos Bi-
variantes . . . . . . . . . . . . . . . . . . . . . 51
4. Conceptos B asicos de Probabilidad 57
4.1. Introducci on . . . . . . . . . . . . . . . . . . . 57
4.2. Denici on axiom atica de probabilidad . . . . . . 59
4.3. T ecnicas de conteo. Combinatoria . . . . . . . . 62
4.3.1. Variaciones con repetici on . . . . . . . . 62
4.3.2. Variaciones ordinarias . . . . . . . . . . 63
4.3.3. Permutaciones ordinarias . . . . . . . . . 64
4.3.4. Permutaciones con repetici on . . . . . . . 64
4.3.5. Combinaciones ordinarias . . . . . . . . 65
4.3.6. Combinaciones con repetici on . . . . . . 66
4.4. Probabilidad condicional . . . . . . . . . . . . . 68
4.5. Sucesos dependientes e independientes . . . . . 69
4.6. Teorema de las probabilidades totales . . . . . . 71
4.7. F ormula de Bayes . . . . . . . . . . . . . . . . 72
4.8. Problemas de Probabilidad . . . . . . . . . . . . 73
5. Variables Aleatorias Discretas 85
5.1. Variables aleatorias discretas . . . . . . . . . . 85
5.2. Modelos probabilsticos discretos . . . . . . . . 89
4 J. L. DazBarrero
5.2.1. Distribuci on de Bernoulli . . . . . . . . . 89
5.2.2. La Distribuci on Binomial . . . . . . . . . 90
5.2.3. Distribuci on uniforme discreta . . . . . . 91
5.2.4. La distribuci on geom etrica . . . . . . . . 91
5.2.5. La distribuci on de Poisson . . . . . . . . 92
5.2.6. Perodo de retorno . . . . . . . . . . . . . 94
5.3. Problemas . . . . . . . . . . . . . . . . . . . . . 94
6. Variables Aleatorias Continuas 101
6.1. Par ametros de una variable aleatoria continua . 103
6.2. Modelos probabilsticos continuos . . . . . . . . 104
6.2.1. Distribuci on uniforme continua . . . . . 104
6.2.2. Distribuci on exponencial . . . . . . . . . 104
6.3. La Distribuci on Normal . . . . . . . . . . . . . 105
6.4. El teorema del Lmite Central . . . . . . . . . . 107
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . 109
7. Inferencia Estadstica: Estimaci on de Par ametros.
Contrastes de Hip otesis 117
7.1. Introducci on . . . . . . . . . . . . . . . . . . . 117
7.2. Muestreo . . . . . . . . . . . . . . . . . . . . . 118
7.3. Estimaci on de Par ametros . . . . . . . . . . . . 120
7.3.1. M etodos de Estimaci on Puntual . . . . . 120
7.3.2. Intervalo de probabilidad e intervalo de
conanza . . . . . . . . . . . . . . . . . 122
An alisis de Datos 5
7.4. Distribuci on de la Media Muestral . . . . . . . . 123
7.5. Intervalos de conanza en poblaciones normales 123
7.6. Contraste de Hip otesis . . . . . . . . . . . . . . 125
7.6.1. Contrastes para la media . . . . . . . . . 127
7.7. An alisis de la Varianza . . . . . . . . . . . . . . 128
7.8. Test de Chi-cuadrado . . . . . . . . . . . . . . 133
7.9. Problemas de inferencia . . . . . . . . . . . . . 136
6 J. L. DazBarrero
Captulo 1
An alisis de Datos
1.1. Introducci on
El an alisis de datos, t ecnicas cuantitativas o estadstica es el
conjunto de m etodos y procedimientos encargados de la ob-
tenci on de informaci on util a partir de un conjunto de datos.
Consiste en la recopilaci on, presentaci on, an alisis y uso de
datos para la toma de decisiones y la resoluci on de proble-
mas. Por tanto, el objetivo del an alisis de datos es la toma de
decisiones frente a la incertidumbre.
1.2. An alisis descriptivo de datos
Los m etodos descriptivos tienen por objeto organizar y resu-
mir los datos disponibles de manera que sea posible perci-
bir r apidamente las caractersticas principales y las posibles
anomalas de los procesos de que provienen, sin intentar in-
ferir nada que vaya m as all a de los propios datos.
7
8 J. L. DazBarrero
1.3. An alisis inferencial
Tiene por objeto deducir informaci on util sobre una pobla-
ci on a partir del an alisis de muestras de la misma. Hay dos
formas de abordar el problema:
1. Estimaci on de par ametros
2. Contraste de hip otesis o decisi on estadstica
La primera consiste en aproximar los par ametros poblacio-
nales con estadsticos muestrales adecuados o bien calcu-
lando intervalos muy probables de posibles valores. En cam-
bio, la decisi on estadstica consiste b asicamente en estable-
cer hip otesis sobre los par ametros poblacionales y a conti-
nuaci on utilizar la informaci on contenida en las muestras
para decidir si las hip otesis formuladas son o no aceptables.
En general, un an alisis de datos consta de las siguientes fa-
ses:
Planteamiento del problema que se desea estudiar
Dise no de un plan para la recogida de datos
An alisis exploratorio de los datos (tabulaci on, sntesis,
detecci on de valores an omalos y obtenci on de primeras
conclusiones)
Modelaci on del problema
Validaci on del modelo
Toma de decisiones
An alisis de Datos 9
En cualquier caso, el an alisis de datos no dir a cual es la
decisi on que se ha de tomar, sino que aportar a informaci on
para que, juntamente con otras consideraciones, se est e en
condiciones para tomarla.
Conceptos fundamentales en el an alisis de datos son los de
poblaci on y muestra. La poblaci on es el conjunto de todos los
elementos que tienen una determinada caracterstica, es de-
cir, lo que se quiere estudiar. Los elementos de una poblaci on
se llaman individuos o unidades muestrales. Una muestra es
cualquier subconjunto de la poblaci on, i.e., lo que se puede
estudiar. El n umero de elementos de que consta es el tama no
o extensi on de la muestra. Una muestra es aleatoria cuando
cada individuo de la poblaci on tiene la misma probabilidad
de ser incluido en ella.
Seg un su car acter los datos se clasican en cualitativos o
atributos y cuantitativos. Estos ultimos a su vez se clasican
en discretos y continuos. Seg un el n umero de datos observa-
dos en cada individuo de la poblaci on estos se clasican en
univariantes (un solo dato) o multivariantes (m as de un dato).
Finalmente, se expone el orden de actuaci on que se considera
m as adecuado para el tratamiento de los datos:
Recogida, ordenaci on, depuraci on y presentaci on analti-
ca (tablas) de los datos
Representaci on gr aca
Evaluaci on de estadsticos muestrales y obtenci on de
valores aproximados de los par ametros poblacionales.
10 J. L. DazBarrero
Este apartado se puede concluir diciendo que el an alisis de
datos es un elemento decisivo para el incremento de la ca-
lidad, dado que las t ecnicas cuantitativas permiten estudiar
la variabilidad, entendida como el resultado de los cambios
en las condiciones sobre las que se hacen las observaciones.
1.4. Conjuntos de Datos
1. En la siguiente tabla aparecen 80 datos que han sido
simulados con MS Excel:
24,34 46,31 48,86 48,70 60,86 39,77 33,98 47,77
49,36 48,21 78,95 63,49 34,43 41,82 55,73 53,86
26,64 44,57 45,49 40,24 51,89 61,30 73,09 46,23
47,18 51,00 62,41 40,85 49,88 61,22 56,36 59,12
31,38 67,82 40,01 31,39 42,61 36,32 68,77 33,12
62,20 61,73 53,72 56,24 68,47 41,38 66,33 47,07
49,21 35,40 37,50 56,71 43,46 63,56 48,31 59,64
69,64 46,17 59,55 29,77 55,63 61,75 32,25 65,27
52,06 56,69 35,23 57,12 60,50 40,18 55,98 45,66
59,28 45,71 52,20 57,18 33,40 47,03 47,85 62,55
2. Los siguientes datos corresponden al tiempo medio (en
segundos) de envasado de una botella de agua mineral:
1,23 2,01 1,72 2,21 2,05 1,96 1,94 2,13 2,18 2,17
2,12 2,10 1,86 1,64 1,77 1,90 1,74 1,75 2,50 1,79
1,41 1,88 2,10 2,04 2,08 2,06 1,76 2,09 2,00 1,87
2,32 2,12 2,01 1,78 2,19 2,14 2,34 2,19 2,07 1,89
2,75 1,32 2,11 2,24 2,42 2,31 2,03 1,96 1,82 1,78
1,77 2,25 1,71 1,53 1,64 2,06 2,00 1,83 2,05 1,63
3. Los siguientes datos corresponden a porcentajes de ba-
sura reciclada obtenidos en 100 puntos seleccionados
An alisis de Datos 11
aleatoriamente en una gran ciudad y su area Metropoli-
tana:
13 25 12 27 45 56 27 34 38 34
22 52 34 29 55 36 49 44 47 61
26 29 37 32 54 30 37 29 38 43
49 36 47 27 46 38 42 53 41 34
29 45 45 55 32 25 23 40 30 31
43 34 22 22 47 39 25 41 29 44
45 33 39 45 27 28 46 40 44 48
43 27 37 36 48 55 34 33 47 35
32 47 47 39 57 28 24 29 25 55
35 47 36 28 25 36 31 43 42 48
Problema 1.1 Para los conjuntos de datos anteriores se pide:
1. Ordenarlos, clasicarlos e intentar decir algo sobre la in-
formaci on contenida en ellos y presentarla de forma re-
sumida.
2. A la vista de lo obtenido en el apartado anterior, se pue-
den sacar algunas conclusiones? cu ales?
12 J. L. DazBarrero
Captulo 2
An alisis exploratorio de
datos univariantes
2.1. Introducci on
El An alisis descriptivo de datos es la parte de la Estadstica
encargada de contar, organizar, resumir y representar gr a-
camente los datos de forma que sean f acilmente perceptibles
sus principales caractersticas. Los elementos de trabajo son
los datos (variables estadsticas) y estos, como ya se ha co-
mentado, pueden ser cualitativos o cuantitativos.
La variables cualitativas describen cualidades de los elemen-
tos de la poblaci on y no toman valores num ericos. Por ejem-
plo, la ciudad donde se ha nacido, el color del pelo, la ocupa-
ci on de los padres, etc., son datos cualitativos.
Las variables cuantitativas toman valores num ericos y pue-
den ser discretas (toman valores num ericos enteros en n ume-
ro nito o innito numerable) y continuas cuando toman valo-
res dentro de un intervalo. El n umero de mensajes electr oni-
13
14 J. L. DazBarrero
cos recibidos por un usuario o el n umero de veces que se
ha de lanzar una moneda hasta que aparezca cara son ejem-
plos de variables discretas. La hora de llegada de un tren a la
estaci on, el porcentaje de ocupaci on hotelera de una deter-
minada comarca o la cotizaci on de unas acciones en Bolsa,
son ejemplos de datos cuantitativos continuos.
Tambi en se utilizan las variables dicot omicas cuando la ca-
racterstica observada toma solo los valores cero y/o uno.
Suele ser una variable cualitativa, reejando dos modalida-
des posibles o la presencia o ausencia de una cualidad.
Un caso intermedio entre las variables cualitativas y las cuan-
titativas son las variables ordinales cuando los valores tienen
un caracter nominal pero admiten una ordenaci on. Por ejem-
plo, las variables de opini on (muy insatisfecho, insatisfecho,
indiferente, satisfecho, muy satisfecho).
Finalmente, cuando sobre un mismo individuo se observa
m as de una caracterstica diremos que se trata de una varia-
ble multidimensional.
2.2. Presentaci on de los datos
Se trata b asicamente de establecer la forma de organizar los
datos en tablas y representarlos gr acamente mediante dia-
gramas con el objetivo de proporcionar una r apida y f acil per-
cepci on de algunas de sus principales caractersticas.
Habitualmente los datos se organizan en tablas llamadas dis-
tribuciones de frecuencias y se representan gr acamente me-
diante diagramas: de puntos, de rect angulos, de barras y sec-
tores, histogramas, polgonos de frecuencias, cartas tempora-
les, pictogramas, etc..
Antes de proceder a la representaci on gr aca de los datos
An alisis de Datos 15
es conveniente utilizar un procedimiento semigr aco, cono-
cido como diagrama de tallo y hojas que sirve para ordenar
los datos y para hacernos una idea de como estos se hallan
distribuidos.
2.2.1. Distribuciones de frecuencias
El resultado de observar una muestra o una poblaci on es en
un conjunto de datos que recoge los valores que toma una
variable estadstica sobre los individuos observados. Estos
valores suelen registrarse en forma de listados o protocolos y
pueden ser nominales, ordinales o num ericos, seg un el tipo
de variable observada. Una primera forma de sintetizar los
datos es analizar qu e valores aparecen y cuantas veces o en
qu e proporci on aparecen.
Supongamos que se observa una determinada caractersti-
ca X sobre n objetos o individuos. El valor n, como ya se
ha dicho, es el tama no o extensi on de la muestra. La mues-
tra se denotar a por M
x
= {x
1
, x
2
, , x
n
} (es el conjunto
de valores observados sobre los n individuos), y por D
x
=
{x
1
, x
2
, , x
k
} el conjunto de valores disitintos que apare-
cen en la muestra.
Se denomina frecuencia absoluta del valor x
i
al n umero de
veces n
i
que aparece el valor x
i
en el conjunto M
x
, y se de-
nota por f
a
(x
i
) = n
i
.
Se denomina frecuencia relativa del valor x
i
a la proporci on
de apariciones del valor x
i
en el conjunto M
x
, y se indica por
f
r
(x
i
) =
n
i
n
.
Con las frecuencias relativas se elimina la inuencia del n ume-
ro total de observaciones y eso permite la comparaci on entre
conjuntos de datos de distinto tama no.
Cuando los valores x
1
, x
2
, , x
k
admiten una ordenaci on
16 J. L. DazBarrero
tiene sentido hablar de frecuencia acumulada hasta el va-
lor i esimo. Supuesta una ordenaci on creciente x
1
x
2

x
k
, se dene:
F
a
(x
i
) =
i

k=1
f
a
(x
k
) =
i

k=1
n
k
;
F
r
(x
i
) =
i

k=1
f
r
(x
k
) =
i

k=1
n
k
n
.
Estos resultados se acostumbran a representar en tablas
(distribuciones de frecuencias), indicando en la primera co-
lumna los valores observados de la caracterstica X, ordena-
dos de menor a mayor cuando ello es posible, y, en columnas
sucesivas, las frecuencias absolutas y relativas y las frecuen-
cias absolutas acumuladas y relativas acumuladas cuando
ello tenga sentido.
x
i
f
a
(x
i
) f
r
(x
i
) F
a
(x
i
) F
r
(x
i
)
x
1
n
1
n
1
n
n
1
n
1
n
x
2
n
2
n
2
n
n
1
+n
2
n
1
+n
2
n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k
n
k
n
n
1
+n
2
+ +n
k
n
1
+n
2
+ +n
k
n
Para la presentaci on de los datos en tablas de frecuencias
(presentaci on analtica) hay que distinguir entre variables
cualitativas y cuantitativas discretas y continuas. El el caso
de variables cualitativas o cuantitativas discretas hay poca
diferencia como se muestra en los siguientes ejemplos.
An alisis de Datos 17
Ejemplo 2.2.1 De los 60 estudiantes que asisten a clase, 40
han nacido en Catalu na, 15 en el resto de Espa na y 5 son
extranjeros. Presentar los datos en una tabla de frecuencias.
Soluci on. En este caso se trata de una variable cualitativa
X que toma los valores {Catalu na,Espa na,Extranjero}, con
frecuencias absolutas {40, 15, 5} respectivamente. La corres-
pondiente tabla de frecuencias es la siguiente:
x
i
f
a
(x
i
) f
r
(x
i
)( %) F
a
(x
i
) F
r
(x
i
)( %)
Cat 40 66.66 40 66.66
Esp 15 25 55 91.66
Ext 5 8.33 60 100
Total 60
2
Ejemplo 2.2.2 Durante 100 das se ha anotado el n umero de
veces diarias que se han producido deciencias en el sumu-
nistro el ectrico por parte de la compa nia suministradora. Los
resultados fueron
x
i
0 1 2 3 4 5 6
n
i
60 30 4 3 1 0 2
Presentar los datos en una tabla de frecuencias y concluir si el
sumunistro puede considerarse o no satisfactorio.
Soluci on. En este caso se trata de una variable cuantitativa
discreta. Su correspondiente tabla de frecuencias es
18 J. L. DazBarrero
x
i
f
a
(x
i
) f
r
(x
i
) F
a
(x
i
) F
r
(x
i
)
0 60 0.60 60 0.60
1 30 0.30 90 0.90
2 4 0.04 94 0.94
3 3 0.03 97 0.97
4 1 0.01 98 0.98
5 0 0.00 98 0.98
6 2 0.02 100 1.00
Total 100
En base a los datos contenidos en la tabla se puede decir
que el suministro es correcto ya que en el 90 % de los das el
suministro o no presenta o a lo sumo sufre una deciencia.
2
En el caso de datos continuos es conveniente agrupar los
valores observados en clases y representar las frecuencias
de estas clases en tablas que como antes se llaman Tablas
de frecuencias.
Las fases a seguir son las siguientes:
i. Redondear los datos y expresarlos (si se considera con-
veniente) en unidades no decimales.
ii. Decidir el n umero de clases a considerar. Normalmente
es un n umero entre 5 i 20. Para determinarlo a veces se
utiliza la f ormula de Sturges:
NUM = E
_
3
4
+
log n
log 2
_
.
Tambi en se acostumbra a utilizar la raz cuadrada por
exceso del n umero de datos.
An alisis de Datos 19
iii. Contar el n umero de observaciones que caen dentro de
cada clase, i.e., las frecuencies absolutas y completar la
tabla de frecuencias.
Se utiliza la siguiente terminologa:
Clase o intervalo de clase: son cada uno de los intervalos
en que se han de agrupar los datos (aunque no es nece-
sario es conveniente que sean de igual longitud).
Lmites de clase: son los extremos de cada intervalo de cla-
se. El lmite inferior se representa por L
i
y el lmite su-
perior por L
s
.
Tama no de la clase: es la diferencia entre el L
s
L
i
.
Marca de clase: es el punto medio del intervalo de clase. To-
dos los elementos de la clase se representan por la mar-
ca de clase.
Ejemplo 2.2.3 Los datos siguientes corresponden a los por-
centajes de basura recilada de 104 puntos seleccionados al
azar en una determinada ciudad. Presentar los datos agrupa-
dos en clases y construir la correspondiente tabla de frecuen-
cias.
96,4 92,6 92,3 92,0 92,0 91,9 91,8 91,5 90,4 89,4
89,3 88,4 87,7 87,7 87,3 87,3 87,0 85,8 85,1 84,9
84,7 84,0 83,2 83,2 83,0 82,4 82,4 82,0 81,9 81,7
81,4 81,3 81,2 81,1 81,1 81,0 81,0 80,9 80,4 79,8
79,7 79,4 79,4 79,3 79,2 78,9 78,8 77,6 77,3 77,1
77,1 77,0 77,0 75,9 75,8 75,6 75,3 74,9 74,4 73,9
73,8 73,6 72,4 71,9 71,5 71,2 70,7 70,7 70,6 69,9
69,7 68,8 68,5 68,1 68,1 68,0 67,7 67,7 66,8 65,8
65,5 65,0 64,7 62,2 61,8 61,4 61,2 60,0 60,0 59,2
59,0 55,9 55,6 54,9 48,9 48,8 46,7 43,6 42,6 39,1
38,0 35,0 33,8 32,1
20 J. L. DazBarrero
Soluci on. Los 104 datos de que disponemos los distribuiremos
en 10 clases. La correspondiente tabla de frecuencias es
L
i
L
s
x
i
f
a
(x
i
) f
r
(x
i
)( %) F
a
(x
i
) F
r
(x
i
)( %)
3037 33.5 3 2.885 3 2.885
3744 40.5 4 3.846 7 6.731
4451 47.5 3 2.885 10 9.616
5158 54.5 3 2.885 13 12.501
5865 61.5 10 9.615 23 22.116
6572 68.5 18 17.308 41 39.424
7279 75.5 18 17.308 59 56.732
7986 82.5 28 26.923 87 83.655
8693 89.5 16 15.385 103 99.04
93100 96.5 1 0.962 104 100
Total 104
2
2.2.2. Diagramas de puntos y de tallo y hojas
El diagrama de puntos es util para conjuntos peque nos de
datos, dado que permite ver con rapidez y facilidad la ubica-
ci on o tendencia central de los datos, as como su dispersi on
o variabilidad.
El diagrama de tallo y hojas es un procedimiento semigraco
para presentar variables cuantitativas cuando el n umero de
datos no es muy elevado. Las fases de su construcci on son
las siguientes:
i. Redondear los datos y expresarlos en unidades no deci-
males.
An alisis de Datos 21
ii. Disponer los datos en una tabla a dos columnas sepa-
radas por una linea vertical de la forma siguiente:
a. Para datos con dos cifras, las decenas que son el ta-
llo, a la izquierda de la linea vertical y las unidades
que son las hojas a la derecha.
b. Para datos con tres cifras las centenas y decenas
forman el tallo y las unidades las hojas.
Cada tallo se escribe una vez, el n umero de hojas da la fre-
cuencia del tallo. Los diagramas de tallo y hojas son tambi en
utiles para ordenar los datos y para hacernos una idea de la
simetra de la distribuci on.
2.3. Representaciones gr acas
La informaci on contenida en las tablas de frecuencias pue-
de expresarse en forma gr aca sin que esta transformaci on
suponga una p erdida o ganacia de informaci on. Las distribu-
ciones de frecuencias se representan gr acamente mediante
diagramas de barras y rect angulos en el caso de variables
cualitatives o cuantitativas discretas y mediante histogramas
de frecuencias y polgonos de frecuencias cuando las varia-
bles son continuas. En el caso cualitativo tambi en se utilizan
los diagramas de sectores.
2.3.1. Diagramas de sectores
Se construyen de forma que su angulo central y por tanto
su area sea proporcional a la frecuencia absoluta correspon-
diente. Son utiles para presentar resultados de encuestas,
procesos electorales, etc.
22 J. L. DazBarrero
2.3.2. Diagrama de rect angulos
En el eje de abcisas se representan los valores de la varia-
ble en cualquier orden y en el de ordenadas se representan
las frecuencias. Cada categora se representa mediante un
rect angulo de altura proporcional a la frecuencia observada.
Los rect angulos tienen todos la misma amplitud de base.
2.3.3. Diagrama de Pareto
Es equivalente al diagrama de rect angulos pero ordenando
las categoras de mayor a menor frecuencia. Se construyen
representando los valores observados en una escala horizon-
tal (vertical), les frecuencias en una escala vertical (horizon-
tal) y se dibujan segmentos sobre los valores observados de
longitudes proporcionales a las frecuencias correspondien-
tes. Son utiles para variables cualitativas y cuantitativas dis-
cretas. El diagrama de barras acumuladas es como el diagra-
ma de barras pero para frecuencias acumuladas.
2.3.4. Histogramas
El Histograma se construye para representar la medida de las
observaciones que estan agrupadas en clases en un eje hori-
zontal, las frecuencias de clase en un eje vertical y se dibu-
jan rectangulos con sus bases determinadas por los lmites
de clase y sus alturas proporcionales a las correspondientes
frecuencias de clase. La altura de las clases puede calcularse
mediante la expresi on
altura =
frecuencia relativa
L
s
L
i
.
A modo de sntesis diremos que el histograma es la descrip-
An alisis de Datos 23
ci on gr aca m as importante de la distribuci on de las varia-
bles continuas. Su forma depende b asicamente de las clases,
que han de ser elegidas antes de construir la distribuci on de
frecuencias. Es recomendable que ninguna clase contenga
m as del 30 % de los datos y tambi en que no halla muchas
clases vacas.
2.3.5. Polgonos de frecuencies
En el caso de datos cualitativos o cuantitativos discretos se
construyen dibujando una poligonal que una los extremos
superiores de los segmentos del diagrama de barras. En el
caso de datos continuos se toman las frecuencies de clase en
las marcas de clase y se unen los puntos medios de la base
superior de los rectangulos del histograma mediante segmen-
tos.
2.3.6. Diagramas de linea o cartas temporales
Una forma de representar la evoluci on de una magnitud a
lo largo del tiempo es a trav es de los gr acos temporales.
Consisten en dibujar en un gr aco cartesiano los puntos que
tienen por abcisa el momento en que se raliza la observaci on
y por ordenada la magnitud de la observaci on. Uniendo los
puntos consecutivos mediante lineas se obtiene una poligo-
nal que proporciona una idea visual de la evoluci on temporal
de la variable.
2.4. Descripci on num erica de datos
Los par ametros poblacionales y los estadsticos muestra-
les son cantidades num ericas que resumen la informaci on
24 J. L. DazBarrero
contenida en los datos. Se llaman par ametros cuando ha-
cen referencia a la poblaci on y estadsticos cuando los datos
corresponden a una muestra. Se clasican en:
Par ametros de posici on (media aritm etica, mediana,
moda, centiles)
Par ametros de dispersi on (rango del conjunto de da-
tos, rango intercuartilico, desviaciones respecto a la me-
dia, varianza, desviaci on tpica o est andard, desviaci on
media, coeciente de variaci on de Pearson)
Par ametros de asimetra (coeciente de simetra: asi-
metra a la izquierda, simetra, asimetra a la derecha)
Par ametros de forma (coeciente de kurtosis: platicu arti-
cas, mesocu articas, leptocu articas).
2.4.1. Par ametros de posici on
Son descriptores del conjunto total de los datos. En cierta
forma son las medidas que describen el centro del conjunto
de datos y por eso tambi en se llaman par ametros de centra-
lizaci on o promedios.
2.4.2. La media aritm etica
La medida m as com un de tendencia central o localizaci on es
el promedio aritm etico ordinario o media aritm etica. Dado
que casi siempre, los datos con los que se trabaja correspon-
den a muestras, es por eso que a la media aritm etica tambi en
se le conoce como media muestral.
Si los datos correspondientes a una muestra de tama no n
son
An alisis de Datos 25
x
1
, x
2
, , x
k
, con frecuencias f
1
, f
2
, , f
k
, f
1
+f
2
+ +
f
k
= n, entonces la media muestral se dene como
x =
x
1
f
1
+x
2
f
2
+ +x
k
f
k
f
1
+f
2
+ +f
k
=
1
n
k

i=1
x
i
f
i
.
La media muestral x representa el valor promedio de todas
las observaciones en la muestra. Tambi en es posible pensar
en calcular el promedio de todas las observaciones de una
poblaci on. Este promedio se conoce como la media pobla-
cional y se acostumbra a representar per la letra griega .
Ejemplo 2.4.1 Determinar un valor aproximado de la media
aritm etica de un conjunto de datos del que se dispone de la
siguiente informaci on:
L
i
L
s
x
i
f
a
(x
i
) f
r
(x
i
)( %) F
a
(x
i
) F
r
(x
i
)( %)
3037 33.5 3 2.885 3 2.885
3744 40.5 4 3.846 7 6.731
4451 47.5 3 2.885 10 9.616
5158 54.5 3 2.885 13 12.501
5865 61.5 10 9.615 23 22.116
6572 68.5 18 17.308 41 39.424
7279 75.5 18 17.308 59 56.732
7986 82.5 28 26.923 87 83.655
8693 89.5 16 15.385 103 99.04
93100 96.5 1 0.962 104 100
Total 104
Soluci on. La media aritm etica es
x =
x
1
f
1
+x
2
f
2
+ +x
k
f
k
f
1
+f
2
+ +f
k
=
1
n
k

i=1
x
i
f
i
=
7614
104
= 73,21
26 J. L. DazBarrero
donde se han tomado las marcas de clase como representan-
tes de todos los elementos contenidos en ellas. 2
La media goza de la siguiente propiedad:
(i) x +y + +z = x +y + +z
(ii) ax = ax.
El valor de la media, a diferencia de otros par ametros de posi-
ci on, no depende del orden en que se hayan escrito los datos.
Si
x
1
, x
2
, , x
n
es un conjunto de observaciones, se acostumbra a represen-
tar por
x
(1)
, x
(2)
, , x
(n)
al conjunto de las mismas observaciones ordenadas de me-
nor a mayor.
Se llama robustez de un par ametro a su resistencia o sensi-
bilidad a los valores extremos, tambi en conocidos como da-
tos atpicos o outliers. Son valores correctos, pero que se
caracterizan por una diferencia pronunciada respecto a los
dem as datos. Deben analizarse cuidadosamente para deter-
minar si provienen de otra poblaci on. Caso de corresponder
a la poblaci on analizada, puede interesar no considerarlos
para el c alculo de estadsticos muy sensibles a los valores
extremos.
La media aritm etica, como ya se ha dicho, es muy sensible a
los valores extremos. Esta falta de robustez se remedia con la
media recortada que modera el efecto de los datos atpicos
en el c alculo de la media aritm etica suprimiendo los valores
extremos. La media recortada al por ciento es la media de
los datos que quedan despu es de suprimir el /2 por cien-
to de los datos m as grandes y el /2 por ciento de los m as
An alisis de Datos 27
peque nos. La media aritm etica ponderada es equivalente a
la media aritm etica, pero para observaciones ponderadas por
pesos w
1
, w
2
, , w
k
. Se dene por
x
p
=
k

i=1
w
i
x
i
k

i=1
w
i
.
2.4.3. La Mediana
La mediana de un conjunto de datos es un valor que di-
vide a la muestra en dos partes iguales cuando estos se ha-
llan ordenados. Cuando la muestra consta de un n umero par
de elementos, cualquier n umero entre los dos centrales sa-
tisface la denici on de mediana. En tal caso, sin embargo,
es conveniente tomar la media aritm etica de los dos valores
centrales como mediana. Sintetizando, con datos ordenados
la mediana se dene como
Me
X
= x =
_
_
_
x
(
n+1
2
)
, n impar,
x
(n/2)
+x
(n/2+1)
2
, n par.
Cuando los datos est an agrupados en clases, para calcular
la mediana se utilizan las expresiones:
(a)
x = Me
X
= L
i
+c
_
n
2
_
F
i1
f
i
donde L
i
es el lmite inferior de la clase mediana, c es
la amplitud de la clase, n el n umero total de datos, F
i1
la frecuencia absoluta acumulada de la clase anterior a
28 J. L. DazBarrero
la clase mediana y f
i
la frecuencia absoluta de la clase
mediana
(b)
x = Me
X
= L
i
+c(j/f
i
)
donde L
i
es el lmite inferior de la clase mediana, c es
la amplitud de la clase, j es el n umero de observaciones
en esta clase hasta completar un total de n/2 y f
i
la
frecuencia de la clase mediana.
Obs ervese que las expresiones (a) y (b) dicen lo mismo dado
que n/2 F
i1
= j.
2.4.4. Los Percentiles
Otros par ametros m as generals que la mediana son los cen-
tiles que son los puntos que dividen la serie de datos orde-
nados en cien partes iguales. En general, el k- esimo centil x
k
es un valor tal que, al menos el k % de las observaciones que-
dan en el valor o por debajo de el, y al menos el (100 k) %
est an en el valor o por encima de el. En el caso de datos agru-
pados en clases para aproximar su valor se puede utilizar la
f ormula
x
k
= L
i
+c
_
nk
100
_
F
k1
f
k
Algunos reciben nombres particulares. As x
25
= q
i
= q
1
=
P
0,25
es el cuartil inferior (el 25 % de los datos son m as pe-
que nos o iguales que el). La mediana x = x
50
= P
0,50
. El
centil x
75
= q
s
= q
3
= P
0,75
es el cuartil superior (el 75 % de
los datos son inferiores o iguales a el.)
An alisis de Datos 29
2.4.5. La Moda
Es la observaci on que presenta mayor frecuencia en la mues-
tra. Cuando en la muestra hay m as de una observaci on con
la m axima frecuencia la distribuci on se dice bimodal si hay
dos modas, y en general, multimodal si hay tres o m as mo-
das. En el caso de datos agrupados la moda se puede obtener
aproximadamente a partir de la f ormula
Mo
X
= L
i
+c
D
1
D
1
+D
2
donde L
i
es el lmite inferior de la clase modal, c es el tama no
de la clase modal, D
1
la diferencia entre la frecuencia abso-
luta de la clase modal y la anterior y D
2
la diferencia entre la
frecuencia absoluta de la clase modal y la posterior.
2.4.6. Par ametros de dispersi on
Las medidas de variabilidad o par ametros de dispersi on dan
una idea de hasta que punto los datos se dispersan o agru-
pan en torno a los valores centrales.
2.4.7. Rango de un conjunto de datos
El menor valor observado en la muestra es el mnimo, i.e.,
min{x
1
, x
2
, , x
n
} = x
(1)
.
El mayor valor observado en la muestra es el m aximo, i.e.,
max{x
1
, x
2
, , x
n
} = x
(n)
.
30 J. L. DazBarrero
Una de las medidas m as sencillas de variabilidad es el rango
que se dene como la diferencia entre los valores m aximo y
mnimo, es decir,
R = max{x
1
, x
2
, , x
n
}min{x
1
, x
2
, , x
n
} = x
(n)
x
(1)
.
Este par ametro es muy sensible (poco robusto) a los valores
extremos de la muestra.
2.4.8. Rango intercuartlico
Se dene como la diferencia entre el cuartil superior y el in-
ferior, i.e.,
R
iq
= q
s
q
i
= x
75
x
25
.
Es menos sensible a los valores extremos que el rango del
conjunto de datos.
2.4.9. Desviaciones respecto a la media
Son las diferencias (errores) entre cada dato y su media arit-
m etica. Si los datos son
x
1
, x
2
, , x
n
,
entonces las desviaciones respecto a la media o errores abso-
lutos son x
1
x, x
2
x, , x
n
x. Estas diferencias tienen
la propiedad de que su suma es zero.
2.4.10. La varianza y la desviaci on tpica
Son las medidas m as importantes de variabilidad. Si x
1
, x
2
, , x
n
,
es una muestra de n observaciones, entonces la varianza se
An alisis de Datos 31
dene como la media aritm etica de los cuadrados de las des-
viaciones respecto a la media. Es decir,
s
2
=
1
n
n

k=1
(x
k
x)
2
=
1
n
n

k=1
x
2
k
x
2
.
Tambi en se puede denir el estadstico varianza muestral co-
rregida por
s
2
c
=
1
n 1
n

k=1
(x
k
x)
2
=
1
n 1
_
n

k=1
x
2
k
nx
2
_
.
La desviaci on muestral est andard, s, es la raz cuadrada
positiva de la varianza, i.e.,
s =

_
1
n
n

k=1
(x
k
x)
2
=

_
1
n
n

k=1
x
2
k
x
2
.
La varianza goza de la siguiente propiedad
V ar(aX +b) = a
2
V ar(X)
y la desviaci on tpica verica
S
aX+b
= |a|S
X
.
El error estandard de la media se dene por se = s/

n.
Cuando solo se conocen la media x y la desviaci on tpica s
de un conjunto de datos, la regla emprica de Chebyshev
permite otra interpretaci on de la desvieci on tpica propor-
cionando informaci on sobre el n umero de observaciones que
caen en los siguientes intervalos:
(x 2s, x + 2s) contiene al menos el 75 % de los datos.
32 J. L. DazBarrero
(x 3s, x + 3s) contiene al menos el 88 % de los datos.
(x 4s, x + 4s) contiene al menos el 93 % de los datos.
2.4.11. Desviaci on media
Es la media aritm etica de los valores absolutos de las desvia-
ciones respecto a la media, es decir,
d =
1
n
n

k=1
|x
k
x|.
Aunque no se cumple de forma exacta, se puede decir que la
relaci on entre d y s, viene dada por d 0,8s.
2.4.12. Coeciente de variaci on de Pearson
Cuando se quiere expresar la variaci on como una fracci on de
la media se puede utilizar una medida porcentual de variabi-
lidad relativa, denominada coeciente de variaci on mues-
tral, que se dene por
C
v
=
s
|x|
100, x = 0
e indica la magnitud promedio del error (desviaci on tpica)
como porcentaje de la media. Es util para comparar las dis-
persiones de variables que aparecen en unidades distintas o
que dieren considerablemente en la magnitud de las obser-
vaciones.
Si el C
v
es menor que 100, indica homogeneidad en los datos;
si es mayor que 150 puede ser indicio de heterogeneidades
debidas a mezclas de poblaciones distintas; esto puede darse
An alisis de Datos 33
de forma no evidente en una primera aproximaci on cuando
han sido utilizados instrumentos distintos para la medici on
de parte de los objetos, o bien se han realizado las obser-
vaciones en momentos distintos o por personas distintas de
forma que estos factores hayan inuido en los resultados.
2.4.13. Par ametros de simetra
Otro rasgo interesante, adem as de la posici on y la dispersi on
de los datos es la simetra de las observaciones respecto a
la media. Esta puede detectarse a partir de la representaci on
gr aca de las frecuencias (diagramas de barras, histogramas,
polgonos de frecuencia). Indicadores num ericos son la rela-
ci on entre la media, mediana y moda:
Mo x x indica simetra.
Mo x x indica simetra negativa (a la izquierda).
Mo x x indica simetra positiva (a la derecha).
Otro indicador num erico es el coeciente de asimetra que
se dene a partir de las desviaciones respecto a la media x
1

x, x
2
x, , x
n
x, por
Cas
X
=
1
ns
3
X
n

k=1
(x
k
x)
3
.
Este coeciente, que es adimensional, vale cero para distri-
buciones sim etricas alrededor de la media. Es negativo para
distribuciones asim etricas a la izquierda y positivo para dis-
tribuciones asim etricas a la derecha.
Si se detecta una asimetra junto con datos atpicos, es con-
veniente estudiar la viabilidad de una transformaci on de los
datos.
34 J. L. DazBarrero
2.4.14. Par ametros de forma
Otra caracterstica de inter es en una distribuci on de datos es
su apuntamiento o kurtosis. Considerando las cuartas po-
tencias de las desviaciones respecto a la media se dene el
coeciente de apuntamiento por
Cap
X
=
1
ns
4
X
n

k=1
(x
k
x)
4
.
Este apuntamiento se suele comparar con una distribuci on
patr on, generalmente la normal, y la distribuci on se dice lep-
tocu artica cuando est a m as apuntada que la normal (Cap
3), mesocu artica cuando su apuntamiento es similar al de
la normal y platicu artica cuando est a menos apunatada que
la normal (Cap 3).
2.4.15. Momentos muestrales
El momento muestral r- esimo en torno al orgen se dene
por
m

r
=
1
n
n

k=1
x
r
k
.
El momento muestral r- esimo en torno a la media se de-
ne por
m
r
=
1
n
n

k=1
(x
k
x)
r
.
Obs ervese que m

1
= x y m
2
= s
2
.
An alisis de Datos 35
2.4.16. Box-plot y detecci on de valores atpi-
cos
El box-plot o diagrama de caja es un procedimiento gr aco
que permite describir en forma resumida algunas de las ca-
ractersticas m as importantes de un conjunto de datos. Estas
son: el centro, la dispersi on, las asimetras y la distribuci on
de valores an omalos. Su construcci on se basa en medidas
resistentes a la presencia de valores atpicos.
Las fases a seguir para construir un box-plot son:
C alculo del rango intercuartilico R
iq
= q
3
q
1
.
C alculo de los intervalos [f
1
, f
3
] y [F
1
, F
3
] con
f
1
= q
1
1,5R
iq
f
3
= q
3
+ 1,5R
iq
y
F
1
= q
1
3R
iq
F
3
= q
3
+ 3R
iq
.
Si la asimetra en los datos es peque na, entonces los va-
lores observados en [F
1
, f
1
] o en [f
3
, F
3
] se consideran
como anomalias moderadas y los observados antes de
F
1
y despu es de F
3
como anomalias extremas.
Este diagrama que puede servir para ltrar los datos de po-
sibles errores, est a formado por una caja o rect angulo hori-
zontal o vertical, que presenta los tres cuartiles y los valo-
res m aximo y mnimo de los datos. La arista izquierda del
rect angulo corresponde al cuartil q
1
y la derecha a q
3
. Den-
tro del rect angulo se dibuja una linea que corresponde a la
mediana. Desde cualquier arista se extienden unas lineas o
bigotes que contienen todas las observaciones comprendi-
das entre cero y 1,5 veces el rango intercuartlico o barreras
interiores. Los valores en que nalizan los bigotes se llaman
adjuntos.
36 J. L. DazBarrero
2.4.17. Transformaciones
A veces a los datos es conveniente aplicarles transforma-
ciones lineales de la forma y
i
= a + bx
i
. Se cumple que
y = a + bx y que s
2
y
= b
2
s
2
x
. Una de las transformaciones
lineales m as importantes es la tipicaci on o estandariza-
ci on de una variable que para una serie de observaciones
x
1
, x
2
, , x
n
, se dene por
z
i
=
x
i
x
s
.
Se verica que z = 0 y s
2
z
= 1 y carece de unidades, lo que
permite una comparaci on directa entre fen omenos de distin-
ta ndole. Cuando la distribuci on es muy asim etrica se sue-
len aplicar transformaciones no lineales. Como regla gene-
ral se tiene que si el cociente x
max
/x
min
es menor que 2, la
transformaci on no modicar a mucho la forma de la distribu-
ci on, mientras que para un cociente mayor que 10 el efecto
ser a acusado. Las m as utilizadas son y = x
2
que comprime
la escala para valores peque nos y la expande para valores
grandes. Es util para asimetras a la izquierda. Para asime-
tras a la derecha se utilizan las transformaciones y = ln(x)
e y = 1/x que comprimen los valores grandes y expanden los
peque nos. La m as utilizada es el logaritmo neperiano.
An alisis de Datos 37
2.5. Problemas de An alisis explorato-
rio de datos
Problema 2.1 Dado el siguiente conjunto de datos
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
a. Ordenar los datos.
b. Hacer una tabla de frecuencias agrupando los datos en
nueve clases (utilizar el rango 70250).
c. Representar gr acamente la distribuci on de frecuencias me-
diante un histograma.
d. Dibujar los correspondientes polgonos de frecuencias (ordi-
narias y acumuladas)
Problema 2.2 Para asistir a una feria de la construcci on hay
dos tipos de entradas: empresas 25 euros y particulares 4 eu-
ros. Sabiendo que el precio medio result o 18 euros. Qu e pro-
porci on de empresas asisiti o a la feria?
Soluci on. Sean p
1
y p
2
las propociones respectivas de empre-
sas y particulares que asisten a la feria y x
1
y x
2
los precios
38 J. L. DazBarrero
de las entradas. Entonces, x = x
1
p
1
+ x
2
p
2
con p
1
+ p
2
= 1.
Sustituyendo los datos del enunciado, resulta
25p
1
+ 4p
2
= 18
p
1
+p
2
= 1
_
.
Resolviendo el sistema anterior se obtiene p
1
= 2/3 y p
2
=
1/3. 2
Problema 2.3 Durante los 6 ultimos a nos el precio del litro de
gasoil (en pts.) ha sufrido las siguientes variaciones:
55, 62, 72, 90, 120, 115.
Un peque no transportista ha tanido 2 camiones los dos pri-
meros a nos, 3 durante el tercero y 4 los tres ultimos. Hallar
el precio medio pagado por el transportista por cada litro de
gasoil consumido durante los 6 a nos.
Soluci on. Cuando todos los valores que intervienen en la va-
riable X no tienen la misma trascendencia, para obtener la
media aritm etica es preciso tener en cuenta la importancia
de cada dato, esto es ponderarlos.
Esta ponderaci on se efect ua asignando a cada valor un coe-
ciente de importancia o peso. As si x
1
, x
2
, , x
n
son los
valores que toma X con frecuencias f
1
, f
2
, , f
n
y pesos
w
1
, w
2
, , w
n
, la media aritm etica ponderada se calcula por
x =
n

k=1
x
k
f
k
w
k
n

k=1
f
k
w
k
En el caso que nos ocupa X = {55, 62, 72, 90, 120, 115} con
pesos {2, 2, 3, 4, 4, 4} con lo que x =
1750
19
= 92,10 pts. 2
An alisis de Datos 39
Problema 2.4 En un area de servicio de una autopista se de-
sarroll o un proceso para atender a los clientes durante la hora
punta del almuerzo. Se registr o el tiempo de espera de todos
los clientes que fueron atendidos durante una semana. Se se-
leccion o una muestra aleatoria de 16 clientes y los resultados
fueron:
4,21, 5,55, 3,02, 5,13, 4,77, 2,34, 3,54, 4,15
3,20, 4,50, 6,10, 0,38, 5,12, 6,46, 6,19, 3,79
Obtener los siguientes estadsticos muestrales:
(1) media aritm etica, (2) mediana, (3) primer cuartil, (4) tercer
cuartil, (5) segundo decil, (6) percentil x
84
, (7) el rango, (8) el
rango intercartlico, (9) la varianza, (10) la desviaci on est andar,
(11) la desviaci on media, (12) el coeciente de variaci on de
Pearson.
Problema 2.5 Comprobar que la varianza puede escribirse en
la forma
s
2
=
1
n
n

k=1
x
2
k
x
2
.
Cu ando ser a cero? Y negativa?
Problema 2.6 Dos variables constan de dos datos cada una.
La media de estas es la misma, y tambi en lo son sus desvia-
ciones tpicas. Son necesariamente iguales los dos conjuntos
de datos? Y si las variables tuviesen 3 datos cada una?
Soluci on. La respuesta a la primera pregunta es armativa.
En efecto, sean X = {x
1
, x
2
} e Y = {y
1
, y
2
} los dos conjun-
tos de adtos. Entonces, si x = y resulta
x
1
+x
2
2
=
y
1
+y
2
2
; x
1
+x
2
= y
1
+y
2
. (2.1)
40 J. L. DazBarrero
Obs ervese que x
1
x =
x
1
x
2
2
, x
2
x =
x
1
x
2
2
, e igual-
mente y
1
y =
y
1
y
2
2
, y
2
y =
y
1
y
2
2
.
Entonces,
S
2
x
=
(x
1
x)
2
+ (x
2
x)
2
2
=
(x
1
x
2
)
2
4
,
S
2
y
=
(y
1
y)
2
+ (y
2
y)
2
2
=
(y
1
y
2
)
2
4
.
Si S
2
x
= S
2
y
, entonces
(x
1
x
2
)
2
= (y
1
y
2
)
2
(2.2)
De (2.1) y (2.2) resulta x
1
= y
1
y x
2
= y
2
or x
2
= y
1
y x
1
= y
2
como se haba anunciado.
La respuesta a la segunda pregunta es no. En efecto, basta
con encontrar un contraejemplo. Sean X = {3, 2, 1} e Y =
{1, 2, 3} ambos tienen media 0 e igual varianza, pero son
distintos. 2
Problema 2.7 En la determinaci on complexom etrica del Zn con-
tenido en una muestra de un determinado material se obtuvie-
ron los siguientes resultados ( %): 10,02, 10,04, 9,98, 10,48. En
base a estos resultados, qu e dato se podra tomar como opti-
mo? Porqu e?
Soluci on. La media aritm etica de las observaciones es x =
10,125. Las correspondientes desviaciones medias son
|x
1
x| = 0,105, |x
2
x| = 0,085,
|x
3
x| = 0,170, |x
4
x| = 0,335.
Parece razonable tomar x
2
como valor optimo por ser el que
m as se acerca a la media aritm etica de los resultados. 2
An alisis de Datos 41
Problema 2.8 Los siguientes datos corresponden a la resis-
tencia a la tensi on (kgf/cm
2
)de un mortero portland:
17,50 17,63 18,25 18,00 17,86
17,75 18,22 17,90 17,96 18,15
Un ingeniero agrega un polmero de l atex al mortero para deter-
minar sus efectos sobre la resistencia a la tensi on. Los datos
obtenidos con este experimento fueron:
16,85 16,40 17,21 16,35 16,52
17,04 16,96 17,15 16,59 16,57
a. Ordenar los datos de ambos conjuntos y representarlos gr a-
camente de forma que sea f acil percibir su tendencia
central as como su variabilidad. Qu e se puede concluir?
b. Hallar la media y la desviaci on tpica de cada conjunto de
datos y comparar los resultados con los del apartado an-
terior.
Problema 2.9 Cinco determinaciones de Fe en un mineral por
volumetra dieron como resultado:
67,48, 67,37, 67,43, 67,40, 67,47.
Calcular los estadsticos que se consideren apropiados para
detectar si hay alg un valor an omalo. Suponiendo que el proce-
dimiento se acepta como v alido siempre que la dispersi on de
los datos no supere el 0,08 %, podra decirse que los resul-
tados obtenidos en la volumetra anterior han sido satisfacto-
rios?
Soluci on. Calculando los estadsticos: media, mediana, va-
rianza, desviaci on tpica y coeciente de variaci on se obtiene
x = 67,43 M = 67,43 s
2
= 0,0017 s = 0,0415 CV = 0,06 %
42 J. L. DazBarrero
Dado que el coeciente de variaci on es inferior al 0,08 % se
puede concluir que los resultados obtenidos son satisfacto-
rios. 2
Problema 2.10 Sobre un conjunto de datos X se dispone de
la siguiente informaci on
Clases Punto medio Frecuencia
58.561.5 60 4
61.564.5 63 8
64.567.5 66 12
67.570.5 69 13
70.573.5 72 21
73.576.5 75 15
76.579.5 78 12
79.582.5 81 9
82.585.5 84 4
85.588.5 87 2
Calcular el n umero de datos. Hallar la media, la mediana, la
moda y los cuartiles. La varianza, desviaci on tpica y coe-
ciente de variaci on de Pearson. Los coecientes de asimetra y
kurtosis.
Problema 2.11 El Departamento de Recursos Naturales ini-
ci o un programa de seguimiento de la precipitaci on acida con
el n de desarrollar controles apropiados de poluci on del aire
para reducir el problema de la lluvia acida. Se midi o la aci-
dez de las primeras 50 lluvias registradas, en escala pH, ob-
An alisis de Datos 43
teni endose los siguientes resultados:
3,58 3,80 4,01 4,01 4,05 4,05 4,12 4,18 4,20 4,21
4,27 4,28 4,30 4,32 4,33 4,35 4,35 4,41 4,42 4,45
4,45 4,50 4,50 4,50 4,50 4,51 4,52 4,52 4,52 4,57
4,58 4,60 4,61 4,61 4,62 4,62 4,65 4,70 4,70 4,70
4,70 4,72 4,78 4,78 4,80 5,07 5,20 5,26 5,41 5,48
Analizar estos datos (tabulaci on de frecuencias, c alculo de es-
tadsticos, representaci on gr aca y detecci on de valores an oma-
los)
(Obs ervese que todas las lluvias son m as acidas que la lluvia
normal, cuyo pH es 5,6).
Problema 2.12 Para estudiar la presencia de plomo en la atm osfe-
ra (gr/m
3
) se han realizado 64 mediciones en una autopista
y se han obtenido los siguientes resultados:
6,7 5,4 5,2 6,0 8,7 6,0 6,4 8,3
5,3 5,9 7,6 5,0 6,9 6,8 4,9 6,3
5,0 6,0 7,2 8,0 8,1 7,2 10,9 9,2
8,6 6,2 6,1 6,5 7,8 6,2 8,5 6,4
8,1 2,1 6,1 6,5 7,9 15,1 9,5 10,6
8,4 8,3 5,9 6,0 6,4 3,9 9,9 7,6
6,8 8,6 8,5 11,2 7,0 7,1 6,0 9,0
10,1 8,0 6,8 7,3 9,7 9,3 3,2 6,4
Hacer un an alisis exploratorio de estos datos: escribir una ta-
bla de frecuencias, calcular los estadsticos que se consideren
apropiados, dibujar el histograma y los polgonos de frecuen-
cias ordinarias y acumuladas. Detectar los valores an omalos,
si los hay, haciendo el correspondiente boxplot.
Problema 2.13 En las grandes ciudades la calidad del aire
se controla peri odicamente. El estado de alarma L se presen-
ta cuando el ndice de contaminaci on se halla entre 275 y 350.
44 J. L. DazBarrero
El estado de alarma G se presenta cuando el ndice de con-
taminaci on supera el valor 350. Suponiendo que el ndice de
contaminaci on se distribuye con media 125 y desviaci on tpica
75 y sin conocer nada m as acerca de la distribuci on, qu e po-
demos decir sobre la proporci on de das que se declarar a la
alerta L?, y la alerta G?
Captulo 3
An alis exploratorio de
datos bivariantes
3.1. Variables bidimensionales
Se llama variable estadstica bidimensional al conjunto de
parejas de valores que resultan de la observaci on conjunta
de dos caractersticas medibles X e Y de una poblaci on. Una
muestra compuesta por n pares de datos toma la forma
M
x,y
= {(x
1
, y
1
), (x
2
, y
2
), , (x
n
, y
n
)}.
De forma an aloga a como se hizo en el caso de datos univa-
riantes se dene la frecuencia absoluta del par (x
i
, y
j
) como
el n umero de apariciones de (x
i
, y
j
) en la muestra M
x,y
. La
frecuencia relativa de (x
i
, y
j
) es la proporci on de aparicio-
nes de (x
i
, y
j
) respecto al n umero total de observaciones. Se
representan, respectivamente, por f
a
(x
i
, y
j
) y f
r
(x
i
, y
j
).
Si x
1
, x
2
, , x
h
son los h valores distintos de la caractersti-
ca X e y
1
, y
2
, , y
k
son los k valores distintos de Y, se llama
distribuci on conjunta de frecuencias absolutas a la tabla
de doble entrada que contiene las frecuencias absolutas de
45
46 J. L. DazBarrero
los pares (x
i
, y
j
). En ella, se escriben los elementos de una
variable en la los de la otra en columna y, en la intersecci on
de cada la y cada columna, se escriben las frecuencias de la
pareja de valores correspondiente.
X \ Y y
1
y
2
. . . y
k
x
1
f
11
f
12
. . . f
1k
x
2
f
21
f
22
. . . f
2k
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
h
f
h1
f
h2
. . . f
hk
Si se a nade a la tabla de doble entrada de una distribuci on
bivariante una la y una columna con los totales respectivos
se obtienen dos distribuciones unidimensionales: la formada
por la primera y ultima columna por un lado y la formada por
la primera y la ultima la por otro. Estas reciben el nombre
de distribuciones marginales de la X y la Y respectivamen-
te.
X \ Y y
1
y
2
. . . y
k
x
1
f
11
f
12
. . . f
1k

f
1j
x
2
f
21
f
22
. . . f
2k

f
2j
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
h
f
h1
f
h2
. . . f
hk

f
hj

f
i1

f
i2
. . .

f
ik
N
Las distribuciones marginales son las distribuciones de cada
una de les variables consideradas por separado, sin tener en
cuenta los valores de la otra.
Procediendo de forma an aloga se obtienen las distribuciones
conjunta y marginales de frecuencias relativas.
An alisis de Datos 47
3.2. Ajuste mnimo-cuadr atico
Si se dispone de n parejas de datos se pueden representar
gr acamente en un sistema de ejes X-Y. A esta representa-
ci on cartesiana de las parejas de valores que corresponden
a una variable bidimensional se le denomina diagrama de
dispersi on, scattergram o nube de puntos. La observaci on
de la nube de puntos s olo proporciona una idea intuitiva de
la posible relaci on o dependencia entre las variables. A con-
tinuaci on se presenta un procedimiento para hallar esta re-
laci on cuando sea lineal, i.e. cuando los puntos que resultan
estan aproximadamente situados alrededor de una recta. Si
se supone que los datos, en general de naturaleza diferente,
son
X : x
1
x
2
. . . x
n
Y : y
1
y
2
. . . y
n
Se llama variable control o variable independiente a la va-
riable X y variable dependiente o variable respuesta a Y .
La variable control toma sus valores libremente, y posible-
mente en una etapa pr evia a la realizaci on de los experimen-
tos que conduciran a obtener los valores de la variable res-
puesta.
Un procedimiento de ajuste es el m etodo de los mnimos
cuadrados (Legendre, pricipios del siglo XIX) y proporciona
los par ametros = a y = b de la recta y = +x para la
que (a, b) es un mnimo de la funci on
L(, ) =
n

i=1
_
y
i
x
i
_
2
.
Siguiendo el procedimiento habitual para minimizar la fun-
ci on L(, ) resultan las ecuaciones normales
48 J. L. DazBarrero
L

= 0,
L

= 0
que tienen por soluci on
= b =
S
xy
S
2
X
= a = y bx
donde
S
xy
=
1
n
n

i=1
(x
i
x)(y
i
y)
es la covarianza muestral de X e Y y S
2
x
=
1
n
n

i=1
(x
i
x)
2
es la varianza de X. La diferencia y
i
(a+bx
i
) = e
i
se llama
residuo del modelo en x
i
. El n umero
S
2

=
1
n 2
n

i=1
e
2
i
es un estimador de la varinza residual y sirve para dar una
idea de la magnitud de los residuos.
Supongamos que conocemos la recta de ajuste que liga dos
variables X e Y y que tiene por ecuaci on
y = a +bx = y +b(x x)
Ahora cabe preguntarse como se puede relacionar el valor y
i
con el valor predicho por el model y
i
? La respuesta es que
y = y +b(x
i
x).
An alisis de Datos 49
En particular,
y
i
y
i
= y +b(x
i
x), i = 1, 2, , n.
De aqu resulta
y
i
y b(x
i
x), i = 1, 2, , n,
o bien
y
i
y = b(x
i
x) +e
i
, i = 1, 2, , n (3.1)
Esto signica que la variaci on de y respecto a y es debida en
parte a la relaci on de linealidad entre X e Y y en parte no.
La diferencia y
i
y se llama variaci on total de y
i
y es igual
a la suma de la variaci on explicada por el modelo b(x
i
x)
m as la variaci on no explicada o residual e
i
..
Como puede verse cuanto menor sea |
i
|, i.e., cuanto mayor
sea la parte de la variaci on debida a la relaci on lineal mejor
ser a el ajuste. Ahora conviene tener en cuenta todos los datos
y denir:
Variabilidad total V T =
n

i=1
(y
i
y)
2
Variabilidad explicada V E =
n

i=1
b
2
(x
i
x)
2
Variabilidad no explicada o residual V NE =
n

i=1
e
2
i
.
50 J. L. DazBarrero
Puede demostrarse que
n

i=1
e
2
i
=
n

i=1
(y
i
y)
2

i=1
b
2
(x
i
x)
2
.
Dado que
VT=VE+VNE
resulta
n

i=1
(y
i
y)
2
= b
2
n

i=1
(x
i
x)
2
+
n

i=1
e
2
i
(3.2)
Ahora, a partir de (3.2) se puede escribir
nS
2
Y
= nb
2
S
2
X
+ (n 2)S
2
e
y denir el coeciente de determinaci on como el porcentaje
de variabilidad explicado por el modelo, i.e.,
r
2
=
V E
V T
=
b
2
S
2
X
S
2
Y
=
S
2
xy
S
2
x
S
2
y
y el coeciente de correlaci on muestral de Pearson por
r =
S
xy
S
x
S
y
.
El coeciente de correlaci on (determinaci on) sirve para dar
una medida de la dependencia funcional (lineal) entre las va-
riables X e Y. El criterio que se acostumbra a utilizar es el
siguiente:
Si |r| < 0,5, entonces la dependencia se considera d ebil.
An alisis de Datos 51
Si 0,5 |r| < 0,8, entonces la dependencia se considera
moderada.
Si 0,8 |r| < 1, entonces la dependencia se considera
fuerte.
Tambi en se utiliza la siguiente nomenclatura: si |r| = 1 se di-
ce que hay dependencia funcional lineal entre las variables;
si 1 < r < 0 se habla de dependencia aleatoria con corre-
laci on negativa o inversa; si 0 < r < 1, la dependencia es
aleatoria con correlaci on positiva o directa y nalmente, si
r = 0 se dice que las variables X e Y son incorrelacionadas
(condici on necesaria).
Otras expresiones de la recta de ajuste son:
Y sobre X : y y =
S
xy
S
2
x
(x x).
X sobre Y : x x =
S
xy
S
2
y
(y y).
Obs ervese que la recta de ajuste siempre pasa por (x, y) el
centro de gravedad de los datos. (Reexionar sobre los valores
atpicos).
3.3. Problemas de An alisis Explorato-
rio de Datos Bivariantes
Problema 3.1 En una muestra de 20 empresas del sector de
la construcci on se obtuvieron los siguientes datos sobre el n ume-
ro de empleados X y sus ingresos anuales Y (10
4
euros)
52 J. L. DazBarrero
X/Y 50-100 100-250 250-1000
10-30 6 2 0
30-50 1 1 0
50-100 0 0 10
a) Calcular la media de los ingresos anuales y del n umero em-
pleados. Obtener tambi en su varianza.
b) Calcular los coecientes de variaci on e interpretar los resul-
tados obtenidos.
c) Obtener, aplicando el m etodo de los mnimos cuadrados,
una recta que ajuste los datos y permita predecir los in-
gresos medios anuales en funci on del n umero de emplea-
dos.
Problema 3.2 En un estudio sobre la relaci on existente entre
el tiempo que tarda un obrero de una autopista en realizar
una tarea en la ma nana (X) y al nal de la tarde (Y ), se han
obtenido los siguientes datos:
10

k=1
x
k
= 86,7,
10

k=1
x
2
k
= 771,35,
10

k=1
y
k
= 88,8,
10

k=1
y
2
k
= 819,34,
10

k=1
x
k
y
k
= 792,92.
Calcular el coeciente de correlaci on e interpretar el resultado.
Problema 3.3 Los datos siguientes corresponden a dos varia-
bles X e Y :
X 1.5 1.5 2.0 2.5 2.5 3.0 3.5 3.5 4.0
Y 23.0 24.5 25.0 30.0 33.5 40.0 40.5 47.0 49.0
An alisis de Datos 53
a) Dibujar la nube de puntos. b) Sugiere este diagrama una
asociaci on lineal? Calcular el coeciente de correlaci on mues-
tral y determinar la ecuaci on de la recta de ajuste mnimo cua-
dr atico.
Problema 3.4 La materia prima que se usa en la producci on
de un determinado material se almacena en un lugar que no
tiene control de humedad. Las medidas de la humedad rela-
tiva y del contenido de humedad de muestras de la materia
prima (en %) en 12 das fueron:
Humedad relativa Contenido de humedad
45 11
54 15
37 11
41 13
35 11
29 7
61 18
45 14
43 11
49 16
34 11
40 13
Calcular el coeciente de correlaci on muestral. Ajustar los da-
tos a una recta utilizando el m etodo de los mnimos cuadrados.
Utilizar los resultados anteriores para prdedecir el contenido
de humedad cuando la humedad relativa es del 35 %.
Problema 3.5 En el an alisis de unos materiales se han medi-
do tres caractersticas: X(ndice de concentraci on de carbono),
Y (ndice de resistencia a la tracci on) y Z(ndice de resistencia
a la torsi on):
54 J. L. DazBarrero
X 0.2 0.5 0.7 1.2 2.3 2.4 2.9 3.0
Y 3.4 6.5 11.0 13.5 22.0 25.8 33.5 34.6
Z 25.6 29.5 29.0 31.2 31.5 33.2 33.4 32.6
a) Utilizar el m etodo de los mnimos cuadrados para obtener
las rectas de ajuste de Y sobre X y de Y sobre Z.
b) Calcular los coecientes de correlaci on r
xy
, r
xz
y r
yz
.
Problema 3.6 Se quiere estudiar que tipo de relaci on existe
entre la temperatura X en una zona monta nosa y el consu-
mo de energa el ectrica Y . Durante 18 das se anotaron las
temperaturas y el consumo de energa de una vivienda y se
obtuvieron los siguientes resultados:
X -1.0 1.5 3.5 -3.0 0.5 2.5
Y 94 81 79 97 88 75
X 4.0 5.0 -5.0 -0.5 9.0 9.5
Y 74 67 107 86 58 55
X 7.0 3.0 -2.0 6.0 8.0 10.0
Y 65 73 91 65 58 52
a) Calcular los estadsticos que se consideren oportunos y co-
mentar la relaci on existente entre la temperatura y el con-
sumo de energa.
b) Aplicar el m etodo de los mnimos cuadrados para ajustar
los datos a una recta.
c) Estimar el consumo medio de energa de una vivienda cuan-
do la temperatura sea de 0

C.
Problema 3.7 Se considera el conjunto de datos asosciados
en parejas M
x,y
= {(x
i
, y
i
) : i = 1, 2, , n}. Probar que la
An alisis de Datos 55
covarianza muestral S
xy
tambi en se escribe en la forma
S
xy
=
1
n
n

k=1
x
k
y
k
xy.
Denimos SS
xx
= nS
2
x
y SS
xy
= nS
xy
. Probar que
n

k=0
_
y
k
(a +bx
k
)
_
2
= SS
yy
bSS
xy
.
Problema 3.8 Los siguientes datos corresponden al cloro resi-
dual en el dep osito de aguas de una ciudad en diversos tiem-
pos despu es de haberse tratado el agua con productos qumi-
cos para mantenerla apta para el consumo:
t (horas) 2 4 6 8 10 12
Cl (ppm) 1.8 1.5 1.4 1.1 1.1 0.9
a. Calcular el coeciente de correlaci on muestral y comentar
el resultado.
b. Obtener una recta de mnimos cuadrados con la que se pue-
da predecir el cloro residual en t erminos del tiempo trans-
currido desde que se trat o el agua.
c. Utilizar la recta de mnimos cuadrados para estimar el cloro
residual en el dep osito 7 horas despu es de haber sido
tratado.
56 J. L. DazBarrero
Captulo 4
Conceptos B asicos de
Probabilidad
4.1. Introducci on
Un experimento que puede ser repetido tantas veces como
se quiera, siempre en las mismas condiciones controlables,
y cuyo resultado es impredecible, se llama un experimento
aleatorio; en caso contrario, el experimento se llama deter-
minista. As, por ejemplo, el lanzamiento de un dado, la hora
de llegada de un tren a una estaci on, un sorteo de lotera,
pueden ser considerados como experimentos aleatorios.
Cada experimento aleatorio lleva asociado el conjunto E de
todos los resultados posibles. Dicho conjunto se llama espa-
cio muestral, sus elementos se llaman sucesos elementales
y sus subconjuntos sucesos. El conjunto de los sucesos ser a,
pues, P(E). Dado un suceso A vamos a denir una medida
te orica de la ocurrencia de A. A esta medida la llamaremos
probabilidad.
57
58 J. L. DazBarrero
Si el espacio muestral E se halla compuesto por n sucesos
elementales, incompatibles dos a dos (disjuntos), y tales que:
(i) E=
n
_
k=1
{a
k
},
(ii) f
r
({a
1
}) = f
r
({a
2
}) = = f
r
({a
n
}).
Entonces, a partir de que f
r
(E) =
n

k=1
f
r
({a
k
}) = 1, resulta
f
r
({a
k
}) = 1/n, k = 1, 2 , n. Adem as, si A = {a
1
, a
2
, , a
h
},
entonces f
r
(A) = f
r
({a
1
})+f
r
({a
2
})+ +f
r
({a
h
}) = h/n.
Lleg andose as a la denici on cl asica de probabilidad o re-
gla de Laplace (1812) que enuncia:
La probabilidad de un suceso Aes el cociente entre el n umero
de casos favorables dividido por el n umero de casos posibles,
considerados como equiprobales, Es decir,
p[A] =
N
f
(A)
N
p
=
N(A)
N(E)
.
La denici on anterior equivale a entender la probabilidad de
un suceso o subconjunto de resultados elementales como la
frecuencia relativa de ese subconjunto en una muestra ex-
haustiva. Los principales inconvenientes de esta denici on
son que no siempre es posible el muestreo exhaustivo y que
no siempre los resultados son equiprobables.
Otra forma de entender la probabilidad consiste en suponer
que el experimento se puede repetir indenidamente de for-
ma que un resultado no inuya en los siguientes. As surge
la denici on frecuentista de probabilidad, formalizada por
Von Misses en 1919 y que se enuncia
p[A] = lm
n
f
r
(A).
An alisis de Datos 59
Aqu hay que suponer que existe el lmite de las frecuen-
cias relativas, i.e., existe el lmite y es el mismo para cual-
quier subsucesi on de experimentos. En otras palabras, las
frecuencias relativas de un suceso se estabillizan alrededor
de un valor jo (su probabilidad) a medida que el n umero de
pruebas aumenta.
Las dicultades aparecidas en las deniciones anteriores se
solucionan con la denici on axiom atica de Kolmogorov (1943).
4.2. Denici on axiom atica de probabi-
lidad
Sea E el espacio muestral asociado a un experimento alea-
torio y A una colecci on de subconjuntos de E. Se dice que
A es un algebra de Boole cuando se verican las siguientes
codiciones:
1. El espacio muestral E pertenece a A.
2. Si un suceso A A, A E entonces A A. Como
consecuencia el conjunto = E pertenece a A.
3. Si A
1
, A
2
, A
n
son elementos de A su uni on
n
_
k=1
A
k
,
pertenece a A y, por las leyes de Morgan, tambi en su
intersecci on,
n

k=1
A
k
.
A es una algebra cuando para cada sucesi on numerable
A
1
, A
2
, , A
n
, ,
60 J. L. DazBarrero
de sucesos de E, su uni on

_
k=1
A
k
y su intersecci on

k=1
A
k
pertenecen a A. La algebra se acostumbra a representar
por S, y recoge todos los posibles sucesos de un experimento
aleatorio. Al par (E, S) se le llama espacio probabilizable o
medible.
A continuaci on expondremos la denici on axiom atica de Kol-
mogorov que consta de tres axiomas:
Axioma 1. Si A es un elemento de una algebra, S, exis-
te un n umero p[A] 0, denominado probabilidad del
suceso A.
Axioma 2. p[E] = 1.
Axioma 3.1 Dada una sucesi on nita de suscesos, disjuntos
dos a dos, A
i

A
j
= , se verica que
p
_
n
_
k=1
A
k
_
=
n

k=1
p[A
k
].
Axioma 3.2 Dada una sucesi on numerable de suscesos, dis-
juntos dos a dos, A
i

A
j
= , se verica que
p
_

_
k=1
A
k
_
=

k=1
p[A
k
].
La terna (E, S, p) se conoce como espacio de probabilidad.
Consecuencia de los axiomas de probabilidad son los siguientes
teoremas.
Teorema 4.1 La probabilidad del suceso imposible es cero,
i.e., p[] = 0.
An alisis de Datos 61
Demostraci on. Consider ese la sucesi on numerable de sucesos
disjuntos A
1
, A
2
, , A
n
, , todos ellos igual al . Seg un el
tercer axioma de Kolmogorov
p
_

_
k=1
A
k
_
=

k=1
p[A
k
].
En nuestro caso,

_
k=1
A
k
=

_
k=1
= . Por tanto,

k=1
p[] =
p[], es decir, la suma innita de una cantidad constante de-
be ser esa cantidad, lo cual s olo ocurre cuando p[] = 0. 2
Teorema 4.2 La probabilidad de la uni on de n sucesos dis-
juntos A
1
, A
2
, , A
n
es igual a la suma de las probabilida-
des de cada uno de los sucesos A
i
, i.e.,
p
_
n
_
k=1
A
k
_
=
n

k=1
p[A
k
].
Demostraci on. Consid esere la suncesi on numerable de suce-
sos disjuntos A
1
, A
2
, , A
n
, A
n+1
, A
n+2
, , siendo los su-
cesos A
n+k
= , k 1. Seg un el tercer axioma de Kolmogorov
p
_

_
k=1
A
k
_
=

k=1
p[A
k
].
El primer miembro de la igualdad anterior se puede escribir
en la forma
p
_

_
k=1
A
k
_
= p
_
n
_
k=1
A
k
_
+p
_

_
k=n+1
A
k
_
= p
_
n
_
k=1
A
k
_
.
Por otra parte, el segundo miembro toma la forma

k=1
p[A
k
] =
n

k=1
p[A
k
] +

k=n+1
p[A
k
] =
n

k=1
p[A
k
].
62 J. L. DazBarrero
Identicando, resulta
p
_
n
_
k=1
A
k
_
=
n

k=1
p[A
k
].
2
Teorema 4.3 La probabilidad de la uni on de dos sucesos cua-
lesquiera viene dada por
p[A
1
_
A
2
] = p[A
1
] +p[A
2
] p[A
1

A
2
].
Teorema 4.4 Si A
1
A
2
, entonces p[A
1
] p[A
2
].
Teorema 4.5 Si A S, entonces se verica que p[A] 1.
Teorema 4.6 La probabilidad del suceso contrario A, es el
complemento a uno de la probabilidad de A, i.e., p[A] = 1
p[A].
4.3. T ecnicas de conteo. Combinatoria
4.3.1. Variaciones con repetici on
Dado un conjunto A = {a
1
, a
2
, , a
n
} de n elementos, se
llama variaci on con repetici on de los n elementos y de or-
den k a toda agrupaci on de k elementos iguales o distintos,
elegidos de entre los n de partida, de forma que dos agrupa-
ciones son distintas si dieren en alg un elemento, o si tenien-
do los mismos estos se hallan escritos en diferente orden.
Para hallar su n umero observemos que el primer lugar de la
variaci on puede estar ocupado por cualquiera de los n ele-
mentos de A; el segundo, como pueden repetirse pude ser
An alisis de Datos 63
ocupado por por cualquiera de los n elementos de A, y as su-
cesivamente hasta el k- esimo que tambi en puede ser ocupa-
do por cualquier elemento de A. En consecuencia, el n umero
de variaciones con repetici on de n elementos tomados de k
en k es
VR
k
n
= n n n = n
k
.
Nota 4.1 Obs ervese que cada variaci on con repetici on de or-
den k es un elemento del producto cartesiano
A
k
= {(a
1
, a
2
, , a
k
) | a
i
A}.
Nota 4.2 Las variaciones con repetici on de n elementos de or-
den k son tambi en las im agenes de todas las aplicaciones que
se pueden establecer entre un conjunto de cardinal k y el A de
cardinal n.
4.3.2. Variaciones ordinarias
Dado un conjunto A = {a
1
, a
2
, , a
n
} de n elementos, se
llama variaci on ordinaria de los n elementos de A tomados
de k en k, a toda agrupaci on de k elementos distintos, ele-
gidos de entre los n de partida de forma que dos de tales
agrupaciones son distintas si dieren en alg un elemento o
cuando teniendo los mismos estos se hallan escritos en dife-
rente orden. (Al ser distintos los elementos de cada variaci on,
necesariamente ha de ser k menor o igual que n).
Para hallar su n umero observemos que el primer lugar de la
variaci on puede ser ocupado por cualquiera de los n elemen-
tos de A; hecha esta elecci on, el segundo lugar puede ser
ocupado por cualquiera de los n 1 elementos restantes; el
tercero, por cualquiera de los n 2 que a un no han sido ele-
gidos; y as hasta el k- esimo lugar que podr a ser ocupado por
64 J. L. DazBarrero
cualquiera de los n k + 1 elementos restantes. En conse-
cuencia, el n umero de variaciones ordinarias de n elementos
y de orden k es
V
k
n
= n(n 1)(n 2) (n k + 1) = n
(k)
=
n!
(n k)!
.
Nota 4.3 Las variaciones ordinarias son las im agenes de to-
das las aplicaciones inyectivas que pueden establecerse entre
un conjunto de cardinal k, (k n) y otro de cardinal n.
4.3.3. Permutaciones ordinarias
La variaciones ordinarias de n elementos tomados de n en
n se llaman permutaciones ordinarias de n elementos. Son
secuencias en las que intervienen los n elementos de partida
diferenciandose unas de otras en el orden en que se hallan
escritos sus elementos. Su n umero es
P
n
= V
n
n
= n!.
Nota 4.4 Las permutaciones ordinarias de los elementos de
A = {a
1
, a
2
, , a
n
} son las im agenes de las aplicaciones bi-
yectivas que pueden establecerse entre el conjunto {1, 2, , n}
y A.
4.3.4. Permutaciones con repetici on
Dado el conjunto A = {a, b, , l} de cardinal n, se lla-
ma permutaci on con repetici on de longitud m de los ele-
mentos de A, y de ordenes de repetici on t
1
, t
2
, , t
n
, con
t
1
+ t
2
+ + t
n
= m; a cada una de las secuencias de m
elementos que se pueden formar con t
1
iguales a a, t
2
iguales
An alisis de Datos 65
a b, , t
n
= l, de forma que todas ellas tienen los mismos
elementos pero escritos en orden diferente.
Para hallar su n umero supongamos que una tal permutaci on
fuera
t
1
..
a a a
t
2
..
b b b
tn
..
l l l .
Si en ella suponemos que todas las a son distintas qudara
a
1
a
2
a
t
1
t
2
..
b b b
tn
..
l l l .
Permutando las a de todas las formas posibles sin cambiar
los dem as elementos, se obtendr an t
1
! permutaciones dife-
rentes. As si en una secuencia de melementos hay t
1
iguales
y se permutan de todas las formas posibles, se obtienen
P
t
1
m
=
m!
t
1
!
permutaciones diferentes. De forma an aloga, si entre los m
elementos hay t
1
iguales a a, t
2
iguales a b, , t
n
iguales a
l, se obtendr an
P
t
1
,t
2
, ,tn
m
=
m!
t
1
!, t
2
!, , t
n
!
permutaciones.
Nota 4.5 Las permutaciones con repetici on son las im agenes
de aplicaciones exhaustivas predeterminadas.
4.3.5. Combinaciones ordinarias
Dado el conjunto A = {a
1
, a
2
, , a
n
} de cardinal n, se lla-
ma combinaci on ordinaria de estos n elementos y de orden
66 J. L. DazBarrero
k a toda agrupaci on de k elementos elegidos de entre los n
de partida de forma que dos de ellos son distintos si dieren
en alg un elemento sin importar el orden en que se hallan es-
critos. Dicho de otra forma, las combinaciones ordinarias de
n elementos tomados de k en k o de orden k son los sub-
conjuntos de cardianl k que se pueden formar con los n de
partida.
Su n umero se representa por C
k
n
. Para calcularlo, suponga-
mos formadas las combinaciones de orden k con los elemen-
tos de A de las que hay en total C
k
n
. Si en cada una de estas
combinaciones permutamos sus elementos de todas las for-
mas posibles resulta que el n umero de secuencias obtenidas
es igual al de variaciones ordinarias de orden k que se pue-
den formar con los elementos de A. Por otro lado, como cada
combinaci on genera k! del total de las variaciones, se tiene
que V
k
n
= C
k
n
k! de donde
C
k
n
=
V
k
n
k!
=
n!
k!(n k)!
=
_
n
k
_
.
4.3.6. Combinaciones con repetici on
Dado un conjunto de cardinal n, se llama combinaci on con
repetici on de orden k a cada una de las agrupaciones que se
pueden formar tomando k de los elementos de partida iguales
o distintos y considerando que dos agrupaciones son distin-
tas cuando dieren en alg un elemento sin importar el orden
en que estos se hallen escritos. Su n umero se designa por
CR
k
n
.
Las combinaciones con repetici on de orden 1 coinciden con
las ordinarias, las de orden 2 se obtienen a partir de las de
orden 1 escribiendo a la derecha de cada una de ellas su
An alisis de Datos 67
ultimo elemento y cada uno de los que le siguen en el orden
natural, obteni endose en total
CR
2
n
=
_
n + 2 1
2
_
= C
2
n+21
.
A parir de las de orden 2 se obtiene las de orden 3, y as su-
cesivamente hasta que las de orden k se obtienen a partir de
las de orden k 1 a nadiendo a cada una de ellas su ultimo
elemento y todos los que le siguen en el orden natural. Es
f acil observar que tales combinaciones se pueden poner en
correspondencia biyectiva con las combinaciones ordinarias
de orden k de los elementos del conjunto {1, 2, , n+k1}
siendo as su n umero
CR
k
n
=
_
n +k 1
k
_
= C
k
n+k1
.
Nota 4.6 A continuaci on se citan dos f ormulas que pueden
ser utiles para la resoluci on de problemas.
Potencia del binomio (F ormula de Tartaglia)
(a +b)
n
=
n

k=0
_
n
k
_
a
k
b
nk
.
Potencia de un polinomio (F ormula de Liebnitz)
(a
1
+a
2
+ +a
n
)
m
=

t
1
+t
2
++tn=m
_
m
t
1
, t
2
, , t
n
_
a
t
1
1
a
t
2
2
a
tn
n
=

t
1
+t
2
++tn=m
m!
t
1
!t
2
! t
n
!
a
t
1
1
a
t
2
2
a
tn
n
.
68 J. L. DazBarrero
4.4. Probabilidad condicional
Tiene inter es cuando se quieren calcular probabilidades de
sucesos, sabiendo que o dado que ha ocurrido algo previa-
mente. Dado el espacio de probabilidad (E, S, p) y un suceso
A S con p[A] > 0. Se dene la probabilidad condiciona-
da del suceso B por A, y se representa por p[B|A], como el
cociente
p[B|A] =
p[B A]
p[A]
.
An alogamente, si p[B] > 0 se dene
p[A|B] =
p[A B]
p[B]
.
Es inmediato comprobar que
p
B
[A] = p[A|B]
es una probabilidad.
Obs ervese que la probabilidad condicionada de un suceso es
la probabilidad del mismo cuando el espacio muestral se ha
modicado.
Si A y B son sucesos de probabilidad no nula se tiene que
p[A B] = p[A]p[B|A] = p[B]p[A|B].
A la probabilidad de la intersecci on de varios sucesos se le
llama probabilidad compuesta, y a la expresi on anterior se
le conoce como ley de la probabilidad compuesta para dos
sucesos. En general, para n sucesos se tiene el siguiente re-
sultado.
An alisis de Datos 69
Teorema 4.7 Sean A
1
, A
2
, , A
n
, n sucesos cualesquiera
de un experimento aleatorio y tales que la probabilidad de rea-
lizaci on de los mismos es no nula, entonces
p[A
1
A
2
A
n
] = p[A
1
]p[A
2
|A
1
] p(A
n
|A
1
A
2
A
n1
).
Demostraci on. Para la demostarci on procederemos por induc-
ci on. Para n = 2, 3 el resultado se comprueba f acilmente por
inspecci on directa. Sup ongase cierto para 2, 3, , n 1 y
veamoslo para n. En efecto,
p[A
1
A
2
A
n
] = p
_
(A
1
A
2
A
n1
) A
n
_
= p[A
1
A
2
A
n1
]p[A
n
|A
1
A
2
A
n1
]
= p[A
1
]p[A
2
|A
1
]p[A
3
|A
1
A
2
] p[A
n
|A
1
A
2
A
n1
].
2
4.5. Sucesos dependientes e indepen-
dientes
Se dice que dos sucesos A y B son independientes cuando
se verica que p[B] = p[B|A]. Si por el contrario p[B] =
p[B|A] se dice que B depende estoc asticamente de A. En
este ultimo caso puede suceder:
(a) p[B] > p[B|A], en cuyo caso, la aparici on de A desfavo-
rece la realizaci on de B.
(b) p[B] < p[B|A], en este caso, la aparici on de A favorece
la realizaci on de B.
Se verican las siguientes condiciones:
70 J. L. DazBarrero
(a) A y B son independientes p[A B] = p[A]p[B].
(b) p[B|A] = p[B] p[A|B] = p[A].
(c) Si A y B son independientes tambi en lo son A y B.
Extenderemos ahora el concepto de independencia a m as de
dos sucesos. Dados tres sucesos A, B y C se dice que son es-
toc asticamente independientes, si se verican simult anea-
mente las siguientes condiciones:
(a) p[A B] = p[A]p[B].
b) p[A C] = p[A]p[C].
(c) p[B C] = p[B][C].
(d) p[A B C] = p[A]p[B]p[C].
Pudiera parecer superua la cuarta condici on, pero veremos
su necesidad mediante un contraejemplo.
Ejemplo de Bernstein. Sea E = {1, 2, 3, 4} y consideremos
los sucesos A = {1, 2}, B = {1, 3} y C = {1, 4}. Es evidente
que p[A] = p[B] = p[C] =
1
2
. Por otro lado, como A B =
A C = B C = {1}, entonces
p[A B] = p[A C] = p[B C] =
1
4
y
p[A]p[B] = p[A]p[C] = p[B]p[C] =
1
4
.
En cambio,
p[A B C] = p[{1}] =
1
4
= p[A]p[B]p[C] =
1
8
.
Esto prueba la necesidad de la cuarta condici on.
Dados n sucesos A
1
, A
2
, , A
n
, se dice que son indepen-
dientes cuando se verica
An alisis de Datos 71
(a) p[A
i
A
j
] = p[A
i
]p[A
j
].
(b) p[A
i
A
j
A
k
] = p[A
i
]p[A
j
]p[A
k
].

() P[A
1
A
2
A
n
] = p[A
1
]p[A
2
] p[A
n
].
4.6. Teorema de las probabilidades to-
tales
Diremos que A
1
, A
2
, , A
n
es un sistema completo de su-
cesos o una partici on cuando se verica
(a) E = A
1
A
2
A
n
.
(b) A
i
A
j
= si i = j.
Teorema 4.8 (F ormula de las probabilidades totales) Sea
A
1
, A
2
, , A
n
un sistema completo de suscesos con P[A
i
] >
0, i = 1, 2, , n. Sea B un suceso para el que se conocen las
probabilidades p[B|A
i
]. Entonces,
p[B] =
n

k=1
p[A
k
]p[B|A
k
].
Demostraci on. Al ser A
1
, A
2
, , A
n
un sistema completo de
suscesos se tiene que
p[B] = p[B E] = p
_
B
_
n
_
k=1
A
k
__
= p
_
n
_
k=1
(B A
k
)
_
=
n

k=1
p[A
k
]p[B|A
k
].
2
72 J. L. DazBarrero
4.7. F ormula de Bayes
El siguiente resultado, conocido como la F ormula de Bayes,
uno de los m as importantes y fructferos de la teora de la
probabilidad, se recoge en el siguiente teorema.
Teorema 4.9 Sea A
1
, A
2
, , A
n
un sistema completo de su-
cesos con p[A
k
] > 0, y sea B un suceso cualquiera para el que
se conocen las probabilidades p[B|A
k
] que llamaremos vero-
similitudes, entonces
p[A
k
|B] =
p[A
k
]p[B|A
k
]
n

k=1
p[A
k
]p[B|A
k
]
.
A las probabilidades p[A
k
] se les llama probabilidades a prio-
ri y a las p[A
k
|B] probabilidades a posteriori.
Demostraci on. De la denici on de probabilidad condicionada
resulta
p[A
k
B] = p[A
k
]p[B|A
k
] = p[B]p[A
k
|B].
Por tanto,
p[A
k
|B] =
p[A
k
]p[B|A
k
]
p[B]
,
pero seg un la f ormula de las probabilidades totales,
p[B] =
n

k=1
p[A
k
]p[B|A
k
]
de d onde se deduce que
p[A
k
|B] =
p[A
k
]p[B|A
k
]
n

k=1
p[A
k
]p[B|A
k
]
.
2
An alisis de Datos 73
4.8. Problemas de Probabilidad
Problema 4.1 Explicar por qu e hay un error en cada una de
las siguientes armaciones:
a. La probabilidad de que llueva en una zona des ertica es 0,12
y la de que nieve es 0,40.
b. La probabilidad que llueva es 0,6 y la probabilidad que llue-
va o nieve es 0,45.
c. La probabilidad que en la pr oxima epoca de lluvias las
aguas sobrepasen el umbral de un rio es 0,77, la probabi-
lidad que se alcance el umbral es 0,08, y la probabilidad
que no se alcance el umbral es 0,05.
Soluci on.
a. Una probailidad nunca puede ser negativa.
b. No puede ser que p[A] > p[A B].
c. Sean los sucesos A = {las aguas sobrepasan el umbral
} y B = { las aguas alcanzan el umbral }. Entonces,
p[A] = 0,77, p[B] = 0,08 y p[A B] = 0,05. De la ultima
relaci on se obtiene p[A B] = 0,95. Lo que implicara
p[A B] = 0,10 (Absurdo)
2
Problema 4.2 En un plan general para control de riadas, se
desea saber si una canalizaci on construida anteriormente pa-
ra un arroyo es suciente para aliviar los posibles caudales
m aximos (siendo el m aximo total de 10 m
3
/s). Tras un estudio
74 J. L. DazBarrero
de riadas anteriores, las probabilidades de caudal m aximo en
un cierto a no se denen como sigue:
A = 3 a 6 m
3
/s, p[A] = 0,6;
B = 5 a 10 m
3
/s, p[B] = 0,6;
C = A B, p[C] = 0,7.
Calcular p[AB], p[A], p[BA], p[A B], p[A B], y denir
cada uno de los sucesos cuyas probabilidades se pide calcu-
lar.
Problema 4.3 Hallar la probabilidad de un suceso, sabiendo
que la suma de su cuadrado y la del cuadrado de la probabi-
lidad del suceso contrario es igual a
5
9
.
Soluci on. Sea p[A] = p, entonces p[A] = 1 p. Seg un el
enunciado se tiene p
2
+ (1 p)
2
= 5/9; 9p
2
9p + 2 = 0;
p = 1/3, p = 2/3. 2
Problema 4.4 En una reuni on hay m as hombres que muje-
res, m as mujeres que beben que hombres que fuman, y m as
mujeres que fuman y no beben que hombres que no beben ni
fuman. Se elige una persona al azar y se pregunta: Qu e es
m as probale?
a. Es mujer que no bebe ni fuma.
b. Es hombre que bebe y no fuma.
Soluci on. Sea E el conjunto de personas que asisten a la reu-
ni on. Formemos la siguiente partici on (sistema completo de
suscesos) de E :
E =
8
_
k=1
X
k
An alisis de Datos 75
siendo
X
1
= H B F, X
5
= M B F,
X
2
= H B F, X
6
= M B F,
X
3
= H B F, X
7
= M B F,
X
4
= H B F, X
8
= M B F.
Veremos que el suceso X
1
es mujer que no bebe ni fuma es
m as probable que el suceso X
8
es hombre que bebe y no fuma.
Esto es equivalente a comprobar que el cardinal de X
1
es
mayor que el cardinal de X
8
. Denotaremos el cardinal de X
i
por N(X
i
), i = 1, 2, , 8.
Seg un el enunciado se tienen las siguientes desigualdades:
4

i=1
N(X
i
) >
8

x=5
N(X
i
),
N(X
5
) +N(X
6
) > N(X
3
) +N(X
4
),
N(X
7
) > N(X
2
).
Sumando miembro a miembro resulta
N(X
1
)+N(X
2
)+N(X
3
)+N(X
4
)+N(X
5
)+N(X
6
)+N(X
7
)
> N(X
5
)+N(X
6
)+N(X
7
)+N(X
8
)+N(X
3
)+N(X
4
)+N(X
2
).
Simplicando, se obtiene
N(X
1
) > N(X
8
).
Esto completa la demostraci on. 2
Problema 4.5 En una encuesta sobre la liberalizaci on de los
peajes en las autopistas se han consultado 1000 personas,
obteni endose los siguientes resultados:
76 J. L. DazBarrero
sexo edad
hombre mujer menor de 25 25-50 myor de 50
a favor 198 243 200 180 61
en contra 125 126 50 111 90
depende 147 161 100 159 49
Se escoge al azar una de las personas consultadas y se desea
saber:
1. Probabilidad de que est e a favor de la liberalizaci on.
2. Probabilidad que tenga menos de 25 a nos.
3. Si est a a favor de la liberalizaci on, cu al es la probabilidad
de que sea mujer?
Se escogen dos personas al azar entre las encuestadas. Se
pide:
1. Probabilidad que sean de distinto sexo.
2. Probabilidad que ambas tengan menos de 50 a nos.
3. Si las dos est an a favor de la liberalizaci on, cu al es la
probabilidad de que sean dos mujeres?
Problema 4.6 En una ciudad costera se inauguraron el a no
pasado un puerto deportivo, un peque no aeropuerto y un dep osi-
to para el suministro de agua. La probabilidad que dentro de
100 a nos continue funcionando el puerto deportivo es 0.76, la
de que no funcione el aeropuerto es 0.18 y la de que funcione
el dep osito de agua es 0.40. Se pide cu al es la probabilidad
que dentro de 100 a nos: a) Continuen funcionando los tres. b)
No funcione ninguno de ellos. c) Funcione solamente el aero-
puerto. d) Funcione exactamente uno de ellos.
An alisis de Datos 77
Soluci on. Tenemos que P[P] = 0,76, la P[A] = 1 P[A] =
10,18 = 0,82 y la P[D] = 0,4. Adem as, por las caractersti-
cas del enunciado los sucesos P, A y D son independientes
y tambi en lo son los sistemas que resultan de susutituir al-
guno de ellos por sus contrarios. Entonces:
a. P[P A D] = P[P]P[A]P[D] = 0,76 0,82 0,4 =
0,2492.
b. P[P A D] = P[P]P[A]P[D] = 0,24 0,18 0,6 =
0,0259.
c. P[P A D] = 0,24 0,82 0,6 = 0,1180.
d. P[P AD] +P[P AD] +P[P AD] = 0,0820 +
0,1180 + 0,0172 = 0,2172.
2
Problema 4.7 Justo despu es de ser puestos en circulaci on,
algunos autobuses fabricados por cierta compa na presentan
grietas en la pintura de los laterales de los vehiculos. Supon-
gamos que una ciudad tiene 80 de estos autobuses y que en
doce de ellos han aparecido grietas.
a. De cu antas maneras se puede seleccionar una muestra de
10 vehiculos para inspecionarla?
b. De cu antas formas distintas puede una muestra de 10
autobuses contener 10 vehiculos con grietas?
c. Determinar la probabilidad que en una muestra de 10 vehi-
culos, elegidos al azar, 4 tengan grietas.
Problema 4.8 La probabilidad que un vuelo del puente a ereo
Madrid-Barcelona salga puntual es 0,92, la de que llegue pun-
tual es 0,93, y la de que salga y llegue puntual 0,84. Qu e es
78 J. L. DazBarrero
m as probable: que llegue puntual un vuelo que ha salido pun-
tual o que haya salido puntual un vuelo que ha llegado pun-
tual.
Soluci on. Sean los sucesos A = { sale puntual} y B = { llega
puntual }. Entonces, p[A] = 0,92, p[B] = 0,93, y p[A B] =
0,84. A partir de aqu resulta que
p[B|A] =
p[A B]
p[A]
= 0,91,
p[A|B] =
p[A B]
p[B]
= 0,90.
Por tanto, es m as probable que llegue puntual un vuelo que
ha salido puntual. 2
Problema 4.9 Las probabilidades que tres meteor ologos inde-
pendientemente pronostiquen correctamente el tiempo para un
determinado n de semana son respectivamente, 1/6,1/4 y
1/3. Si cada uno de ellos, pronostica el tiempo para el pr oximo
n de semana, se pide:
1. Probabilidad que solamente uno de ellos acierte.
2. Si solamente acierta uno, cu al es la probabilidad que
sea el primero?
Soluci on. Sean los sucesos A = {acierta el primero}, B =
{acierta el segund} y C = {acierta el tercero}. Las probabili-
dades de estos sucesos y sus contarrios son, respectivamen-
te,
P[A] =
1
6
, P[B] =
1
4
, P[C] =
1
3
P[A] =
5
6
, P[B] =
3
4
, P[A] =
2
3
An alisis de Datos 79
1.- Sea X = {acierta solamente uno}, entonces
X = (A B C) (A B C) (A B C)
siendo dicha uni on disjunta. Por tanto,
P[X] = P[(A B C) (A B C) (A B C)]
= P[A B C] +P[A B C] +P[A B C]
= P[A]P[B]P[C] +P[A]P[B]P[C] +P[A]P[B]P[C]
=
31
72
= 0,4305
2.- En este caso hemos de calcular
P[A|X] =
P[A X]
P[X]
=
P[A B C]
P[X]
=
6
31
= 0,1935
2
Problema 4.10 Tres m aquinas A, B y C han producido res-
pectivamente 100, 200 y 300 piezas. Se sabe que A produce un
5 % de defectuosas, B un 6 % y C un 7 %. Se selecciona una
pieza al azar y se pide:
1. Probabilidad de que no sea defectuosa.
2. Sabiendo que es defectuosa, probabilidad de que haya sido
fabricada por la m aquina A.
Problema 4.11 Se estudian tres tipos de defectos de las me-
morias montadas sobre los circuitos integrados: Defectos de
los circuitos de encuadraci on (Hip otesis H
1
: p[H
1
] = 0,1); de-
fectos provocados por acoplamientos par asitos entre las c elu-
las (Hip otesis H
2
: p[H
2
] = 0,6), y defectos de las barras de
direcci on (Hip otesis H
3
: p[H
3
] = 0,3). La diagnosis se lleva a
cabo con ayuda de una serie de tests T
1
, T
2
, , T
n
cada uno
80 J. L. DazBarrero
de los cuales comprueba un estado determinado de la c elula
de memeoria. El resultado observable es el estado de la c elula
escogida respecto a cada test. Supongmos que la diagnosis se
ha realizado y se ha observado cierto resultado A. Si antes
de la prueba es conocido que p[A|H
1
] = 0,4, p[A|H
2
] = 0,2 y
p[A|H
3
] = 0,3. Qu e hip otesis tiene la m axima probabilidad a
posteriori? Es decir, qu e defecto es m as probable?
Soluci on. Aplicando la f ormula de las probabilidades totales
se tiene
p[A] = p[H
1
]p[A|H
1
] +p[H
2
]p[A|H
2
] +p[H
3
]p[A|H
3
] = 0,25
Aplicando la f ormula de Bayes, resulta
p[H
1
|A] = 0,16, p[H
2
|A] = 0,48, p[H
3
|A] = 0,36.
Por tanto, la m axima probabilidad la tiene la hip otesis H
2
:
Defectos por acoplamiento de par asitos. 2
Problema 4.12 Un jugador arroja un dado, le sale 6 y gana.
Hallar la probabilidad de que haya hecho trampa. (Se supone
que el 40 % de los jugadores hacen trampa)
Soluci on. El espacio muestral se puede descomponer en la
forma E = TT, TT = con p[T] = 2/5, p[T] = 3/5, p[6|T] =
1, y p[6|T] = 1/6. Aplicando la f ormula de Bayes se obtiene
p[T|6] =
p[T]p[6|T]
p[T]p[6|T] +p[T]p[6|T]
=
4
5
.
2
Problema 4.13 Un ladr on perseguido por la policia llega a un
garage que tiene tres puertas: una conduce al recinto A donde
hay 5 coches tres de los cuales tienen gasolina; la segunda al
An alisis de Datos 81
recinto B donde de los 4 coches que hay uno solo tiene com-
bustible; y nalmente, la tercera conduce al recinto C donde
hay 7 coches cinco de los cuales tienen gasolina. Elige una
puerta y un coche. cu al es la probabilidad de escapar? Si se
sabe que ha escapado, determinar la probabilidad de que ha-
ya salido por la puerta A.
Soluci on. Denotaremos por G al suceso tener combustible.
Entonces, podemos pensar los recintos como urnas con la
siguientes composiciones:
A(3G, 2G), B(1G, 3G), C(5G, 2G)
todas igualmente probables, es decir, p[A] = p[B] = p[C] =
1/3. Sea F el suceso escapar, entones
p[F|A] =
3
5
, p[F|B] =
1
4
, p[F|C] =
5
7
.
As
p[F] = p[A]p[F|A] +p[B]p[F|B] +p[C]p[F|C] = 0,5214.
Por otro lado, teniendo en cuenta la f ormula de Bayes, resul-
ta
p[A|F] =
p[A]p[F|A]
p[A]p[F|A] +p[B]p[F|B] +p[C]p[F|C]
= 0,3835.
2
Problema 4.14 La mitad de los habitantes de Barcelona y su
area metropolitana acuden al trabajo en vehculo propio, el
40 % utiliza el transporte p ublico y el resto van andando. Se
estima que el 10 % de los que usan vehculo propio, el 3 % de
los que utilizan los transportes p ublicos y el 1 % de los que van
andando llegan tarde al trabajo. Se pide:
82 J. L. DazBarrero
1. Porcentaje de individuos que llegan puntuales al trabajo.
2. Si un individuo lleg o tarde al trabajo, cu al es la probabi-
lidad que utilizase vehculo propio?
Soluci on.
Seg un los datos del enunciado, tenemos
Prioris Verosimilitudes Posterioris
p[V]=50/100 p[t|V]=10/100 p[V|t]=(1/C) 50/10010/100
p[T]=40/100 p[t|T]=3/100 p[T|t]=(1/C) 40/1003/100
p[A]=10/100 p[t|A]=1/100 p[A|t]=(1/C) 10/1001/100
donde C (constante de normalizaci on) es la probabilidad que
un individuo llegue tarde. Es decir,
C = p[t] =
50
100

10
100
+
40
100

3
100
+
10
100

1
100
=
63
1000
.
Por tanto, p[t] = 1
63
1000
=
937
1000
.
En el segundo apartado nos piden p[V |t] =
1
C
p[V ]
p[t|V ] =
50
63
. 2
Problema 4.15 (Problema de los cumplea nos) Hallar la pro-
babilidad que en una reuni on de n personas todas tengan fe-
cha de cumplea nos diferente .
Soluci on. Puesto que hay n personas y 365 das en un a no,
resulta que el n umero de formas distintas de cumplir a nos
que se pueden presentar es
VR
n
365
= 365
n
.
An alisis de Datos 83
Por otro lado, si las personas han de tener fechas distintas
de cumplea nos, se tienen para la primera persona 365 posi-
bilidades, para la segunda, 364; pra la tercera, 363 y as su-
cesivamente, hasta que para la n- esima se tienen 365n+1.
Por tanto, la probabilidad pedida es
p =
365 364 (365 n + 1)
365
n
=
V
n
365
VR
n
365
.
2
Nota 4.7 Cuando n 23 se verica que p <
1
2
lo que se
puede interpretar diciendo que a partir de 23 personas en
adelante es m as probable que dos coincidan en la fecha de
nacimiento, a que todos tengan fechas de nacimiento distin-
tas.
Problema 4.16 El gerente de una empresa que fabrica neu-
m aticos para maquinaria de construcci on estudia el lanzamien-
to de un nuevo neum atico. En el pasado, el 40 % de los neum a-
ticos proyectados han tenido exito y el 60 % han fracasado.
Antes de lanzar el neum atico se hace un estdio de mercado
y se solicita un informe, ya sea favorable o desfavorable. En
etapas anteriores, el 80 % de los neum aticos con informe favo-
rable tuvieron exito y s olo el 30 % de los que fracasaron tenan
informe favorable. Calcular la probabilidad que un neum atico
tenga exito si recibe un informe favorable.
Soluci on. Sea E = {neum atico con exito} y F = {informe favorable}.
Entonces,
Prioris Verosimilitudes Posterioris
p[E]=40/100 p[F|E]=80/100 p[E|F]=(1/C) 40/10080/100
p[E]=60/100 p[F|E]=30/100 p[E|F]=(1/C) 60/10030/100
84 J. L. DazBarrero
Entonces C =
1
2
y p[E|F] = (1/C) 40/10080/100 =
64
100
.
2
Problema 4.17 Se dispone de tres urnas con las siguientes
composiciones: U
1
(3B, 2N), U
2
(2B, 3N) y U
3
(1B, 4N). Se lan-
za un dado, si sale 1 se elige la primera urna, si sale primo la
segunda y si sale 4 o 6 la tercera. A continuaci on, se extrae
una bola de la urna elegida. Hallar la probabilidad de que sea
blanca. Si ha resultado ser blanca, Cu al es la probabilidad
que hubiese salido primo en el lanzamiento del dado?
Captulo 5
Variables Aleatorias
Discretas
El concepto de variable aleatoria (v.a.) viene motivado por la
necesidad de trasladar el estudio de los sucesos del algebra
de sucesos a la recta real. Dado un espacio muestral E, una
variable aleatoria X es una aplicaci on X : E R que aso-
cia a cada suceso un n umero real que viene determinado
por el resultado de un experimento aleatorio. Esta asocia-
ci on permitir a expresar los sucesos en t erminos num ericos.
En otras palabras, una variable aleatoria es la modelizaci on
te orica de las variables estadsticas anteriormente estudia-
das. Tienen la ventaja de obviar la descripci on del espacio de
probabilidad. Distinguiremos entre variables aleatorias dis-
cretas y continuas.
5.1. Variables aleatorias discretas
Una variable aleatoria X es discreta cuando el conjunto de
valores que toma X(E) es nito o innito numerable, i.e.,
85
86 J. L. DazBarrero
X(E) = {x
1
, x
2
, x
3
, }. Dado un espacio de probabilidad
(E, S, p) y una v.a. X denida sobre E. Llamamos
D
x
= {x
1
, x
2
, x
3
, , x
n
, } X
al conjunto de valores posibles de X y denimos la funci on
de densidad de probailidad p(x) de X como la aplicaci on
p : R [0, 1] denida por p(x) = p[X = x], que verica las
siguientes condiciones:
1. p(x) 0, para todo x D
x
.
2. p(x) = 0 para todo x R D
x
.
3.

xDx
p(x) = 1.
Toda funci on p(x) tal que para un conjunto de valores -
nito o innito numerable cumple las condiciones anteriores
es funci on de densidad de una variable aleatoria discreta X.
Tambi en se utiliza la notaci on f
X
(x) = p(x).
La funci on de distribuci on acumulada F
X
(x) de una va-
riable aleatoria discreta X con funci on de densidad p(x) se
dene para cada x R por
F
X
(x) = p[X x] =

{y: yx}
p(y)
y verica:
1. lm
x
F
X
(x) = 0.
2. lm
x+
F
X
(x) = 1.
3. Para culesquiera n umeros reales a y b con a < b se veri-
ca que F
X
(a) F
X
(b) (no decreciente)
An alisis de Datos 87
4. lm
xa
+
F
X
(x) = F
X
(a) para todo a R (continua por la
derecha)
La funci on de distribuci on goza de las siguientes propieda-
des:
1. p[a < X b] = F
X
(b) F
X
(a).
2. p(x) = f
X
(x) = F
X
(x) lm
yx

F
X
(y).
Sea p(x) la funci on de densidad de una variable aleatoria dis-
creta. La esperanza matem atica o valor esperado de X se
dene por
E(X) = =

x
k
Dx
x
k
p(x
k
)
y la esperanza de la funci on g(X) de la v.a. X por
E[g(X)] =
g(X)
=

x
k
Dx
g(x
k
)p(x
k
).
La esperanza es una medida de tendencia central y su va-
lor es un n umero real. La esperanza existe siempre que sea
convergente la correspondiente serie que la dene. Se verica
que
E(aX +b) = aE(X) +b, a, b R.
Los momentos ordinarios de una variable aleatoria, si exis-
ten, se denen como las esperanzas de potencias de la varia-
ble aleatoria, i.e.,

k
= E(X
k
) =

x
i
Dx
x
k
i
f
X
(x
i
)
De entre ellos destacan
0
= 1 y
1
= = E(X) llamada
media de X.
88 J. L. DazBarrero
Los momentos centrados sobre , si existen, se denen co-
mo
m
k
= E
_
(X E[X])
k
_
=

x
i
Dx
(x
i
)
k
f
X
(x
i
).
Son momentos destacados m
0
= 1, m
1
= 0, m
2
= V ar(X) =

x
i
Dx
(x
i
)
2
f
X
(x
i
). La desviaci on tpica o est andar es la
raz cuadrada positiva de la varianza, i.e.,

X
=
_
V ar(X) =
_

x
i
Dx
(x
i
)
2
f
X
(x
i
)
_
1/2
.
La varianza goza de las sguientes propiedades:
1. V ar(X) = E(X
2
)
_
E(X)
_
2
.
2. V ar(aX +b) = a
2
V ar(X), a, b R.
Entre los momentos centrados y ordinarios se verica la si-
guiente relaci on
m
k
= E
_
(X E[X])
k
_
= E
_
k

j=0
(1)
kj
_
k
j
_
X
j

kj
_
=
k

j=0
(1)
kj
_
k
j
_

kj
1

j
.
La funci on generadora de momentos, si existe, se dene
como
m
X
(t) = E(e
tX
) =

x
j
Dx
e
tx
j
p(x
j
)
y la funci on caracterstica como

X
(t) = E(e
itX
) =

x
j
Dx
e
itx
j
p(x
j
).
Se verica
An alisis de Datos 89
1. m
X
(t) =
X
(it),
X
(t) = m
X
(it)
2.
d
k
dt
k
m
X
(t)

t=0
=
k
3.
d
k
dt
k

X
(t)

t=0
= i
k

k
.
5.2. Modelos probabilsticos discretos
5.2.1. Distribuci on de Bernoulli
Si un experimento aleatorio tiene dos resultados posibles
exito y fracaso, i.e., E = {e, f}. Entonces, la aplicaci on
X : E R denida por X(e) = 1 y X(f) = 0 es una variable
aleatoria que tiene como funci on de densidad de probabilidad
f
X
(x) =
_
1 p si x = 0,
p si x = 1
se llama distribuci on de Bernoulli de par ametro p, i.e., X
Ber(p). Su esperanza es E(X) = p, su varianza V ar(X) =
p(1 p) y m
X
(t) = E(e
tX
) = 1(1 p) +e
t
p = 1 +p(e
t
1).
Ejemplo 5.2.1 La probabilidad anual que se produzca un tor-
nado en Mallorca es 0,2. La variable aleatoria
X =
_
0 si no se produce,
1 si se produce
es una variable aleatoria de Bernoulli de par ametro p = 0,2
con funci on de densidad
f
X
(x) =
_
0,8 si x = 0,
0,2 si x = 1.
90 J. L. DazBarrero
5.2.2. La Distribuci on Binomial
En el experimento que consiste en la realizaci on de repeticio-
nes independientes de una prueba de Bernoulli, si n repre-
senta el n umero de pruebas y X es la variable aleatoria que
toma como valores el n umero de exitos en estas n repeticio-
nes, entonces
X = {0, 1, 2, , n}.
Su funci on de densidad de probabilidad f
X
(k) = p[X = k]
representa la probabilidad de obtener k exitos y n k fra-
casos en n repeticiones del experimento. Dado que las repe-
ticiones se consideran independientes cualquier ordenaci on
de k exitos y n k fracasos tiene probabilidad p
k
(1 p)
nk
y como hay PR
k,nk
n
ordenaciones posibles, entonces, para
k = 0, 1, , n, se tiene que
p[X = k] = PR
k,nk
n
p
k
(1 p)
nk
=
n!
k!(n k)!
p
k
(1 p)
nk
=
_
n
k
_
p
k
(1 p)
nk
.
La distribuci on de probabilidad anteriormente denida se re-
presenta con la notaci on X B(n; p) y se denomina Distri-
buci on Binomial porque los valores que toma su funci on de
densidad coinciden con los t erminos del binomio
[(1 p) +p]
n
=
n

k=0
_
n
k
_
p
k
(1 p)
nk
.
Sus par ametros son:
1. = E(X) = np,
2. V ar(X) =
2
= np(1 p), =
_
np(1 p)
3. m
X
(t) = [(1 p) +pe
t
]
n
.
An alisis de Datos 91
5.2.3. Distribuci on uniforme discreta
Una variable aleatoria que puede asumir n valores diferentes
con igual probabilidad diremos que tiene una distribuci on
uniforme discreta, i.e., si D
x
= {1, 2, , n} entonces
X U{1, 2, , n} f
X
(x) =
1
n
, x = 1, 2, , n.
Sus par ametros son:
1. E[X] =
n + 1
2
2. V ar(X) =
n
2
1
12
.
3. m
X
(t) =
1
n
n

k=1
e
kt
.
5.2.4. La distribuci on geom etrica
La distribuci on geom etrica modela el n umero de fracasos
hasta el primer exito. Existen dos versiones: (1) La que cuen-
ta unicamente el n umero de fracasos y (2) La que cuenta
el n umero de pruebas incluyendo la que constituye el primer
exito. Puesto que modela unidades, en general de tiempo, que
hay que esperar hasta obtener el primer exito, se denomina
tambi en variable aleatoria discreta de tiempo de espera.
Se dice que la variable aleatoria X con D
x
= {0, 1, 2, }
sigue una distribuci on geom etrica de par ametro p si
f
X
(x) = p(1 p)
x
, x = 0, 1, 2, .
Esta distribuci on modela el n umero de fracasos hasta el pri-
mer exito, sin incluirlo. Sus par ametros son:
92 J. L. DazBarrero
1. E(X) =
1 p
p
,
2. V ar(X) =
1 p
p
2
.
3. m
X
(t) =
p
1 e
t
(1 p)
.
La variable aleatoria X con D
x
= {1, 2, 3, } sigue una dis-
tribuci on geom etrica de par ametro p cuando
f
X
(x) = p(1 p)
x1
, x = 1, 2, 3,
Sus par ametros son
1. E(X) =
1
p
,
2. V ar(X) =
1 p
p
2
.
Modela el n umero de pruebas hasta alcanzar el primer exito,
incluyendo este.
5.2.5. La distribuci on de Poisson
Una variable aleatoria X con D
x
= {0, 1, 2, } se dice que
sigue una Distribuci on de Poisson de par ametro cuando
y solo cuando
f
X
(x) = p[X = x] =

x
e

x!
, x D
x
, > 0.
Sus par ametros son:
An alisis de Datos 93
1. E(X) = ,
2. V ar(X) = .
3. m
X
(t) = e
(e
t
1)
.
Esta distribuci on es un modelo adecuado para muchos fen ome-
nos aleatorios, independientes, que cuentan exitos por uni-
dad de tiempo, espacio, longitud, etc. Ejemplos: n umero de
tornados, terremotos o inundaciones que ocurren en una de-
terminada zona por a no.
La distribuci on de Poisson puede obtenerse como lmite de la
Binomial. En efecto, supongamos que en un tiempo t se reali-
zan n experimentos independientes de Bernoulli con par ame-
tro p. Si X es la variable aleatoria que cuenta el n umero de
exitos, entonces se distribuye como una Binomial de par ame-
tros n y p, es decir, X B(n, p) con
f
X
(x) = p[X = x] =
_
n
x
_
p
x
(1 p)
nx
, x = 0, 1, 2, , n.
Supongamos que en el periodo t aumentamos el n umero de
experimentos de forma que el promedio de exitos sea cons-
tante, i.e., E(X) = np = = cte., entonces p =

n
y
f
X
(x) = p[X = x] =
_
n
x
_
_

n
_
x
_
1

n
_
nx
, x = 0, 1, 2, , n.
Tomando lmite con n se obtiene
f
X
(x) = p[X = x] =

x
e

x!
, x = 0, 1, 2, .
Sintetizando, la distribuci on de Poisson se obtiene como lmi-
te de una Binomial para la que el n umero de experimentos
de Bernoulli crece indenidamente manteniendo constante
el n umero medio de exitos por unidad de tiempo.
94 J. L. DazBarrero
5.2.6. Perodo de retorno
Se llama perodo de retorno al tiempo esperado entre suce-
sos. Es decir, si A es un suceso y T es la variable aleatoria
(temporal) que mide el tiempo entre ocurrencias consecuti-
vas de A, entonces el periodo de retorno de A es E(T). Por
ejemplo, si T = n umero de a nos que transcurren hasta la
realizaci on de un suceso A, entonces T G(p) con p = p[A].
Por tanto, = E(T) =
1
p
es el periodo de retorno de A.
5.3. Problemas
Problema 5.1 Se considera la distribuci on de probabilidad (X, f
X
)
donde X {1, 2, , 9, 10} y f
X
(x) = 1/10, x = 1, 2, , 9, 10.
a. Representar gr acamente las funciones de densidad de pro-
babilidad y de distribuci on.
b. Calcular la esperanza y la varianza de X.
c. Calcular p[X > 5], p[3 < X 8], p[X 7].
Problema 5.2 La probabilidad anual de que se produzcan inun-
daciones en la costa del Maresme es 0,45. Calcular la probabi-
lidad que en los pr oximos 10 a nos se produzcan inundaciones:
a. Todos los a nos.
b. Al menos dos a nos.
c. Exactamente 4 a nos.
d. M as de cuatro pero menos de ocho a nos.
An alisis de Datos 95
Problema 5.3 Trece hormigoneras est an suministrando hor-
mig on a una obra. La probabilidad que al nal de una jorna-
da una hormigonera continue funcionando es de 0,60. Si las
hormigoneras funcionan independientemente hallar cual es el
n umero m as probable de hormigoneras en funcionamiento al
nal del da y cual es su probabilidad.
Soluci on. Sea X = n umero de hormigoneras en funciona-
miento al nal del dia. Bajo la hip otesis de independencia X
se distribuye seg un una Binomial de par ametros n = 13 y
p = 0,60. La correspondiente funci on de densidad es
x 0 1 2 3 4 5 6
f
X
6.6e-06 0.0001 0.0011 0.0063 0.0238 0.0643 0.1287
x 7 8 9 10 11 12 13
f
X
0.1932 0.2173 0.1811 0.1086 0.0444 0.0113 0.0013
La mayor probabilidad es f
X
(8) = 0,2173 y por tanto 8 es
el n umero m as probable de m aquinas en funcionamiento al
nal del da y su probabilidad es 0,2173. 2
Problema 5.4 Calcular la probabilidad de que en una reuni on
de 100 personas, elegidas al azar, hallan nacido k, (0 k
100) en el mismo da.
Soluci on. Parece natural asignar a un individuo, elegido al
azar, la probabilidad
p =
1
365
de haber nacido un determinado da del a no.
Tenemos 100 personas y de ellas seleccionamos k. La proba-
bilidad de que todos ellos hayan nacido el mismo da y que
96 J. L. DazBarrero
no lo hayan hecho ninguno de los 100 k restantes es
_
1
365
_
k
_
1
1
365
_
100k
.
Dado que con las 100 personas que tenemos se pueden for-
mar
_
100
k
_
grupos de k personas, entonces la probabilidad
pedida es
p =
_
100
k
_
_
1
365
_
k
_
1
1
365
_
100k
.
2
Problema 5.5 Se tiene un dado trucado. En 10 tiradas inde-
pendientes la probabilidad de que aparezca n umero par 5 ve-
ces es el doble de la probabilidad de aparezca 4 veces. Cu al
ser a la probabilidad de que aparezca par al menos una vez en
las 10 tiradas?
Soluci on. Sean p y q las probabilidades de que al lanzar el
dado aparezca par e impar respectivamente. La probabilidad
de que aparezca par en 5 ocasiones es
_
10
5
_
p
5
q
5
y la de que aparezca en 4 ocasiones
_
10
4
_
p
4
q
6
.
Seg un los datos del enunciado se tine
_
10
5
_
p
5
q
5
= 2
_
10
4
_
p
4
q
6
An alisis de Datos 97
o 6p = 10q. Por otro lado, q = 1 p. Resolviendo el sistema
anterior se obtiene p =
5
8
y q =
3
8
.
Por tanto, la probabilidad pedida es la del suceso contrario a
la no aparici on de par, es decir,
p = 1
_
10
0
_
p
0
q
10
= 1
_
3
8
_
10
0,999945.
2
Problema 5.6 Tr aco pretende modicar la normativa de cir-
culaci on de modo que un conductor pierda su permiso de con-
ducir si recibe tres multas por exceso de velocidad. Cada vez
que un conductor coge su coche tiene una probabilidad de
0,001 de ser sancionado por exceso de velocidad.
a. Calcular la probabilidad que un conductor reciba su prime-
ra multa por exceso de velocidad la d ecimoquinta vez que
coja el coche despu es de la aplicaci on de la nueva norma-
tiva.
b. Cu al es el n umero esperado de veces que coger a el coche
hasta que reciba la primera multa por exceso de veloci-
dad?
c. Cu al es la probabilidad de que un conductor coja su coche
al menos tres veces hasta que reciba la primera multa?
Y la de que lo coja al menos tres veces antes de recibir
su primera multa?
d. Si un conductor ha salido ya tres veces con su coche y to-
dava no ha sido multado por exceso de velocidad, cu al
es la probabilidad de que conduzca al menos una vez
m as antes de recibir la primera multa?
98 J. L. DazBarrero
Soluci on. (a) Sea X el n umero de veces que el conductor coge
su coche antes de ser sancionado por primera vez, i.e., X =
{0, 1, 2, }. La probabilidad de ser sancionado por exceso
de velocidad es p = 0,001 y la de no ser sancionado es 1p =
0,999. Por tanto, se trata de una repetici on de variables de
Bernoulli independientes hasta que se produzca la primera
sanci on, es decir, X sigue una distribuci on geom etrica de
par ametro p = 0,001, i.e.,
X G(0,001).
La probabilidad pedida es p[X = 14] = (1p)
14
p = 0,999
14

0,001 = 0,00099.
(b) Ahora hay que calcular el n umero esperado de veces que
coge el coche sin recibir sanci on y a nadirle una vez m as (la
vez que conduce y recibe la sanci on), i.e.,
N = E(X) + 1 = 1 +
1 p
p
= 1000 veces.
(c) Las probabilidades pedidas son p[X 2] = La sanci on
puede ocurrir en la tercera vez o siguientes = 0,998; y p[X
3] = La sanci on puede ocurrir en la cuarta vez o siguientes
= 0,9970.
(d) Si la tercera vez que coge el coche todava no ha sido
multado, entonces la variable X tomar a valores mayores o
iguales que 3, pues la primera multa llegara en el peor de
los casos, la cuarta vez. Por tanto, la probabilidad pedida es
p[X 4|X 3] =
p[X 4 X 3]
p[X 3]
=
p[X 4]
p[X 3]
= 0,999.
2
Problema 5.7 Determinar la esperanza y la varianza para las
distribuciones geom etrica y de Poisson. (Utilizar la funci on ge-
neratiz de momentos)
An alisis de Datos 99
Soluci on. (a) La funci on generatriz de momentos para una
variable aleatoria que sigue una distribuci on geom etrica de
par ametro p es
m
X
(t) = E(e
tX
) =

x=0
e
tx
f
X
(x) =

x=0
e
tx
p(1 p)
x
= p

x=0
e
tx
(1 p)
x
= p
_
1 +e
t
(1 p) +e
2t
(1 p)
2
+. . .
_
= p
_
1
1 e
t
(1 p)
_
si e
t
(1 p) < 1.
Por tanto, dado que m
X
(t) =
p
1 e
t
(1 p)
, entonces
E(X) = lm
t0
d
dt
m
X
(t) = lm
t0
p(1 p)
_
1 e
t
(1 p)
_
2
=
1 p
p
.
Ahora es f acil obtener que V ar(X) =
1 p
p
2
.
(b) Si X Poiss() entonces
m
X
(t) = E(e
tX
) =

x=0
e
tx
f
X
(x) =

x=0
e

(e
t
)
x
x!
= e

x=0
(e
t
)
x
x!
= e
(e
t
1)
.
A partir de m
X
(t) se obtiene
E(X) = lm
t0
d
dt
m
X
(t) = lm
t0
_
e
(e
t
1)
e
t
_
= .
E(X
2
) = lm
t0
d
2
dt
2
m
X
(t)
100 J. L. DazBarrero
= lm
t0
_
e
(e
t
1)
e
t
+
2
e
2t
e
(e
t
1)
_
= +
2
.
Por tanto, V ar(X) = E(X
2
) E
2
(X) = . 2
Problema 5.8 Suponiendo que el n umero de tornados obser-
vados en un a no en una cierta regi on tiene una distribuci on de
Poisson de par ametro = 8.
1. Calcular p
_
X 5
_
, p
_
6 X 9
_
, p
_
10 X
_
.
2. Cu antos tornados cabe esperar que se produzcan en un
a no y cu al es la desviaci on tpica del n umero de tornados
observados?
Soluci on. 1.- Dado que P
_
X = x
_
=

x
e

x!
, entonces
P[X 5] =
5

x=0
8
x
e
8
x!
= 0,191.
p[6 X 9] =
9

x=6
8
x
e
8
x!
= 0,526.
p[x 10] = 1 p[X < 10] = 1
9

x=0
8
x
e
8
x!
= 0,283.
(b) E(X) = 8, V ar(X) = 8 y
X
=
_
V ar(X) = 2,828.
2
Captulo 6
Variables Aleatorias
Continuas
Dado un espacio de probabilidad (E, S, p); una variable alea-
toria X denida sobre S con D
x
R (intervalo) se dice que
es una variable aleatoria continua.
La funci on de densidad de probabilidad de una variable
aleatoria continua X se dene como una funci on f
X
: R
[0, 1] tal que para todo a, b R, con a < b,
p[a < X b] =
_
b
a
f
X
(x) dx.
La funci on de densidad verica:
1. f
X
(x) 0, para todo x R.
2.
_

f
X
(x) dx = 1.
Al igual que en el caso discreto toda funci on f
X
: R [0, 1]
que cumpla las dos condiciones anteriores es funci on de den-
sidad de una variable aleatoria X, en este caso continua.
101
102 J. L. DazBarrero
La funci on de densidad goza de las siguientes propiedades:
1. p[X = c] = 0, para toda constante c R.
2. p[a < X b] = p[a X b] = p[a X < b] = p[a <
X < b], para todo a, b R, a < b.
A la pareja formada por (X, f
X
) se le llama distribuci on con-
tinua de probabilidad.
La funci on de distribuci on acumulada F
X
(x) de una varia-
ble aleatoria continua X se dene por
F
X
(x) = p[X x] =
_
x

f
X
(x) dx,
y verica las siguientes propiedades:
1. lm
x
F
X
(x) = 0,
2. lm
x+
F
X
(x) = 1,
3. F
X
(a) F
X
(b), para todo a < b (no decreciente),
4. lm
xa
+
F
X
(x) = F
X
(a) (continua derecha),
5. p[a < X b] = p[X b] p[X a] = F
X
(b) F
X
(a),
para todo a, b R, a < b,
6. La funci on de densidad es la derivada de la funci on de
distribuci on
f
X
(x) = F

X
(x) =
dF
X
(x)
dx
.
An alisis de Datos 103
6.1. Par ametros de una variable alea-
toria continua
La esperanza matem atica de una variable aleatoria conti-
nua se dene por
E(X) = =
_

xf
X
(x) dx,
y la esperanza o valor esperado de la funci on g(X) por
E[g(X)] =
g(X)
=
_

g(x)f
X
(x) dx.
La esperanza es un par ametro de centralizaci on que existe
siempre y cuando sea convergente la integral que la dene.
La varianza de X se dene por
V ar(X) =
2
X
=
_

(x )
2
f
X
(x) dx = E(X
2
) E
2
(X).
La desviaci on tpica es la raz cuadrada positiva de la va-
rianza, i.e.,

X
=
_
V ar(X).
La desigualdad de Chebychev enuncia que para toda varia-
ble aleatoria X con esperanza y varianza nita
2
, y toda
k > 0,
p[|X | k]
1
k
2
,
o equivalentemente,
p[ k < X < +k] 1
1
k
2
.
104 J. L. DazBarrero
El percentil q esimo se dene para todo q [0, 1], como
aquel valor
q
tal que

q
= mn{x
k
|F
X
(x
k
) q}.
La moda se dene como el valor o valores de x donde f
X
alcanza sus m aximos.
6.2. Modelos probabilsticos continuos
6.2.1. Distribuci on uniforme continua
La distribuci on uniforme continua o distribuci on rectangu-
lar sirve para modelar fen omenos que toman valores en un
intervalo nito [a, b] donde se supone la equiprobabilidad de
los subintervalos de igual longitud. Ejemplo: situar puntos
sobre un segmento. Se dice que X U[a, b] cuando su fun-
ci on de densidad es
f
X
(x) =
1
b a
I{a X b}.
Sus par ametros son
1. E(X) =
a +b
2
,
2. V ar(X) =
(b a)
2
12
.
6.2.2. Distribuci on exponencial
Es util para modelar tiempos entre sucesos de Poisson. Se
dice que la variable aleatoria X con D
x
= R
+
sigue una dis-
An alisis de Datos 105
tribuci on exponencial de par ametro , ( > 0), i.e.,
X Exp() f
X
(X) = e
x
I{0 x}.
Sus par ametros son
1. E(X) =
1

(perodo de retorno)
2. V ar(X) =
1

2
.
6.3. La Distribuci on Normal
Una variable aleatoria continua X se dice que sigue una
Distribuci on Normal o Distribuci on de GaussLaplace de
par ametros ,
2
si tiene por funci on de densidad
f
X
(x) =
1

2
e

1
2
_
x

_
2
.
Probablemente es la m as importante y la m as utilizada de las
distribuciones de probabilidad, entre otras, por las siguientes
razones:
1. Es b asica en la aplicaci on de la inferencia estadstica al
an alisis de datos, dado que gran cantidad de estadsti-
cos muestrales tienden a la distribuci on normal a medi-
da que aumenta el tama no de la muestra.
2. Gran parte de los fen omenos observables se representan
mediante la distribuci on normal al menos en una pri-
mera aproximaci on.
3. Las variables aleatorias continuas que dependen de un
gran n umero de causas independientes, que suman sus
efectos y que ninguna de ellas es preponderante sobre
las dem as, tambi en sigue una distribuci on normal.
106 J. L. DazBarrero
Esta distribuci on aparece en el siglo XVIII denida en forma
emprica o gr aca en problemas relacionados con el comercio
y la navegaci on. En 1733 De Moivre la introdujo como lmite
de la Binomial (aproximaci on) cuando el n umero de prue-
bas n crece indenidamente. Posteriormente, Gauss (1808)
y Laplace (1812) presentan el modelo normal expresandolo
con una funci on de densidad y lo utilizan para estudiar la
distribuci on de los errores al realizar mediciones fsicas (As-
tronoma).
La gr aca de f
X
(x) tiene forma de campana con un m aximo
en x = . Las dos colas se extienden indenidamente sien-
do y = 0 una asntota horizontal. Cualesquiera que sean los
valores de y
2
para una variable aleatoria normal, el area
bajo la curva f
X
es igual a 1 y se verica que aproximada-
mente el 68,25 % de los valores de la distribuci on se encuen-
tran en el intervalo [, +], el 95,5 % en [2, +2]
y el 99,7 % en [ 3, + 3].
Puede comprobarse que si X N(,
2
) sus par ametros
son:
1. E(X) = ,
2. V ar(X) =
2
,
3. m
X
(t) = e
t +
1
2

2
t
2
.
Dado que la p[a X b] viene dada por
p[a X b] =
_
b
a
f
X
(x) dx
y que esta integral no es resoluble por cuadraturas, se nece-
sita aproximarla num ericmente mediante tablas. Esto com-
portara hacer una tabla para cada pareja de valores ,
2
.
An alisis de Datos 107
Este problema se resuelve mediante la tipicaci on de la va-
riable que consiste en hacer el cambio de variable
Z =
X

que permite pasar de la variable X N(,


2
) a la normal
est andard Z N(0, 1). En efecto,
E(Z) = E
_
X

_
=
1

_
E(X)
_
=
1

( ) = 0.
V ar(Z) = V ar
_
X

_
=
1

2
V ar(X) =

2
= 1.
6.4. El teorema del Lmite Central
La aparici on hist orica de variables aleatorias normales en las
aplicaciones proviene del hecho que cuando se suman varia-
bles aleatorias, el resultado tiende a comportarse como una
variable aleatoria normal. Esto se justica con el Teorema
del Lmite Central que es uno de los m as importantes en
la Teora de la Probabilidad y con enormes consecuencias en
Estadstica. A continuaci on, se enuncia una versi on sencilla
de este resultado:
Teorema del Lmite Central
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes e
id enticamente distribuidas, con E(X
i
) = y V ar(X
i
) =

2
, i = 1, 2, . . . , n. Denimos S
n
=
n

i=1
X
i
. Entonces, la va-
riable S
n
tipicada
Z
n
=
S
n
E(S
n
)
_
V ar(S
n
)
=
S
n
n

n
108 J. L. DazBarrero
tiene distribuci on F
Zn
(x) tal que, para cualquier x R
lm
n+
F
Zn
(x) = F
Z
(x).
En otras palabras,
lm
n+
p[a Z
n
b] = p[a Z b]
con Z N(0, 1). Sintetizando, este resultado enuncia que:
En una sucesi on de pruebas repetidas e independientes la
media muestral estandarizada tiende a la normal est andard
a medida que el n umero de pruebas aumenta.
El teorema del lmite central puede aplicarse a la suma de
variables aleatorias discretas. El siguiente teorema, anterior
al del lmite central, puede considerarse un corolario.
Teorema de De MoivreLaplace
Sea X B(n, p). Denimos Z
n
=
X np
_
np(1 p)
cuya distri-
buci on escalonada es F
Zn
. Entonces,
lm
n+
F
Zn
(x) = F
Z
(x).
Es decir, para valores grandes de n, si p no es pr oximo a 1,
la distribuci on normal
N
_
np, np(1 p)
_
se puede utilizar para aproximar a la Binomial. Cuanto ma-
yor sea n y p m as pr oximo a 0,5 mejor ser a la aproximaci on.
Finalmente, se ha de comentar que actualmente con la tecnolo-
ga que tenemos a nuestro alcance las aproximaciones de la
Binomial por la la normal carecen de sentido.
An alisis de Datos 109
6.5. Problemas
Problema 6.1 En una f abrica de cementos se anuncia que
los pedidos son atendidos en 30 minutos. Supongamos que
el tiempo en atender los pedidos se distribuye seg un una va-
riable aleatoria continua X U(25, 35). se pide:
1. Denir las funci ones de densidad de probabilidad y dis-
tribuci on y dibujar sus gr acas.
2. Cu al es la probabilidad que el tiempo de atenci on del
siguiente pedido exceda los 33 minutos?
3. Cu al es la probabilidad que el tiempo en que un pedido
es atendido diera en 2 minutos del tiempo anunciado?
4. Para cada a tal que 25 < a < a + 2 < 35, cu al es la
probabilidad que un pedido sea atendido en el intervalo
[a, a + 2]?
Problema 6.2 Un estudio realizado sobre la cantidad de Cha-
papote retirado diariamente por los equipos de limpieza (vo-
luntarios, pescadores y ej ercito), revela que el 50 % de los equi-
pos retiran m as de 100 y menos de 200 teneladas, el 25 %m as
de 200 y menos de 300 y el resto no llega a las 100 tonela-
das. Con esta informaci on construir una funci on de densidad
que modelice la distribuci on X (en cientos de toneladas) de los
residuos recogidos por los equipos de limpieza y, a partir de
ella, obtener:
1. La funci on de distribuci on de X.
2. La media de residuos recogidos y su desviaci on tpica.
3. El porcentaje de equipos que recogen entre 50 y 150 to-
neladas diarias.
110 J. L. DazBarrero
Soluci on. El n umero de toneladas recogidas, seg un el infor-
me, oscila entre 0 y 300 toneladas diarias. Entonces, La fun-
ci on de densidad es
f
X
(x) =
_

_
1/4, 0 x < 1;
1/2, 1 x < 2;
1/4, 2 x < 3;
0, en el resto.
1. F
X
(x) =
_
x

f
X
(x) dx =
_

_
0, x < 0;
x/4, 0 x < 1;
x/2 1/4, 1 x < 2;
x/4 + 1/4, 2 x < 3.
1, x 3.
En efecto, para x < 0, F
X
(x) =
_
x

0 dx = 0. Para 0
x < 1, F
X
(x) =
_
0

0 dx +
_
x
0
1/4 dx =
x
4
. Para 1
x < 2, F
X
(x) =
_
0

0 dx +
_
1
0
1/4 dx +
_
x
1
1/2 dx =
x
2

1
4
. Para 2 x < 3, F
X
(x) =
_
0

0 dx +
_
1
0
1/4 dx +
_
2
1
1/2 dx+
_
x
2
1/4 dx =
x
4
+
1
4
. Finalmente, para x 3,
F
X
(x) =
_
0

0 dx+
_
1
0
1/4 dx+
_
2
1
1/2 dx+
_
3
2
1/4 dx =
1.
2. E(X) =
_

xf
X
(x) dx =
3
2
, i.e., 150 toneladas. E(X
2
) =
_

x
2
f
X
(x) dx =
34
12
. Por tanto, V ar(X) = 0,5833 y
s
X
= 0,7638.
3. P[0,5 X 1,5] =
_
1,5
0,5
f
X
(x) dx = F
X
(1,5)F
X
(0,5) =
0,375. Es decir, el 37,5 % de los equipos.
An alisis de Datos 111
2
Problema 6.3 Sea Z una variable aleatoria que se distribuye
seg un una normal est andard. Calcular las siguientes probabi-
lidades:
p(0 z 2,2) p(z 1,37) p(2,5 z 2,5)
p(0 z 1) p(1,8 z) p(1,4 z 2,5)
p(2,5 z 0) p(1,5 z 2) p(1,5 z)
Problema 6.4 Hallar los valores aproximados de los siguien-
tes percentiles de la distribuci on normal est andadrd:
a. 91 b. 9 c. 75 d. 95
Soluci on. a. Se ha de calcular el valor de a de forma que
p(z a) = 0,91. Directamente de las tablas se obtiene que
a = 1,34. En los otros casos los valores aproximados son
respectivamente: 1,34, 0,68, 1,645. 2
Problema 6.5 Obtener el valor de k en las siguientes ecuacio-
nes para la variable aleatoria N(0, 1):
p(z k) = 0,01 p(k z k) = 0,6826
p(k z k) = 0,98 p(k z k) = 0,9544
p(z k) = 0,01 p(z k) = 0,95
Soluci on. En el primer caso hay que tener encuenta que p(z
k) = 0,01 es equivalente a que 1 p(z < k) = 0,01 o p(z <
k) = 0,99. Directamente de las tablas resulta que k = 2,33.
En los otros casos se obtienen los valores 2,33, 2,33, 1,00, 2,00
y 1,645 respectivamente. 2
Problema 6.6 Sea X una variable aleatoria que se distribuye
seg un una N(30, 25). Hallar las siguientes probabilidades:
P(30 X 37,1) P(21,05 X 27,3) P(26,35 X 30)
P(23,15 X 40,05) P(33,25 X 36,3) P(|X| 32,5)
112 J. L. DazBarrero
Soluci on. Tipicando la variable mediante la transformaci on
z =
x

, se obtienen losisguientes resultados:


0,4222 0,1540 0,2673 0,8925 0,2579 0,6913
2
Problema 6.7 Suponiendo que los errores en la medida de
300 observaciones topogr acas siguen una distribuci on nor-
mal de media 0 y desviaci on est andar 4, calcular :
(i) La probabilidad de que un error no sea mayor que 6
(ii) La probabilidad de que sea por defecto y mayor que 8
(iii) Si llamamos peque nos a los errores menores que 7 y gran-
des a los mayores que 7, calcular el n umero esperado de
errores grandes y peque nos en las 300 observaciones.
Soluci on. Si X N(0, 16) y Z N(0, 1), entonces:
(i) p[|X| 6] = p[6 X 6] = p[1,5 Z 1,5] =
0,8662.
(ii) p[X < 8] = p[Z < 2] = 0,0228.
(iii) p[ error peque no]=p[|X| 7] = p[|Z| 1,75] = 0,9198 y
p[error grande] = 1 0,9198 = 0,0802. Por tanto, el n ume-
ro esperado de rrores peque nos es de 276 y el de errrores
grandes de 24. 2
Problema 6.8 Supongamos que el pH del suelo de la cuenca
de un rio es una variable aleatoria que se distribuye normal-
mente con media 6 y desviaci on tpica 0,10. Si se elige una
muestra al azar del suelo y se determina su pH:
1. Cu al es la probabilidad que el pH resultante est e entre
5,90 y 6,25?
An alisis de Datos 113
2. Cu al es la probabilidad que el pH se mayor que 6,10?
3. Qu e valor ser a superado solamente por el 5 % de los posi-
bles pH?
Problema 6.9 Para conocer el grado de concienciaci on de los
problemas medio ambientales que tienen los trabajadores de
las constructoras un inspector ha aplicado un test de ambien-
talizaci on a los 500 trabajadores de una empresa. Se supone
que las puntuaciones obtenidas se distribuyen se g un una nor-
mal de media 80 y desviaci on tpica 12. (a) Qu e puntuaci on
separa al 25 % de los trabajadores con menor conocimiento de
los problemas ambientales? (b) A partir de qu e puntuaci on se
encuentra el 25 % de los trabajadores con mejor conocimiento
de la ambientalizaci on? (c) El inspector visita otra empresa y
al aplicar el mismo test a sus trabajadores encuentra que las
puntuaciones se distribuyen seg un una N(82, 169). Qu e se
puede decir? Hay en la segunda empresa trabajadores con
mejor conocimiento de los problemas ambientales que en la
primera?
Soluci on. (a) p[X x] = 0,25; p
_
X 80
12
z
_
= 0,25.
z = 0,67;
X 80
12
= 0,67; X = 71,96.
El 25 % de los trabajadores con menor conocimiento en am-
bientalizaci on obtiene puntuaciones inferiores a 71,96.
(b) P[X x] = 0,75; p
_
X 80
12
z
_
= 0,75. z = 0,67;
X 80
12
= 0,67; X = 88,04
A partir de 88,04 se encuentra el 25 % de los trabajadores con
mejor conocimiento de los problemas ambientales.
(c) Teniendo en cuenta que en el intervalo ( , + ) se
114 J. L. DazBarrero
halla el 68,2 % de los individuos; en (2, +2) el 95,4 %
y en ( 3, + 3) el 99,7 %, entonces
68.2% 95.4% 99.7%
Empresa 1 (68,92) (56,104) (44,116)
Empresa 2 (69,95) (56,108) (43,121)
Se puede concluir que en la segunda empresa hay trabaja-
dores con mejor conocimiento de los problemas ambientales
que en la primera, ya que los lmites inferiores de los inter-
valos son muy pr oximos; en cambio los superiores son sen-
siblemente m as altos en la segunda empresa. 2
Problema 6.10 La vida de una hormigonera se distribuye nor-
malmente con media 10000 horas. Por la experiencia acumula-
da, se sabe que el 50 % de ellas dura menos de 9190 horas o
m as de 10810 horas. Se pide:
1. Cu al es la desviaci on est andard del tiempo de vida de
las hormigoneras?
2. Cu al es el porcentaje de hormigoneras que funcionar a m as
de 11500 horas?
3. Si una hormigonera lleva funcionando 12000 horas, cu al
es la probabilidad de que continue funcionando despu es
de las 13000 horas?
Soluci on. La vida de las hormigoneras X se distribuye seg un
una N(10000,
2
). Tipicando, mediante el cambio de varia-
ble z =
x 10000

se obtiene que Z N(0, 1). Entonces:


1. z
1
=
10810 10000

=
810

, z
2
=
9190 10000

=
810

.
An alisis de Datos 115
Seg un el enunciado, tenemos
p
_
Z >
810

_
= p
_
Z
810

_
p
_
Z >
810

_
+p
_
Z
810

_
= 0,5
De d onde p
_
Z
810

_
= 0,75;
810

= 0,675 y = 1200.
2. p[X 11500] = 1 p[X < 11500] = 1 p[Z < 1,25] =
1 0,8944 = 0,1056.
3. p[X > 13000|X 12000] =
p[X > 13000 X 12000]
p[X 12000]
=
p[X > 13000]
p[X 12000]
= 0,1278. 2
Problema 6.11 La temperatura que se registra en la superfcie
de un sat elite meteorol ogico se puede considerar que se distri-
buye seg un una variable aleatoria normal. Cuando se encuen-
tra afectado por la sombra de la Tierra, se tiene que en un 95 %
de los casos la temperatura es inferior a los 263

K, mientras
que supera los 253

K en el 40 % de las mediciones.
1. Calcular la media y la varianza de la temperatura en es-
tas condiciones.
2. Cuando el sat elite recibe directamente la luz solar, la tem-
peratura en su superfcie presenta la misma varianza que
en el caso anterior, pero su media se incrementa en 35

K.
Cu al es la probabilidad que la temperatura supere los
278

K?
Soluci on. (1) La variable aleatoria temperatura en la sombra
se distribuye seg un una normal X N(,
2
). Adem as,
p[X < 263] = 0,95, y p[X > 253] = 0,4
116 J. L. DazBarrero
o equivalentemente,
263

= 1,645, y
253

= 0,255
Resolviendo el sistema anterior resulta: = 251,16

K y =
7,19

K.
(2) La variable aleatoria temperatura al sol se distribuye seg un
una normal Y N( + 35,
2
). Entonces,
p[Y > 278] = 1p[Y 278] = 1p
_
278 286,16
7,19
_
= 0,871.
2
Problema 6.12 La probabilidad que un cliente pague con VI-
SA la compra de unos materiales de lampisteria es del 50 %.
Hallar la probabilidad que de los 100 pr oximos clientes:
1. Exactamente 60 paguen con VISA.
2. A lo sumo 40 paguen con VISA.
3. M as de 40 paguen con VISA.
Soluci on. Ahora se trata de una distribuci on Binomial B(100, 0,5).
Como np = 50 > 5 y nq = 50 > 5, entonces aplicando
el teorema de De Moivre se puede aproximar mediante una
N(, ) donde = np = 50 y =

npq = 5. Por tanto,


1. P[X = 60] P[59,5 X 60,5] = P[1,9 Z
2,1] = 0,0108
2. P[X 40,5] = P[Z 1,9] = 0,0287.
3. P[X > 40,5] = 1 P[X 40,5] = 1 0,0287 = 0,9713.
2
Captulo 7
Inferencia Estadstica:
Estimaci on de Par ametros.
Contrastes de Hip otesis
7.1. Introducci on
La inferencia estadstica tiene como objetivo obtener infor-
maci on sobre la poblaci on (lo que se quiere estudiar) a partir
de una o varias muestras de ella misma (lo que se puede
estudiar). La inferencia es un conjunto de t ecnicas y procedi-
mientos que permiten de alguna forma cuanticar la incerti-
dumbre acerca del modelo y de sus par ametros. Es deseable,
que la t ecnica elegida sea la m as apropiada para seleccionar
el modelo que permita tomar las mejores decisiones a partir
de la informaci on obtenida en las muestras.
Sintetizando, podramos decir que el objetivo de la estadstica
es obtener conclusiones sobre una caracterstica de la po-
blaci on a partir de la informaci on proporcionada por una
muestra, para lo cual, es clave garantizar que la muestra sea
representativa de la poblaci on.
117
118 J. L. DazBarrero
7.2. Muestreo
Por poblaci on se entiende un conjunto homog eneo de ele-
mentos en los que se estudia una cracterstica o variable da-
da. Una muestra es un conjunto representativo de los ele-
mentos de la poblaci on. Para obtener datos de una pobla-
ci on se puede proceder de dos formas, mediante un censo
(se estudia toda la poblaci on) o seleccionando una muestra
(se estudia parte de la poblaci on). Este ultimo procedimiento
se denomina muestreo. Existen varios tipos de muestreo:
1. Muestreo aleatorio simple. Es un procedimiento de se-
lecci on de una muestra de forma que cada individuo de
la poblaci on tiene la misma probabilidad de ser elegido.
Cuando la selecci on se realiza con reemplazamiento,
de forma que la poblaci on es id entica en todas las ex-
tracciones, la muestra se llama aleatoria simple.
2. Muestreo aleatorio sistem atico. Se utiliza cuando el
n umero de individuos de la poblaci on es elevado. Para
realizarlo, se calcula primero el par ametro k que es la
parte entera del cociente entre el tama no del censo N y
el taman no de la muestra n. A continuaci on, se selec-
ciona aleatoriamente el primer elemento de la muestra
entre los k primeros elementos de la poblaci on (orde-
nados siguiendo alg un criterio), el segundo entre los k
siguientes y as hasta completar la muestra.
3. Muestreo aleatorio estraticado. Se utiliza en pobla-
ciones heterog eneas cuando los individuos de la pobla-
ci on se agrupan en estratos (grupos de caractersticas
homog eneas, como sexo, renta,...). Consiste en dividir
la poblaci on en estratos y mediante muestreo aleatorio
simple seleccionar una muestra representativa de ca-
da uno de ellos. Puede ser constante (cuando se extrae
el mismo n umero de individuos de cada estrato) o pro-
porcional (cuando el n umero de elementos que se se-
An alisis de Datos 119
leccionan de cada estrato es proporcional al n umero de
elementos del estrato en la poblaci on).
4. Muestreo aleatorio por clusters o conglomerados. Se
utiliza cuando no se dispone de un censo de la poblaci on
o cuando sus individuos se hallan muy dispersos geo-
gr acamente. Asume como unidades muestrales grupos
de la poblaci on y no individuos particulares. El procedi-
miento consiste es seleccionar tantos clusters o conglo-
merados como individuos tenga la muestra y despu es
seleccionar mediante muestro aleatorio simple un indi-
viduo de cada cluster para poder as formar una mues-
tra representativa de la poblaci on.
5. Muestreo aleatorio dirigido. Consiste en seleccionar
una muestra con un cierto criterio, de forma que los
individuos selecionados se supongan representativos de
la poblaci on.
6. Muestreo no aleatorio por cuotas. Se utiliza en en-
cuestas de opini on. Se basa en un buen conocimiento
de la poblaci on. El investigador selecciona, seg un su cri-
terio, el n umero de estratos o individuos que considera
m as apropiados para su investigaci on.
7. Muestreo no aleatorio deliberado. Consiste en selec-
cionar la muestra a partir de un segmento concreto de
la poblaci on (por ejemplo, la guia telef onica) o seleccio-
nando deliberadamente los individuos que se conside-
ran m as apropiados para constituir la muestra objeto
de estudio.
Finalmente, comentaremos que la representatividad de una
muestra no se halla solamente en el m etodo de muestreo si
no que el tama no de la muestra es fundamental. Los criterios
generales para seleccionar el tama no de una muestra son:
120 J. L. DazBarrero
1. El objetivo perseguido.
2. Las caractersticas de la poblaci on investigada.
3. El grado de error que se pueda tolerar.
7.3. Estimaci on de Par ametros
Dada una poblaci on caracterizada por una variable aleatoria
X, se llama muestra aleatoria a un conjunto X
1
, X
2
, . . . , X
n
de variables aleatorias independientes, id enticamente distri-
buidas, todas con la misma distribuci on y los mismos pr ame-
tros que X. La funci on de densidad conjunta de la muestra
es
f(x
1
, x
2
, . . . , x
n
) =
n

i=1
f(x
i
).
Obs ervese que antes de tomar la muestra los X
i
son variables
aleatorias que al realizarse generan la muestra x
1
, x
2
, . . . , x
n
.
Un estimador es una funci on de la muestra apropiada para
estimar un par ametro de la poblaci on. Es una variable alea-
toria y cada vez que se realiza ( sustituci on de la v.a. por una
muestra) produce una estimaci on puntual del par ametro,
i.e., un n umero.
7.3.1. M etodos de Estimaci on Puntual
Dada una muestra aleatoria X
1
, X
2
, . . . , X
n
, y una realiza-
ci on de la misma x
1
, x
2
, . . . , x
n
, el m etodo de los momen-
tos consiste en identicar los momentos muestrales con los
momentos poblacionales. Los estimadores de los par ametros
An alisis de Datos 121
son las soluciones del sistema de ecuaciones

k
= E(X
k
) =
1
n
n

i=1
X
k
i
= m

k
, k = 1, 2, . . .
El sistema, que tiene tantas ecuaciones como par ametros a
estimar, no siempre tiene soluci on unica. Tambi en pueden
utilizarse los momentos centrados en torno a la media.
El m etodo de la m axima verosimilitud consiste en hallar
los valores de los par ametros que hacen m as verosmil (pro-
bable) la muestra. Es decir, se trata de hallar los valores de
los par ametros que maximizan la funci on de verosimilitud
L(
1
,
2
; x
1
, x
2
, . . . , x
n
) =
n

k=1
f(x
k
;
1
,
2
).
En la pr actica es m as c omodo maximizar el logaritmo de la
funci on de verosimilitud, i.e.,
ln L(
1
,
2
; x
1
, x
2
, . . . , x
n
) =
n

k=1
ln f(x
k
;
1
,
2
).
Uno de los objetivos que se ha de procurar conseguir cuando
se hace la estimaci on de un par ametro es, obtener de en-
tre todos los posibles, el que sea m as adecuado. Al intentar
obtener este estimador es util el concepto de error cuad ati-
co medio (RMS) del estimador. Si

= (X
1
, X
2
, . . . , X
n
) es
un estimador de , se llama error cuad atico medio de

a la
esperanza de la diferencia entre

y , i.e.,
RMS(

) = E[(

)
2
].
Desarrollando la expresi on anterior, se obtiene
RMS(

) = E[(

)
2
] = V ar(

) + [ E(

)]
2
.
122 J. L. DazBarrero
Como puede observarse el error cuadr atico medio es la suma
de dos cantidades no negativas, la varianza del estimador y
el cuadrado de su sesgo respecto al par ametro desconocido.
Esto pone de maniesto que las propiedades deseables de un
estimador han de ser que su varianza sea lo m as peque na
posible y que la distribuci on muestral de

se concentre alre-
dedor del par ametro.
Un estimador se dice que es insesgado o centrado cuando
E(

) = . Es decir, cuando su sesgo E(

) = 0. Un es-
timador con sesgo negativo subestima al par ametro y si el
sesgo es positivo lo sobrestima. Si,
lm
n
E(

) = ,
entonces el estimador es asint oticamente insesgado. Un es-
timador se dice que es consistente en media cuadr atica si y
s olo si,
lm
n
E[(

)
2
] = 0.
Se dice que el estimador

1
es m as eciente que

2
si
V ar(

1
) < V ar(

2
).
Un estimador es optimo cuando es insesgado y de varianza
mnima. Finalmente, un estimador

se dice que es sucien-
te para un par ametro , cuando utiliza en la estimaci on toda
la informaci on contenida en la muestra sobre el par ametro .
7.3.2. Intervalo de probabilidad e intervalo de
conanza
Dada una muestra aleatoria X
1
, X
2
, . . . , X
n
, sean
1
,
2
dos
funciones de la muestra, i.e.,

i
=
i
(X
1
, X
2
, . . . , X
n
), i = 1, 2,
An alisis de Datos 123
tales que
1

2
y p[
1
< <
2
] = 1 . Entonces, se
dice que (
1
,
2
) es un intervalo de probabilidad 1 , (0 <
< 1) para . Su realizaci on, que se obtiene al sustituir en
la muestra aleatoria los valores obtenidos, se llama intervalo
de conanza al 100(1 ). %
7.4. Distribuci on de la Media Muestral
Si se considera una caracterstica de una poblaci on que se
distribuye seg un una variable aleatoria de par ametros y

2
, i.e., X X(,
2
) y se seleccionan un gran n umero de
muestras aleatorias simples de tama no n, entonces la media
muestral X es una variable aleatoria que tiene por media

X
= y por varianza
2
X
=

2
n
. Es decir,
X X(,
2
) =X X
_
,

2
n
_
.
Seg un el Teorema del Lmite Central se tiene que indepen-
dientemente de la poblaci on original, la distribuci on de la me-
dia muestral X ser a aproximadamente normal para muestras
sucientemente grandes (n > 30). Es decir, si X es normal,
entonces X ser a normal independientemente del tama no de
las muestras. En cambio, si X no es normal X ser a aproxi-
madamente normal s olo para valores grandes de n.
7.5. Intervalos de conanza en pobla-
ciones normales
En lo que sigue, consideraremos muestras aleatorias proce-
dentes de variables aleatorias normales o muestras grandes
de poblaciones cualesquiera.
124 J. L. DazBarrero
1. Intervalo de conanza para la media con varianza
conocida. Supongamos que X N(,
2
), en don-
de el par ametro es desconocido y deseamos obtener
un intervalo de conanza para al nivel de conanza
100(1 ) %. Para ello tomamos una muestra de ta-
ma no n, X
1
, X
2
, . . . , X
n
de una poblaci on normal o de
una poblaci on cualquiera con n > 30 y hallamos dos
n umeros
1
,
2
tales que
p[
1
X
2
] = 1 .
Para determinar los valores de
1
,
2
utilizaremos la me-
dia muestral X (que se distribuye seg un una normal de
par ametros y
2
/n). Entonces, tipicando, resulta
Z =
x
/

n
que se distribuye como una N(0, 1) y por tanto, utilizan-
do la normal est andard, podemos encontrar dos valores

1
,
2
tales que
p
_

1

x
/

n

2
_
= 1 (7.1)
de donde se deduce
p
_
x
2

n
x
1

n
_
= 1
y en consecuencia el intervalo
_
x
2

n
, x
1

n
_
. (7.2)
Pero la expresi on (7.1) no quiere decir que
1
,
2
sean
unicos. Entonces, de entre todos los posibles valores
tendremos que elegir aquellos que hagan mnima la lon-
gitud del in tervalo (7.2). Es decir, hemos de minimizar
la funci on (longitud del intervalo):
L(
1
,
2
) =
_
x
1

n
_

_
x
2

n
_
=

n
(
2

1
)
An alisis de Datos 125
sujeta a la condici on dada en (7.1), i.e.,
p[
1
Z
2
] =
_

2

1
f
Z
(z) dz = 1 .
Aplicando un m etodo de minimizaci on, por ejemplo, el
de los multiplicadores de Lagrange, se obtienen los valo-
res
1
= z
/2
y
2
= z
/2
. As, el intervalo de conanza
para la media de una normal con varianza conocida vie-
ne dado por
_
x z
/2

n
, x +z
/2

n
_
donde x es la media muestral observada y z
/2
es tal
que p[Z > z
/2
] =

2
.
2. Intervalo de conanza para la media con varianza
desconocida.
Cuando la varianza es desconocida, y la media y la va-
rianza muestrales observadas son x y s
2
, entonces un
intervalo de conanza para la media poblacional al
100(1 ) % de conanza viene dado por
_
x t
/2,n1
s

n
, x +t
/2,n1
s

n
_
donde t
/2,n1
es tal que p[t
n1
> t
/2,n1
] =

2
y t
n1
sigue una distribuci on tStudent con n 1 grados de
libertad.
7.6. Contraste de Hip otesis
El objetivo de este tipo de inferencia es determinar, a partir
del an alisis de una muestra, si hay o no evidencia estadsti-
ca suciente para concluir si es o no razonable la hip otesis
hecha sobre un par ametro de la poblaci on.
126 J. L. DazBarrero
Dada una variable aleatoria X con funci on de densisdad
f
X
(x) y una muestra aleatoria X
1
, X
2
, . . . , X
n
, un contraste
de hip otesis o test parm etrico sobre los par ametros de la
poblaci on consta de las siguientes fases:
1. Una hip otesis nula o primaria que se representa por
H
0
especica siempre el valor de uno o varios par ame-
tros de la poblaci on. Si se reduce a un unico valor se
dice simple y en caso contrario compuesta.
2. Una hip otesis alternativa que se representa por H
a
o
H
1
.
3. El test de prueba que es una funci on de la muestra
aleatoria con funci on de densidad conocida. Habitual-
mente un estimador del par ametro.
4. El nivel de signicaci on del contraste. Se acostumbra
a representar por .
5. La regla de decisi on para aceptar o rechazar la hip ote-
sis nula. Dene el rango de valores del test de prueba
para rechazar la hip otesis primaria H
0
.
La hip otesis nula puede ser verdadera o falsa y por tanto son
posibles dos decisiones correctas:
1. No rechazarla cuando es correcta.
2. Rechazarla cuando es incorrecta.
Pero tambi en son posibles dos decisiones incorrectas:
1. Rechazar H
0
cuando es correcta.
2. No rechazarla cuando es incorrecta.
An alisis de Datos 127
En este ultimo caso, a (1) se le llama error de tipo I y a
(2) error de tipo II. La probabilidad de un error de tipo I se
representa por y la de un error de tipo II por . Se llama
potencia del contraste al valor 1 . Cuando la hip otesis
H
1
es compuesta el error de tipo II est a denido para una
innidad de valores. Entonces, es una curva (caracterstica
de operaci on) y en este caso 1 es la funci on de potencia
del test.
7.6.1. Contrastes para la media
1. Test de dos colas
Hip otesis nula : H
0
: =
0
Hip otesis alternativa : H
A
: =
0
Test de prueba: z =
x
0
/

n
Regla de decisi on : Rechazo de H
0
si z > z
/2
o si
z < z
/2
, o equivalentmente, rechazo de H
0
si |z| >
z
/2
.
2. Test de una cola por la derecha
Hip otesis nula : H
0
: =
0
Hip otesis alternativa : H
A
: >
0
Test de prueba: z =
x
0
/

n
Regla de decisi on : Rechazo de H
0
si z > z

.
128 J. L. DazBarrero
3. Test de una cola por la izquierda
Hip otesis nula: H
0
: =
0
Hip otesis alternativa: H
A
: <
0
Test de prueba: z =
x
0
/

n
Regla de decisi on : Rechazo de H
0
si z < z

.
En poblaciones de varianza desconocida s
x
. A continua-
ci on, se exponen algunos ejemplos de test param etricos.
7.7. An alisis de la Varianza
El objetivo que se pretende con este an alisis es la compa-
raci on de las medias de dos o m as poblaciones cuando los
datos son cuantitativos. La t ecnica que se utiliza emplea las
varianzas muestrales para detectar las diferencias entre las
medias, siendo esta la raz on por la que se conoce como an ali-
sis de la varianza o m etodo ANOVA. Dadas k poblaciones
X
i
N(
i
,
2
), i = 1, 2, . . . , n,
que se suponen normales con medias desconocidas y varian-
zas desconocidas pero iguales (homoced asticas), se seleccio-
nan k muestras independientes
M
i
(n
i
, x
i
, s
2
i
), i = 1, 2, . . . , k.
A continuaci on se realiza el siguiente test de hip otesis:
1. Hip otesis nula: H
0
:
1
=
2
= . . . =
k
.
An alisis de Datos 129
2. Hip otesis alternativa: H
1
: Al menos dos medias son
diferentes.
3. Test de prueba: El estadstico de prueba que se utiliza
tiene en cuenta tanto la variabilidad entre los grupos
(muestras) como la variabilidad dentro de cada gru-
po (muestra). Se denotan por SST (sum of squares for
treatments) y SSE (sum of squares for error) respecti-
vamente. Se denen por
SST =
k

j=1
n
j
(x
j
x)
2
,
donde x es la media de todas las observaciones, y
SSE =
k

j=1
n
j

i=1
(x
ij
x
j
)
2
=
k

j=1
(n
j
1)s
2
j
.
A continuaci on se evaluan las medias de los cuadra-
dos:
MST =
SST
k 1
, MSE =
SSE
n k
y el test de prueba que se utiliza es
F =
MST
MSE
con
1
= k 1 grados de libertad del numerador y
2
=
n k grados de libertad del denominador.
4. Regla de decisi on: Rechazo de H
0
si F > F
,k1,nk
.
Los c alculos anteriores se acostumbran a disponer en
una tabla como la que se describe a continuaci on.
130 J. L. DazBarrero
Tabla ANOVA
variabilidad df SS MS F-ratio
e.m. k-1 SST MST=
SST
k 1
d.c.m n-k SSE MSE=
SSE
n k
F=
MST
MSE
Total n-1 SS(Total)
Ejemplo 7.7.1 Un nuevo producto ha sido introducido en el
mercado de los materiales de construcci on. Para saber si hay
diferencia entre las medias de ventas de tres importantes mer-
cados regionales se han anotado las ventas de los ultimos 8
das y se han obtenido (en unidades apropiadas) los siguien-
tes resultados:
Mercado 1 15 17 22 20 18 16 14 19
Mercado 2 10 12 15 17 12 13 15 16
Mercado 3 13 18 19 16 17 16 15 18
Se puede concluir al 5 % de signicaci on que hay diferencia
entre las medias de ventas de los tres mercados? (Se supone
que las poblaciones son normales y con varianzas iguales).
Soluci on. En este caso las hip otesis son:
1. H
0
:
1
=
2
=
3
2. H
1
: Al menos dos medias son diferentes.
An alisis de Datos 131
3. Estadstico de prueba:
x
1
=
15 + 17 +. . . + 19
8
=
141
8
= 17,625
x
2
=
10 + 12 +. . . + 16
8
=
110
8
= 13,750
x
3
=
13 + 18 +. . . + 18
8
=
132
8
= 16,500
x =
15 + 17 +. . . + 18
24
=
383
24
= 15,958
SST =
3

j=1
n
j
(x
j
x)
2
= 63,59.
s
2
1
= 7,125, s
2
2
= 5,643, s
2
3
= 3,714
SSE = (n
1
1)s
2
1
+ (n
2
1)s
2
2
+ (n
3
1)s
2
3
= 115,375
MST =
SST
k 1
=
63,59
3 1
= 31,80
MSE =
SSE
n k
=
115,375
24 3
= 5,49
F =
MST
MSE
=
31,80
5,49
= 5,79.
El n umero de grados de libertad del numerador es
1
=
k 1 = 3 1 = 2 y los del denominador
2
= n k =
24 3 = 21, por tanto, F
,
1
,
2
= F
0,05,2,21
= 3,47.
4. Regla de decisi on: Rechazamos H
0
si F > F
,
1
,
2
. Por
tanto, dado que 3,47 < 5,79, en base a los datos analiza-
dos, rechazaremos la hip otesis primaria al 5 % de nivel
de signicaci on.
2
132 J. L. DazBarrero
Los datos de la tabla ANOVA se pueden utilizar para obtener
intervalos de conanza para las medias de cada una de las
poblaciones y para la diferencia de medias entre dos de ellas
mediante las expresiones:
x
j
t
/2,nk

MSE
n
j
(x
j
x
m
) t
/2,nk

MSE
_
1
n
j
+
1
n
m
_
.
Considerando el mismo ejemplo de antes hallaremos interva-
los de conanza al 95 % para
1
y
1

2
respectivamente.
En el primer caso es x
1
= 17,625 y s
1
= 2,67. Por tanto, si
1 = 95 % el m etodo tradicional da:
x
1
t
/2,n
1
1
s
1

n
= 17,625 2,365
2,67

8
= 17,625 2,23
con una cota de error E = 2,23. En cambio, utilizando la
tabla ANOVA se obtiene
x
1
t
/2,21

MSE
n
1
= 17,625 2,080
_
5,49
8
= 17,625 1,72
con una cota de error E = 1,72. Dado que en este caso la
cota de error es menor la estimaci on es mejor.
En el segundo caso, el intervalo pedido es
(x
1
x
2
) t
/2,nk

MSE
_
1
n
1
+
1
n
2
_
= (17,625 13,75) 2,080
_
5,49(1/8 + 1/8) = 3,875 2,44
y el intervalo de conanza es [1,435, 6,315].
An alisis de Datos 133
7.8. Test de Chi-cuadrado
El objetivo que se pretende con este tipo de tests es comparar
las proporciones de dos o m as poblaciones. La t ecnica utili-
zada es parecida a la que se utiliza en las tablas ANOVA pero
con variables cualitativas. Los test que habitualmente se rea-
lizan son los de bondad del ajuste y de independencia.
Supongamos que realizamos un experimento tal que sus re-
sultados se pueden clasicar en k categoras o c elulas, y que
lo repetimos n veces. Adem as supondremos que las probabi-
lidades o proporciones de los diferentes resultados son
p
1
, p
2
, , p
k
, p
1
+p
2
+ +p
k
= 1,
y que en el total de las n repeticiones las frecuencias obser-
vadas de cada uno de estos resultados ha sido:
O
1
, O
2
, , O
k
, O
1
+O
2
+ +O
k
= n.
Entonces un Test de bondad de ajuste consiste en :
1. H
0
:
1
= p
10
,
2
= p
20
, ,
k
= p
k0
.
2. H
a
: Al menos un
i
= p
i0
.
3. Nivel de signicaci on : .
4. Estadstico de contraste:

2
=
k

i=1
(O
i
e
i
)
2
e
i
donde e
i
= np
i
(frecuencia esperada).
5. Regla de decisi on: Rechazo de H
0
si
2
>
2
,k1
.
134 J. L. DazBarrero
Ejemplo 7.8.1 Cosiderar 300 repeticiones de un mismo expe-
rimento con 5 c elulas donde las frecuencias observadas son:
Categora 1 2 3 4 5
Frecuencia 24 65 86 70 55
contrastar las hip otesis :
1. H
0
:
1
= 0,1,
2
= 0,2,
3
= 0,3,
4
= 0,2,
5
= 0,2
2. H
1
: Al menos un
i
= p
i0
.
con un nivel de signicaci on del 1 %.
Soluci on. Una vez hechas las hip otesis y jado el nivel de sig-
nicaci on se proceder a a evaluar el estadstico de contraste:
e
1
= np
1
= 300(0,1) = 30, e
2
= np
2
= 300(0,2) = 60
e
3
= np
3
= 300(0,3) = 90, e
4
= np
4
= 300(0,2) = 60,
e
5
= np
5
= 300(0,2) = 60.

2
=
5

i=1
(O
i
e
i
)
2
e
i
=
(24 30)
2
30
+
(65 60)
2
60
+
(86 90)
2
90
+
(70 60)
2
60
+
(55 60)
2
60
=
36
30
+
25
60
+
16
90
+
100
60
+
25
60
= 3,88.
El valor de
2
0,01,4
= 13,27. Dado que 3,88 < 13,27, en base a
estos datos, no se puede rechazar la hip otesis nula. 2
El segundo test de chi-cuadrado trata con datos ordenados
en una tabla de contingencia y determina si dos clasica-
ciones de una poblaci on cualitativa son o no independientes.
Las hip otesis a contrastar son:
An alisis de Datos 135
1. H
0
: Las dos clasicaciones son independientes.
2. H
1
: Las dos clasicaciones son dependientes.
3. Estdstico de contraste:

2
=
h

i=1
k

j=1
(O
ij
e
ij
)
2
e
ij
, e
ij
=
(

F
i
) (

C
j
)
n
.
4. Nivel de signicaci on : .
5. Regla de decisi on: Rechazo de H
0
si
2
>
2
,(h1)(k1)
,
donde h es el n umero de las de la matriz de contingen-
cia y k el n umero de columnas.
Ejemplo 7.8.2 En un momento determinado el gobierno de
una Cominudad Aut onoma tiene dos opciones en poltica econ omi-
ca: recortar el Gasto p ublico o subir los impuestos. Antes de to-
mar ninguna descisi on se realiza un sondeo entre la poblaci on
del que resulta:
Aliaci on R.G.P S.I. Totales
A 62 90 152
B 103 85 188
C 31 29 60
Totales 196 204 400
Se puede concluir al 10 % de nivel de signicaci on que hay
relaci on entre la aliaci on poltica y el soporte del electorado a
cada una de las opciones econ omicas?.
Soluci on. Las hip otesis a contrastar son:
1. H
0
: Las dos opciones son independientes.
2. H
1
: Las dos opciones son dependientes.
136 J. L. DazBarrero
3. Estadstico de contraste:

2
=
h

i=1
k

j=1
(O
ij
e
ij
)
2
e
ij
, e
ij
=
(

F
i
) (

C
j
)
n
.
Aliaci on R.G.P S.I. Totales
A 62(74.48) 90(77.52) 152
B 103(92.12) 85(95.88) 188
C 31(29.40) 29(30.60) 60
Totales 196 204 400

2
=
h

i=1
k

j=1
(O
ij
e
ij
)
2
e
ij
=
(62 74,48)
2
74,48
+
(103 92,12)
2
92,12
+
(31 29,40)
2
29,40
+
(90 77,52)
2
77,52
+
(85 95,88)
2
95,88
+
(29 30,60)
2
30,60
= 6,79
El valor del modelo de probabilidad es
2
0,1,(31)(21)
=
2
0,1,2
=
4,60517. Dado que 6,79 > 4,60 hemos de rechazar H
0
, lo que
signica que los datos obtenidos en este sondeo aportan evi-
dencia estadstica suciente para creer que hay relaci on en-
tre la aliaci on poltica y el soporte a la opci on econ omica.
2
7.9. Problemas de inferencia
Problema 7.1 El gerente de una f abrica de pinturas para la
se nalizaci on de las carreteras ha observado que el conntenido
de las bolsas medianas (33 kg.) se distribuye normalmente
con media 33,2 y desviaci on est andard 0,3. Se pide:
An alisis de Datos 137
1. Hallar la probabilidad que una bolsa de pintura compra-
da por un cliente contenga menos de 33 kg.
2. Probabilidad de que si compra un paquete de 6 bolsas, la
media del contenido de estas sea inferior a 33 kg.
Soluci on. El contenido de las bolsas de pintura es una v.a. X
que se distribuye normalmente con media 33,2 y desviaci on
es andard 0,3, i.e. X = N(33,2, 0,3).
1. En este caso la ecuaci on de tipicaci on es z =
x

=
33 33,2
0,3
= 0,667 y P[x < 33] = P[z < 0,667] =
0,2514.
2. X es una v.a. normalmente distribuida con media 33,2
y desviaci on est andard /

n = 0,2/

6 = 0,12. Por
tanto, X = N(33,2, 0,12), z =
x 33,2
0,12
= 1,667 y
P[x < 33] = P[z < 1,667] = 0,0485.
2
Problema 7.2 Sea X
1
, X
2
, . . . , X
n
una muestra aleatoria de
una distribuci on normal con funci on de densidad de probabili-
dad
f
X
(x) =
1

2
exp
_

1
2
_
x

_
2
_
.
Hallar por m etodo de la m axima verosimilitud estimadores de
y
2
. En una realizaci on de la muestra con n = 10 se han ob-
servado los valores: 26,3, 35,1, 23,0, 28,4, 31,6, 30,9, 25,2, 28,0,
27,3, 29,2. Utilizar los resultados anteriores para obtener esti-
maciones de los par ametros y
2
.
138 J. L. DazBarrero
Soluci on. En primer lugar deniremos la funci on de verosimi-
litud que depender a de los par ametros y
2
. Es decir,
L(,
2
; x) =
n

k=1
1

2
exp
_

1
2
_
x
k

_
2
_
=
_
1

2
_
n
exp
_

1
2
2
n

k=1
(x
k
)
2
_
.
A continuaci on procederemos a maximizar la funci on
ln L(,
2
; x) =
n
2
ln 2
n
2
ln
2

1
2
2
n

k=1
(x
k
)
2
.
Para ello calcularemos sus derivadas parciales respecto a
y
2
y resolveremos el sistema de ecuaciones
ln L(,
2
; x)

=
1

2
n

k=1
(x
k
) = 0
ln L(,
2
; x)

2
=
n
2
2
+
1
2
4
n

k=1
(x
k
)
2
= 0.
Despejando de la primera ecuaci on y sustituyendo en la
segunda se obtienen los estimadores
=
1
n
n

k=1
X
k
;
2
=
1
n
n

k=1
(X
k
X)
2
.
Una vez tenemos una realizaci on de la muestra, una estima-
ci on de la media es x = 28,5 y una estimaci on de la varianza
es s
2
= 10,71. 2
Problema 7.3 Sea X una variable aleatoria que se distribuye
seg un una N(,
2
) con conocida. Se pide:
An alisis de Datos 139
1. Cu al es el nivel de conanza para el intervalo
_
x 2,58

n
, x + 2,58

n
_
.
2. Cu al es el nivel de conanza para el intervalo x1,645

n
.
3. Calcular un intervalo para la media al 95 % de conan-
za cuando n = 100 y x = 58,3 (Tomar = 3).
Soluci on.
1. Si z
/2
= 2,58 esto signica que p[z > 2,58] = /2 o
eqivalentemente que p[z 2,58] = 1 /2. Directa-
mente de las tablas de la N(0, 1) se obtiene 1 /2 =
0,9951, = 0,0098 y el nivel de conanza es 100(1
) % = 99 %.
2. Procediendo como en el caso anterior el nivel de con-
anza es 100(1 ) % = 90 %.
3. Un intervalo de conanza para la media viene dado por
x z
/2

n
= 58,3 1,96
3

100
= 58,3 0,588 o equi-
valentemente (57,71, 58,89).
2
Problema 7.4 Un test de turbidez realizado sobre 16 mues-
tras de aguas arenosas en el delta de un rio arroj o los siguien-
tes resultados:
26,7 25,8 24,0 24,9 26,4 25,9 24,4 21,7
24,1 25,9 27,3 26,9 27,3 24,8 23,6 25,0
Suponiendo que el muestreo se llev o a cabo sobre una pobla-
ci on normal, estimar intervalos al 90 %, 95 % y 99 % de nivel
de conanza para la media de turbidez .
140 J. L. DazBarrero
Soluci on. Se trata de obtener estimaciones de intervalos de
conanza para la media de una poblaci on normal de varianza
desconocida a partir de una muestra de 16 observaciones.
Las estimaciones las obtendremos al realizar los estimadores

1
= Xt
/2,n1
S

n
y
2
= X+t
/2,n1
S

n
sobre la muestra.
Teniendo en cuenta que x = 25,29 y s = 1,47, entonces:
1. Si 1 = 90 %, /2 = 0,05, t
/2,15
= 1,753 y la estima-
ci on del intervalo es 25,291,753
1,47
4
= 25,290,64,
i.e., (24,65, 25,93).
2. Si 1 = 95 %, /2 = 0,025, t
/2,15
= 2,131 y la estima-
ci on del intervalo es 25,292,131
1,47
4
= 25,290,78,
i.e., (24,51, 26,07).
3. Si 1 = 99 %, /2 = 0,005, t
/2,15
= 2,947 y la estima-
ci on del intervalo es 25,292,947
1,47
4
= 25,291,08,
i.e., (24,21, 26,37).
2
Problema 7.5 Una compa na que produce neum aticos para
autom oviles de turismo est a considerando la posibilidad de in-
torducir una cierta modicaci on en el dise no de sus productos.
El gerente de la compa na considera que la inversi on econ omi-
ca que supone dicha modicaci on estara justicada s olo si
se aumentase la duraci on promedio de los neum aticos que ac-
tualmente es de 20000 km. Se selecciona una muestra aleato-
ria de 16 prototipos del neum atico modicado y se observa que
la duraci on promedio de los mismos es de 20758 km. Suponien-
do que la vida media de los neum aticos se distribuye normal-
mente con desviaci on est andard 1500 km. (La del neum atico
que actualmente se fabrica), sugiere este experimento que se
An alisis de Datos 141
dan las condiciones apropiadas para que el gerente autorice el
cambio de dise no? (Tomar = 0,01).)
Soluci on. Se realizar a un test param etrico para la media que
consta de las siguientes fases:
1. Hip otesis primaria H
0
: = 20000.
2. Hip otesis alternativa H
1
: > 20000.
3. Nivel de signicaci on y cuantil que marca la zona de
rechazo de la hip otesis primaria: = 0,01, z

= z
0,01
=
2,33.
4. Estadstico de contraste: z =
x
0
/

n
=
20758 20000
1500/

16
=
2,02.
5. Como z = 2,02 < 2,33 = z
0,01
, en base a los datos
contenidos en esta muestra, no se puede rechazar la
hip otesis primaria y por tanto se recomienda continuar
la producci on tal y como se venia haciendo hasta ahora.
2
Problema 7.6 Una empresa de telefona m ovil realiza una en-
cuesta entre 470 personas para determinar si la opini on de las
personas respecto a la instalaci on de una antena, depende de
la distancia entre su lugar de residencia y la ubicaci on de la
antena. Para ello se clasic o a los encuestados en tres zonas
(zona 1, zona 2, zona 3) siendo la zona 1 la m as pr oxima y la
zona 3 la m as alejada del lugar donde se piensa instalar la
antena. La informaci on obtenida es
142 J. L. DazBarrero
Opini on zona 1 zona 2 zona 3 Total
A favor 40 55 60 155
En contra 85 70 50 205
Indecisos 30 40 40 110
Total 155 165 150 470
1. Contrastar la independencia entre la opini on acerca de la
antena y la distancia a la misma ( = 0,05).
2. Comentar la discrepancia entre las frecuencias observa-
das y esperadas para la zona 1.
Soluci on. 1) Las frecuencias esperadas son
Opini on zona 1 zona 2 zona 3 Total
A favor 51.12 54.51 49.47 155
En contra 67.61 71.97 65.43 205
Indecisos 36.28 38.62 35.11 110
Total 155 165 150 470
Entonces
2
= 14,448 y
2
0,05,4
= 9,49. Por tanto, RH
0
.
(2) Para la zona 1, el rechazo es mayor que el que sera de
esperar si las caractersticas fueran independientes. 2

Vous aimerez peut-être aussi