Vous êtes sur la page 1sur 240

Problemas resueltos

de estadística
SERGIO ZUBELZU AINHOA ERCORECA
PROFESOR ASOCIADO. UNIVERSIDAD COMPLUTENSE DE MADRID PROFESORA ASOCIADA DE ESTADÍSTICA EN LA UNIVERSIDAD
Y UNIVERSIDAD ANTONIO DE NEBRIJA ANTONIO DE NEBRIJA Y EN EL DEPARTAMENTO DE ESTADÍSTICA
DE LA UNIVERSIDAD CARLOS III DE MADRID

Problemas resueltos
de estadística

EDICIONES PIRÁMIDE
COLECCIÓN «ECONOMÍA Y EMPRESA»

Director:
Miguel Santesmases Mestre
Catedrático de la Universidad de Alcalá

Edición en versión digital

Está prohibida la reproducción total o parcial


de este libro electrónico, su transmisión, su
descarga, su descompilación, su tratamiento
informático, su almacenamiento o introduc-
ción en cualquier sistema de repositorio y
recuperación, en cualquier forma o por cual-
quier medio, ya sea electrónico, mecánico,
conocido o por inventar, sin el permiso expre-
so escrito de los titulares del copyright.

© Sergio Zubelzu y Ainhoa Ercoreca, 2015


© Segunda edición electrónica publicada por Ediciones Pirámide (Grupo Anaya, S. A.), 2015
Para cualquier información pueden dirigirse a piramide_legal@anaya.es
Juan Ignacio Luca de Tena, 15. 28027 Madrid
Teléfono: 91 393 89 89
www.edicionespiramide.es
ISBN digital: 978-84-368-3376-8
Índice

Prólogo ............................................................................................................... 9

1. Resumen de conceptos estadísticos ..................................................... 11


1.1. Estadística descriptiva univariante ......................................................... 12
1.2. Estadística descriptiva bivariante ........................................................... 18
1.3. Probabilidad ........................................................................................... 20
1.4. Variable aleatoria discreta ...................................................................... 22
1.5. Variable aleatoria continua ..................................................................... 28
1.6. Distribución de estadísticos en el muestreo ........................................... 35
1.7. Estimación puntual ................................................................................. 37
1.8. Intervalos de confianza ........................................................................... 39
1.9. Contrastes de hipótesis paramétricos ..................................................... 43
1.10. Contrastes de hipótesis no paramétricos ................................................ 48

2. Preguntas cortas y test .............................................................................. 51


2.1. Introducción .............................................................................................. 52
2.2. Preguntas cortas ........................................................................................ 52
2.3. Preguntas tipo test .................................................................................... 65

3. Cuestiones y problemas teóricos ........................................................... 89


3.1. Introducción .............................................................................................. 90
3.2. Cuestiones y problemas teóricos............................................................... 90

4. Ejercicios de aplicación ............................................................................. 119


4.1. Introducción .............................................................................................. 120
4.2. Ejercicios de aplicación ............................................................................ 120

© Ediciones Pirámide 7
Prólogo

Nuestros alumnos suelen quejarse amargamente de que en clase no resolve-


mos problemas similares a los que luego preguntamos en los exámenes. Llevan
razón, en la afirmación, aunque no en basar su queja en ello, solo faltaba. En
realidad creemos que nuestra obligación no es enseñar al alumno a resolver ejer-
cicios, y menos similares a aquellos respecto de los que luego les evaluaremos.
Entendemos que nuestra obligación es motivar su pensamiento reflexivo, su ca-
pacidad de síntesis, entrenarles en la tarea de enfrentarse a problemas, acostum-
brarles a buscar soluciones… Creemos que esto es la tan manida, y distorsionada,
adquisición de competencias. Hace poco alguien en una reunión de docentes dijo
algo parecido a lo siguiente: «… al alumno hay que enseñarle A y B y exigirle
que sea capaz de resolver C como consecuencia de operar con A y B, pero no
enseñarle C directamente…». Claro, lo contrario no es preparar al alumno, sino
darle una receta para superar un examen.
En fin, en este libro hemos querido expresar y explicar nuestras propias C que
hemos venido pidiendo en diferentes exámenes a lo largo de nuestras experien-
cias en la docencia de la estadística. Se trata de problemas, no ejercicios, que
requieren saber un poco de estadística, pero también, especialmente, exigen com-
prender la disciplina, ser capaz de relacionar conceptos, de afrontar situaciones
complejas desde una perspectiva global…
El objetivo de estos ejercicios nunca fue evaluar si el alumno sabía calcular
una probabilidad condicionada o la varianza de un conjunto de datos o la probabi-
lidad vinculada a un modelo binomial, por ejemplo, sino saber sacar conclusiones
vinculadas a un fenómeno en el que aparecen caracteres condicionados, o corregir
un proceso productivo según la dispersión de un conjunto de datos o decidir entre
dos proveedores según la probabilidad de que sus productos sean defectuosos.
Las herramientas que proporciona esta disciplina no deben ser un fin, a menos
que el objetivo sea profundizar en la teoría estadística de forma explícita, sino un

© Ediciones Pirámide 9
Prólogo

medio para estudiar los fenómenos de la realidad y tomar decisiones racionales en


situaciones de incertidumbre.
En cualquiera de los casos, seguiremos evaluando competencias en los térmi-
nos descritos en este prólogo, porque creemos en ello y porque sin duda es la
manera más justa en la que formar a nuestros alumnos. Ello implica que los ejer-
cicios de los exámenes serán situaciones en las que los alumnos habrán de enfren-
tarse a problemas que deberán afrontar desde una perspectiva reflexiva y de aná-
lisis. Esperamos que este libro ayude a formar esta capacidad de análisis y para
ello hemos escrito las explicaciones y los razonamientos que permiten resolver
cada uno de los problemas. Las cuestiones y los problemas no solo están resuel-
tos, sino también explicados para ayudar al alumno a formarse esa capacidad de
razonamiento y para acostumbrarse a proponer soluciones analíticas para resolver
problemas desde el punto de vista estadístico.
El lector encontrará diferentes cuestiones, tanto preguntas cortas y tipo test
como cuestiones teóricas para desarrollar y demostrar, como problemas comple-
jos que abarcan diferentes conceptos estadísticos. Hemos tratado de abarcar la
mayor parte de las opciones que venimos utilizando en diferentes exámenes y
esperamos que ello proporcione una perspectiva global de las distintas opciones
antes las que se puede enfrentar en una evaluación.
Esperamos también que este libro ayude a que el lector disfrute y perciba el in-
terés real de unas disciplinas tan interesantes como la estadística y la probabilidad.

LOS AUTORES

10 © Ediciones Pirámide
1 Resumen de conceptos estadísticos

CONTENIDO

1.1. Estadística descriptiva univariante.


1.2. Estadística descriptiva bivariante.
1.3. Probabilidad.
1.4. Variable aleatoria discreta.
1.5. Variable aleatoria continua.
1.6. Distribución de estadísticos en el muestreo.
1.7. Estimación puntual.
1.8. Intervalos de confianza.
1.9. Contrastes de hipótesis paramétricos.
1.10. Contrastes de hipótesis no paramétricos.

CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá dis-
poner de los siguientes conocimientos previos:

 Conocimientos básicos de cálculo matemático.


 Álgebra de sucesos y probabilidad.
 Derivación e integración con una y varias variables.

OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:

 Conocer los fundamentos básicos de la estadística y el tratamiento de


datos.
 Manejar sucesos y calcular probabilidades.
 Caracterizar y estudiar variables aleatorias.
 Calcular y operar con estadísticos y estimadores.
 Manejar las técnicas de inferencia paramétrica y no paramétrica.

© Ediciones Pirámide 11
Problemas resueltos de estadística

1.1. ESTADÍSTICA DESCRIPTIVA UNIVARIANTE

Se denomina estadística descriptiva al conjunto de técnicas encaminadas al


tratamiento de datos de forma que las conclusiones procedentes de su estudio no
pueden extrapolarse más allá del conjunto de datos analizados.
La estadística descriptiva univariante se encarga del estudio de un único ca-
rácter en un conjunto de datos. Proporciona técnicas que permiten tanto el trata-
miento de los datos (distribuciones de frecuencias, características de posición
central, posición no central dispersión, asimetría y forma) como su representación
(técnicas de representación gráfica).

1.1.1. Distribución de frecuencias

La distribución de frecuencias permite agrupar un conjunto de datos represen-


tando las frecuencias absolutas y relativas con las que se presentan cada uno de
los resultados obtenidos en la toma de datos. El proceso de construcción de la
distribución de frecuencias requiere representar una tabla en la que se incluyan
tanto los resultados obtenidos en el experimento (x1, x2,…xa) como las frecuen-
cias en las que cada uno de ellos aparece.

na: número de repeticiones del resultado a

N a   i 1 ni
X n N f F i a

x1 n1 N1 f1 F1
x2 n2 N2 f2 F2

i n
f a  na i 1
ni
    
xa na Na fa Fa
Fa   i 1 f i
i a

Si los resultados del experimento son continuos, basta con agrupar en interva-
los y trabajar con el centro del intervalo (marca de clase).

12 © Ediciones Pirámide
Resumen de conceptos estadísticos

1.1.2. Características de posición central

Se trata de números que proporcionan información acerca del centro del con-
junto de datos. Esta característica, que genéricamente se ha denominado centro,
adopta distinta forma según el indicador del que se trate.

1. Media aritmética: centro geométrico de la distribución de frecuencias:

x

1
i n
n

i n
i 1 
xi ni  fi  ni 
i n
i 1 
ni   i 1 xi fi
i n

i 1 i

2. Media geométrica: orientada al cálculo de tasas de variación medias:

 i1 ni
i n

 
i n 1
g i 1
ni
x
i

3. Mediana: resultado que divide la distribución de frecuencias en dos con-


juntos con la misma frecuencia acumulada:


 
i  j 1
i 1
ni   i 1 ni 2
i n
 
Me  x j / 
  i1 i ni   ni 2  
i n
i n in

 i  j 1 i 1

4. Moda: resultado con mayor frecuencia absoluta o relativa:

Mo  x j / n j  máx.

1.1.3. Características de posición no central

Aportan información acerca de determinadas características de la distribución


no necesariamente relacionadas con su posición central.

© Ediciones Pirámide 13
Problemas resueltos de estadística

1. Momentos centrados respecto del origen:

ar 

1
i n
n

i n
i 1 
xir ni  fi  ni 
i n
i 1 
ni   i 1 xir fi
i n

i 1 i

2. Momentos centrados respecto de la media:

r 

1
i n
n
 x  x
i n
i 1 i
r

ni  f i  ni 
i n
i 1 
ni   i 1  xi  x  f i
i n r

i 1 i

3. Cuantiles. Cuantil de orden α:

  i 1 ni    i 1 ni
i  j 1 in


x  x j /  ; 0  1
 i  
i n

ni  1    i 1 ni
i i n
n
i 1 i  
 j 1

1.1.4. Características de dispersión


Informan acerca de la dispersión de los datos en torno a las características de
posición central.

1. Varianza: suma de las desviaciones cuadráticas de los valores respecto de


la media:

1  1 
 x  x  ni   i  n  xi2 ni    x 
in in
2 
2 2

   ni
i n
ni
i 1 i i 1

i 1  i 1 

2. Desviación típica: raíz cuadrada de la varianza:

  2

3. Coeficiente de variación: medida de la dispersión en términos relativos:

CV   x

14 © Ediciones Pirámide
Resumen de conceptos estadísticos

4. Rango: diferencia entre valores máximo y mínimo:

R  xMax.  xmin.

5. Recorrido intercuartílico: amplitud del 50 % central:

RI  Q3  Q1

1.1.5. Asimetría

Los indicadores de asimetría proporcionan información acerca de la posición


de los resultados extremos de la distribución de frecuencias. Hay varias formas de
comprobar el tipo de asimetría de la distribución:

1. Comparación media y mediana:

x  Me  Asimetría positiva (derecha)


x  Me  Simétrica
x  Me  Asimetría negativa (izquierda)

2. Coeficiente de asimetría de Pearson:

 0  Asimetría negativa
x  Mo 
AS P     0  Simétrica
   0  Asimetría positiva

3. Coeficiente de asimetría de Fisher:

 0  Asimetría negativa
 
AS F  33    0  Simétrica
   0  Asimetría positiva

© Ediciones Pirámide 15
Problemas resueltos de estadística

1.1.6. Curtosis

La curtosis informa acerca de la concentración de los datos en torno a las me-


didas de posición central en relación a los datos de los extremos de la distribu-
ción.

1. Coeficiente de curtosis de Fisher:

 0  Leptocúrtica
 
C F  44  3    0  Mesocúrtica
 
  0  Platicúrtica

1.1.7. Técnicas de representación gráfica

Existen diferentes tipos de gráficos para representar las distribuciones de fre-


cuencias con diferentes aplicaciones según la naturaleza de los datos a represen-
tar.

1. Histogramas de frecuencias: datos cuantitativos o cualitativos ordinales:

Caracteres cuantitativos discretos

16 © Ediciones Pirámide
Resumen de conceptos estadísticos

Caracteres cuantitativos continuos (intervalos), cualitativos ordinales

2. Diagramas de sectores: datos cualitativos nominales:

Datos cualitativos nominales

3. Diagramas de caja: datos cuantitativos o cualitativos ordinales. Si no


existen datos atípicos, en el lugar de bigotes se representarán los valores
máximo y mínimo:

© Ediciones Pirámide 17
Problemas resueltos de estadística

Datos cualitativos nominales

1.2. ESTADÍSTICA DESCRIPTIVA BIVARIANTE

En este apartado se estudian de forma conjunta dos caracteres en una pobla-


ción con un esquema similar al de la estadística descriptiva univariante, pero ha-
ciendo especial hincapié en las relaciones entre los caracteres. En los puntos si-
guientes se analizan las distribuciones de frecuencia de dos caracteres, así como
las medidas de relación entre los dos caracteres y las expresiones de regresión.

1.2.1. Distribución de frecuencias

Se trata de agrupar los resultados en una tabla de frecuencias con entradas tan-
to por filas como por columnas. El significado de las frecuencias absolutas y rela-
tivas es equivalente al referido en la estadística descriptiva univariante.

X\Y y1 y2 … ym X
x1 n11/f11 n12/f12 … n1m/ f1m n1·/ f1·
x2 n21/f21 n22/f22 … n2m/ f2m n2·/f2·
     
xn nn1/fn1 nn2/fn2 … nnm/fnm nn·/f1·

 
i n j m
Y n·1/f·1 n·2/f·2 … n·m/ f·m i 1 j1
nij /1

18 © Ediciones Pirámide
Resumen de conceptos estadísticos

Los caracteres X e Y son independientes si se cumple alguna de las siguientes


igualdades:

nij  ni·  n· j
fij  fi·  f· j

Las distribuciones de la columna derecha y última fila representan las distri-


buciones marginales de los caracteres X e Y, mientras que cualquier fila o colum-
na independizada de la tabla hará referencia a la distribución del carácter condi-
cionado que correspondiese. Sirva como ejemplo la siguiente:

Y y1 y2 … ym X
Y/X=x2 n21/f21 n22/f22 … n2m/ f2m n2·/f2·

1.2.2. Medidas de relación entre los caracteres

Permiten analizar la naturaleza y la intensidad de la relación lineal existente


entre dos caracteres:

1. Covarianza: definida en términos absolutos, informa acerca del tipo de


relación que existe entre dos caracteres, de forma que valores positivos
indican relaciones directas, negativos, indirectas, e iguales a cero, la au-
sencia de relación lineal:

 
 
1
cov xy   xy  a11   a10 a01     
in j m
xi y j nij   x y
  in n i 1 j 1

 i 1 i 

2. Coeficiente de correlación lineal: definido en términos relativos, informa


acerca del tipo y la intensidad de relación lineal que existe entre dos ca-
racteres, de forma que valores positivos indican relaciones directas, nega-
tivos indirectas e iguales a cero, la ausencia de relación lineal:

 xy   xy  x y  1   xy  1

© Ediciones Pirámide 19
Problemas resueltos de estadística

1.2.3. Regresión lineal simple


Técnica que permite encontrar la mejor relación funcional lineal posible entre
dos caracteres para explicar una variable dependiente (Y) a partir de una indepen-
diente (X):

Y  0  1 X  1   xy  x2 ; 0  y  1 x

La bondad se mide con el coeficiente de determinación (R2) que representa la


fracción de la varianza de la variable dependiente (Y) explicada a través de la
regresión:

R 2   xy2

1.3. PROBABILIDAD

La definición axiomática de la probabilidad propuesta por Kolmogorov exige


el cumplimiento de los tres siguientes axiomas para cualesquiera dos sucesos A y
B y el espacio muestral E:

P  A  0

PE  1

P  A  B   P  A  P  B  A, B incompatibles

De los citados axiomas se derivan las siguientes propiedades:

P  A  1  P  A

P    0

P  A  B   P  A  P  B   P  A  B 

A  B  P  A  P  B 

20 © Ediciones Pirámide
Resumen de conceptos estadísticos

1.3.1. Probabilidad condicionada


El acaecimiento de un determinado suceso B afecta a la probabilidad de otro
suceso A:

P  A B  P  A  B P  B

Dos sucesos A y B son independientes si la probabilidad de ocurrencia de uno


de ellos no afecta a la probabilidad del otro, de forma que puede escribirse lo
siguiente:

P  A B   P  A
  P  A  B   P  A P  B 
P  B A  P  B 

1.3.2. Teorema de la probabilidad total


Sea un conjunto de sucesos completos Ai y un suceso B con intersección no
nula con alguno de los anteriores. La probabilidad total de ocurrencia del suceso
B puede calcularse como sigue:

P  B    i 1 P  Ai  B    i 1 P  B Ai  P  Ai 
i n i n

1.3.3. Teorema de Bayes


Sea un conjunto de sucesos completos Ai y un suceso B con intersección no
nula con alguno de los anteriores. La probabilidad a posteriori de cada suceso Ai
condicionada a la ocurrencia del suceso B puede calcularse a partir de la siguiente
expresión:

P  Ai B   P  Ai  B  P  B   P  Ai  B   P  Ai  B  
in
i 1

 P  B Ai  P  Ai   P  B Ai  P  Ai 
in
i 1

© Ediciones Pirámide 21
Problemas resueltos de estadística

1.4. VARIABLE ALEATORIA DISCRETA


Una variable aleatoria puede definirse como una aplicación lineal de los resul-
tados de un experimento aleatorio sobre la recta real. Será discreta si su dominio
de definición (conjunto imagen) está compuesto por un número finito o infinito
numerable de posibles resultados.

1.4.1. Distribución de probabilidad variable aleatoria


unidimensional
Queda definida por las funciones de distribución y de cuantía o masa:

1. Función de distribución: permite calcular probabilidades acumuladas


hasta el punto en el que queda definida. En variables aleatorias discretas
es discontinua por la izquierda:

0  F  x   1
 F     0; F     1

F  a   P  X  a   P  , a   x2  x1  F  x2   F  x1 

 F  xi   F  xi   F  xi   F  xi   P  X  xi 
 


 F  xi   F  xi 

2. Función de cuantía: permite calcular probabilidades vinculadas a resulta-


dos concretos:

0  P  X  xi   1
 i n

f  xi   P  X  xi   pi  i 1 P  X  xi   1

F  a   i 1 P  X  xi 
i a

3. Momentos

i. Momento de orden r centrado respecto del origen:

ar  i 1 xir P X  xi 
i n

22 © Ediciones Pirámide
Resumen de conceptos estadísticos

El momento centrado respecto del origen de orden uno es la es-


peranza matemática:

a1  E  X   i 1 xi P X  xi 
i n

ii. Momento de orden r centrado respecto de la esperanza matemática:

r  i 1  xi  E  X  P X  xi 
i n r

El momento centrado respecto de la esperanza matemática de


orden dos es la varianza:

2   2  i 1  xi  E  X  P X  xi 
i n 2

iii. Función generatriz de momentos:

 d r x  t  
 x  t   E  e itX    i 1 xi e itx  
in
  i ar
i r
r
 dt  t 0

1.4.2. Distribución de probabilidad variable aleatoria


bidimensional discreta
En términos similares a los empleados para la distribución de probabilidad de
variables aleatorias unidimensionales pero incorporando la segunda variable:

1. Funciones de cuantía y distribución:

P  X  xi ; Y  y j   pij

i  a j b
F  a;b   P  X  a; Y  b    P  X  xi ; Y  y j 
i 1 j 1

© Ediciones Pirámide 23
Problemas resueltos de estadística

2. Momentos:

i. Momentos centrados respecto del origen de órdenes r y s:

ars  E  X rY s 

ii. Momentos centrados respecto de las esperanzas matemáticas de órdenes


r y s:

 rs  E   X  E  X  Y  E Y  
r s

 

El momento centrado respecto de las esperanzas matemáticas de órdenes uno


y uno es la covarianza:

11  E  X  E  X  Y  E Y    a11   a10 a01 

3. Vectores de esperanzas matemáticas y matriz de varianzas y covarianzas:

 X    E  X 1  
E V   E  1     
 X 2    E  X 2  

  x21 x x 
W  2 1

 x x  x2 
 12 2

4. Variable aleatoria condicional: variable aleatoria unidimensional por fi-


jarse una de las dos variables originales:

f  xi ; y j  P  X  xi ;Y  y j 
f  X Y  yj   
f  yj  P Y  y j 

24 © Ediciones Pirámide
Resumen de conceptos estadísticos

1.4.3. Modelos de probabilidad para variables


aleatorias discretas
Permiten estudiar fenómenos concretos que reúnen una serie de característi-
cas. Para cada uno de los modelos siguientes se expondrá el tipo de experimentos
que permiten estudiar su dominio de definición, sus funciones de cuantía y, si
hubiese lugar, la distribución y los momentos más relevantes.

1. Distribución Bernoulli: permite estudiar un fenómeno dicotómico.

i. Dominio de definición.

Dx  0,1

ii. Función de cuantía.

P  X  xi   p xi 1  p 
1 xi

iii. Función característica.

 x  t   1  p   peit 

iv. Esperanza matemática.

E X   p

v. Varianza.

V  X   p 1  p 

© Ediciones Pirámide 25
Problemas resueltos de estadística

2. Distribución binomial: permite estudiar un fenómeno dictómico cuando el


experimento se repite n veces.

i. Dominio de definición.

Dx  0,1, 2,3,..., n

ii. Función de cuantía.

n!
P  X  xi   p xi 1  p  i
n x

xi ! n  xi !

iii. Función característica.

x  t   1  p   peit 
n

iv. Esperanza matemática.

E  X   np

v. Varianza.

V  X   np 1  p 

3. Distribución Poisson: experimentos cuyos resultados son discretos pero


vinculados a un medio continuo.

i. Dominio de definición.

Dx  0,1,2,3,..., 

26 © Ediciones Pirámide
Resumen de conceptos estadísticos

ii. Función de cuantía.

e   xi
P  X  xi  
xi !

iii. Función característica.

 x  t   e  ee
it

iv. Esperanza matemática.

E X   

v. Varianza.

VX  

4. Distribución uniforme: experimentos discretos en los que cualquier resul-


tado tiene la misma probabilidad de ocurrir.

i. Dominio de definición.

Dx  1,..., N 

ii. Función de cuantía.

1
P  X  xi  
N

iii. Función característica.

eit  eitN  1
x  t  
N  eit  1

© Ediciones Pirámide 27
Problemas resueltos de estadística

iv. Esperanza matemática.

N
E X  
2

v. Varianza.

N 2 1
V X  
12

1.5. VARIABLE ALEATORIA CONTINUA


La variable aleatoria continua queda definida por una aplicación cuyo conjun-
to imagen está formado con una cantidad infinita no numerable de resultados
posible.

1.5.1. Distribución de probabilidad variable aleatoria


unidimensional

Queda definida por las funciones de distribución y de densidad. La función de


distribución es continua en todo caso (tanto por su derecha como por su izquier-
da), lo que implica la siguiente igualdad:

F  x   F  x   F  x   F  x   0

Esta característica hace que carezca de sentido el estudio de probabilidades


vinculadas a resultados individuales. De esta forma la función de distribución
queda definida a partir de la función de densidad:

dF ( x )
 f ( x)
dx

28 © Ediciones Pirámide
Resumen de conceptos estadísticos

Siendo las propiedades más relevantes de ambas funciones las siguientes:

0  F  x ; f  x  1

F     0; F     1

x2  x1  F  x2   F  x1 

F  x   F  x   F  x 

 f  x  dx  1


1. Momentos

i. Momento de orden r centrado respecto del origen:



ar   xr f  x  dx


El momento centrado respecto del origen de orden uno es la esperanza


matemática y adopta la forma siguiente:

a1  E  X    xf  x  dx


ii. Momento centrado respecto de la esperanza matemática:

 x  E  X  f  x dx

r  
r



El momento centrado respecto de la esperanza matemática de orden dos es la


varianza:

 x  E  X  f  x dx

2   2  
2



2. Función generatriz de momentos:

  d r x  t  
 x  t   E  e itX
   xe dx   itx
r   i ar
r

 dt  t 0

© Ediciones Pirámide 29
Problemas resueltos de estadística

1.5.2. Distribución de probabilidad variable aleatoria


bidimensional
De forma equivalente a la variable aleatoria bidimensional discreta, pero con
las particularidades derivadas de la continuidad de la función de distribución.

1. Funciones de cuantía y distribución:

F  x; y    f  x; y  dxdy

La formulación teórica de los momentos, vector de esperanzas matemáticas,


matriz de varianzas y covarianzas y variables condicionadas no difiere de la ex-
puesta en el presente trabajo para las variables aleatorias discretas. El desarrollo
de los conceptos expuestos sí estaría no obstante sujeto a las particularidades
derivadas de la continuidad.

1.5.3. Modelos de probabilidad para variables


aleatorias continuas

Con el mismo concepto que los modelos de probabilidad para variables aleato-
rias discretas, pero aplicados a variables aleatorias continuas.

1. Distribución uniforme continua: experimentos discretos en los que cual-


quier resultado tiene la misma probabilidad de ocurrir, siendo la variable
aleatoria continua

i. Dominio de definición.

Dx  a,..., b

ii. Función de densidad.

1
f  x 
ba

30 © Ediciones Pirámide
Resumen de conceptos estadísticos

iii. Función característica.

eitb  eita
x t  
it  b  a 

iv. Esperanza matemática.

ab
E X  
2

v. Varianza.

b  a 
2

V X  
12

2. Distribución exponencial: permite estudiar el medio continuo que trans-


curre hasta obtener el primer suceso en el contexto de un modelo Poisson.

i. Dominio de definición.

Dx  0,1,2..., 

ii. Función de densidad.

f  x    e  x

iii. Función de distribución.

x
F  x    f  x  dx 1  e   x
0

iv. Función característica.


 x t  
  it

© Ediciones Pirámide 31
Problemas resueltos de estadística

v. Esperanza matemática.

1
EX  

vi. Varianza.

1
V X 
2
3. Distribución normal.

i. Dominio de definición.

Dx  , ..., 

ii. Función de densidad.


 x   
2

f  x    2 
1 2
 
2 1 2
e 2 2

iii. Función característica.


 t 2 2
 x  t   e it  e 2

iv. Esperanza matemática.

E X   

v. Varianza.

V X   2

4. Distribución normal tipificada. Resultado de tipificar una variable aleato-


ria normal.

i. Dominio de definición.

Dx  , ..., 

32 © Ediciones Pirámide
Resumen de conceptos estadísticos

ii. Función de densidad.


 z2
f  z    2 
1 2
2
e

iii. Función característica.

 z t   et
2
2

iv. Esperanza matemática.

E X   0

v. Varianza.

V  X  1

5. Distribución chi cuadrado.


i n
X   Zi2 Zi  Z  0;1
i 1

i. Dominio de definición.

Dx  0,1,2..., 

ii. Esperanza matemática.

E X   n

iii. Varianza.

V  X   2n

6. Distribución t-Student.

Z  Z  Z  0;1
T  2
     n 
2
2 n

© Ediciones Pirámide 33
Problemas resueltos de estadística

i. Dominio de definición.

DT  ,..., 

ii. Esperanza matemática.

E T   0

iii. Varianza.

n
V T   n  2
n2

7. Distribución F-Snedecor.

F
   n n
2

   m m
2

i. Dominio de definición.

DF  0,1,2..., 

ii. Esperanza matemática.

m
EF  
m2

iii. Varianza.

2m2 (m  n  2)
V F  
n(m 2)2 (m 4)

34 © Ediciones Pirámide
Resumen de conceptos estadísticos

1.5.4. Desigualdad de Chebychev


Expresión que muestra que la probabilidad de que la diferencia en valor abso-
luto entre una variable aleatoria y su media supere una determinada cantidad k es
mayor o igual que la complementaria del cociente entre su varianza y la referida
cantidad:

2 1
P[| X   | k ]  1  2
 P[| X   | k ]  1 
k k2

1.5.5. Teorema central del límite

Proporciona una solución para el estudio de sucesiones de variables aleatorias


independientes gracias a las convergencias en probabilidad, y puede formularse
de la forma siguiente:

Y   i 1 X i   N   i 1 i ;  i 1  i2 
i n n  in i n

 
X i  f  xi  ; E  X i   i ;V  X i    i2

1.6. DISTRIBUCIÓN DE ESTADÍSTICOS EN EL MUESTREO


El proceso de inferencia paramétrica requiere definir estadísticos (funciones
matemáticas) a partir de los que estimar los parámetros.

1.6.1. Estadísticos para el muestreo de poblaciones


normales

1. Estadísticos para el muestreo de una población normal

x 
 Z  0;1
 n 

© Ediciones Pirámide 35
Problemas resueltos de estadística

x  x 
  t n 1
s n 1 n  s n n 1 
 x  
in
nV
2
i 1
   (2n )
i

 2
 2

  x  x
i n 2

i 1 i

nsn2

 n  1 sn21   2
 n 1
2 2 2

2. Estadísticos para el muestreo de dos poblaciones normales

 x1  x2    1  2   Z
 0,1
12 n1    22 n2 

 x1  x2    1  2  
 t n1  n2  2
1 1 n1sn1  n2 sn2
2 2


n1 n2 n1  n2  2

 x1  x2    1  2   t n1  n2  2
1  n1  1 sn 1   n2  1 sn 1
2 2
1
 1 2

n1 n2 n1  n2  2

 x  1 
i n 2
i 1 1i

n1 12 V1 22
  F n1 ;n2 
 x  2  V2 12
i n 2
i 1 2i

n2 22

 n1  1 Sn2 1  n1Sn21 
 2 
1

 n1  112 Sn21 1 22   n1  1  1 


 2   F n1 1;n2 1
 n2  1 Sn2 1 Sn2 1 12  n2 Sn22 
 2 
2

 n2  1 22   n2  1  2 

36 © Ediciones Pirámide
Resumen de conceptos estadísticos

1.6.2. Estadísticos para el muestreo de proporciones

fn  p
 Z  0;1
p 1  p  n

f n1 
 f n2   p1  p2 
 Z  0;1
p1 1  p1  p2 1  p2 

n1 n2

1.7. ESTIMACIÓN PUNTUAL


En el presente capítulo se exponen las técnicas para obtener estimadores así
como las principales propiedades mediante las que evaluar estos estimadores. Un
estimador es una función matemática que depende únicamente de las mediciones
de la muestra y no del parámetro respecto del que se desea inferir.

1.7.1. Procedimientos para la obtención


de estimadores
1. Método de la máxima verosimilitud

Se deduce el estimador que hace máxima la función de verosimilitud de la


muestra. La función de verosimilitud es una medida de la probabilidad conjunta
de cada uno de los individuos de la muestra y se formula como el producto de las
probabilidades de cada una de las observaciones:

L  x1 , x2 ,..., xn ;    i 1 f  xi ; 
in

El valor para el parámetro que hace máxima esa función es el estimador de


máxima verosimilitud. Se deduce comprobando las dos condiciones exigidas para
deducir el máximo de una función:

© Ediciones Pirámide 37
Problemas resueltos de estadística

 dL  x , x ,..., x ; mv 
 1 2 n
0
 d
 mv 
 d 2 L  x1 , x2 ,..., xn ; mv 
 0
 d 2

2. Método de los momentos

Se deducen los estimadores de los parámetros de la igualdad entre momentos


poblacionales y muestrales:


 m   ar muestra  E  X r   población

1.7.2. Propiedades de los estimadores


1. Propiedades basadas en el error cuadrático medio:

ECM    E    2   V     B  


2

i. Insesgadez: un estimador es insesgado (sesgo nulo) si su esperanza ma-


temática coincide con el parámetro a estimar:

B    0  E    

ii. Varianza mínima: puede demostrarse la que la varianza de cualquier es-


timador es igual o superior a la cota de Cramer-Rao con lo que la varian-
za mínima será la que es igual a dicha cota:

2
 dB   
 1   

V    VCR   d 
 dLn  f  X ;    2 
nE    
 d  

38 © Ediciones Pirámide
Resumen de conceptos estadísticos

2. Consistencia: un estimador será consistente si cumple las dos condicio-


nes siguientes. Se trata de condiciones suficientes aunque no necesarias:

lim E      lim B    0


n    n   

lim V    0
n   

3. Suficiencia: un estimador es suficiente si utiliza toda la información con-


tenida en la muestra de manera que la función de probabilidad de la
muestra condicionada a que el estimador adopte un determinado valor no
depende del parámetro. Para comprobar si un estimador es suficiente,
basta con comprobar si la función de verosimilitud puede expresarse co-
mo producto de las dos funciones siguientes (teorema de factorización de
Fisher-Neyman):

 
L  X ;   g   x1 , x2 ,...xn  ; h  x1 , x2 ,...xn 

1.8. INTERVALOS DE CONFIANZA


Un intervalo de confianza es un intervalo dentro del que con una determinada
probabilidad (nivel de confianza) se encontrará el parámetro, dejando fuera del
intervalo una probabilidad igual al nivel de significación.

En lo sucesivo se entenderán definidos los cuantiles de las distribuciones con


arreglo a la siguiente nomenclatura:

P  Z  Z1   1   P   (2n )  2   


P  Z  Z    P   (2n )  12   1  
P  Z  Z1 2    1    2  P   (2n )   2 2     2 
 
P   (2n )  12 2    1   2 

© Ediciones Pirámide 39
Problemas resueltos de estadística

P  F( n1 1;n2 1)  F 2     2 

P  F( n1 1;n2 1)  F1 2   1   2  P t n 1  t1   1  

P  F( n1 1;n2 1)  F    P t n 1  t   

P  F( n1 1;n2 1)  F1   1   P t n 1  t1    1    2 


 2 

1.8.1. Intervalos de confianza para poblaciones


normales
Se asume que el modelo de distribución del carácter en la población, y por
tanto en cada una de las observaciones de la muestra, es un modelo normal:

X  N   ;   xi  N   ; 

1. Intervalos de confianza para una población

i. Intervalo de confianza para la media de la población conocida la varian-


za poblacional:


IC   ;   x  Z1  2  n 
ii. Intervalo de confianza para la media poblacional desconocida la varian-
za poblacional:


IC   ;   x  t1 2  sn 1  n   x  t 1  2  s n n 1 
iii. Intervalo de confianza para la varianza poblacional conocida la media
poblacional:

  i  n  xi   2  i  n  xi   2   nV nV 
IC  ;    i 1 2  ; 2 
; i 1 2  2
2

 1 2  2   1 2  2 

40 © Ediciones Pirámide
Resumen de conceptos estadísticos

iv. Intervalo de confianza para la varianza poblacional desconocida la me-


dia poblacional:

 ns 2 ns 2    n  1 s  n  1 sn21 
2

IC  2 ;    2 n ; 2 n    2 n 1 ; 
  
 1 2  2   1 2
2 2 

2. Intervalos de confianza para dos poblaciones

i. Intervalo de confianza para diferencia entre la media de dos poblaciones


conocidas las varianzas poblacionales:


IC  1  2 ;    x1  x2   Z1 2  2
1 n1    22 n2  
ii. Intervalo de confianza para diferencia entre la media de dos poblaciones
desconocidas las varianzas poblacionales:

 1 1 n1sn21  n2 sn22 
IC  1  2 ;    x1  x2   t   

1 n1 n2 n1  n2  2 
2

 1 1  n1  1 sn2 1   n2  1 sn2 1 
IC  1  2 ;    x1  x2   t   1 2


1 n1 n2 n1  n2  2
2


iii. Intervalo de confianza para el cociente entre las varianzas poblacionales


conocidas las medias poblacionales:

 n n2  i 1  x1i  1  
2  i 1  x1i  1 
in 2 in 2

IC  2
 ;   
2
; 2 

 n1 F1 2  i 1  x2i   2  n1 F 2  i 1  x2i  2  
1 2 in 2 in

 V V 
 1
; 1 
 
V2 F1 2  V2 F 2 

© Ediciones Pirámide 41
Problemas resueltos de estadística

iv. Intervalo de confianza para el cociente entre las varianzas poblacionales


desconocidas las medias poblacionales:

 sn2 1 sn2 1 
IC  12  22 ;    2 1 ; 2 1 
 sn2 1 F1 2  sn2 1 F 2 

 n1  n2  1 sn2 n1  n2  1 sn21 
IC  12  22 ;    1
; 
 n2  n1  1 sn2 F1 2 n2  n1  1 sn2 F 2 
2 2

1.8.2. Intervalos de confianza para proporciones

Se asume que el modelo de distribución del carácter en la población, y por


tanto en cada una de las observaciones de la muestra, es un modelo Bernoulli:

X   1; p   xi   1; p 

1. Intervalo de confianza para una población:

 f n 1  f n  
IC  p;    f n  Z1 2 
 n 

2. Intervalo de confianza para dos poblaciones:


 
f n1 1  f n1   f 1  f  
 
IC  p1  p2 ;    f n1  f n2  Z 
1 n1
n2

n2
n2

 2 

1.8.3. Intervalos de confianza para cualquier


distribución
Siempre que pueda aceptarse la distribución (asintótica al menos) normal del
estimador de máxima verosimilitud:

42 © Ediciones Pirámide
Resumen de conceptos estadísticos


IC  ;    mv  Z1 2 V  mv 
  
1.9. CONTRASTES DE HIPÓTESIS PARAMÉTRICOS
Un contraste de hipótesis es una situación ante la que debe optarse por una de
entre dos hipótesis estadísticas con un determinado nivel de significación. Su
solución exige definir un estadístico y una región crítica y concluir entre las dos
hipótesis formuladas.

Los contrastes se resuelven planteando dos hipótesis, hipótesis nula, H0, e hi-
pótesis alternativa, H1, definidas ambas de forma que sean completas en términos
algebraicos. La solución al contraste se obtiene manejando las probabilidades
vinculadas a los dos tipos de errores que pueden cometerse:

i. Error de primera especie:

P  RH 0 H 0   

ii. Error de segunda especie:

P  RH1 H1     

1.9.1. Contrastes de hipótesis para poblaciones


normales
Se asume que el modelo de distribución del carácter en la población, y por
tanto en cada una de las observaciones de la muestra, es un modelo normal:

X  N   ;   xi  N   ; 

© Ediciones Pirámide 43
Problemas resueltos de estadística

1. Contrastes de hipótesis para una población

i. Contrastes de hipótesis para la media de la población conocida la va-


rianza poblacional:

 H :     H :     RH  Z  Z
x  ( ) H0  0 0 1 0 0 0 1

Z0    H0 :   0  H1 :   0  RH 0  Z0  Z
 n   
 H0 :   0  H1 :   0  RH 0  Z0  Z1 2

ii. Contrastes de hipótesis para la media poblacional desconocida la va-


rianza poblacional:

 H :     H :     RH  t  t
x  ( )H0 x  ( )H0  0 0 1 0 0 0 1

t0     H 0 :   0  H1 :   0  RH 0  t0  t
S n 1 n  S n 1  
 H 0 :   0  H1 :   0  RH 0  t0  t1 2
n

iii. Contrastes de hipótesis para la varianza poblacional conocida la media


poblacional:





 H 0 :  2   02  H1 :  2   02  RH 0   02  12
 x  
i n
nV 
2

  i 1
   H 0 :  2   02  H1 :  2   02  RH 0   02  2
2 i

( ) H 0 ( 2 ) H 0
0 2

   02   2 2
 
 H 0 :    0  H1 :    0  RH 0   o
2 2 2 2

  2   2
  0 1  2 

iv. Contrastes de hipótesis para la varianza poblacional desconocida la me-


dia poblacional:

44 © Ediciones Pirámide
Resumen de conceptos estadísticos





 H :  2   2  H :  2   2  RH    2    2
 0 0 1 0 0 0 1

nSn2  n  1 Sn21 
 02      H 0 :  2   02  H1 :  2   02  RH 0   02 0  2
( 2 ) H0 ( 2 ) H0 
 2 
   0     2 
 2

 H 0 :  2   02  H1 :  2   02  RH 0   o
  2 
  0   12 2


2. Contrastes de hipótesis para dos poblaciones

i. Contrastes de hipótesis para diferencia entre la media de dos poblacio-


nes conocidas las varianzas poblacionales:
 H 0 : 1   2  H1 : 1   2
  RH 0  Z 0  Z1
 H 0 : 1   2  0  H1 : 1   2  0
 x1  x2    1   2  H  H 0 : 1   2  H1 : 1   2

Z 0  0
  RH 0  Z 0  Z
   H 0 : 1   2  0  H1 : 1   2  0
2 2
1
 2
 H :   H :  
n1 n2
 0 1 2 1 1 2
 RH 0  Z 0  Z1  2 
 H 0 : 1   2  0  H1 : 1   2  0

ii. Contrastes de hipótesis para la diferencia entre la media de dos pobla-


ciones desconocidas las varianzas poblacionales:

 H 0 : 1  2  H1 : 1  2
  RH 0  t0  t1
 H 0 : 1  2  0  H1 : 1  2  0
 x1  x2    1  2  H0  H 0 : 1  2  H1 : 1  2
t0    RH 0  t0  t
1 1 n1sn1  n2 sn2  H 0 : 1  2  0  H1 : 1  2  0
2 2

  H :   H :  
n1 n2 n1  n2  2  0 1 2 1 1 2
 RH 0  t0  t1 2
 H 0 : 1  2  0  H1 : 1  2  0

© Ediciones Pirámide 45
Problemas resueltos de estadística

iii. Contrastes de hipótesis para el cociente entre las varianzas poblaciona-


les conocidas las medias poblacionales:



 H 0 : 12   22  H1 : 12   22
  RH 0  F0  F1
 H 0 :  2 1   1 H1 :  2 1   1
2 2 2 2


V1   22   H 0 : 12   22  H1 : 12   22
F0      RH 0  F0  F
V2  12 H0  H 0 :  2 1   1 H1 :  2 1   1
2 2 2 2


  F0  F 2
 H 0 : 12   22  H1 : 12   22 
  RH 0   o
 H 0 :  2 1   1 H1 :  2 1   1
2 2 2 2
F  F
  0 1 2

iv. Contrastes de hipótesis para el cociente entre las varianzas poblaciona-


les desconocidas las medias poblacionales:

F0 
S n21 1   22 

n1 S n21  n1  1    22 

   
S n22 1   12  H
0
n2 S n22  n2  1    12  H 0



 H 0 :  12   22  H1 :  12   22
  RH 0  F0  F1
 H 0 :  2  1   1 H1 :  2  1   1
2 2 2 2


 H 0 :  12   22  H1 :  12   22
  RH 0  F0  F
 H 0 :  2  1   1 H1 :  2  1   1
2 2 2 2


  F0  F 2
 H 0 :  12   22  H1 :  12   22 
  RH 0   o
 H :   2
 2
  1  H :   2
 2
  1  
 F0  F1 2
0 2 1 1 2 1



46 © Ediciones Pirámide
Resumen de conceptos estadísticos

1.9.2. Contrastes de hipótesis para proporciones


Se asume que el modelo de distribución del carácter en la población, y por
tanto en cada una de las observaciones de la muestra, es un modelo Bernoulli:

X   1; p   xi   1; p 

1. Contrastes de hipótesis para una población:

 H : p  p  H : p  p  RH  Z   Z
f n  po  0 0 1 0 0 0 1

Z 0    H 0 : p  p0  H1 : p  p0  RH 0  Z 0  Z
po 1  p0  
n  H 0 : p  p0  H1 : p  p0  RH 0  Z 0  Z1 2

2. Contrastes de hipótesis para dos poblaciones:

 H 0 : p1  p2  H1 : p1  p2
  RH 0  Z0 Z1
 H 0 : p1  p2  0  H1 : p1  p2  0

Z0
f n1 
 f n2   p1  p2  H
0



H 0 : p1  p2  H1 : p1  p2
 RH 0  Z0 Z

f n1 1  f n1   f 1  f 
n2 n2  H 0 : p1  p2  0  H1 : p1  p2  0
 H : p  p H : p  p
n1 n2  0 1 2 1 1 2
 RH 0  Z0  Z1 2
 H 0 : p1  p2  0  H1 : p1  p2  0

1.9.3. Contrastes de hipótesis para cualquier


distribución


 H 0 :    0  H1 :    0  RH 0  Z 0  Z1
iv


 mv   0 
Z 0iv    H 0 :    0  H1 :    0  RH 0  Z 0iv  Z
V  mv  
 H 0 :    0  H1 :    0  RH 0  Z 0  Z1 2 
iv

© Ediciones Pirámide 47
Problemas resueltos de estadística

1.9.4. Error de segunda especie. Potencia


del contraste
El error de segunda especie de un contraste (β(θ)) queda definido como sigue,
siendo el complementario de la potencia (P(θ)) del contraste:

    P  RH 1 H 1 
P    1      P  RH 0 H 1 

El estudio del contraste uniformemente más potente planteado a partir de una


hipótesis alternativa simple puede resolverse mediante el lema de Neyman-
Pearson:

H 0 :   0   L  X ; 0 
   k X  RC
H1 :    0  H 0 :    0  L  X ;1 
  RC  región crítica óptima  
H 0 :   1  H1 :   1  L  X ; 0   X  RC
 
H1 :   1   L  X ;1 

1.10. CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Conjunto de técnicas de inferencia estadística que no se centran en la estima-


ción de parámetros poblacionales o bien que no parten de la asunción previa de la
vigencia de un determinado modelo de probabilidad.

1.10.1. Contrastes chi-cuadrado bondad de ajuste


Permite evaluar la similitud de un conjunto de datos respecto de una determi-
nada distribución de probabilidad, formulándose el contraste como sigue:

H 0 : X  f  x;  
H 1 : X  f  x;  

48 © Ediciones Pirámide
Resumen de conceptos estadísticos

El estadístico es el siguiente, siendo k las clases en las que se ha dividido el


conjunto de observaciones y m el número de parámetros a estimar:

 oi  ei 
2


i k
i 1
  k2m 1
ei

La regla de decisión es la siguiente:

 oi  ei 
2

RH 0   i 1  12  k  m  1
i k

ei

1.10.2. Contrastes Kolmogorov-Smirnov


Al igual que el anterior, permite evaluar la similitud entre un conjunto de da-
tos y un determinado modelo de distribución de probabilidades. A continuación
se incluyen la formulación del contraste, el estadístico y la regla de decisión:

H 0 : X  f  x;  
H1 : X  f  x; 

i
An  x   i  1... n
n

 
Dn  max An  x   F  x   An  x  
i
n
i  1... n

P  Dn  Qks1     Qks1   Ln  2  2n

1.10.3. Contrastes de rachas

Permite pronunciarse respecto de la aleatoriedad de un conjunto de datos,


siendo la formulación, el estadístico y la regla de decisión los siguientes:

© Ediciones Pirámide 49
Problemas resueltos de estadística

H 0 : muestra aleatoria
H1 : muestra aleatoria

 2n n
   1 1 2

n
R

 n
 N   ;   
R 
1 2
n

  2n n  2n n  n  n 
R R

1 2 1 2 1 2

  n  n   n  n  1
R 2

 1 2 1 2

R  R
RH 0   Z1 2
R

1.10.4. Contraste chi-cuadrado de independencia


Contraste para dilucidar si dos variables son independientes entre sí:

H 0 : X eY independientes
H 1 : X eY independientes

 oij  eij 
2

 
i 1 jk
i 1 j 1
  2h -1 k 1
eij

La regla de decisión es la siguiente:

o  eij 
2

RH 0   i 1  j 1
i 1 jk
 12
ij

eij

50 © Ediciones Pirámide
2 Preguntas cortas y tipo test

CONTENIDO

2.1. Introducción.
2.2. Preguntas cortas.
2.3. Preguntas tipo test.

CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá tener
los siguientes conocimientos previos:

 Conocimientos sobre las técnicas y herramientas propias de la estadísti-


ca descriptiva.
 Probabilidad, variables aleatorias y modelos de distribución de probabi-
lidades.
 Técnicas de inferencia paramétrica: estimación puntual, intervalos de
confianza y contrastes de hipótesis.

OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:

 Interrelacionar diferentes conceptos estadísticos de cara a la resolución


de cuestiones cortas.
 Razonar en relación a diferentes soluciones estadísticas y de probabilidad
de cara a identificar la opción correcta.
 Realizar razonamientos críticos en relación a cuestiones y conceptos
concretos relacionados con la probabilidad y la estadística.

© Ediciones Pirámide 51
Problemas resueltos de estadística

2.1. INTRODUCCIÓN
A lo largo de este capítulo se presenta un conjunto de preguntas cortas y cues-
tiones tipo test. Para cada una de ellas se incluye la solución adecuada junto con
una breve explicación de las razones que justifican dicha selección.

El lector encontrará cuestiones relacionadas con la estadística descriptiva, la


probabilidad y la inferencia, y debe abordar su lectura desde un punto de vista
reflexivo y crítico.
Muchas de las cuestiones expuestas exigen relacionar conceptos estadísticos
de diferente naturaleza y tener las ideas lo suficientemente claras para seleccionar
la opción adecuada de entre un conjunto de alternativas.
El capítulo se ha dividido en dos apartados distinguiendo entre cuestiones cor-
tas y cuestiones tipo test. Las primeras responden mayoritariamente a cálculos
sencillos, mientras que las segundas presentan un conjunto de soluciones de las
que únicamente una es correcta (la opción subrayada).

2.2. PREGUNTAS CORTAS

2.1 Según el siguiente gráfico de diagramas de caja de dos variables, razone las si-
guientes cuestiones:

52 © Ediciones Pirámide
Preguntas cortas y tipo test

1. A la vista de la información disponible, ¿cuál de las dos variables es más


dispersa?

2. ¿Qué tipo de asimetría tienen las dos distribuciones?

3. ¿Se puede decir que por debajo del valor 6 se encuentran más del 50 %
de los valores en la variable 1? ¿Y en la variable 2?

4. ¿Es posible saber si sólo el 25 % de los datos en la variable 1 es inferior


al valor 3? ¿Y en la variable 2?

Solución:

1. A la vista de la información disponible, ¿cuál de las dos variables es más


dispersa?

Es más dispersa la variable 2 porque su recorrido intercuartílico (caja) es mayor.

2. ¿Qué tipo de asimetría tienen las dos distribuciones?

La variable 1 presenta una clara asimetría negativa puesto que la media es


mucho menor a la mediana y la patilla de la izquierda es más larga que la de la
derecha.

El tipo de simetría no puede afirmarse de forma tan concluyente a la vista del


diagrama de caja de la variable 2, puesto que la media es ligeramente superior
que la mediana pero por encima del tercer cuartil parece existir una cantidad simi-
lar a la que existe debajo del primer cuartil.

3. ¿Se puede decir que por debajo del valor 6 se encuentran más del 50 %
de los valores en la variable 1? ¿Y en la variable 2?

En la variable 1 por debajo del valor 6 se encuentran menos del 50 % de los


valores de la distribución, ya que la mediana es 7. Por el contrario, en la variable
2 sí se puede decir que por debajo del valor 6 se encuentran más del 50 % de los
datos porque la mediana es 5.

4. ¿Es posible saber si sólo el 25 % de los datos en la variable 1 es inferior


al valor 3? ¿Y en la variable 2?

© Ediciones Pirámide 53
Problemas resueltos de estadística

En la variable 1 el cuartil 1 es 4, por lo que por debajo del valor 3 existen me-
nos del 25 % de los datos. En la variable 2 el cuartil 1 sí es 3, por lo que se puede
afirmar que por debajo de 3 se encuentran el 25 % de los datos.

2.2 Se realizó un estudio del tiempo (en segundos) que un cierto número de coches
tardan en pasar de 0 a 100 km/h (aceleración). Las mediciones se realizaron dis-
tinguiendo entre vehículos portugueses y españoles y dieron lugar al siguiente
gráfico:

Señale como verdaderas (V) o falsas (F) las siguientes cuestiones según el grá-
fico anterior razonando su respuesta:

1. El 25 % de los coches portugueses más rápidos tienen un tiempo de ace-


leración igual al 50 % de los coches más rápidos españoles.

2. El tiempo medio de los coches españoles será mayor que el tiempo me-
diano de dichos coches.

3. El tiempo máximo al que se llega en esta muestra corresponde con un co-


che portugués.

4. La varianza de los coches españoles es mayor que la varianza de los co-


ches portugueses.

5. Las dos distribuciones son simétricas.

54 © Ediciones Pirámide
Preguntas cortas y tipo test

6. El percentil 80 de los coches portugueses supera los 8 segundos.

Solución:

1. El 25 % de los coches portugueses más rápidos tienen un tiempo de ace-


leración igual al 50 % de los coches más rápidos españoles.

Falso, el 25 % de los coches portugueses más rápidos tardan como mucho 6 se-
gundos (cuartil 1), que no coincide con la mediana de los coches españoles, que es
igual a 5.

2. El tiempo medio de los coches españoles será mayor que el tiempo me-
diano de dichos coches.

Es verdadero puesto que la distribución es asimétrica positiva y, por lo tanto,


la media se desvía hacia los valores más alejados que son los mayores. Además,
se observa un dato español atípico que apoya esta conclusión.

3. El tiempo máximo al que se llega en esta muestra corresponde con un co-


che portugués.

Falso. El tiempo máximo corresponde al dato atípico de los coches españoles.

4. La varianza de los coches españoles es mayor que la varianza de los co-


ches portugueses.

Verdadero. Puede observarse que la distribución de los vehículos españoles es


más dispersa que la de los portugueses, tanto por la patilla derecha, que es más
larga como por el dato atípico que influye en la dispersión.

5. Las dos distribuciones son simétricas.

Falso. La distribución de los coches portugueses sí, pero no la de los españo-


les, que es asimétrica positiva por la patilla derecha y el dato atípico.

6. El percentil 80 de los coches portugueses supera los 8 segundos.

Verdadero. Si el percentil 75 (cuartil 3) es 8 segundos, el percentil 80 tiene


que ser mayor a 8 segundos.

© Ediciones Pirámide 55
Problemas resueltos de estadística

2.3 Mediante una encuesta realizada entre los alumnos de la universidad se ha reco-
gido información tanto sobre el medio de locomoción utilizado (X) como el tiem-
po empleado en minutos (Y) por los alumnos en llegar a la universidad. El resul-
tado de la encuesta queda recogido en la siguiente tabla:

Y
X (5-15] (15-25] (25-35] (35-45]
A pie 8 4 2 1
Autobús 2 5 6 7
Tren 2 4 5 8
Coche 3 8 4 6
Bicicleta 5 2 0 0

1. ¿Qué porcentaje de alumnos de esta muestra van a pie y tardan 25 minu-


tos como máximo?

2. ¿Cuántos alumnos de la muestra van a la universidad en tren?

3. ¿Qué porcentaje de alumnos tardan más de 15 minutos en llegar a la uni-


versidad?

4. De los alumnos que más tardan en llegar a la universidad (entre 35 y 45


minutos), ¿qué porcentaje de ellos utilizan el autobús?

5. De los alumnos que utilizan el coche para ir a la universidad, ¿qué tiempo


medio emplean para llegar?

Solución:

1. ¿Qué porcentaje de alumnos de esta muestra van a pie y tardan 25 minu-


tos como máximo?

Para contestar a la cuestión planteada debe sumarse el total de alumnos en-


cuestados, que asciende a 82, y resolver la probabilidad de la intersección:

12
P  X  A pie   Y  25    0,14  14,63 %
82

56 © Ediciones Pirámide
Preguntas cortas y tipo test

2. ¿Cuántos alumnos de la muestra van a la universidad en tren?

Sumando las frecuencias absolutas de la fila referida al transporte en tren se


deduce que el número de alumnos asciende a 19.

3. ¿Qué porcentaje de alumnos tardan más de 15 minutos en llegar a la Uni-


versidad?

62
P Y  15   0,75  75,61 %
82

4. De los alumnos que más tardan en llegar a la universidad (entre 35 y 45


minutos), ¿qué porcentaje de ellos utilizan el autobús?

Se trata de una probabilidad condicionada en la que condición resulta ser tar-


dar entre 35 y 45 minutos. Deben por tanto calcularse las frecuencias referidas a
este suceso y al suceso intersección entre éste y viajar en autobús.

P  X  Autobús    35  Y  45 
P  X  Autobús   35  Y  45   
P 35  Y  45
7 82
  0,31  31,82 %
22 82

5. De los alumnos que utilizan el coche para ir a la universidad, ¿qué tiempo


medio emplean para llegar?

Simplemente debe calcularse el valor medio de los tiempos invertidos por los
alumnos que viajan en coche:

10  3   20  8    30  4    40  6 
x  26,19
21

La siguiente figura muestra una recta de regresión ajustada a una muestra de da-
2.4
tos registrados en cinco departamentos de una empresa para poder predecir la
variable Y = «gasto telefónico mensual en euros» en función de la variable X =
«tiempo de conexión a Internet mensual en minutos».

© Ediciones Pirámide 57
Problemas resueltos de estadística

Responder verdadero o falso a las siguientes cuestiones:

1. Aparentemente, existe relación lineal negativa entre las variables X e Y.

2. Si se aumenta 1 minuto el tiempo de conexión a Internet el gasto telefóni-


co esperado aumenta en 39,559 euros.

3. A medida que aumenta el tiempo de conexión a Internet aumenta el gasto


telefónico en la factura.

4. El coeficiente de correlación lineal será cercano a 1.

5. El gasto medio estimado para un departamento que se conecta a Internet


700 minutos sería aproximadamente de 113 euros.

Solución:

1. Aparentemente, existe relación lineal negativa entre las variables X e Y.

Falso, la pendiente de la recta es positiva, con lo que a medida que aumenta el


tiempo de conexión, lo hace también el gasto telefónico.

2. Si se aumenta 1 minuto el tiempo de conexión a Internet el gasto telefóni-


co esperado aumenta en 39,559 euros.

Falso, porque la pendiente no es 39,559.

58 © Ediciones Pirámide
Preguntas cortas y tipo test

3. A medida que aumenta el tiempo de conexión a Internet aumenta el gasto


telefónico en la factura.

Verdadero, al ser la pendiente positiva, lo que implica que las dos variables
varían en el mismo sentido.

4. El coeficiente de correlación será cercano a 1.

Verdadero, porque se observa que los puntos se acercan mucho a la recta de


regresión, por lo que la varianza residual será muy pequeña.

5. El gasto medio estimado para un departamento que se conecta a Internet


700 minutos sería aproximadamente de 113 euros.

Verdadero, puesto que al sustituir la variable X por la cifra 700 en la ecuación


de la regresión se obtiene un gasto estimado aproximado de 113 euros.

2.5 Un tren lleva a bordo módulos de acumulación de energía (X), medidos en kwh,
que le permite recorrer una determinada distancia (Y), medida en metros, sin ca-
tenaria. Se han recogido datos referentes al número de módulos a bordo así como
la distancia recorrida sin catenaria en 50 trenes, disponiéndose de la siguiente
información:

Autonomía (en metros)


Número de módulos
(0-300] (300-600] (600-1000]
1
2 0,04 0,12
3 0,04 0,06
4 0,02 0,10

© Ediciones Pirámide 59
Problemas resueltos de estadística

P Y  150 X  1  0,1; P Y  450 X  1  0, 4; P Y  800 X  1  0,5

1. Completar la tabla de distribución de frecuencias relativas conjunta.

2. Calcular el número medio y varianza del número de módulos en los casos


en los que la autonomía es como máximo 300 m.

3. ¿A partir de qué valor de autonomía se considera el 25 % de los trenes


con mayor autonomía?

Solución:

1. Completar la tabla de distribución de frecuencias relativas conjunta.

Autonomía (en metros)


Número de módulos
(0-300] (300-600] (600-1000]
1 0,02 0,08 0,10
2 0,04 0,12 0,12
3 0,04 0,06 0,14
4 0,02 0,10 0,16

Utilizando el gráfico de barras y sabiendo que el total de la muestra consultada


asciende a 50 individuos pueden obtenerse las frecuencias relativas marginales de
la variable X:

10  14 12 14
P  X  1  ; P X  2  ; P  X  3  ; P  X  3 
50 50 50 50

Conociendo las siguientes frecuencias relativas condicionadas, pueden dedu-


cirse las frecuencias relativas conjuntas de la primera fila de la tabla:

P Y  150    X  1


P Y  150 X  1  0,1  
P  X  1
 P Y  150    X  1  0,1  0, 2  0,02

60 © Ediciones Pirámide
Preguntas cortas y tipo test

P Y  450    X  1


P Y  450 X  1  0,1  
P  X  1
 P Y  450    X  1  0, 4  0, 2  0,08
P Y  800    X  1
P Y  800 X  1  0,1  
P  X  1
 P Y  800    X  1  0,5  0, 2  0,1

2. Calcular el número medio y varianza del número de módulos en los casos


en los que la autonomía es como máximo 300 m.

Los casos en los que la autonomía es inferior o igual a 300 corresponde al 12 %


de la muestra, con lo que basta con operar con las correspondientes variables
condicionales:

Y X  300   i 1 y j P Y  y j X  300 
in

0,02 0,04 0,04 0,02


 1  2  3  4  2,5
0,12 0,12 0,12 0,12

 Y2 X  300    i 1 y 2j P Y  y j X  300   y X  300  


i n 2

 12 
0,02 0,04 2 0,04 0,02 
 22  3   42     2,5   0,91
2

 0,12 0,12 0,12 0,12 

3. ¿A partir de qué valor de autonomía se considera el 25 % de los trenes


con mayor autonomía?

Debe calcularse el percentil 75 de la variable autonomía, que al estar agrupada


se calcula de la siguiente manera:

0,75  Fi 1 0,75  0, 48
P75  Li 1   ci  600   400  807,69
fi 0,52

2.6 La distancia recorrida no sólo depende de los módulos de energía a bordo, sino
también de otros factores como son la inclinación del terreno, la temperatura ex-
terior o la carga del tren.

© Ediciones Pirámide 61
Problemas resueltos de estadística

Para poder estimar la autonomía de los trenes (en m) en función de la tempera-


tura exterior (en ºC) se han recogido los siguientes datos:

Autonomía 300 500 400 600 800 500 700 600 500 400
Temperatura 30 15 28 18 8 16 12 15 17 32

¿Es razonable que se quiera estimar la autonomía de un tren en función de la


temperatura ambiente? ¿Por qué?

Solución:

Para responder a la cuestión se calcula el coeficiente de correlación lineal co-


mo medida del tipo de relación lineal existente entre las dos variables:

 AT
 ( AT )
 AT 
  AT n    A  T 
i n
i 1 i i

 A T  
  i 1 Ai
i n
n    A     T n   T  
2 12 i n
i 1 i
2 12

 91.600 10    530  19,1


  0,89
 4.235 10   19,1 
12 12
 3.010.000 10    530  
2 2

Como el coeficiente se acerca a –1 puede afirmarse que la relación entre las


dos variables es linealmente fuerte e inversa. A mayor temperatura exterior, me-
nor es la autonomía del tren. Es, por lo tanto, razonable el querer estimar la auto-
nomía en función de la temperatura exterior.

2.7 El departamento comercial de una empresa dedicada a la venta de ropa por catá-
logo ha hecho un estudio para determinar si existe relación entre el número de
líneas abiertas para pedidos (L) y las ventas realizadas (V), en cientos de euros.
Para ello, se han recogido los datos de dichas variables durante 20 días, obtenién-
dose los siguientes resultados:

 Li  599;  i 1 Vi  2.835;  i 1 L2i  19.195


i  20 i  20 i  20
i 1

 Vi 2  458.657;  i 1 LV
i  20 i  20
i 1 i i  92.000

62 © Ediciones Pirámide
Preguntas cortas y tipo test

Suma cuadrados de regresión  SCM   40.107, 44

Suma cuadrados de errores  SCR   16.823,72

1. Obtenga el coeficiente de determinación e interprételo.

2. Determine la estimación de la recta de regresión de la variable ventas (V)


en función de la variable número de líneas abiertas (L).

3. Estime las ventas correspondientes a un día en el que se encuentran abier-


tas 12 líneas.

Solución:

1. Obtenga el coeficiente de determinación e interprételo:

SCM 40.107, 44
R2    0,70
SCT 56.931,16

Se puede decir que la variable número de líneas abiertas para pedidos explica
el 70,45 % de la variabilidad de la variable ventas.

2. Determine la estimación de la recta de regresión de la variable ventas (V)


en función de la variable número de líneas abiertas (L):

b
 VL

 i  20
i 1

i i  nLV
LV 


92.000  20 
599 2.835
20
 
20  5,65
 L2  i  20
i 1
L    nL 
2
î
2
19.195   20 
599 

2

 20 

2.835 599
a  V  bL   5,65   27, 46
20 20

Por lo tanto, la recta de regresión estimada será la siguiente:

Vi  27, 46  5,65 Li

© Ediciones Pirámide 63
Problemas resueltos de estadística

3. Estime las ventas correspondientes a un día en el que se encuentran abier-


tas 12 líneas.

Simplemente debe sustituirse en la variable independiente L el resultado


igual a 12:

V  27, 46  5,65  12  40,34

Analizando todas las ventas en el año pasado de una determinada aplicación para
2.8
móviles en distintos países se ha obtenido que la venta media por semana ha sido
de 158 unidades con una varianza de 100 unidades2. A partir de una muestra alea-
toria de 8 semanas del presente año se obtiene una media de 180 paquetes con
varianza 150 paquetes2. A continuación se enuncia un conjunto de hipótesis sobre
los valores poblacionales de las ventas de este producto. Reescríbalas como hipó-
tesis nula y alternativa.

Hipótesis H0 H1
Las ventas medias no han disminuido respecto al año pasado
La varianza no ha disminuido respecto al año pasado
Las ventas medias han aumentado 10 paquetes respecto al año pasado
La varianza poblacional es este año 140 paquetes2

Solución:

Hipótesis H0 H1
Las ventas medias no han disminuido respecto al año pasado µ = 158 µ < 158
2
La varianza no ha disminuido respecto al año pasado σ = 100 σ2 < 100
Las ventas medias han aumentado 10 paquetes respecto al año pasado µ = 168 µ  168
σ2  140
2 2
La varianza poblacional es este año 140 paquetes σ = 140

64 © Ediciones Pirámide
Preguntas cortas y tipo test

2.3. PREGUNTAS TIPO TEST

2.9 La siguiente tabla contiene una serie de estadísticos sobre 2 variables:

X1 X2
Media 16000 0,30
Mediana 15,500 0,50
Varianza 8,410 3,61
Mínimo 9000 -5,300
Máximo 22000 3,70
Rango 13000 900
Cuartil inferior 14000 -0,900
Cuartil superior 17000 1,30
Coeficiente de variación 0,183 6,30

1. Seleccione la respuesta correcta de entre las siguientes:

i. La variable X1 es más dispersa que la variable X2.

ii. La variable X2 es más dispersa que la variable X1.

iii. Las dos variables son igualmente dispersas.

El coeficiente de variación es la medida de dispersión permite comparar la


dispersión de dos experimentos diferentes al estar definido en términos relativos.
Si se calcula esta medida para las dos variables se observa cómo para X2 este
coeficiente es igual a 1,9, mientras que para la variable X1 es igual a 0,18.

2. Seleccione la respuesta correcta de entre las siguientes:

i. La asimetría de la variable X1 es positiva o directa.

ii. La asimetría de la variable X1 es negativa o inversa.

iii. La variable X1 es simétrica.

© Ediciones Pirámide 65
Problemas resueltos de estadística

Basta con comparar la media aritmética y la mediana para observar que la


primera es mayor que la segunda, lo que significa que la distribución es asimétri-
ca a la derecha.

3. En la variable X2, el 25 % de los datos de la variable se encuentran…

i. Por debajo del valor 1,3.

ii. Por encima del valor -0,9.

iii. Por encima del valor 1,3.

El tercer cuartil corresponde con el percentil de orden 0,75, que deja el 25 %


de los datos por encima de él. Este dato para la variable X2 es igual a 1,3, como se
observa en la tabla.

Los 40 estudiantes del grado de Economía evalúan el esfuerzo de su profesora de


2.10
Estadística para enseñarles. Las notas son de 1 (muy mal) a 5 (muy bien). La
siguiente tabla de frecuencias resume la evaluación:

Nota Frecuencia absoluta Frecuencia relativa


1 5
2 0,175
3 4
4
5 8

1. ¿Qué porcentaje de alumnos han evaluado a su profesora con más de 3?:

i. 24 %.

ii. 60 %.

iii. 70 %.

Sabiendo que existen 40 alumnos en la muestra, las frecuencias relativas de


las notas 1 y 3 son, respectivamente, 0,125 y 0,1. Si se suman las frecuencias
relativas de los resultados 1, 2 y 3 se observa que su suma es igual a 0,4. Esta

66 © Ediciones Pirámide
Preguntas cortas y tipo test

cifra implica que el 60 % de los alumnos han evaluado a su profesora con nota
superior a 3.

2.11 Señale la afirmación correcta a partir del siguiente conjunto de datos:

Vida en
Bombillas Frecuencia relativa Frecuencia relativa acumulada
horas
(0-500] 8 0,16
(500-1.000] 12 0,4
(1.000-1.500] 0,30 0,7
(1.500-2.500] 0,20
(2.500-3.000] 5 1,0

i. El porcentaje de bombillas con duración de más de 500 horas es 90 %.

ii. El porcentaje de bombillas con duración de 2.500 horas como máximo


es 90 %.

iii. El porcentaje de bombillas con duración de entre 1.000 y 1.500 horas es 15 %.

Basta con sumar en la columna de frecuencias relativas acumuladas la fre-


cuencia relativa del intervalo (1.500-2.500] para comprobar que la frecuencia
acumulada hasta ese punto es igual a 0,9.

2.12 La siguiente tabla muestra los estadísticos resumen de las mediciones de 50 torni-
llos con dos calibres diferentes.

Calibre 1 Calibre 2
Media 346,160 351,120
Mediana 346,000 352,000
Moda 345,000 353,000
Varianza 007,402 ,21,900
Rango 011,000 ,16,000
Asimetría 000,590 00,028
Curtosis -0,278 -1,174
Coeficiente de variación 00,786 01,333

© Ediciones Pirámide 67
Problemas resueltos de estadística

i. El calibre 1 es mejor debido a que su distribución está más concentrada


en torno a su media.

ii. El calibre 2 presenta un menor coeficiente de variación que es indicativo


de que sus mediciones son más exactas.

iii. El calibre 2 presenta una menor dispersión y por lo tanto se considera que
sus mediciones son mejores que las realizadas con el calibre 1.

Basta con calcular el coeficiente de variación de ambos calibres para darse


cuenta de que la dispersión del calibre 1 (CV = 0,007) es menor que la dispersión
del calibre 2 (CV = 0,01).

2.13 Sea la variable peso que es capaz de levantar un elevador. Para calcular el peso a
partir del cual el elevador pueda levantar con una probabilidad del 30 % se debe
calcular:

i. El percentil 30.

ii. El percentil 70.

iii. El percentil 3.

El percentil es por definición la medida que deja por debajo de él una canti-
dad de observaciones igual a su orden, de forma que la medida que deja por
debajo de éste el 70/ % de las observaciones (percentil 70) mantiene por encima
suyo el 30 % de observaciones restante. Por ello, el valor del peso tal que por
encima de él permanece una probabilidad del 30 % es el percentil 70.

2.14 Durante una semana se han contado un total de 5.000 visitas realizadas a la pági-
na web de un determinado diario online. Se desea estudiar la relación entre el día
de la semana y el intervalo horario en que se realizan las visitas. Sean X = «día de
la semana» e Y = «intervalo horario» en el que se realizó la visita:

68 © Ediciones Pirámide
Preguntas cortas y tipo test

(8:00-13:00] (13:00-16:00] (16:00-20:00]


Lunes 232 400 228
Martes 348 600 342
Miércoles 319 550 313
Jueves 95 525 298
Viernes 77 425 248

Señale cuál de las siguientes opciones es la correcta usando la correspondiente


distribución condicionada:

i. El 15 % de las visitas realizadas entre [8:00-13:00) horas se realizaron


el lunes.

ii. El 8,87 % de las visitas realizadas entre [8:00-13:00) horas se realizaron


el jueves.

iii. El 20 % de la visitas realizadas entre [8:00-13:00) horas se realizaron el


jueves.

Basta con sumar las visitas dentro de cada intervalo para calcular las frecuen-
cias relativas de cada día y franja horaria para comprobar que la frecuencia relati-
va de la franja horaria (8:00-13:00] los jueves es igual a 0,0887.

2.15 Se dispone de la distribución de edades de los individuos de una población. El


número de ellos que no es mayor de edad es:

i. Una frecuencia relativa.

ii. Una frecuencia absoluta.

iii. Una frecuencia acumulada.

Es una frecuencia absoluta por ser una cantidad de individuos con una edad
igual o inferior a 18 años.

© Ediciones Pirámide 69
Problemas resueltos de estadística

2.16 Dada las siguientes gráficas (etiquetadas como H1, H2, H3, C1, C2 y C3), ¿qué
correspondencias son correctas?

i. H1-C1, H2-C2 y H3-C3.

ii. H1-C3, H2-C1 y H3-C2.

iii. H1-C3, H2-C2 y H3-C1.

El histograma 2 únicamente puede corresponder con el diagrama de caja 1 al


asemejarse a una distribución uniforme. El histograma 1 corresponde con el dia-
grama de caja 3 observando el estrecho rango. Por último, el histograma 3 corres-
ponde con el diagrama de caja 2, pudiendo comprobarse a la vista de la mediana
inferior a 0,5.

70 © Ediciones Pirámide
Preguntas cortas y tipo test

2.17 En una empresa de servicio técnico se desea conocer el grado de satisfacción de


los usuarios. Para ello se realiza un cuestionario de satisfacción y se les pide que
valoren, en una escala continua de 0 a 10, el servicio recibido. El valor 0 identifi-
ca un pésimo servicio y el 10 identifica un inmejorable servicio. La información,
tanto de la valoración del servicio como del sexo de diez de los usuarios entrevis-
tados, es:

H H M M M H M M H M
2,20 1,50 4,50 1,10 3,30 2,80 2,40 2,50 1,70 4,50

Señale la opción correcta:

i. La frecuencia absoluta de las mujeres (M) es 6 y la media es 2,5.

ii. La frecuencia relativa de las mujeres (M) es del 50 % y la frecuencia ab-


soluta de los hombres (H) es 4.

iii. La media es 2,65 y la frecuencia relativa de los hombres (H) es del 40 %.

Si se calcula la media aritmética del conjunto de datos se comprueba que es


igual a 2,65, y observando que han contestado 4 hombres y 6 mujeres se deduce
que la opción correcta es la tercera.

2.18 La siguiente tabla muestra información sobre la venta en 1998 de prensa diaria
escrita, en ejemplares diarios vendidos por cada mil habitantes para 8 comunida-
des autónomas españolas, relacionándola con su producción económica basada en
el Producto Interior Bruto (PIB) por habitante, en miles de euros.

PIB 8,3 9,7 10,7 11,7 12,4 15,4 16,3 17,2


Número de
57,4 106,8 104,4 131,9 144,6 146,4 177,4 186,9
ejemplares

Asumiendo que existe relación lineal entre ambas variables, se obtiene la si-
guiente recta de regresión para explicar el número de ejemplares vendidos por
cada 1.000 habitantes en función del PIB por habitante en miles de euros:

Y= −23,55 + 12,23X

© Ediciones Pirámide 71
Problemas resueltos de estadística

1. ¿Cuál será la venta de prensa que se podría predecir para una comunidad
cuyo PIB por habitante fuese de 15.000 euros?

i. 159,9 ejemplares.

ii. 159,9 ejemplares por cada mil habitantes.

iii. 183.430 ejemplares por cada mil habitantes.

Basta con sustituir X por 15 en la recta de regresión para comprobar que la


venta esperada será de 159,9 ejemplares.

2. ¿Cuál de las siguientes afirmaciones es correcta?

i. Cuando el PIB por habitante aumenta en 1.000 euros, el número de ejem-


plares vendidos por cada mil habitantes es de 12,23.

ii. Cuando el PIB por habitante aumenta en 1.000 euros, el número de ejem-
plares vendidos por cada mil habitantes disminuye en 23,55.

iii. Cuando el PIB por habitante aumenta en 1.000 euros, el número de ejem-
plares vendidos por cada mil habitantes aumenta en 12,23.

La pendiente de la recta de regresión (12,23) representa el incremento de la


variable dependiente ante una variación unitaria de la variable independiente,
hecho que explica que la tercera opción sea la correcta.

2.19 El coeficiente de determinación, correspondiente a una recta de regresión que se


ha determinado a partir de 10 pares de datos, vale 0,25. El coeficiente de correla-
ción lineal vale…

i. 0,25/10.

ii. 0,5.

iii. No hay suficiente información para calcular el coeficiente de correlación.

El coeficiente de correlación lineal puede calcularse como la raíz cuadrada del


coeficiente de determinación, con lo que el coeficiente de correlación lineal as-
ciende a 0,5.

72 © Ediciones Pirámide
Preguntas cortas y tipo test

2.20 En un conjunto de 26 valores de una variable aleatoria, se aumenta 5 unidades a


los 3 valores más altos. Entonces no varía…

i. La media aritmética.

ii. El percentil 98.

iii. La mediana.

La mediana no está afectada por variaciones en los resultados extremos ya que


no hacen que cambie su posición ni el reparto del número de observaciones en
torno a la mediana.

2.21 En un ajuste de regresión lineal simple por mínimos cuadrados…

i. Cuando r = 1 la varianza residual es igual a 0.

ii. Cuando r = -1 las dos rectas de regresión coinciden y su pendiente


vale -1.

iii. Cuando r = 0 las variables son independientes.

El coeficiente de determinación resulta ser el coeficiente de correlación li-


neal al cuadrado y representa la fracción de la varianza de la variable depen-
diente no explicada. Si el coeficiente de correlación lineal es igual a la unidad,
también lo será el coeficiente de determinación y, por tanto, no existirá varianza
no explicada.

2.22 Un profesor quiere mostrar a sus alumnos lo determinante que es la asistencia a


clase en el resultado final de una asignatura. Para ello ha tomado una muestra de
datos correspondientes al porcentaje de asistencia a clase de un grupo de alumnos
así como la nota final obtenida en la asignatura.

© Ediciones Pirámide 73
Problemas resueltos de estadística

Basándose en el gráfico anterior escoja la respuesta correcta:

i. La relación lineal entre las variables es fuerte e inversa.

ii. El modelo de regresión lineal no serviría para obtener predicciones de no-


ta final fiables.

iii. Si aumenta un 1 % la asistencia a clase de un alumno, la nota final au-


mentaría en 0,0742 puntos.

La pendiente de la recta es igual a 0,0742 y esta cifra representa la variación


que experimenta la variable dependiente (nota final) ante variaciones unitarias de
la variable independiente (porcentaje de asistencia).

2.23 Una fábrica utiliza máquinas de tipo A para el 25 % de sus productos y de tipo B
para el resto. El 2 % de los productos fabricados por las máquinas de tipo A son
defectuosos, así como el 1 % de los fabricados por las máquinas de tipo B. Esco-
gido un producto al azar resulta ser defectuoso. La probabilidad de que fuese
fabricado por la máquina A es:

i. 0,005.

ii. 0,6.

iii. 0,4.

74 © Ediciones Pirámide
Preguntas cortas y tipo test

Se trata de calcular la probabilidad mediante el teorema de Bayes de la forma


siguiente:

P  A  D 0, 25  0,02
P  A D    0, 4
P  D  0, 25  0,02    0,75  0,01

2.24 El número de clientes en una tienda de venta online que devuelven el producto en
la primera semana después de la compra es una variable aleatoria cuya distribu-
ción de probabilidad es la siguiente:

xi 0 1 2 3 4 5
P[X = xi] 0,05 0,15 k 0,25 0,12 0,06

i. La probabilidad de que como mínimo sean dos clientes que los que de-
vuelven el producto es 0,6.

ii. El número medio de clientes que devuelven el producto en la primera


semana es 2,56.

iii. La probabilidad de que devuelven el producto a lo sumo 2 clientes es


0,57.

Debe calcularse el valor de la constante k de forma que la suma de las proba-


bilidades vinculadas a cada resultado del dominio de la variable sea igual a la
unidad. Se observa que k es igual a 0,37, lo que hace que la opción válida sea iii.

2.25 Dada una variable aleatoria normal de media 10 y varianza 9, sabemos que dentro
del intervalo [4;16] se recogen aproximadamente…

i. 88 % de los datos.

ii. 95 % de los datos.

iii. 99,7 % de los datos.

Basta con calcular la probabilidad del intervalo aludido en el enunciado para


la distribución normal referida para comprobar que el resultado es aproximada-

© Ediciones Pirámide 75
Problemas resueltos de estadística

mente 0,95. Se trata además de un intervalo centrado en la media y con una am-
plitud de ±2σ. Intervalo que se sabe que en una distribución normal concentra el
95 % de los resultados.

2.26 Al vestíbulo de una estación de tren llega una media de 120 pasajeros a la hora.
La llegada de los pasajeros tiene un ritmo medio estable y lo hacen de forma in-
dependiente. La variable aleatoria X = número de pasajeros que llegan en media
hora se distribuye según…

i. Un modelo binomial (n = 120, p).

ii. Un modelo de Poisson de parámetro 120.

iii. Un modelo de Poisson de parámetro 60.

Se trata de un experimento que se ocupa de estudiar algo que ocurre en térmi-


nos discretos (número de pasajeros que acceden al vestíbulo) pero vinculado a un
medio continuo (tiempo), con lo que se trata de un modelo de Poisson. Si el expe-
rimento se refiere a un tiempo de media hora basta con transformar la tasa que
proporciona el enunciado para referirla a esa unidad temporal para comprobar que
la opción correcta es la última.

2.27 La probabilidad de que una probeta de cierto material plástico no supere las prue-
bas de resistencia a tracción es del 2 %. Se toman al azar 20 probetas de dicho
material, el número de probetas que no superarán las pruebas de resistencia a
tracción sigue un modelo…

i. Poisson de parámetro 0,4.

ii. Binomial de parámetros n = 20 y p = 0,02.

iii. Binomial de parámetros n = 20 y p = 0,98.

El experimento constituye un fenómeno dicotómico que se repite en 20 oca-


siones siendo la tasa esperada de éxitos un 2 %, lo que ha de estudiarse mediante
un modelo binomial de parámetros 20 y 0,02.

76 © Ediciones Pirámide
Preguntas cortas y tipo test

2.28 El número medio de consultas telefónicas a un número de información de un


ayuntamiento es de 90 a la hora. El modelo de probabilidad de la variable tiempo
en minutos que transcurre entre la llamada de dos consultas es…

i. Una distribución exponencial de parámetro 1,5.

ii. Una distribución exponencial de parámetro 0,67.

iii. Una distribución de Poisson de parámetro 1,5.

Basta con transformar la tasa aportada por el enunciado (90 llamadas a la ho-
ra) a minutos y ser consciente de que el experimento puede estudiarse mediante
una distribución exponencial para comprobar que la opción correcta es la i.

2.29 Si A y B son dos sucesos de un espacio muestral , entonces siempre se cumple:

i. P(A  B) ≥ P(A) + P(B).

ii. P(A  B) ≤ P(A) + P(B).

iii. P(A  B) = P(A) + P(B).

La opción ii constituye una de las propiedades que se derivan de los axiomas


probabilísticos propuestos por Kolmogorov.

2.30 Sea la siguiente variable aleatoria continua X cuya función de distribución es la


siguiente:

0 si x  1

 x2 1
 x si 1  x  2
2 2
F ( x)  
 x2 7
  3x  si 2  x  3
 2 2
1 si x  3

© Ediciones Pirámide 77
Problemas resueltos de estadística

La probabilidad de que la variable X tome valores entre 1,5 y 2,5 es…

i. 0,125.

ii. 0,875.

iii. 0,75.

Basta con sustituir los resultados de la función de distribución aportada por el


enunciado en 2,5 y 1,5 para comprobar que la respuesta correcta es la tercera.

2.31 Señala la afirmación correcta:

i. La media muestral, como estimador para μ, es siempre insesgada.

ii. La media muestral es un estimador insesgado para μ si la población es


normal.

iii. La media muestral es un estimador insesgado para μ si n es lo suficiente-


mente grande.

Las propiedades de la media muestral como estimador dependen de las carac-


terísticas de la población a la que se refieren, con lo que no cabe más que selec-
cionar la opción ii.

2.32 En un contraste de hipótesis se ha rechazado Ho: θ = θo en favor de la alternativa


H1:θ ≠ θo a un 5 % de significación. Esto significa que:

i. θ0 pertenece al intervalo de confianza al 95 % de confianza.

ii. Puede asegurarse que θ no tomará el valor de θo.

iii. θ0 no pertenece al intervalo de confianza al 95 % de confianza.

La solución del contraste bilateral es equivalente a la solución del intervalo,


con lo que rechazar la hipótesis nula implica que el estadístico se situaría fuera
del supuesto intervalo de confianza equivalente.

78 © Ediciones Pirámide
Preguntas cortas y tipo test

2.33 Dado un contraste de hipótesis donde se ha rechazado la hipótesis nula al 5 % de


significación, se sabe que:

i. También se rechazará al 1 % de significación.

ii. No se rechazará la H0 al 10 % de significación.

iii. El p-valor tomará un valor inferior al 5 %.

El p-valor representa una medida de la credibilidad de la hipótesis nula que se


compara con el nivel de significación, de forma que si se ha rechazado el contras-
te, no cabe otra opción que fuese porque la credibilidad de la hipótesis nula medi-
da a través del p-valor sea inferior al nivel de significación.

2.34 La distribución de la diferencia de medias muestrales:

i. Puede aproximarse mediante a una ley normal si los tamaños muestrales


son lo suficientemente grandes.

ii. Es normal sólo si las poblaciones son normales con la misma varianza.

iii. Con tamaños muestrales inferiores a 30 nunca es normal.

De entre las tres opciones únicamente resulta cierta en todo caso la primera en
virtud del teorema central del límite y los teoremas de convergencia.

2.35 Al calcular intervalos de confianza para la media poblacional con tamaño mues-
tral n < 30 la distribución t-Student se utiliza:

i. Siempre.

ii. Supuesta población normal con varianza conocida.

iii. Supuesta población normal y varianza poblacional estimada por ser des-
conocida.

Si la población es normal y la varianza poblacional se desconoce, la cantidad


pivotal que emplea la desviación típica o cuasidesviación típica muestrales se
distribuye según un modelo t-Student.

© Ediciones Pirámide 79
Problemas resueltos de estadística

2.36 El menor nivel de significación al cual puede rechazarse la hipótesis nula es:

i. La probabilidad del error de tipo I.

ii. El p-valor.

iii. La probabilidad del error de tipo II.

La segunda de las opciones coincide exactamente con la definición del p-


valor.

2.38 La distribución muestral de (n - 1)s2(n-1)/σ2, siendo s2(n-1) la cuasivarianza mues-


tral construida a partir de una muestra aleatoria:

i. Es siempre una 2.

ii. Es siempre una 2 si la variable aleatoria X de la que procede la muestra


es normal.

iii. Es siempre asintóticamente normal.

El numerador del estadístico en cuestión es equivalente en términos de proba-


bilidad a una suma de n-1 variables aleatorias normales elevadas al cuadrado de
media cero y varianza σ2 (siempre que las variables que se suman se distribuyan
según modelos normales), con lo que basta con dividir esta suma por la propia
varianza para tener una suma de distribuciones normales tipificadas elevadas al
cuadrado, suma que equivale a una distribución 2

2.39 Un estimador de un parámetro poblacional es:

i. Una cantidad desconocida.

ii. La realización de una variable aleatoria.

iii. Una variable aleatoria que depende de la información muestral.

Un estimador es una función matemática que depende de la información de la


muestra y no de los parámetros poblacionales.

80 © Ediciones Pirámide
Preguntas cortas y tipo test

2.40 Un estimador por intervalos para un parámetro poblacional es:

i. Un par de variables aleatorias que con cierta probabilidad contiene al


verdadero valor del parámetro poblacional.

ii. Un par de valores que, con cierta probabilidad, contiene al verdadero va-
lor del parámetro poblacional.

iii. Un intervalo de valores centrado en el verdadero valor del parámetro po-


blacional.

El intervalo de confianza puede definirse como el intervalo en el que con una


determinada probabilidad (nivel de confianza) se encontrará el verdadero valor
del parámetro respecto del que se desea inferir. Esta definición implica que los
límites del intervalo se construyen con base en variables aleatorias.

2.41 La proporción muestral como estimador de la verdadera proporción poblacional


es:

i. Sesgado.

ii. Insesgado y no consistente.

iii. Insesgado y consistente.

La proporción muestral es un estimador insesgado ya que su esperanza mate-


mática coincide con el parámetro p y además es consistente al ser insesgado y
asintóticamente de varianza mínima al ser su varianza igual a la varianza de la
población dividido por el tamaño de la muestra. Cociente cuyo límite, cuando el
tamaño de la muestra tiende a infinito, es igual a cero.

2.42 El método de máxima verosimilitud consiste en:

i. Escoger el máximo valor posible del parámetro desconocido.

ii. Escoger el valor del parámetro que haga más probable el resultado obte-
nido en la muestra.

iii. Escoger el máximo valor de los datos muestrales.

© Ediciones Pirámide 81
Problemas resueltos de estadística

El estimador de máxima verosimilitud es aquel que hace máxima la función de


verosimilitud que resulta ser una medida de la probabilidad conjunta de la mues-
tra seleccionada. Así, el estimador de máxima verosimilitud es el mejor posible
para la muestra seleccionada.

2.43 Sabiendo que B ˆ1   1 y V ˆ1   0,5 , y que el estimador insesgado ˆ2 tiene
una varianza igual a 4, según el criterio del error cuadrático medio:

i. Es preferible ˆ1 a ˆ2 .

ii. Es preferible ˆ2 a ˆ1 .

iii. No se pueden comparar.

Siendo el error cuadrático medio igual a la varianza del estimador más su ses-
go elevado al cuadrado, no queda más que seleccionar al primer estimador por ser
su error cuadrático medio igual a 1,5 frente al segundo, cuyo error cuadrático
medio es igual a 4.

2.44 El error cuadrático medio de un estimador ( ˆ ) de un parámetro θ mide:

i. La dispersión del estimador alrededor de su sesgo.

ii. La dispersión del estimador alrededor del parámetro.

iii. La dispersión del estimador alrededor de su media.

El error cuadrático medio es igual a la esperanza matemática de la diferencia


entre el estimador y el parámetro, lo que resulta ser una medida de las desviacio-
nes elevadas al cuadrado de cada valor del estimador respecto del parámetro.

2.45 Se quiere estimar la renta mínima de los habitantes de Lugo. Para estimar pun-
tualmente dicho parámetro se seguirá el siguiente proceso:

i. Una vez conocido el censo de los lucenses, se toma una muestra aleato-
ria, se propone un estimador adecuado y por último se calcula una esti-
mación sobre una muestra en particular.

82 © Ediciones Pirámide
Preguntas cortas y tipo test

ii. Se recoge información de los últimos 20 lucenses que han engrosado las
cifras del paro y se calcula la renta media de dicha muestra como estima-
ción del parámetro.

iii. Se sitúa un encuestador en un punto céntrico de Lugo y va preguntando a


diferentes individuos las rentas que obtienen y se propone como estima-
ción la renta mínima de dicha muestra.

La primera de las opciones constituye el procedimiento más adecuado en


términos generales para abordar una operación de inferencia estadística, puesto
que ninguna de las otras dos opciones garantizan la selección de una muestra
adecuada.

2.46 Dada una población normal de media µ y varianza σ2, sabemos que el estadísti-
co media muestral x de una muestra aleatoria simple sigue una distribución
normal de:

i. Media n veces mayor que su población y varianza igual a su población.

ii. Media igual a la de su población y varianza n veces más pequeña que su


población.

iii. Media n veces menor y varianza n veces mayor a su población.

La distribución de probabilidad de la media muestral obtenida de una pobla-


ción normal es también un modelo normal cuya media es igual a la media de la
población y cuya varianza es igual a la varianza poblacional dividida entre el
tamaño de la muestra.

2.47 En términos generales, para intervalos de confianza:

i. A mayor nivel de confianza, menor amplitud del intervalo.

ii. A mayor varianza poblacional, intervalos con menor amplitud.

iii. Si n crece, la amplitud del intervalo de confianza disminuye.

© Ediciones Pirámide 83
Problemas resueltos de estadística

El tamaño de la muestra n aparece en el denominador del error del intervalo,


hecho que justifica que al aumentar el tamaño de la muestra disminuya la ampli-
tud del intervalo de confianza.

2.48 Sea el siguiente intervalo de confianza al 95 % de confianza para la media pobla-


cional sobre una muestra de 50 observaciones de una variable X:

IC   ;0,05   87,3;95,7 

Señale la afirmación correcta:

i. Seguro que la media poblacional es 90.

ii. La media muestral siempre estará incluida en el intervalo obtenido.

iii. El intervalo de la media no es válido pues se basa en la normalidad y no


conocemos esa propiedad de X.

La media muestral es el centro del intervalo de confianza cuando el modelo de


probabilidad de la cantidad pivotal es simétrico, hecho que ocurre cuando se utili-
za el estimador de máxima verosimilitud y/o el tamaño de la muestra es lo sufi-
cientemente grande.

2.49 Para una muestra particular se ha obtenido el p-valor = 0,023 al realizar un de-
terminado contraste de hipótesis. Entonces:

i. Se acepta la hipótesis nula con un nivel de significación del 10 %.

ii. Se rechaza la hipótesis nula con un nivel de significación del 1 %.

iii. Se rechaza la hipótesis nula con un nivel de significación del 10 %.

El p-valor representa una medida de que la hipótesis nula, para la muestra se-
leccionada, sea cierta, de forma que si es inferior al nivel de significación fijado
habrá de rechazarse la hipótesis nula por ser poco creíble. Esta circunstancia es la
que se observa en la tercera opción de entre las anteriores.

84 © Ediciones Pirámide
Preguntas cortas y tipo test

2.50 Una muestra aleatoria simple de tamaño n seleccionada de una población:

i. Está formada por n datos de dicha población.

ii. Está formada por n variables aleatorias independientes de la población.

iii. Se obtiene haciendo extracciones sin reemplazamiento de la población.

En realidad, la muestra seleccionada puede suponerse constituida por variables


aleatorias equivalentes puesto que se trata de experimentos individuales dentro de
una población con unas características de aleatoriedad que pueden extrapolarse a
cada una de las observaciones de manera individual.

2.51 Se ha obtenido el siguiente intervalo de confianza para la diferencia de medias


poblaciones al 95 %.

IC   x   y ;0,05    1,35; 0, 48 

Con base en dicho intervalo, se puede afirmar que:

i. La media poblacional de la variable X es mayor a la media poblacional de


la variable Y al 95 % de confianza.

ii. La media poblacional de la variable X es menor a la media poblacional de


la variable Y al 95 % de confianza.

iii. La media poblacional de la variable X es igual a la media poblacional de


la variable Y al 95 % de confianza.

El signo negativo implica que la diferencia entre las dos medias será menor
que cero con un nivel de confianza del 95 %. Ello, tal y como se ha planteado el
intervalo, implica que la media poblacional de la variable aleatoria X es menor
que la media poblacional de la variable aleatoria Y.

2.52 Un 90 % de confianza en un intervalo para el parámetro  quiere decir que:

i. Existe un 90 % de probabilidad de que  se encuentre fuera del intervalo


de confianza.

© Ediciones Pirámide 85
Problemas resueltos de estadística

ii. De cada 100 intervalos de confianza obtenidos, en 90 de ellos se espera


que esté incluido .

iii. Existe un error de un 90 % de que el intervalo incluya al verdadero .

Asumiendo que un intervalo de confianza es un intervalo en el que con una


determinada probabilidad (nivel de confianza) estará incluido el parámetro res-
pecto del que se desea inferir, cabe pensar que en 90 de cada 100 intervalos cal-
culados la media quedará dentro de sus límites.

2.53 Se desea estimar la media µ de una variable aleatoria X. Para ello se toman 10
datos y se calcula la media muestral x y la cuasivarianza muestral sn21 . Enton-
ces:

i. Por el teorema central del límite se sabe que µ será una variable aleatoria
normal

ii. Un estimador de X es x .

iii. Si X es normal, x es siempre normal.

Si el carácter que se desea estudiar en la población se distribuye según un mo-


delo normal, también se distribuirán según ese modelo (con los mismos paráme-
tros) cada una de las observaciones individuales que componen la muestra. Así,
siendo la media muestral una combinación lineal de tales observaciones indivi-
duales, no cabe más que aceptar que la media muestral se distribuirá según un
modelo normal.

2.54 La distribución muestral de la diferencia de medias muestrales…

i. Con tamaños muestrales elevados convergerá a una distribución normal.

ii. Siempre se distribuye exactamente como una normal.

iii. Es normal sólo si las poblaciones son normales con la misma varianza.

86 © Ediciones Pirámide
Preguntas cortas y tipo test

Consecuencia directa del teorema central del límite y los teoremas de conver-
gencia, puede aceptarse que si el tamaño de la muestra es elevado, independien-
temente del modelo de probabilidad concreto de cada una de las observaciones, el
modelo de probabilidad de la diferencia de medias muestrales (en la medida en la
que se trata de una combinación lineal de variables aleatorias) convergerá a una
distribución normal.

2.55 Sea X una variable aleatoria que permite modelizar el número de clientes que en
una determinada población tienen instalada fibra óptica en casa. Si se toma una
muestra aleatoria simple de 20 individuos de dicha población, se sabe que X:

i. Es una variable aleatoria que puede tomar valores 0 y 1.

ii. Es una variable aleatoria normal como la variable aleatoria de la pobla-


ción.

iii. El valor de X cambiará si el primer cliente seleccionado tiene fibra óptica


en casa.

El carácter que se desea modelizar es un fenómeno dicotómico, con lo que ca-


da una de las observaciones individuales en la muestra se distribuirá según un
modelo dicotómico que únicamente puede adoptar resultados iguales a 0 o 1.

2.56 Sea Ho: 2  o2, frente a H1: 2 > o2, para una muestra de tamaño 20 procedente
de una variable aleatoria X distribuida N(;2).

i. El error tipo I es el que se comete al rechazar Ho: 2  o2 cuando es ver-


dadera.

ii. El error tipo II es el que se comete al aceptar H1:  > o2 cuando es falsa.

iii. La probabilidad de cometer el error tipo I y la de cometer el error tipo II


se reducirían si redujésemos el tamaño muestral.

El error tipo I representa la probabilidad de rechazar la hipótesis nula cuando


en realidad es cierta y se hace corresponder con el nivel de significación fijado
para resolver el contraste.

© Ediciones Pirámide 87
3 Cuestiones y problemas teóricos

CONTENIDO

3.1. Introducción.
3.2. Cuestiones y problemas teóricos.

CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá tener
los siguientes conocimientos previos:

 Conocimientos sobre las técnicas y herramientas propias de la estadísti-


ca descriptiva.
 Probabilidad, variables aleatorias y modelos de distribución de probabi-
lidades.
 Técnicas de inferencia paramétrica: estimación puntual, intervalos de
confianza y contrastes de hipótesis.

OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:

 Realizar desarrollos abstractos y teóricos relacionados con los principa-


les conceptos de la estadística descriptiva.
 Operar con sucesos y probabilidades.
 Operar desde un punto de vista teórico con conceptos relacionados con
las variables aleatorias y los modelos de distribución de probabilidades.
 Desarrollar operaciones teóricas referidas a las técnicas de inferencia
paramétrica: estimación puntual, intervalos de confianza y contrastes de
hipótesis.

89
© Ediciones Pirámide
89
Problemas resueltos de estadística

3.1. INTRODUCCIÓN

En el presente capítulo se incluye una colección de ejercicios y propuestas de


carácter teórico que abarcan demostraciones y desarrollos vinculados con concep-
tos estadísticos, de probabilidad y de inferencia.

En algunos de los campos de la estadística, especialmente la inferencia, y


dentro de ésta en la estimación puntual, los planteamientos de carácter teórico
son mayoritarios en las evaluaciones puesto que su vocación es eminentemente
teórica. De forma complementaria, en prácticamente todas las ramas de la esta-
dística existen aplicaciones susceptibles de ser planteadas desde un punto de
vista teórico.

La solución a cada una de las cuestiones se ha planteado de forma sencilla y


detallada para que el lector pueda seguir el razonamiento lógico que guía a cada
uno de los desarrollos expuestos.

3.2. CUESTIONES Y PROBLEMAS TEÓRICOS

3.1 Demostrar si la siguiente igualdad es cierta:

 2  a2  a12

Siendo σ2 la varianza y a2 y a1 los momentos centrados respecto del origen de


órdenes 1 y 2, respectivamente.

Solución:

Para probar la veracidad de la igualdad expuesta ha de desarrollarse la expre-


sión para el cálculo de la varianza desplegando la expresión elevada al cuadrado y
operando de la forma siguiente:

90 © Ediciones Pirámide
Cuestiones y problemas teóricos

 2  E  X  E  X    E  X 2  E  X   2 XE  X  
2 2

 E  X 2   E  E  X    E  2 XE  X   E  X 2   E  X   2 E  X  E  X  
2 2

 E  X 2   E  X   2 E  X   E  X 2   E  X   a2  a12
2 2 2

3.2 Demostrar si la siguiente igualdad es cierta

P A  B C  P A C  PB C  P A  B C

Solución:

El enunciado propone calcular una probabilidad condicionada cuyo esquema


es el que se observa en la figura siguiente:

Para calcular la probabilidad deseada basta con desarrollar la probabilidad


condicionada recurriendo a la definición y operar con el numerador del cociente:
P  A  B   C  P  A  C    B  C 
P A  B C   
P C  P C 
P  A  C   P  B  C   P  A  B    B  C 
 
P C 
P  A  C   P  B  C   P  A  B  C 
 
P C 
P  A  C  P  B  C  P  A  B  C 
   
P C  P C  P C 
 P A C  PB C  P A  B C

© Ediciones Pirámide 91
Problemas resueltos de estadística

3.3 Conocidas las probabilidades de los sucesos A, B, C, A ∩ B, A ∩ C, B ∩ C y A ∩


B ∩ C, determinar la probabilidad de la unión de sucesos siguiente:

P A  B  C

Solución:

El esquema gráfico de la probabilidad solicitada es el siguiente:

La solución a la probabilidad buscada no tiene más complicación que aplicar


los axiomas de la probabilidad y desarrollar la unión.

P  A  B  C   P  A  B   C   P  A  B   P C   P  A  B   C  
  P  A  P  B   P  A  B    P  C    P   A  C    B  C    
 P  A  P  B   P  A  B   P C   P  A  C   P  B  C   P  A  C    B  C  
 P  A  P  B   P C   P  A  B   P  A  C   P  B  C   P  A  B  C 

3.4 Obtener, empleando la función característica, la esperanza matemática y la va-


rianza de la variable aleatoria definida por la siguiente función de distribución:
F  x   1  e   x x  0

Solución:

El primer paso para resolver la cuestión planteada pasa por deducir la función
de densidad sin más que derivar la función de distribución expuesta en el enun-
ciado:

92 © Ediciones Pirámide
Cuestiones y problemas teóricos

dF  x 
dx
 f  x 
d
dx
1  e x    e x
Una vez conocida la función de densidad, ha obtenerse la función característi-
ca para posteriormente derivarla hasta obtener los momentos. Primeramente la
función característica:

 x  t   E eitx    f  xe
itx
dx   e e dx    e x  it  dx 
  x itx

Dx Dx Dx

  
 e x   it   
 it     0    it 

Una vez obtenida la función característica se calculan la primera y segunda


derivada para deducir a1, a2 y a partir de ellos, α2:

 d x  t    d   
        
d
 dt t  0  dt     it    t  0  dt
1 
    it   
 t 0
 
   1  i   1 1 1
   i  ia1  a1   E  X  
    it   t 0   
2

El momento centrado respecto del origen de orden 2 puede deducirse de la se-


gunda derivada de la función característica particularizada para t = 0:

 d 2 x  t    d 2   

 dt 2    2 
t 0  dt    it
   
d
   t 0  dt
2 
 i    it   
 t 0

   2   i 2  2 2
   i 2 2  i 2 a2  a2  2
    it   t 0  
3

Por último, la varianza es el resultado de restar al momento de orden 2 el


momento de orden uno elevado al cuadrado:

2 1 1
V  X   a2  a12   
 2
 2
2

© Ediciones Pirámide 93
Problemas resueltos de estadística

3.5 Sean dos variables aleatorias independientes distribuidas según las leyes binomia-
les expuestas a continuación:

X 1    k1 ; p 
X 2    k2 ; p 

Demostrar que la variable aleatoria Y, definida como suma de las dos variables
anteriores, se distribuye según un modelo binomial con los siguientes parámetros:

Y  X 1  X 2    k1  k2 ; p 

Solución:

Para demostrar la veracidad de la distribución puede recurrirse a las funciones


características, desarrollando en primer lugar la función característica de la varia-
ble aleatoria Y:

 y  t   E eity   E eit  x  x    E eitx eitx   E eitx  E eitx  


1 2 1 2 1 2

k1  k2
  eitp  1  p    eitp  1  p    eitp  1  p  
k1 k2

Por otro lado, la función característica de la suma de las dos variables aleato-
rias resulta ser el producto de ambas funciones:

 x  x  t    x  t  x  t   E eitx  E eitx  
1 2 2 2
1 2

k1  k2
 eitp  1  p    eitp  1  p    eitp  1  p  
k1 k2

Comprobándose que se obtiene el mismo resultado por ambos caminos y por


tanto la veracidad de la igualdad.

Sea una variable aleatoria distribuida en la población según un modelo binomial


3.6
de parámetros k y p. Si se extrae una muestra de tamaño n suficientemente gran-
de, siendo independientes las extracciones, deducir la distribución de probabili-
dad de la media muestral.

94 © Ediciones Pirámide
Cuestiones y problemas teóricos

Solución:

El teorema central del límite proporciona la herramienta para conocer el mo-


delo de probabilidad al establecer que una sucesión de variables aleatorias con-
verge a una distribución normal si su cantidad es lo suficientemente elevada.

De esta forma, sabiendo que la media muestral no es más que una combina-
ción lineal de variables aleatorias, y que según el enunciado el tamaño muestral
es lo suficientemente elevado, podrá aceptarse el siguiente planteamiento:

TCL  n  

x   i 1 xi n  N E  x ; V  x 
i n

Simplemente resta por conocer los valores concretos para esperanza mate-
mática y varianza para lo cual se aplican sendos operadores sobre la media
muestral:

 1 i n  1
E  x   E   i 1 xi   E  i 1 xi    i 1 E  xi   E  xi   kp 
i n 1 i n
n  n   n

1 i n
  kp  kp
n i 1

La varianza se obtiene como sigue:

 1 i n  1
V  x   V   i 1 xi   2 V   i 1 xi   2  i 1 V  xi   V  xi   kp 1  p  
in 1 in

n  n   n

1 kp 1  p 
2  i 1
in
 kp(1  p ) 
n n

En los desarrollos anteriores se han empleado los valores para la esperanza


matemática y la varianza de una distribución binomial, que son los siguientes:
E[X] = kp; V[X] = kp(1 – p).

Puede por tanto concluirse finalmente que la distribución de probabilidad de la


media muestral es la siguiente:

© Ediciones Pirámide 95
Problemas resueltos de estadística

TCL  n 
 kp 1  p  
x   i 1 xi n  N  kp;
i n

 n 
 

La expresión anterior permite también deducir la distribución de la media


muestral en caso de que la distribución poblacional fuese un modelo de Bernoulli,
sin más que suponer k = 1:

TCL  n  
 p 1  p  
x   i 1 xi n  N  p;
i n

 n 
 

3.7 Justificar, de forma razonada, el modelo de probabilidad mediante el que se dis-


tribuye el siguiente estadístico supuestamente enmarcado en el estudio de una
variable aleatoria normalmente distribuida:

 n  1 sn21
2

Solución:

Para estudiar el modelo de distribución del referido estadístico cabe comenzar


por el estudio del numerador, que en realidad se trata de una combinación lineal,
sumatorio, de variables aleatorias normales:

 x  x
i n 2
i 1 i

Utilizando el lema de Fisher se puede aceptar que el sumatorio anterior equi-


vale, en términos de probabilidad, a una suma de variables aleatorias normales en
los términos siguientes:

 x  x   N 2  0; 2 
in 2 i  n 1
i 1 i i 1

Queda por tanto caracterizado el numerador como una suma de n - 1 variables


aleatorias normales centradas en el origen y con varianza σ2. Basta incorporar este

96 © Ediciones Pirámide
Cuestiones y problemas teóricos

resultado en el estadístico propuesto en el enunciado para comprobar el modelo


de distribución:

 N 2  0; 2  i  n 1  N  0;  
i  n 1
2 2
  i 1     i 1 Z  0;1   n 1
i 1 i  n 1 2 2

2   2

Puede por tanto concluirse que el estadístico referido se distribuye según un


modelo chi-cuadrado con n - 1 grados de libertad:

 n  1 sn21   2
n 1
2

3.8 Sea una variable aleatoria distribuida en la población según una distribución de
Poisson de parámetro λ. Si se extrae una muestra de tamaño lo suficientemente
grande, siendo independientes las extracciones, deducir la distribución de proba-
bilidad de la media muestral.

Solución:

El teorema central del límite proporciona el fundamento teórico que permite


aceptar que la distribución de la media muestral será un modelo normal con los
siguientes parámetros:

x   i 1 xi n 
i n TCL n  

 N E  x ; V  x  
Simplemente queda por calcular los valores concretos para la esperanza ma-
temática y la varianza de la distribución normal. Para ello debe recordarse que la
esperanza matemática y la varianza para el modelo de Poisson son iguales al pa-
rámetro λ y trabajar con los referidos operadores de la forma siguiente:

 1 i n  1
E  x   E   i 1 xi   E  i 1 xi    i 1 E  xi    E  xi    
in 1 in
n  n   n
1 i n
   
n i 1

© Ediciones Pirámide 97
Problemas resueltos de estadística

 1 i n  1
V  xi   V  xi    
1
V  x   V   i 1 xi   2 V   i 1 xi   2 
in i n

n  n   n i 1

1 in


n2
  n
i 1

Por último, la deducción formal del modelo se expone a continuación:

x   i 1 xi n 
i n P
 N ;  n  

3.9 Deducir el estimador máximo verosímil para el parámetro λ de un modelo de


distribución de Poisson.

Solución:

La función de verosimilitud es una función de probabilidad conjunta de cada


una de las observaciones de la muestra. Matemáticamente se trata de una función
de probabilidad conjunta y para el modelo de Poisson adopta la forma siguiente:

e  n   i1
i n
xi

L  x1 , x2 ,.., xn ;     i 1 f  xi ;   
in


in
i 1
xi !

El estimador de máxima verosimilitud es el que maximiza la función con di-


cho nombre, con lo que para obtener el estimador habrá de derivarse esta función
respecto del parámetro λ, operación que se simplifica tomando logaritmos:

 
d   e  n   i1 i
i n

dLn  L  x1 ,..., xn ;    x

 Ln  
d d     i  n xi ! 
  i 1 

 xi
i n


d 
d  
 n Ln  e      x  Ln     
in
i 1 i
 

 Ln  i 1 xi !    n  i 1
i n

98 © Ediciones Pirámide
Cuestiones y problemas teóricos

La expresión anterior se iguala a cero forzando la primera condición de máxi-


mo, refiriéndose ya al estimador de máxima verosimilitud y despejando este es-
timador:

dLn  L  x1 ,..., xn ;    
i n
xi
  mv  x   i 1 xi n
i n
 0  n  i 1

d  mv

Como puede observarse de la deducción anterior, el estimador de máxima ve-


rosimilitud para el parámetro λ de la distribución de Poisson resulta ser la media
muestral.

La comprobación de que la media muestral es el estimador que maximiza la


verosimilitud se obtiene calculando la segunda derivada y comprobando que su
signo es negativo:

d 2 Ln  L  x1 ,..., xn ;    d   1 in  1
 n    i 1 xi     2 
in
0 xi  0
d2 d       i 1

3.10 Comprobar si la media muestral es un estimador de varianza mínima para el pa-


rámetro λ de una distribución de Poisson.

Solución:

Para comprobar si la media muestral es un estimador de varianza mínima para


el parámetro λ habrá de calcularse la varianza del estimador y la cota de Cramer-
Rao para la distribución de Poisson, comparando ambos para ver si son iguales.

La varianza se calcula sin más que aplicar el citado operador matemático al


estimador media muestral:

1   i n   1  i n
V  x   V   i 1 xi n  2 V   i 1 xi    n 2   i 1 V  xi 

in

  n

 V  xi     2
1  i n    
n  i 1  n

© Ediciones Pirámide 99
Problemas resueltos de estadística

Una vez conocida la varianza se calcula la cota de Cramer-Rao en los térmi-


nos descritos en el desarrollo siguiente, en el que se comienza definiendo la cota
desde comenzando por el denominador:

e   x
f  x;  
x!

Ln  f  x;        xLn     Ln  x !

dLn  f  x;   x x


 1  
d  

A continuación se aplica el operador esperanza matemática sobre el cuadrado


de la expresión anterior:

 dLn  f  x;   2   x    2    x   2 
   
  E 
E 
      E 
d        2 


1
2 
2
 

2
 
1

E  x      E   x       2  V  X   2 V  X  

 V  X    
1

Una vez caracterizado el denominador, queda pendiente calcular la derivada


del sesgo para definir el denominador:

B  x     E  x     E   i 1 xi n       i 1 E  xi  n  
i n i n

   
   E   i 1  n       0
i n

 

Al ser la media muestral un estimador insesgado del parámetro, el numerador


de la cota de Cramer-Rao es igual a la unidad.

100 © Ediciones Pirámide


Cuestiones y problemas teóricos

2
 dB    
1   
 
VCR   d  
1

 dLn  f  X ;      2
n 1   n
nE    
 d  

Basta con comparar la cota obtenida con la varianza previamente calculada


para comprobar que son iguales y que, por tanto, la media muestral es un estima-
dor de varianza mínima para el parámetro λ de la distribución de Poisson:

 
V  x    VCR 
n n

3.11 Comprobar si el estadístico suma es un estimador suficiente del parámetro λ de


una distribución de Poisson.

Solución:

El teorema de factorización de Fisher-Neyman proporciona una herramienta


adecuada para comprobar si la media muestral es un estimador suficiente para el
parámetro λ de una distribución de Poisson.

El uso del citado teorema exige recurrir a la función de verosimilitud que se


expone a continuación:

e  n   i1
in
xi

L  x1 , x2 ,.., xn ;     i 1 f  xi ;   
in


in
i 1
xi !

Un estimador suficiente según el teorema aludido será aquel que permita ex-
presar la función de verosimilitud como producto de dos funciones, la primera de
las cuales depende del parámetro y de la muestra a través del estimador y la se-
gunda depende de la muestra pero no a través del estimador:

 
L  x1 , x2 ,.., xn ;    g   x1 , x2 ,.., xn  ;   h  x1 , x2 ,.., xn 

© Ediciones Pirámide 101


Problemas resueltos de estadística

Cabe por tanto analizar la función de verosimilitud expuesta de cara a discutir


su posible agrupación. En este caso concreto, la función de verosimilitud puede
expresarse de la forma siguiente:

  x 
g   x1 , x2 ,...xn  ;   e  n   i1 i 
i n


L  x1 , x2 ,.., xn ;    e  n   i1 i
i n
x 1
1 
h  x1 , x2 ,...xn    x1 !...xn !
x1 !...xn ! 

Puede por tanto concluirse que el estadístico suma es un estimador suficiente


para el parámetro λ de una distribución de Poisson.

3.12 Deducir el estimador de máxima verosimilitud para el parámetro p de una distri-


bución binomial cuyos parámetros son el citado p y k.

Solución:

La obtención del estimador de máxima verosimilitud requiere deducir la fun-


ción de verosimilitud y obtener la expresión para el parámetro que maximiza
dicha función. El primer paso consiste, por tanto, en obtener la función de vero-
similitud para la distribución binomial:

i  n  k  kx 
L  x1 , x2 ,..., x n ; k , p    i 1 f  xi ; k , p    i 1    p xi 1  p  i  
in

  xi  
 in  k 
   i 1    p  i 1 i 1  p   i 1 i
in in
x kn  x

  xi  

Una vez expuesta la función de verosimilitud debe derivarse respecto del pa-
rámetro para el que se busca un estimador e igualar a cero para comprobar la
primera condición de máximo. Para facilitar el cálculo cabe tomar logaritmos y
operar de la forma siguiente:

Ln  L  x1 , x2 ,..., xk ; p   
 i n  k 
 Ln  i 1    
  xi  
  x  Ln  p    kn   x  Ln 1  p 
i n
i 1 i
i n
i 1 i

102 © Ediciones Pirámide


Cuestiones y problemas teóricos

Se deriva la expresión logarítmica anterior:

   i n  k  
 Ln     
p   i 1  xi  
  x  Ln  p    kn   x  Ln 1  p   
i n
i 1 i
i n
i 1 i

  i n
i 1  
xi p   kn   i 1 xi

i n
 1  p 
Finalmente se iguala a cero fijando la condición de máximo y refiriéndose ya
al estimador:

 in
i 1  
xi p mv   kn   i 1 xi
i n
 1  p   0  p
mv mv   i 1 xi kn
i n

Por último, la segunda derivada debe ser negativa para confirmar la condición
de máximo:

2
L  x1 , x2 ,..., xn ; k , p   0 
p 2


 
p 
 i n
i 1  
xi p   kn   i 1 xi

i n
 1  p  
  i n
i 1  
xi p 2   kn  i 1 xi

i n
 1  p 
2 


Pudiendo comprobarse que la segunda derivada es negativa y que por el esti-


mador deducido es el que maximiza la función de verosimilitud.

3.13 Deducir el estimador por el método de los momentos para el parámetro p de una
distribución binomial de parámetros k y p.

Solución:

El estimador obtenido por el método de los momentos es el que procede de


igualar los momentos poblacionales y los muestrales. En este caso, al tratarse de un
único parámetro se recurrirá a los momentos de orden uno.

© Ediciones Pirámide 103


Problemas resueltos de estadística

El planteamiento y la deducción son sencillos tal y como puede observarse a


continuación:

E  X   a1  kp   i 1 xi n  p m   i 1 xi kn
i n i n

Puede comprobarse cómo los estimadores por los métodos de los momentos y
de la máxima verosimilitud para el parámetro p de la distribución binomial coin-
ciden.

3.14 Comprobar en el parámetro si la media muestral es un estimador eficiente del


parámetro p de una distribución de Bernoulli.

Solución:

La eficiencia implica la doble comprobación de la insesgadez y de la varianza


mínima.

Comenzando por la comprobación de la insesgadez, a continuación se deduce


la esperanza matemática del estimador y se compara con el verdadero valor del
parámetro de cara a obtener el sesgo:

1 
B  x   p  E  x   p  E  i 1 xi n   p   E  i 1 xi   
i n i n

  n   
 1 i n   1 i n 
 p    i 1 E  xi     E  xi   p  p    p   p  np  0
1
n   n i 1  n

Tras comprobar el sesgo, el análisis se centra en el estudio de la varianza, para


lo cual ha de calcularse la varianza del estimador y la cota de Cramer-Rao para la
distribución. El cálculo de la varianza es el siguiente:

V  x   V  i 1 xi n   2 i 1 V  xi   V  xi   p 1  p  
i n 1 i n

  n  

1  i n p 1  p 
2   i 1
 p 1  p   
n  n

104 © Ediciones Pirámide


Cuestiones y problemas teóricos

A continuación se calcula la cota de Cramer-Rao calculando comenzando por


el denominador:

f  x; p   p x 1  p 
1 x

Ln  f  x; p    xLn  p   1  x  Ln 1  p 

Ln  f  x; p   x 1  x  x p
  
p p 1  p  p 1  p 

El paso siguiente requiere calcular la esperanza matemática de esta función


elevada al cuadrado:

 Ln  f  x; p   2   x  p  2    x  p 2 
   
E    E     E 
     
  p 1  p   
p  p 1 p   2

     


1
 p 1  p  
2   
E  x  p    E  x  p     2  V  X   p 1  p  
2

2
 
1 1
 p 1  p  
 p 1  p  
2
 p 1  p  

Así, teniendo en cuenta que el estimador es insesgado, se deduce la cota de


Cramer-Rao de la forma siguiente:

 dB  x  
2

1  
 dp  1 p 1  p 
VCR   
 Ln  f  x; p   
 
2
 
n 1  p 1  p    n
nE  
 p  

© Ediciones Pirámide 105


Problemas resueltos de estadística

Puede comprobarse, por tanto, que varianza y cota de Cramer Rao coinciden,
lo que hace que la media muestral sea un estimador eficiente para el parámetro p
de una distribución binomial:

p 1  p  p 1  p 
V x   VCR 
n n

3.15 Comprobar si la media muestral es un estimador consistente del parámetro λ de


una distribución de Poisson.

Solución:

La consistencia implica comprobar el cumplimiento de los dos límites que fi-


jan las condiciones suficientes:

lim B    0
n   

lim V    0
n   

Basta con particularizar las condiciones anteriores para la media muestral y


el modelo de distribución de Poisson para comprobar que el estimador es con-
sistente:

lim E  x     E  x   
n 


lim V  x   0  lim V  x   lim    0
n  n 
 
n  n

Puede comprobarse, por tanto, que el estimador es consistente.

3.16 Calcular el estimador de máxima verosimilitud para el parámetro µ de una distri-


bución normal de parámetros µ y σ.

106 © Ediciones Pirámide


Cuestiones y problemas teóricos

Solución:

El primero de los pasos exige calcular la función de verosimilitud para la dis-


tribución normal:
  xi   
2

L  x1 , x2 ,..., xn ;  ,    i 1 f  xi ;  ,    i 1  2 
in i n 1 2
 2 1 2
e 2 2

 i1  xi   
i n 2

  2 
n 2
 2 n 2
e 2 2

El estimador de máxima verosimilitud para el parámetro μ viene de derivar la


función de verosimilitud respecto de dicho parámetro. Para simplificar la opera-
ción se toman logaritmos previamente a derivar:

  xi   
i n 2

Ln  L  x1 , x2 ,..., xn ;  ,     Ln  2   Ln  2   i 1 2
n n
2 2 2

Igualando a cero se fija la primera condición de máximo y se puede hacer re-


ferencia al estimador despejando su valor:


 
1
Ln  L  x1 , x2 ,..., xn ;  ,    0  2  i 1 xi  
i n  

mv 
  i 1 xi  
i n
   i 1 i  i 1  mv   i 1 xi  n mv  0 
  0  in x  in 
mv
i n

 
 i 1 xi n  x
i n
 mv

La segunda condición de máximo se comprueba recurriendo a la segunda de-


rivada de la función de verosimilitud:

2   1  n
2  i 1  i
Ln  L  x1 , x2 ,..., xn ;  ,    0  x     2
i n

 2 
    

3.17 Se desea obtener el estimador de máxima verosimilitud del parámetro θ del mo-
delo de probabilidad definido por la siguiente función de densidad:

f ( x; )  1    x  0  x  1

© Ediciones Pirámide 107


Problemas resueltos de estadística

Solución:

Para calcular el estimador de máxima verosimilitud se obtiene la función de


verosimilitud como sigue:

L  x1 , x2 ,..., xn ;    i 1 f  xi ;    i 1 1    xi 
in i n

 1    
in
xi
n
i 1

Antes de fijar la primera condición de máximo se toman logaritmos:

Ln  L  x1 , x2 ,..., xn ;    nLn 1      Ln  i 1 xi 


in

La derivada respecto del parámetro adopta la forma siguiente:

d n
Ln  L  x1 , x2 ,..., xn ;     Ln  i 1 xi 
in

d 1   

En último lugar se iguala a cero despejando el estimador:

d n
Ln  L  x1 , x2 ,..., xn ;    0   Ln  i 1 xi  
i n

d 

1   mv 
n
  mv  1
 Ln  xi 
in
i 1

La segunda derivada de la función de verosimilitud permite comprobar el ca-


rácter máximo del estimador obtenido:

d2
Ln  L  x1 , x2 ,..., xn ;    0 
d  n
d  1   
 Ln  i n

xi  
n
d 2  1   
i 1 2

108 © Ediciones Pirámide


Cuestiones y problemas teóricos

3.18 Se desea obtener el estimador por el método de los momentos del parámetro θ del
modelo de probabilidad definido por la siguiente función de densidad:

f ( x; )  1    x  0  x  1

Solución:

Para calcular el estimador por el método de los momentos ha de obtenerse la


esperanza matemática de la variable aleatoria e igualarla al momento muestral de
orden uno respecto del origen.

Comenzando por la esperanza matemática:

  1  2    1
1

E  X    xf  x  dx   x 1    x dx   1    x 1dx 
1 1
x  
Dx 0 0  2 0   2

Simplemente queda por igualar la esperanza matemática anterior a la media


muestral (momento centrado respecto del origen de orden uno) y despejar el es-
timador:

 m  1 2x  1
 x   m 

m 2 1 x

3.19 Deducir de forma razonada, mediante el método de la cantidad pivotal, la expre-


sión que permite calcular un intervalo de confianza con un nivel de significación
α para la varianza de una población normal supuestamente desconocido su valor
medio y conocida la cuasidesviación típica muestral.

Solución:

El método de la cantidad pivotal exige identificar un pivote de carácter aleato-


rio cuya distribución de probabilidad sea conocida. A partir de esta cantidad pivo-
tal se deducen los límites del intervalo de confianza. El planteamiento puede es-
quematizarse como sigue:

P  q1  Q  q2   1    P  LI    LS   1  

© Ediciones Pirámide 109


Problemas resueltos de estadística

Las exigencias planteadas en el enunciado imponen el recurso a la siguiente


cantidad pivotal:

Q
 n  1 sn21   2
 n 1
2

Utilizando el referido pivote debe desarrollarse la probabilidad que define un


intervalo de confianza y despejar los límites del intervalo:

P  LI   2  LS   1  

Para llegar a despejar los límites (LI, LS) reflejados en la expresión anterior se
parte de la probabilidad correspondiente referida a la cantidad pivotal y se desa-
rrolla hasta despejar la varianza en el centro del intervalo y los límites en los dos
extremos:

 2  n  1 sn21 2 
P  q1  Q  q2   1    P   2   1 2   1  
 2 

Simplemente despejando y operando con las inecuaciones interiores pueden


despejarse los límites del intervalo sin complicación:

110 © Ediciones Pirámide


Cuestiones y problemas teóricos

 2  n  1 sn21 2   2 2 1 12 2 


P   2   1 2   1    P   2 
2   n  1 sn 1   n  1 sn21 
2
 
  n  1 sn21  n  1 sn21   P   n  1 sn21   2   n  1 sn21 
 P   2
   
  2 12 2   1 2 2 2 
2 2

Quedando por tanto el límite formalmente expresado como sigue:

  n  1 sn21  n  1 sn21 
IC  ;    2
2
; 
 1 2 2 2 

3.20 Deducir de forma razonada, mediante el método de la cantidad pivotal, la expre-


sión que permite calcular un intervalo de confianza con un nivel de significación
α para la media de una población normal supuestamente desconocido su valor
medio y conocida la cuasidesviación típica muestral.

Solución:

El uso de la técnica de la cantidad pivotal requiere proponer el pivote adecua-


do y desarrollar la definición del intervalo de confianza. El planteamiento del
problema es el siguiente:

P  q1  Q  q2   1    P  LI    LS   1  

La cantidad pivotal acorde con las exigencias del enunciado es la siguiente:

x 
Q  t n 1
 sn n 1 
El esquema del intervalo y de su definición se refleja a continuación:

P  LI    LS   1  

© Ediciones Pirámide 111


Problemas resueltos de estadística

Por último, el desarrollo del intervalo a partir del planteamiento de la cantidad


pivotal:

 x  
P  q1  Q  q2   1    P t 2   t1   1

sn n  1  2



La deducción de los límites:

 x     s   s 
P t 2   t1 2   1    P t 2  n   x    t1 2  n 1   
 sn n  1     n 1   n 

  s   s 
P   x  t 2  n       x  t1 2  n   
  n 1   n  1 
  s 
 s 

 P  x  t 2  n     x  t1 2  n    t 2  t1 2 
  n 1   n  1 

  s   s 
 P  x  t1 2  n     x  t1 2  n  
  n 1   n  1 

Por último, la formulación del intervalo:

  s 
IC   ;    x  t1 2  n  
  n  1 

112 © Ediciones Pirámide


Cuestiones y problemas teóricos

3.21 Deducir la función de potencia para el siguiente contraste de hipótesis suponiendo


el comportamiento normal de la variable en la población y conocida la varianza
poblacional:

H 0 :   0
H1 :   0

Solución:

La potencia del contraste queda definida como la complementaria de la proba-


bilidad vinculada al riesgo de segunda especie:

    P  AH 0 H 1 
P    1      P  RH 0 H 1 

Con lo que el cálculo de la función de potencia ha de partir del planteamiento


y desarrollo de la probabilidad referida. Dicha probabilidad implica que el esta-
dístico se ubique en la región crítica para los diferentes valores del parámetro µ.
Para ello se empieza definiendo la probabilidad vinculada a aceptar la hipótesis
nula:

 x  0    
P  AH0 H0   P   Z1   P  x  0  Z1  
 n   n 
  
  x1  0  Z1   P  x  x1 
 n 

Sobre esta probabilidad se incorpora la condición vinculada a la hipótesis al-


ternativa:

 x     H1 x1     H1   x1     H1 
P  AH0 H1   P  x  x1 H1   P     P Z  
  n  n    n 

Para el cálculo de la función de potencia únicamente resta aplicar la comple-


mentaria a la probabilidad anterior y desarrollar el contenido de la probabilidad:

© Ediciones Pirámide 113


Problemas resueltos de estadística

 x1     H1 
P     1       1  P Z  
  n 


1 P Z 
 
0   n Z1     H1 
  
  n 
 
 
 1  P  Z  Z1 

n
0     H1   
 

3.22 Proponer una regla que permita decidir entre dos contrastes unilaterales para la
media de una población normal en los términos siguientes:

H 0 :   0
H1 :   1

Solución:

Para resolver la cuestión planteada debe recurrirse al estudio de la potencia de


los contrastes y para ello el lema de Neyman-Pearson proporciona una herramien-
ta válida.

Ha de calcularse el cociente entre las funciones de verosimilitud vinculadas a


ambas hipótesis y compararse con un valor umbral. El cociente entre las funcio-
nes de verosimilitud es el siguiente:

 i1  xi  1 
i n 2

   i1  xi  0    i1  xi  1 
i n i n
2 n 2
 2 
n 2 2 2

L  x1 , x2 ,..., xn ; 1 ,  e 2 2

 e 2 2

L  x1 , x2 ,..., xn ; 0 ,   i1  xi  0 
i n 2

 2 
n 2
  2 n 2
e 2 2

El criterio de decisión implica rechazar la hipótesis nula si el citado cociente


es mayor o igual que una determinada cantidad constante k. El objetivo, por tanto,
es encontrar un valor de la media muestral por encima del cual habrá de rechazar-
se la hipótesis nula y para ello se opera hasta despejar la media muestral.

114 © Ediciones Pirámide


Cuestiones y problemas teóricos

Se persigue, por consiguiente, aislar la media muestral y vincularla con una


cantidad constante de la forma siguiente:

 i1  xi  1    i1  xi  0 
i n 2 i n 2

 k   i 1  xi  0    i 1  xi  1   2 2 Ln  k  
in 2 i n 2
2 2
e
 n  02  12   2  0  1   i 1 xi  Ln  2k 2  
in

2 2 Ln  k   n  02  12  Ln  2k 2   n  02  12 


  i 1 xi 
i n
x
2  0  1  2n  0  1 

La expresión anterior exige, por tanto, rechazar la hipótesis nula si la media


muestral supera la referida cantidad.

3.23 Se sabe que la función de densidad de una determinada variable aleatoria adopta
la forma siguiente:

f ( x;  )   e  x  x  0

Se plantea un contraste de hipótesis acerca del parámetro poblacional en los


términos siguientes:

H 0 :   0
H1 :   1

Se desea determinar la mejor región crítica empleando un nivel de significa-


ción α.

Solución:

La solución a este planteamiento la proporciona el lema de Neyman-Pearson,


que parte del cociente de las funciones de verosimilitud vinculadas a ambas hipó-
tesis. La función de verosimilitud de la distribución referida para una muestra
aleatoria simple de tamaño n es la siguiente:

L  x1 , x2 ,..., xn ;    i 1 f ( xi ; )   i 1  e xi   n e  i1 i


i n
in i n  x

© Ediciones Pirámide 115


Problemas resueltos de estadística

El cociente entre las funciones de verosimilitud es el siguiente:

1n e 
i n

L  x1 , x2 ,..., xn ;1 

      in x
x n

  1  e 0 1  i1 i
1 i 1 i


L  x1 , x2 ,..., xn ;0  0n e   0 
i n
o x
i 1 i

Simplemente resta fijar la condición de rechazo y operar hasta encontrar el es-


timador adecuado:

 1  0 1  ii1n xi  


n

 k  nLn  1    0  1   i 1 xi  Ln  k  
in
  e
 0  0 
Ln  k   nLn 1  0  Ln  k   nLn 1  0 
  i 1 xi 
i n
x
0  1  n  0  1 

Debiendo rechazarse la hipótesis nula si la media muestral fuese mayor que la


cantidad expresada.

3.24 El tiempo de funcionamiento en horas de una determinada cámara de control es


una variable aleatoria cuya función de densidad es la siguiente:

f  x;    2 xe  x x0

Se sabe que la esperanza matemática de la citada variable aleatoria es igual a


2/ y la varianza es igual a 2/ 2.

1. Calcular el estimador para el parámetro  por el método de máxima vero-


similitud.

2. ¿Es el estimador obtenido insesgado?

3. Sea la media muestral el estimador del parámetro . ¿Sería este nuevo es-
timador más eficiente que el estimador calculado en los apartados ante-
riores? Razónese para  = 1.

116 © Ediciones Pirámide


Cuestiones y problemas teóricos

Solución:

1. Calcular el estimador para el parámetro  por el método de máxima vero-


similitud.

El estimador de máxima verosimilitud requiere obtener el valor del parámetro


que hace máxima dicha función, para lo cual el primer paso es obtener la citada
función:

L  x1 , x2 ,..., xn ;    i 1 f  xi ;    i 1  2 xi e xi 
in in

 
x e  i1 i
i n
i n 
  2n
x
i 1 i

Para simplificar la derivación posterior se toman logaritmos en la función de


verosimilitud:


  x 
x e  i1 i  
i n

LnL  x1 , x2 ,..., xn ;   Ln  2 n
i n 
 i 1 i 
 2nLn  Ln  i n
i 1

xi    i 1 xi
in

El paso siguiente exige derivar el logaritmo de la función de verosimilitud:

d
d
 LnL  x1 , x2 ,..., xn ;   
d 
d 
2nLn  Ln  i n
i 1

xi    i 1 xi  
in

2n
  i 1 xi
in

Igualando a cero la anterior derivada se fija la primera condición de máximo y


puede obtenerse un primer candidato a estimador:

d 2n 2n
 LnL  x1 , x2 ,..., xn ;    0    i 1 xi   mv  i  n
in
 
d  mv  xi i 1

Simplemente resta calcular la segunda derivada del logaritmo de la función de


verosimilitud para comprobar si el estimador obtenido en realidad constituye un
máximo de la función:

© Ediciones Pirámide 117


Problemas resueltos de estadística

d2 d  2n  2n
Ln  L  x1 , x2 ,..., xn ;    0    i 1 xi   2
i n

d 2 
d    

El signo de la segunda derivada es negativo y por tanto se verifica la bondad


del estimador.
2. ¿Es el estimador obtenido insesgado?
Ha de calcularse el sesgo del estimador que requiere obtener la esperanza ma-
temática del mismo y restársela al verdadero valor del parámetro:

B  mv     E  mv     E  2n  xi     2nE 1  xi  


i n i n
i 1 i 1

2n 2n 2n
      0
 E  xi   E  xi  2n 
i n in
i 1 i 1

Pudiendo comprobarse que se trata de un estimador insesgado.

3. Sea la media muestral el estimador del parámetro . ¿Sería este nuevo es-
timador más eficiente que el estimador calculado en los apartados ante-
riores? Razónese para  = 1.
Para pronunciarse respecto de la eficiencia de los dos estimadores ha de calcu-
larse la varianza de cada uno de ellos:

4n 2
 
i n i n
V ˆmv   V  2n x   4n 2
i 1 i 
V  xi    2n 2
i 1
2n  2

 i 1 V  xi   2n  2  2
i n

  i 1 i 
i n
V x  V  x n  
n2 n2 n 2
Simplemente queda particularizar para θ = 1 y pronunciarse respecto del esti-
mador más eficiente:

V ˆmv   2n 2  2n
2 2
V x  
n 2
n

A la vista de tales resultados, el estimador más eficiente será la media mues-


tral al proporcionar una varianza inferior al otro estimador.

118 © Ediciones Pirámide


4 Ejercicios de aplicación

CONTENIDO

4.1. Introducción.
4.2. Ejercicios de aplicación.

CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá tener
los siguientes conocimientos previos:

 Conocimientos teóricos y aplicados sobre estadística descriptiva univa-


riante y bivariante.
 Conocimientos acerca de operaciones con sucesos y probabilidad y los
teoremas de uso frecuente.
 Manejo y operativa con variables aleatorias continuas y discretas.
 Conocimientos teóricos y aplicados acerca de los modelos de distribu-
ción de probabilidades de uso más frecuente.
 Inferencia estadística: estimación puntual, estimación por intervalos y
contrastes de hipótesis.

OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:

 Resolver ejercicios complejos de estadística y probabilidad que incluyan


conceptos de diferentes unidades teóricas.
 Operar con datos y técnicas propias de la estadística descriptiva interpre-
tando los resultados.
 Resolver problemas complejos de probabilidad y variables aleatorias.
 Resolver ejercicios complejos de inferencia estadística.

© Ediciones Pirámide 119


Problemas resueltos de estadística

4.1. INTRODUCCIÓN
A lo largo de este último capítulo del manual se presentará un conjunto de
ejercicios de aplicación numérica en su mayoría. Se trata de ejercicios concebidos
desde una perspectiva global del conocimiento estadístico.
En muchos de los ejercicios expuestos se combinan conceptos de diferentes
unidades teóricas, lo que hace que la solución requiera de una perspectiva
completa del área de conocimiento y una considerable capacidad de interrelación
entre conceptos diferentes.
Los ejercicios expuestos incluyen la solución con explicaciones que permiten
al lector seguir el razonamiento seguido hasta obtener la solución.

4.2. EJERCICIOS DE APLICACIÓN

4.1 Un televisor tiene un gran número de válvulas, tanto de tipo A como de tipo B,
todas independientes entre sí. El número medio de válvulas tipo A que se es-
tropean al año sigue un modelo cuyo parámetro es 2 y suponiendo estabilidad
e independencia en el proceso. El número de válvulas tipo B que se estropean
se puede representar por una variable aleatoria cuya función de masa es la
siguiente:

P X B  i   i i  1, 2, 3

P X B  i    (7  i) i  4, 5, 6

Donde i es el número de válvulas que se estropean en un año. Se supone que


no existe ninguna relación entre las válvulas tipo A y las válvulas tipo B que se
estropean.
1. Calcule la constante  para que la función de cuantía del número de vál-
vulas esté bien definida.
2. Calcule el número esperado de válvulas de tipo B que se estropean en un
año.

120 © Ediciones Pirámide


Ejercicios de aplicación

3. Qué es más probable, ¿que en un año determinado se estropee una válvu-


la de tipo A o una de tipo B?
4. Si un televisor se estropea cuando lo hacen más de dos válvulas del tipo A
o más de tres válvulas del tipo B, ¿cuál es la probabilidad de que un tele-
visor se estropee?
5. Si un televisor tiene cinco válvulas de tipo A y siete de tipo B, calcular la
probabilidad de que, sabiendo que se ha estropeado una válvula, ésta sea
de tipo A.
Solución:
1. Calcule la constante  para que la función de cuantía del número de vál-
vulas esté bien definida.
Se dispone de información sobre el número de válvulas que se estropean en un
determinado proceso. Esta variable puede adoptar un número finito de resultados,
con lo que se trata de una variable aleatoria discreta.
El enunciado proporciona la función de cuantía y solicita determinar el valor
de  para que esa función esté bien definida. Para determinar el valor de ese pa-
rámetro ha de recurrirse a las propiedades de la función de cuantía y recordar que
la suma de los valores de la función de cuantía en cada punto del dominio de la
variable (probabilidades vinculadas a todos los posibles resultados de la variable)
debe ser igual a la unidad:

 P X
Dx B  i  1

Teniendo en cuenta la propiedad anterior, simplemente resta sustituir y despe-


jar el valor de  como sigue:
 i 3 i    i 6  (7  i)   1 
 i 1   i 4 
  2  3    (7  4)   (7  5)   (7  6)  1    0,08
2. Calcule el número esperado de válvulas de tipo B que se estropean en un
año.
El número esperado de válvulas que se estropean en un año puede calcularse a
través de la función esperanza matemática de una variable aleatoria que, cuando
se trata de una variable discreta, adopta la forma siguiente:
E  X B   D xBi P X B  xBi   D iP X B  xBi 
x x

© Ediciones Pirámide 121


Problemas resueltos de estadística

Sustituyendo cada valor de i y de su correspondiente probabilidad mediante la


función de cuantía, se obtiene la esperanza matemática de la forma siguiente:

E  X B   i 1 i  0,08i    i 4 i  0,08(7  i) 


i 3 i 6

  0,08  0,32  0,72  0,96  0,80  0,56  3,36


No debe extrañar que el número esperado adopte un valor con decimales pues-
to que no se trata de un resultado para la variable aleatoria, sino de un número
esperado que corresponde con un valor medio
3. Qué es más probable, ¿que en un año determinado se estropee una válvu-
la de tipo A o una de tipo B?
Para contestar a este apartado ha de calcularse la probabilidad de que se averíe
una válvula del tipo A, la probabilidad de que se averíe una válvula del tipo B y
comparar ambos resultados.
El cálculo de la probabilidad de avería de la válvula tipo B es sencillo y sim-
plemente procede sustituir el resultado en cuestión (XB = 1) en la función de cuan-
tía anterior:
P XB 1  0,081 0,08
Para calcular la probabilidad de que una válvula del tipo A se estropee hay que
recurrir a la función de cuantía para un modelo de Poisson puesto que se trata de
un experimento cuyos resultados son discretos (número de válvulas que se estro-
pean), pero referido a un medio continuo (tiempo, medido en años en este caso).
Para aplicar la función de cuantía del modelo de Poisson ha de conocerse el
valor del parámetro (λ) que representa la tasa habitual con la que ocurre el fenó-
meno objeto de estudio (tasa con la que habitualmente se estropean las válvulas al
año) y que el enunciado fija en un valor de 2.
Basta con sustituir en la expresión de la función de cuantía de la distribu-
ción de Poisson y calcular la probabilidad de que se estropee una válvula del
tipo A:

e    xAi e 2 21
P  X A  x Ai    P  X A  1   0, 27
x Ai ! 1!
Comparando ambas probabilidades puede concluirse que es más probable que
se estropee una válvula del tipo A.

122 © Ediciones Pirámide


Ejercicios de aplicación

4. Si un televisor se estropea cuando lo hacen más de dos válvulas del tipo A


o más de tres válvulas del tipo B, ¿cuál es la probabilidad de que un tele-
visor se estropee?
El enunciado exige calcular la probabilidad de la unión de dos sucesos: es-
tropearse más de dos válvulas del tipo A o estropearse más de tres válvulas del
tipo B.
Para calcular la probabilidad de la unión de estos dos sucesos se recurre a los
axiomas de la probabilidad. Así, particularizando para el caso del presente enun-
ciado, la probabilidad solicitada puede calcularse como sigue:

P A  B  P A  P A  P A  B 
P X A  2  XB  3  P X A  2  P XB  3  P X A  2  XB  3

El cálculo de las dos probabilidades absolutas incluidas en la expresión ante-


rior resulta sencillo y basta con sustituir en la función de cuantía tanto para la
válvula A (función de cuantía del modelo de Poisson) como para la válvula B
(función de cuantía teórica):

P  X A  2   1  P  X A  2   1   P  X A  0   P  X A  1  P  X A  2  
 e 2 2 0 e 2 21 e 2 2 2 
1      0,32
 0! 1! 2! 

P  X B  3  P  X B  4  P  X B  5  P  X B  6 
 0,08  (7  4)  0,08  (7  5)  0,08  (7  6)  0,52

Para calcular la intersección debe matizarse una cuestión, puesto que el enun-
ciado especifica que puede asumirse la independencia, con lo que la intersección
se calcula como producto de las probabilidades absolutas ya calculadas anterior-
mente:

P  X A  2    X B  3  P  X A  2 P  X B  3  0,32  0,52  0,16

Finalmente, se obtiene la probabilidad de la unión aplicando el axioma ya re-


ferido:

P  X A  2    X B  3  P  X A  2  P  X B  3  P  X A  2    X B  3 


 0,32  0,52  0,16  0,68

© Ediciones Pirámide 123


Problemas resueltos de estadística

5. Si un televisor tiene cinco válvulas de tipo A y siete de tipo B, calcular la


probabilidad de que, sabiendo que se ha estropeado una válvula, ésta sea
de tipo A.
El enunciado divide el total de válvulas del televisor en dos porciones (A y B),
e informa acerca de la probabilidad de cada una de ellas. Adicionalmente dice
que ocurre un hecho de forma transversal a ambas válvulas (estropearse). Este
esquema remite al teorema de la probabilidad total:

La probabilidad de toparse con una válvula estropeada se calcula, por tanto,


empleando el teorema de la probabilidad total:

PE  P X A  E  P X B  E 
5  7 
 P  X A  P  E X A   P  X B  P  E X B     0, 27     0, 08   0,16
12  12 
Ha de matizarse la nomenclatura empleada en la expresión anterior, puesto
que el suceso E = «válvula estropeada» representa el hecho de que una válvula
del tipo A o B se haya estropeado lo que en realidad implica que XA = 1 o XB = 1.
Por su parte, los sucesos XA y XB en la expresión anterior aluden a los sucesos
seleccionar válvulas del tipo A o B, respectivamente.
Ahora bien, el enunciado especifica que ya se ha seleccionado una válvula que
resulta estar estropeada y que entonces se calcule la probabilidad de que se trate
de una válvula tipo A, lo que obliga a recurrir al teorema de Bayes, puesto que el
especio muestral total no está constituido por todas las válvulas, sino únicamente
por aquellas ya estropeadas. El esquema siguiente refleja la nueva situación:

124 © Ediciones Pirámide


Ejercicios de aplicación

El teorema de Bayes permite calcular la proporción que sobre la probabilidad


total calculada representa cada uno de los sumandos de esta probabilidad y en
este caso se refiere al sumando vinculado a las válvulas tipo A:

P  X A  E  P  X A  P  E X A  0,11
P X A E     0,68
PE PE 0,16

4.2 Los lanzamientos de jabalina de dos atletas siguen sendas distribuciones de


probabilidad normales con media µ y desviaciones típicas σ1 y σ2. En 21 lanza-
mientos, elegidos al azar, del primer atleta y 16 del segundo se ha observado
que las cuasivarianzas de ambas muestras han sido 25 y 28. Se pide contrastar
con un 5 % de significación si ambos atletas tienen la misma dispersión (va-
rianza) en sus lanzamientos.
Solución:
La respuesta al enunciado debe proporcionarse mediante un contraste de hipó-
tesis, que debe adoptar la forma siguiente:

H0 :  22  12  H0 :  2 1   1
2 2


H1 :  22  12   H1 :  22 12   1

El estadístico adecuado para resolver el contraste debe incluir las cuasivarian-
zas muestrales por ser la información proporcionada por el enunciado:

© Ediciones Pirámide 125


Problemas resueltos de estadística

 22 S n2 1 S n2 1   22 
    F  n1  1; n2  1
1 1

 12 S n2 1 S n2 1   12  H
2 2 0

Al tratarse de un contraste bilateral, la región crítica se ubica sobre las dos co-
las de la distribución de probabilidad tal y como muestra el siguiente esquema:

La regla de decisión acorde con el esquema gráfico y el estadístico planteado


son los siguientes:
 S n21 1
 2  F 2 
 S n2 1

RH 0   o
 2
 S n1 1  F
1  2 
 S n2 1
 2
Una vez formulado el problema desde un punto de vista teórico, la solución al
contraste pasa por sustituir los datos disponibles en el enunciado:

Sn21 1 25 
  0,89 
Sn22 1 28 

F0,975  20;15   2,75   No RH 0

1 1
F0,025  20;15     0,38
F0,975 15;20  2,53 

126 © Ediciones Pirámide


Ejercicios de aplicación

Como puede observarse a la vista de las cifras anteriores, el estadístico no se


sitúa sobre la región crítica, con lo que no puede rechazarse la hipótesis nula.

4.3 Sea el siguiente conjunto de datos relativos al tiempo de conexión de los usuarios
a una determinada página web:

Población 1 Población 2
Usuario Tiempo (min) Usuario Tiempo (min) Usuario Tiempo (min)
1 13,88 1 01,82 21 02,73
2 15,96 2 05,83 22 02,50
3 14,80 3 03,08 23 03,08
4 12,50 4 02,14 24 14,32
5 12,91 5 02,73 25 09,12
6 14,58 6 02,50 26 02,50
7 15,28 7 13,85 27 02,31
8 16,05 8 12,86 28 05,71
9 12,58 9 03,64 29 00,91
10 14,88 10 12,50 30 12,46
11 15,19 11 03,08 31 13,85
12 15,86 12 02,14 32 14,30
13 12,47 13 03,64 33 01,82
14 15,45 14 02,50 34 05,83
15 12,51 15 03,08 35 06,15
16 14,13 16 03,57 36 02,14
17 14,10 17 05,45 37 03,64
18 14,02 18 02,50 38 01,67
19 13,64 19 03,85 39 03,85
20 16,04 20 14,29 40 02,86

© Ediciones Pirámide 127


Problemas resueltos de estadística

Se ha realizado la prueba de Kolmogorov-Smirnov en las dos poblaciones re-


sultando la siguiente información:

Población 1 Población 2
Tamaño de la muestra 20,000 40,000
Media muestral 14,341 05,420
Cuasidesviación típica 01,265 04,397
Z Kolmogorov-Smirnov 00,541 01,831
p-valor
00,931 00,002
Significación asintótica normal (bilateral)

1. A partir de los resultados de la prueba de Kolmogorov-Smirnov, contes-


tar, para cada una de las dos poblaciones, suponiendo un nivel de signifi-
cación del 5 %, las siguientes cuestiones:
i. Hipótesis que se formulan en el contraste.
ii. Conclusión que puede extraerse del contraste.
2. Se desea calcular un intervalo de confianza para el valor medio de la po-
blación 2, con un nivel de significación del 5 %. Indicar el estadístico pi-
vote y los supuestos que permiten construir el intervalo de confianza. Su-
ponga que la varianza poblacional es igual a 4.
3. Se desea contrastar si la varianza de la población 1 es igual a 2 para un
nivel de significación del 5 %.
4. Determinar si existe evidencia suficiente para afirmar que la media de la
población 1 es mayor a la media de la población 2. Discutirlo en base al
p-valor.
5. Se desea contrastar si la proporción de individuos que se conectan más de
14 minutos en la población 1 es igual a la proporción de individuos que
se conectan más de 2,5 minutos en la población 2 para un nivel de signi-
ficación del 5 %.
6. Sean las siguientes curvas de potencia de los contrastes indicados:

128 © Ediciones Pirámide


Ejercicios de aplicación

¿Cuál de los tres contrastes seleccionaría si la media de la población fuese


igual a 106?

Solución:

1. A partir de los resultados de la prueba de Kolmogorov-Smirnov, contes-


tar, para cada una de las dos poblaciones, suponiendo un nivel de signifi-
cación del 5 %, las siguientes cuestiones:

i. Hipótesis que se formulan en el contraste.

El de Kolmogorov-Smirnov es un contraste de bondad de ajuste que en este


caso se ha propuesto para contrastar si los datos recopilados se asemejan a una
distribución normal o no. De esta forma, las hipótesis quedarían formuladas como
sigue:
H 0 : X  N   ; 
H1 : X  N   ; 

ii. Conclusión que puede extraerse del contraste.

La solución al contraste viene por la comparación del p-valor con el nivel de


significación que, según el enunciado, ha quedado fijado en un 5 %. De esta for-

© Ediciones Pirámide 129


Problemas resueltos de estadística

ma, si el p-valor es inferior al nivel de significación (que equivale a un límite de


credibilidad) la hipótesis nula tiene una probabilidad baja de ser cierta, con lo que
habrá de rechazarse.
Esto es lo que ocurre con la población 2 (p-valor = 0,002), mientras que en la
población 1 (p-valor = 0,931) sí puede asumirse que los datos se distribuyen se-
gún una ley normal:

Población 1  p  valor  0,931    0,05  X  N  ; 

Población 2  p  valor  0,002    0,05  X  N  ; 

2. Se desea calcular un intervalo de confianza para el valor medio de la po-


blación 2, con un nivel de significación del 5 %. Indicar el estadístico pi-
vote y los supuestos que permiten construir el intervalo de confianza. Su-
ponga que la varianza poblacional es igual a 4.

Para calcular un intervalo de confianza para el valor medio de la población


debe en primer lugar analizarse la información disponible relativa a la normalidad
de los datos. Así, según el contraste de Kolmogorov-Smirnov analizado en el
apartado anterior, no puede aceptarse que los datos se distribuyan según una ley
normal. Sin embargo, el hecho de disponer de una muestra de tamaño suficiente
(40 datos) permite aplicar el teorema central del límite y aceptar que la media
muestral converge a una ley normal con los parámetros que se expresan a conti-
nuación:

TCL  n  
 N  ;
X   n 
Esto, junto con el hecho de conocer la varianza poblacional, permite utilizar el
pivote siguiente cuyo modelo de probabilidad es conocido al tratarse de una dis-
tribución normal tipificada:

x 
Q  Z  0;1
 n 
Con esta información únicamente queda recurrir al concepto de intervalo de
confianza que queda reflejada en la figura siguiente:

130 © Ediciones Pirámide


Ejercicios de aplicación

 
x    1    IC   ;     x   Z 
P  Z 2   Z1  

   n  2


 n
1  2

El resultado numérico final para los límites del intervalo de confianza procede
de sustituir la información disponible en las expresiones incluidas en el gráfico
anterior:
 2   2 
IC  ;0,05   5,42  Z0,975    5,42  1,96    4,80;6,04
 40   40 

3. Se desea contrastar si la varianza de la población 1 es igual a 2 para un


nivel de significación del 5 %.
El enunciado pide plantear y resolver un contraste bilateral para la varianza de
la población 1. Las características del estimador al que se hará referencia para
resolver el contraste exigen aceptar la distribución normal de los datos. Este su-
puesto ya se ha comprobado gracias al resultado del contraste de Kolmogorov-
Smirnov ya analizado en el primer apartado.
Una vez hecha la precisión previa pueden formularse las hipótesis de la forma
siguiente:

H0 : 12  2
H1 : 12  2
Para resolver el contraste con la información de la que se dispone se utilizará
el siguiente estadístico:

© Ediciones Pirámide 131


Problemas resueltos de estadística

 n  1 S n21
  n21
 12 H 0

Al ser bilateral el contraste, la región de rechazo debe definirse en las dos co-
las de la distribución, y al no ser la distribución chi-cuadrado simétrica, ha de
comprobarse el estadístico con los dos extremos de la región crítica. El esquema
del contraste queda reflejado en la siguiente figura:

El planteamiento teórico del contraste que se corresponde con el esquema


anterior implica repartir el nivel de significación en las dos colas de la distri-
bución:

  n  1 S 2    n  1 S 2 
P  RH 0 H 0     P  n 1
  2
   n 1
  2
 
  12  H    12  H 1  2 
 2

 0   0 
  n  1 Sn21
  2 2
  1  H 0
2


 RH 0   o

  n  1 Sn 1   2
2

  12  1 2 
 H0

132 © Ediciones Pirámide


Ejercicios de aplicación

Por lo tanto, no queda más que calcular el estadístico sustituyendo con la in-
formación del enunciado y comparar con los valores de los cuantiles para la dis-
tribución chi-cuadrado:

 n  1 Sn21   20  1 1,262  15,08 


 15,08  8,90 y
 
2
1 H0
2   No RH 0
 
 15,08  32,9
2 2  0,025
2
 8,90; 12 2  0,975
2
 32,9

No puede rechazarse la hipótesis nula para un nivel de significación del 5 % al


no ubicarse el estadístico dentro de la región de rechazo.
4. Determinar si existe evidencia suficiente para afirmar que la media de la
población 1 es mayor a la media de la población 2. Discutirlo en base al
p-valor.
El p-valor es una medida de la credibilidad de la hipótesis nula. De esta forma,
si el p-valor es pequeño, la probabilidad de que la hipótesis nula sea cierta es
pequeña, y por tanto no quedará más remedio que rechazarla.
Como el p-valor busca medir, en cierto modo, la probabilidad de que la hipó-
tesis nula sea cierta, habrá de buscarse para cada contraste la probabilidad de que
cada estadístico se ubicase en la región de aceptación. En el caso concreto del
presente apartado, al tratarse de un contraste unilateral superior y que habrá de
emplear un estadístico que se distribuye según un modelo t-Student, el esquema
de la zona de aceptación sería el siguiente:

© Ediciones Pirámide 133


Problemas resueltos de estadística

Una vez aclarado el significado del p-valor se afronta la resolución concreta


de la cuestión, comenzando por formular el contraste. El enunciado pide compro-
bar si la media de la población 1 es mayor que la media de la población 2, lo que
implicar plantear las hipótesis como sigue:

H 0 : 1  2 H :   2  0
 0 1
H1 : 1  2 H1 : 1  2  0

Esto implica, con la información disponible (cuasidesviaciones típicas mues-


trales), emplear el siguiente estadístico:

 x1  x2    1  2 H 0
 tn1  n2 2
1  n1  1 sn 1   n2  1 sn 1
2 2
1
 1 2

n1 n2 n1  n2  2

Y para el contraste unilateral superior, definir la región crítica como sigue:

 x1  x2    1  2  H
RH 0  0
  t n  n  2  
1  n1  1 sn 1   n2  1 sn 1
2 2 1 21
1
 1 2

n1 n2 n1  n2  2

Este planteamiento exige definir la probabilidad buscada (p-valor) como la pro-


babilidad de que el estadístico sea menor que el valor de una distribución t-Student
(por formalidad dentro del corchete de la probabilidad se expresará colocando pri-
mero la referencia a la variable y después el estadístico, pero el significado es el
mismo):

  x1  x2    1  2  H 
p -valor  P tn1  n2  2  0

 1  n1  1 sn 1   n2  1 sn 1 
2 2
1
  1 2

 n1 n2 n1  n2  2 

Una vez planteada la probabilidad buscada, simplemente resta sustituir la in-


formación disponible y concluir respecto del contraste comparando el resultado
obtenido con el nivel de significación máximo fijado.

134 © Ediciones Pirámide


Ejercicios de aplicación


P tn1  n2  2 
14,34  5, 42   0 

 1

1  20  11, 26 2   40  1 4,392 
 20 40 20  40  2 


 P t58 
14,34  5,42  0 


 1

1  20  11,262   40  1 4,392 
 20 40 20  40  2 

 P t58  8,8  0  p-valor    RH 0

5. Se desea contrastar si la proporción de individuos que se conectan más de


14 minutos en la población 1 es igual a la proporción de individuos que
se conectan más de 2,5 minutos en la población 2 para un nivel de signi-
ficación del 5 %.

El enunciado solicita en este apartado resolver un contraste bilateral para las


proporciones de individuos que se conectan un tiempo superior a 14 minutos en
una población y más de 2,5 minutos en la otra población. Para resolver el contras-
te ha de calcularse en primer lugar las proporciones de individuos que en cada
muestra se conectan más de 14 o 2,5 minutos, respectivamente. Para ello basta
con repasar los datos muestrales incluidos en la tabla del enunciado y enumerar la
cantidad de resultados que cumplen la condición fijada en cada población de for-
ma que puedan obtenerse las proporciones muestrales:

13 27
fn1   0,65; fn2   0,67
20 40

Una vez calculadas las frecuencias muestrales se puede abordar la resolución


del contraste comenzando por la formulación de las hipótesis:

H 0 : p1  p 2  0
H 1 : p1  p 2  0

El estadístico a utilizar es el siguiente, que se distribuye según un modelo


normal:

© Ediciones Pirámide 135


Problemas resueltos de estadística

f n1 
 f n2   p1  p2  H
0
 Z  0,1

f n1 1  f n1   f 1  f 
n2 n2

n1 n2

El contraste es bilateral, con lo que la región crítica se ubica en las dos colas
de la distribución normal:

El siguiente paso requiere formular la probabilidad vinculada al nivel de signi-


ficación especificando con ella la región crítica del contraste coincidente con el
gráfico anterior:


P  RH 0 H 0     P 
f n1 
 f n2   p1  p2  H
0

 Z1 2  

 
f n1 1  f n1   f 1  f 
n2 n2


 n1 n2 

 RH 0 
f n1 
 f n2   p1  p2  H
0
 Z1 2

f n1 1  f n1   f 1  f 
n2 n2

n1 n2

Al ser la distribución normal simétrica y coincidir cambiados de signo los


cuantiles complementarios (Z1-α = –Zα), cabe comparar el valor absoluto del esta-
dístico con el cuantil positivo (Z1-α) de la distribución.

136 © Ediciones Pirámide


Ejercicios de aplicación

Por último, se sustituyen los valores conocidos en el estadístico, se calcula el


resultado para el cuantil de la distribución normal y se comparan ambos resulta-
dos para concluir respecto del contraste.

f n1 
 f n2   p1  p2  H
0

 0,65  0,67   0 
 0,19

f n1 1  f n1   f 1  f 
n2 n2
0,65  1  0,65 0,67  1  0,67 



n1 n2 20 40 

Z1 2  Z0,975  1,96 
 0,19  1,96  No RH0

6. Sean las siguientes curvas de potencia de los contrastes indicados:

¿Cuál de los tres contrastes seleccionaría si la media de la población fue-


se igual a 106?

El contraste más potente es el que minimiza la probabilidad de cometer el


error de segunda especie. Para un valor de la media poblacional igual a 106 el
contraste más potente es el siguiente:

H 0 :   100
H 1 :   100

© Ediciones Pirámide 137


Problemas resueltos de estadística

Se observa buscando el valor 106 en el eje de ordenadas y encontrando la cur-


va que proporciona un mayor valor para la potencia.

4.4 La longitud aleatoria de las piezas que fabrica una compañía con la línea de pro-
ceso en dos fases se distribuye según la siguiente función de densidad:
3
f (x)  ( x 1)( x  3)
4
Se considera que la pieza es correcta cuando su longitud se encuentra entre 2,5
y 4 unidades de longitud.
1. ¿Cuál es la probabilidad de que una pieza sea correcta?
2. Si se empaquetan las piezas en lotes de 5 unidades, ¿cuál es la probabili-
dad de que en un lote haya como mucho 3 piezas correctas?
3. Cada día la empresa produce 500 piezas que empaqueta en lotes de ese
tamaño. La producción diaria se considera correcta si se producen entre
412 y 438 piezas. ¿Cuál es la probabilidad de que la producción de un día
se considere correcta?
4. La misma compañía fabrica la misma pieza con un proceso productivo en
tres fases y sabe que la probabilidad de que las piezas sean correctas se
distribuye según un modelo de Poisson de varianza 432 (piezas/día)2. Se
sabe que la probabilidad de que la cantidad de piezas producidas en un

138 © Ediciones Pirámide


Ejercicios de aplicación

día se considere correcta es igual a 0,98. Calcular el número mínimo de


piezas fabricadas en un día que esta empresa considera correctas.
5. Si un operario se ubicase a la salida de la línea de proceso de tres fases,
calcular la probabilidad de que la primera pieza correcta se la encuentre
transcurrido como máximo un minuto.
6. Esta compañía posee 250 líneas de proceso de dos fases y 150 de tres fa-
ses. Se sabe que un auditor ha acudido un día en el que la producción dia-
ria es correcta. Calcular la probabilidad de que hubiese acudido a una
planta en la que hubiera un proceso productivo en dos fases.

Solución:
1. ¿Cuál es la probabilidad de que una pieza sea correcta?
El enunciado proporciona una función de densidad a partir de la cual se calcu-
lará la probabilidad buscada mediante una integral definida. Si la pieza se consi-
dera correcta cuando oscila su longitud entre las 2,5 y las 4 unidades, éstos han de
ser los límites de la integral de la función de densidad:
4
3  3  x3 
P 2,5  x  4  
4
( x 1)( x  3)dx     2x2  3x   0,84
2,5 4
4 3 2,5
El significado de la probabilidad resulta ser el área sombreada bajo el gráfico
de la función de densidad como se observa en el esquema siguiente:

4
3
P  2,5  x  4   4 ( x  1)( x  3)dx
2,5

© Ediciones Pirámide 139


Problemas resueltos de estadística

2. Si se empaquetan las piezas en lotes de 5 unidades, ¿cuál es la probabili-


dad de que en un lote haya como mucho 3 piezas correctas?
Si las piezas se empaquetan en lotes, el experimento puede expresarse en térmi-
nos dicotómicos, puesto que consiste en seleccionar una pieza y comprobar si es
correcta o no. En la medida en la que no se dispone de información adicional, se
supondrá que existe reposición o que el tamaño es lo suficientemente grande como
para suponer que las extracciones no influyen en la proporción de defectuosas.
Para ello debe definirse el experimento a partir de la variable aleatoria Y (nú-
mero de piezas correctas en cinco experimentos) que se distribuye según un mo-
delo binomial con parámetros 5 y 0,84 (proporción de piezas correctas ya calcu-
lada en el apartado anterior):

Y   5;0,84

Una vez hecho el planteamiento teórico, el cálculo de la probabilidad requiere


sustituir en la función de cuantía del modelo binomial:

yj !
P Y  y j   p y j 1  p 
n y j

n ! n  y j !

P Y  3  P Y  0  P Y  1  P Y  2  P Y  3 
0! 1!
  0,84 0 1  0,84 50   0,84 1 1  0,84 51 
 
5! 5  0 !  
5! 5  1 !
2! 3!
  0,84 2 1  0,84 5 2   0,84 3 1  0,84 53  0,17
5! 5  2 ! 5! 5  3!

3. Cada día la empresa produce 500 piezas que empaqueta en lotes de ese
tamaño. La producción diaria se considera correcta si se producen entre
412 y 438 piezas. ¿Cuál es la probabilidad de que la producción de un día
se considere correcta?
Si los lotes en lugar de estar formados por 5 piezas lo están por 500, el expe-
rimento continuaría pudiendo explicarse mediante un modelo binomial. Sin em-
bargo, el teorema central del límite permite simplificar el cálculo empleando una
distribución normal cuya media es la suma de los valores medios de las distribu-
ciones binomiales originales y cuya desviación típica es la raíz cuadrada de la
suma de las varianzas de las distribuciones binomiales originales.

140 © Ediciones Pirámide


Ejercicios de aplicación

X    n; p   X 
 

 N np; np 1  p 
TCL n 

X    500;0,84  X 

TCL n 

 N 500  0,84; 500  0,84  1  0,84 
X  N  421,5;8,13

Una vez definido el modelo, el cálculo de la probabilidad requiere tipificar y


buscar en la tabla de la distribución normal tipificada o bien calcular directamente
la probabilidad de la distribución normal:

P  412  X  438  P  X  438  P  X  412  


 438  421,5   412  421,5 
 P Z    P Z    0,86
 8,13   8,13 

4. La misma compañía fabrica la misma pieza con un proceso productivo en


tres fases y sabe que la probabilidad de que las piezas sean correctas se
distribuye según un modelo de Poisson de varianza 432 (piezas/día)2. Se
sabe que la probabilidad de que la cantidad de piezas producidas en un
día se considere correcta es igual a 0,98. Calcular el número mínimo de
piezas fabricadas en un día que esta empresa considera correctas.
En este caso la variable aleatoria original se distribuye según un modelo de
Poisson, pero de nuevo el teorema central del límite (debido al elevado valor del
parámetro λ) permite utilizar la distribución normal:

 N  432; 432 
 
X  P  432  X 
TCL n

X  N  432;20,78

El enunciado no pregunta una probabilidad, sino un número de piezas tal que


se garantice una probabilidad de 0,98. Al referirse a una cifra mínima de piezas,
la probabilidad debe expresarse como sigue:

a  432
P  X  a   0,98   2, 05  a  475
20, 78

La solución anterior se ha obtenido de forma opuesta al apartado precedente


en el que se solicitaba calcular una probabilidad. Se busca la probabilidad para la

© Ediciones Pirámide 141


Problemas resueltos de estadística

distribución normal tipificada y se opera hasta despejar el valor de la cantidad


mínima de piezas.
5. Si un operario se ubicase a la salida de la línea de proceso de tres fases,
calcular la probabilidad de que la primera pieza correcta se la encuentre
transcurrido como máximo un minuto.
La probabilidad de que la primera pieza correcta aparezca como máximo en el
primer minuto se calcula utilizando la distribución exponencial, que resulta ser la
complementaria a la distribución de Poisson.
El parámetro λ de la función exponencial debe referirse a minutos. Con una
simple regla de tres, a partir de las 432 piezas al día resulta una tasa de 0,3 pie-
zas/minuto.
Con esta información puede calcularse la probabilidad solicitada de forma
sencilla:

Y  E  0,3  Pt 1 1 et 1 e0,3  1  0,25

6. Esta compañía posee 250 líneas de proceso de dos fases y 150 de tres fa-
ses. Se sabe que un auditor ha acudido un día en el que la producción dia-
ria es correcta. Calcular la probabilidad de que hubiese acudido a una
planta en la que hubiera un proceso productivo en dos fases.
El esquema para resolver el problema responde a los teoremas de la probabili-
dad total y Bayes. El total de líneas de la empresa se encuentran divididas en dos
partes (2 fases y 3 fases) que constituyen un conjunto complementario e incompa-
tible, y el enunciado se interesa por algo que ocurre de forma transversal a las dos
líneas (la producción se realiza de forma correcta, sabiendo que la probabilidad
de que sea correcta en el proceso de dos fases es igual a 0,86 —tercer apartado—
y de que sea correcta en el sistema de tres fases es igual a 0,98 —cuarto apar-
tado—).
Una vez formulado el esquema anterior, el enunciado pregunta de forma ex-
presa por una probabilidad vinculada a un día en el que la producción ha funcio-
nado correctamente, con lo que el espacio muestral estará compuesto por los días
en los que ocurre tal circunstancia. La solución a esta cuestión debe buscarse a
través del teorema de Bayes tal y como muestra el siguiente esquema:

142 © Ediciones Pirámide


Ejercicios de aplicación

La solución numérica que corresponde al esquema anterior es la siguiente:

250 150
P C   P C 2F  P  2F   P C 3F  P 3F    0,86   0,98  0,90
400 400
P C 2F  P  2F   250 400  0,86
P  2F C     0,59
P C  0,9

Se han seleccionado dos muestras diferentes de establecimientos agroindustria-


4.5
les y se han recopilado datos de número de empleados y potencia consumida
cuyo comportamiento puede suponerse normal. En la tabla siguiente se incluyen
los datos.

Industrias oleícolas Industrias vinícolas


Número de Potencia Número de Potencia
Industria empleados instalada Industria empleados instalada
(ni) (Pi) (ni) (Pi)
1 417 383 1 39 40
2 48 97 2 199 7
3 36 64 3 17 193
4 145 290 4 40 71
5 80 216 5 17 71
6 50 247 6 11 230

© Ediciones Pirámide 143


Problemas resueltos de estadística

Industrias oleícolas Industrias vinícolas


Número de Potencia Número de Potencia
Industria empleados instalada Industria empleados instalada
(ni) (Pi) (ni) (Pi)
7 147 101 7 129 64
8 12 15 8 77 31
9 73 198 9 65 80
10 35 89 10 13 29

Se dispone además de la información siguiente acerca de cada uno de los dos


sectores:

Industrias oleícolas Industrias vinícolas


n i 1.043 607

P i 1.700 816

 Pn
i i 270.947 29.031

n 2
i 235.721 70.385

P i
2
409.510 114.178

Se pide:
1. Calcular la recta de regresión lineal que permite predecir la potencia insta-
lada a partir del número de empleados en el sector de industrias oleícolas.
2. Se desea construir un intervalo de confianza para el número de emplea-
dos medio en las industrias vinícolas para un nivel de confianza del 95 %.
Especificar las hipótesis que permiten formular el intervalo y construirlo.
3. Construir un intervalo de confianza para la diferencia entre los valores
medios de la potencia instalada (oleícola-vinícola), para un nivel de signi-
ficación del 5 %.
4. En caso de que la varianza de la potencia fuese significativamente mayor
que 11.000 kW2 la red tendría problemas. ¿Se puede afirmar para una
significación del 5 % que la varianza de la potencia instalada en las in-
dustrias oleícolas es significativamente mayor, o no, que 11.000 kW2?

144 © Ediciones Pirámide


Ejercicios de aplicación

Solución:
1. Calcular la recta de regresión lineal que permite predecir la potencia ins-
talada a partir del número de empleados en el sector de industrias oleíco-
las.
Se trata de una expresión de regresión lineal simple puesto que únicamente so-
licita incluir una variable explicativa. En esos términos la expresión de la recta
buscada es la siguiente:

Y   0  1 X

Siendo Y la potencia instalada y X el número de empleados.


Las incógnitas de la regresión son los dos coeficientes β0 y β1 cuyas expresiones
deducidas mediante el método de los mínimos cuadrados son las siguientes:

11  xy
1  
 20  x2
 0  a10  1a01  y  1 x

Teniendo en cuenta las expresiones anteriores no queda más que operar con
los sumatorios que proporciona el enunciado para obtener los momentos y los
coeficientes de regresión buscados:


i  10
x  a10  i 1
n i 10  104, 30

y  a01   i 1 Pi N P  170
i 10

 x2   20    i 1 ni2 N n     i 1 ni N n   12.693, 71
i 10 i 10 2

 xy  11  a11   a10 a01     i 1 Pn


i i N      i 1 ni N n 
i 10
 i 10
 i 10
i 1 
Pi N P  

 9.363, 7

Simplemente resta sustituir estos datos en las expresiones ya expuestas para


los coeficientes de regresión:

© Ediciones Pirámide 145


Problemas resueltos de estadística

11  xy 9.363,7
1   2   0,73
 20  x 12.693,71
 0  a10  1a01  170  0,73  104,3  93,06

El gráfico siguiente muestra la nube de puntos y la recta deducida:

2. Se desea construir un intervalo de confianza para el número de emplea-


dos medio en las industrias vinícolas para un nivel de confianza del 95 %.
Especificar las hipótesis que permiten formular el intervalo y construirlo.
La variable aleatoria X (número de empleados) se distribuye según una ley
normal N(µ;σ) en la población y la cantidad pivotal ha de ser tal que recurra a la
varianza o cuasivarianza muestrales. Se empleará la cuasidesviación típica mues-
tral en este caso:

x 
Q t n1
sn1 n

El esquema del intervalo de confianza es el que se observa en la figura si-


guiente:

146 © Ediciones Pirámide


Ejercicios de aplicación

 s s 
IC   ;    x n  n 1 t1 2  n  1 ; x n  n 1 t1 2  n  1 
 n n 

Empleando la cantidad pivotal referida, únicamente queda plantear la defini-


ción de intervalo de confianza y deducir, por tanto, los resultados concretos para
el citado intervalo:

x 
P  q1  Q  q2   P t 2   t1 2  
 Sn1 n 
 s s 
 IC  ;    xn  n1 t1 2  n  1 ; xn  n1 t1 2  n  1 
 n n 

IC   ;0,05    60,7  t0,975  9   


61,05 61,05
t0,975  9  ;60,7 
 10 10 

  60,7  2, 26  
61, 05 61,05
2, 26;60,7 
 10 10 
 IC   ;0, 05   17, 07;104,33 

3. Construir un intervalo de confianza para la diferencia entre los valores


medios de la potencia instalada (oleícola-vinícola), para un nivel de signi-
ficación del 5 %.

© Ediciones Pirámide 147


Problemas resueltos de estadística

Se trata de plantear un intervalo de confianza para la diferencia entre los valo-


res medios de la potencia sin más información que la contenida en las muestras,
razón por la que ha de recurrirse a la siguiente cantidad pivotal:

Q
 x1  x2    1  2   t n1  n2  2
1 1 n1sn21  n2 sn22

n1 n2 n1  n2  2

El esquema del intervalo actual es equivalente al expuesto en el apartado ante-


rior al tratarse también de una distribución t-Student:

 1 1 no sn2o  nv sn2v 
IC  o  v ;     xo  xv   t1 2   
 no nv no  nv  2 
 

De nuevo ha de plantearse la definición del intervalo de confianza y despejar


los límites del intervalo:

  xo  xv    o  v  
P  q1  Q  q2   P t 2   t1 2  
1 1 no sno  nv snv
2 2
  
 no nv no  nv  2 

148 © Ediciones Pirámide


Ejercicios de aplicación

 1 1 no sn2o  nv sn2v 
IC  o  v ;     xo  xv   t1 2   
 no nv no  nv  2 
 

 1 1 10  12.501  10  7.733,31 
  170  81,6   t0,975  
 10 10 10  10  2 

 1 1 10  12.501  10  7.733,31 
  170  81,6   2,1  
 10 10 10  10  2 

 IC  o  v ;0,05    11,17;187,97 

4. En caso de que la varianza de la potencia fuese significativamente mayor


que 11.000 kW2 la red tendría problemas. ¿Se puede afirmar para una
significación del 5 % que la varianza de la potencia instalada en las in-
dustrias oleícolas es significativamente mayor, o no, que 11.000 kW2?

El enunciado pide descartar si la varianza de la potencia instalada en las indus-


trias oleícolas es significativamente mayor de 11.000 kW2, cuestión ante la que
ha de plantearse un contraste de hipótesis unilateral superior para la varianza.
La formulación es la siguiente:

H 0 :  2  11.000
H1 :  2  11.000

El citado contraste exige emplear, a la vista de la información disponible, el


siguiente estadístico:

nsn2
  n21
 2  H 0

Siendo la regla de decisión que define la región crítica la siguiente:

© Ediciones Pirámide 149


Problemas resueltos de estadística

Esquema gráfico de la región crítica que se corresponde con la siguiente for-


mulación matemática:

nsn2
RH0   12
 2  H 0

Simplemente resta calcular el estadístico, comparar con el cuantil y adoptar la


decisión oportuna:

nsn2 10  12.501 
  11,36 
  H 0
2
11.000   11,36  16,91  No RH 0
12  n  1   0,95
2  9   16,91

4.6 Un determinado establecimiento ha colocado unos adornos luminosos no aptos


para intemperie en el exterior del edificio. Cada adorno está formado de tres hile-
ras de luces independientes entre sí. Sea la variable aleatoria X el número de hile-
ras que dejan de funcionar en cada adorno y sea su función de probabilidad la
siguiente:

150 © Ediciones Pirámide


Ejercicios de aplicación

0,5  x  0
m  x  1

P  X  xi   
0,15  x  2
0,05  x  3

1. Calcular el valor de m para que la función anterior sea una función de


cuantía y X sea una variable aleatoria.
2. Si ha dejado de funcionar alguna hilera de luces, ¿cuál es la probabilidad
de que se hayan fundido menos de tres?
3. En total se han colocado siete adornos de este tipo. Si hay problemas de
iluminación en más de dos de los siete adornos, el gerente del centro co-
mercial no volverá a adquirir ese tipo de adorno otro año. ¿Qué probabi-
lidad hay de que esto ocurra?
4. Cada adorno se vende a 100 euros, aunque se penaliza con 10 euros por
cada hilera que no funciona. Si el coste de fabricación de cada adorno as-
ciende a 20 euros, calcular de manera razonada el beneficio esperado por
adorno.
5. En cierta calle los comerciantes han adquirido 80 adornos para decorar
sus comercios. ¿Cuál es la probabilidad de que cuando acabe la campaña
de promoción con el luminoso más de la mitad no tengan ninguna hilera
fundida?
Solución:
1. Calcular el valor de m para que la función anterior sea una función de
cuantía y X sea una variable aleatoria.
La función de cuantía anterior lo será si cumple las propiedades de dichas fun-
ciones en especial la condición fijada a la suma de las probabilidades de cada
punto del dominio de definición de la variable:

 Dx
P  X  xi   1

Simplemente resta desarrollar dicha igualdad y despejar el valor de m:

0, 5  m  0,15  0, 05  1  m  0, 3

© Ediciones Pirámide 151


Problemas resueltos de estadística

2. Si ha dejado de funcionar alguna hilera de luces, ¿cuál es la probabilidad


de que se hayan fundido menos de tres?
El enunciado informa acerca de la existencia de un determinado suceso previo
(se sabe que al menos una hilera de luces ha dejado de funcionar) y pide calcular
la probabilidad vinculada a otro suceso, con lo que debe plantearse una probabili-
dad condicionada. La probabilidad solicitada es la siguiente:
P  X  3 X  1

La solución a la citada probabilidad pasa por recurrir a la definición de proba-


bilidad condicionada y posteriormente operar hasta obtener la cifra final:
P  X  3   X  1 P 1  X  3
P  X  3 X  1   
P  X  1 P  X  1
P  X  1  P  X  2 0,45
   0,9
1  P  X  0 0,5

3. En total se han colocado siete adornos de este tipo. Si hay problemas de


iluminación en más de dos de los siete adornos, el gerente del centro co-
mercial no volverá a adquirir ese tipo de adorno otro año. ¿Qué probabi-
lidad hay de que esto ocurra?
El enunciado exige en este caso proponer una nueva variable aleatoria que
permita estudiar el número de adornos que presentan problemas y calcular la
probabilidad de que haya problemas en más de dos adornos. La variable aleatoria
Y queda por tanto definida como sigue:
Y = Número de adornos con una o más hileras fundidas.
El experimento en cuestión debe definirse como un modelo binomial al tratar-
se de un experimento dicotómico (la hilera presenta problemas o no los presenta)
que se repite en siete ocasiones, siendo el parámetro p la tasa en la que al menos
una hilera presente problemas (calculada en el apartado anterior y que resulta ser
igual a 0,5):
Y    7;0,5 

Una vez definida la variable aleatoria y el experimento, únicamente queda


pendiente calcular la probabilidad haciendo uso de la función de cuantía del mo-
delo binomial:

152 © Ediciones Pirámide


Ejercicios de aplicación

P Y  2  1  P Y  2  1   P Y  0  P Y  1  P Y  2
 7  7 7 
 1    0,50  0,57    0,51  0,56    0,52  0,55   0,77
 0  1  2 

4. Cada adorno se vende a 100 euros aunque se penaliza con 10 euros por
cada hilera que no funciona. Si el coste de fabricación de cada adorno as-
ciende a 20 euros, calcular de manera razonada el beneficio esperado por
adorno.
Ha de proponerse una nueva variable aleatoria que permita estudiar el benefi-
cio y que resulta ser una combinación lineal de la variable previamente manejada
y que alude a las hileras que no funcionan. El planteamiento es el siguiente:

Beneficio  B  100  10 X  20  80  10 X

Una vez definida la variable aleatoria, ha de calcularse su esperanza matemá-


tica para obtener el beneficio esperado. El cálculo de la esperanza matemática de
la nueva variable aleatoria debe hacer uso de las propiedades del operador espe-
ranza matemática a partir de la esperanza matemática de la variable aleatoria X.
Así, el primer paso consiste en calcular la esperanza matemática de la variable
aleatoria X, y operar hasta obtener la esperanza matemática de B:

E  X    D xi P  X  xi    x 1 xi P  X  xi  
x 6

  0  0,5  1 0,3   2  0,15   3  0,05  0,75

E  B  80  10E  X   80  10  0,75  72,5

5. En cierta calle los comerciantes han adquirido 80 adornos para decorar


sus comercios. ¿Cuál es la probabilidad de que cuando acabe la campaña
de promoción con el luminoso más de la mitad no tengan ninguna hilera
fundida?
El esquema del experimento es similar al descrito en el apartado tercero, pero
con la salvedad del número de experimentos, significativamente alto en este caso,
o al menos suficiente como para poder aplicar el teorema central del límite. El
experimento continúa siendo del tipo binomial, pero se puede aceptar la conver-
gencia al modelo normal en los términos siguientes:

© Ediciones Pirámide 153


Problemas resueltos de estadística

 N  80  0,5; 80  0,5  0,5 


 
X    80;0,5  
TCL n 

 
X    80;0,5  
TCL n 
 N  40; 4, 47 

Con este planteamiento únicamente resta calcular la probabilidad requerida


por el enunciado para una distribución normal:

40  40 
P  X  40  P  Z   P  Z  0  0,5
 4, 47 

4.7 Lúcico es el primer fabricante especializado en iluminación led. El tiempo de


vida de las bombillas led sigue una distribución exponencial de media de 10 años.
No obstante, algunas de ellas son defectuosas y siguen una exponencial cuya vida
media es de 1 año. Se sabe que el 10 % de las bombillas fabricadas por la empre-
sa son defectuosas.
1. Un cliente compra al azar una bombilla led de esta empresa y después
de un año sigue funcionando. ¿Cuál es la probabilidad de que sea defec-
tuosa?
2. Para la bombilla que se sabe que ha durado un año, ¿cuál es la probabili-
dad de que funcione otros dos años más?

Solución:
1. Un cliente compra al azar una bombilla led de esta empresa y después
de un año sigue funcionando. ¿Cuál es la probabilidad de que sea defec-
tuosa?
El enunciado informa acerca de la existencia de dos tipos de bombillas según
su duración media: las primeras que se consideran correctas y cuya duración me-
dia es de diez años (C) y las segundas consideradas defectuosas y cuya duración
media es de un año (D), siendo la duración de ambas sendas variables aleatorias
susceptibles de ser estudiadas mediante modelos exponenciales. Debe prestarse
atención a la definición del parámetro λ que resulta ser la inversa del valor medio
(esperanza matemática) de la distribución.
C = Tiempo de vida de las bombillas correctas:
TC  E 1 10 

154 © Ediciones Pirámide


Ejercicios de aplicación

D = Tiempo de vida de las bombillas defectuosas:


TD  E 1 1 
El enunciado especifica que un comprador adquiere una bombilla sin saber de
qué tipo es, y que transcurrido un año sigue en funcionamiento. Este suceso cons-
tituye la característica transversal a las dos componentes del espacio muestral
(bombillas correctas o defectuosas) con un planteamiento que remite al teorema
de la probabilidad total. El esquema es el siguiente:

Pero el hecho de que la bombilla continúe funcionando transcurrido un año


representa la condición en la probabilidad que solicita calcular el enunciado, al
afirmar «después de un año sigue funcionando. ¿Cuál es la probabilidad de que
sea defectuosa?», con lo que pregunta sobre la proporción que las defectuosas
representan sobre las que siguen funcionando transcurrido un año. Este plantea-
miento remite al teorema de Bayes. Se observa en el esquema siguiente:

© Ediciones Pirámide 155


Problemas resueltos de estadística

Los cálculos encaminados a calcular la probabilidad de que la bombilla supere


la duración de un año son los siguientes:

P  D   0,1; P T  1 D   1  1  e 11   0,36 



P C   0,9; P T  1 C   1  1  e 10,1   0,90 
 P T  1  P T  1 D  P  D   P T  1 C  P C  
  0,1  0,36    0,9  0,9   0,85

Las condiciones expuestas en las probabilidades anteriores se materializan gra-


cias al uso del modelo exponencial correspondiente para cada clase de bombillas.
Por último, la probabilidad de que, sabiendo que ha durado más de un año, la
bombilla sea defectuosa:

P T  1 D P  D 0,03
P  D T  1    0,04
P T  1 0,85

2. Para la bombilla que se sabe que ha durado un año, ¿cuál es la probabili-


dad de que funcione otros dos años más?
La probabilidad se resuelve sin más problema planteando la probabilidad con-
dicionada y operando a partir de su definición, simplemente con la salvedad de
que la probabilidad de que durase más de tres años, de la misma forma que la
probabilidad de que dure más de un año, es la probabilidad total de que duren
más de tres años las bombillas correctas o las defectuosas.

P T  3  T  1 P T  3
P T  3 T  1   
P T  1 P T  1
P T  3 P T  3 D  P  D   P T  3 C  P C 
  
P T  1 P T  1 D  P  D   P T  1 C  P C 
 0,36 1  1  e13      0,9 1  1  e0,13    

 0,36 1  1  e 11      0,9 1  1  e0,11    
 0,1  0,05   0,9  0,74 
  0,78
 0,1 0,36    0,9  0,9 

156 © Ediciones Pirámide


Ejercicios de aplicación

4.8 Se lleva a cabo un experimento para estudiar la posible relación entre la capaci-
dad de adhesión de productos de caucho (A) y el tiempo de uso (T) de esos pro-
ductos. Para ello se han recogido datos relativos al tiempo de uso (en cientos de
horas) y la capacidad de adhesión de 16 productos de caucho cuyos resultados
son:

12 10 8 9 7 9 7 8
T
8 6 8 7 5 11 10 11
2,7 3 3,1 3,2 3,4 3,6 3,6 3,2
A
3,7 3,8 3,4 3,5 3,8 3,2 3 3,1

Se dispone además de la siguiente información respecto de las correspondien-


tes sumas:


i 16
i 1
Ti 136,00


i 16
i 1
Ai 053,30


i 16
i 1
Ti 2 189,30


i 16
i 1
Ai2 179,09


i 16
i 1
Ti Ai 445,40

1. ¿Existe una relación lineal intensa entre la capacidad de adhesión y el


tiempo de uso de los productos de caucho?
2. Obtener la recta de regresión que prediga la capacidad de adhesión en
función del tiempo de uso de los productos de caucho.
3. Construir el diagrama de caja para la muestra de datos de capacidad de
adhesión. Razonar el tipo de asimetría a la vista del gráfico.
4. Se ha añadido un nuevo aditivo al caucho y se ha registrado la capacidad
de adhesión de 16 productos obteniéndose la siguiente tabla:

© Ediciones Pirámide 157


Problemas resueltos de estadística

CAPACIDAD DE ADHESIÓN
Sin aditivo (A) Con aditivo (A´)
Media 3,33 3,83
Moda 3,20 3,90
Varianza muestral 0,10 0,05
Mínimo 2,70 3,50
Máximo 3,80 4,30
Cuartil inferior 3,10 3,65
Cuartil superior 3,60 3,90

¿Puede afirmarse al 95 % de confianza que existe diferencia significati-


va entre las capacidades medias de adhesión de los productos de caucho
con y sin el nuevo aditivo? (supónganse varianzas poblacionales iguales
a 0,15 y poblaciones normales).

Solución:
1. ¿Existe una relación lineal intensa entre la capacidad de adhesión y el
tiempo de uso de los productos de caucho?
La intensidad de la relación lineal existente entre dos variables se mide me-
diante el coeficiente de correlación lineal entre ambas variables que resulta ser el
cociente entre la covarianza y el producto de las desviaciones típicas:

 xy
 xy 
 x y

Los cálculos encaminados a obtener estos indicadores se expresan a continua-


ción:

 A  a10   i 1 Ai N A  3,33
i 16

T  a01   i 1 Ti N T  8,5
i 16

 A2   20    i 1 Ai2 N A     i 1 Ai N A   0,09
i 16 i 16 2

158 © Ediciones Pirámide


Ejercicios de aplicación

 A   A2  0, 09  0,31

 T2   20    i 1 Ti 2 NT     i 1 Ti NT   3,5
i 16 i 16 2

 T   T2  3,5  1,87
 AT  11  a10   a10 a01  

  i 16
i 1
 

i i N 
AT
i 16
i 1
Ti NT  i 16
i 1 
Ai N A   0, 48

Una vez extraídos los datos de las desviaciones típicas y de la covarianza entre
las variables puede calcularse el coeficiente de correlación lineal como sigue:

 AT  0, 48
 AT     0,82
 A T 1,87  0, 31

El coeficiente de correlación muestra una relación de intensidad elevada e in-


versa entre ambas variables.
2. Obtener la recta de regresión que prediga la capacidad de adhesión en
función del tiempo de uso de los productos de caucho.
La regresión lineal perseguida exige determinar los valores para los coeficien-
tes de regresión β0 y β1 de la expresión siguiente:

A   0  1T

La solución para cada uno de los dos coeficientes es la siguiente:

 AT
1 
 T2
 0  A  1 T

siendo las expresiones anteriores el resultado del método de los mínimos cuadra-
dos. Simplemente resta sustituir en estas expresiones para deducir la recta de
regresión:

© Ediciones Pirámide 159


Problemas resueltos de estadística

 AT 0,48
1    0,13
 T2 3,5

0  A  1T  3,33   0,13  8,5  4, 49

Quedando la recta resultante como sigue:

A   0  1T  4, 49  0,13T

Que se corresponde con el siguiente esquema de gráficos de puntos y recta de


regresión:

3. Construir el diagrama de caja para la muestra de datos de capacidad de


adhesión. Razonar el tipo de asimetría a la vista del gráfico.
Para construir el diagrama de caja únicamente se necesita la información acer-
ca de la mediana, los cuartiles primero y tercero y los bigotes inferior y superior
de cara a identificar la posible existencia de valores atípicos en la distribución. En
el caso de que no hubiera resultados atípicos habría de conocerse también los

160 © Ediciones Pirámide


Ejercicios de aplicación

valores máximo y mínimo. Los resultados obtenidos para el conjunto de datos


relativos a la capacidad de adhesión son los siguientes:

Mediana 3,30
Cuartil 1 3,10
Cuartil 3 3,60
Bigote inferior 2,35
Bigote superior 3,85

Con los datos de la tabla puede dibujarse el diagrama de caja teniendo en


cuenta que al no existir datos atípicos (mayores que el bigote superior o menores
que el bigote inferior), los extremos del diagrama han de coincidir con los valores
máximo y mínimo del conjunto de datos. La representación es la siguiente:

En cuanto a la simetría, la relación entre la media y la mediana indicarían una


distribución simétrica o ligeramente asimétrica a la derecha, mientras que el coe-
ficiente de asimetría conduce a pensar en una distribución asimétrica a la izquier-
da. Los resultados son los siguientes:

Media 3,33
Mediana 3,30

© Ediciones Pirámide 161


Problemas resueltos de estadística

  A  A
i 16 3
 n 0, 05
AS F  33  i 1
  1,86
i


  A  A 
32
i 16 2 0, 02
i 1 i n

4. Se ha añadido un nuevo aditivo al caucho y se ha registrado la capacidad


de adhesión de 16 productos obteniéndose la siguiente tabla:

CAPACIDAD DE ADHESIÓN
Sin aditivo (A) Con aditivo (A´)
Media 3,33 3,83
Moda 3,20 3,90
Varianza muestral 0,10 0,05
Mínimo 2,70 3,50
Máximo 3,80 4,30
Cuartil inferior 3,10 3,65
Cuartil superior 3,60 3,90

¿Puede afirmarse al 95 % de confianza que existe diferencia significati-


va entre las capacidades medias de adhesión de los productos de caucho
con y sin el nuevo aditivo? (supónganse varianzas poblacionales iguales
a 0,15 y poblaciones normales).
La respuesta al enunciado se obtiene mediante un contraste de hipótesis entre
los valores medios de dos poblaciones que podría formularse de la forma siguiente:

H 0 :  A   A´   H 0 :  A   A´  0

H 1 :  A   A´   H 1 :  A   A´  0

La solución a dicho contraste, suponiendo poblaciones normales y varianzas


poblaciones conocidas e iguales, pasa por emplear el siguiente estadístico:

 xA  xA´    A  A´ H 0
Z
 1 nA   1 nA' 

162 © Ediciones Pirámide


Ejercicios de aplicación

La región crítica para el contraste bilateral para la diferencia de medias con el


estadístico referido puede plantearse a partir del valor absoluto al ser la normal
tipificada una distribución simétrica:

 xA  xA´    A  A´  H
RH0  0
 Z1 2
 1 nA   1 nA' 

Esta región crítica se corresponde con el esquema gráfico siguiente:

El cálculo y la comprobación es la siguiente:

 x A  x A´     A   A´  H  3,33  3,83  0 
0
  3,7 
 1 nA   1 nA '  0,38 1 16   1 16   3,7  1,96  RH 0
Z1 2  Z 0,975  1,96 

El resultado obliga a rechazar que el comportamiento sea igual para el produc-


to con aditivo y sin aditivo.
Este ejercicio podría también haberse resuelto mediante un intervalo de con-
fianza utilizando la cantidad pivotal equivalente al estadístico referido.

© Ediciones Pirámide 163


Problemas resueltos de estadística

  x  x A´     A   A´  
P  q1  Q  q2   P  Z 2  A  Z1 2 
  1 nA   1 nA '  


IC   A   A´ ;    x A  x A´   Z1 2 1 nA   1 nA '   

  3,33  3,83  Z 0,975 0,38 1 16   1 16   

  3,33  3,83  1,96  0,38 1 16   1 16   
 IC   A   A´ ;0,05    0,73; 0, 26 

El resultado conduce a pensar que el valor medio del producto sin aditivo es
inferior en todo caso al valor medio del producto con aditivo al quedar los dos
límites del intervalo con signo negativo. Con el siguiente esquema gráfico puede
comprobarse la coincidencia del planteamiento con el contraste de hipótesis pre-
viamente planteado:


IC   A   A ' ;    x A  x A '   1  / 2  1 / n A   1 / n A '  

4.9 En un almacén hay dos tipos de interruptores. De ellos, 150 son del tipo A y 250
del tipo B. Estos interruptores se comportan con arreglo a diferentes distribucio-
nes de tiempos hasta el fallo. Así, los de tipo A siguen un modelo exponencial de

164 © Ediciones Pirámide


Ejercicios de aplicación

media 0,25 fallos por año y la vida de los del tipo B sigue una distribución normal
de media 4 años y desviación típica 1,5 años.
1. Una habitación del almacén dispone de un único interruptor, pero se des-
conoce su tipo. Calcular de manera razonada la probabilidad de que al fi-
nal del segundo año el interruptor no se haya averiado.
2. Un interruptor tomado al azar funcionó más de dos años. ¿Cuál es la pro-
babilidad de que dicho interruptor fuera del tipo B? Razonar la respuesta.
3. Acaba de salir al mercado un nuevo interruptor cuyo tiempo de funcio-
namiento en años sigue una distribución normal. Se han muestreado alea-
toriamente 10 de estos interruptores, obteniéndose el tiempo hasta el fallo
de cada uno:

5,1 4,2 6,3 5,7 4,8 5,2 5,5 4,9 5,6 6,1

Obtener de manera razonada una estimación por intervalo al 95 % de


confianza para la media de la duración, indicando los supuestos y el esta-
dístico adecuado.
4. A partir de la misma muestra anterior, deducir de forma razonada un in-
tervalo de confianza para la desviación típica de la duración, indicando
los supuestos y el estadístico adecuado.
5. El fabricante afirma que la vida media de estos nuevos interruptores es de
6 años. Contrastar de manera razonada si la afirmación del fabricante es
correcta, utilizando la muestra anterior, indicando de manera razonada las
hipótesis de partida, región crítica, estadístico de contraste y p-valor.

Solución:

1. Una habitación del almacén dispone de un único interruptor, pero se des-


conoce su tipo. Calcular de manera razonada la probabilidad de que al fi-
nal del segundo año el interruptor no se haya averiado.
La probabilidad de que un interruptor seleccionado al azar no se hubiese es-
tropeado transcurridos dos años debe contemplar en primer lugar la probabilidad
de seleccionar cualquiera de los dos tipos de interruptores y la probabilidad de
que cualquiera de esos tipos tenga una duración superior a los dos años. Esta pro-
babilidad debe calcularse de forma específica para cada uno de los dos tipos de
interruptores mediante el modelo de probabilidad que rige cada uno de ellos (ex-

© Ediciones Pirámide 165


Problemas resueltos de estadística

ponencial en el caso de los interruptores tipo A y normal para los interruptores


tipo B), mientras que la probabilidad de seleccionar cada tipo de interruptor es
consecuencia directa de la cantidad de cada uno de ellos disponible.
Este planteamiento responde al teorema de la probabilidad tal y como se ob-
serva en el siguiente esquema:

La formulación de la probabilidad total de que un interruptor tenga una dura-


ción superior a dos años es la siguiente:

P T  2   P T  2 A  P  A   P T  2 B  P  B 

Las dos condiciones de las probabilidades anteriores ejercen su influencia me-


diante el uso de los respectivos modelos a los que hace referencia el enunciado.
El cálculo de cada una de las probabilidades requeridas para deducir la probabili-
dad total es el siguiente:

P T  2 A  1  P T  2 A  1  1  e 42   0,0003
150
P  A   0,375
400
2  4
P T  2 B   1  P T  2 B   1  P  Z   0,9
 1,5 
250
P  B   0,625
400

166 © Ediciones Pirámide


Ejercicios de aplicación

Simplemente resta operar con las probabilidades anteriores hasta obtener la


probabilidad de que un interruptor dure más de dos años:

P T  2  P T  2 A P  A  P T  2 B  P  B  
  0,0003  0,375    0,9  0,625   0,567

2. Un interruptor tomado al azar funcionó más de dos años. ¿Cuál es la pro-


babilidad de que dicho interruptor fuera del tipo B? Razonar la respuesta.
En este apartado el enunciado propone un planteamiento que responde al teo-
rema de Bayes, puesto que la condición alude a los interruptores cuya duración ha
sido superior a 2 años y de entre éstos pide calcular la probabilidad de que el
interruptor fuese de tipo B. El esquema es el siguiente:

El cálculo de la probabilidad es el siguiente:

P T  2 B  P  B  0,9  0,625
P  B T  2    0,99
P T  2 0,567

3. Acaba de salir al mercado un nuevo interruptor cuyo tiempo de funcio-


namiento en años sigue una distribución normal. Se han muestreado alea-
toriamente 10 de estos interruptores, obteniéndose el tiempo hasta el fallo
de cada uno:

© Ediciones Pirámide 167


Problemas resueltos de estadística

5,1 4,2 6,3 5,7 4,8 5,2 5,5 4,9 5,6 6,1

Obtener de manera razonada una estimación por intervalo al 95 % de


confianza para la media de la duración, indicando los supuestos y el esta-
dístico adecuado.
El enunciado solicita calcular un intervalo de confianza para la media pobla-
cional a partir de una muestra aleatoria simple de duraciones de interruptores.
Ante el desconocimiento de la varianza poblacional, la cantidad pivotal a emplear
y el esquema del intervalo son los siguientes:

x
Q  t n 1
Sn 1 n

Para calcular los límites del intervalo se requiere conocer la media y cuasides-
viación típica muestrales que proceden directamente de los datos del enunciado:

x   i 1 xi n  5,34
i 10


i 10
sn 1 i 1
 xi  x 2  n  1  0,39  0,63

Simplemente resta deducir los límites del intervalo a partir de la cantidad pi-
votal y obtener el resultado final:

x 
P  q1  Q  q2   P t 2   t1 2 
 Sn 1 n 

168 © Ediciones Pirámide


Ejercicios de aplicación

 s s 
IC   ;    xn  n 1 t1 2  n  1 ; xn  n 1 t1 2  n  1 
 n n 
IC   ;0,05    5,34  t0,975  9   
0,63 0,63
t0,975  9  ;5,34 
 10 10 
  5,34  2,26  
0,63 0,63
2, 26;5,34 
 10 10 
 IC   ;0,05   4,88;5,79 

4. A partir de la misma muestra anterior, deducir de forma razonada un in-


tervalo de confianza para la desviación típica de la duración, indicando
los supuestos y el estadístico adecuado.
En el caso de la varianza poblacional, cambia la cantidad pivotal y el esquema
gráfico:

 n  1 sn21
  n21
2

Una vez identificada la cantidad pivotal, el desarrollo es equivalente el resto


de intervalos con la salvedad de tener que considerar la raíz cuadrada de los
valores al solicitar el enunciado un intervalo para la desviación típica y no para
la varianza:

© Ediciones Pirámide 169


Problemas resueltos de estadística

 n  1 sn21
  n21
2
 
  n21  2    2 n 1
n  1 s2
P  q1  Q  q2   P 

   n21 1 2 
  n  1 sn21  n  1 sn21 
IC  ;    ; 

   n21 1 2   n21  2 

 10  1 0,39 10  1 0,39 
IC  ;0,05    ; 

   2
10  0,975
  2
10  0,025


 10  1 0,39 10  1 0,39 
 ; 
 19,02 2,7 
 IC  ;0,05    0, 42;1,14 

5. El fabricante afirma que la vida media de estos nuevos interruptores es de


6 años. Contrastar de manera razonada si la afirmación del fabricante es
correcta, utilizando la muestra anterior, indicando de manera razonada las
hipótesis de partida, región crítica, estadístico de contraste y p-valor.
El enunciado solicita resolver un contraste de hipótesis bilateral para la me-
dia de la población empleando el p-valor. La formulación del contraste es la
siguiente:
H0 :   6
H1 :   6
El estadístico con el que debe afrontarse la solución al contraste a la vista de la
información disponible será el siguiente:
x  ()H0
tn1
Sn1 n
La resolución del contraste mediante el p-valor requiere, en cierto modo,
cuantificar la probabilidad de que el estadístico se ubique en la región de acepta-
ción que, como en este caso se trata de un contraste bilateral que se resuelve me-
diante una distribución simétrica, puede plantearse como sigue:

170 © Ediciones Pirámide


Ejercicios de aplicación

 x    H0   5,34  6 
p -valor  2 P t n 1    2 P  t10 1    0, 001
 S n 1 n   0, 63 10 

Siendo tan baja la probabilidad no cabe más que descartar la opción de que la
hipótesis nula sea cierta, ya que la probabilidad de que el estadístico se sitúe en la
región de aceptación es ínfima.

4.10 Se sabe que el valor medio de la producción de las 25 plantas de la misma com-
pañía en un país que produce fibras textiles asciende a 4.553,32 t/día con una
desviación típica de 719,38 t/día. Se pide:

1. Calcular un intervalo de confianza para la desviación típica de todas las


plantas.
2. Para el mismo nivel de confianza, ¿cuál es el tamaño de la muestra que
permite un error máximo de estimación de la desviación típica de 250 kg?
Nota: la cifra exacta se encuentra entre 18 y 23.

Solución:

1. Calcular un intervalo de confianza para la desviación típica de todas las


plantas.
El intervalo de confianza para la desviación típica con la información disponi-
ble requiere emplear la siguiente cantidad pivotal:

 n  1 sn21
Q   n21
 2

Deben no obstante hacerse las transformaciones oportunas para poder deducir


el intervalo en términos de la desviación típica:

  n  1 sn21 
P  q1  Q  q2   P 

  n21  2   2
   n21 1 2 

© Ediciones Pirámide 171


Problemas resueltos de estadística

  n  1 sn21  n  1 sn21 
IC  ;    ; 

   n21 1 2   n21  2 

  25  1 733,12  25  1 733,12 
 ; 
   24   0,025  24  
 0,975 
  25  1 733,12  25  1 733,12 
 ; 
 39,36 12, 40 
 
 IC  ;0,05    572, 25;1.020,05 

2. Para el mismo nivel de confianza, ¿cuál es el tamaño de la muestra que


permite un error máximo de estimación de la desviación típica de 250 kg?
Nota: la cifra exacta se encuentra entre 18 y 23.

La solución a este planteamiento requiere de un cálculo iterativo al depender


los grados de libertad de la distribución chi-cuadrado del tamaño de la muestra.
Por ello el enunciado informa que la solución se encuentra en el intervalo entre
18 y 23. El planteamiento del problema es el siguiente:

 n  1 sn2  n  1 sn2
L  
 2   n  1  2  n  1
1
2 2

 
 1 1 
  n  1 s  2
   250
 2
 1 
n
 n  1  2
  n  1 
 2 2 
La solución pasa por asignar valores a n en la expresión hasta hacer que el ta-
maño deducido sea igual a los grados de libertad más una unidad:

Grados de libertad 0,025


2
 n1 0,975
2
 n1 n

50 32,40 71,4 142


27 14,60 43,2 038,7
19 08,91 32,9 19
20 09,59 34,2 21

172 © Ediciones Pirámide


Ejercicios de aplicación

4.11 En un matadero se ha observado que el peso de la canal de las reses sacrificadas


durante varios años sigue una ley normal de media 100 kg y desviación típica
20 kg. Se desea construir la curva de potencia del test unilateral (α = 0,01) que
permitiría saber si el peso es igual o superior a 100 kg. Para construir la curva
se seleccionó una muestra de 25 animales cuyo peso medio fue de 110 kg. Para
construir la curva de potencia, emplear los valores 102, 104, 106 y 108.

Solución:

La función de potencia para un contraste unilateral superior para la media po-


blacional de una distribución normal de la que se conoce a la varianza poblacio-
nal puede deducirse de la forma siguiente:

 x  (  ) H0    
P AH0 H0   P   Z1   P  x  ()H0  Z1   P x  x1 
  n   n 

P     1       1  P  AH0 H1   1  P  x  x1 H1  
 x  H1 x1  ( ) H1   x1  ( ) H1 
1 P     1  P Z  
 n  n    n 
 n
 1  P  Z  Z1   ( )H0  ( ) H1   
  
 25 
 1  P  Z  2,32  100  ( )H1  
 20 

Una vez definida la función de potencia en los términos descritos, simplemen-


te resta calcular cada una de las probabilidades para cada uno de los valores de la
media poblacional a los que alude el enunciado:

µ  ( ) P( )  1   (m)
102 0,97 0,03
104 0,91 0,09
106 0,80 0,20
108 0,63 0,37

© Ediciones Pirámide 173


Problemas resueltos de estadística

Si se construyese la curva de potencia con un mayor número de datos el resul-


tado sería el siguiente:

4.12 El departamento de marketing de una marca de automóviles considera que el


tiempo que transcurre para la renovación de un automóvil por parte de su cliente
típico puede representarse por la función de densidad:

1 2
f ( x)  x 0 x6
72
1. ¿Cuál es la probabilidad de que una familia tarde más de 5 años en reno-
var su automóvil, supuesto que ya han pasado más de 3 años desde la
compra del actual?
2. Calcular la probabilidad de que al menos 2 de los 10 clientes renueven el
coche con más de 3 años.
3. Calcule el tiempo en que como máximo se renovarán el 75 % de los coches.
4. Suponga que el Gobierno implementa un sistema de estímulo del sector
del automóvil que consiste en subvencionar a los compradores de coches,
de manera que el coste medio de un coche tipo después de la subvención
viene dado por la siguiente expresión:
C = 18.000 – 1.000X
Obtenga de manera razonada el coste medio del nuevo coche.

174 © Ediciones Pirámide


Ejercicios de aplicación

Solución:
1. ¿Cuál es la probabilidad de que una familia tarde más de 5 años en reno-
var su automóvil, supuesto que ya han pasado más de 3 años desde la
compra del actual?

Se trata de calcular una probabilidad condicionada para la variable aleatoria


cuya función de densidad proporciona el enunciado. Se obtiene sin más que plan-
tear la definición de probabilidad condicionada y especificar bien los límites de
las integrales definidas a partir de las que se obtienen las correspondientes proba-
bilidades. El desarrollo es el siguiente:

P  X  5  X  3 P  X  5
P  X  5 X  3   
P  X  3 P  X  3

1    x 2 72  dx
5
0, 42
 0
  0, 48
1    x 72  dx
3
2 0,87
0

2. Calcular la probabilidad de que al menos 2 de los 10 clientes renueven el


coche con más de 3 años.

El experimento así definido debe ser analizado mediante un modelo binomial


en el que el parámetro p sea la probabilidad de renovar el vehículo con más de
tres años y el parámetro n sea diez puesto que es el número de individuos que
componen el experimento. Ha de calcularse, por tanto, la probabilidad de que se
renueve el vehículo con más de tres años para la variable aleatoria cuya función
de densidad propone el enunciado. La citada probabilidad es la siguiente:

P  X  3  1  P  X  3  1    x 2 72  dx  0,87
3

Quedando entonces la distribución binomial definida de la forma siguiente:

Y   10;0,87

La probabilidad solicitada por el enunciado es la probabilidad de que la varia-


ble aleatoria Y así definida sea igual o superior a dos unidades:

© Ediciones Pirámide 175


Problemas resueltos de estadística

P Y  2  1  P Y  1  1   P Y  0  P Y  1 

 10! 10 0 10! 10 1 


1  0,870 1  0,87   0,871 1  0,87  
 0!10  0 ! 1!10  1! 
 0,99

3. Calcule el tiempo en que como máximo se renovará el 75 % de los coches.

Se trata de calcular el valor de X, variable aleatoria original del enunciado, tal


que la probabilidad acumulada a este punto sea igual a 0,75. Puede plantearse a
partir de la función de densidad o de la función de distribución. Sea a el valor
buscado:

F  a   P  X  a    f  x  dx  0,75
a

 x 72  dx  0,75  a3 216  0,75  a  5,45años


a
2
0

4. Suponga que el gobierno implementa un sistema de estímulo del sector


del automóvil que consiste en subvencionar a los compradores de coches,
de manera que el coste medio de un coche tipo después de la subvención
viene dado por la siguiente expresión:

C = 18.000 – 1.000X

Obtenga de manera razonada el coste medio del nuevo coche.

Se trata de calcular el valor esperado de una nueva variable aleatoria definida


como una transformación lineal de la variable aleatoria X original, con lo que
simplemente ha de calcularse aplicando las propiedades del operador esperanza
matemática y deducirla resolviendo la esperanza matemática de la variable trans-
formada:

176 © Ediciones Pirámide


Ejercicios de aplicación

E C   18.000  1.000 E  X   18.000  1.000 x f  x  dx 


6

 18.000  1.000 x  x 2 72  dx  18.000  1.000  4,5  13.500


6

4.13 En las siguientes tablas y gráficos se recoge información sobre las atenciones
sanitarias no domiciliarias atendidas a través del teléfono 112 de Protección Civil
durante los últimos 180 días en cierta ciudad española. Para cada día se ha obser-
vado el tiempo medio de respuesta (en minutos) de las ambulancias para acciden-
tes con heridos y el número de accidentes atendidos según su tipología (accidente
de tráfico, laboral y otros):

Global Lunes-Viernes Sábado-Domingo


Media 0.013,91 0.012,650 020,65
Mediana 0.007,72 0.007,430 016,45
Cuasidesviación típica 0.014,12 0.012,750 018,59
Curtosis 0.002,00 0.002,760 0–0,19
Asimetría 0.001,52 0.001,650 000,85
Rango 0.065,16 0.061,090 064,99
Mínimo 0.000,02 0.000,023 000,18
Máximo 0.065,18 0.061,110 065,18
Suma 2.505,42 1.897,510 607,90
Tamaño muestra 0.180,00 0.150,000 030,00

Número de accidentes atendidos


Tráfico Laboral Otros
Lunes-Viernes 111 9 30
Sábado-Domingo 26 1 3

© Ediciones Pirámide 177


Problemas resueltos de estadística

Tiempo medio de respuesta global Tiempos medios de respuesta

Responda justificadamente a las siguientes cuestiones indicando las tablas y/o


gráficos que utiliza para su razonamiento:
1. Describa la forma de la distribución del tiempo medio de respuesta (glo-
bal) e indique la medida de centralización que sería representativa en di-
cha distribución.
2. Justifique si son ciertas o falsas las siguientes afirmaciones:
i. En más de la mitad de los casos, el tiempo medio de respuesta de las am-
bulancias durante los fines de semana es más de dos veces superior al de
los días laborables.
ii. En el 75 % de los casos el tiempo medio de respuesta de las ambulancias
durante los fines de semana es superior a 30 minutos.
3. Si tuviera que dar un tiempo máximo de respuesta por debajo del cual
pudiera garantizar que se ha atendido el 75 % de las emergencias de lunes
a viernes, ¿qué tiempo daría?

178 © Ediciones Pirámide


Ejercicios de aplicación

4. ¿Puede afirmarse a un 5 % de significación que el tiempo medio de res-


puesta en los fines de semana es significativamente superior al de lunes a
viernes? (utilice la aproximación a la normal). Plantee las hipótesis, esta-
dístico de contraste, región crítica y decisión/conclusión.
5. Obtenga el p-valor del contraste anterior.

Solución:
1. Describa la forma de la distribución del tiempo medio de respuesta (glo-
bal) e indique la medida de centralización que sería representativa en di-
cha distribución.
El histograma de frecuencias del tiempo de respuesta global presenta cierta
asimetría a la derecha, lo que recomienda no recurrir a la media aritmética como
medida de posición central ya que resulta ser una medida sensible a los valores
extremos. Resultan más robustas en este caso la moda o la mediana.
2. Justifique si son ciertas o falsas las siguientes afirmaciones:
i. En más de la mitad de los casos, el tiempo medio de respuesta de las am-
bulancias durante los fines de semana es más de dos veces superior al de
los días laborables.
La afirmación es verdadera puesto que la mediana de la variable tiempo de
respuesta en fin de semana (16,45) es superior al doble de la mediana del tiempo
de respuesta en días laborables (7,43 × 2 = 14,86).
ii. En el 75 % de los casos el tiempo medio de respuesta de las ambulancias
durante los fines de semana es superior a 30 minutos.
Falso, puesto que por encima del tercer cuartil no queda un 75 % de los datos,
sino el 25 %, tal y como muestra el diagrama de caja correspondiente al tiempo
de respuesta en los fines de semana.
3. Si tuviera que dar un tiempo máximo de respuesta por debajo del cual se
pudiera garantizar que se ha atendido el 75 % de las emergencias de lunes
a viernes, ¿qué tiempo daría?
Aproximadamente 18 minutos, que se corresponde con el tercer cuartil del
diagrama de caja y que es el valor que deja por debajo de él el 75 % de los datos.

4. ¿Puede afirmarse a un 5 % de significación que el tiempo medio de res-


puesta en los fines de semana es significativamente superior al de lunes a

© Ediciones Pirámide 179


Problemas resueltos de estadística

viernes? (utilice la aproximación a la normal). Plantee las hipótesis, esta-


dístico de contraste, región crítica y decisión/conclusión.
Debe resolverse un contraste de hipótesis para la diferencia entre los valores
medios de ambos tiempos de espera. La formulación del contraste es la siguiente:

H 0 : F  L  H 0 : F  L  0

H1 : F  L  H1 : F  L  0

Al ser el contraste unilateral, la región de rechazo se sitúa sobre una única cola
de la distribución t-Student, tal y como se observa en el esquema siguiente:

En estas condiciones, la solución al contraste se deduce de la forma siguiente:

 xF  xL     F   L  H 
0
 
1  nF  1 sn 1   nL  1 sn 1 
2 2
1
 F L

nF nL n F  nL  2 

 20, 26  12,65   0 
  2,74 
1 1  30  1 345,58  150  1162,56 
 
30 165 30  150  2 
 
tn1  n2  2
1
  t178 0,95  1,65  Z 0,95  1,65 

 2,74  1,65  RH 0

180 © Ediciones Pirámide


Ejercicios de aplicación

Por lo que debe rechazarse que el tiempo medio de respuesta sea igual en fin
de semana que en día laborable.
5. Obtenga el p-valor del contraste anterior.
El p-valor debe calcularse como la probabilidad de que el estadístico se sitúe
en la región de aceptación del contraste, lo que implica calcular la siguiente pro-
babilidad:

  xF  xL     F   L  H 
P tn1  n2  2  0

 1  nF  1 sn 1   nL  1 sn 1 
2 2
1
  F L

 nF n L nF  n L  2 
  20, 26  12,65   0 
 1  P t178  
 1

1  30  1 345,58  150  1162,56 
 30 165 30  150  2 

 1  P t178  2, 74   1  P  Z  2, 74   0, 002

conduciendo el p-valor a la misma conclusión que la resolución del apartado an-


terior, que no es otra que el rechazo de la hipótesis nula de igualdad entre los
tiempos de respuesta de fin de semana y día laborable.
Cabe fijarse en cómo el esquema gráfico del planteamiento del p-valor es
complementario al reflejado en el apartado anterior para resolver el contraste
mediante la comparación del estadístico y el cuantil:

© Ediciones Pirámide 181


Problemas resueltos de estadística

4.14 La función de densidad asociada a la duración en días de un determinado pro-


ducto es:

f ( x)  k (2  x) 0  x  2

1. Determinar el valor de la constante k.


2. Si el producto sólo está en condiciones óptimas para su venta entre 12 ho-
ras y 48 horas después de haber sido producido, calcular la probabilidad
de que el producto esté en condiciones óptimas para su venta (considére-
se que un día son 24 horas).
3. Una determinada empresa tiene capacidad para producir únicamente cua-
tro de estos productos cada día. ¿Cuál es la probabilidad de que no pueda
vender todos los productos fabricados un día cualquiera?
4. Cada uno de estos productos cuesta producirlo 200 euros. Si el precio de
venta de cada producto es de 510 euros si es óptimo para la venta y de
310 si no lo es, calcule el beneficio esperado por producto.
Solución:
1. Determinar el valor de la constante k.
El valor de la constante k se deduce del planteamiento de las propiedades de la
función de densidad, en especial de aquella que establece que la derivada de la
función de densidad a lo largo de todo el dominio de definición de la variable
debe ser igual a la unidad. Basta con plantear la integral definida, igualarla a uno
y despejar el valor de k que garantiza tal propiedad:

2
2  kx 2  
Dx
f  x  dx  1   k  2  x  dx   2kx 
0 
 1 k 1 2
2  0

2. Si el producto sólo está en condiciones óptimas para su venta entre 12 ho-


ras y 48 horas después de haber sido producido, calcular la probabilidad
de que el producto esté en condiciones óptimas para su venta (considére-
se que un día son 24 horas).
El enunciado solicita calcular la probabilidad de un intervalo, lo que implica
integrar la función de densidad entre los límites fijados o recurrir a las funciones
de distribución definidas para cada uno de los dos puntos. En la medida en la que

182 © Ediciones Pirámide


Ejercicios de aplicación

el enunciado directamente proporciona la función de densidad, se recurrirá a este


procedimiento:

2
2  x  x2 
P  0,5  X  2  
2
dx   x     0,56
0,5 2  4  0,5

3. Una determinada empresa tiene capacidad para producir únicamente cua-


tro de estos productos cada día. ¿Cuál es la probabilidad de que no pueda
vender todos los productos fabricados un día cualquiera?
Ha de plantearse una nueva variable aleatoria en términos dicotómicos, puesto
que la probabilidad solicitada alude a la posibilidad, o no, de vender los produc-
tos, siendo el parámetro p la probabilidad de que el producto se venda en un pe-
ríodo de entre 12 y 48 horas ya calculada en el apartado anterior.
La nueva variable aleatoria se comporta, por tanto, de la siguiente forma:

Y    4; 0, 56 

La probabilidad requerida por el enunciado es la siguiente:

P Y  4  P Y  0  P Y  1  P Y  2  P Y  3 
4!
  xi 1
x 3  4 x 
0,56 xi 1  0,56  i  0,90
i
xi ! 4  xi !

4. Cada uno de estos productos cuesta producirlo 200 euros. Si el precio de


venta de cada producto es de 510 euros si es óptimo para la venta y de
310 si no lo es, calcule el beneficio esperado por producto.
El resultado exigido en este apartado procede de obtener el beneficio, como
diferencia entre ingreso y coste, para cada tipo de producto (óptimos para la venta
y no óptimos) y multiplicar este beneficio por la probabilidad de cada uno de los
productos, sabiendo que la probabilidad de que el producto sea óptimo es la pro-
babilidad de que se venda entre 12 y 48 horas (calculada anteriormente igual a
0,56), y la probabilidad de que no sea óptimo será su complementaria:

© Ediciones Pirámide 183


Problemas resueltos de estadística

Tipo de producto Beneficio Probabilidad


Óptimo 510 – 200 = 310 0,56
No óptimo 310 – 200 = 110 0,44

De esta forma, el beneficio esperado se obtiene a partir de la suma de los con-


ceptos anteriores:

E  B    310  0,56   110  0, 44   222

4.15 La demanda de un determinado tipo de artículo ha venido comportándose durante


los últimos años con arreglo a una distribución N (µ,20). A la empresa que lo
produce se le ofrece una campaña publicitaria del artículo con objeto de aumentar
sus ventas. Si bien el precio de la campaña es alto, la empresa considera que si su
aplicación eleva la venta media por encima de las 250 unidades, su contratación
sería rentable. Con objeto de tomar una decisión, tal campaña se aplica durante un
cierto período de prueba, obteniéndose como venta media, en dicho período 260
unidades, correspondientes a 35 de sus clientes habituales. Plantear el contraste
de hipótesis adecuado y contestar a las siguientes preguntas:
1. ¿Qué decisión adoptará la empresa, al nivel de significación del 1 %?
2. ¿Cuál será la potencia del contraste anterior para un valor de la media
poblacional de 252 unidades?

Solución:
1. ¿Qué decisión adoptará la empresa, al nivel de significación del 1 %?
Se trata de un contraste unilateral superior para la media poblacional que pue-
de formularse de la forma siguiente:

H0 :   250
H1 :   250

El estadístico adecuado a la información de la que se dispone es el siguiente:

x     H0
Z
 n

184 © Ediciones Pirámide


Ejercicios de aplicación

Siendo la regla de decisión la siguiente:

x    H0
RH 0   Z1
 n

Por último, la resolución numérica al contraste:

x    H 0 260  250 
  2,95 
 n 
20 35    2,95  2,32  RH 0

Z1  Z 0,99  2,32 

Debe por tanto rechazarse la hipótesis nula y pensar que las ventas podrían ser
superiores a las 250 unidades.

2. Calcule la potencia del contraste anterior para un valor de la media po-


blacional de 252 unidades.
El cálculo de la potencia exige calcular la probabilidad complementaria de la
vinculada al error de segunda especie:

P     1       1  P  AH 0 H1   1  P  x  x1 H1  

 x     H1 x1     H1   x1     H1 
1 P     1  P Z  
  n  n    n 

© Ediciones Pirámide 185


Problemas resueltos de estadística



1 P Z 
  
0   n Z1     H1 
 
  n 
 
 n 
 1  P  Z  Z1     H0     H1   
  
 35 
 1  P  Z  2,32   250  252    1  P  Z  1,73  0,041
 20 

El contraste es poco potente y, por tanto, la probabilidad de cometer el error


de segunda especie es elevada.

4.16 Una multinacional se dedica al mantenimiento de estaciones depuradoras de


aguas residuales (EDAR) y gestiona 100 plantas en el hemisferio norte y 300 en
el hemisferio sur. La empresa está preocupada porque de forma aleatoria acceden
aguas residuales con una elevada concentración de compuestos radiactivos, lo
cual daña los filtros biológicos. Esta multinacional sabe que las puntas de concen-
tración diarias en el hemisferio norte se producen con arreglo a la siguiente ley de
probabilidad:

3 1
P  X HN  xi     x  0,1, 2,3, 4
2 x ! 4  x  !

Por su parte, las puntas de concentración diarias en el hemisferio sur se distri-


buyen con arreglo a la siguiente ley:

e2 2 x
P  X HS  xi    x  0
x!

1. Calcular la probabilidad de que se produzcan más de dos puntas de con-


centración en alguna de las plantas de la compañía.

186 © Ediciones Pirámide


Ejercicios de aplicación

2. La probabilidad de que se produzca alguna punta de concentración en el


hemisferio norte o en el hemisferio sur suponiendo que las puntas se pro-
ducen de forma independiente entre ambos hemisferios.
3. ¿Cuál es la probabilidad de que transcurran tres días hasta que se observe
la primera punta de contaminación en el hemisferio sur?
4. Si se selecciona una muestra de tres EDAR en el hemisferio sur, ¿cuál es
la probabilidad de que la media de puntas de concentración de esas tres
EDAR sea superior a tres?
5. Si se selecciona una muestra de 100 EDAR en el hemisferio sur, ¿cuál es
la probabilidad de que la media de puntas de concentración de esas 100
EDAR sea superior a 2,5?

Solución:

1. Calcular la probabilidad de que se produzcan más de dos puntas de con-


centración en alguna de las plantas de la compañía.
La probabilidad de que se produzcan más de dos puntas de concentración en
alguna de las EDAR de la compañía debe ser el resultado de sumar la probabili-
dad de que se produzcan más de dos puntas de concentración en el hemisferio
norte más la probabilidad de que se produzcan más de dos puntas de concentra-
ción en el hemisferio sur. Este esquema recuerda a un suceso que puede producir-
se de forma transversal a una serie de sucesos en los que se divide el espacio
muestral total, remitiendo al teorema de la probabilidad total.

© Ediciones Pirámide 187


Problemas resueltos de estadística

La peculiaridad viene impuesta por las características de las funciones de den-


sidad de cada una de las dos variables aleatorias (XHN y XHS). El planteamiento de
la probabilidad total es el siguiente:

P  X  2   P  X  2 X HS  P  X HS   P  X  2 X HN  P  X HN 

Por tanto, hay que calcular cada una de las probabilidades condicionadas con
las respectivas funciones de cuantía (en realidad, la condición referida a cada
hemisferio se implementa gracias a la existencia de funciones de cuantía específi-
ca para cada suceso), así como las probabilidades absolutas:

P  X  2 X HS   1  P  X  2 X HS  

 1   P  X  0 X HS   P  X  1 X HS   P  X  2 X HS  

 e 2 20 e 2 21 e 2 2 2 
1      1  0,67  0,32
 0! 1! 2! 

P  X  2 X HN   1  P  X  2 X HN  

 1   P  X  0 X HN   P  X  1 X HN   P  X  2 X HN  

3 1 3 1 3 1 
1      1  0,68  0,31
 2 0! 4  0 ! 2 1! 4  1! 2 2! 4  2 !

Por su parte, las probabilidades absolutas son las siguientes:

300
P  X HS    0,75
400
100
P  X HN    0, 25
400

Finalmente, la probabilidad total de que se produzcan más de dos puntas de


concentración como combinación de las anteriores:

P  X  2   P  X  2 X H S  P  X HS   P  X  2 X H N  P  X H N  
  0, 75  0, 32    0, 25  0, 31   0, 32

188 © Ediciones Pirámide


Ejercicios de aplicación

2. La probabilidad de que se produzca alguna punta de concentración en el


hemisferio norte o en el hemisferio sur suponiendo que las puntas se pro-
ducen de forma independiente entre ambos hemisferios.
El enunciado solicita calcular la probabilidad de una unión de sucesos: produ-
cirse alguna punta de concentración en el hemisferio norte (XHN > 0) o producirse
alguna punta de concentración en el hemisferio sur (XHS > 0). Para deducir esta
probabilidad basta con recurrir a los axiomas probabilísticos y aplicar las conse-
cuencias de la independencia de sucesos para el cálculo de la intersección:

P  X HS  0    X HN  0    P  X HS  0  P  X HN  0  P  X HS  0    X HN  0   

 P  X HS  0  P  X HN  0   P  X HS  0 P  X HN  0

Simplemente queda calcular las probabilidades de que se produzca alguna


punta de concentración en cada uno de los dos hemisferios con las correspondien-
tes funciones de cuantía:

e2 20
P  X HS  0  1  P  X HS  0  1   0,93
0!
3 1
P  X HN  0  1  P  X HN  0  1   0,86
2 0! 4  0 !

Y finalmente sustituir para calcular la probabilidad de la unión de sucesos:

P   X HS  0    X H N  0   

 P  X HS  0   P  X HN  0    P  X HS  0  P  X H N  0  
 0, 93  0, 86   0, 93  0, 86   0, 99

3. ¿Cuál es la probabilidad de que transcurran tres días hasta que se observe


la primera punta de contaminación en el hemisferio sur?
El tiempo que transcurre hasta que se produce la primera punta de concentra-
ción en el hemisferio sur puede estudiarse mediante una distribución exponencial
al ser el modelo que rige las puntas de concentración por unidad de tiempo una
distribución de Poisson. El planteamiento del modelo es el siguiente:

t HS  E  2 

© Ediciones Pirámide 189


Problemas resueltos de estadística

Finalmente, la probabilidad de que tarde exactamente tres días se calcula con


la función de densidad del modelo exponencial:

PtHS  3  ex  2e23  0,005

4. Si se selecciona una muestra de tres EDAR en el hemisferio sur, ¿cuál es


la probabilidad de que la media de puntas de concentración de esas tres
EDAR sea superior a tres?
En este caso se requiere calcular una probabilidad vinculada a la media de una
muestra de tres EDAR en el hemisferio sur. El tamaño de la muestra no es lo
suficientemente grande como para poder aplicar el teorema central del límite,
pero, sin embargo, cabe aceptarse que la media muestral es una combinación
lineal de variables aleatorias que se distribuyen según un modelo de Poisson, con
lo que éste debe ser el modelo con el que estudiar la media muestral.
Por simplificar el tratamiento, antes de deducir el modelo se opera con el de-
nominador de la media muestral de la forma siguiente:

 X HS1  X HS 2  X HS3 
P  X HS  3  P   3  P  X HS1  X HS 2  X HS3  9  
 3 

 
 X HS1  X HS2  X HS3  YHS  P  HS1  HS2  HS3   P  6   1  P YHS  9   0, 08

5. Si se selecciona una muestra de 100 EDAR en el hemisferio sur, ¿cuál es


la probabilidad de que la media de puntas de concentración de esas 100
EDAR sea superior a 2,5?
El tamaño de la muestra sí permite en este caso aplicar el teorema central del
límite, pudiendo calcularse la probabilidad vinculada a la media muestral median-
te una distribución normal de la forma siguiente:


P  X HS  2,5  X HS 
n 
 N   ;  n   N  2;0,14   
 2,5  2 
 1  P  X HS  2,5  1  P  Z  0
 0,14 

190 © Ediciones Pirámide


Ejercicios de aplicación

4.17 En el proceso de etiquetado de un producto agroalimentario los paquetes deben


pasar necesariamente por dos fases, como se muestra en la figura siguiente:

Cada fase se controla con un componente (C1 y C2 respectivamente) en serie


cuyas duraciones, en miles de horas, se comportan de manera independiente:
— C1 como exponencial de parámetro 0,2.
— C2 como una variable aleatoria cuya función de densidad es la si-
guiente:

2
f  C 2   c2  1
C 23

1. Calcule la probabilidad de que el componente C1 funcione más de 1.500


horas y el componente C2 funcione más de 1.500 horas a la vez.
2. ¿Cuál es la probabilidad de que la duración total de 70 componentes del
tipo C1 supere las 400.000 horas?
3. Se está evaluando la compra de unos nuevos componentes cuyas dura-
ciones se distribuyen según una normal de media 3.000 horas y desvia-
ción típica 200 horas cada uno. El proveedor ha mandado una muestra
de 100 componentes de este tipo cuyos funcionamientos son indepen-
dientes entre sí. ¿Cuál es la probabilidad de que el promedio de dura-
ción de esta muestra supere en más de 40 horas a la de la media pobla-
cional?
4. Se han muestreado 100 componentes de cada tipo (C1 y C2) cuyo resu-
men de estadísticos se muestra a continuación:

© Ediciones Pirámide 191


Problemas resueltos de estadística

C1 C2
Recuento 100,0000 100,00000
Promedio 4,880 3,4900
Mediana 3,580 2,3200
Desviación estándar 4,650 3,5700
Coeficiente de variación 95,28%0 102,30%000
Mínimo 0,028o 0,0065
Máximo 24,080o 16,70000
Rango 24,050o 16,69000
Cuartil inferior 1,790 1,0600
Cuartil superior 6,890 4,8600

Responda a las siguientes cuestiones justificando su respuesta:


i. ¿Cuál de las dos distribuciones es más dispersa?
ii. ¿Qué tipo de asimetría siguen las dos distribuciones?
iii. En la distribución de los componentes C1, ¿a partir de qué duración en
horas se recoge el 25 % de los componentes que más duran?
iv. ¿Cuál de los dos tipos de componentes le parece más fiable?
v. ¿Existirá algún dato atípico en alguna de las dos distribuciones?

Solución:
1. Calcule la probabilidad de que el componente C1 funcione más de 1.500
horas y el componente C2 funcione más de 1.500 horas a la vez.
Ha de calcularse la probabilidad de una intersección de dos sucesos teniendo
en cuenta que ambos procesos son independientes, de forma que puede asumir-
se que la probabilidad de la intersección es igual al producto de ambas probabi-
lidades.
Para ello debe en primer lugar calcularse las probabilidades de que cada uno
de los componentes dure más de 1.500 horas para cada una de las funciones de
densidad especificadas en el enunciado:

192 © Ediciones Pirámide


Ejercicios de aplicación


P C1  1.500    0, 2e 0,2 c1 dc1  1  F 1,5   e 0,21,5  0, 74
1,5


P C 2  1.500    2 c 23 dc 2  1  F 1,5   2 1,5 2  0, 44
1,5

Finalmente, la probabilidad de la intersección se calcula de la forma siguiente:

P  C1  1.500   C 2  1.500  P C1  1.500 P C 2  1.500 


 0,74  0,44  0,33

2. ¿Cuál es la probabilidad de que la duración total de 70 componentes del


tipo C1 supere las 400.000 horas?
Se trata de calcular una probabilidad para una variable aleatoria que resulta ser
una combinación lineal de 70 variables aleatorias cuyo modelo de probabilidad es
conocido. En estas condiciones, el teorema central del límite proporciona una
herramienta válida para estudiar la variable aleatoria resultante mediante una
distribución normal. El esquema es el siguiente:

C1  E  0, 2   Y   i 1 C1i
i  70

 N  nE C1 ; nV C1 

TCL n 
Y 
 N  70  1 0, 2  ; 70  1 0, 22  

TCL n 
Y 
 
TCL n
Y   N  350;41,83

Una vez conocido el modelo de probabilidad, el cálculo es sencillo y basta con


operar con la distribución normal:

400  350 
P Y  400  1  P  Z   0,12
 41,83 

3. Se está evaluando la compra de unos nuevos componentes cuyas duracio-


nes se distribuyen según una normal de media 3.000 horas y desviación
típica 200 horas cada uno. El proveedor ha mandado una muestra de 100
componentes de este tipo cuyos funcionamientos son independientes en-
tre sí. ¿Cuál es la probabilidad de que el promedio de duración de esta
muestra supere en más de 40 horas a la de la media poblacional?

© Ediciones Pirámide 193


Problemas resueltos de estadística

Se trata en este caso de una probabilidad referida a una media muestral de


componentes de los que se conoce que la duración de cada uno de ellos se distri-
buye según un modelo normal. De esta forma, la media muestral de tales duracio-
nes también se distribuirá mediante un modelo normal cuyos parámetros serán los
siguientes:

X i  N  3.000; 200 
x   i 1 X i 100  N  3.000; 200 100 
i 100

x  N  3.000; 20 

El cálculo de la probabilidad vuelve a ser sencillo una vez que se formula bien
la cuestión solicitada puesto que simplemente resta dividir entre la desviación
típica para obtener la variable tipificada:

P  x    40  P  x    40  P  Z  40 20  1  P  Z  2  0,02

4. Se han muestreado 100 componentes de cada tipo (C1 y C2) cuyo resu-
men de estadísticas se muestra a continuación:

C1 C2
Recuento 100,0000 100,00000
Promedio 4,880 3,4900
Mediana 3,580 2,3200
Desviación estándar 4,650 3,5700
Coeficiente de variación 95,28%0 102,30%000
Mínimo 0,028o 0,0065
Máximo 24,080o 16,70000
Rango 24,050o 16,69000
Cuartil inferior 1,790 1,0600
Cuartil superior 6,890 4,8600

Responda a las siguientes cuestiones justificando su respuesta:


i. ¿Cuál de las dos distribuciones es más dispersa?
Para comparar la dispersión de diferentes conjuntos de datos debe recurrirse a
medidas relativas para evitar el efecto de la magnitud de la escala de medida. En

194 © Ediciones Pirámide


Ejercicios de aplicación

este caso, la distribución de C2 es más dispersa debido a que su coeficiente de


variación es mayor. Le afectan mucho los datos atípicos que son muy extremos.
ii. ¿Qué tipo de asimetría siguen las dos distribuciones?
Al no disponer de información relativa a los coeficientes de asimetría, ha de
compararse los datos de media y mediana. En este caso son las dos distribuciones
asimétricas positivas, ya que las medias son en los dos casos mayores a las me-
dianas.
iii. En la distribución de los componentes C1, ¿a partir de qué duración en
horas se recoge el 25 % de los componentes que más duran?
El dato que deja a su derecha el 25 % de los datos de la distribución, y por tan-
to a su izquierda el 75 % restante, es el percentil 75, que se corresponde con el
cuartil superior y que resulta ser 6,89 miles de horas.
iv. ¿Cuál de los dos tipos de componentes le parece más fiable?
Son más fiables los componentes C1 ya que son mayores los 3 cuartiles de du-
ración (cuartil inferior, mediana y cuartil superior) y además tiene un menor coe-
ficiente de variación.
v. ¿Existirá algún dato atípico en alguna de las dos distribuciones?
El cálculo de los valores atípicos requiere definir los bigotes inferior y supe-
rior de cada distribución de la forma siguiente:

 BI  Q1  1,5   Q3  Q1   5,86
C1  
 BS  Q3  1,5   Q3  Q1   14,55
 BI  Q1  1,5   Q3  Q1   4, 62
C2  
 BS  Q3  1,5   Q3  Q1   10,55

Comparando los resultados anteriores con los valores máximos y mínimos in-
cluidos en la tabla del enunciado puede comprobarse que sí existen datos atípicos
por ser superiores a los bigotes superiores en ambos casos.

4.18 Una empresa paga una cuota trimestral de 80 € en concepto de suscripción a un


servicio de reparaciones para sus máquinas. Además, cada visita del técnico para
realizar la reparación cuesta 70 €. El número de reparaciones trimestrales de las

© Ediciones Pirámide 195


Problemas resueltos de estadística

máquinas de esta empresa es una variable aleatoria con la siguiente función de


probabilidad:

xi 1 2 3 4 5
P[X = xi] 0,15 a b c 0,1

Además, se sabe que P(X < 4) = 0,65 y P(X > 2) = 0,6.


1. Calcular a, b y c.
2. Calcular la probabilidad de que haya tres trimestres consecutivos en los
que el técnico venga como máximo tres veces.
3. Obtener la probabilidad de que en dos años haya más de 6 trimestres en
los que el técnico tenga que acudir exactamente 3 veces a reparar las má-
quinas.
4. Calcular el coste esperado para la empresa por reparación trimestral te-
niendo en cuenta la cuota trimestral.

Solución:
1. Calcular a, b y c.
El cálculo de los valores de los parámetros a, b y c debe proceder de la defini-
ción de la función de cuantía, de sus propiedades y de la información adicional
que proporciona el enunciado. De esta forma, se puede construir un sistema de
tres ecuaciones con tres incógnitas en los términos siguientes:

 DX
P  X  xi   1

P  X  4  0,65
P  X  2  0,6

La concreción de los anteriores resulta en las siguientes expresiones de las que


despejar los parámetros a, b y c:

0,15  a  b  c  0,1  1
0,15  a  b  0,65
b  c  0,1  0,6

196 © Ediciones Pirámide


Ejercicios de aplicación

De este sistema de ecuaciones se pueden deducir los siguientes resultados:


a = b = c = 0,25, quedando la distribución de probabilidad de la variable com-
pletamente definida como sigue:

xi 1 2 3 4 5
P[X = xi] 0,15 0,25 0,25 0,25 0,1

2. Calcular la probabilidad de que haya tres trimestres consecutivos en los


que el técnico venga como máximo tres veces.
La variable aleatoria X representa el número de ocasiones que en un trimestre
el técnico acude a una reparación con lo que la probabilidad de que como mucho
acuda tres veces en un trimestre resulta ser la de que la variable aleatoria X sea
menor o igual a 3:

P  X  3

La probabilidad referida se calcula sin problema observando la función de


cuantía de la variable aleatoria:

P  X  3  0,65

Por tanto, suponiendo que el número de visitas que cada trimestre ha de acudir
el técnico es independiente de la cantidad de ocasiones que habría de acudir en
otros trimestres, se puede calcular la probabilidad requerida sin más que multipli-
car:

P  X 3  X 3  X 3 0,650,650,65 0,27

3. Obtener la probabilidad de que en dos años haya más de seis trimestres


en los que el técnico tenga que acudir exactamente tres veces a reparar las
máquinas.
Ha de estudiarse una nueva variable aleatoria Y que permita analizar si el téc-
nico acude, o no, en tres ocasiones durante un trimestre de forma que se pueda
calcular la probabilidad de que eso ocurra en más de seis trimestres a lo largo de
dos años. Puede, por tanto, definirse la variable aleatoria como un modelo bino-
mial cuyos parámetros son el número de trimestres analizados (ocho trimestres en
dos años) y la probabilidad de que el técnico acuda exactamente en tres ocasiones

© Ediciones Pirámide 197


Problemas resueltos de estadística

por trimestre (cifra que asciende a 0,25 obtenida directamente de la función de


cuantía del enunciado):

Y    8; 0, 25 

Una vez definido el modelo, simplemente queda calcular la probabilidad bus-


cada recurriendo a la función de cuantía del modelo binomial:

P Y  6  P Y  7   P Y  8 
8!   8!  
 0, 257  0,75 87  0, 258  0,75 88  0
 
7! 8  7 !  
8! 8  8 !

4. Calcular el coste esperado para la empresa por reparación trimestral te-


niendo en cuenta la cuota trimestral.
Para analizar el coste de las reparaciones ha de definirse una nueva variable
aleatoria combinación lineal de la variable aleatoria X (reparaciones trimestrales)
y que queda definida de la forma siguiente:

C  80  70 X

Para calcular el valor esperado del coste únicamente queda pendiente calcular
el valor esperado de la variable aleatoria reparaciones trimestrales y operar con
las propiedades de la esperanza matemática:

E X   i1 xi P X  xi   2,9
i 5

EC  80  70E X   283

La cantidad promedio de compras por cada conexión a través de una determinada


4.19
plataforma online se considera una variable aleatoria que se distribuye según la
siguiente función de densidad:

f ( x )  k  x  1  1  x  3
3

198 © Ediciones Pirámide


Ejercicios de aplicación

1. Calcular el valor de k.
2. Sabiendo que en una determinada circunstancia la cantidad promedio de
compras ha sido mayor que 1,5, calcular la probabilidad de que esa canti-
dad sea finalmente inferior a 2.
3. ¿Cuál es la probabilidad de que la cantidad total comprada en 50 plata-
formas (cuya función de densidad es la especificada en el enunciado
siendo independientes entre sí) supere las 132 unidades?
4. ¿Cuál es la probabilidad de que la media de una muestra (media mues-
tral) de 40 plataformas supere las 2,6 unidades?

Solución:

1. Calcular el valor de k.
El valor de la constante k debe ser tal que la función definida constituya una
función de densidad, con lo que su integral a lo largo del dominio de definición
debe ser igual a la unidad. Aprovechando esta característica se despeja el valor de
la constante:

3
k 4
f  x  dx  1   k  x  1 dx   x  1   1  k  0, 25
3

3
DX 1 4 1

2. Sabiendo que en una determinada circunstancia la cantidad promedio de


compras ha sido mayor que 1,5, calcular la probabilidad de que esa canti-
dad sea finalmente inferior a 2.
El enunciado exige calcular una probabilidad condicionada definida como
sigue:

P 1, 5  X  2 
P  X  2 X  1, 5  
P  X  1, 5 

La solución al problema pasa, por tanto, por calcular la probabilidad de la in-


tersección de sucesos así como la probabilidad del suceso que fija la condición.
Para ello ha de integrarse la función de densidad ya definida una vez conocido el
valor de la constante k. Los cálculos son los siguientes:

© Ediciones Pirámide 199


Problemas resueltos de estadística

P 1,5  X  2    x  1 4 dx  0,05
3 2

1,5

P  X  1,5    x  1 4 dx  0,99
3 3
1,5

Una vez conocidas las dos probabilidades anteriores únicamente resta sustituir
y calcular la probabilidad de la intersección:

P 1, 5  X  2  0, 05
P  X  2 X  1, 5     0, 05
P  X  1, 5  0, 99

3. ¿Cuál es la probabilidad de que la cantidad total comprada en 50 plata-


formas (cuya función de densidad es la especificada en el enunciado y
cuyo funcionamiento puede suponerse independiente) supere las 132 uni-
dades?
Se trata de calcular una probabilidad vinculada a un conjunto de 50 platafor-
mas de cada una de las que se conoce su función de densidad y respecto de las
que puede suponerse independencia en el comportamiento. Además, la cantidad
de plataformas es lo suficientemente grande, de forma que puede aplicarse el
teorema central del límite. El planteamiento es el siguiente:

Y  i 1 X i  Y   N  50  E  X ; 50 V  X  
i 50 TCL n  

Bajo el planteamiento anterior queda pendiente calcular la esperanza matemá-


tica y la varianza de la variable aleatoria X para definir completamente el modelo
de probabilidad de la variable aleatoria Y:
3
E X    xf  x  dx   x  x  1 4 dx  2,6
3

Dx 1

2 3 
V  X    x 2 f  x  dx    xf  x  dx     x2  x  1 4 dx    2,6   0,1
3 2
 
Dx  Dx  1 

Una vez conocidas la esperanza y la varianza, únicamente resta aplicar el teore-


ma central del límite para tener perfectamente caracterizada la variable aleatoria:

Y  N  50  2, 6; 50  0,1 

200 © Ediciones Pirámide


Ejercicios de aplicación

El cálculo de la probabilidad solicitada resulta sencillo sin más que operar con
la distribución normal:

 132  130 
P Y  132  1  P  Z   1  P  Z  0,89  1  0,81  0,19
 2, 23 

4. ¿Cuál es la probabilidad de que la media de una muestra de 40 platafor-


mas supere las 2,6 unidades?
La probabilidad alude en este caso a la media muestral. Aunque se sabe que el
carácter objeto de estudio no se distribuye según un modelo normal en la pobla-
ción, el tamaño de la muestra seleccionada sí permite afirmar que la variable alea-
toria media muestral convergerá a un modelo normal gracias al teorema central
del límite:


TCL n
 N E  X ; V  X  n
x  
 N  2,6; 0,1 40 
 
TCL n
x 

De nuevo el cálculo de la probabilidad resulta sencillo sin más que operar con
la distribución normal:

 2,6  2,6 
P  x  2,6  P  Z   0,5
 0,05 

4.20 Se han realizado unas mediciones del peso en gramos de cierta sustancia en un
laboratorio con dos tipos de balanzas (balanza 1 y 2) obteniéndose las siguientes
medidas resumen:

Medida Balanza 1 Balanza 2


Tamaño muestra 17 31
Media 1,960 2,11
Mediana 1,970 2,09
Varianza 0,005 0,01
Cuasidesviación típica 0,070 0,10
Mínimo 1,810 1,98

© Ediciones Pirámide 201


Problemas resueltos de estadística

Medida Balanza 1 Balanza 2


Máximo 2,070 2,34
Recorrido intercuartílico 0,120 0,12
Asimetría -0,690 0,90
Curtosis 0,080 0,36
Significación asintótica/p-valor
0,900 0,69
(Kolmogorov-Smirnov normalidad)

1. ¿Se puede suponer que las muestras provienen de poblaciones normales?


Contrastar a un 5 % de significación.
2. Calcular un intervalo de confianza para la media de las pesadas con la ba-
lanza 1 con un nivel de confianza del 95 %.
3. Si se quisiera obtener en el intervalo anterior una longitud máxima de
0,04 g, ¿qué tamaño muestral se necesitaría tomar para conseguir este su-
puesto? Utilizar la aproximación a la normal.
4. Si se ha observado que, para cualquier balanza, en una de cada 10 medi-
ciones se superan los 2 g, contrastar la afirmación de que la proporción
poblacional de las mediciones que superan los 2 g es menor de un 15 %.
5. Contrastar la igualdad de varianzas poblacionales a un 10 % de significa-
ción.

Solución:

1. ¿Se puede suponer que las muestras provienen de poblaciones normales?


Contrastar a un 5 % de significación.
El contraste de Kolmogorov-Smirnov permite pronunciarse respecto de si un
conjunto de datos se asemeja a una distribución normal o no. La formulación del
contraste es la siguiente:

H 0 : f  x   distribución normal
H1 : f  x   distribución normal

Con el contraste así planteado y a la vista de los resultados de la significación


asintótica (p-valor) expuestos en la tabla para cada uno de los dos conjuntos de

202 © Ediciones Pirámide


Ejercicios de aplicación

datos (0,9; 0,69), no puede rechazarse la hipótesis nula de que ambos conjuntos
de datos se distribuyen según leyes normales sea cierta puesto que la probabilidad
de que la hipótesis nula sea cierta en ambos casos es superior al 5 % fijado como
límite.

2. Calcular un intervalo de confianza para la media de las pesadas con la ba-


lanza 1 con un nivel de confianza del 95 %.
Una vez comprobado que la variable aleatoria que permite estudiar las pesadas
de la balanza 1 se distribuye según una ley normal, se puede plantear el estadísti-
co pivote siguiente sin discutir el tamaño de la muestra necesario:

x 
Q  tn 1
sn 1 n

Se utiliza el estadístico que incluye la cuasivarianza por ser el dato que pro-
porciona el enunciado. Simplemente queda por plantear la probabilidad vinculada
al intervalo de confianza y operar hasta encontrar los límites deseados:

x 
P q1  Q  q2   P t 2   t1 2 
 Sn1 n 

 s s 
IC   ;    x  n 1 t1 2  n  1 ; x  n 1 t1 2   n  1 
 n n 

IC   ;0,05   1,97  t0,975 16   


0,07 0,07
t0,975 16  ;1,97 
 17 17 

  1,97  2,12  
0,07 0,07
2,12;1,97 
 17 17 
 IC   ;0,05   1,93;2,01

3. Si se quisiera obtener en el intervalo anterior una longitud máxima de


0,04 g, ¿qué tamaño muestral se necesitaría tomar para conseguir este su-
puesto? Utilizar la aproximación a la normal.

© Ediciones Pirámide 203


Problemas resueltos de estadística

La amplitud del intervalo resulta el doble de la cantidad que se suma y resta a


la media muestral para deducir los límites del intervalo. El enunciado permite
adoptar la distribución normal, lo que simplifica el cálculo al no tener que preo-
cuparse por los grados de libertad:

sn 1
L Z1 2
n

Se trata de sustituir en la expresión anterior hasta despejar el tamaño de la


muestra:

1,96  0, 07
0, 04  2   n  51, 65  52
n

4. Si se ha observado que, para cualquier balanza, en una de cada 10 medi-


ciones se superan los 2 g, contrastar la afirmación de que la proporción
poblacional de las mediciones que superan los 2 g es menor de un 15 %.
Se trata de plantear un contraste de hipótesis vinculado a la proporción pobla-
cional p. Aunque la proporción es una característica propia de la distribución
binomial, el hecho de disponer de una muestra lo suficientemente grande avala el
uso de la frecuencia muestral como estadístico y la distribución normal de ésta en
los términos siguientes:

fn   p H0
f n   i 1 xi n 
i n
Z
 p H 0
1   p  H  n
 0 

De esta forma se puede plantear el contraste como sigue:

H 0 : p  0,15

H1 : p  0,15

A la vista del contraste (unilateral inferior) y del estadístico empleado y su


distribución, la región crítica puede apreciarse en el esquema siguiente:

204 © Ediciones Pirámide


Ejercicios de aplicación

  fn   p H
RH 0  0
 Z
 p H 0
1   p  H  n
 0 

Queda, por tanto, calcular el estadístico, comparar con el cuantil correspon-


diente de la distribución normal y concluir respecto de las hipótesis:

f n   p H 0 0,1  0,15 
  0,97 
 p H 1   p  H 0  n 0,15  1  0,15  48 
 

0

Z   Z 0,05  1, 65 

 0,97   1, 65  No RH 0

No puede rechazarse la hipótesis nula por no cumplirse la condición fijada pa-


ra el rechazo. No puede descartarse, por consiguiente, que la proporción pobla-
cional sea igual a 0,15.
5. Contrastar la igualdad de varianzas poblacionales a un 10 % de significa-
ción.
Se trata de resolver un contraste referido al cociente entre las varianzas pobla-
cionales. El planteamiento es el siguiente:

H0 :12  22  H0 :22 12 1



H1 :12  22  H1 :22 12  1

© Ediciones Pirámide 205


Problemas resueltos de estadística

Se plantea el contraste en términos de un cociente entre varianzas puesto que


de esta manera se dispone de un estadístico con el que poder resolver el contraste.
Este estadístico, definido a partir de las cuasivarianzas muestrales que constituyen
la información disponible, adopta la siguiente forma:

sn21 1   22 
   F n1 1;n2 1
sn22 1  12 H
0

Para estas condiciones la región crítica debe plantearse de forma expresa sobre
las dos colas de la distribución F-Snedecor al no tratarse de una distribución si-
métrica:

Quedando formalmente expresada la definición de la región crítica como sigue:

  sn 1      sn2 1   2   
2 2
RH 0    21  22   F 2    21  22   F1 2   
   sn2 1   1  H 0
  n2 1  1  H 0  
s

Con el planteamiento anterior simplemente queda calcular el estadístico, com-


parar con los valores de los cuantiles de la distribución F-Snedecor y concluir
respecto a las hipótesis:

206 © Ediciones Pirámide


Ejercicios de aplicación

sn21 1   22  0, 07 2 
    1  0, 49 
sn22 1   12  H 0,12 
0

F / 2 16;30   F0,05  0, 45; F1 2
 F0,95 16;30   1,99 
 0, 45  0, 49  1,99  No RH 0

Por tanto, no puede rechazarse la hipótesis nula al no ubicarse el estadístico en


la región de rechazo del contraste.

4.21 Costes e ingresos de una determinada aleación dependen de una variable aleatoria
X vinculada con la demanda de metal por la industria a través de las siguientes
relaciones:

X 5 25  X
C ;I
7 4

Se sabe que la función de densidad de la variable aleatoria X adopta la forma


siguiente:

f  x   x 108 3  x  15

1. Calcular la función de distribución de la variable aleatoria X.


2. Calcular al valor esperado de las ventas (V).
3. Calcular la probabilidad de que el beneficio (diferencia entre ingresos y
gastos) sea negativo.

Solución:
1. Calcular la función de distribución de la variable aleatoria X.
La función de distribución de la variable aleatoria es la que procede de inte-
grar la función de densidad. Ha de tenerse en cuenta que la constante de integra-
ción forma parte del resultado al tratarse de una integral indefinida. El resultado
de la integral es el siguiente:

F x   f  x  dx   x 216  c
2

© Ediciones Pirámide 207


Problemas resueltos de estadística

El valor de la constante de integración se determina a partir de un punto cual-


quier, conocido para la función de distribución. En este caso se recurre al límite
superior del dominio de definición de la variable en el que se sabe que debe adop-
tar el valor uno:

 
F 15   1  15 2 216  c  c   0, 04

Quedando finalmente la función de distribución definida como sigue:

 0 x3
 2
 
F  x    x 216  0,04  3  x  15

 1  x  15

2. Calcular al valor esperado de las ventas (V).


Se trata de calcular la esperanza matemática de la función aleatoria ventas, de-
finida como una combinación lineal de la variable aleatoria X. Ello implica calcu-
lar la esperanza matemática de la variable aleatoria X y posteriormente aplicar las
propiedades del operador esperanza matemática.
La esperanza matemática de la variable aleatoria X se calcula integrando:

EX    xf  x  dx   x  x 108   10,33


15

DX 3

Finalmente, la esperanza matemática de las ventas se calcula recurriendo a las


propiedades de la esperanza matemática de la forma siguiente:

 25  I  25 1 25 1
E V   E     EX     10,33  3, 67
 4  4 4 4 4

3. Calcular la probabilidad de que el beneficio (diferencia entre ingresos y


gastos) sea negativo.
Debe en primer lugar operarse hasta encontrar la variable aleatoria que permi-
ta estudiar los beneficios y que se obtiene sin más complicación que restar las
variables aleatorias ingresos y gastos:

208 © Ediciones Pirámide


Ejercicios de aplicación

25  X X  5 155  11X
B  I C   
4 7 28

Para calcular la probabilidad de que el beneficio sea negativo simplemente


debe proponerse la probabilidad y operar hasta obtener una probabilidad referida
a la variable aleatoria X cuya función de densidad es conocida. Los pasos son los
siguientes:

155  11X   155   155   155 


P  B  0  P   0  P  X   1 P X   1 F  
 28   11   11   11 
 0,12

Una línea de proceso tiene tres centrífugas trabajando de forma independiente


4.22
entre sí. Se sabe que el tiempo (en horas) que tarda en averiarse una centrífuga
vertical es una variable aleatoria puede modelizarse mediante la siguiente función
de densidad:

1 t 100
f t   e t 0
100

Calcular la probabilidad de que falle al menos una de las máquinas en las 100
primeras horas.

Solución:

La variable aleatoria que permite estudiar la probabilidad de que falle una má-
quina en las 100 primeras horas se distribuye según un modelo binomial puesto
que cada centrífuga puede fallar o no, y el experimento se ocupa de tres máqui-
nas. El parámetro p del modelo binomial responde a la probabilidad de que una
centrífuga se averíe en menos de 100 horas:

P t  100   1 100et 100dt  1  et 100 0


100 100
 0,63
0

Queda, por tanto, la variable aleatoria que permite estudiar la probabilidad de


que falle una máquina en las 100 primeras horas definida como sigue:

Y    3;0,63

© Ediciones Pirámide 209


Problemas resueltos de estadística

Finalmente, la probabilidad solicitada se calcula utilizando la función de cuan-


tía de la distribución binomial:

 3! 3
P Y  1  1  P Y  0  1   0,630 1  0,63   0,95
 0! 3  0 ! 

4.23 La demanda de semanal de acero fuera del período de máxima producción mun-
dial es una variable aleatoria normalmente distribuida de parámetros 100 y 6 kg,
respectivamente. Sin embargo, en el período de máxima producción (8 semanas),
la demanda semanal se incrementa un 70 %. Supóngase que un año cuenta con 52
semanas.
1. Si en una semana se superó una demanda de 120 kg, ¿cuál es la probabi-
lidad de que se trate de una de las semanas de máxima producción?
2. ¿Cuál es la probabilidad de que la primera semana de enero (período de
máxima producción) supere el doble de la demanda que hay en la última
semana de junio (fuera de máxima producción)?
3. Calcular la probabilidad de que en un año la demanda de acero sea supe-
rior a 5,8 toneladas?
4. Si se toman 3 semanas al azar, ¿cuál es la probabilidad de que la deman-
da en esas tres semanas supere los 500 kg?

Solución:

1. Si en una semana se superó una demanda de 120 kg, ¿cuál es la probabi-


lidad de que se trate de una de las semanas de máxima producción?

La solución requiere plantear cuidadosamente las variables aleatorias y los su-


cesos respecto de los que se formulan las cuestiones. El esquema es el siguiente:
X: Demanda de acero fuera del período de máxima producción.
Y: Demanda de acero en el período de máxima producción.
N: Tratarse de una semana de máxima producción.
U: Tratarse de la última semana de máxima producción.
W: Demanda aleatoria de acero en una semana cualquiera.

210 © Ediciones Pirámide


Ejercicios de aplicación

Los modelos de probabilidad de las variables aleatorias anteriormente defini-


das son conocidos:

X  N 100; 6 

Y  N 100  1, 7; 6  1, 7 

Las probabilidades referidas a cada uno de los sucesos también pueden calcu-
larse sin problema:

8
P N  
52

P N  
44
52
1
P U  
52

Una vez deducida la información anterior, la respuesta a la pregunta pasa por


plantear una probabilidad condicionada siendo la condición el haber superado en
una semana la cantidad de 120 kg. La solución al planteamiento la proporcionan
sin más problemas los teoremas de la probabilidad total y Bayes en los términos
siguientes:

© Ediciones Pirámide 211


Problemas resueltos de estadística

Pero con la especificación adicional de que el enunciado habla de ubicarse en


una semana concreta dentro del período de máxima producción, con lo que la
probabilidad del numerador del teorema de Bayes todavía requerirá de la concre-
ción adicional referida a esta semana en concreta. El planteamiento de la probabi-
lidad requerida es el siguiente:

P W  120 U  P U  P W  120 U  P U 
P U W  120  
P W  120 P Y  120 P  N   P  X  120 P  N 

Las probabilidades absolutas contenidas en la expresión anterior son conoci-


das, por lo que únicamente resta calcular las probabilidades vinculadas a las
variables aleatorias X e Y recurriendo a las correspondientes distribuciones
normales:

120  170 
P Y  120  1  P  Z   0,9996
 10, 2 
120  100 
P  X  120  1  P  Z   0,0004
 6 

Una vez conocidas todas las probabilidades, se opera hasta obtener el resulta-
do final:

P W  120 U  P U 
P U W  120  
P W  120
P W  120 U  P U 

P Y  120 N  P  N   P Y  120 N  P  N 

0,9996  1 52 
  0,1247
0,9996   8 52  0,0004   44 52 

2. ¿Cuál es la probabilidad de que la primera semana de enero (período de


máxima producción) supere el doble de la demanda que hay en la última
semana de junio (fuera de máxima producción)?
El enunciado solicita calcular una probabilidad vinculada a una combinación
lineal de variables aleatorias normales en los términos siguientes:

212 © Ediciones Pirámide


Ejercicios de aplicación

PY  2X   PY  2X  0

Debe, por tanto, estudiarse la variable aleatoria Y – 2X deduciendo sus caracte-


rísticas a partir de las propiedades de las variables aleatorias normales. Así, la
nueva variable aleatoria se distribuirá según un modelo normal cuyos parámetros
se obtendrán de la forma siguiente:

E Y  2 X   E Y   2 E  X   170  2  100   30
V Y  2 X   V Y   2 2 V  X   10, 2 2  4  6 2  248, 04

Los resultados anteriores suponen independencia entre las cantidades deman-


dadas en los dos períodos considerados. Así, los parámetros y el modelo de la
nueva variable aleatoria serán los siguientes:

Y  2 X  N  30;15,74 

La probabilidad solicitada se calcula sin problemas tipificando:

0   30  
P Y  2 X   P Y  2 X  0  1  P  Z   0,03
 15,74 

3. Calcular la probabilidad de que en un año la demanda de acero sea supe-


rior a 5,8 toneladas.
Ha de proponerse de nueva una variable aleatoria combinación lineal de va-
riables aleatorias normales. Se trata de una simple suma de las 52 variables que
caracterizan la demanda semanal:

D   i 1 X i   j 1 Y j
i  44 j 8

Teniendo en cuenta que la nueva variable aleatoria D puede estudiarse me-


diante una distribución normal, sus parámetros son los siguientes:

 E  D    i  44 E  X i    j 8 E Y j 

D  N  E  D ; V  D    
i 1 j 1

V  D    i 1 V  X i    j 1 V Y j 
i  44 j 8

© Ediciones Pirámide 213


Problemas resueltos de estadística

Operando con las esperanzas y varianzas de las variables aleatorias X e Y se


obtienen los resultados concretos:

E  D    i 1 E  X i    j 1 E Y j   44  100  8  170  5.760


i  44 j 8

V  D    i 1 V  X i    j 1 V Y j   44  10, 2 6  8  6 2  2.416,32
i  44 j 8

D  N  5.760; 49,15 

Finalmente, la probabilidad de que la demanda anual supere los 5.800 kg se


obtiene operando con la distribución normal:

5.800  5.760 
P  D  5.800  1  P  Z    0, 21
 49,15

4. Si se toman tres semanas al azar, ¿cuál es la probabilidad de que la de-


manda en esas tres semanas supere los 500 kg?
Se trata de ir seleccionando tres semanas cada una de las cuales puede perte-
necer, o no, al período de máxima producción, constituyendo, por tanto, un fenó-
meno dicotómico. Para plantear la probabilidad solicitada por el enunciado puede
definirse una variable aleatoria que represente el número de semanas de máxima
producción (SMP) seleccionadas entre tres semanas, estando su dominio de defini-
ción compuesto por los siguientes valores: 0, 1, 2 y 3.
De esta forma, según los valores que adoptase esta variable aleatoria, la de-
manda total a lo largo de las tres semanas (DT) variará: por ejemplo, si adopta el
valor tres, el modelo que permita estudiar la demanda total será una distribución
normal suma de tres distribuciones normales referidas a la semana de máxima
producción. Por el contrario, si la variable aleatoria adopta el valor dos, la de-
manda se distribuirá según una normal combinación de dos distribuciones norma-
les referidas a las semanas de máxima producción y una normal referida al resto
de semanas.
Las combinaciones posibles son, por tanto, las siguientes:

 
S MP  0  DT  N 3  100; 3  36  N  300;10,39 

S MP  1  DT  N 170  2  100; 10, 22  2  36   N  370;9,66 

214 © Ediciones Pirámide


Ejercicios de aplicación

 
S MP  2  DT  N 2  170  100; 2  10, 22  36  N  440;7,51

S MP  3  DT  N  3  170; 
3  10, 22  N  510;5,53 

Para el cálculo de la probabilidad requerida por el enunciado también ha de


conocerse la probabilidad de que SMP adopte cada uno de los cuatro valores que
componen su dominio de definición:

3!
P  SMP  0  8 52   44 52   0,60
0 3 0

0! 3  0 !
3!
P  SMP  1  8 52   44 52  0,33
1 31

1! 3  1!
3!
P  SMP  2  8 52  44 52  0,06
2 3 2

2! 3  2 !
3!
P  SMP  3  8 52  44 52  0,01
3 3 3

3! 3  3!

Por tanto, la probabilidad solicitada es la probabilidad total de que la demanda


total supere los 500 kg, tal y como se representa en el esquema siguiente:

© Ediciones Pirámide 215


Problemas resueltos de estadística

La solución numérica se expone a continuación:

P  DT  500   i  0 P  DT  500 S MP  i  P  S MP  i  
i 3

 500  300   500  370 


 P Z   P  S MP  0  P  Z  P  S MP  1 
 10,39   9,06 

 500  440   500  510 


 P Z   P  S MP  2  P  Z  P  S MP  3 
 7,51   5,53 

 P  Z  19, 24   P  S MP  0  P  Z  9,79  P  S MP  1 

 P  Z  3,84   P  S MP  2  P  Z  0,57   P  S MP  3  0,002

4.22 Un fabricante produce salchichas cuya longitud siguen una distribución unifor-
me con parámetros 0 y θ. Para estimar la longitud máxima de dichas salchichas,
se toma una muestra aleatoria de 50 salchichas y se definen los siguientes esti-
madores:

 1  2 x
 1  Max  x1 , x2 ,....xn 

1. ¿Son insesgados los estimadores propuestos?

2. Calcular el error cuadrático medio de los estimadores  1 y  2 y según és-


te, exponer cuál sería preferible de manera razonada.
3. Se toma una nueva muestra aleatoria simple de 15 salchichas cuya longi-
tud media es de 0,98 cm y la cuasidesviación típica es de 0,18 cm. Calcu-
lar razonadamente un intervalo de confianza al 95 % de confianza para el
valor de la longitud media de las salchichas.

Solución:
1. ¿Son insesgados los estimadores propuestos?
Los valores para la esperanza matemática y la varianza de una distribución
uniforme son los siguientes:

216 © Ediciones Pirámide


Ejercicios de aplicación

0  
EX   
2 2
  0  2 2
V X   
12 12
Cabe, por tanto, calcular la esperanza matemática de cada uno de los estima-
dores para compararla con la esperanza matemática del modelo en la población y
pronunciarse respecto del sesgo:

E  1   E  2 x   E  2  i 1 xi n   E   i 1 xi    i 1 E  xi  
i n 2 i n 2 i n
n n
2 i n
  i 1  2  
n

E  2   E  Max  x1 , x2 ,..., xn    2

Por tanto, el sesgo para cada uno de los estimadores es el siguiente:

B  1     E  1   0

B  2     E  2      2    2

El estimador  1 es insesgado, al contrario que el estimador  2.

2. Calcular el error cuadrático medio de los estimadores θ1 y θ2 y según és-


te, exponer cuál sería preferible de manera razonada.
El error cuadrático medio responde a la siguiente expresión:

ECM    V    B  


2

Una vez calculado el sesgo en el apartado anterior, únicamente resta calcular


la varianza de cada estimador:

V  1   V  2 x   V  2  i 1 xi n   2 V   i 1 xi   2
4 4

in in in
i 1
V  xi  
n n
4

in
 i 1
 2 12   2 3n
n2

© Ediciones Pirámide 217


Problemas resueltos de estadística

V  2   V  Max  x1 , x2 ,..., xn    2 12

El error cuadrático medio se obtiene sumando a la varianza el sesgo elevado al


cuadrado:

E C M  1   V  1   B  1    3n   0  


2
2 2
3n   2
150

E C M  1   V  1   B  1    2 12    2    2 3


2 2

Es preferible, a la vista del error cuadrático medio, emplear el estimador  1 .

3. Se toma una nueva muestra aleatoria simple de 15 salchichas cuya longi-


tud media es de 0,98 cm y la cuasidesviación típica es de 0,18 cm. Calcu-
lar razonadamente un intervalo de confianza al 95 % de confianza para el
valor de la longitud media de las salchichas.
La información disponible exige emplear la siguiente cantidad pivotal:

x 
Q  t( n 1)
Sn 1
n

218 © Ediciones Pirámide


Ejercicios de aplicación

Simplemente resta deducir los límites del intervalo a partir de la cantidad pi-
votal y obtener el resultado final:

x 
P q1  Q  q2   P t 2   t1 2 
 Sn1 n 

 s s 
IC   ;    x  n 1 t1 2  n  1 ; x  n 1 t1 2  n  1 
 n n 

IC   ;0,05   0,98  t0,975 14   


0,18 0,18
t0,975 14  ;0,98 
 15 15 

  0,98  2,14  
0,18 0,18
2,14;0,98 
 15 15 
 IC   ;0,05   0,88;1,07 

4.23 El tiempo que una compañía de ambulancias tardar en enviar un vehículo a un


siniestro, en minutos, es una variable aleatoria con la siguiente función de densi-
dad:

f  x    e   x x  0

Además, se ha tomado una muestra aleatoria de 10 tiempos de respuesta por


parte de la empresa en el último año obteniéndose los siguientes datos:

14 17 27 18 12 8 22 13 19 12

1. Calcular, de manera razonada, un estimador de λ por el método de los


momentos y dar una estimación para la muestra dada.
2. ¿Es el estimador anteriormente calculado insesgado?
3. Esta misma empresa ofrece, además, varios niveles de protección según
el tipo de siniestro que se pueden etiquetar como A, B y C con las si-
guientes probabilidades de acaecimiento:

© Ediciones Pirámide 219


Problemas resueltos de estadística

P  A   2

P  B   1   
2

P  B   2 1   
2

0  1

Una muestra aleatoria simple ha proporcionado los siguientes resultados


que corresponden al número de siniestros bajo los distintos niveles de
protección:

Tipo de nivel A B C
Muestra 16 50 34

Calcular un estimador puntual para θ por el método de máxima verosimi-


litud.
4. Calcular una estimación puntual para θ por el método de máxima verosi-
militud para la muestra considerada.

Solución:
1. Calcular, de manera razonada, un estimador de λ por el método de los
momentos y dar una estimación para la muestra dada.
La deducción de los estimadores puntuales por el método de los momentos
exige igualar los momentos centrados respecto del origen (en este caso únicamen-
te de orden uno) poblacionales y muestrales. Habrá, por tanto, de calcularse el
momento poblacional de orden uno para la citada función de densidad:

   2 1
E  X    xf  x  dx   xe x dx    xe x dx   
DX DX 0  2

Por otra parte, el momento de orden uno muestral resulta ser la media mues-
tral, con lo que igualando ambos puede deducirse el estimador buscado:

EX  1  
  m 1 x
a1  x 

220 © Ediciones Pirámide


Ejercicios de aplicación

De esta forma, la estimación concreta del parámetro a partir de los tiempos


medidos en la muestra tomada sería la siguiente:

1
 m   0, 06
14  17  ...  12  10

2. ¿Es el estimador anteriormente calculado insesgado?


Para contestar a la cuestión planteada en el enunciado debe calcularse la espe-
ranza matemática del estimador y comparar con el parámetro al que se refiere el
estimador:

E   m   E 1 x   E  n   
in in in
i 1
xi   nE 1 i 1
xi   n i 1
E  xi  

1 1
n n 
 n
in
i 1
1

La esperanza matemática del estimador es, por tanto, igual al parámetro al que
se refiere con lo que puede afirmarse que el estimador es insesgado:

B  m     E  m   0

3. Esta misma empresa ofrece, además, varios niveles de protección según


el tipo de siniestro que se puede etiquetar como A, B y C con las siguien-
tes probabilidades de acaecimiento:

P  A   2

P  B   1   
2

P  B   2 1   
2

0  1

Una muestra aleatoria simple ha proporcionado los siguientes resultados


que corresponden al número de siniestro bajo los distintos niveles de pro-
tección:

© Ediciones Pirámide 221


Problemas resueltos de estadística

Tipo de nivel A B C
Muestra 16 50 34

Calcular un estimador puntual para θ por el método de máxima verosi-


militud.
Han de definirse en primer lugar las reglas bajo las que la muestra aleatoria se
selecciona, puesto que en cualquier caso la suma de los siniestros bajo los tres
tipos de niveles de protección debe ser igual al tamaño de la muestra aleatoria
seleccionada. Así, si se denomina x al número de siniestros bajo el nivel de pro-
tección A, y al correspondiente bajo el nivel de protección B y z a la cantidad de
siniestros bajo el nivel de protección C, y se tiene en cuenta además que la suma
de las tres es igual al tamaño de la muestra (x + y + z = n), la función de verosi-
militud puede proponerse de la forma siguiente:

L  x1 ,...xn ;    A 1 f  x A ;     B 1 f  xB ;     C 1 f  xC ;   


A x B y Cz

   A 1  2    B 1 1       C 1 2 1     
A x B y 2 Cz

2 yz
  2 x 1     2  1     2 z  2 x  z 1   
2y z z

Una vez conocida la función de verosimilitud, ha de derivarse respecto del pa-


rámetro igualando a cero para fijar la primera condición de máximo. Para simpli-
ficar este paso previamente se tomarán logaritmos:

Ln  L  x1 ,...xn ;   Ln  2 z  2 x  z 1    
2 y z

 zLn  2    2 x  z  Ln     2 y  z  Ln 1   
dLn  L  x1 ,...xn ;  d
  zLn  2    2 x  z  Ln     2 y  z  Ln 1    
d d
2x  z 2y  z
 
 1
dLn  L  x1 ,...xn ;  2x  z 2 y  z
0  
d  mv 1   mv
 2 x  z  1   mv    2 y  z  mv  2x  z
  0   mv 
 mv 1   mv 
  2x  2 y  2z

222 © Ediciones Pirámide


Ejercicios de aplicación

Una vez deducido el candidato a estimador, debe comprobarse su bondad cal-


culando la segunda derivada para contrastar si se trata de un valor máximo o mí-
nimo:

d 2 Ln  L  x1 ,... xn ;  d  2 x  z 2 y  z  2x  z 2 y  z
    0
d 2 d    1    2 1   2

Comprobando, por tanto, que en realidad se trata de un valor máximo y que el


estimador es el de máxima verosimilitud.
4. Calcular una estimación puntual para θ por el método de máxima verosi-
militud para la muestra considerada.
Tal y como se ha deducido la función de verosimilitud, las tres variables con-
sideradas adoptarán los valores concretos siguientes: x = 16, y = 50, z = 34. Sim-
plemente ha de sustituirse en la función del estimador para contestar a la cuestión
planteada en el enunciado:

2x  z  2  16   34
 mv    0, 33
2 x  2 y  2 z  2  16    2  50    2  34 

Una compañía de envasado de zumo en tetrabrik está analizando los consumos


4.24
energéticos en el proceso. Sabe que un tetrabrik se produce como resultado de
tres operaciones de compactado de capas, cuyos consumos energéticos se dis-
tribuyen según sendas leyes uniformes de parámetros 5 kW y 15 kW, más otras
tres operaciones de pintura y recubrimientos cuyos consumos energéticos se
distribuyen según sendos modelos normales de media 15 kW y desviación típi-
ca 2 kW.
1. Calcular el cuartil primero de consumos de energía para cada uno de los
tipos de operaciones.
2. La probabilidad de defecto de cada uno de los tipos de operaciones, con-
sideradas independientes entre sí, son de un 10 % y un 12 %, respectiva-
mente. Un tetrabrik es defectuoso, y por tanto debe desecharse para el
llenado, si falla al menos una de las operaciones de compactado y al me-
nos dos de las operaciones de pintado. ¿Cuál es la probabilidad de que
eso ocurra?

© Ediciones Pirámide 223


Problemas resueltos de estadística

Solución:
1. Calcular el cuartil primero de consumos de energía para cada uno de los
tipos de operaciones.
El primer cuartil es el resultado de la variable tal que divide la distribución de
frecuencias en dos partes dejando un 25 % de los resultados inferiores a él a un
lado y el 75 % restante al otro. Tratándose en ambos casos de distribuciones con-
tinuas, el cuartil debe deducirse mediante la integral de las funciones de densidad.
Sea XC el consumo en las operaciones de compactado y XP el consumo energético
en las operaciones de pintado:
Q
1 x  1
P  X C  Q1   0, 25  
Q1 Q1
f  x  dx   dx   0, 25 Q1  7,5
5 5 15  5 15  5  5
Q  15 
P  X P  Q1   0, 25  P  Z  1  0, 25  Q1  13, 66
 2 

2. La probabilidad de defecto de cada uno de los tipos de operaciones, con-


sideradas independientes entre sí, son de un 10 % y un 12 %, respectiva-
mente. Un tetrabrick es defectuoso, y por tanto debe desecharse para el
llenado, si falla al menos una de las operaciones de compactado y al me-
nos dos de las operaciones de pintado. ¿Cuál es la probabilidad de que
eso ocurra?
El experimento, tal y como lo define el enunciado, debe abordarse como la in-
tersección de dos sucesos independientes: fallo de al menos una operación de
compactado y fallo de al menos dos operaciones de pintado. Cada uno de los dos
sucesos que constituyen la intersección puede ser estudiado mediante una varia-
ble aleatoria del tipo binomial puesto que se trata de experimentos dicotómicos:
la operación falla o no falla. Cada una de las variables aleatorias quedaría defini-
da como sigue:
YC    3;0,1
YP    3;0,15 

siendo los respectivos parámetros p de los modelos los que proporciona el enun-
ciado.
Simplemente quedan por calcular las probabilidades requeridas y obtener la
intersección entre ambos sucesos:

224 © Ediciones Pirámide


Ejercicios de aplicación

3!
P YC  1  1  P YC  0  1  0,10 1  0,1  0, 27
3 0

0! 3  0 !

P YP  2  1  P YP  1  1  P YP  0  P YP  1 


3! 3!
0,120 1  0,12  
3 0
0,121 1  0,12   0,11
31
1
0! 3  0 ! 1! 3  1!

Resultando la intersección de la forma siguiente:

P YC  1  YP  2   P YC  1 P YP  2   0, 03

4.25 En una empresa dedicada al pintado de carrocerías se ha recogido la siguiente


muestra correspondiente a los tiempos de pintado:

Tiempos (0-2] (2-4] (4-6] (6,8] (8,10]


Número de trabajos 35 25 20 13 7

La densidad de pintado es una variable aleatoria que depende de las caracte-


rísticas de la pistola y que puede analizarse mediante la siguiente función de
densidad:

 1
1
f  x;      x  1,   1
x

Deducir un estimador de máxima verosimilitud para el parámetro θ.

Solución:
El procedimiento para deducir el estimador de máxima verosimilitud exige en
primer lugar obtener la función de verosimilitud de la muestra:

L  x;    i 1 f  xi ;    i 1  1 xi    n  i 1 1 xi 
in in  1 in  1

Para simplificar la derivada y la deducción del estimador se toman logaritmos


en la función de verosimilitud:

© Ediciones Pirámide 225


Problemas resueltos de estadística

LnL  x;   Ln  n  i 1 1 xi    nLn    1 Ln  i  n 1 x   


in  1
   i 1 i 

 nLn    1  i 1 Ln 1 xi 
in

Una vez tomados logaritmos se deriva esa función:

d d d 
LnL  x;   Ln  n i 1 1 xi    nLn    1 i 1 Ln 1 xi   
i n  1 i n

d d   d  
  n    i 1 Ln 1 xi 
i n

Igualando a cero y despejando en la expresión anterior se obtiene un candidato


a estimador:

d
d
 
LnL  x;   0  n  mv   i 1 Ln 1 xi    mv  n
i n

i n
i 1
Ln 1 xi 

Si se calcula la segunda derivada se puede comprobar que es negativa, con lo


que el resultado obtenido es un máximo:

d2 d 
LnL  x;    n     i 1 Ln 1 xi     n  2
i n

d 2
d 

4.26 Una compañía dedicada al llenado de frascos de mermelada está analizando su


proceso de fabricación midiendo los pesos, en cientos de gramos, de cada reci-
piente y ha observado que se trata de una variable aleatoria definida por la si-
guiente función de distribución:

0 si x  4
 3
 x 115
F  x     4,5 x 2  x  26 4  x  5
 3 6
1 si x  5

1. Los clientes únicamente aceptan los recipientes con pesos comprendidos


entre 410 g y 450 g. Calcular la probabilidad de que un recipiente sea
considerado como aceptable por los clientes.

226 © Ediciones Pirámide


Ejercicios de aplicación

2. Un determinado cliente hace un pedido de 15 tarros. Si la probabilidad de


encontrar al menos dos «válidos» es de al menos un 80 %, el cliente está
dispuesto a firmar un contrato con ellos para los próximos 5 años. Res-
ponder si el cliente decidirá firmar el contrato.
3. Este cliente ha realizado también un encargo a otra compañía de llenado
de tarros de la que conoce que su proceso de llenado se distribuye según
un modelo normal de media 425 y desviación típica 10. A esta nueva
compañía le ha encargado un total de 15 tarros, mientras que a la primera
le hizo un encargo de 30 unidades. De entre esos 45 ha seleccionado un
recipiente que resultó estar bien llenado y desea calcular la probabilidad
de que proceda de esta segunda fábrica.
4. Un cliente hace un encargo de 1.000 tarros a esta nueva compañía para
cubrir una tarta con la que quiere batir el récord Guinness. El transporte
lo encarga en avión, que limita el peso en la bodega a 426 kg. ¿Qué pro-
babilidad existe de trasladar todos los tarros en un único avión?

Solución:
1. Los clientes únicamente aceptan los recipientes con pesos comprendidos
entre 410 g y 450 g. Calcular la probabilidad de que un recipiente sea
considerado como aceptable por los clientes.
Se trata de calcular la probabilidad del intervalo requerido, para lo que puede
recurrirse a deducir la función de densidad y obtener la probabilidad a partir de la
integral definida entre los límites del intervalo o, de forma más directa, utilizar la
función de distribución que proporciona el enunciado. Recurriendo a esta segunda
alternativa el cálculo de la probabilidad es sencillo:

P  410  X  450  F  450   F  410  

  450 3 115  
   4,5   450   450   26  
2

 3 6 
  410 3 115  
   4,5   410   410   26   0, 41
2

 3 6 

2. Un determinado cliente hace un pedido de 15 tarros. Si la probabilidad de


encontrar al menos dos «válidos» es de al menos un 80 %, el cliente está

© Ediciones Pirámide 227


Problemas resueltos de estadística

dispuesto a firmar un contrato con ellos para los próximos 5 años. Res-
ponder si el cliente decidirá firmar el contrato.
Se trata de contestar a la cuestión de si entre 15 recipientes la probabilidad de
que al menos dos de ellos tengan el peso adecuado (entre 410 y 450 gramos), es
superior a 0,8. Se trata, por tanto, de un experimento dicotómico (el tarro puede
tener un peso adecuado o no) de parámetros 15 y 0,41 (la probabilidad de que el
llenado sea correcto calculada en el apartado anterior):

Y   15;0, 41

siendo la probabilidad solicitada la de que la variable aleatoria Y sea igual o ma-


yor que dos:

P Y  2   1   P Y  0   P Y  1 
15! 15  0 15! 15 1
1 0, 410  1  0, 41  0, 411  1  0, 41  0,99
0!15  0 ! 1!15  1!

Por tanto, el cliente puede firmar el contrato al superar la probabilidad de que


haya dos o más recipientes correctos la cifra de 0,8.
3. Este cliente ha realizado también un encargo a otra compañía de llenado
de tarros de la que conoce que su proceso de llenado se distribuye según
un modelo normal de media 425 y desviación típica 10. A esta nueva
compañía le ha encargado un total de 15 tarros, mientras que a la primera
le hizo un encargo de 30 unidades. De entre esos 45 ha seleccionado un
recipiente que resultó estar bien llenado y desea calcular la probabilidad
de que proceda de esta segunda fábrica.
El esquema planteado en el enunciado responde de forma evidente a una
probabilidad a deducir por el teorema de Bayes, tal y como se observa en la
siguiente figura:

228 © Ediciones Pirámide


Ejercicios de aplicación

Para responder a la probabilidad solicitada debe calcularse en primer lugar la


probabilidad de que un tarro procedente de la nueva fábrica (XN) esté correcta-
mente llenado sabiendo que se distribuye según un modelo normal:

X N  N  425;10 
450  425  410  425 
P  410  X N  450  P  Z    P  Z    0,92
 10   10

Una vez conocida esta probabilidad debe calcularse la probabilidad total de


que un recipiente seleccionado tenga el peso adecuado (A):

P  A  P  A X N  P  X N   P  A X A  P  X A  
  0,92  15 45    0, 41  30 45   0,58

Por último, obtener la probabilidad que un recipiente correctamente llenado


procediese de la nueva compañía:

P  A X N  P  X N  0, 92  15 45 
P  X N A    0, 53
P  A 0, 58

4. Un cliente hace un encargo de 1.000 tarros a esta nueva compañía para


cubrir una tarta con la que quiere batir el récord Guinness. El transporte

© Ediciones Pirámide 229


Problemas resueltos de estadística

lo encarga en avión que limita el peso en la bodega a 426 kg, ¿qué proba-
bilidad existe de trasladar todos los tarros en un único avión?
Se trata de calcular una probabilidad vinculada a una nueva variable aleato-
ria resultado de sumar 1.000 variables aleatorias normales de parámetros 426 g
y 10 g. Por tanto, la nueva variable aleatoria también se distribuirá según un
modelo normal con los siguientes parámetros:

YN   i 1 X Ni  N 1.000  425; 1.000  100 


i n

426.000  425.000 
P YN  426.000  P  Z   0,99
 1.000  100 

En una empresa de consultoría dedicada a redactar proyectos de obras los cartu-


4.27
chos de tóner para impresora que se adquieren provienen únicamente de dos fa-
bricantes, de manera que el fabricante I provee el 70 % de los cartuchos y el fa-
bricante II el resto de ellos.
El número de cartuchos que la empresa pide mensualmente al fabricante I es
una variable aleatoria cuya función de masa de probabilidad es la siguiente:

xi 1 2 3 4 5 6
P[X = xi] 1/12 1/6 1/4 1/4 1/6 1/12

La empresa hace pedidos semanales al fabricante II según una distribución de


Poisson de media 2 pedidos.
1. Calcular la proporción de meses en los que se han pedido al fabricante I
más de dos cartuchos de entre los que se pidió como máximo cuatro car-
tuchos.
2. ¿Cuál será el número esperado de cartuchos pedidos al mes al fabricante I?
3. Si un mes cualquiera se hizo un pedido de tres cartuchos, calcular la pro-
babilidad de que se le haya hecho el pedido al fabricante II.
4. El tiempo que dura un cartucho de tóner del fabricante II es una variable
aleatoria normal de media 80 horas y varianza 100 horas2. Calcular la
probabilidad de que en un año haya al menos dos meses en los que un
cartucho se gaste antes de 70 horas.

230 © Ediciones Pirámide


Ejercicios de aplicación

5. Se ha tomado una muestra aleatoria del desgaste de 10 cartuchos de tóner


del fabricante II porque se sospecha que la media no es de 80 horas como
dice el fabricante.

72 75 83 70 68 74 72 79 80 75

Calcular un intervalo de confianza al 95 % para la media de duración de


los cartuchos y concluir acerca de la afirmación del fabricante.

Solución:
1. Calcular la proporción de meses en los que se han pedido al fabricante I
más de dos cartuchos de entre los que se pidió como máximo cuatro car-
tuchos.
Se trata de calcular una probabilidad condicionada ciñéndose el estudio a los
meses de los que se conoce que se pidieron como máximo cuatro cartuchos. El
planteamiento y la solución son los siguientes:

P  X  2    X  4 
P  X  2 X  4 
P  X  4

Las probabilidades del numerador y denominador se calculan a partir de la


función de cuantía que proporciona el enunciado sin problema:

P  X  2    X  4   P  X  3   P  X  4   0, 5
P  X  4   0, 75

Siendo la probabilidad solicitada la siguiente:

P  X  2    X  4  0, 5
P  X  2 X  4    0, 66
P  X  4 0, 75

2. ¿Cuál será el número esperado de cartuchos pedidos al mes al fabricante I?


La esperanza matemática del número de cartuchos solicitados al primer fabri-
cante puede calcularse de la forma siguiente:

© Ediciones Pirámide 231


Problemas resueltos de estadística

E  X    i 1 xi P  X  xi  
i 6

 121    2  16   3  14    4  14    5  16   6  121   3,5


 1

3. Si un mes cualquiera se hizo un pedido de tres cartuchos, calcular la pro-


babilidad de que se le haya hecho el pedido al fabricante II.
Se trata del esquema característico del teorema de Bayes, puesto que el hecho
de haber pedido tres cartuchos en un determinado mes constituye el suceso trans-
versal (probabilidad total) y el enunciado solicita la probabilidad de que habiendo
ocurrido tal suceso, se obtenga la probabilidad de que el pedido se hubiese hecho
al fabricante II. El esquema del planteamiento es el siguiente:

La formulación del problema es la siguiente:

P  X  3 X II  P  X II 
P  X II X  3 
P  X  3

La probabilidad de que la cantidad demandada en un mes sea igual a tres se


obtiene aplicando el teorema de la probabilidad total y calculando cada una de las
dos probabilidades con su modelo correspondiente (función de cuantía o modelo
de Poisson):

232 © Ediciones Pirámide


Ejercicios de aplicación

P X  3  P X  3 X II  P X II   P X  3 X I  P X I 

e2 23
P  X  3 X II    0,18
3!

P  X II   0,3
P  X  3 X I   0, 25
P  X I   0,7

Finalmente, puede calcularse la probabilidad total y la probabilidad solicitada


por el enunciado:

P  X  3  P  X  3 X II  P  X II   P  X  3 X I  P  X I  
  0,18  0,3    0, 25  0, 7   0, 22
P  X  3 X II  P  X II  0,18  0,3
P  X II X  3    0, 23
P  X  3 0, 22

4. El tiempo que dura un cartucho de tóner del fabricante II es una variable


aleatoria normal de media 80 horas y varianza 100 horas2. Calcular la
probabilidad de que en un año haya al menos dos meses en los que un
cartucho se gaste antes de 70 horas.
La solución a este apartado pasa por plantear una variable aleatoria dicotómica
que permita analizar la probabilidad de que en un determinado mes se gaste un
cartucho antes de las 70 horas o no. Los parámetros del modelo binomial son 12
(meses) y la probabilidad de que un cartucho se agote en menos de 70 horas que
procede de la variable aleatoria normal de la que informa el enunciado:

70  80 
P T  70  P  Z   0,16
 100 

Puede de esta forma plantearse la variable aleatoria binomial:

Y   12;0,16 

Finalmente, calcular la probabilidad de que en al menos dos meses se agoten


los cartuchos con menos de 70 horas de funcionamiento:

© Ediciones Pirámide 233


Problemas resueltos de estadística

P Y  2   1   P Y  0   P Y  1 
12! 12!
0,160  1  0,16 
12  0
0,161  1  0,16   0,59
12 1
1 

0! 12  0 !   
1! 12  1 !

5. Se ha tomado una muestra aleatoria del desgaste de 10 cartuchos de tóner


del fabricante II porque se sospecha que la media no es de 80 horas como
dice el fabricante.

72 75 83 70 68 74 72 79 80 75

Calcular un intervalo de confianza al 95 % para la media de duración de


los cartuchos y concluir acerca de la afirmación del fabricante.
El cálculo del intervalo de confianza con la información disponible debe partir
de la siguiente cantidad pivotal:

x
 t n 1
S n 1 n

El esquema del intervalo es el siguiente:

Ha de calcularse, por tanto, la media y la cuasivarianza muestral con los datos


del enunciado:

234 © Ediciones Pirámide


Ejercicios de aplicación

x   i 1 xi n  748 10  74,8
i 10

sn21   i 1  xi  x   n  1  21,95  sn 1  4,68


i 10 2

Simplemente queda plantear la cantidad pivotal, operar y sustituir para obtener


los límites del intervalo deseado:

x 
P  q1  Q  q2   P t 2   t1 2 
 Sn1 n 


 n  1 
s sn 1
IC   ;    xn  n 1 t1  2  n  1 ; xn  t1  2
 n n 

IC   ;0, 05    74,8  t0,975  9   


4, 68 4, 68
t0,975  9  ;74,8 
 10 10 

  74,8  2, 26  
4, 68 4, 68
2, 26;74,8 
 10 10 
 IC   ;0, 05    71, 45;78,15 

4.28 Sea la siguiente función de distribución conjunta para las variables aleatorias X e Y:

F x; y  1e4x 1e9y  x, y  0

1. Calcular las siguientes probabilidades P  X  Y  , P X  Y 1.


2. Determinar si las variables X e Y son independientes.

Solución:
1. Calcular las siguientes probabilidades P  X  Y  , P X  Y 1.
El cálculo de la primera de las probabilidades exige deducir la función de den-
sidad marginal de la variable aleatoria X, de forma que el primer paso será obte-
ner la función de densidad conjunta integrando la función de distribución:

© Ediciones Pirámide 235


Problemas resueltos de estadística

   
f  x; y    F  x; y     1  e4 x 1  e 9 y  
y  x  y  x 

 4e4 x 1  e 9 y   36e 4 x e 9 y
y

A partir de esta función de densidad pueden deducirse sin problema las fun-
ciones de densidad de las variables aleatorias marginales:


f  x    f  x; y  dy   36e4 x e9 y dy  4e4 x e9 y 0  4e4 x

DY 0


f  x; y  dx   36e4 x e9 y dx  9e4 x e9 y 0  9e9 y

f  y  
DX 0

Con la información anterior ya puede formularse de forma sencilla la primera


de las probabilidades requeridas:

P X  Y   PY  X    f  y  dy   9e9 y dy  e9 y 0  1  e9 x


x x x

0 0

La segunda de las probabilidades también puede calcularse recurriendo a las


funciones de densidad marginales:

1 y 1 y
4e4 x dx  e4 x 0  1  e41 y 
1 y
P  X  Y  1  P  X  1  Y    f  x  dx  
0 0

2. Determinar si las variables X e Y son independientes.


Para pronunciarse respecto de la independencia de las variables ha de compa-
rarse la función de densidad conjunta con el producto de las funciones de densi-
dad marginales:

f  x; y   f  x f  y 

En este caso puede comprobarse que las variables aleatorias son independientes:

f  x; y   36e4 x e9 y  f  x  f  y   9e9 y  4e4 x

236 © Ediciones Pirámide


Ejercicios de aplicación

4.29 Sea la siguiente función de densidad conjunta para las variables X e Y:

f ( x, y )  x  y  0  x, y  1

1. Calcular las siguientes probabilidades P  X  0,5; Y  0, 2 , P  X  Y  1.


2. Determinar si las variables X e Y son independientes.
3. Determinar la esperanza matemática siguiente: E[Y/X].

Solución:

1. Calcular las siguientes probabilidades P  X  0,5; Y  0, 2 , P X  Y  1.


La primera probabilidad solicitada constituye una aplicación directa de la fun-
ción de densidad conjunta, obteniendo el resultado directamente de la resolución
de la integral doble definida entre los límites para cada variable:

P  X  0,5;Y  0,2  
0,5

0,2
f  x, y  dydx  
0,5

0,2
 x  y  dydx 
0 0 0 0

  xy   y2 2 0
0,5
dx    0,2 x  0,002 dx 
0,2 0,5

0 0

  0,1x2  0,02x 0  0,035


0,5

El cálculo de la segunda de las probabilidades requiere de una transformación


previa en busca de una de las funciones marginales de alguna de las dos variables
para poder determinar el cálculo eliminando una variable:

P X  Y 1  P X 1 Y   Fx 1 Y 

De esta forma se vincula el cálculo de la probabilidad a la función de distribu-


ción de la variable X. La función de densidad se obtiene como sigue:

f  x    x  y  dy   xy   y2 2 0  x  1 2
1 1

Basta con calcular la integral de la función de densidad anterior entre los lími-
tes fijados para obtener la probabilidad buscada:

© Ediciones Pirámide 237


Problemas resueltos de estadística

1 y
P X  1  Y   Fx 1  Y    f  x  dx 
0

1  y 2 1  y 
   x  1 2 dx    x2 2   x 2 0 
1 y 1

0 2 2
2. Determinar si las variables X e Y son independientes.
Para comprobar si las variables son independientes ha de contrastarse la vera-
cidad de la siguiente igualdad:

f  x; y  f  x f  y

Se conocen las funciones de densidad conjunta y marginal de la variable X,


con lo que únicamente resta por calcular la función de densidad marginal de la
variable aleatoria Y:

f  y     x  y  dx    x2 2  xy 0  1 2  y
1 1

Al comprobar si el producto de ambas funciones marginales es igual a la fun-


ción de densidad conjunta debe descartarse la independencia al no cumplirse la
condición de igualdad:

f  x; y   f  x  f  y    x  y    x  1 2   1 2   y 

3. Determinar la esperanza matemática siguiente: E[Y/X]


El cálculo de la esperanza matemática de una variable aleatoria continua exige
resolver la integral, para el dominio de definición de la variable, del producto de
la variable por su función de densidad. En este caso la integral es la siguiente:

E Y X    yf  y x  dy
DY

De forma que para afrontar el cálculo de la esperanza matemática ha de dedu-


cirse la función de densidad condicionada que resulta ser el cociente entre la fun-
ción de densidad conjunta y la función de densidad de la variable que marca la
condición:

f  x; y  x y
f  y x  

f x  x  1 2 

238 © Ediciones Pirámide


Ejercicios de aplicación

Finalmente, resolver la integral requerida con la función de densidad condi-


cionada:

E Y X    yf  y x  dy   y  x  y   x  0,5 dy 
1

DY 0

 yx  y2   x  0,5 dy 
1  1
y 2 dy  
1 1
   yxdy  
0 x  0,5 0 0

1
1  xy 2 y3  3x  2
    
x  0,5  2 3  0 6 x  3

© Ediciones Pirámide 239


TÍTULOS RELACIONADOS

Análisis cuantitativo de la actividad turística, J. Alegre Martín, M. Cladera Munar, C. N.


Juaneda Sampol.
Árboles de decisión y ELECTRA I, M. Ruiz Rodríguez, S. Martínez Fierro, J. M.ª Biedma Fe-
rrer y A. Martín Navarro.
Cien ejercicios de econometría, J. Bernardo Pena Trapero , J. A. Estavillo Dorado , M.ª E.
Galindo Frutos, M.ª J. Leceta Rey, M.ª del M. Zamora Sanz.
Curso básico de matemáticas para la economía y dirección de empresas I, M. López Ca-
chero y A. Vegas Pérez.
Curso básico de matemáticas para la economía y dirección de empresas II, M. López Ca-
chero y A. Vegas Pérez.
Curso elemental de Estadística Descriptiva, A. Hernández Bastida.
Econometría. M. Díaz Fernández y M.ª del M. Llorente Marrón.
Ejercicios de econometría I, F. Palacios González (coord.), R. M.ª García Fernández y J. M.
Herrerías Velasco.
Ejercicios de estadística descriptiva y probabilidad para economía y administración
de empresas. J. M. Casas Sánchez, C. García Pérez, L. F. Rivera Galicia y A. I. Zamora Sanz.
Ejercicios de inferencia estadística y muestreo para economía y administración de
empresas. J. M. Casas Sánchez, C. García Pérez, L. F. Rivera Galicia y A. I. Zamora Sanz.
Estadística. Problemas resueltos, M.ª J. Peralta Astudillo, A. Rúa Vieytes, R. Redondo Palomo y
C. del Campo Campos.
Introducción a la econometría. F. J. Trívez Bielsa.
Introducción a las matemáticas financieras (Manual + Guía del alumno), S. Cruz Rambaud
y M.ª del C. Valls Martínez.
Introducción a las matemáticas financieras. Problemas resueltos, M.ª del C. Valls Martínez
y S. Cruz Rambaud.
Matemática de los seguros de vida, R. Moreno Ruiz, O. Gómez Pérez-Cacho, E. Trigo Martí-
nez.
Matemáticas para la economía y la empresa, S. Calderón Montero y M. L. Rey Borrego.
Matemáticas para el éxito empresarial, E. M. Fedriani Martel y M.ª del C. Melgar Hiraldo.
Métodos de valoración de empresas, V. Caballer Mellado.
Microeconometría y decisión, B. Cabrer Borrás, A. Sancho Pérez y G. Serrano Domingo.
Predicción y simulación aplicada a la economía y gestión de empresas, A. Pulido San
Román y A. M.ª López García.
Problemas de estadística. J. López de la Manzanara Barbero.
Problemas resueltos de estadística, S. Zubelzu y A. Ercoreca.
Problemas resueltos de estadística para las ciencias sociales, J. M.ª Sarabia, C. Trueba,
L. Remuzgo, V. Jordá y F. Prieto.
Sistemas informáticos aplicados al turismo. A. Guevara Plaza (coord.).
Técnicas de programación y control de proyectos. C. Romero López.

Si lo desea, en nuestra página web puede consultar el catálogo completo o descargarlo:

www.edicionespiramide.es

Vous aimerez peut-être aussi