Vous êtes sur la page 1sur 26

ESTADÍSTICA (SISTEMAS)

Profesores: Hilario Navarro. Jorge Martı́n

DEPARTAMENTO DE ESTADÍSTICA,
INVESTIGACIÓN OPERATIVA Y CÁLCULO
NUMÉRICO

Soluciones a los problemas propuestos de Estadı́stica Descriptiva y


Probabilidad
Curso 2007-2008
Estadı́stica Descriptiva. Probabilidad 1

Problema 1. En 1978, H. Cavendish realizó una serie de 29 experimentos con


objeto de medir la densidad de la tierra. Sus resultados, tomando como unidad
de densidad la del agua, fueron:
5.50 5.61 4.88 5.07 5.26 5.55 5.36 5.29 5.58 5.65
5.57 5.53 5.62 5.29 5.44 5.34 5.79 5.10 5.27 5.39
5.42 5.47 5.63 5.34 5.46 5.30 5.75 5.68 5.85
Analizar descriptivamente estos datos.
Solución
Si optamos por un diagrama de tallos y hojas para tener una descripción
gráfica de la distribución de frecuencias resulta

48 8
49
50 7
51 0
52 6799
53 04469
54 2467
55 03578
56 12358
57 59
58 5

Respecto a la localización del centro de la distribución obtenemos:

Media:
29
1 X
x̄ = xi = 5.448
29 i=1

Mediana: La posición central de las observaciones ordenadas está ocupada


por la que toma el valor 5.46.

Para valorar la dispersión de la distribución elegimos la desviación tı́pica. El


cálculo de la varianza lo efectuamos mediante la fórmula
29
1 X 2
vx = x − x̄2
29 i=1 i

resultando vx = 0.049.
Como consecuencia, el valor de la desviación tı́pica es

0.049 = 0.221

2 Estadı́stica (Sistemas). UNED. Curso 2007-2008

Problema 2. La siguiente es la distribución del número de artı́culos defectu-


osos encontrados en 404 lotes de un producto manufacturado. Calcule la media,
mediana, varianza y desviación tı́pica para iniciar la descripción de los datos
referidos.

No de items defectuosos No de lotes


0 53
1 110
2 82
3 58
4 35
5 20
6 18
7 12
8 9
9 3
10 1
11 2
12 1

Solución
Para el cálculo de las medidas de centralización y dispersión pedidas, tenemos
que tener en cuenta que partimos de la distribución de frecuencias. Concreta-
mente, según la tabla del enunciado, el valor 0 se ha presentado en 53 ocasiones
(frecuencia absoluta ni ), el 1 en 110, el 2 en 82 y ası́ sucesivamente. Entonces,
la media será el resultado del siguiente cálculo

1
x̄ = [(0 × 53) + (1 × 110) + (2 × 82) + (3 × 58) + · · · + (12 × 1)]
404
es decir,
1023
x̄ = = 2.532.
404
La mitad del número de observaciones es 202. Observando la tabla vemos
que el primer valor que acumula una frecuencia igual o superior a este número
es el 2 y, por tanto, es la mediana de esta distribución.
El hecho de que la media supere a la mediana nos indica que la cola derecha
tiene una “ extensión ” mayor que la izquierda.
¿Cuánto se dispersan los datos en torno al centro de la distribución? Para
responder a esta pregunta calcularemos la desviación tı́pica. La media de las
desviaciones cuadráticas (varianza) la obtendremos mediante la expresión
1 X
vx = ni x2i − x̄2 .
404 i
Estadı́stica Descriptiva. Probabilidad 3

Dado que

1  2  4561
(0 × 53) + (12 × 110) + (22 × 82) + · · · + (12 × 1) = = 11.562
404 404
y

x̄2 = 2.5322 = 6.411

resulta que vx = 11.562 − 6.411 = 5.241.


Como la desviación tı́pica
√ es la raı́z cuadrada positiva de la varianza, nuestra
medida de la dispersion es 5.241 = 2.289.


Problema 3. A partir de una muestra de 26 observaciones de la variable X


—que toma valores entre 320 y 430—, se obtuvo el siguiente diagrama de tallos
y hojas:
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4

(a) Reproduzca las 10 primeras observaciones (en la ordenación de menor a


mayor).

(b) ¿Dónde está situada la mediana de la distribución? ¿Qué variación exper-


imentarı́a dicha medida de centralización si el máximo de la distribución
aumentara su valor en 10 unidades?

(c) Sabiendo que el valor medio es 370.7, ¿cómo medirı́a la dispersión de los
datos respecto a este valor central? (No se requiere realizar los cálculos)

Solución

(a) Las observaciones pedidas son

325, 325, 334, 339, 356, 356, 359, 359, 363, 364
4 Estadı́stica (Sistemas). UNED. Curso 2007-2008

(b) La mediana de la distribución está situada en el punto


369 + 370
= 369.5
2
Si el máximo de la distribución, que es 424, aumentara su valor en 10
unidades, la mediana estarı́a situada en el mismo punto —en 369.5—, ya
que seguirı́amos teniendo el mismo número de observaciones a cada lado.
(c) Mediante la desviación tı́pica, que se define como la raı́z cuadrada positiva
de la varianza. Para el cálculo de esta última, se puede aplicar directamente
la definición:
1X 2
vx = (xi − x̄)
n i
ó, equivalentemente,
1X 2
vx = x − x̄2
n i i
1
3252 + 3252 + 3342 + ... + 4242 − 370.72

=
26

Problema 4. Cada uno de los dı́gitos que forman una clave de tres dı́gitos
se elige, con independencia de los otros, entre los números: 0, 1, 2, . . . , 9. De-
termı́nese:

(a) la probabilidad de que la clave tenga al menos dos cifras iguales.


(b) la probabilidad de que, si la clave obtenida es un número par, no sea
superior a 100.

Solución

(a) Se pueden formar un total de 103 claves con los dı́gitos del 0 al 9.
Denotaremos por A el suceso

A = “ la clave tiene al menos dos cifras iguales ”

Vamos a calcular la probabilidad del complementario

Ac = “ todas las cifras que forman la clave son distintas ”

Hay 10 · 9 · 8 claves favorables al suceso Ac ; ya que la cifra de las centenas


puede ser uno cualquiera de los diez dı́gitos, la de las decenas uno de los
nueve restantes y la de las unidades uno cualquiera de los ocho que no
ocuparon el lugar de las centenas y decenas.
Estadı́stica Descriptiva. Probabilidad 5

10 9 8
× × ×

10 · 9 · 8
La probabilidad del complementario es P (Ac ) = ; de donde se
103
sigue la probabilidad pedida:

10 · 9 · 8 18 7
P (A) = 1 − P (Ac ) = 1 − =1− = .
103 25 25

(b) Vamos a resolver el problema utilizando dos métodos.


Método 1. El enunciado nos informa sobre el resultado del experimento: la
clave obtenida es un número par. Con esta información la incertidumbre
se modifica; de entrada excluirı́amos todas las claves impares. Por tanto,
el espacio muestral cambia y queda restringido al conjunto de todas las
claves pares entre la 0 0 0 y la 9 9 9 ; un total de 500, es decir

Ω = {Conjunto de claves pares entre la 0 0 0 y la 9 9 9 }

De todas ellas hay un total de 51 que no superan a 100; todos los pares com-
prendidos entre el 0 cuya clave es 0 0 0 y el 100 con clave 1 0 0 .
Consecuentemente, la probabilidad pedida será 51/500.

Método 2. Se considera el espacio muestral inicial que está formado por el


conjunto de todas las claves comprendidas entre el 0 y el 999:

Ω = {Conjunto de claves entre la 0 0 0 y la 9 9 9 }

A continuación, se consideran los sucesos

A = “ la clave obtenida no supera a 100 ”

B = “ la clave obtenida es un número par ”

Nos están pidiendo calcular la probabilidad condicionada

P (A ∩ B)
P (A|B) = .
P (B)

Del conjunto de todas las claves, un total de 1000, hay 51 que son pares
menores o iguales que 100; con lo cual se tiene que
6 Estadı́stica (Sistemas). UNED. Curso 2007-2008

51
P (A ∩ B) = .
1000
Por otro lado, hay un total de 500 claves que son pares; luego se obten-
drá que

500
P (B) = .
1000
Por tanto, la probabilidad pedida es

51/1000 51
P (A|B) = = .
500/1000 500

Problema 5. Con el enunciado del problema anterior se pide calcular:

(a) la probabilidad de que la clave sea un número de dos cifras.

(b) la probabilidad de que la clave sea un múltiplo de 5.

(c) la probabilidad de que la clave sea un número par de dos cifras.

Solución

(a) Denotaremos por A el suceso “ la clave es un número de dos cifras ”.


Las claves de dos cifras tendrán el 0 en el lugar de las centenas, cualquier
dı́gito menos el 0 —un total de 9 dı́gitos posibles— en el lugar de las
decenas y uno cualquiera de los 10 dı́gitos en el lugar de las unidades:

1 9 10
0 × ×

Consecuentemente, habrá un total de 1 · 9 · 10 = 90 claves de dos cifras.


Por tanto, la probabilidad pedida será

1 · 9 · 10 9
P (A) = 3
= .
10 100

(b) Vamos a denotar por B el suceso “ la clave es un múltiplo de 5 ”.


Obtendremos un múltiplo de 5 —contando el 0, con clave 0 0 0 , entre
los múltiplos de 5— cuando en las unidades aparece un 0 o un 5 y en las
centenas y decenas uno cualquiera de los 10 dı́gitos:
Estadı́stica Descriptiva. Probabilidad 7

10 10 2
× × ×

Hay un total de 10 · 10 · 2 = 200 claves en que esto ocurre; luego la


probabilidad pedida será

10 · 10 · 2 1
P (B) = 3
= .
10 5

(c) Finalmente, sea C el suceso “ la clave es un número par de dos cifras ”.


Ocurre C si en las centenas aparece un 0, en las decenas uno cualquiera de
los 10 dı́gitos exceptuando el 0 (9 casos posibles) y en las unidades alguno
de los dı́gitos 0, 2, 4, 6, 8 (5 casos posibles):

1 9 5
0 × ×

Hay un total de 1 · 9 · 5 = 45 claves pares de dos cifras; con lo cual la


probabilidad pedida será

1·9·5 9
P (C) = 3
= .
10 200


Problema 6. Consideremos el circuito de la figura. Cada conmutador está cer-


rado con probabilidad p; y está abierto o cerrado con independencia del estado
de los otros. El circuito está cerrado si la corriente pasa desde A hasta B.
Consideremos el circuito de la figura. Cada conmutador está cerrado con
probabilidad p; y está abierto o cerrado con independencia del estado de los
otros. El circuito está cerrado si la corriente pasa desde A hasta B.

c1  

c2 

A B


c3  

c4
8 Estadı́stica (Sistemas). UNED. Curso 2007-2008

Sean los sucesos: Ci = “ el conmutador ci está cerrado ” : 1 ≤ i ≤ 4; y el suceso:


C = “ el circuito está cerrado ”. Calcular P (C) y P (C1 ∩ C2 |C).

Solución

El circuito está cerrado o bien cuando c1 y c2 están cerrados, o bien cuando


c3 y c4 están cerrados. Por tanto, con la notación del enunciado, podemos poner
el suceso C como

C = (C1 ∩ C2 ) ∪ (C3 ∩ C4 ),

con lo cual, teniendo en cuenta que los sucesos Ci son independientes, se


tendrá que

P (C) = P (C1 ∩ C2 ) + P (C3 ∩ C4 ) − P (C1 ∩ C2 ∩ C3 ∩ C4 )

= p2 + p2 − p4 = p2 (2 − p2 ).

Para calcular la probabilidad condicionada P (C1 ∩ C2 |C), recurrimos a la


definición:

P ((C1 ∩ C3 ) ∩ C)
P (C1 ∩ C3 |C) = .
P (C)
Ahora bien, dado que C1 ∩ C2 ⊂ C, se tiene que (C1 ∩ C2 ) ∩ C = C1 ∩ C2 ;
con lo cual

P (C1 ∩ C2 ) p2 1
P (C1 ∩ C2 |C) = = 2 = .
P (C) p (2 − p2 ) 2 − p2


Problema 7. Un algoritmo de búsqueda inspecciona una lista de 1000 reg-


istros a fin de localizar un registro determinado. El algoritmo emplea un pro-
cedimiento secuencial de búsqueda: recorre la lista de izquierda a derecha, com-
probando si cada registro coincide con el que busca, hasta que lo encuentra. Se
pide:

(a) Calcular la probabilidad de que lo encuentre en 6 intentos.

(b) Calcular la probabilidad de que tenga que realizar k intentos.

(c) Determinar el número medio de intentos que realiza.

Solución
Estadı́stica Descriptiva. Probabilidad 9

(a) Sea X la variable aleatoria

X = número de intentos hasta encontrar el registro buscado.

Supongamos que ponemos todos los registros en fila:

· · · ········· · ·

El algoritmo realizará seis intentos cuando no localice el registro que busca


en las cinco primeras posiciones de la fila y lo encuentre en la sexta.
Si denotamos por Ai el suceso “ el registro buscado ocupa la i−ésima
posición de la fila ” la probabilidad pedida será

P (X = 6) = P (Ac1 ∩ Ac2 ∩ Ac3 ∩ Ac4 ∩ Ac5 ∩ A6 ).

Por la regla de la multiplicación para calcular de la probabilidad de la


intersección de sucesos, se tiene que

P (X = 6) = P (Ac1 )P (Ac2 |Ac1 )P (Ac3 |Ac1 ∩Ac2 ) · · · P (A6 |Ac1 ∩Ac2 ∩Ac3 ∩Ac4 ∩Ac5 ).

Por tanto, la probabilidad pedida será

      
999 998 997 996 995 1 1
P (X = 6) = =
1000 999 998 997 996 995 1000

(b) De la misma manera, la probabilidad de realizar k intentos es la proba-


bilidad de que el algoritmo no localice el registro en los k − 1 primeros
lugares de la fila y lo encuentre en el k-ésimo. Por tanto, para cada
k = 1, 2, . . . , 1000

    
999 1000 − k + 1 1 1
P (X = k) = ··· =
1000 1000 − k + 2 1000 − k + 1 1000

El cálculo anterior se generaliza sin dificultad a una lista con n registros.


Ası́, para cada k = 1, 2, . . . , n, se tiene que

     
n−1 n−2 n−k+1 1 1
P (X = k) = ··· =
n n−1 n−k+2 n−k+1 n
10 Estadı́stica (Sistemas). UNED. Curso 2007-2008

Sin embargo, para calcular P (X = k) en el caso general, preferimos utilizar


el razonamiento recurrente que se sigue del procedimiento secuencial de
búsqueda.
Para una lista de n registros, sea pk,n la probabilidad de localizar el registro
buscado en k intentos, y A el suceso “el primer registro de la fila es distinto
al buscado”.
Para localizar el registro en k intentos, debe ocurrir A, y a continuación,
se han de realizar k − 1 intentos en una nueva lista con n − 1 registros
(todos menos el primero). Por tanto,

n−1
pk,n = P (X = k) = pk−1,n−1 : k = 2, 3, . . . , n
n
de donde se sigue la ecuación recurrente

npk,n = (n − 1)pk−1,n−1 (1)

1
Teniendo en cuenta la condición inicial: p1,i = (en una lista con i reg-
i
istros la probabilidad de localizar el buscado en el primer intento es 1/i),
basta aplicar la ecuación anterior sucesivamente para obtener que

npk,n = (n−1)pk−1,n−1 = (n−2)pk−2,n−2 = · · · · · · = (n−k+1)p1,n−k+1 = 1

1
de donde se sigue que pk,n = P (X = k) = : k = 1, 2, . . . , n.
n

(c) Ya que hemos sido capaces de generalizar el problema, vamos a seguir


utilizando la lista de n registros.
El número medio de intentos que realiza el algoritmo es la media de la
variable aleatoria X.

n n
X 1X
E{X} = kP (X = k) = k.
n
k=1 k=1

Calcular esta suma es sencillo si se tiene en cuenta que la suma de cada


dos términos del sumatorio que equidistan de los extremos es igual a la
suma de estos:

1 2 3 ········· n−2 n−1 n


n n−1 n−2 ········· 3 2 1
n+1 n+1 n+1 ········· n+1 n+1 n+1
Estadı́stica Descriptiva. Probabilidad 11

Pn
De lo anterior se sigue que 2 k=1 k = n(n + 1), es decir,

n
1X n+1
E{X} = k= .
n 2
k=1

Cuando n = 1000, el número medio de intentos es 1001/2.


El razonamiento recurrente nos proporciona de nuevo un procedimiento
de cálculo de la media que evita cuentas “engorrosas” como las anteriores.
Denotamos por µn el número medio de intentos en una lista con n registros.
Si el registro buscado está en la primera posición de la fila, lo cual ocurre
con probabilidad 1/n, se realiza un intento y se acaba la búsqueda. En
(n − 1)
cambio, si no está, lo cual ocurre con probabilidad , contamos un
n
intento y comenzaremos a buscar en una lista con n − 1 registros; con lo
que, en este caso, el número medio de intentos será 1 + µn−1 .
De este razonamiento resulta la siguiente ecuación recurrente:

1 n−1
µn = + (1 + µn−1 ) (2)
n n

con la condición inicial µ1 = 1 (en una lista con un solo registro se localiza
el buscado en un intento). Poniendo Qn = nµn , (2) se transforma en

Qn = Qn−1 + n con Q 1 = µ1 = 1 (3)

Es posible que no sepas resolver esta ecuación en diferencias. En realidad


no lo necesitas, ya que el enunciado tan sólo te pide que encuentres µ1000 =
Q1000
. Seguro que sı́ sabes programar un bucle que realice el cálculo:
1000

Q=1
for n = 2 to 1000
Q=Q+n
next n
Q/1000

Para los aficionados a resolver problemas, vamos a solucionar (3).


Ensayamos para Qn una solución de la forma: Qn = a+bn+cn2 . Partiendo
de la condición inicial, basta aplicar la recurrencia dos veces para obtener

Q1 = 1 Q2 = 3 Q3 = 6
12 Estadı́stica (Sistemas). UNED. Curso 2007-2008

Sustituyendo los valores n = 1, n = 2 y n = 3 en la solución general, se


llega al siguiente sistema de ecuaciones.

a+b+c = 1
a + 2b + 4c = 3
a + 3b + 9c = 6

La solución del sistema es a = 0, b = 1/2, c = 1/2; con lo que

n n2
 
Qn 1 n+1
µn = = + =
n n 2 2 2

Problema 8. Una cadena de montaje produce lotes de piezas. La proporción


de piezas defectuosas en cada uno de esos lotes es una variable aleatoria X con
función de densidad
(
k 41 − x , si 0 < x < 41

f (x) =
0 , en otro caso
Determı́nese

(a) El valor de la constante k.

(b) La proporción media de piezas defectuosas que contendrá un lote deter-


minado.

(c) Ciertos controles de calidad obligan a retirar los lotes que contienen una
proporción de piezas defectuosas superior al 10 %. Si el coste de producción
de cada lote es de 100 euros, ¿cuál deberá ser el precio mı́nimo de venta
para garantizar un beneficio por lote de al menos 4 euros?.

Solución

(a) Puesto que la integral de la función de densidad ha de ser 1, se tendrá que

∞ 1/4  
1 k
Z Z
1= f (x) dx = k −x dx = ,
−∞ 0 4 32

de donde se deduce que k = 32.


La representación gráfica de la densidad de la variable X es la que aparece
en la siguiente figura.
Estadı́stica Descriptiva. Probabilidad 13

8
1

f (x) = 32 4 −x

1/4

Figura 1: Función de densidad de la variable aleatoria X

(b) La proporción media es

1/4 1/4

x2 x3
x 
1
Z Z 
2
E(X) = xf (x) dx = 32 −x dx = 32 − = .
−∞ 0 4 8 3 0 12

(c) Sea B la variable aleatoria beneficio obtenido en la venta de un lote.


Supongamos que el precio de venta del lote es 100 + a con a > 0.
Puesto que los lotes que no pasan los controles de calidad se retiran, la
probabilidad de perder 100 euros en un lote es la probabilidad de que
contenga una proporción de piezas defectuosas superior al 10 %, es decir,
  1/4 1/4  
1 1 9
Z Z
P X> = f (x) dx = 32 −x dx = .
10 1/10 1/10 4 25

Por tanto, la variable B toma los valores a y −100 con probabilidades:

16 9
P (B = a) = , P (B = −100) = .
25 25
Para tener un beneficio por lote de al menos 4 euros, debe ocurrir que

16a 900
E(B) = − > 4,
25 25
de donde se obtiene que a > 62.5.
Por tanto, el precio mı́nimo de venta de cada lote debe ser de 162.5 euros.
14 Estadı́stica (Sistemas). UNED. Curso 2007-2008

Problema 9. Se supone que el voltaje medido en cierto circuito eléctrico es


una variable aleatoria con distribución normal de media 120 y desviación tı́pica
2. Realizada una medición cualquiera, calcule la probabilidad de que

(a) Proporcione un voltaje superior a 118. Un voltaje entre 116 y 118.

(b) Se obtenga un voltaje que difiera del voltaje medio en al menos una unidad.

Solución
Al tipificar la variable aleatoria X que mide el voltaje del circuito, se obtiene
una variable

X − 120
Z=
2
cuya distribución es una normal de media 0 y desviación tı́pica 1.

(a) En este apartado nos están pidiendo la probabilidad del suceso {X > 118}.
Utilizando la estandarización anterior se tiene que

−1 1

Figura 2: Probabilidades: P (Z > −1) y P (Z < 1)

118 − 120
P (X > 118) = P (Z > ) = P (Z > −1).
2
Teniendo en cuenta la simetrı́a de la distribución normal, se obtendrá que
P (Z > −1) = P (Z < 1) = Φ(1) —véase la figura 2—, siendo Φ la función
de distribución de una N (0, 1). Por tanto,

P (X > 118) = P (Z > −1) = P (Z < 1) = Φ(1) = 0.8413.

Para la segunda de las cuestiones de este apartado, se obtiene, después de


tipificar la variable X, que

116 − 120 118 − 120


P (116 < X < 118) = P ( <Z< ) = P (−2 < Z < −1).
2 2
Estadı́stica Descriptiva. Probabilidad 15

De nuevo, teniendo en cuenta la simetrı́a de la distribución (ver figura 3),


podremos concluir que

P (116 < X < 118) = P (−2 < Z < −1) = P (1 < Z < 2)

= P (Z < 2) − P (Z < 1) = Φ(2) − Φ(1) = 0.9772 − 0.8413 = 0.1359.

−2 −1 1 2

Figura 3: Probabilidades: P (−2 < Z < −1) y P (1 < Z < 2)

(b) Una medida difiere del voltaje medio en al menos una unidad cuando
|X − 120| > 1. Consecuentemente, la probabilidad pedida será

|X − 120| 1 1
P (|X − 120| > 1) = P ( > ) = P (|Z| > ).
2 2 2
De nuevo por la simetrı́a de la distribución (ver figura 4), se puede afirmar
1 1
que P (|Z| > ) = 2P (Z > ). Por tanto,
2 2

1 1
P (|X − 120| > 1) = 2P (Z > ) = 2[1 − Φ( )] = 2[1 − 0.6915] = 0.617.
2 2

Problema 10. El tiempo que un ordenador tarda en ejecutar cierto algoritmo es


una variable aleatoria con distribución normal de media y varianza desconocidas.
Se sabe que el 15.87 % de las ocasiones el algoritmo tarda en ejecutarse al menos
6 segundos y que el 99 % de las ocasiones el tiempo de ejecución no es superior
a 7 segundos. Determı́nese la media y la desviación tı́pica de la distribución.
Solución
Sea X la variable aleatoria tiempo de ejecución del algoritmo; denotaremos la
media y la varianza desconocidas de dicha variable por µ y σ 2 respectivamente.
El enunciado del problema establece las siguientes condiciones:

P (X ≥ 6) = 0.1587 , P (X ≤ 7) = 0.99.
De la primera de ellas se obtiene que
16 Estadı́stica (Sistemas). UNED. Curso 2007-2008

−1/2 1/2

Figura 4: Función de densidad de una N (0, 1)

6−µ 6−µ
P (X ≥ 6) = P (Z ≥ ) = 1 − P (Z ≤ ) = 0.1587.
σ σ
6−µ 6−µ
Consecuentemente, P (Z ≤ ) = Φ( ) = 0.8413, lo cual implica que
σ σ
6−µ
= Φ−1 (0.8413) = 1,
σ
valor que se obtiene de las tablas de la distribución N (0, 1).
De la misma manera, la segunda condición conduce a
7−µ 7−µ
P (X ≤ 7) = P (Z ≤ ) = Φ( ) = 0.99,
σ σ
de donde se deduce que
7−µ
= Φ−1 (0.99) = 2.33.
σ
Las dos condiciones anteriores dan lugar al siguiente sistema de ecuaciones:
6−µ 7−µ
=1 , = 2.33
σ σ
del cual se obtienen los valores desconocidos de la media y la desviación tı́pica:
µ = 5.25 y σ = 0.75.


Problema 11. Cierto aparato registra el nivel de saturación de la red eléctrica


en una comarca. El error relativo porcentual de la medida dada por el aparato
es una variable aleatoria continua X con función de distribución

0
 , si x < 0
F (x) = 1 − (1 − x)3 , si 0 ≤ x ≤ 1

1 , si x > 1

Determinar:

(a) La función de densidad de la variable X.


(b) La probabilidad de que una medida registrada por el aparato tenga un
error entre el 0.1 % y el 0.2 %.
Estadı́stica Descriptiva. Probabilidad 17

(c) El error relativo medio.

Solución

(a) La representación gráfica de la función de distribución F (x) es la que


aparece en la figura 5.

−2 −1 0 1 2
Figura 5: Función de distribución de la variable aleatoria X

Puesto que la variable X es continua, la función de densidad se obtiene


derivando la de distribución. Dicha función viene dada por

0
 , si x < 0
f (x) = F 0 (x) = 3(1 − x)2 , si 0 ≤ x ≤ 1

0 , si x > 1

Su representación gráfica es la que aparece en la figura 6.

−2 −1 0 1 2
Figura 6: Función de densidad de la variable aleatoria X

(b) El error de medida está entre el 0.1 % y el 0.2 % cuando 0.1 ≤ X ≤ 0.2.
Por tanto, la probabilidad pedida será
Z 0.2 Z 0.2
P (0.1 ≤ X ≤ 0.2) = f (x) dx = 3 (1 − x)2 dx = 0.217.
0.1 0.1

Esta probabilidad es el área sombreada de la figura 7.


Un modo alternativo de llegar al mismo resultado es haciendo uso de la
función de distribución dada en el enunciado del problema.
18 Estadı́stica (Sistemas). UNED. Curso 2007-2008

Figura 7: P (0.1 ≤ X ≤ 0.2)

Z 0.2 Z 0.2 Z 0.1


P (0.1 ≤ X ≤ 0.2) = f (x) dx = f (x) dx − f (x) dx
0.1 −∞ −∞

= F (0.2) − F (0.1) = 1 − (1 − 0.2)3 − (1 − (1 − 0.1)3 ) = 0.217.

(c) Finalmente, en este apartado nos están pidiendo la media de la variable


aleatoria X que mide el error, la cual viene dada por

1 1

x2 2x3 x4

1
Z Z
E{X} = xf (x) dx = 3 x(1−x)2 dx = 3 − + =
−∞ 0 2 3 4 0 4

Problema 12. La variable aleatoria X que mide —en dı́as— el tiempo de fun-
cionamiento de determinados equipos, hasta que comienzan a presentar fallos,
tiene la siguiente función de densidad:
(
0 , si x ≤ 0
f (x) = 1 −x/1000
1000 e , si x > 0

Determinar:

(a) La probabilidad de que uno de estos equipos dure al menos 100 dı́as.

(b) La probabilidad de que un equipo que no ha fallado en 100 dı́as, comience


a hacerlo antes de 500.

(c) Si un sistema está formado por tres de estos equipos conectados en serie,
¿cuál es la probabilidad de que el sistema funcione correctamente durante
al menos 300 dı́as? Supóngase que cada equipo funciona con independencia
de los otros.
Estadı́stica Descriptiva. Probabilidad 19

100

Figura 8: P (X > 100) para una exponencial de media 1000

Solución

(a) La función de densidad del enunciado es la de una exponencial de media


1000. Un equipo durará al menos 100 dı́as cuando X > 100; con lo cual,
la probabilidad pedida —área de la zona sombreada de la figura 8— será

∞ ∞
1
Z Z
P (X > 100) = f (x) dx = e−x/1000 dx = e−1/10 .
100 1000 100

(b) Puesto que nos suministran la información adicional de que cierto equipo
ha durado al menos 100 dı́as, nos enfrentamos ante el cálculo de una
probabilidad condicionada.
Nos piden calcular la probabilidad del suceso {X < 500} supuesto que se
cumple que X > 100, es decir, P (X < 500|X > 100).
En efecto, de la definición de probabilidad de un suceso condicionado por
otro se obtiene que

P (100 < X < 500)


P (X < 500|X > 100) = .
P (X > 100)

La probabilidad del denominador es la que ya hemos calculado en el


apartado anterior.
Para el cálculo de la probabilidad del numerador —área sombreada de la
figura 9—, se integra la densidad exponencial en el intervalo (100, 500),
obteniéndose que

500 500
1
Z Z
P (100 < X < 500) = f (x) dx = e−x/1000 dx
100 1000 100

i500
= −e−x/1000 = e−1/10 − e−1/2 .
100
20 Estadı́stica (Sistemas). UNED. Curso 2007-2008

100 500

Figura 9: P (100 < X < 500) para una exponencial de media 1000

Equipo 1 Equipo 2 Equipo 3

Figura 10: Conexión en serie de los tres equipos

Ahora ya tenemos todos los ingredientes que permiten evaluar la proba-


bilidad condicionada que nos piden:

e−1/10 − e−1/2
P (X < 500|X > 100) = = 1 − e−2/5 .
e−1/10

(c) Vamos a denotar por E, E1 , E2 y E3 los sucesos:

E =“ El sistema funciona correctamente durante al menos 300 dı́as ”


E1 =“ El equipo 1 funciona correctamente durante al menos 300 dı́as ”
E2 =“ El equipo 2 funciona correctamente durante al menos 300 dı́as ”
E3 =“ El equipo 3 funciona correctamente durante al menos 300 dı́as ”

Dado que la conexión es en serie —véase la figura 10—, el sistema fun-


cionará durante al menos 300 dı́as cuando los tres equipos que lo componen
permanezcan en funcionamiento por al menos este periodo de tiempo. Por
tanto, teniendo en cuenta la hipótesis de independencia del enunciado, se
tendrá que

P (E) = P (E1 ∩ E2 ∩ E3 ) = P (E1 )P (E2 )P (E3 ).

Estas tres probabilidades: P (E1 ), P (E2 ) y P (E3 ) son iguales y vienen


dadas por
Estadı́stica Descriptiva. Probabilidad 21

∞ ∞
1
Z Z
P (E1 ) = P (E2 ) = P (E3 ) = f (x) dx = e−x/1000 dx = e−3/10 .
300 1000 300

Consecuentemente, la probabilidad pedida será P (E) = e−9/10 .

Problema 13. El tiempo de vida de ciertos aparatos de medida es una variable


aleatoria X con función de densidad

ke−x , x > 3
f (x) =
0 , en otro caso

Se pide:

(a) El valor de la constante k. Hallar la probabilidad: P (5 < X < 7) .

(b) La media de la variable X.

Solución

(a) Puesto que f (x) es una función de densidad, se tiene que


Z ∞
f (x) ≥ 0 : − ∞ < x < ∞ , f (x) dx = 1
−∞

De la segunda condición se sigue que:


Z ∞

k e−x dx = −k e−x 3 = ke−3 = 1
3

con lo cual la constante será: k = e3 .


A continuación, calculamos la probabilidad que se pide —área sombreada
de la figura—. Para ello basta integrar la densidad entre 5 y 7.

Z 7 7
P (5 < X < 7) = e3−x dx = −e3 e−x 5 = −e3 (e−7 − e−5 ) = e−2 − e−4 .
5

(b) La esperanza de la variable aleatoria X viene dada por


Z ∞ Z ∞
E{X} = xf (x) dx = xe3−x dx.
−∞ 3
22 Estadı́stica (Sistemas). UNED. Curso 2007-2008

3 5 7

Figura 11: Representación gráfica de la función de densidad

Integrando por partes (para los que hayan olvidado la integración por
partes, se recomienda que repasar los métodos de integración que se estu-
dian en cualquier curso de introducción al Cálculo), se obtendrá que
 Z ∞ 
3 ∞
dx = e3 3 · e−3 + e−3 = 4.
 
E{X} = e −xe−x 3 + e −x
3

Problema 14. La probabilidad de error en la transmisión de un bit por un


canal de comunicación es p = 10−4 . Los bits se empaquetan en bloques de
información; y la transmisión de cada bit del bloque es independiente del resto.
Se pide:

a) Calcular la probabilidad de que se produzca algún error en la transmisión


de un bloque de 1000 bits.
b) Calcular la probabilidad de que se hayan producido más de dos errores en
la transmisión de un bloque de 1000 bits si se observó algún error en la
transmisión del bloque.

Solución

a) Dado que en la transmisión de cada bit se esperan dos resultados posi-


bles —transmisión incorrecta o correcta— con probabilidades respectivas
p = 10−4 y 1 − p = 1 − 10−4 , estamos ante un experimento aleatorio de
Bernoulli.
La variable aleatoria X que sirve de modelo para este experimento aleato-
rio es la de Bernoulli con función de masa

P (X = 1) = p P (X = 0) = 1 − p

El número de errores en la transmisión de un bloque de 1000 bits viene


dado por la variable aleatoria S = X1 + X2 + · · · + X1000 —donde cada
una de las Xi de la suma sigue la distribución de Bernoulli anterior—,
es decir, S es una variable aleatoria Binomial de parámetros n = 1000 y
p = 10−4 ; ya que los bits se transmiten independientemente.
Estadı́stica Descriptiva. Probabilidad 23

La probabilidad que se pide es: P (S > 0) = 1 − P (S = 0).


Puesto que en las condiciones de enunciado la distribución Binomial se
puede aproximar por una de Poisson de parámetro λ = np = 1000·10−4 =
1/10, la probabilidad pedida se aproximará mediante:

e−1/10 (1/10)0
P (S > 0) ≈ 1 − = 1 − e−1/10 .
0!
b) El enunciado nos dice que es ha observado algún error en la transmisión
del bloque, es decir, se nos informa que ocurrió el suceso {S > 0}. Se
pide hallar la probabilidad del suceso {S > 2}, dada esta información adi-
cional sobre la elección del azar, es decir, se pregunta por la probabilidad
condicionada: P (S > 2|S > 0).
Utilizando la fórmula de la probabilidad condicionada se obtiene que

P ({S > 2} ∩ {S > 0}) P (S > 2)


P (S > 2|S > 0) = =
P (S > 0) P (S > 0)
La probabilidad del denominador se halló en el apartado anterior; para
calcular la del numerador, utilizamos otra vez la aproximación de la Bi-
nomial por la distribución de Poisson. De este modo se obtiene que

P (S > 2) = 1 − P (S ≤ 2) = 1 − P (S = 0) − P (S = 1) − P (S = 2)

e−1/10 (1/10) e−1/10 (1/10)2


≈ 1 − e−1/10 − −
1! 2!
Por tanto,

e−1/10 (1/10) (1/10)2


−e
−1/10
1 − e−1/10 − 1! 2!
P (S > 2|S > 0) ≈
1 − e−1/10

e−1/10 (1/10) + 21 e−1/10 (1/10)2


=1−
1 − e−1/10


Problema 15. Un canal de transmisión está formado por un emisor de dı́gitos


binarios y un receptor. La probabilidad de error en la transmisión de cada dı́gito
es p = 10−2 . El error se produce con independencia de lo sucedido en los dı́gitos
emitidos anteriormente.

a) Si se emite un mensaje con 10 dı́gitos, ¿cuál es la función de masa de


la variable aleatoria X = “número de dı́gitos que se reciben con error”?
Calcular E {X}.
24 Estadı́stica (Sistemas). UNED. Curso 2007-2008

b) Si se emiten dı́gitos consecutivamente, ¿cuál es la función de masa de la


variable aleatoria Y = “número de dı́gitos que se transmiten hasta que se
produce el primer error”? Calcular E {Y }.

Solución

a) La variable aleatoria modelo para la transmisión de un dı́gito es la Bernoul-


li de parámetro p = 10−2 . Por la hipótesis de independencia, la variable
X que contabiliza el número de transmisiones erróneas en un bloque de
10 bits será una Binomial de parámetros n = 10 y p = 10−2 .
La función de masa de una variable aleatoria X Binomial de parámetros
(n, p) viene dada por
 
n x
P (X = x) = p (1 − p)n−x : x = 0, 1, . . . , n
x

En este caso, con los parámetros dados por el enunciado, se obtiene que
 
10
P (X = x) = (1/100)x (1 − 1/100)10−x : x = 0, 1, . . . , 10
x

Se sabe que la media de la distribución binomial es E{X} = np. Para la


situación del enunciado, se tiene que E{X} = 10 · (1/100) = 1/10

b) La variable aleatoria Y cuenta el número de dı́gitos que se transmiten hasta


que se produce el primer error. Tomará el valor Y = 0 si el primer dı́gito se
transmitió erróneamente, lo cual ocurre con probabilidad 10−2 ; tomará el
valor Y = 1 si el primero se transmitió correctamente y el segundo no,
suceso que tiene probabilidad (1 − 10−2 ) · 10−2 (por la independencia en la
transmisión de cada dı́gito); el valor Y = 2 si el primer error ocurre en la
transmisión del tercer dı́gito, lo cual tiene probabilidad (1 − 10−2 )2 · 10−2 .
En general, función de masa de la variable Y vendrá dada por

P (Y = y) = (1 − 10−2 )y · 10−2 : y = 0, 1, 2, . . .

La distribución anterior se conoce con el nombre de geométrica de parámetro


p = 10−2 . La función de masa de una geométrica de parámetro p viene
dada por

P (Y = y) = (1 − p)y · p : y = 0, 1, 2, . . .

A partir de la función de masa anterior, se puede obtener que la media de


1−p
la distribución es E{Y } = . Para el caso que nos ocupa, la esperanza
p
será:
Estadı́stica Descriptiva. Probabilidad 25

1 − 1/100 99/100
E{Y } = = 99.
1/100 1/100

Las tres distribuciones que aparecen en este problema son el objeto de las
secciones 2, 3 y 4 del capı́tulo 6 del texto base.

Vous aimerez peut-être aussi