Vous êtes sur la page 1sur 64

EXMENES

RESUELTOS

ESTADSTICA



INFORMTICA
SISTEMAS




DELEGACIN DE ALUMNOS

CENTRO ASOCIADO DE BALEARES



COLECCIN DE EXAMENES DE ESTADSTICA





































CENTRO DE ASOCIADO DE BALEARES

ESTADISTICA I (SISTEMAS)
Primera semana. 96/97

1. El tiempo que dura un proceso de validacin de datos es una variable aleatoria con funcin
de densidad:

x2/9 0<=x<=a
f(x)=
0 resto
a) Calcular a.
b) Calcular el tiempo esperado del proceso de validacin
c) Calcular la mediana de la distribucin.

2. Un jugador tiene en su bolsillo dos dados de tipo A, tres de tipo B y cuatro de tipo C. Los
dados de tipo A tienen 3 caras con el nmero 3 y otras tres con el 6. Los de tipo B tienen
dos caras de cada uno de los nmeros 2, 4 y 6. Los del tipo C tienen una cara con cada
uno de los nmeros del 1 al 6. Si el jugador elige al azar un dato y lo lanza, se pide:
a) Calcular la probabilidad de que salga un 6.
b) Suponiendo que haya salido un 3, calcular la probabilidad de que el dado elegido haya sido
del tipo A

3. En una muestra aleatoria de 400 individuos se encontraron 12 cumpliendo una condicin
determinada. Hay una evidencia suficiente para concluir que la proporcin de individuos
de esta clase es superior al 2%? (Utilice =0.05)

4. Un sistema contiene 3 componentes conectados en serie que funcionan
independientemente. Suponiendo que el tiempo de vida de estos componentes (medido en
horas) sigue una distribucin exponencial de media 1000, 3000 y 6000 horas,
respectivamente, calcular la probabilidad de que el sistema no falle antes de 100 horas.

Datos auxiliares:
a) La densidad exponencial es de la forma
1/ exp (-x/) x>0
f(x)=
0 en otro caso

b) La conexin en serie implica que el sistema falla cuando lo hace alguno de sus
componentes.

ESTADSTICA I*
(Informtica de Sistemas)

Primera Prueba Presencial. Primera Semana.
Curso 1998-99.

1. Se sabe que la cuarta parte de los habitantes de una gran ciudad tiene menos de 50
aos y que la probabilidad de que un habitante muera de cncer es 0.1 en el caso
de que tenga menos de 50 aos, y 0.2 en otro caso.

(a) Determinar la probabilidad de que un habitante, elegido al azar, no muera de
cncer.

(b) Si una persona muri de cncer, cul es la probabilidad de que tuviera menos de
50 aos?

2. Una compaa area afirma que la duracin de sus vuelos entre las ciudades A y
B se distribuye segn una ley Normal de media no superior a 1.2 horas. Sin
embargo, la competencia afirma que sto no es cierto ya que, despus de tomar 9
vuelos al azar, observ una duracin media de 1.78 horas y una cuasivarianza de
0.36. Avalan estos datos la afirmacin de la competencia? (Utilice =0.05)

Datos auxiliares: t8,0.05 =1.86 ; z0.05 =1.645 ; z0.025 =1.96


3. Una empresa compra grandes cantidades de una clase de dispositivos
electrnicos. La decisin para aceptar o rechazar un lote de dichos elementos se
toma en base a una muestra aleatoria de 100 unidades. Si el lote se rechaza
cuando se encuentran 3 ms unidades defectuosas, cul es la probabilidad de
rechazar un lote con un 1% de dispositivos defectuosos?

4. Con el fin de describir el comportamiento de una variable cuantitativa X bajo
unas condiciones determinadas, se procedi a su observacin. Los datos
registrados se resumen en la siguiente tabla de frecuencias:
__________________________________________
| X | 0 1 2 3 4 |
| Frec. abs. acumulada | 2 3 7 8 10 |

(a) Calcule la media de esta distribucin.
(b) Obtenga una medida de la dispersin.

_______________________________________
*NO se permite el uso de CALCULADORA.
Estadstica I - Sistemas
Primera Prueba Presencial. Segunda Semana. Curso 1998-99.
Examen realizado el 9 de febrero de 1999.

1. Una fbrica tiene tres plantas; el 20% de sus mquinas se montan en la primera planta, el 30% en la
segunda y el 50% restante en la tercera. Se sabe adems que la cadena de montaje falla, dando lugar a
una mquina defectuosa, con probabilidades 0.1, 0.2 y 0.15 en cada una de las tres plantas.

a) Determinar la probabilidad de que una mquina cualquiera montada en esa fbrica sea defectuosa.
b) Cul es la probabilidad de que una mquina no defectuosa se haya montado en la primera planta?

2. La tabla siguiente resume los datos obtenidos en la observacin de una variable cuantitativa X.

X 1 2 3 4 5
f 0.1 0.2 0.4 0.1 0.2

a) Calcular el coeficiente de variacin.
b) Obtener los percentiles correspondientes al 25% y al 75%

3. Un vendedor afirma que el tiempo medio de vida de las bombillas que oferta a sus clientes no es
inferior a 10 meses. Extrada una muestra aleatoria de 64 bombillas, se obtuvo un tiempo de vida
medio de 9.8 meses y una cuasivarianza muestral de 1. Avala la muestra, al nivel de significacin
alfa=0.025, la afirmacin hecha por el vendedor?

Datos auxiliares: Si F es la funcin de distribucin de la N(0,1),
F(1.96) =0.975 y F(1.645) =0.95.

4. Se supone que el voltaje medido en cierto circuito elctrico tiene una distribucin Normal con
media 120 y desviacin tpica 2. Calcule la probabilidad de que una medicin proporcione un voltaje:

a) superior a 118,
b) entre 116 y 118.

Datos auxiliares: F(1) =0.8413 y F(2) =0.9773, siendo F la funcin de distribucin de la N(0,1).

NOTA: NO se permite el uso de calculadora.
ESTADSTICA I

(Informtica de Sistemas)
Primera Prueba Presencial. Primera Semana.
Curso 2001-2002.
1. El siguiente diagrama de tallos y hojas propor-
ciona una descripcin de la naturaleza de una
coleccin de datos relativos a un aspecto cuanti-
tativo X de inters con valores en el intervalo
[0, 100].
4 2
5 5
6 9 3 8 5
7 2 9 2 1
8 4 4 8
9 2 1
Se pide:
(a) Calcular la media y la mediana de X.
(b) Obtener la desviacin tpica de X, par-
tiendo de
P
i
x
2
i
= 82169.
2. Un programa se ejecuta desde uno cualquiera
de dos perifricos: P
1
y P
2
, de acuerdo con el
siguiente protocolo: si P
1
est operativo el pro-
grama se ejecuta desde P
1
; si no lo est se reali-
za un segundo intento desde el segundo perif-
rico; si ste est operativo el programa se eje-
cuta desde P
2
, en caso contrario el programa se
queda sin ejecutar. Cada perifrico est opera-
tivo o no con independencia del estado del otro
y las probabilidades de estar operativo son: 0.8
para P
1
y 0.7 para P
2
.
(a) Determnese la probabilidad de que el pro-
grama no se ejecute.
(b) Si el programa se ha ejecutado, cul es la
probabilidad de que lo haya hecho desde el
segundo perifrico?

NO se permite el uso de CALCULADORA. No se exige


precisin en los clculos; puede efectuar los redondeos que
considere oportunos.
3. El nmero de trabajadores que diariamente in-
tegran una cadena de montaje vara a causa del
nivel de absentismo. La tabla siguiente contiene
los datos registrados en una muestra aleatoria
de la produccin diaria, siendo X el nmero de
trabajadores ausentes e Y el nmero de produc-
tos defectuosos generados por dicha cadena.
X 1 3 5 0 2
Y 10 16 20 9 12
Si la recta de regresin estimada es
y = 8.26 + 2.34x ,
calcule un intervalo de conanza (99%) para la
prediccin de la cantidad de productos defec-
tuosos que se obtendrn cuando el nmero de
operarios ausentes sea 4.
Datos auxiliares:
x = 2.20, y = 13.4, v
y
= 20.80,
I =

y
0
t
n2;/2
r
v
y
(1r
2
)
n2

1 +
(x0 x)
2
vx

,
t
3;0.01
= 4.5407, t
3;0.005
= 5.8409, t
5;0.01
=
3.3649.
4. Dos algoritmos A y B permiten simular cierto
proceso. En 10 simulaciones, realizadas con
cada uno de ellos, se obtuvieron los siguientes
tiempos de ejecucin por cada simulacin
Tiempo de ejecuci on (en segundos)
A 7 10 8 9 6.5 8 7 7.5 9 8
B 7 7 6 5.5 7 8 6.5 7 7 9
Proporcionan los datos la evidencia suciente,
al nivel de signicacin = 0.05, para concluir
que hay diferencias entre los tiempos medios de
ejecucin de ambos algoritmos? Supngase nor-
malidad e igualdad de varianzas en los tiempos
de ejecucin.
Datos auxiliares: t
20;0.05
= 1.725 , t
18;0.05
=
1.734 , t
18;0.025
= 2.101 , z
0.05
= 1.645 , z
0.025
=
1.96
1
ESTADSTICA I

(Informtica de Sistemas)
Primera Prueba Presencial. Segunda Semana.
Curso 2001-2002.
1. Con el n de seleccionar el sistema ms rpido
de almacenamiento y recuperacin de datos
para un determinado tipo de procesos, se rea-
liz un experimento consistente en hacer 4 prue-
bas con cada uno de los tres sistemas conside-
rados: CD, Disco y Cinta. Los tiempos en
minutos requeridos en cada ocasin se ree-
jan en la siguiente tabla
CD Disco Cinta
8.7 7.0 7.2
9.3 6.4 9.1
7.9 9.8 7.5
8.0 8.2 7.7
Suma 33.9 31.4 31.5
Media 8.475 7.850 7.875
Varianza 0.429 2.250 0.709
Utilizando un nivel de signicacin = 0.01,
contraste la hiptesis de igualdad de los tiempos
medios.
Datos auxiliares: La variabilidad total es
11.167. F
2;11;0.01
= 7. 2057, F
2;9;0.01
= 8. 0215,
F
3;9;0.01
= 6. 9919
2. Un programa se puede ejecutar en uno
cualquiera de dos perifricos A y B, de acuerdo
con el siguiente protocolo: en un primer intento
se elige uno de los dos perifricos al azar; si est
operativo, el programa se ejecuta desde l; si no
lo est, se intenta ejecutar el programa desde el
otro perifrico; si ste no est operativo el pro-
grama se queda sin ejecutar. Cada perifrico
est operativo o no con independencia del es-
tado del otro. Las probabilidades de estar ope-
rativo son: 0.9 para A y 0.6 para B.
(a) Determnese la probabilidad de que el pro-
grama no se ejecute.
(b) Si el programa se ha ejecutado, cul es
la probabilidad de que haya sido en el se-
gundo intento?

NO se permite el uso de CALCULADORA. No se exige


precisin en los clculos; puede efectuar los redondeos que
considere oportunos.
3. Del tiempo que funciona cierta componente de
un sistema hasta que comienza a presentar fa-
llos sistemticos se sabe que sigue una distribu-
cin normal. A n de estimar el tiempo medio
de funcionamiento a pleno rendimiento, se ob-
servaron 10 de estas componentes obtenindose
los siguientes tiempos en miles de horas de
funcionamiento sin fallos:
1 ,1.5 ,0.8 ,1.2 ,0.9 ,1.1 ,1.4 ,1.3 ,0.7 ,0.1 .
Determnese:
(a) Una estimacin puntual para el parmetro
de inters.
(b) Un intervalo de conanza, al 90%, para el
tiempo medio de funcionamiento.
Datos auxiliares: z
0.05
= 1.645 , t
9;0.05
=
1.833 , t
10;0.05
= 1.812 , t
9;0.1
= 1.383
4. Tratando de describir estadsticamente una
coleccin de 30 pares (X, Y ), se obtuvieron los
siguientes resultados:
P
i
x
i
= 15 ,
P
i
y
i
= 30 ,
P
i
y
2
i
= 190 ,
P
i
(x
i
x) (y
i
y) = 30 ,
P
i
(x
i
x)
2
= 10
.
(a) Calcule la recta de regresin de Y sobre X
y el coeciente de correlacin.
(b) Compare la varianza residual con la va-
rianza de Y . Qu se puede concluir?
1
ESTADSTICA I

(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Primera Prueba Presencial (Primera Semana)
1. Extraemos tres dgitos al azar entre el 0 y el 9
para formar una clave. Se pide:
(a) Calcular la probabilidad de que la clave
tenga al menos dos cifras iguales.
(b) Calcular la probabilidad de que, si la clave
obtenida es un nmero par, no sea superior
a 100.
2. La lectura registrada por cierto aparato de me-
dida es una variable aleatoria X con distribu-
cin normal. En una muestra de doce lecturas,
tomadas al azar, se han observado los siguientes
valores de la variable X :
10, 15, 11, 12, 8, 13, 16, 5, 14, 5, 6, 5
(a) Dar una estimacin puntual de la media de
X. Justifquese la eleccin del estimador
que se utiliza.
(b) Obtener un intervalo de conanza, al 95%,
para la media de X.
Datos auxiliares: t
12;0.025
= 2.179 ,
t
11;0.05
= 1.796 , z
0.025
= 1.96 , t
11;0.025
=
2.201, z
0.05
= 1.645

NO se permite el uso de CALCULADORA.


3. Se dispone de los siguientes datos referentes a
14 observaciones del par (X, Y ):
P
x
i
= 517
P
y
i
= 346
1
14
P
x
2
i
= 2792.5
1
14
P
y
2
i
= 1246.7
1
14
P
x
i
y
i
= 1844.6
Se pide:
(a) Calcular la pendiente de la recta de regre-
sin de Y sobre X.
(b) Obtener una medida del ajuste de dicha
recta a la nube de puntos.
Datos auxiliares: Coeciente de correlacin
r = 0.98
4. Se piensa que el tiempo de respuesta de un
equipo informtico, cuando se le solicita cierto
tipo de informacin, sigue una distribucin ex-
ponencial con parmetro = 1 seg. (por tanto,
la densidad es f(x) = e
x
, para x 0). Con-
traste dicha hiptesis utilizando los siguientes
datos:
I Los puntos 0.22, 0.51, 0.92, 1.61 determinan 5
clases equiprobables para la densidad citada.
I La frecuencia observada en cada una de estas
clases, en un muestreo aleatorio de tamao 40,
es:
6, 8, 10, 7, 9
respectivamente.
Datos auxiliares:
2
5;0.025
= 12.833;

2
4;0.05
= 9.488 ;
2
5;0.05
= 11.07
1
ESTADSTICA I

(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Primera Prueba Presencial (Segunda Semana)
1. Para estudiar la posible relacin entre dos varia-
bles, X e Y , se registraron los valores de dichas
variables en una muestra aleatoria formada por
20 individuos. De la informacin recogida se
obtuvieron los siguientes datos estadsticos:
1
20
P
x
i
= 53.69
1
20
P
y
i
= 58.81
1
20
P
x
2
i
= 2948.82
1
20
P
y
2
i
= 3505.15
1
20
P
x
i
y
i
= 3197.39
Suponiendo un modelo de regresin lineal, se
puede concluir, con un nivel de signicacin
= 0.05, que la pendiente de la recta de Y
sobre X es positiva?
Datos auxiliares: t
18;0.05
= 1.734 , t
20;0.025
=
2.086 ; la estimacin insesgada de la varianza

2
vale 31.36 ; cuando
1
= 0,

1
S
R
q
1
nv
x
t
n2
.
2. La distribucin del error de medida de cierto
aparato es una variable aleatoria con distribu-
cin normal de media y varianza desconocidas.
En 10 mediciones, tomadas al azar, se obser-
varon los siguientes errores (expresados en la
unidad de medida correspondiente):
8, 10, 11, 10, 12, 10, 9, 8, 13, 9
(a) Obtener un intervalo de conanza, al 90%,
para el error de medida medio.
(b) Si la varianza del error de medida es
2
=
2.5 , obtener un nuevo intervalo, con el
mismo nivel de conanza, para la media
del error de medida. Comprelo con el
obtenido en el apartado anterior.
Datos auxiliares: z
0.1
= 1.28 , t
10;0.05
=
1.812 , z
0.05
= 1.645 , t
9;0.05
= 1.833 , t
9;0.1
=
1.383 , t
10;0.1
= 1.372

NO se permite el uso de CALCULADORA.


3. Un algoritmo de bsqueda inspecciona una lista
de 1000 registros a n de localizar un registro
determinado. El algoritmo emplea un proce-
dimiento secuencial de bsqueda: recorre la
lista de izquierda a derecha, comprobando si
cada registro coincide con el que busca, hasta
que lo encuentra. Se pide:
(a) Calcular la probabilidad de que lo encuen-
tre en 6 intentos.
(b) Calcular la probabilidad de que tenga que
realizar k intentos.
(c) Determinar el nmero medio de intentos
que realiza.
4. A partir de una muestra de 26 observaciones de
la variable X que toma valores entre 320 y
430, se obtuvo el siguiente diagrama de tallos
y hojas:
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4
(a) Reproduzca las 10 primeras observaciones
(en la ordenacin de menor a mayor).
(b) Dnde est situada la mediana de la dis-
tribucin? Qu variacin experimentara
dicha medida de centralizacin si el m-
ximo de la distribucin aumentara su valor
en 10 unidades?
(c) Sabiendo que el valor medio es 370.7,
cmo medira la dispersin de los datos
respecto a este valor central? (No se re-
quiere realizar los clculos)
1
ESTAD

ISTICA I (SISTEMAS)
Profesores: Hilario Navarro. Jorge Martn
DEPARTAMENTO DE ESTAD

ISTICA,
INVESTIGACI

ON OPERATIVA Y C

ALCULO
NUM

ERICO
Soluciones a los problemas del examen.
Primera prueba presencial. Curso 2002-2003
Soluciones a los problemas del examen. 1
a
P. Presencial 1
Problema 1. Primera semana. Extraemos tres dgitos al azar entre el 0
y el 9 para formar una clave. Se pide:
(a) Calcular la probabilidad de que la clave tenga al menos dos cifras iguales.
(b) Calcular la probabilidad de que, si la clave obtenida es un n umero par, no
sea superior a 100.
Soluci on
(a) Se pueden formar un total de 10
3
claves con los dgitos del 0 al 9.
Denotaremos por A el suceso
A = la clave tiene al menos dos cifras iguales
Vamos a calcular la probabilidad del complementario
A
c
= todas las cifras que forman la clave son distintas
Hay 10 9 8 claves favorables al suceso A
c
; ya que la cifra de las centenas
puede ser uno cualquiera de los diez dgitos, la de las decenas uno de los
nueve restantes y la de las unidades uno cualquiera de los ocho que no
ocuparon el lugar de las centenas y decenas.
10 9 8

La probabilidad del complementario es P(A
c
) =
10 9 8
10
3
; de donde se
sigue la probabilidad pedida:
P(A) = 1 P(A
c
) = 1
10 9 8
10
3
= 1
18
25
=
7
25
.
(b) Vamos a resolver el problema utilizando dos metodos.
Metodo 1. El enunciado nos informa sobre el resultado del experimento: la
clave obtenida es un n umero par. Con esta informaci on la incertidumbre
se modica; de entrada excluiramos todas las claves impares. Por tanto,
el espacio muestral cambia y queda restringido al conjunto de todas las
claves pares entre la 0 0 0 y la 9 9 9 ; un total de 500, es decir
= {Conjunto de claves pares entre la 0 0 0 y la 9 9 9 }
2 Estadstica I (Sistemas). UNED. Curso 2002-2003
De todas ellas hay un total de 51 que no superan a 100; todos los pa-
res comprendidos entre el 0 cuya clave es 0 0 0 y el 100 con clave
1 0 0 . Consecuentemente, la probabilidad pedida ser a 51/500.
Metodo 2. Se considera el espacio muestral inicial que est a formado por el
conjunto de todas las claves comprendidas entre el 0 y el 999:
= {Conjunto de claves entre la 0 0 0 y la 9 9 9 }
A continuaci on, se consideran los sucesos
A = la clave obtenida no supera a 100
B = la clave obtenida es un n umero par
Nos est an pidiendo calcular la probabilidad condicionada
P(A|B) =
P(A B)
P(B)
.
Del conjunto de todas las claves, un total de 1000, hay 51 que son pares
menores o iguales que 100; con lo cual se tiene que P(A B) =
51
1000
.
Por otro lado, hay un total de 500 claves que son pares; luego se obten-
dr a que P(B) =
500
1000
.
Por tanto, la probabilidad pedida es
P(A|B) =
51/1000
500/1000
=
51
500
.

Problema 2. Primera semana. La lectura registrada por cierto aparato


de medida es una variable aleatoria X con distribuci on normal. En una muestra
de doce lecturas, tomadas al azar, se han observado los siguientes valores de la
variable X.
10 15 11 12 8 13 16 5 14 5 6 5
(a) Dar una estimaci on puntual de la media de X. Justifquese la elecci on del
estimador que se utiliza.
(b) Obtener un intervalo de conanza, al 95 %, para la media de X.
Soluciones a los problemas del examen. 1
a
P. Presencial 3
Soluci on
(a) Para estimar la media de X, utilizamos la media muestral:

X =

n
i=1
X
i
n
.
Se propone este estimador porque es insesgado para el par ametro media de
la variable poblacional X que se desea estimar. Con la muestra obtenida,
la estimaci on resulta:
x =
10 + 15 + 11 + 12 + 8 + 13 + 16 + 5 + 14 + 5 + 6 + 5
12
= 10
(b) Puesto que la variable aleatoria poblacional es normal de varianza desco-
nocida, la cantidad pivotal que utilizamos para construir el intervalo de
conanza pedido es la basada en la distribuci on t de Student, que elimina
el efecto de la varianza poblacional:
U =

X
S/

n
t
n1
donde
es la media de la variable X.

X es la media muestral. En este caso la media muestral es 10.


S
2
es la cuasivarianza muestral. En la muestra obtenida S = 4.1.
n es el tama no muestral. En este caso n = 12.
En primer lugar, encontramos el intervalo que contiene a U con una pro-
babilidad igual al nivel de conanza 0.95. Puesto que U tiene distribuci on
t con 11 grados de libertad, el problema se reduce a buscar los extremos de
un intervalo que contenga a una distribuci on t
11
con una probabilidad de
0.95. Los extremos del intervalo, obtenidos de las tablas de la distribuci on
t
11
, son t
11;0.025
= 2.201 y t
11;0.025
= 2.201; ya que, por la simetra de
la densidad de la distribuci on t (vease la gura 1), la probabilidad del in-
tervalo (2.201, ) es 0.025, la del (, 2.201) es 0.025 y la del intervalo
(2.201, 2.201) es 0.95 ( area sombreada de la gura 1).
2.201 2.201
Figura 1: Funci on de densidad de una t
11
4 Estadstica I (Sistemas). UNED. Curso 2002-2003
Ahora que conocemos el intervalo, el resto del ejercicio es un sencillo c alcu-
lo matem atico. Dado que
0.95 = P(2.201

X
S/

12
2.201) = P(2.201
S

12


X 2.201
S

12
),
despejando en la desigualdad anterior la media , se obtiene que
_

X 2.201
S

12
,

X + 2.201
S

12
_
es un intervalo aleatorio que cubre a con probabilidad 0.95.
Una vez que se ha extrado la muestra, el intervalo anterior deja de ser
aleatorio, ya que los estimadores se sustituyen por sus valores en la mues-
tra. Para la muestra extrada el intervalo de conanza que resulta es
_
10 2.201
4.1

12
, 10 + 2.201
4.1

12
_
.

Problema 3. Primera Semana. Se dispone de los siguientes datos refe-


rentes a 14 observaciones del par (X, Y ):

x
i
= 517

y
i
= 346
1
14

x
2
i
= 2792.5
1
14

y
2
i
= 1246.7
1
14

x
i
y
i
= 1844.6
Se pide:
(a) Calcular la pendiente de la recta de regresi on de Y sobre X.
(b) Obtener una medida del ajuste de dicha recta a la nube de puntos.
Datos auxiliares: Coeciente de correlaci on r = 0.98
Soluci on
(a) La pendiente de la recta de regresi on de Y sobre X viene dada por el
cociente
cov
x,y
v
x
=
1
n

n
i=1
x
i
y
i
x y
1
n

n
i=1
x
2
i
x
2
o, alternativamente,
cov
x,y
v
x
= r
_
v
y
v
x
Soluciones a los problemas del examen. 1
a
P. Presencial 5
Sustituyendo en la primera expresi on queda
1844.6
_
517
14
_ _
346
14
_
2792.5
_
517
14
_
2
(b) La varianza residual se dene como el error cuadr atico medio cometido
con la recta de regresi on de Y sobre X. Entonces, su valor nos dar a una
medida del ajuste de dicha recta a la nube de puntos. Con los datos del
enunciado obtenemos
v
y
=
1
n
n

i=1
y
2
i
y
2
= 1246.7
_
346
14
_
2
= 635.9
y
V arianza residual = 635.9
_
1 0.98
2
_
= 25.18
Sin embargo, si queremos una medida del error con mayor capacidad de
interpretaci on, deberemos calcular el valor relativo dado por el cociente
V arianza residual
v
y
= 1 r
2
o, equivalentemente, tomar el coeciente r
2
como una medida del grado
de ajuste: un valor pr oximo a 1 reejar a un buen ajuste y un valor cer-
cano al 0 indicar a la cualidad contraria. En denitiva, podramos calcular
directamente
r
2
= 0.96
concluyendo que, en este caso, el ajuste es bastante bueno.

Problema 4. Primera semana. Se piensa que el tiempo de respuesta de


un equipo inform atico, cuando se le solicita cierto tipo de informaci on, sigue
una distribuci on exponencial con par ametro = 1 seg. (por tanto, la densidad
es f(x) = e
x
, para x 0). Contraste dicha hip otesis utilizando los siguientes
datos:
Los puntos 0.22, 0.51, 0.92, 1.61 determinan 5 clases equiprobables para la
densidad citada.
La frecuencia observada en cada una de estas clases, en un muestreo
aleatorio de tama no 40, es:
6, 8, 10, 7, 9
respectivamente.
Datos auxiliares:
2
5;0.025
= 12.833;
2
4;0.05
= 9.488 ;
2
5;0.05
= 11.07
Soluci on
6 Estadstica I (Sistemas). UNED. Curso 2002-2003
Comparamos las frecuencias observada y esperada mediante el estadstico

2
=

5
i=1
(O
i
e
i
)
2
e
i
. Los resultados se muestran en la siguiente tabla
Clases O
i
e
i
(O
i
e
i
)
2 (O
i
e
i
)
2
e
i

5
i=1
(O
i
e
i
)
2
e
i
Menores que 0.22 6 8 4 4/8 1.25
0.22 0.51 8 8 0 0
0.51 0.92 10 8 4 4/8
0.92 1.61 7 8 1 1/8
Mayores que 1.61 9 8 1 1/8
El procedimiento que vamos a aplicar consiste en rechazar la hip otesis de interes
para el nivel de signicaci on si se satisface la desigualdad
5

i=1
(O
i
e
i
)
2
e
i
>
2
51;
En nuestro caso, el estadstico proporciona el valor 1.25 y, seg un los datos auxi-
liares,
2
4;0.05
= 9.488. Como consecuencia, no hay suciente evidencia al nivel
de signicaci on 0.05 contra la hip otesis de que el tiempo de respuesta sigue
una distribuci on exponencial con par ametro = 1 seg.

Problema 1. Segunda Semana. Para estudiar la posible relaci on entre dos


variables, X e Y , se registraron los valores de dichas variables en una muestra
aleatoria formada por 20 individuos. De la informaci on recogida se obtuvieron
los siguientes datos estadsticos:
1
20

x
i
= 53.69
1
20

y
i
= 58.81
1
20

x
2
i
= 2948.82
1
20

y
2
i
= 3505.15
1
20

x
i
y
i
= 3197.39
Suponiendo un modelo de regresi on lineal, se puede concluir, con un nivel
de signicaci on = 0.05, que la pendiente de la recta de Y sobre X es positiva?
Datos auxiliares: t
18;0.05
= 1.734 , t
20;0.025
= 2.086 ; la estimaci on inses-
gada de la varianza
2
vale 31.36 ; cuando
1
= 0,

1
S
R
_
1
nv
x
t
n2
.
Soluciones a los problemas del examen. 1
a
P. Presencial 7
Soluci on
La pregunta alude al contraste
H
0
:
1
0 , H
1
:
1
> 0
Entonces, al nivel = 0.05, rechazaremos la hip otesis nula concluyendo que

1
es positiva cuando

1
S
R
_
1
20v
x
> t
18;0.05
Con los datos de este ejercicio resulta:

1
=
cov
x,y
v
x
=
3197.3953.6958.81
2948.8253.69
2
= 0.60
S
R
=

31.36 = 5.6
_
1
20(2948.8253.69
2
)
= 0.03
y, como consecuencia,

1
S
R
_
1
nv
x
=
0.6
5.6 0.03
= 3.57
Dado que t
18;0.05
= 1.734, los datos nos permiten concluir que la pendiente
1
es positiva.

Problema 2. Segunda semana. La distribuci on del error de medida de


cierto aparato es una variable aleatoria con distribuci on normal de media y
varianzas desconocidas. En 10 mediciones, tomadas al azar, se observaron los
siguientes errores (expresados en la unidad de medida correspondiente).
8 10 11 10 12 10 9 8 13 9
(a) Obtener un intervalo de conanza, al 90 %, para el error de medida medio.
(b) Si la varianza del error de medida es
2
= 2.5 obtener un nuevo intervalo
de conanza, con el mismo nivel de conanza, para la media del error de
medida. Comp arelo con el obtenido en el apartado anterior.
Soluci on
(a) Puesto que el error de medida sigue una distribuci on normal con varianza
desconocida, la cantidad pivotal que se utiliza para obtener el intervalo de
conanza es
U =

X
S/

n
t
n1
siendo
8 Estadstica I (Sistemas). UNED. Curso 2002-2003
la media del error de medida.

X la media muestral.
S
2
la cuasivarianza muestral.
n el tama no muestral.
En este caso, para la muestra extrada de tama no n = 10, se tiene que
x =
8 + 10 + 11 + 10 + 12 + 10 + 9 + 8 + 13 + 9
10
= 10
S
2
=
1
n 1
n

i=1
(x
i
x)
2
=
(8 10)
2
+ (10 10)
2
+ + (9 10)
2
9
= 2.67
Emplearemos el mismo procedimiento que en el problema 2 de la primera
semana. Ahora el tama no muestral es 10 y la cantidad pivotal U tiene
distribuci on t con 9 grados de libertad. Puesto que la probabilidad de que
U este comprendida entre los valores t
9;0.05
= 1.833 y t
9;0.05
= 1.833,
obtenidos de las tablas de la t
9
, es 0.90 area sombreada de la gura 2
se obtendr a que
0.90 = P(1.833

X
S/

10
1.833) = P(1.833
S

10


X 1.833
S

10
).
Despejando en la desigualdad anterior , resulta que
_

X 1.833
S

10
,

X + 1.833
S

10
_
es un intervalo aleatorio que cubre a con probabilidad 0.90.
1.833 1.833
Figura 2: Funci on de densidad de una t
9
Para la muestra obtenida, el intervalo con nivel de conanza del 90 % ser a
_
10 1.833

2.67

10
, 10 + 1.833

2.67

10
_
.
Soluciones a los problemas del examen. 1
a
P. Presencial 9
(b) Puesto que ahora la varianza de la poblaci on es
2
= 2.5 conocida, no
recurrimos, como hacamos en el apartado anterior, a la distribuci on t,
que elimina el efecto de la varianza. Utilizaremos la cantidad pivotal con
distribuci on normal dada por
V =

X
/

n
N(0, 1)
donde
es la media del error de medida.

X es la media muestral. Para la muestra extrada x = 10.

2
es la varianza de la poblaci on. En este caso
2
= 2.5
n es el tama no muestral.
Al igual que en el apartado anterior, encontramos el intervalo que contiene
a V con una probabilidad de 0.90. La distribuci on N(0, 1), que rige su
comportamiento aleatorio, nos abre el camino. La probabilidad de que
V , o equivalentemente, una N(0, 1), este comprendida entre los valores
z
0.05
= 1.645 y z
0.05
= 1.645, obtenidos de las tablas de la normal, es
0.90 ( area sombreada de la gura 3).
1.645 1.645
Figura 3: Funci on de densidad de una N(0, 1)
Por tanto, se tendr a que
0.90 = P(1.645

2.5/

10
1.645) = P(1.645

2.5

10


X 1.645

2.5

10
)
Despejando en la desigualdad, resulta el siguiente intervalo de extremos
aleatorios que cubre al error medio de medida con probabilidad 0.90
_

X 1.645

2.5

10
,

X + 1.645

2.5

10
_
Reemplazado el valor de la media muestral que resulta de la muestra
extrada, obtendremos el siguiente intervalo con nivel de conanza del
90 %:
10 Estadstica I (Sistemas). UNED. Curso 2002-2003
_
10 1.645

2.5

10
, 10 + 1.645

2.5

10
_
.
Puesto que para la muestra extrada S
2

2
, las longitudes de ambos
intervalos est an caracterizadas por los cuantiles t
9;0.05
y z
0.05
de las dis-
tribuciones t y normal; el primero es mayor que el segundo ya que la
distribuci on t tiene colas m as pesadas que la normal. Esto explica que el
intervalo de conanza basado en la t tenga mayor longitud que el basado
en la normal.

Problema 3. Segunda semana. Un algoritmo de b usqueda inspecciona


una lista de 1000 registros a n de localizar un registro determinado. El al-
goritmo emplea un procedimiento secuencial de b usqueda: recorre la lista de
izquierda a derecha, comprobando si cada registro coincide con el que busca,
hasta que lo encuentra. Se pide:
(a) Calcular la probabilidad de que lo encuentre en 6 intentos.
(b) Calcular la probabilidad de que tenga que realizar k intentos.
(c) Determinar el n umero medio de intentos que realiza.
Soluci on
(a) Sea X la variable aleatoria
X = n umero de intentos hasta encontrar el registro buscado.
Supongamos que ponemos todos los registros en la:

El algoritmo realizar a seis intentos cuando no localice el registro que busca
en las cinco primeras posiciones de la la y lo encuentre en la sexta.
Si denotamos por A
i
el suceso el registro buscado ocupa la iesima
posici on de la la la probabilidad pedida ser a
P(X = 6) = P(A
c
1
A
c
2
A
c
3
A
c
4
A
c
5
A
6
).
Por la regla de la multiplicaci on para el c alculo de la probabilidad de la
intersecci on de sucesos (secci on 6 del captulo 3 del texto base), se tiene
que
Soluciones a los problemas del examen. 1
a
P. Presencial 11
P(X = 6) = P(A
c
1
)P(A
c
2
|A
c
1
)P(A
c
3
|A
c
1
A
c
2
) P(A
6
|A
c
1
A
c
2
A
c
3
A
c
4
A
c
5
).
Por tanto, la probabilidad pedida ser a
P(X = 6) =
_
999
1000
__
998
999
__
997
998
__
996
997
__
995
996
__
1
995
_
=
1
1000
(b) De la misma manera, la probabilidad de realizar k intentos es la pro-
babilidad de que el algoritmo no localice el registro en los k 1 prime-
ros lugares de la la y lo encuentre en el k-esimo. Por tanto, para cada
k = 1, 2, . . . , 1000
P(X = k) =
_
999
1000
_

_
1000 k + 1
1000 k + 2
__
1
1000 k + 1
_
=
1
1000
El c alculo anterior se generaliza sin dicultad a una lista con n registros.
As, para cada k = 1, 2, . . . , n, se tiene que
P(X = k) =
_
n 1
n
__
n 2
n 1
_

_
n k + 1
n k + 2
__
1
n k + 1
_
=
1
n
Sin embargo, para calcular P(X = k) en el caso general, preferimos utilizar
el siguiente razonamiento que en matem aticas llamamos recurrente y que
se sigue del procedimiento secuencial de b usqueda.
Denotaremos por p
k,n
la probabilidad de localizar el registro buscado en k
intentos con una lista de n registros y por A el suceso el primer registro
de la la es distinto al buscado.
Para localizar el registro en k intentos, debe ocurrir A, y a continuaci on,
se han de realizar k 1 intentos en una nueva lista con n 1 registros
(todos menos el primero). Por tanto, la probabilidad del suceso {X = k}
ser a
p
k,n
= P(X = k) =
n 1
n
p
k1,n1
: k = 2, 3, . . . , n
de donde se sigue la ecuaci on recurrente
np
k,n
= (n 1)p
k1,n1
(1)
12 Estadstica I (Sistemas). UNED. Curso 2002-2003
Teniendo en cuenta la condici on inicial: p
1,i
=
1
i
(en una lista con i regis-
tros la probabilidad de localizar el buscado en el primer intento es 1/i),
basta aplicar la ecuaci on anterior sucesivamente para obtener que
np
k,n
= (n1)p
k1,n1
= (n2)p
k2,n2
= = (nk+1)p
1,nk+1
= 1
de donde se sigue que
p
k,n
= P(X = k) =
1
n
: k = 1, 2, . . . , n.
(c) Ya que hemos sido capaces de generalizar el problema, vamos a seguir
utilizando la lista de n registros.
El n umero medio de intentos que realiza el algoritmo es la media de la
variable aleatoria X.
E{X} =
n

k=1
kP(X = k) =
1
n
n

k=1
k.
Calcular este sumatorio es un ejercicio sencillo si se tiene en cuenta que la
suma de cada dos terminos del sumatorio que equidistan de los sumandos
extremos es igual a la suma de estos:
1 2 3 n 2 n 1 n
n n 1 n 2 3 2 1
n + 1 n + 1 n + 1 n + 1 n + 1 n + 1
De lo anterior se sigue que 2

n
k=1
k = n(n + 1), es decir,
E{X} =
1
n
n

k=1
k =
n + 1
2
.
Cuando n = 1000, el n umero medio de intentos es 1001/2.
El razonamiento recurrente nos proporciona de nuevo un procedimiento
de c alculo de la media que evita cuentas engorrosas como las anteriores.
Denotamos por
n
el n umero medio de intentos en una lista con n registros.
Si el registro buscado est a en la primera posici on de la la, lo cual ocurre
con probabilidad 1/n, se realiza un intento y se acaba la b usqueda. En
cambio, si no est a, lo cual ocurre con probabilidad
(n 1)
n
, contamos un
intento y comenzaremos a buscar en una lista con n 1 registros; con lo
que, en este caso, el n umero medio de intentos ser a 1 +
n1
.
Soluciones a los problemas del examen. 1
a
P. Presencial 13
De este razonamiento resulta la siguiente ecuaci on recurrente:

n
=
1
n
+
n 1
n
(1 +
n1
) (2)
con la condici on inicial
1
= 1 (en una lista con un solo registro se localiza
el buscado en un intento).
Poniendo Q
n
= n
n
, la ecuaci on recurrente 2 se transforma en
Q
n
= Q
n1
+n con Q
1
=
1
= 1 (3)
Es posible que no sepas resolver esta ecuaci on en diferencias. Realmente
no lo necesitas, ya que el enunciado tan s olo te pide que encuentres
1000
=
Q
1000
1000
. Seguro que s sabes programar un bucle que realice el c alculo. Las
siguientes cinco lneas de c odigo te resultar an familiares.
Q=1
for n = 2 to 1000
Q=Q+n
next n
Q/1000
Para los acionados a resolver problemas, vamos a solucionar 3.
Ensayamos para Q
n
una soluci on de la forma: Q
n
= a+bn+cn
2
. Partiendo
de la condici on inicial, basta aplicar la recurrencia dos veces para obtener
Q
1
= 1 Q
2
= 3 Q
3
= 6
Sustituyendo los valores n = 1, n = 2 y n = 3 en la soluci on general, se
llega al siguiente sistema de ecuaciones.
a +b +c = 1
a + 2b + 4c = 3
a + 3b + 9c = 6
La soluci on del sistema es a = 0, b = 1/2, c = 1/2; con lo que

n
=
Q
n
n
=
1
n
_
n
2
+
n
2
2
_
=
n + 1
2

14 Estadstica I (Sistemas). UNED. Curso 2002-2003


Problema 4. Segunda Semana. A partir de una muestra de 26 obser-
vaciones de la variable X que toma valores entre 320 y 430, se obtuvo el
siguiente diagrama de tallos y hojas:
32 55
33 49
34
35 6699
36 34469
37 03345
38 9
39 2347
40 23
41
42 4
(a) Reproduzca las 10 primeras observaciones (en la ordenaci on de menor a
mayor).
(b) D onde est a situada la mediana de la distribuci on? Que variaci on expe-
rimentara dicha medida de centralizaci on si el m aximo de la distribuci on
aumentara su valor en 10 unidades?
(c) Sabiendo que el valor medio es 370.7, c omo medira la dispersi on de los
datos respecto a este valor central? (No se requiere realizar los c alculos)
Soluci on
(a) Las observaciones pedidas son
325, 325, 334, 339, 356, 356, 359, 359, 363, 364
(b) La mediana de la distribuci on est a situada en el punto
369 + 370
2
= 369.5
Si el m aximo de la distribuci on, que es 424, aumentara su valor en 10
unidades, la mediana estara situada en el mismo punto en 369.5, ya
que seguiramos teniendo el mismo n umero de observaciones a cada lado.
(c) Mediante la desviaci on tpica, que se dene como la raz cuadrada positiva
de la varianza. Para el c alculo de esta ultima, se puede aplicar directamente
la denici on:
v
x
=
1
n

i
(x
i
x)
2
Soluciones a los problemas del examen. 1
a
P. Presencial 15
o, equivalentemente,
v
x
=
1
n

i
x
2
i
x
2
=
1
26
_
325
2
+ 325
2
+ 334
2
+... + 424
2
_
370.7
2

ESTADSTICA I

(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Septiembre (Original)
1. Se est realizando un estudio sobre los fallos
de un dispositivo electrnico. Este elemento se
puede montar en dos posiciones diferentes y hay
cuatro tipos de fallos posibles. Un muestreo
aleatorio proporciona la siguiente distribucin
de frecuencias:
Tipo de fallo
Posicin de Montaje A B C D
1 14 18 8 20
2 6 12 12 10
Concluira que el tipo de fallo es independiente
de la posicin de montaje?
Datos auxiliares:
t
3;0.025
= 3.182 ,
8;0.05
= 15.507 ,

3;0.05
= 7.815, z
0.05
= 1.645
2. Cierto aparato registra el nivel de saturacin
de la red elctrica en una comarca. El error
relativo porcentual de la medida dada por el
aparato es una variable aleatoria continua X
con funcin de distribucin
F(x) =

0 si x < 0
1 (1 x)
3
si 0 x 1
1 si x > 1
Determinar:
(a) La funcin de densidad de la variable X.
(b) La probabilidad de que una medida regis-
trada por el aparato tenga un error entre
el 0.1% y el 0.2%.
(c) El error relativo medio.

NO se permite el uso de CALCULADORA. Aproxime los


resultados de las operaciones para facilitar el clculo. Deje
indicadas las operaciones no elementales.
3. La cantidad en kg de cereal cosechada por
m
2
en una regin es una variable aleatoria con
distribucin normal. En 25 localizaciones elegi-
das al azar se obtuvo que la cantidad media
cosechada por m
2
fue de 18.5 kg con una cua-
sivarianza de 1 kg
2
. Contrastar la hiptesis de
que la cantidad media por m
2
es de 18 kg, frente
a la alternativa de que es mayor. Tmese un
nivel de signicacin de = 0.01
Datos auxiliares:
z
0.01
= 2.33, t
24;0.01
= 2.192, t
25;0.01
= 2.485
4. Para cada una de las condiciones que se indican
a continuacin, represente una nube de puntos
(X,Y) que sea compatible con ella:
Covarianza negativa
Pendiente de la recta de regresin de Y
sobre X positiva
Correlacin prxima a 1.
Correlacin nula.
(Nota: Justique brevemente cada represen-
tacin)
ESTAD

ISTICA I (SISTEMAS)
Profesores: Hilario Navarro. Jorge Martn
DEPARTAMENTO DE ESTAD

ISTICA,
INVESTIGACI

ON OPERATIVA Y C

ALCULO
NUM

ERICO
Soluciones a los problemas del examen.
Convocatoria de septiembre. Curso 2002-2003
Soluciones a los problemas del examen. Convocatoria de septiembre 1
Problema 1. Se est a realizando un estudio sobre los fallos de un dispositivo
electr onico. Este elemento se puede montar en dos posiciones diferentes y hay
cuatro tipos de fallos posibles. Un muestreo aleatorio proporciona la siguiente
distribuci on de frecuencias:
Tipo de fallo
Posici on de Montaje A B C D
1 14 18 8 20
2 6 12 12 10
Concluira que el tipo de fallo es independiente de la posici on de montaje?
Datos auxiliares:
t
3;0.025
= 3.182,
8;0.05
= 15.507,
3;0.05
= 7.815, z
0.05
= 1.645
Soluci on
Rechazaremos la hip otesis nula (Posici on de Montaje independiente del Tipo
de Fallo), con un nivel de sgnicaci on , si
4

j=1
2

i=1
(o
ij
e
ij
)
2
e
ij
>
2
(21)(41);
El enunciado nos proporciona la frecuencia observada (o
ij
); multiplicando las
correspondientes frecuencias marginales y dividiendo por el tama no de la mues-
tra obtenemos la frecuencia esperada bajo la hip otesis nula (e
ij
):
Tipo de fallo
Posici on de Montaje A B C D
1 12 18 12 18 60
2 8 12 8 12 40
20 30 20 30 100
Con estos datos podemos realizar la operaci on (o e)
2
/e para cada celda de la
tabla, resultando:
Tipo de fallo
Posici on de Montaje A B C D
1 4/12 0 16/12 4/18
2 4/8 0 16/8 4/12
Entonces,
4

j=1
2

i=1
(o
ij
e
ij
)
2
e
ij
=
4 + 16 + 4
12
+
16 + 4
8
+
4
18
=
144 + 180 + 16
72
=
340
72
4.7
2 Estadstica I (Sistemas). UNED. Curso 2002-2003
Como 4.7 <
2
3;0.05
= 7.815, concluimos que, con un nivel de signicaci on =
0.05, la condici on de independencia es aceptable.

Problema 2. Cierto aparato registra el nivel de saturaci on de la red electrica


en una comarca. El error relativo porcentual de la medida dada por el aparato
es una variable aleatoria continua X con funci on de distribuci on
F(x) =
_

_
0 si x < 0
1 (1 x)
3
si 0 x 1
1 si x > 1
Determinar:
(a) La funci on de densidad de la variable X.
(b) La probabilidad de que una medida registrada por el aparato tenga un
error entre el 0.1 % y el 0.2 %.
(c) El error relativo medio.
Soluci on
(a) La representaci on gr aca de la funci on de distribuci on F(x) es la que
aparece en la gura 1.
0 1 2 1 2
1
Figura 1: Funci on de distribuci on de la variable aleatoria X
Puesto que la variable X es continua, la funci on de densidad se obtiene
derivando la de distribuci on. Dicha funci on viene dada por
f(x) = F

(x) =
_

_
0 si x < 0
3(1 x)
2
si 0 x 1
0 si x > 1
Su representaci on gr aca es la que aparece en la gura 2.
Soluciones a los problemas del examen. Convocatoria de septiembre 3
0 1 2 1 2
1
2
Figura 2: Funci on de densidad de la variable aleatoria X
(b) El error de medida est a entre el 0.1 % y el 0.2 % cuando 0.1 X 0.2.
Por tanto, la probabilidad pedida ser a
P(0.1 X 0.2) =
_
0.2
0.1
f(x) dx = 3
_
0.2
0.1
(1 x)
2
dx = 0.217.
Esta probabilidad es el area sombreada de la gura 3.
0 1 2 1 2
1
2
Figura 3: P(0.1 X 0.2)
Un modo alternativo de llegar al mismo resultado es haciendo uso de la
funci on de distribuci on dada en el enunciado del problema.
P(0.1 X 0.2) =
_
0.2
0.1
f(x) dx =
_
0.2

f(x) dx
_
0.1

f(x) dx
= F(0.2) F(0.1) = 1 (1 0.2)
3
(1 (1 0.1)
3
) = 0.217.
(c) Finalmente, en este apartado nos est an pidiendo la media de la variable
aleatoria X que mide el error, la cual viene dada por
E{X} =
_

xf(x) dx = 3
_
1
0
x(1x)
2
dx = 3
_
x
2
2

2x
3
3
+
x
4
4
__
1
0
=
1
4

4 Estadstica I (Sistemas). UNED. Curso 2002-2003


Problema 3. La cantidad en Kg de cereal cosechada por m
2
en una
regi on es una variable aleatoria con distribuci on normal. En 25 localizaciones
elegidas al azar se obtuvo que la cantidad media cosechada por m
2
fue de 18.5
kg con una cuasivarianza de 1 kg. Contrastar la hip otesis de que la cantidad
media por m
2
es de 18 kg, frente a la alternativa de que es mayor. T omese un
nivel de signicaci on de = 0.1.
Datos auxiliares: z
0.01
= 2.33, t
24;0.01
= 2.192, t
25;0.01
= 2.485
Soluci on
El contraste de hip otesis sobre la cantidad media de cereal cosechado por
m
2
viene dado por
H
0
: = 18 H
1
: > 18.
Dado que la cantidad recolectada por m
2
es una variable aleatoria con distri-
buci on normal de varianza desconocida, el estadstico de contraste que debemos
emplear es

X
0
S/

n
t
n1
,
donde

0
: la media poblacional bajo H
0
. En este caso
0
= 18.

X: media muestral. Para la muestra extrada



X = 25.
S
2
: cuasivarianza muestral. Para la muestra extrada S
2
= 1.
n: tama no muestral. En este caso n = 25.
La regi on crtica del test viene dada por
R =
_

X
0
S/

n
> t
n1;
_
,
siendo el nivel de signicaci on y t
n1;
el cuantil 1 de una distribuci on
t con n 1 grados de libertad, es decir, el valor de la distribuci on que verica
que P(t
n1
t
n1;
) = 1 .
En este caso, para un tama no muestral n = 25 y un nivel de signicaci on
= 0.01, la regi on crtica zona sombreada de la gura 4 viene dada por
R =
_

X 18
S/5
> t
24;0.01
= 2.192
_
.
Para la muestra extrada se obtendr a que

X 18
S/5
=
18.5 18
1/5
= 2.5 R,
lo cual conduce a rechazar la hip otesis nula de que la cantidad media de cereal
cosechada por m
2
es de 18 Kg.
Soluciones a los problemas del examen. Convocatoria de septiembre 5
2.192
Figura 4: Funci on de densidad de una t
24

Problema 4. Para cada una de las condiciones que se indican a continua-


ci on, represente una nube de puntos (X, Y ) que sea compatible con ella:
Covarianza negativa.
Pendiente de la recta de regresi on de Y sobre X positiva.
Correlaci on pr oxima a 1.
Correlaci on nula.
(Nota: Justique brevemente cada representaci on)
Soluci on
Breve justicaci on: La relaci on entre covarianza, coeciente de corre-
laci on lineal y pendiente de la recta de regresi on de Y sobre X se
pone de maniesto en las siguientes igualdades:
Pendiente =
cov
x,y
v
x
= r
_
v
y
v
x
Por tanto, dichos elementos tendr an siempre el mismo signo (gr acas de
la gura 5).
X
Y
X
Y
Figura 5: Covarianza negativa. Pendiente positiva
6 Estadstica I (Sistemas). UNED. Curso 2002-2003
Adem as, el valor del coeciente de correlaci on se reeja en la varianza
residual seg un indica la siguiente expresi on:
varianza residual = v
y
_
1 r
2
_
.
As, el caso de correlaci on pr oxima a 1 se corresponde con un valor pe-
que no para el cociente
varianza residual
v
y
(gr aca izquierda de la gura
6), mientras que un coeciente de correlaci on nulo supone una varianza
residual cercana a su valor m aximo, que es v
y
(gr aca derecha de la gura
6).
X
Y
X
Y
Figura 6: Correlaci on pr oxima a 1. Correlaci on nula

ESTADSTICA I

(402014)
(Informtica de Sistemas)
Curso 2002-2003.
Septiembre (Reserva)
1. Se pretende describir el comportamiento de dos
variables cuantitativas, X e Y, en una poblacin
determinada. Tras un estudio estadstico, se
realiza un informe en el que aparecen los si-
guientes datos:
La recta de regresin de Y sobre X es:
Y = 0.24X + 1.80
Coeciente de correlacin lineal : 0.21
Varianza de Y : 120.5
Varianza residual ( Y sobre X): 10.25
Detecte y comente los errores que contiene este
informe.
2. La variable aleatoria X, que mide en das
el tiempo de funcionamiento de determinados
equipos, hasta que comienzan a presentar fallos,
tiene la siguiente funcin de densidad:
f(x) =

0 si x 0,
1
1000
e
x/1000
si x > 0 .
Determinar:
(a) La probabilidad de que uno de estos
equipos dure al menos 100 das.
(b) La probabilidad de que un equipo que no
ha fallado en 100 das, comience a hacerlo
antes de 500.
(c) Si un sistema est formado por tres de es-
tos equipos conectados en serie, cul es
la probabilidad de que el sistema funcione
correctamente durante al menos 300 das?
Supngase que cada equipo funciona con
independencia de los otros.

NO se permite el uso de CALCULADORA. Aproxime los


resultados de las operaciones para facilitar el clculo. Deje
indicadas las operaciones no elementales.
3. A n de contrastar la hiptesis de igualdad de
varianzas de dos poblaciones normalmente dis-
tribuidas, se obtuvo una muestra aleatoria de
cada una de ellas. Los resultados de ambas
muestras se recogen en la siguiente tabla:
Poblacin 1 10.5 9.5 11 8 9 10
9.8 10.2
Poblacin 2 17 18 16.5 17.2 19 18.5
18.3 17.5 17.8 17.7
Qu evidencia proporcionan los datos acerca
de la hiptesis que se pretende contrastar?
Tmese nivel de signicacin = 0.1 .
Datos auxiliares:
t
16;0.01
= 2.552 , F
7,9;0.1
= 2.5053 , F
7,9;0.05
=
3.2927, F
9,7;0.05
= 3.6767
4. Del anlisis de la varianza de una variable res-
puesta (Y ), que se ha medido bajo 3 condiciones
diferentes, se conocen los siguientes datos:
N
o
de observaciones de cada clase: 10
Media de cada grupo: 8.1 (Grupo 1), 9.5
(Grupo 2) y 9.9 (Grupo 3)
Estadstico F: 0.8
Se pide:
(a) Completar la tabla de anlisis de la
varianza.
(b) Obtener conclusiones a partir de los
datos estadsticos disponibles.
Datos auxiliares:
F
27,2;0.01
= 99.462, F
2,27;0.05
= 3.3541,
F
3,10;0.01
= 6.5523
ESTAD

ISTICA (SISTEMAS)
Profesores: Hilario Navarro. Jorge Martn
DEPARTAMENTO DE ESTAD

ISTICA,
INVESTIGACI

ON OPERATIVA Y C

ALCULO
NUM

ERICO
Soluciones a los problemas de examen.
Primera prueba presencial. Curso 2003-2004
Soluciones a los problemas del examen. 1
a
P. Presencial 1
Problema 1. Primera semana. Partiendo de 10 observaciones del par
(X, Y ), y con el n de estudiar la asociaci on entre dichas variables, se calcularon
la recta de regresi on de Y sobre X y el coeciente de correlaci on muestral,
resultando:
Y = 25.5 + 3.6X ; r = 0.90,
respectivamente. Tambien se sabe que la varianza de X es 16. Se pide:
(a) Calcular la varianza de la variable Y .
(b) Cu anto vale la covarianza entre ambas variables?
Soluci on
(a) La pendiente (pend) de la recta de regresi on de Y sobre X se relaciona con
la varianza de Y a traves de la siguiente igualdad
pend =
cov
x,y
v
x
= r
_
v
y
v
x
Con los datos del enunciado resulta
v
y
=
_
pend
r
_
2
v
x
=
_
3.6
0.9
_
2
16 = 256
(b) Para el c alculo de la covarianza se puede utilizar
cov
x,y
= r

v
x
v
y
o bien,
cov
x,y
= pend v
x
De cualquier modo, se obtiene que
cov
x,y
= 57.6

Problema 2. Primera semana. Con el n de ejecutar un proceso se se-


lecciona uno de tres perifericos A, B y C. Las probabilidades de escoger cada uno
de ellos son: 0.5 para A, 0.3 para B y 0.2 para C. Como resultado de la elecci on,
se pueden producir perturbaciones que detienen la ejecuci on del proceso. Esto
ocurre el 10 % de las veces si el periferico seleccionado fue A, el 20 % si fue B y
el 15 % si fue C.
(a) Hallar la probabilidad de que el proceso no se ejecute.
2 Estadstica (Sistemas). UNED. Curso 2003-2004
(b) Si el proceso se ha ejecutado, cu al es la probabilidad de que lo haya hecho
desde A o B?
Soluci on
(a) Vamos a denotar por A, B, C y E los siguientes sucesos:
A = El periferico seleccionado es el A
B = El periferico seleccionado es el B
C = El periferico seleccionado es el C
E = El proceso se ejecuta
Las probabilidades de los sucesos A, B y C son las probabilidades de
selecci on de cada uno de los perifericos, que vienen dadas por:
P(A) = 0.5 , P(B) = 0.3 , P(C) = 0.2.
El proceso no se ejecutar a cuando se produzca una perturbaci on que lo
detenga. Puesto que las probabilidades de que ocurran estas perturbacio-
nes en cada uno de los perifericos vienen dadas por 0.1, 0.2 y 0.15, se
tendr a que:
P(E
c
|A) = 0.1 , P(E
c
|B) = 0.2 y P(E
c
|C) = 0.15.
Consecuentemente, aplicando el teorema de la probabilidad total se obtie-
ne la probabilidad pedida de que el proceso no se ejecute, dada por
P(E
c
) = P(E
c
|A)P(A) +P(E
c
|B)P(B) +P(E
c
|C)P(C)
= 0.1 0.5 + 0.2 0.3 + 0.15 0.2 = 0.14.
(b) El enunciado nos dice que el proceso se ha ejecutado. Dada esta informa-
ci on, se pide hallar la probabilidad de que la ejecuci on se hubiera realizado
desde el periferico A o B. La probabilidad pedida es una probabilidad con-
dicionada por el suceso que recoge tal informaci on el suceso E. Por
tanto, tendremos que calcular P(A B|E). Se sabe que:
P(A B|E) =
P((A B) E)
P(E)
=
P(A E) +P(B E)
P(E)
=
P(E|A)P(A) +P(E|B)P(B)
P(E)
.
Soluciones a los problemas del examen. 1
a
P. Presencial 3
La probabilidad del suceso E se obtiene del apartado anterior:
P(E) = 1 P(E
c
) = 1 0.14 = 0.86.
Las probabilidades condicionadas del numerador son:
P(E|A) = 1 P(E
c
|A) = 0.9 y P(E|B) = 1 P(E
c
|B) = 0.8.
Por tanto,
P(A B|E) =
0.9 0.5 + 0.8 0.3
0.86
=
0.45 + 0.24
0.86
=
69
86
0.8023256.
Otra manera de llegar al mismo resultado sera mediante el c alculo de la
probabilidad del complementario P(C|E), la cual viene dada por
P(C|E) =
P(C E)
P(E)
=
P(E|C)P(C)
P(E)
=
0.85 0.2
0.86
=
17
86
0.1976744,
de donde P(A B|E) = 1 P(C|E) = 1
17
86
=
69
86
0.8023256.

Problema 3. Primera Semana. Una muestra aleatoria de 200 dgitos


proporcion o los datos que se recogen en la siguiente tabla de frecuencias
Dgito Frecuencia
0 10
1 20
2 19
3 21
4 21
5 15
6 21
7 22
8 25
9 26
Contraste la hip otesis de que la muestra procede de una distribuci on en la
que los 10 dgitos son igualmente probables.
4 Estadstica (Sistemas). UNED. Curso 2003-2004
Soluci on
Estamos ante una situaci on que el Texto Base identica como contraste de
la bondad del ajuste (primer caso). La forma de proceder es calcular el valor
del estadstico

2
=
10

i=1
(O
i
e
i
)
2
e
i
y comparar con el dato que nos proporciona la distribuci on
2
9
(9 grados de
libertad) para el nivel de signicaci on seleccionado.
Respecto al c alculo del estadstico, el enunciado nos proporciona la frecuen-
cia observada (O
i
) en una muestra aleatoria de tama no 200, mientras que la
frecuencia esperada (e
i
) bajo la hip otesis de que los 10 dgitos fuesen igualmen-
te probables es, en cada caso, 20. Entonces,
(O
i
e
i
)
2
: 100, 0, 1, 1, 1, 25, 1, 4, 25, 36
y
10

i=1
(O
i
e
i
)
2
e
i
=
194
20
= 9.7
Entre los datos auxiliares encontramos
2
9;0.05
= 16.92; entonces, dado que
9.7 < 16.92
las desviaciones observadas no son signicativas, al nivel = 0.05, y por tanto,
aceptamos la hip otesis de que en la poblaci on los 10 dgitos son equiprobables.

Problema 4. Primera semana. De una poblaci on normal se extrae una


muestra aleatoria de tama no 10, obteniendose las siguientes observaciones:
1, 2, 5, 1, 3, 7, 4, 2, 3, 2
(a) Obtener una estimaci on insesgada de la media poblacional.
(b) Contrastar la hip otesis de que la media poblacional es 3.5, frente a la
alternativa de que es menor. T omese un nivel de signicaci on de = 0.01.
Soluci on
(a) Se sabe que la media muestral

X =
1
n
n

i=1
X
i
es un estimador insesgado
de la media poblacional , ya que E{

X} =
1
n
n

i=1
E{X
i
} = .
Para la muestra extrada la estimaci on viene dada por
Soluciones a los problemas del examen. 1
a
P. Presencial 5
x =
1 + 2 + 5 + 1 + 3 + 7 + 4 + 2 + 3 + 2
10
= 3.
(b) La muestra obtenida ha proporcionado un valor para la media muestral de
x = 3. Se trata de comprobar si ese valor proporciona evidencia estadstica
en favor de la hip otesis de que la media poblacional es = 3.5 o por el
contrario apoya la alternativa de que es inferior.
El problema se plantea en terminos de un contraste de hip otesis en el que
H
0
: = 3.5 H
1
: < 3.5.
Dado que la variable aleatoria poblacional sigue una distribuci on normal
de media y varianza desconocidas, el contraste se lleva a cabo utilizando
la cantidad pivotal

X
0
S/

n
t
n1
,
donde

0
: la media poblacional bajo H
0
. En este caso
0
= 3.5.

X: media muestral.
S
2
: cuasivarianza muestral.
n: tama no muestral.
La regi on crtica del test conjunto de todas las muestras para las que se
rechaza H
0
viene dada por
R =
_
(X
1
, X
2
, . . . , X
n
) :

X
0
S/

n
< c
_
donde el punto crtico c se determina con la condici on del nivel de signi-
caci on, la cual viene dada por:
P
H
0
((X
1
, X
2
, . . . , X
n
) R) = P
_

X
0
S/

n
< c
_
= P(t
n1
< c) = 0.01.
En este caso, para un tama no muestral de n = 10, el punto crtico vale
c = 2.821, ya que para una distribuci on t con 9 grados de libertad se
tiene que P(t
9
< 2.821) = 0.01 (vease la gura 1, en la que el area de
la regi on sombreada coincide con el nivel de signicaci on = 0.01). Por
tanto, la regi on crtica R est a denida por R =
_

X
0
S/

n
< 2.821
_
.
6 Estadstica (Sistemas). UNED. Curso 2003-2004
2.821
0.01
Figura 1: Punto crtico para una t
9
( = 0.01)
Para la muestra extrada, se sabe que x = 3 y que
S
2
=
1
n 1
n

i=1
(X
i


X)
2
=
(1 3)
2
+ (2 3)
2
+ + (2 3)
2
9
=
32
9
,
de donde se sigue que

X
0
S/

n
=
3 3.5
_
32/90
= 1.5
_
10
32
/ R.
Consecuentemente, la muestra extrada no proporciona evidencia estadsti-
ca como para rechazar H
0
y mantendremos la armaci on de que la media
de la poblaci on es 3.5.

Problema 1. Segunda Semana. Con el n de describir un conjunto de


10 observaciones del par de variables (X, Y ), se calcularon la recta de regresi on
de Y sobre X y la correspondiente varianza residual, resultando:
Y = 23.5 10.2X ; V arianza residual = 9,
respectivamente. Se pide:
(a) Cu al es el signo de la covarianza? (Justique la respuesta sin calcular
dicho dato)
(b) Si la varianza residual representa el 19 % de la varianza de Y , cu anto vale
el coeciente de correlaci on muestral?
Soluci on
(a) La relaci on entre la covarianza y la pendiente (pend) de la recta de regre-
si on de Y sobre X se pone de maniesto en la siguiente igualdad
cov
x,y
= pend v
x
Soluciones a los problemas del examen. 1
a
P. Presencial 7
Como la varianza es siempre positiva, covarianza y pendiente tendr an
siempre el mismo signo. En este caso la pendiente es 10.2; por tanto, la
covarianza es negativa.
(b) El enunciado nos adelanta que
V arianza residual
v
y
= 0.19
Entonces, dado que
V arianza residual
v
y
= 1 r
2
resulta
r
2
= 0.81
y, como consecuencia
r = 0.9
Nota: Observe que el signo del coeciente de correlaci on es el mismo que el de
la covarianza.

Problema 2. Segunda semana. Se lanza un dado, y a continuaci on, tantas


monedas como puntuaci on se obtuvo en el lanzamiento del dado.
(a) Hallar la probabilidad de que se obtenga alguna cara.
(b) Si se ha obtenido alguna cara, cu al es la probabilidad de que el resultado
del dado fuera un uno?
Soluci on
(a) Denotaremos por X la variable aleatoria que da la puntuaci on del dado y
por A el suceso Obtener alguna cara . Vamos a razonar por c alculo de
la probabilidad del complementario de A.
Las probabilidades a priori de las distintas puntuaciones del dado son
P(X = i) =
1
6
con i = 1, 2, 3, 4, 5, 6.
Por otro lado, si en el lanzamiento del dado se obtuvo la puntuaci on i,
el suceso complementario de A ocurrir a cuando se obtengan i cruces al
lanzar la moneda; con lo cual
8 Estadstica (Sistemas). UNED. Curso 2003-2004
P(A
c
|X = i) =
_
1
2
_
i
: i = 1, 2, 3, 4, 5, 6.
Del teorema de la probabilidad total se sigue la probabilidad del suceso
complementario de A:
P(A
c
) =
6

i=1
P(A
c
|X = i)P(X = i) =
1
6
6

i=1
_
1
2
_
i
=
1
6
(1/2)
6
(1/2) (1/2)
(1/2) 1
=
1
6
_
2
6
1
2
6
_
=
21
128
,
de donde se obtendr a que P(A) = 1 P(A
c
) = 1
21
128
=
107
128
.
(b) La informaci on dada sobre el resultado del experimento aleatorio: se ha
obtenido alguna cara modica las probabilidades a priori de las distintas
puntuaciones del dado. Nos est an pidiendo recalcular la probabilidad de
que X = 1, conocida dicha informaci on, es decir, hallar la probabilidad a
posteriori P(X = 1|A).
Este es un ejemplo tpico de aplicaci on de la regla de Bayes para el que
P(X = 1|A) =
P({X = 1} A)
P(A)
=
P(A|X = 1)P(X = 1)
P(A)
=
[1 P(A
c
|X = 1)]P(X = 1)
P(A)
=
_
1
1
2
_
1
6
107
128
=
32
321
.

Problema 3. Segunda semana. El an alisis de la varianza de una variable


respuesta Y , medida bajo una serie de condiciones, proporcion o los datos que
se recogen en la siguiente tabla
Fuente de variaci on SC GL CM F
Entre grupos 348 3
Dentro de los grupos 8
(SC: Suma de cuadrados; GL: Grados de libertad; CM: Cuadrado medio; F: Estadstico)
Sabiendo que la varianza total es 428, complete las posiciones que faltan en
la tabla (marcadas con ) y obtenga conclusiones sobre el comportamiento de
Y en los grupos considerados.
Soluciones a los problemas del examen. 1
a
P. Presencial 9
Soluci on
Como la varianza total es 428 y la SC(Entre) = 348, resulta
SC(Dentro) = 428 348 = 80
Adem as,
CM(Entre) = 348/3 = 116
CM(Dentro) = 80/8 = 10
F(Estadstico) = 116/10 = 11.6
Una vez completada la tabla, observamos que el valor obtenido para el es-
tadstico F satisface la desigualdad
F
3,8;0.05
= 9.28 < 11.6
Este hecho nos conduce al rechazo, con un nivel de signicaci on del 5 %, de la
hip otesis nula, que establece que la respuesta media es la misma en los 4 grupos
considerados.

Problema 4. Segunda Semana. De una poblaci on con distribuci on nor-


mal se extrae una muestra aleatoria de tama no 11, de la cual se obtiene una
varianza muestral de 5.
(a) Obtener una estimaci on insesgada de la varianza poblacional.
(b) Contrastar la hip otesis de que la varianza poblacional es 4.5, frente a la
alternativa de que es mayor. T omese un nivel de signicaci on de = 0.05.
Soluci on
(a) Se sabe que un estimador insesgado de la varianza poblacional es la cua-
sivarianza muestral denida mediante
S
2
=
1
n 1
n

i=1
(X
i


X)
2
=
n
n 1
v
2
x
,
donde v
2
x
es la varianza muestral cuyo valor es proporcionado por el
enunciado.
Por tanto, la estimaci on insesgada vendr a dada por S
2
=
11
10
5 = 5.5.
10 Estadstica (Sistemas). UNED. Curso 2003-2004
(b) El enunciado pide realizar un contraste de hip otesis para la varianza de
la poblaci on
2
, con una hip otesis nula que postula que la varianza es 4.5
frente una alternativa que arma que es mayor:
H
0
:
2
= 4.5 H
1
:
2
> 4.5.
El objetivo es comprobar si la evidencia proporcionada por la muestra,
descrita en terminos de la cuasivarianza muestral, corrobora la hip otesis
nula o, por el contrario, la desacredita. Para ello, utilizaremos la cantidad
pivotal que corresponde a la situaci on planteada.
Dado que la distribuci on poblacional es normal, llevaremos a cabo el con-
traste empleando el estadstico:
(n 1)S
2

2
0

2
n1
,
donde

2
0
: varianza poblacional bajo H
0
. En este caso
2
0
= 4.5.
S
2
: cuasivarianza muestral. Para la muestra extrada se obtuvo en el
apartado anterior que S
2
= 5.5.
n: tama no muestral. En este caso n = 11.
La regi on crtica del contraste conjunto de muestras para las que se
rechaza H
0
viene dada por
R =
_
(X
1
, X
2
, . . . , X
n
) :
(n 1)S
2

2
0
> c
_
,
donde el punto crtico c se determina con la condici on del nivel:
P
H
0
((X
1
, X
2
, . . . , X
n
) R) = P
_
(n 1)S
2

2
0
> c
_
= P(
2
n1
> c) = 0.05.
18.307
0.05
Figura 2: Punto crtico para una
2
10
( = 0.05)
Soluciones a los problemas del examen. 1
a
P. Presencial 11
En este caso, para un tama no muestral de n = 11, el punto crtico vale
c = 18.307, ya que para una distribuci on
2
con 10 grados de libertad se
cumple que P(
2
10
> 18.307) = 0.05 vease la regi on sombreada en la
gura 2.
Para la muestra extrada, el valor de la cuasivarianza se sabe que es S
2
=
5.5; con lo cual
(n 1)S
2

2
0
=
10 5.5
4.5
< 18.307, es decir, la muestra
no pertenece a la regi on crtica. Por tanto, la decisi on que adoptaremos
ser a aceptar, con un nivel de signicaci on de = 0.05, la hip otesis nula
de que el valor de la varianza poblacional es 4.5.