Vous êtes sur la page 1sur 4

PROBLEMAS ESTAD

ISTICA
GRADO DE INGENIER

IA INFORM

ATICA
CURSO 2014/2015 GRUPO TARDE
Estadstica Descriptiva Bidimensional
1. Se analizaron ciertas caractersticas de un grupo de 3020 procesadores de la familia Intel con vistas
a realizar un estudio comparativo. Entre las caractersticas analizadas se encuentran X el chip
de CPU e Y la velocidad del microprocesador (medida en Megahertzios). Los datos recogidos se
muestran en la siguiente tabla:
X / Y 133 150 166 180 200 233 266 300 350 400
Pentium 70 90 100 0 130 0 0 0 0 0
Pentium Pro 0 70 0 180 200 0 0 0 0 0
Pentium MMX 0 50 160 0 170 200 0 0 0 0
Pentium II 0 0 0 0 0 210 300 320 350 420
Se pide
(a) Calcular las distribuciones marginales de las variables X e Y. Calcular el n umero de PCs con
una velocidad del microprocesador superior a 180. Y con una velocidad inferior a 233.
(b) Construir la distribucion de frecuencias de X condicionada al valor Y = 200.
(c) Construir la distribucion de frecuencias de Y condicionada al valor X = Pentium II.
(d) Son ambas variables independientes? Por que?.
2. En una encuesta realizada a 215 familias se han obtenido los siguientes datos sobre los ingresos
mensuales (X) y los depositos en bancos y cajas de ahorros (Y)
X / Y 0-200 200-500 500-2000 2000-10000
50-100 20 6 4 0
100-150 8 24 6 2
150-250 4 30 35 10
250-500 2 20 32 12
Se pide:
(a) Representar gracamente esta distribucion mediante un diagrama de dispersion o nube de
puntos.
(b) Obtener las distribuciones marginales tanto de los ingresos mensuales como de los depositos
en Bancos y Cajas de Ahorros.
(c) Calcular la media y la varianza de las distribuciones marginales.
(d) Que distribucion de las marginales esta mas concentrada?
(e) Se quiere saber la distribucion de los ingresos mensuales por familias con un deposito entre
500 y 2000. Y para aquellas familias con un deposito superior a 500.
1
(f) Cual es el grado de asociacion lineal entre el deposito de una familia y sus ingresos? Es
posible estimar el deposito que hara una familia en bancos y cajas de ahorros sabiendo que su
ingreso es de 200 unidades?.
3. La siguiente tabla de doble entrada muestra la relacion entre las averas mensuales de una maquina
X y la temperatura media de funcionamiento de la misma Y. Supuesto que el tama no de la mues-
tra fuese de 100 maquinas, completa la tabla de correlacion de la variable bidimensional (X,Y).
Determina el n umero medio de averas mensuales, la temperatura media de funcionamiento, la co-
varianza entre ambas variables y la distribucion de la variable temperatura cuando el n umero de
averas mensuales es cuatro. Que puedes decir de la independencia entre ambas variables?.
Averas / 120 140 160
Temperatura
2 0.2 0.15 - 0.45
3 0.12 0.07 0.05 -
4 0.04 0.1 0.02 -
5 0 - 0.1 -
0.36 - - -
4. Se considera la siguiente distribucion bidimensional (X, Y)
X / Y 1 2 3 4 5
100 2 4 6 10 8
200 1 2 3 5 4
300 3 6 9 15 12
400 4 8 12 20 16
Se pide:
(a) Calcular las medias y varianzas marginales de X e Y. Que distribucion esta mas agrupada
alrededor de su media?.
(b) Calcular las medias de X condicionada a todos los valores de Y.
(c) Calcular las medias de Y condicionada a todos los valores de X.
(d) Son X e Y independientes?.
(e) Calcular la covarianza.
5. La siguiente pregunta tiene 4 posibles respuestas, razona las que consideres correcta e indica el
porque. Una distribucion bidimensional de frecuencias tiene por rectas de regresion:
I.- x + 0.3y 2.9 = 0 y II.- 2.7x + y 8.4 = 0
Entonces:
a).- I es la recta de regresion de Y sobre X.
b).- coeciente de correlacion vale 0.81.
c).- coeciente de correlacion vale 0.9.
d).- Las tres armaciones anteriores son falsas.
Averiguar ademas las medias de las variables X e Y. Suponiendo que la varianza de Y es de 180,
calcular la varianza de X y la covarianza entre ambas.
2
6. Dadas las siguientes pares de rectas, estudiar si es asumible que sean rectas de regresion, y en dicho
caso calcular el coeciente de correlacion lineal, los coecientes de regresion y las medias de x e y.
a)
8x + 2y = 1
16x + 9y = 1
b)
2x - 4y = 50
6x + 5y = 75
c)
4x - 8y = 70
2x - 4y = 50
d)
2x + y = 7
x + y = 13
7. Se midio el tiempo en segundos que tardaron en grabarse los mismos 24 cheros en cada uno de los
dos tipos de discos (3
1/2
y 5
1/4
). Los tiempos observados fueron:
3
1/2
1.2 1 1.1 0.5 1.1 1.5 1 1.4 1.4 1.3 0.4 1.2
5
1/4
1.3 1.1 1.2 0.4 1.2 1.4 1.1 1.6 1.6 1.5 0.4 1.5
3
1/2
0.4 0.3 0.3 1.5 1.4 1.1 1.2 1.2 0.4 0.5 1.3 1.5
5
1/4
0.4 0.3 0.3 1.6 1.3 1.1 1.3 1.1 0.4 0.4 1.4 1.6
(a) Construye la tabla de frecuencias conjuntas.
(b) Obtener las distribuciones marginales de los tiempos de grabacion en ambos tipos de disco.
Cual es el porcentaje de cheros que tardan menos de 1.5 segundos en el disco de 3
1/2
y mas
de 1.4 en el disco de 5
1/4
? Cuantos cheros tardan en grabarse entre 0.6 y 1.2 segundos en el
disco de 3
1/2
?
(c) Hallar la distribucion de frecuencias de los tiempos de grabacion en el disco 5
1/4
condicionada
aquellos programas que tardaron 1.2 en el disco de 3
1/2
. Cual es la proporcion de estos
programas que tardan en grabarse mas de 1.4 segundos?
(d) Representar la nube de puntos correspondiente a estos datos, y calcular el coeciente de de-
terminacion.
(e) Si un chero tarda 0.8 segundos en grabarse en el disco de 3
1/2
, cuantos segundos se estima
que tardara en grabarse en el disco de 5
1/4
?.
8. Las notas obtenidas por 10 alumnos de Ingeniera Tecnica de Gestion (Informatica) en Estructura
de Datos y en Estadstica I son:
Estructura de Datos 6 4 8 5 3.5 7 5 10 5 4
Estadstica I 6.5 4.5 7 5 4 8 7 10 6 5
Se pide:
(a) Calcular las rectas de regresion y representarlas junto con el diagrama de dispersion o nube
de puntos.
(b) Calcular el coeciente de correlacion y el de determinacion.
3
(c) Cual sera la nota esperada en Estadstica I de un alumno que haya obtenido un 8.3 en
Estructura de Datos?.
9. Los siguientes datos corresponden a los tiempos en segundos que tardaron en ejecutarse seis pro-
gramas elegidos al azar en un entorno Windows y en Linux:
Programas
1 2 3 4 5 6
Windows 2.5 7.1 5 8.5 7 8.1
Linux 2.3 7.1 4 8 6.6 7.7
Se pide:
(a) Representar el diagrama de dispersion de los datos anteriores.
(b) Calcular las rectas de regresion, y calcular el coeciente adecuado para medir la bondad del
ajuste.
(c) Si un progama tarda 3 segundos en ejecutarse en Windows cuanto tardara en ejecutarse en
Linux.
(d) Si un programa tarda 6 segundos en ejecutarse en Linux, cuanto tardara en ejecutarse en
Windows.
10. A continuacion se recoge el tiempo de respuesta en nanosegundos de un circuito logico en fro X y
tras una hora de uso intesivo Y, para un conjunto de 15 maquinas:
X 6.0 5.0 8.0 16.0 7.0 4.0 5.0 9.0 12.0 8.0 6.0 11.0 9.0 5.0 8.0
Y 8.5 8.0 11.0 12.3 10.0 7.7 9.0 11.2 12.0 10.0 9.0 10.5 9.8 9.0 9.0
Se pide:
(a) Calcular las medias y varianzas de ambas variables.
(b) Que muestra tiene mayor dispersion?. En que coeciente te apoyas para contestar a la
anterior cuestion?.
(c) Son incorreladas dichas variables? Si no es as indica el tipo de correlacion que existe entre
las mismas.
(d) Cuanto se estima que tardara en responder un determinado circuito tras una hora de fun-
cionamiento intensivo, si en fro tuvo un tiempo de respuesta de 10 nanosegundos?. Con-
sideras el modelo adecuado para dicha prediccion?. En que coeciente te basas?. Razona la
respuesta.
4