Académique Documents
Professionnel Documents
Culture Documents
Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
Prctica 3:
Pulse.rda
Ran
indica
aquellos individuos que despus de lanzar una moneda al aire y obtener cara estuvieron
corriendo durante 5 minutos. A todos los individuos (corrieran o no) se les volvi a medir
las pulsaciones (Pulse2). Adems contiene los datos de sus pesos en libras (Weight) y
sus alturas en pulgadas (Height).
Adems, usaremos el chero
Mundo.rda.
de doble entrada
contingencia
de Estadsticos.
de
se encuentra en el men
como variable la y
Porcentajes totales.
Actividad
condicionada a
cada uno de los sexos (distribuciones por las). Identica las dos distribuciones de
frecuencias que se generan.
3. Realiza las distribuciones de frecuencias de la variable
una de las modalidades de la variable
Actividad
Sexo
condicionada a cada
B.
b) El porcentaje que supone la frecuencia anterior.
c) El porcentaje de individuos que practican la actividad B.
d) El porcentaje de mujeres de la muestra.
Prctica 3
Curso 2011-12
Pgina: 1
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
los datos de una variable cuantitativa continua en clases de intervalo. Dicha variable
segmentada en clases de intervalo puede ser usada para intervenir en una tabla de doble
entrada.
Por ejemplo, si quisiramos hacer una tabla de frecuencias de la pareja de variables
(Height,
Weight)
intervalo, al igual que hacamos en el caso de una nica variable cuantitativa continua.
Una vez que las dos variables estn segmentadas en clases de intervalos podemos
usarlas para llevar a cabo la tabla de frecuencias de doble entrada.
1. Realiza la tabla de doble entrada de la pareja de variables (Height2, Weight2). Qu
porcentaje de individuos de la muestra tienen el mismo nivel de peso y altura?.
2. Realiza la tabla de distribuciones de frecuencias por las. Cul es la distribucin
de frecuencias de la variable
Height2
Prctica 3
Curso 2011-12
Pgina: 2
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
R-Commander
R.
X, Y ,
x, y ,
la funcin
table(x,y)
table(x,y) #
en las e
en columnas.
en
c( )
prop.table(table(x,y),1) #
las.
prop.table(table(x,y),2) #
columnas.
Las opciones
barplot( ), beside=T
lengend.text=c( )
por
y,
es decir,
en las y
y.
el contenido de
barplot(table(Sexo,Actividad)) #
Actividad
y en cada una de ellas se apilan las correspondientes a cada uno de los sexos.
Prctica 3
Curso 2011-12
Pgina: 3
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
barplot(table(Sexo,Actividad),beside=T) #
barplot(table(Sexo,Actividad),legend.tex=c("H","M"))#
aadiendo etiquetas para distinguir las clases del factor Sexo.
prop.table(table(Sexo, Actividad)) # Tabla
tas, en las Sexo y en columnas Actividad.
barplot(prop.table(table(Sexo, Actividad)))
table(Actividad,Sexo).
Prctica 2.2 Realiza los grcos para la pareja de variables (Height2, Weight2). Describe el comportamiento de la variable
Weight2
en funcin de
Height2.
Y.
X=x
Y |x
para analizar si su
numricos.
Estadsticos->Resmenes->Resmenes
Esta opcin puede ser llevada a cabo para cada grupo de individuos segn
X.
Prctica 3
Curso 2011-12
Pgina: 4
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
herramienta bsica para analizar la dependencia entre una variable cuantitativa y una
cualitativa vamos a usar este grco.
Prctica 3.1 En la opcin Estadsticos->Resmenes->Resmenes numricos obtenemos algunos estadsticos bsicos de la variable Pulse2 condicionada a las modalidades
de
Activity,
seleccionando en la opcin
dicho factor.
Prctica 3.2 (Diagrama de caja y bigotes por grupos) Vamos a construir el diagrama de caja y bigotes de la variable Pulse2 para cada tipo de actividad. La opcin
la podemos encontrar en diagrama de caja del men Grcas y seleccionando la opcin Grca por grupos. Discute las caractersticas de cada una de las tres muestras
comparndolas entre ellas.
Prctica 3.3 (Diagrama de medias) Mediante la opcin Grfica de medias podemos visualizar las medias junto con sus desviaciones tpicas de cierta variable cuantitativa, cuando dichas medias se han calculado por niveles de cierto factor o atributo. Realiza
el grco de medias que se halla en el men de grcas para la variable
Activity.
Pulse2
en fun-
4. Diagrama de dispersin
Si la pareja de variables
(X, Y )
(xi , yi )
relacin entre dos variables cuantitativas continuas es necesario en primer lugar intuir
tanto la forma como la intensidad de la relacin. Ello podemos llevarlo a cabo mediante
un grco llamado Diagrama de dispersin que representa en el plano bidimensional las
parejas de valores
(xi , yi ),
desde
i = 1, 2, ...., n.
si existe una relacin ms o menos intensa entre dos variables, que en las prximas
prcticas cuanticaremos mediante estadsticos.
una de ellas mediante el diagrama de caja y patillas. El resto de opciones no deben ser
seleccionadas, pues de momento no se usan.
La nube de puntos representa cada uno de los puntos observados respecto a la pareja
de variables en estudio. La forma de la nube nos indica que puede haber cierta relacin
Prctica 3
Curso 2011-12
Pgina: 5
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
Hombre
Mujer
200
200
160
100
100
120
140
180
160
Weight
Weight
180
140
120
62
64
66
68
70
72
74
62
Height
64
66
68
70
72
74
Height
lineal entre dichas variables pues la forma de la nube est ms o menos dispersa a lo
largo de una recta creciente.
La grca tambin puede hacerse por grupos, teniendo en cuenta una tercera variable
que sea un factor para clasicar individuos en grupos. Por ejemplo, la grca anterior
se podra haber hecho teniendo en cuenta el sexo de los individuos. Basta con sealar
dicha variable en la opcin
de dispersin
ables.
Llevar a cabo la matriz de diagramas de dispersin tomando en cuenta las variables
tectando en cada uno de ellos qu variable acta como variable independiente (la que
se representa en el eje horizontal) y cul acta como variable dependiente (la que se
representa en el eje vertical).
5. Regresin lineal
Para esta prctica vamos a trabajar con el chero
Mundo.rda.
Prctica 5.1 (Recta de regresin y lnea suavizada) Realizamos el grco de dispersin de la pareja de variables (ESPMAS,
bajo el criterio de mnimos cuadrados, es la recta que ms cerca pasa por la nube
de puntos.
Smooth line
Prctica 3
Curso 2011-12
puntos
(xi , yi );
Pgina: 6
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
i = 1, ...., n,
Universidad de Murcia
f (xi )
yi .
60
ESPFEM
70
80
posteriores a
en el punto
50
40
45
50
55
60
65
70
75
ESPMAS
Cuando ambas lneas son parecidas indica que el ajuste lineal es apropiado para relacionar las variables en juego. En caso contrario, un ajuste no lineal sera ms adecuado.
En la grca anterior observamos que para explicar la relacin entre la pareja (ESPMAS,
ESPFEM)
Prctica 5.2 (Obtencin de la recta de regresin) En los casos anteriores es posible que interese obtener la expresin de la recta de regresin as como el grado de bondad
del ajuste medido mediante el Coeciente de Determinacin. Este parmetro es usado,
adems, para comparar la bondad del ajuste entre dos situaciones.
Estadsticos ->Ajuste
de Modelos ->Regresin lineal. Elegimos en Variable explicada la variable dependiente, (ESPFEM en este caso) y en Variable explicativa la variable independiPara obtener la recta de regresin debemos elegir la opcin
ESPFEM)
obtenemos que la
recta de regresin es
r2 = 0.965
De la expresin de la recta obtenemos que por cada ao que aumenta
ESPMAS
ESPFEM.
96.5 % de la varianza de
ESPFEM
hay un
ESPMAS
y es
Curso 2011-12
Pgina: 7
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
ESPMAS
ESPFEM
es de 75 aos. Haramos
ESPFEM
es de 79.95 aos.
6. Prcticas adicionales
1. Repetir las tablas y grcos de la primera seccin para la pareja de variables
3. Describir la variable
Peso
Dif=Pulse2-Pulse1.
Dif
Ran).
Prctica 3
Height
Altura
Curso 2011-12
Pgina: 8
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
6. Describe la variable anterior en funcin del sexo. Interpreta los estadsticos bsicos
para cada grupo.
Mundo.rda.
7. Mediante el chero
Smooth line.
NATAL) us-
Comparar este
7. Regresin no lineal
Esta seccin no es contenido obligatorio del curso, aunque se aade en este punto
para completar el tema de regresin simple y para alumnos que desean saber ms.
La forma de la nube de puntos puede sugerir en ocasiones que existe relacin estadstica entre dos variables pero que dicha relacin no es de tipo lineal, como puede sugerir
las dos siguientes nubes de puntos.
150
80
0
0
5000
50
50
60
70
ESPFEM
100
MORTINF
10000
15000
20000
PIB
5000
10000
15000
20000
PIB
Regresin hiperblica
b
y =a+
x
Prctica 3
1
x
Curso 2011-12
Pgina: 9
x0 =
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
de la variable
1
X0 = .
X
sera
Regresin logartmica
Y = a + b X 0,
Universidad de Murcia
ax
y=
y = a xb
resultando
Regresin exponencial
y = ab
resultando
Prctica 7.1 Con los ejemplos anteriores observamos que la transformacin logartmica
resuelve muchas situaciones de ajustes no lineales del tipo exponencial o potencial.
En R y R-Commander, la funcin
del nmero
y.
Es decir, calcula el
ex .
funcin exponencial
La funcin
el nmero
log(y,a)
que verica
a (x) = y ,
donde
a (x)
a.
Es decir, calcula
x
es la funcin exponencial a .
haciendo
en base
exp(1).
2. Calcula los valores siguientes: log(e), log(10), log(2), log(1), log(0.5), log(100),
log(1000). Interpreta los resultados usando la funcin exponencial.
3. Calcula los logaritmos de los mismos valores anteriores en base 10 e interpreta los
resultados usando la funcin exponencial.
4. Igual pero en base 2.
5. Mediante la funcin
en el intervalo
log(x,10)
curve(log(x,10),1,10,add=T)
se rep-
en el mismo grco
curve(log(x,2),1,10,add=T)
Curso 2011-12
a continuacin.
Pgina: 10
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Prctica 7.2
1. Crea el chero
de variables
(X,Y):
Universidad de Murcia
Ajuste1.rda
(1, 536), (1.2, 400), (1.5, 220), (2, 82), (3, 11), (4, 4), (5, 2).
plot(X,Y)
en la ventana
de instrucciones.
(LX, LY)
LY = 6.63 3.69 LX
con coeciente de determinacin
que
r2 = 0.9889
r = 0.9889 = 0.9944
puesto
Y para un
= 25.76
valor de
X,
LY = 6.63
3.69 LX , sustituimos el valor X=2.5 y tenemos log(y) = 6.63 3.69 log(2.5) =
3.2488. Es decir, log(Y ) = 3.2488 por lo que Y = exp(3.2488) = 25.76.
(X,Y),
desmarcando todas
las opciones.
Sin cerrar el grco anterior hacemos
T ).
LY)
donde
LX=log(X)
LY=log(Y).
Para
ajustar a un modelo potencial podemos haber usado una tranformacin logartmica con cualquier otra base. Por ejemplo
LX=log(X,10) y LY=log(Y,10),
Prctica 3
Curso 2011-12
Pgina: 11
M. Iniesta
Grado en Ciencia y Tecnologa de los Alimentos
Universidad de Murcia
300
100
200
400
500
Prctica 7.3 Vamos a tratar el caso de la pareja de variables (PIB, MORTINF) del
chero
Mundo.rda.
jar la recta de regresin y la curva suavizada y observar que son bastante dispares.
2. Realizar el ajuste lineal y medir la bondad del ajuste mediante el coeciente de
determinacin.
3. Calcular las variables nuevas
1/PIB, log(PIB)
log(MORTINF).
(1/PIB, MORTINF),
(log(PIB), MORTINF), (log(PIB), log(MORTINF)) y (PIB, log(MORTINF)); representando la recta de regresin y la curva suavizada. Puedes usar la opcin Matriz
de diagramas de dispersin y reconocer en este grco las grcas que se solicitan. Recuerda que cuando indicamos la pareja de variables (X, Y ) signica que
X es la variable independiente o explicativa que se representa en el eje horizontal,
mientras que Y es la variable dependiente o explicada que se representa en el eje
vertical.
5. Intuir cul de los cuatro grcos anteriores presenta mejor ajuste lineal.
6. Llevar a cabo dichos ajustes observando el coeciente de determinacin. Indicar
qu ajuste tiene mayor bondad.
7. Usando el ajuste de mayor bondad, estimar la tasa de mortalidad infantil medio
en el conjunto de pases con PIB=20000 dlares per cpita.
Prctica 3
Curso 2011-12
Pgina: 12