Académique Documents
Professionnel Documents
Culture Documents
CORRELACIÓN LINEAL
Midiendo la relación entre dos variables
JORGE FALLAS
2012
i
Índice
1. Introducción ......................................................................................................................... 1
2. Diagrama de dispersión ........................................................................................................ 1
3. Coeficiente de correlación lineal de Pearson ....................................................................... 2
6. Interpretación de r ................................................................................................................ 6
4. Correlación no es sinónimo de causa-efecto ........................................................................ 8
5. ¿De qué depende la intensidad de la correlación?................................................................ 9
7. Significancia de r: Prueba de hipótesis .............................................................................. 11
8. Coeficiente de correlación de órdenes de Spearman .......................................................... 16
8.1. Prueba de hipótesis .......................................................................................................... 18
9. Coeficiente de correlación de órdenes de Kendall's (Tau-a y Tau-b) ................................ 21
9. Bibliografía......................................................................................................................... 23
10. Ejercicios .......................................................................................................................... 25
1. Introducción
En los capítulos anteriores hemos trabajado con variables tales como altura (h), diámetro (d) ,
precipitación y peso en forma independiente; sin embargo ¿son en el mundo real realmente
independientes dichas variables? Si observamos un bosque, podemos apreciar que usualmente los
árboles de mayor altura también tienen el mayor diámetro y viceversa. Sin embargo, es evidente
que esta relación no es perfecta, pues el árbol más alto no necesariamente tiene el mayor diámetro,
ni tampoco el árbol más pequeño tiene el menor diámetro. Esto implica que las dos variables están
correlacionadas y que el grado o intensidad de la correlación no es perfecto. Usted puede pensar en
situaciones particulares de su quehacer profesional donde se presentan situaciones similares. Esto
nos lleva a plantearnos las siguientes preguntas: dadas dos variables ¿Existe algún tipo de correla-
ción entre ellas? y en caso de existir, ¿Cuál es la dirección e intensidad de la misma?
2. Diagrama de dispersión
El diagrama de dispersión expresa gráficamente la relación entre dos variables cuantitativas
utilizando un sistema de ejes cartesianos. Su uso, como medio para representar gráficamente una
distribución bivariable, se atribuye a Sir Francis Galton. Por ejemplo, si estamos estudiando la
relación entre el diámetro y altura de un bosque, cada par de valores se gráfica en un sistema de
coordenadas X, Y. La figura 1 ilustra este concepto para 46 valores de diámetro (cm) y altura total
(m) de Jaúl. La distribución conjunta de diámetro y altura se denomina bivariable porque está
formada por la interacción tanto del diámetro como de la altura. Esta gráfica nos permite hacer las
siguientes observaciones:
1. Existe un alto grado de correlación lineal entre las dos variables. La naturaleza de la
asociación puede describirse adecuadamente por una recta como la trazada en la figura 1.
2. La relación es imperfecta; ya que no siempre los árboles de mayor diámetro corresponden a
árboles de mayor altura. Existe una covariación entre los dos sets de datos; sin embargo no
es perfecta.
correlación de Pearson es apropiado únicamente para aquellos casos en que la asociación es lineal y
la escala de medición cuantitativa (intervalo o razón).
45
40
35
altura total (m)
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
d (cm)
Figura 1: Diagrama de dispersión para diámetro (cm) y altura total (m) de jaúl. La recta indica la
tendencia general de los datos.
(1)
El estimador de ρ es “r” y su fórmula es:
(2)
2. Su valor fluctúa entre 1 y -1. Cuando la asociación entre X y Y es perfecta “r” es igual a 1
(todos los valores se ubican en una recta); cuando no existe correlación lineal su valor es 0.
Figura 2: Relación entre el valor y signo del coeficiente de correlación lineal de Pearson y la
tendencia de valores.
La formula 2 facilita el cálculo de “r” sin embargo no nos permite apreciar como los valores
estandarizados de X y Y afectan su valor. Una expresión más simple y que nos permite apreciar lo
anterior es:
(3)
Donde:
la media de X
la media de Y
SX la desviación estándar de X
SY la desviación estándar de X
4
Figura 3: Diagrama de dispersión para cuatro pares de valores de diámetro (cm) y altura total (m).
Las letras romanas indican los cuadrantes.
El signo de “r” está dado por el signo de los valores estandarizados en la formula tres; ya que n,
Sx y Sy son positivos. Además cuanto mayor sea el número de casos que se ubiquen en los
cuadrantes I y III o II y IV mayor será la magnitud de la suma de productos XY y por ende de r. Para
los puntos de la figura tres, el valor del “r” es 0,97.
r = Syx / Sx * Sy (4)
Para los datos del presente ejemplo Sx=3,16 cm; Sy=3,37 m y Syx=10,33. Sustituyendo los
valores en 4 tenemos que r es igual a:
Single-variable
Alt. tot (m) d (cm)
Number 4 Number 4
Two-variable Mean 11 Mean 9
Number 4 St Dev 3.3665 St Dev 3.1623
Covariance 10.333 Min 7 Min 6
Correlation 0.9706 Max 15 Max 13 Correlation Coeff
R 0.9422
2
Median 11 Median 8.5 Correlation 0.970648
El coeficiente de correlación obtenido para una muestra (r) es un estimador puntual que mide la
dirección e intensidad de la covarianza de los datos analizados y no implica necesariamente que
dicho valor sea la correlación de la población (ρ). Por ejemplo, si para cuatro árboles no se obtiene
una correlación entre el diámetro y la altura, no se puede afirmar que tal correlación no existe. Como
con cualquier otro estimador, es esencial que el valor de "r" se interprete considerando las
circunstancias y condiciones bajo las cuales fue calculado.
6
6. Interpretación de r
Al observar el valor del coeficiente de correlación podemos preguntarnos, por ejemplo, ¿qué nos
indica un r = 0,5? ó ¿Cuánto más intensa es la correlación cuando r = 0,8? El coeficiente de
correlación puede interpretarse tomando como referencia el intervalo [−1≤ ρ ≤ 1]; así como el
concepto de variabilidad. A continuación se discute cada enfoque.
100
90
Para proseguir con nuestro análisis la variabilidad, la variabilidad en peso debe expresarse en
términos de la varianza (S2). Si los valores difieren drásticamente entre sí (datos muy heterogéneos)
el valor de S2 será grande; por otra parte, si son relativamente homogéneos, S2 será pequeña; y si
todos los datos tienen el mismo peso, S2 será cero (no existe variabilidad).
La variación total puede dividirse en dos componentes: variación asociada al factor tamaño de la
huella y variación asociada a otros factores o error (cuadro 3). Para hacer esta división, el valor de
“r” debe expresarse en términos de R2 (coeficiente de determinación). Si el peso de la muestra tiene
una varianza de S2 = 2,60 kg 2 y el coeficiente de correlación lineal es 0,80; la variación total en
peso se puede dividir de la siguiente manera:
8
Dos variables pueden presentar un alto grado de correlación por diferentes motivos como se
ilustra en la figura 5. Por ejemplo, la variación en X puede ser la responsable de la variación en Y o
viceversa. También pueden existir otros factores que afecten tanto a X como a Y (ver efecto de
confusión). Por ejemplo, la respuesta de una planta a un determinado fertilizante puede estar
afectada por el pH, la fertilidad inicial del suelo y época de aplicación del fertilizante. En otras
ocasiones dos cosas o eventos ocurren al mismo tiempo pero sin embargo no están correlacionados y
mucho menos uno es causa del otro.
9
1. Principio de linealidad
La figura 6 muestra tres diagramas de dispersión con sus respectivas curvas de mejor ajuste. En
el diagrama A el grado de correlación es moderado, en tanto que en el B es alto. La figura indica
que cuanto mayor sea el número de observaciones que se ubiquen alrededor de la línea de mejor
ajuste mayor será el valor de “r”.
Por otra parte cuando una recta no describe adecuadamente la relación entre X y Y, como es el
caso de la figura 6C, se dice que las observaciones no satisfacen el principio de linealidad de
regresión. Esto no implica que los datos no estén correlacionados, simplemente significa que la
relación es no lineal. La relación del diagrama 6C es curvilínea y si calculamos el valor de “r”
encontraríamos que es muy pequeño y posiblemente cercano a cero. Esta gráfica ilustra claramente
que si la relación es curvilínea, el coeficiente de correlación de Pearson subestimará en gran medida
la intensidad de la asociación. El coeficiente de correlación de Pearson solo debe usarse con
distribuciones bivariables que no se aparten sensiblemente del principio de linealidad.
10
El coeficiente de correlación para la totalidad de las observaciones es 0,73; en tanto que para el
subset es 0,13. Esto nos indica que, dada una relación lineal, la magnitud del coeficiente de
correlación depende del grado de variabilidad de los datos. Si mantenemos constantes los otros
factores que afectan el valor de “r”, restringiendo el ámbito de X y Y reduciremos el valor del
coeficiente de correlación.
45 30
40
r = 0,729 25
35 r = 0,132
altura total (m)
altura total (m)
30 20
25
15
20
15 10
10
5
5
0 0
0 10 20 30 40 50 60 70 80 0 5 10 15 20
d (cm) d (cm)
Figura 7: Efecto del ámbito de las observaciones en el valor del coeficiente de correlación lineal de
Pearson.
4. Variación muestral
Al igual que la media o la desviación estándar, el coeficiente de correlación se obtiene a partir de
una muestra y por lo tanto está sujeto a las leyes del azar; las cuales se expresan en variabilidad. El
valor de “r” para una muestra es diferente al valor de la población (ρ). Si la muestra es
representativa y lo suficientemente grande se esperaría que la discrepancia o error sea mínimo. El
coeficiente de correlación para una muestra no es el coeficiente de correlación poblacional, sino
simplemente un valor que responde a las características de la muestra seleccionada.
En la sección tres se calculó un coeficiente de correlación lineal de 0,97 para cuatro valores de
diámetro y altura. A simple vista pareciera que la relación es lo suficientemente fuerte y positiva (lo
cual tiene sentido biológico) como para suponer que efectivamente existe una relación entre ambas
variables; sin embargo ¿es el valor de “r” significativamente diferente de cero? Para responder a esta
pregunta debemos realizar una prueba de hipótesis de dos colas.
(6)
12
Los valores de t calculados se comparan con valores críticos obtenidos de la distribución “t” de
Estudiante con n-2 grados de libertad.
(7)
El intervalo de confianza para “ρ” de Pearson se basa en la transformación “r” a “z” de Fisher. Si
los pares ordenados (X,Y) tienen una distribución bivariable normal y son independientes, entonces
Z es aproximadamente normal con media igual a:
(8)
(9)
EJEMPLO
1. Calcular r:
r = 0,97
Ho: ρ = 0
Ha: ρ <> = 0
3. Elegir el valor de alfa crítico. Recuerde que debe elegir dicho valor antes de realizar la prueba de
hipótesis. Para el presente ejercicio se eligió del valor de 0,05 (recuerde que usted puede elegir
cualquier valor inferior o igual a 0,1)
13
4-2
0,5
t = 0,97 * [ -------------------]
1- (0,97*0,97)
t = 5,708
Si usted busca el valor 5,708 en una tabla “t” de Estudiante con n-2 grados de libertad (en este caso
4-2=2) encontrará que corresponde a una probabilidad de 0,0293 (este es el valor de P calculado por
los paquetes estadísticos).
5. Decisión
Ho se rechaza si el valor de P calculado es menor que el alfa elegido (P critico).
En este caso el valor de P calculado (0,0293) es menor que el valor de P critico (0,05) y por tanto
se rechaza Ho a un nivel de significancia de 5%.
6. Conclusión
A un nivel de significancia de 5% la muestra provee suficiente evidencia estadística para suponer
que las variables provienen de una población con un coeficiente de correlación lineal diferente de 0.
Por tanto para la muestra en estudio se concluye que el diámetro y la altura están linealmente
correlacionados (P < 0,05).
Es posible que la conclusión no le sorprenda ya que biológicamente existe una relación entre el
diámetro y altura; además, el valor del coeficiente de correlación es lo suficientemente alto como
para suponer que tal correlación existe. Sin embargo debemos estar conscientes de que el tamaño de
muestra determina los grados de libertad y este a su vez juega un papel importante en la
determinación de la significancia de “r” como puede observarse en el siguiente cuadro.
Observe como para un “r” de 0,10 con n=1.002 se rechaza la hipótesis nula, en tanto que para un
“r” de 0,55 con n=12 no se rechaza. El factor que controla la decisión de rechazar o no rechazar Ho
es el número de observaciones (grados de libertad). Para muestras muy grandes (e.g. 500 o 1.000
pares de observaciones), coeficientes de correlación relativamente pequeños serán significativos en
tanto que con muestras pequeñas sucederá lo opuesto.
1. Convertir r a z
z = 0,5 ln [( 1+0,97)/ 1- 0,9] = 2.09229572
3. Calcular IC para ρ
Para un nivel de confianza de 95% el valor de Z es igual a 1,96.
Límite superior: z= 2.09229572 +1,96 *0,7071 =3, 4782
Límite inferior: z= 2.09229572 - 1,96 *0,7071 = 0,706379
4. Convertir valores de z a r:
Límite superior: r= e 2*3, 4782-1 / e 2*3, 4782 +1 = 0,998
Límite inferior: r= e 2*0,706379-1 / e 2*0,706379 +1 =0,608
Y el intervalo de confianza es: 0,608 < ρ < 0,998. Dado el set datos analizado, tenemos una
confianza de 95% de que el parámetro de la población se entre 0,608 y 0,998.
EJEMPLO 2
¿Cuál es el coeficiente de correlación para los datos de diámetro y altura del archivo
d_h_jaul.xlsx? Es el coeficiente diferente de cero a un nivel de confianza del 99%? El
procedimiento a seguir es:
1. Diagrama de dispersión
2. Calcular r
3. Plantear hipótesis nula y alternativa
4. Elegir el valor de alfa crítico (“p” crítico)
15
1. Diagrama de dispersión
El grafico muestra que existe una correlación lineal entre las variables diámetro (cm) y altura
total (m).
45
40
r = 0,78
35
altura total (m)
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
d (cm)
Figura 8: Diagrama de dispersión para diámetro (cm) y altura total (m) de Jaúl.
2. Calcular r
Single-variable
altura total (m) diámetro (cm)
Number 46 Number 46
Two-variable Mean 27.739 Mean 35.652
Number 46 St Dev 6.3541 St Dev 15.651
Covariance 77.752 Min 15 Min 10
Correlation 0.7818 Max 42 Max 68
R 0.6113
2
Median 28.5 Median 33.5
Correlation Coeff
Correlation 0.781847
El coeficiente de correlación lineal de Pearson para las variables diámetro (cm) y altura total (m) es
0,78.
5. Decisión
Dado que el valor de “p” calculado es menor que “P” crítico se rechaza Ho.
6. Conclusión
El valor de “p” calculado (1,41 E-10) es inferior al valor del “p” crítico (0.01) y por lo tanto se
concluye que las variables están linealmente correlacionadas.
Dados “n” pares de observaciones (X1,Y1), (X2,Y2), ....., (Xn,Yn) para las variables aleatorias X y
Y; para estimar la correlación entre X y Y primero se ordenan los pares de observaciones de mayor a
menor (utilizando X o Y) y luego se les asigna el orden respectivo a cada par X,Y; de esta manera
generamos un conjunto de “n” pares de órdenes, los cuales denotamos como (Rx1,Ry1),
(Rx2,Ry2),.., (Rxn, Ryn).
Si dos observaciones tienen el mismo orden (empates) se les asigna el orden medio (e.g. si las
observaciones correspondientes a los ordenes 8 y 9 son iguales, se les asigna el orden 8,5). La
correlación entre X y Y se obtiene calculando el coeficiente de correlación de Pearson para los pares
de ordenes. La expresión matemática básica para Rho es:
n Rx * Ry - Rx * R y
Rb = ------------------------------------------- (10)
n R2x - (Rx)2 * n R2y - (Ry)2
17
12 Rx * Ry n+1
Ra= --------------------- - 3 ---------- (11)
n (n2 - 1) n-1
6 Di2
Rs= 1 - --------------- (12)
n (n2 - 1)
6 ( Di2 + U + V)
Rs= 1 - ------------------------------ (13)
n (n2 - 1)
1
U = ------- mj (mj2 - 1) (14)
12
1
V= ------- nj (nj2 - 1) (15)
12
n (n2 - 1) - 6 ( Di2 + U + V
Rs = --------------------------------------------------------------- (16)
{n (n2 - 1) - 12 U } * { n (n2 - 1) - 12 U }0,5
Si se desea calcular un intervalo de confianza para Rho o someter a prueba una hipótesis para un
valor de Rho diferente de cero, se pude utilizar la transformación de Fisher y la distribución Z:
(18)
(19)
A continuación se ilustra el uso de XLStatistics para calcular el valor de Rho para los datos de
diámetro (cm) y altura de Jaúl (m) analizados en la sección anterior.
EJEMPLO
Se desea determinar el coeficiente de correlación de Spearman para el set de datos de diámetro
(cm) y altura de Jaúl (m) analizado previamente. El procedimiento de cálculo es el mismo sugerido
para el coeficiente de correlación de Pearson.
1. Diagrama de dispersión
A continuación se muestran los valores originales y el respectivo orden para cada uno de los pares
de observaciones.
Cuadro 5: Valores originales de diámetro (cm) y altura total (m) y el respectivo orden para cada uno
de los pares de observaciones.
50 50
45 A 45 r = 0,75
B
r = 0.75
40 40
35 35
orden altura
orden altura
30 30
25 25
20 20
15 15
10 10
5 5
0 0
0 10 20 30 40 50 0 10 20 30 40 50
orden diámetro orden diámetro
Figura 9: Diagrama de dispersión para ordenes de diámetro (cm) y altura total (m) de Jaúl.
A. Considera empates. B. No considera empates.
2. Calcular Rho
Spearman's Rank Coefficient (rho)
Correlation Coeff
r 0.74987615
El coeficiente de correlación lineal de Spearman para los órdenes de diámetro (cm) y altura total
(m) es 0,75. Note su similitud con el valor del coeficiente de correlación de Pearson. El coeficiente
de determinación para el coeficiente de correlación de Spearman puede aproximarse como Rb2. En
este caso Rb2 es igual a 0,56. Los resultados indican que aproximadamente el 56 de la variación en
altura puede atribuirse a la variación den diámetro.
5. Decisión
Dado que el valor de “p” calculado es menor que “P” crítico se rechaza Ho.
6. Conclusión
El valor de “p” calculado (1,41 E-10) es inferior al valor del “p” crítico (0.01) y por lo tanto se
concluye que las variables están linealmente correlacionadas.
A la formula veinte se le conoce como Tau-a y no hace ningún ajuste por empates entre ordenes.
El denominador corresponde al número total de pares y por tanto el valor del coeficiente se
encuentra en el ámbito −1≤ τ ≤ 1. Cuando existe una total concordancia entre los órdenes de ambas
variables el valor de τ es 1 y cuando el desacuerdo el total, el valor es igual a -1. Si las variables son
independientes, el valor será cercano a cero.
(21)
Y por lo tanto, para “N” mayor que diez, Ho: ρ=0 puede someterse a prueba transformando ρ en un
valor de Z, el cual tiene una distribuye normal con una media igual a cero y desviación estándar
igual a uno (N~ 0,1).
(22)
El percentil de Z τ debe compararse con el valor del “p” crítico para decidir sobre Ho.
22
(23)
Donde:
n0 = n(n-1)/2
n1 = n(n-1)/2
Ʃi ti (ti-1) /2
Ʃj tj (uj-1) /2
nc: número de pares concordantes
nd: número de pares discordantes
ti = número de empates para el ith grupo de empates para la primera variable.
uj = número de empates para el jth grupo de empates para la segunda variable.
EJEMPLO
Se desea determinar el coeficiente de correlación de rangos de Kendall (Tau-b) para el set de datos
de diámetro (cm) y altura de Jaúl (m) analizado previamente. El procedimiento de cálculo es el
mismo sugerido para el coeficiente de correlación de Spearman. El programa XLStatiscis ofrece los
siguientes resultados:
Dado que el valor de “p” calculado (1,49 E-08) es menor que “p” crítico (0,001), se concluye que
el el valor del coeficiente de correlación de rangos de Kendall (Tau-b) es diferente de cero y por lo
tanto las variables diámetro y altura están correlacionadas.
23
9. Bibliografía
Abdi Hervé. The Kendall Rank Correlation Coefficient. In: Neil Salkind (Ed.) (2007). Encyclopedia
of Measurement and Statistics. Thousand Oaks (CA): Sage. Disponible en
http://www.utdallas.edu/~herve/Abdi-KendallCorrelation2007-pretty.pdf. Visitado 10 julio 2012.
Chatillon, C. 1985. Reply on "Some remarks on quick estimation of the correlation coefficient".
The American Statistician 38(4):230-231.
Cleveland, W.S.; Diaconis, P. and McGil, R. 1982. Variables on scatterplots look more highly
correlated when the scales are increased. Science 216 (4550): 1130-1141.
Cui Zhongmin, Li Dongmei, and Tao Wei. 2008. Constructing Bootstrap Confidence Intervals for
Pearson's r .10p. Dsiponible en
http://www.divms.uiowa.edu/~kcowles/s166_2008/taoproject_report.pdf. Visitado 10 julio 2012.
Filliben, J. J. 1975. The probability plot correlation coefficient test for normality. Technometrics
17:111-112.
-------. 1963. Measures of association for cross-classifications, III: approximate sampling theory.
Jour. of the American Statistical Association 58: 310-364.
-----------. 1959. Measures of association for cross-classification, II. further discussion and
references. Jour. of the American Statistical Association 54 (285):123-163.
-----------. 1954. Measures of association for cross-classification. Jour. of the American Statistical
Association 49 (268):732-764.
Helsel, D.R., Mueller, D.K., and Slack, J.R., 2006, Computer program for the Kendall family of
trend tests: U.S. Geological Survey Scientific Investigations Report 2005–5275, 4 p. Disponible en
http://pubs.usgs.gov/sir/2005/5275/pdf/sir2005-5275.pdf. Visitado 15 julio 2012.
Koch, G. G. 1985. A basic demonstration of the -1,1 range for the correlation coefficient. The
American Statistician. 39(3):201-202.
Kvalseth, T. O. 1985. Cautionary note about R2. The American Statistician. 39(4):Pt.1:279-285.
24
Pearson, K. 1896. Mathematical contributions to the theory of evolution, III. Regression, heredity
and panmixia. Philosophical Transactions of the Royal Society A. 187:253-318.
Raveh, A. 1985. On quick estimates of Pearson's R from scatter diagrams. The American Statistician
39(3):239-240.
Schilling, M. F. 1984. Some remarks on quick estimation of the correlation coefficient. The
American Statistician 38(4):330.
Somers, R.H. 1968. On the measurement of association. American Sociological Review. 33:291-
292.
----------. 1962. A new asymmetric measure of association for ordinal variables. American
Sociological Review 27:799-811.
Stuart, A. 1963. The estimation and comparison of strengths of association in contingency tables.
Biometrika 40:105-110.
---------. 1963. Calculation of Spearman's rho for ordered two way classifications. American
Statistician 17(4):23-24.
Wagstaff David A., Elek Elvira, Kulis Stephen and Marsiglia Flavio. 2009. Using a Nonparametric
Bootstrap to Obtain a Confidence Interval for Pearson’s r with Cluster Randomized Data: A Case
Study.J Prim Prev.30(5): 497–512. Disponible en
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2792874/pdf/nihms148193.pdf. Visitado 10 julio
2012.
Yule, G. U. 1912. On the methods of measuring association between two attributes. Jour. of the
Royal Statistical Society 75:579-642.
25
10. Ejercicios
2. Brinde una lista de pares de variables que en su opinión muestren una correlación positiva.
3. Brinde una lista de pares de variables que en su opinión muestren una correlación negativa.
4. Basado en la gráfica que se muestra a continuación, responda a la siguiente pregunta: ¿Están las
variables “nota” y “tarea” correlacionadas? Argumente su respuesta. ¿Cuál sería su pronóstico
para las siguiente tareas?
90
89
88
87
86
85
Nota
84
83
82
81
80
79
0 1 2 3 4 5 6
Tarea
5. Brinde tres ejemplos en los que usted esperaría que la relación entre X y Y fuera no lineal.
6. Una investigadora selecciona una muestra de 50 árboles al azar de un bosque húmedo Tropical
(bh-T) en la península de Nicoya. Para cada árbol mide el diámetro a la altura del pecho (cm) y
su altura total (m). Luego obtiene un valor de “r” igual a 0.55 y un valor de “p” calculado igual a
0,04. ¿Es el coeficiente de correlación estadísticamente significativo? Otro investigador que
estudia un de bosque húmedo Tropical (bh-T) cerca de Peñas Blancas, frontera norte, decide
utilizar dicho valor de “r” para caracterizar la relación diámetro-altura de su sitio de estudio.
¿Cuál es su opinión al respecto?
8. Grafique los datos del archivo ppt_5_estaciones.xlsx. Luego, calcule el coeficiente de correlación
lineal de Pearson y Rho de Spearman para Coronado-La Marina; Coronado-Quesada; Coronado-Sta.
María. Compare sus resultados. ¿Es la correlación en todos los casos estadísticamente significativa?
10. El Ministro de Ambiente realizará una conferencia de prensa para anunciar que durante su
gestión se redujo la tala de bosque. Para esto cuenta con los siguientes datos. Usted como asesor
¿Qué le recomendaría? ¿Por qué?
----------------------------------------------------------------
Pearson Correlation Table
========================================================
| Año |No.Perm.FB | No.Perm.B |
-----------+----------+-----------+----------+
Año | | -0.99 | -0.19|
| | (4) | (4) |
| | 0.01 | 0.81|
-----------+----------+-----------+----------+
No.Perm.FB | -0.99| | 0.04|
| (4) | | (4) |
| 0.01| | 0.96|
-----------+----------+-----------+----------+
No.Perm.B | -0.19| 0.04 | |
| (4) | (4) | |
| 0.81| 0.96 | |
-----------+----------+-----------+----------+
Note: the values in the table are listed as follows:
| correlation value |
| (sample size) |
| probability |
A continuación se muestra el volumen autorizado para extracción forestal en áreas fuera del
bosque (Vol m3 FB) y para bosques (Vol m3 B) para el período 1990-1998. También se muestra la
respectiva gráfica. ¿Cuál es el tamaño de la muestra? ¿Existe correlación lineal entre algunas de las
variables en estudio? ¿Qué le indica el signo de r? A qué conclusión se llegaría analizando por
separado los datos de las preguntas 1 y 2. Observe la línea correspondiente a los datos de volumen
aprobado para explotación fuera del bosque; ¿nota algo diferente en dicha línea? ¿Cuál sería su
explicación?
28