Vous êtes sur la page 1sur 19

Nombre: Ana Salazar

Actividad evaluativa 5. Correlación, regresión y comparación de medias


EJERCICIOS: Correlación
1. Calcule la existencia de correlación con los siguientes datos. Calcule el
coeficiente de determinación e interprete los resultados.

x y
13 50
14 53
16 37
17 41
21 35
25 25
26 27
29 30
Coeficiente de correlación: -0,88977
Coeficiente de determinación: 79,17%
La relación lineal entre las variables presentadas es fuerte.
Las variables x e y comparten un 79,17% de datos.
2. La correlación entre depresión y autoestima es de r = -0,57. Calcule el
coeficiente de determinación e interprete los dos resultados.
Coeficiente de correlación: 𝑟 = −0,57
Coeficiente de determinación: 𝑅 2 = (−0,57)2 = 𝟑𝟐, 𝟒𝟗%
Sin comprobar la significancia de los coeficientes de correlación y determinación,
se puede afirmar que la relación lineal entre las variables 'depresión’ y ‘autoestima’
es moderada; y, que comparten un 32,49% de los datos.
3. La correlación del ejercicio 1, ¿es significativa con una confiabilidad del
95%? (determínelo por medio de la prueba de hipótesis).
Se plantean las hipótesis para comprobar la significación de la correlación
presentada en el ejercicio 1:
H0: rxy = 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es cero (ρ = 0).
H1: rxy ≠ 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es distinta de cero (ρ ≠ 0).
Para comprobar la hipótesis nula, se procede al cálculo de un valor “t” de prueba
mediante la ecuación:
𝑟𝑥𝑦 − 0
𝑡=
2
√1 − 𝑟𝑥𝑦
𝑁−2
En donde:
 rxy es el coeficiente de correlación en valor absoluto. El valor obtenido fue
de -0,88977.
 N-2 el número de grados de libertad para el estadístico de prueba t de
student. Para el caso propuesto el número de grados de libertad es:
8-2 = 6.
A continuación, se calcula el estadístico:
0,88977 − 0
𝑡= = 𝟒, 𝟕𝟕𝟓
2
√1 − 0,88977
8−2
Una vez obtenido el estadístico de prueba calculado, se procede a compararlo con
el estadístico tabulado, con un nivel de confiabilidad del 95%:

El estadístico tabulado para t (0,05;6) = 2,36.


Finalmente, se compara el estadístico calculado con el tabulado. El resultado se
interpreta de la siguiente manera:
t > t (α; N-2): ⇒ Se rechaza la Hipótesis nula. La correlación obtenida no procede de
una población cuyo valor ρxy = 0. Por tanto, las variables están relacionadas.
t < t (α; N-2): ⇒ Se acepta la Hipótesis nula. La correlación obtenida procede de una
población cuyo valor ρxy = 0. Por tanto, las variables no están relacionadas.
Para nuestro caso: 4,775 > 2,36. Se rechaza la hipótesis nula; por lo tanto, las
variables están relacionadas; con una confiabilidad del 95%.
4. Grafique los siguientes puntos e indique si hay correlación y si esta es
significativa (NC=95%).

x y
4 10
5 6
5 7
6 8
7 6
8 3
10 3
5 11
13 14
15 12
18 20
23 23
27 29
29 27

35

30

25

20

15

10

0
0 5 10 15 20 25 30 35

Coeficiente de correlación: 0,909


Existe una correlación fuerte entre ambas variables.
A continuación, se comprobará si dicha correlación es significativa:
H0: rxy = 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es cero (ρ = 0).
H1: rxy ≠ 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es distinta de cero (ρ ≠ 0).
Se calcula el estadístico de prueba:
𝑟𝑥𝑦 − 0
𝑡=
2
√1 − 𝑟𝑥𝑦
𝑁−2
0,909 − 0
𝑡= = 𝟕, 𝟓𝟓𝟓.
2
√1 − 0,909
14 − 2
Se comprueba con el estadístico de tablas:

t (0,05;12) = 2,18.
En este caso: 7,555 > 2,18; por lo tanto, se rechaza la hipótesis nula; es decir, sí
existe correlación entre las variables, con un nivel de significancia del 95%.
5. Encuentre la correlación entre un índice de inteligencia social y otro de
desempeño laboral (X e Y, respectivamente). Realice una predicción para X =
16, X = 18 y X = 8.
X Y
25 5
15 4
10 3
25 5
20 4
23 4
2 1
5 2
7 3
9 3
10 3
15 4

Coeficiente de correlación: 0,9336


Según el coeficiente de correlación calculado, existe una relación fuerte entre las
variables: ‘inteligencia social’ y ‘desempeño laboral’.
Predicción de valores:

X Y
25 5
15 4
10 3
25 5
20 4
23 4
2 1
5 2
7 3
9 3
10 3
15 4
16 4
18 4
8 3

6. Construya un gráfico para los datos del ejercicio 5, calcule el coeficiente


de determinación y represente la recta de regresión y los nuevos puntos
calculados.
Gráfica de los datos:

y = 0.1371x + 1.52
5 R² = 0.8717

0
0 5 10 15 20 25 30

Coeficiente de determinación: 0,8717


Gráfica de datos con los valores predichos:

y = 0.135x + 1.5949
5 R² = 0.866

0
0 5 10 15 20 25 30

7. Calcule la recta de regresión que mejor ajusta los datos entre asertividad
(X) y autoimagen (Y). Realice una predicción cuando X = 50. ¿El valor del
coeficiente de correlación, es significativo al 95% de confianza?
X Y
20 60
10 50
32 65
33 66
34 65
35 61
36 69
38 66
40 68
41 65
41 73
43 68
45 71
45 74
47 71
48 75

80
y = 0.5649x + 45.928
70 R² = 0.8341

60

50

40

30

20

10

0
0 10 20 30 40 50 60

Coeficiente de correlación: 0,9133


Se puede predecir una Y = 74 cuando X = 50.
Para comprobar si la correlación es significativa al 95% de confiabilidad:
H0: rxy = 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es cero (ρ = 0).
H1: rxy ≠ 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es distinta de cero (ρ ≠ 0).
Se calcula el estadístico de prueba:
𝑟𝑥𝑦 − 0
𝑡=
2
√1 − 𝑟𝑥𝑦
𝑁−2
0,9133 − 0
𝑡= = 𝟖, 𝟑𝟗
2
√1 − 0,9133
16 − 2
Se comprueba con el estadístico tabulado:

t (0,05;14) = 2,14.
En este caso: 8,39 > 2,14; por lo tanto, se rechaza la hipótesis nula; es decir, sí
existe correlación entre las variables, con un nivel de significancia del 95%.
8. Responda a la siguiente pregunta: ¿Las personas que más ejercicio
realizan (X), tienen más disposición al consumo de alcohol (Y)? Realice una
predicción cuando X = 4.
X Y
10 2
10 1
2 9
3 8
5 7
9 1
8 3
4 5
5 5
10 1
2 9
3 8
5 7
9 1
1 8
2 9

De acuerdo a los datos, se podría afirmar que no; que las personas que más
ejercicio realizan, tienen menos disposición al consumo de alcohol.
Se podría predecir para un X = 4, que Y = 7.
9. Grafique los datos del ejercicio 8, calcule el coeficiente de correlación y de
determinación y pruebe la hipótesis de que más ejercicio implica menos
consumo, con un nivel de confianza del 95%.

10

3
y = -0.9451x + 10.448
2 R² = 0.9213

0
0 2 4 6 8 10 12

Coeficiente de correlación: -0,9599


Coeficiente de determinación: 0,9213
Para comprobar la hipótesis planteada, se debe cumplir la hipótesis nula que se
plantea a continuación:
H0: rxy = 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es cero (ρ = 0).
H1: rxy ≠ 0. El coeficiente de correlación obtenido procede de una población cuya
correlación es distinta de cero (ρ ≠ 0).
Se calcula el estadístico de prueba:
𝑟𝑥𝑦 − 0
𝑡=
2
√1 − 𝑟𝑥𝑦
𝑁−2
0,9599 − 0
𝑡= = 𝟏𝟐, 𝟖𝟏
2
√1 − 0,9599
16 − 2
Se comprueba con el estadístico tabulado:

t (0,05;14) = 2,14.
En este caso: 12,81 > 2,14; por lo tanto, se rechaza la hipótesis nula; es decir, sí
existe correlación entre las variables, con un nivel de significancia del 95%.
Se puede concluir entonces que más ejercicio implica menos consumo de
alcohol.
EJERCICIOS: Comparación de medias
1. Se mide el antígeno G en 10 chicas adolescentes del pueblo A y en otras
10 del pueblo B. Los resultados (en ng/ml) son los siguientes:
A 13 16 15 12 10 12 14 9 8 12
B 9 10 12 13 11 7 8 10 15 9

Valore la afirmación “Las chicas de A tienen un G claramente superior a las


de B”
µA = 12,1 µB = 10,4
SA = 2,56 SB = 2,41
nA = 10 nB = 10
α = 0,05.
δ=0
H0: µA = µB. No existe diferencia significativa entre las muestras A y B.
H1: µA > µB. Existe diferencia significativa entre A y B.
Se usará el estadístico t debido al tamaño de la muestra (<30).
Se procede primero con el cálculo de la varianza:
(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2
2
𝜎 =
𝑛𝐴 + 𝑛𝐵 − 2

2
(10 − 1)2,562 + (10 − 1)2,412
𝜎 = = 𝟔, 𝟏𝟖
10 + 10 − 2
Se calcula t:
(𝜇𝐴 − 𝜇𝐵 ) − 𝛿
𝑡=
𝜎2 𝜎2

𝑛𝐴 + 𝑛𝐵
(12,1 − 10,4) − 0
𝑡= = 𝟎, 𝟔𝟏𝟓
2 2
√6,18 + 6,18
10 10
Se determina t tabulado, con α = 0,05 y 18 grados de libertad.
t (0,05;18) = 1,7341.
Debido a que t < t (0,05;18), se acepta la hipótesis nula; es decir, que no se
puede afirmar que las chicas de A tienen un G claramente superior a las
chicas de B.
2. En esas mismas chicas se determina el antígeno H.
A 1 2 3 4 5 6 7 8 9 10
B 3 3 2 4 3 2 4 3 3 2

Valore la afirmación “Las chicas de A tienen un H estadísticamente similar a


las de B”
H0: µA = µB. No existe diferencia significativa entre las muestras A y B.
H1: µA > µB. Existe diferencia significativa entre A y B.
µA = 5,5 µB = 2,9
SA = 3,03 SB = 0,74
nA = 10 nB = 10
α = 0,05.
δ=0
Se procede primero con el cálculo de la varianza:
(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2
𝜎2 =
𝑛𝐴 + 𝑛𝐵 − 2
(10 − 1)3,032 + (10 − 1)0,742
𝜎2 = = 𝟒, 𝟖𝟔
10 + 10 − 2
Se calcula t:
(𝜇𝐴 − 𝜇𝐵 ) − 𝛿
𝑡=
𝜎2 𝜎2

𝑛𝐴 + 𝑛𝐵
(5,5 − 2,94) − 0
𝑡= = 𝟏, 𝟏𝟖
2 2
√4,86 + 4,86
10 10
Se determina t tabulado, con α = 0,05 y 18 grados de libertad.

t (0,05;18) = 1,7341.
Debido a que t < t (0,05;18), se acepta la hipótesis nula; es decir, que se puede
afirmar que H es estadísticamente similar para los dos grupos.
3. Se estudió el contenido de alquitrán de dos marcas de cigarrillos. En 121
cigarrillos de la marca A se encontró una media de 11 mg y una desviación
estándar de 2,28. En 181 cigarrillos de la marca B: media 13 mg, s=2 ¿Qué
conclusión puede extraerse?
̅̅̅̅
𝑋 𝑨 = 11
̅̅̅̅
𝑋 𝑩 = 13

SA = 2,28 SB = 2
nA = 121 nB = 181
α = 0,01
δ=0
H0: µA = µB. No existe diferencia significativa entre las muestras A y B.
H1: µB > µA. Existe diferencia significativa entre A y B.
Debido al tamaño de la muestra, se utiliza el estadístico Z:
̅̅̅̅
(𝑋 ̅̅̅̅
𝑩 − 𝑋𝑨 ) − 𝛿
𝑍=
2 2
√𝑆𝐴 + 𝑆𝐵
𝑛𝐴 𝑛𝐵

(13 − 11) − 0
𝑍= = 𝟕, 𝟖𝟒
2 2
√2,28 + 2
121 181
Se compara con Z tabulado con α/2 = 0,005

Z0,005 = -2,58.
Al ser una prueba de dos colas, si Z > 2,58 o Z < -2,58; entonces se rechaza la
hipótesis nula.
En este caso 7,84 > 2,58; por lo que se rechaza la hipótesis nula; es decir, existe
una diferencia significativa entre ambas marcas.
4. En 10 pacientes se valora la TAS (tensión arterial sistólica) antes y
después de un mes de dieta sin sal. Se quiere saber si ha sido eficaz. Los
datos:
Antes 140 165 160 160 175 190 170 175 155 160
Después 145 150 150 160 165 175 160 165 145 170

H0: µA = µD. No existe diferencia significativa entre las muestras Antes y Después.
H1: µA > µD. Existe diferencia significativa entre Antes y después.
µA = 165 µD = 158,5
SA = 13,54 SB = 10,55
nA = 10 nB = 10
α = 0,05.
δ=0
Se procede primero con el cálculo de la varianza:
(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2
𝜎2 =
𝑛𝐴 + 𝑛𝐵 − 2
(10 − 1)13,542 + (10 − 1)10,552
𝜎2 = = 𝟏𝟒𝟕, 𝟑𝟐
10 + 10 − 2
Se calcula t:
(𝜇𝐴 − 𝜇𝐵 ) − 𝛿
𝑡=
𝜎2 𝜎2

𝑛𝐴 + 𝑛𝐵
(165 − 158,5) − 0
𝑡= = 𝟎, 𝟎𝟗𝟗
2 2
√147,32 + 147,32
10 10
Se determina t tabulado, con α = 0,05 y 18 grados de libertad.
t (0,05;18) = 1,7341.
Debido a que t < t (0,05;18), se acepta la hipótesis nula; es decir, que el
tratamiento no ha sido eficaz, pues los resultados son similares antes y
después.
5. Un programa de incremento de competencia cultural dirigido a enfermeras
es aplicado tras pasar un primer test y obtener unas puntuaciones (cuanto
mayor, más competencia cultural). Tras el programa, se vuelve a pasar el
test obteniendo los siguientes resultados:
Enfermera Test Test
(antes) (post)
1 5 7
2 6 7
3 9 8
4 6 5
5 7 7
6 5 8
7 9 9
8 7 9
9 7 8
10 10 9
11 8 7
12 8 10
13 7 8
14 5 5
15 9 9
16 7 8
17 7 9
18 10 10
19 8 9
20 5 5
21 5 6
22 7 7
23 6 6
24 9 8
25 8 9
26 10 9
27 7 7
28 6 9
29 7 9
30 9 10
Indique si existen diferencias significativas entre las puntuaciones obtenidas
pre y post, considerando un nivel de significación del 0,05.
H0: µA = µD. No existe diferencia significativa entre los tests Antes y Después.
H1: µA < µD. Existe diferencia significativa entre Antes y después.
µA = 7,3 µD = 7,9
SA = 1,58 SB = 1,47
nA = 30 nB = 30
α = 0,05.
δ=0
Se procede primero con el cálculo de la varianza:

2
(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2
𝜎 =
𝑛𝐴 + 𝑛𝐵 − 2

2
(30 − 1)1,582 + (30 − 1)1,472
𝜎 = = 𝟐, 𝟑𝟑
30 + 30 − 2
Se calcula t:
(𝜇𝐴 − 𝜇𝐵 ) − 𝛿
𝑡=
𝜎2 𝜎2

𝑛𝐴 + 𝑛𝐵
(7,9 − 7,3) − 0
𝑡= = 𝟎, 𝟗𝟗𝟕
2 2
√2,33 + 2,33
30 30
Se determina t tabulado, con α = 0,05 y 58 grados de libertad.

t (0,05;58) = 1,6716.
Debido a que t < t (0,05;58), se acepta la hipótesis nula; es decir, que no existe
diferencia significativa entre antes y post.

Vous aimerez peut-être aussi