Vous êtes sur la page 1sur 22

ESCUELA SUPERIOR POLITÉCNICA DE

CHIMBORAZO
FACULTAD DE CIENCIAS
ESCUELA DE BIOQUÍMICA Y FARMACIA
BIOMETRÍA Y DISEÑO EXPERIMENTAL
MODELOS DE REGRESIÓN

Profesor: Dr. Jaime Béjar S.


Introducción

Aquí se estudia la relación entre dos variables de intervalo (o de


razón). A continuación se trata el modelo más general con relaciones
del tipo 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏, que es la ecuación de una recta o polinomio de
primer grado, donde a y b se conocen como coeficientes de
regresión. Este modelo se lo conoce con el nombre de Análisis de
Regresión lineal.

Conviene hacer una aclaración para distinguir entre Análisis de


Regresión y Análisis de Correlación.
El Análisis de Regresión se lo usa cuando el investigador sabe que existe una
relación entre las variables porque hay una teoría o investigaciones previas
que la han descubierto. Por ejemplo, la relación entre espacio y tiempo ya se
sabe que es la velocidad, o como la relación entre voltaje e intensidad de
corriente eléctrica. En estos casos, el investigador suele estar interesado en
verificar experimentalmente tal relación y el objeto de la regresión es
encontrar la curva que mejor ajuste a sus datos experimentales.
El Análisis de Correlación se emplea cuando el investigador sospecha que
ambas magnitudes están relacionadas, pero no tiene idea de una ecuación
que las combine. Por ejemplo el caso de peso y talla, donde todo lo que se
sospecha es que a mayor talla, mayor peso, pero nadie ha descubierto una
fórmula que las relacione.
Análisis de regresión lineal simple
• En un grupo de 8 pacientes se miden las cantidades antropométricas
peso y edad, obteniéndose los siguientes resultados:

x = edad y = peso La variable dependiente 𝑦𝑦 que se


12 58 desea pronosticar es 𝑦𝑦 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝,
8.0 42
mientras que la variable
10 51
11 54 independiente es 𝑥𝑥 = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒. Puesto
7.0 40 que es una sola variable
7.0 39 independiente, se utiliza una
10 49 regresión lineal simple.
14 56
Solución con MegaStat
Solución con MegaStat

Regression Analysis 𝑟𝑟 (coeficiente de correlación), es 0.943, lo


r² 0.890
que indica que hay una excelente correlación
r 0.943 entre las variables ( Perfecta: 𝑟𝑟 = 0.5,
Std. Error 2.673
n 8 Excelente: 0.9 ≤ 𝑟𝑟 < 1, Buena: 0.8 ≤
k 1
Dep. Var. Y = peso 𝑟𝑟 < 0.9, Regular: 0.5 ≤ 𝑟𝑟 < 0.8, Mala:
ANOVA table
𝑟𝑟 < 0.5 ).
Source SS df MS F p-value 𝑟𝑟 2 (coeficiente de determinación), indica
Regression 345.0179 1 345.0179 48.30 .0004
Residual 42.8571 6 7.1429 que el 89.0% de la variable dependiente
Total 387.8750 7
es explicada por la variable
Regression output confidence interval
independiente (bondad de de ajuste).
variables coefficients std. error t (df=6) p-value 95% lower 95% upper La recta de regresión es:
Intercept 20.6122 4.1399 4.979 .0025 10.4823 30.7422
X = edad 2.8367 0.4082 6.950 .0004 1.8380 3.8355 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 = 20.6122 + 2.8367𝑥𝑥
Solución con Minitab
Solución con Minitab
Análisis de regresión lineal múltiple
• Se conoce que cierta variable Y depende linealmente de las variables
𝑥𝑥1 y 𝑥𝑥2 :

y x1 x2 Puesto que existen dos variables


30 20 25
independientes (𝑥𝑥1 y 𝑥𝑥2 ), se utiliza
60 40 50
40 20 35 una regresión lineal múltiple.
60 30 50
30 10 40
40 10 50
𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑥𝑥1 + 𝑐𝑐𝑥𝑥2
40 20 50
50 20 60
30 20 40
70 30 80
Solución con MegaStat

𝑟𝑟 (coeficiente de correlación), es 0.950, lo que


indica que hay una Excelente correlación
entre las variables ( Perfecta: 𝑟𝑟 = 0.5,
Excelente: 0.9 ≤ 𝑟𝑟 < 1, Buena: 0.8 ≤
𝑟𝑟 < 0.9, Regular: 0.5 ≤ 𝑟𝑟 < 0.8, Mala:
𝑟𝑟 < 0.5 ).
𝑟𝑟 2 (coeficiente de determinación), explica
el porcentaje (90.2%) de la variable
dependiente, es explicada por la variable
independiente (bondade de ajuste).
Por tanto la recta de regresión es:
Y = -1.7242 + 0.8448X1 + 0.5862X2
Solución con Minitab
Solución con Minitab
Análisis de regresión curvilínea
• No siempre la curva de regresión es una línea recta dada por 𝑦𝑦 = 𝑎𝑎 +
𝑏𝑏𝑏𝑏. Por ejemplo, si un conjunto de datos pareados, que consisten en
n puntos 𝑥𝑥𝑖𝑖 , 𝑦𝑦𝑖𝑖 “se alinean” cuando log 𝑦𝑦𝑖𝑖 se grafica contra 𝑥𝑥𝑖𝑖 , ello
indica que la curva de regresión de 𝑦𝑦 sobre 𝑥𝑥 es exponencial; es decir,
la relación entre variables es
𝑦𝑦 = 𝑎𝑎 𝑏𝑏 𝑥𝑥
O equivalentemente,
log 𝑦𝑦 = log 𝑎𝑎 + 𝑥𝑥 log 𝑏𝑏
Otras relaciones que se encuentran frecuentemente en aplicaciones
prácticas son las siguientes:

La función recíproca: 1
𝑦𝑦 =
𝑎𝑎 + 𝑏𝑏𝑏𝑏

La función exponencial: 𝑦𝑦 = 𝑒𝑒 𝑎𝑎+𝑏𝑏𝑏𝑏

La función polinomial: 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐𝑥𝑥 2 + ⋯ + 𝑐𝑐𝑥𝑥 𝑛𝑛

etc.
Ejercicio:
Los siguientes datos pertenecen al crecimiento de una colonia de
bacterias en un medio de cultivo:

x = Días desde la a) Grafique log 𝑦𝑦𝑖𝑖 contra 𝑥𝑥𝑖𝑖 para


y = Conteo
inoculación verificar que sea razonable
3 115000 ajustar una curva exponencial.
6 147000 b) Ajuste una curva exponencial a
los datos dados.
9 239000 c) Use el resultado obtenido en el
12 356000 inciso b) para estimar el conteo
15 579000 de bacterias al final de 20 días.

18 864000
Solución:
a) Como se observa a continuación si resulta razonable ajustar los datos
a una curva exponencial.

x log y

3 5.06
6 5.17
9 5.38
12 5.55
15 5.76
18 5.94
b)
b) La solución obtenida del software
Minitab es:

log 𝑦𝑦 = 4.842 + 0.06036 𝑥𝑥

O, equivalentemente,

𝑥𝑥
𝑦𝑦 = 69502.4 1.149

c) Sustituyendo 𝑥𝑥 = 20 días en la
ecuación de la curva de ajuste
obtenida en el inciso anterior se tiene:

20
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 = 69502.4 1.149
= 1117894 bacterias
b) Realmente se puede demostrar que existe otra curva que ajusta mejor los datos
experimentales, la cual se la obtiene a continuación:
b)
b)
c)

Sustituyendo 𝑥𝑥 = 20 días en la ecuación de la curva de ajuste


obtenida se tiene:

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 = 66110 𝑒𝑒 0.14304 𝑥𝑥 = 1155305 bacterias

Vous aimerez peut-être aussi