Vous êtes sur la page 1sur 3

Regresión lineal simple

El concepto de regresión se refiere al “cuantum” o “cantidad de cambio” que expermentan


una variable dependiente (Y), en relación al cambio de una unidad de una variable
independiente (X). la regresión es un concepto estadístico estrechamente vinculado al
concepto de correlacion, mientras la regresión estudia la naturaleza de la relación entre
dos variables dependientes, la correlacion estudia la estrechez de la relación entre esas
dos variables una dependiente de la otra, (Little y Hills, 1978). Al igual que con otros
procedimientos estadísticos, (Dicovskyi, 2002), destaca que en la regresión lineal se desea
realizar una inferencia estadística partiendo de los valores muéstrales obtenidos; por
tanto, se deben cumplir ciertos requisitos, que en el caso de la regresión lineal son los
siguientes:
1. Normalidad y homogeneidad de varianzas en la variable dependiente (Y) del
modelo para los valores fijos de la variable independiente (X).
2. Independencia de las observaciones de Y.
3. Linealidad en la relación entre las variables.
Modelo de regresión lineal simple es el siguiente:

𝒀𝒊 = 𝑩𝒐 + 𝑩𝟏 𝑿𝟏 + 𝒆𝟏

Donde:
𝑌𝑖 = es la variable dependiente
𝐵𝑜 = es la ordenada en el origen, o bien es el intercepto
𝐵1= es la pendiente de la recta de regresión
𝑒1 = es el término del error, es decir la diferencia entre los valores predichos por la
regresión y los valores reales
Diagramas de dispersión
Un diagrama de dispersión es una ilustración gráfica que se usa en el análisis de regresión.
El diagrama de dispersión, también llamado nube de puntos, brinda dos tipos de
información, visualmente se pueden determinar los patrones que indican como las
variables están relacionadas (lineal o mediante una curva) y por otro lado si existe una
relación entre ellas visualizando la clase de línea o ecuación de estimación que describe
a dicha relación.
Método de mínimos cuadrados
El método de mínimos cuadrados sirve para determinar la recta que mejor se ajuste a los
datos muestrales. Una línea de regresión calculada a partir de los datos muéstrales, por el
método de mínimos cuadrados se llama línea de regresión estimada o línea de regresión
muestral.
Existen dos medidas para describir la correlación entre dos variables:
 coeficiente de determinación
 coeficiente de correlación.

Coeficiente de correlación
El coeficiente de correlación es un número que sirve para medir en forma relativa el grado
de asociación lineal entre dos variables (X y Y). El valor del coeficiente de correlación
puede variar entre -1 y 1. Cuando el valor del coeficiente de correlación es negativo, esto
indica una asociación lineal inversa entre X y Y, esto es, cuando X sube Y baja. Los
valores de correlación cercanos a -1 o a 1, indican una fuerte asociación lineal entre X y
Y. Los valores de correlación cercanos a 0 indican falta de asociación lineal entre X y Y.
El coeficiente de determinación muestral

Se representa como r2, y mide exclusivamente la fuerza de una relación lineal entre dos
variables.

La recta de regresión

Un diagrama de dispersión ofrece una idea bastante aproximada sobre el tipo de relación
existente entre dos variables. Además también puede utilizarse como una fórmula de
cuantificar el grado de relación lineal existente entre dos variables: basta con observar el
grado en el que la nube de puntos se ajusta a una línea recta.

Utilizarlo como una forma de cuantificar esa relación tiene un serio inconveniente: la
relación entre dos variables no siempre es perfecta o nula.

Análisis de regresión lineal simple (simple=una variable independiente)

El coeficiente de determinación (R2 o r2) se utiliza con frecuencia porque da una mejor
percepción de la recta aunque no indique la dirección de la correlación.

En la interpretación del coeficiente de correlación se debe tener en cuenta que:

 r = ±1 indica una relación lineal exacta positiva (creciente) o negativa


(decreciente),
 r = 0 indica la no existencia de relación lineal estocástica, pero no indica
independencia de las variables ya que puede existir una relación no lineal incluso
exacta
 valores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la existencia de una relación
lineal estocástica, más fuerte cuanto más próximo a +1 (ó -1) sea el valor de r.
Para poder interpretar con mayor facilidad el coeficiente de correlación muestral se
exponen varias nubes de observaciones y el ajuste lineal obtenido

Errores en regresión lineal

• Ni la regresión lineal ni el coeficiente de correlación indican que un determinado


conjunto de datos tiene una relación lineal.

• Una forma de reducir la cantidad de error es incluir más réplicas de los datos.

• Las bandas de confianza (líneas discontinuas) consisten en un límite superior y un


límite inferior que definen la variación del valor del eje y.

• Un error común es extrapolar más allá de los puntos de datos utilizados para
construir la curva.

Bibliografía
Little, M., & Hills, F. (1981). Metdos estadísticos para la investigación en la agricultura.
Editorial Trillas, Mexico, D.F. p.268
Discovskiy, L. (2002). Folletos del curso “Estadistica Aplicada para Analisis de
Encuestas en SPSS para Windows”. ADESO. Esteli, Nicaragua.
Gutieerrez, H., & De la Vara, R. (2008). Analisis y Diseño de experimentos. Editorial
MCGraw-Hill Interamericana, Mexico, D.F.

Vous aimerez peut-être aussi