Vous êtes sur la page 1sur 7

MEMBRETE

REGRESIN SIMPLE

INFORMACIN ADICIONAL
Anlisis de regresin simple

En estudios de medicina y bioestadstica es muy comn encontrar anlisis

basados en mtodos estadsticos y matemticos. La medicina actual y los estudios

en el rea de salud se apoyan fuertemente en investigaciones de este tipo para

obtener y ofrecer datos y conclusiones cientficas con respecto a variables que

puedan presentarse en el campo. Uno de ellos es el anlisis de regresin lineal

simple, el cual intenta verificar si existe una relacin entre las dos variables de

estudio. Segn Reding (2011), la regresin lineal simple es til para encontrar la

fuerza o magnitud de cmo se relacionan dos variables: una independiente, que se

representa con una X, y otra dependiente, que se identifica con una Y. Por lo tanto,

cuando los investigadores en el rea de la salud encuentran variables de estudio

que de alguna forma consideran que presentan una caracterstica de causalidad,

emplean este tipo de tcnicas para afirmar en un porcentaje la fuerza de asociacin

entre ellas.

Un ejemplo de esto son los sntomas de las enfermedades. Es increble reconocer

que incluso hasta para estudios sintomticos de enfermedades, existen estudios

estadsticos para comprobar su relacin. En el caso de alguna ITS, los individuos de

la muestra, que para este caso son personas que poseen una determinada ITS,

informan al mdico el tiempo que ha pasado entre los sntomas y el ltimo contacto

sexual. Adems de ello verifican la infeccin de otra ITS y verifican si hay una

relacin entre una ITS y otra. A travs de este tipo de estudios se ha verificado que

existe una alta probabilidad de una ITS venga acompaada de una infeccin por

hongos (clamidia). Es por ello que los investigadores en el rea de salud se plantean
hiptesis de la relacin entre dos variables, realizan el estudio de regresin lineal

simple, para comprobar que existe una correlacin entre las variables.

El mtodo de regresin lineal simple est definido por ciertos aspectos tcnicos.

El primero es la existencia de dos variables de estudio. Si se quiere realizar un

anlisis de correlacin o causalidad, deben existir entonces dos variables en las

cuales se presuma dependencia. El segundo sera la identificacin de la variable

independiente. En la hiptesis del investigador, est presente un factor que hace

que otro factor ocurra. El primero es llamado variable independiente y el segundo,

dependiente. En un diagrama de dispersin, la independiente se grafica en el eje de

las abscisas y la dependiente en el eje de las ordenadas. De esta manera se puede

ver de una forma grfica si existe una armona entre los dos comportamientos. Si en

el grfico se verifica que hay una tendencia lineal de los datos, entonces se puede

presumir que un anlisis de correlacin lineal simple es ideal para determinar el

grado de asociacin de las variables.

El estudio del anlisis de correlacin arroja un nmero que va desde -1 hasta 1.

Una correlacin que se acerque a -1, indica una correlacin negativa, es decir, que

la variable dependiente causa un comportamiento inverso a la variable

dependiente. Una correlacin positiva cercana a 1, muestra que el mismo

comportamiento que posee la variable dependiente, la posee la independiente. Si

una aumenta, la otra tambin y viceversa. Un resultado cercano a cero indica que

no hay correlacin entre las variables, es decir, el comportamiento de una variable

no afecta a la otra.

Adems de esto, el mtodo de correlacin lineal simple no solo muestra

correlacin, sino proyeccin, la cual se calcula a travs de un estudio de lnea recta

con la frmula Y = aX+b. La determinacin de los valores de a y b, dan forma a


la recta y permiten el pronstico. X y Y representan las variables independiente y

dependiente, respectivamente. El coeficiente a representa la pendiente de la

recta y b el corte con el eje Y. Este estudio se hace a travs de la determinacin

de una recta donde la sumatoria de las distancias de todos los puntos de la grfica

a la recta sea la menor posible. A esta tcnica se le denomina los mnimos

cuadrados. Este estudio es muy explcito y expedito a la hora de representar

correlacin entre las variables, no obstante, no indica que haya una asociacin real

o una causalidad verdadera.

Por ser un estudio muy caracterstico, donde se necesita un conjunto de

individuos u observaciones representativos, se realiza la tcnica del muestreo, que

es seleccionar la cantidad de individuos de la poblacin que pasarn a ser parte de

la muestra o estudio. El muestreo es necesario, puesto que hay estudios con

poblaciones que poseen un nmero inmenso de individuos y, realizar el estudio

para todos, sera muy costoso. Una cantidad representativa y estudiada sera

suficiente para estudiar a la poblacin total.

El estudio de regresin simple posee diferentes supuestos o conjeturas que

estn implcitos dentro da cada estudio y definen el comportamiento y las

caractersticas de la regresin. El primero es el supuesto de normalidad. Este indica

que los errores observados en el estudio, tienen una distribucin normal con media

0 y poseen su varianza constante. En este caso, se indica que los valores de la

variable dependiente siguen una distribucin de campana de Gauss o normal. En un

tal caso de que esto no suceda, sera recomendable la transformacin de la variable

para convertirla en variable de distribucin normal. El segundo es la independencia

de los errores. A pesar de que la tcnica identifique una relacin de dependencia

entre variables, los errores o, en su defecto, las magnitudes de los errores son
independientes entre s. Esto se explica porque la relacin producto de la regresin

se hace en base a los valores totales de cada observacin y no a sus errores con

respecto a la grfica o recta de mnimos cuadrados. Cabe destacar que los errores

de los que se mencionan no pertenecen a una muestra; al contrario, pertenecen a

muchas muestras estudiadas a travs del tiempo.

La tercera conjetura es la homocedasticidad. Esto no es ms que la cualidad de

presentar una varianza constante en los errores. Tal cual como se mencion en la

primera conjetura. Incluso, el estudio de mnimos cuadrados hace posible este

supuesto, donde la variacin de los errores se mantiene para todas las muestras del

modelo. Un ejemplo es una estatura de adultos nativos de una regin con respecto

a otra variable como la prctica del deporte. Si en esa muestra, a medida que

avanza Y, el error aumenta, habr cambio en la varianza del mismo, por lo tanto no

se presenta homocedasticidad. Si practican deporte pero su estatura cambia de

forma inesperada a medida que X avanza, entonces debe haber un mal

procedimiento en la toma de la muestra o datos relacionados. Cuando un modelo es

lineal y presenta una distribucin normal sin sesgo, sus errores presentan una

varianza constante. Al presentarse un sesgo en la distribucin de las variables, el

modelo pierde su carcter lineal y la varianza deja de ser constante, presentndose

heterodasticidad.

El ltimo factor es la linealidad de los datos. Es necesario saber si despus de

establecerse los datos de la variable independiente, las medias de los datos de Y

forman una lnea recta. Si esto es posible, entonces hay un comportamiento lineal

de la variable Y, haciendo que un estudio de regresin lineal sea apropiado. Si esto

no sucede, lo ms conveniente es aplicar mtodos estadsticos ms complejos o

normalizar la variable Y.
A pesar de ser un anlisis de ecuaciones y estudios simples, la aplicacin de esta

tcnica requiere prudencia, puesto que toda muestra puede ser sometida a un

estudio de regresin lineal simple, pero no a toda muestra es aplicable este tipo de

estudio. Si alguna de las conjeturas no se cumple, es posible que el anlisis tenga

cierto desacierto.
Bibliografa

Lind, D. (2012). Estadstica Aplicada a la Economa y a los Negocios de Lind.

Recuperado de http://es.slideshare.net/SaariithaaS/estadistica-aplicada-a-los-

negocios-y-economia-15-ed-lind-marchal-wathen

Reding, A (2011). Cmo y cundo realizar un anlisis de regresin lineal simple?

Aplicacin e interpretacin. Recuperado de

http://www.medigraphic.com/pdfs/derrevmex/rmd-2011/rmd116n.pdf

Spiegel, M (1991). Estadstica. Recuperado de

http://es.slideshare.net/willsontamayo7/estadistica-de-schaum-spiegel