Académique Documents
Professionnel Documents
Culture Documents
CORRELACIN Y REGRESIN
Introduccin
En diversos problemas vinculados con el
anlisis de la informacin es importante
estudiar las relaciones que puedan existir
entre dos o ms variables. Preguntas
como: las personas con mayor poder
adquisitivo tienen mayor grado de
educacin? o las empresas familiares
pagan mejor a sus empleados? estn
referidas a las relaciones que podran
existir entre las variables "poder
adquisitivo" y "educacin" o "tipo de
empresa" y "sueldo". Las relaciones entre
variables pueden explorarse algunas veces
usando grficos adecuados, pero tambin
existen medidas que indican no solo la
existencia de la relacin sino tambin la
fuerza de esta. A estas medidas se les
llama medidas de correlacin cuando las
variables en estudio son numricas u
ordinales y medidas de asociacin si las
variables son nominales.
El ndice de correlacin de Pearson
Al colocar en el eje X las edades de un
grupo de pacientes de un hospital y en el
eje Y, el nmero de das que cada uno de
ellos ha necesitado para recuperarse
despus de una determinada operacin, se
obtiene el siguiente diagrama de
dispersin.
Ntese que a mayor edad del paciente
acompaa mayor nmero de das
necesarios para recuperarse. Podemos
decir que las variables edad y estada
covaran de manera positiva. Si ocurriera
que a mayor edad es menor la estada se
dice que ambas variables covaran de
manera negativa.
C( x ,y ) Sxy
xi yi
i 1
XY
C( x ; y )
s x sy
sea mnima
La resolucin y uso de la condicin
permite escribir la recta como:
yY
C( x , y )
(x X)
V(x)