Vous êtes sur la page 1sur 4

Anlisis de datos.

Para establecer la relacin entre las variables estructurales y ambientales


evaluadas y la presencia/ausencia (1/0) de la rana, se realizaron regresiones logsticas para cada
localidad con la ayuda del Statgraphics Plus 5.1 (STATISTICAL GRAPHICS CORP., 1994-2000). En la
seleccin de las variables relacionadas se tuvo en cuenta la bondad de ajuste del modelo, la razn
de verosimilitud de las variables, el anlisis de desvianzas y el R2 ajustado de acuerdo con
CASTAO (2004). Adems, se excluyeron las variables redundantes para reducir la
multicolinealidad. La determinacin de la asociacin entre la densidad poblacional y los cuatro
sitios de estudio con diferente intervencin se realiz mediante Anlisis de correspondencia
cannica con el programa estadstico Canoco 4.5 (Canoco for Windows), en el cual se construy
una matriz con la densidad de las ranas en cada unos de los sitios y momentos versus la matriz con
las diferentes variables ambientales para cada uno de los sitios y momentos.

Regresin logstica

Bondad de ajuste del modelo

Por bondad del ajuste hay que entender el grado de acoplamiento que existe entre
los datos originales y los valores tericos que se obtienen de la
regresin.Obviamente cuanto mejor sea el ajuste, ms til ser la regresin a la
pretensin de obtener los valores de la variable regresando a partir de la
informacin sobre la variable regresora .
Razn de verosimilitud
En estadstica, la funcin de verosimilitud (o, simplemente, verosimilitud) es una funcin
de los parmetros de un modelo estadstico que permite realizar inferencias acerca de su valor
a partir de un conjunto de observaciones.
Analisis de desvianzas
R2

Ejemplo de R-cuadrado ajustado


Por ejemplo, usted trabaja para una compaa de chips de patatas que examina los
factores que afectan el nmero de chips desmenuzados por contenedor. Usted incluye
el porcentaje de patatas en relacin con otros ingredientes, la tasa de enfriamiento y la
temperatura de coccin como predictores en el modelo de regresin. Obtiene los
siguientes resultados a medida que agrega los predictores de forma escalonada hacia
delante:

Temp. Valor p
Tasa de
Pas %Patat de R ajustad
2
de
enfriamient R2
o a cocci o regresi
o
n n

1 X 52 51% 0.000
%

2 X X 63 62% 0.000
%

3 X X X 65 62% 0.000
%

El primer paso produce un modelo de regresin estadsticamente significativo. Al


agregar el segundo trmino, usted observa que el R2 ajustado aument, lo que indica
que la "tasa de enfriamiento" mejor el modelo. Usted agrega el tercer trmino, la
temperatura de coccin, y aunque el R2 aumenta, el R2ajustado no lo hace. Puesto que
la temperatura de coccin no mejor el modelo, usted podra considerar eliminarla del
modelo.

Multicolinealidad

La multicolinealidad en regresin es una condicin que ocurre cuando algunas


variables predictoras del modelo estn correlacionadas con otras variables predictoras.
La multicolinealidad severa es problemtica, porque puede incrementar la varianza de
los coeficientes de regresin, hacindolos inestables. Las siguientes son algunas de las
consecuencias de los coeficientes inestables:

Los coeficientes pueden parecer insignificantes incluso cuando existe una relacin
significativa entre el predictor y la respuesta.
Los coeficientes de predictores altamente correlacionados variarn ampliamente de
una muestra a otra.
La eliminacin de cualquier trmino altemente correlacionado del modelo afectar
considerablemente los coeficientes estimados de los dems trminos altamente
correlacionados. Los coeficientes de los trminos altamente correlacionados incluso
pueden tener el signo equivocado.

Para medir la multicolinealidad, usted puede examinar la estructura de correlacin de


las variables predictoras. Tambin puede examinar los factores de inflacin de la
varianza (FIV). Los FIV miden qu tanto aumenta la varianza de un coeficiente de
regresin estimado aumenta si los predictores estn correlacionados. Si todos los FIV
son 1, no hay multicolinealidad, pero si algunos FIV son mayores que 1, los predictores
estn correlacionados. Cuando un FIV es de 5 a 10, el coeficiente de regresin para ese
trmino no se estima adecuadamente. Si la correlacin de un predictor con otros
predictores es casi perfecta, Minitab muestra un mensaje indicando que el trmino no
se puede estimar. Los valores de FIV para los trminos que no se pueden estimar por
lo general superan un mil millones.

La multicolinealidad no afecta la bondad de ajuste ni la bondad de prediccin. Los


coeficientes (funcin discriminante lineal) no pueden interpretarse de forma fiable,
pero los valores (clasificados) ajustados no se ven afectados.

Correspondencia canonica

El anlisis de correlacin cannica es un mtodo de anlisis multivariante desarrollado


por Harold Hotelling. Su objetivo es buscar las relaciones que pueda haber entre dos grupos
de variables y la validez de las mismas. Se diferencia del anlisis de correlacin mltiple en
que ste solo predice una variable dependiente a partir de mltiples independientes, mientras
que la correlacin cannica predice mltiples variables dependientes a partir de mltiples
independientes. La correlacin hipercannica es una correlacin lineal y, por tanto, solo busca
relaciones lineales entre las variables. En este anlisis, entonces, se crean combinaciones
lineales de las variables originales, sobre la base de su estructura de correlacin. Al disear el
experimento hay que considerar el tamao de la muestra ya que son necesarias un mnimo de
observaciones por variable, para que el anlisis pueda representar las correlaciones
adecuadamente.
Finalmente, hay que interpretar las cargas cannicas para determinar la importancia de cada
variable en la funcin cannica. Las cargas cannicas reflejan la varianza que la variable
observada comparte con el valor terico cannico. El autovalor de cada eje indica la
correlacin multivariada entre las nuevas variables lineales creadas a partir del anlisis.

Vous aimerez peut-être aussi