Académique Documents
Professionnel Documents
Culture Documents
Note: Before using this information and the product it supports, read the general information
under Notices el p. 47.
This document contains proprietary information of SPSS Inc, an IBM Company. It is provided
under a license agreement and is protected by copyright law. The information contained in this
publication does not include any product warranties, and any statements provided in this manual
should not be interpreted as such.
When you send information to IBM or SPSS, you grant IBM and SPSS a nonexclusive right
to use or distribute the information in any way it believes appropriate without incurring any
obligation to you.
Copyright SPSS Inc. 1989, 2010.
Prefacio
IBM SPSS Statistics es un sistema global para el anlisis de datos. El mdulo adicional
opcional Regresin proporciona las tcnicas de anlisis adicionales que se describen en este
manual. El mdulo adicional Regresin se debe utilizar con el sistema bsico de SPSS Statistics y
est completamente integrado en dicho sistema.
Asistencia tcnica
El servicio de asistencia tcnica est a disposicin de todos los clientes de mantenimiento. Los
clientes podrn ponerse en contacto con este servicio de asistencia tcnica si desean recibir ayuda
sobre la utilizacin de los productos de SPSS Inc. o sobre la instalacin en alguno de los entornos
de hardware admitidos. Para ponerse en contacto con el servicio de asistencia tcnica, consulte el
sitio web de SPSS Inc. en http://support.spss.com o encuentre a su representante local a travs
del sitio web http://support.spss.com/default.asp?refpage=contactus.asp. Tenga a mano su
identificacin, la de su organizacin y su contrato de asistencia cuando solicite ayuda.
iii
Cursos de preparacin
SPSS Inc. ofrece cursos de preparacin, tanto pblicos como in situ. Todos los cursos incluyen
talleres prcticos. Los cursos tendrn lugar peridicamente en las principales ciudades. Si
desea obtener ms informacin sobre estos cursos, pngase en contacto con su oficina local que
encontrar en el sitio Web en http://www.spss.com/worldwide.
Publicaciones adicionales
Los documentos SPSS Statistics: Guide to Data Analysis, SPSS Statistics: Statistical Procedures
Companion y SPSS Statistics: Advanced Statistical Procedures Companion, escritos por Marija
Noruis y publicados por Prentice Hall, estn disponibles y se recomiendan como material
adicional. Estas publicaciones cubren los procedimientos estadsticos del mdulo SPSS Statistics
Base, el mdulo Advanced Statistics y el mdulo Regression. Tanto si da sus primeros pasos en el
anlisis de datos como si ya est preparado para las aplicaciones ms avanzadas, estos libros le
ayudarn a aprovechar al mximo las funciones ofrecidas por IBM SPSS Statistics. Si desea
informacin adicional sobre el contenido de la publicacin o muestras de captulos, consulte el
sitio web de la autora: http://www.norusis.com
iv
Contenido
1
Regresin Logstica
11
Anlisis probit
22
Regresin no lineal
26
Estimacin ponderada
35
38
Apndices
A Esquemas de codificacin de variables categricas
41
Desviacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Helmert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Diferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Polinmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Repetido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Indicador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
vi
B Notices
47
ndice
49
vii
Captulo
Los modelos de regresin logstica binaria pueden ajustarse mediante el uso del procedimiento
de Regresin logstica o del procedimiento de Regresin logstica multinomial. Cada uno de
estos dos procedimientos contiene opciones que no estn disponibles en el otro. Existe entre
ambos una distincin terica importante: el procedimiento de Regresin logstica genera todas
las predicciones, residuos, estadsticos de influencia y pruebas de bondad de ajuste utilizando los
datos a nivel de los casos individuales, independientemente de la forma en que los datos hayan
sido introducidos y de si el nmero de patrones en las covariables es o no menor que el nmero
total de casos; el procedimiento de Regresin logstica multinomial, por su parte, agrega los casos
de manera interna para formar subpoblaciones con patrones en las covariables idnticos para las
variables predictoras, generando predicciones, residuos y pruebas de bondad de ajuste basadas en
las citadas subpoblaciones. Si todas las variables predictoras son categricas, o si alguna variable
predictora continua toma slo un nmero limitado de valores (de manera que haya varios casos
para cada patrn en las covariables), la aproximacin mediante subpoblaciones puede generar
pruebas de bondad de ajuste vlidas y residuos que sean informativos, mientras que el mtodo a
nivel de los casos individuales no lo permite.
La opcin Regresin logstica ofrece una serie de funciones nicas que se detallan a continuacin:
Prueba de bondad de ajuste del modelo de Hosmer-Lemeshow
Anlisis por pasos
Contrastes para definir la parametrizacin del modelo
Puntos de corte alternativos para la clasificacin
Grficos de clasificacin
Aplicacin de un modelo ajustado mediante un conjunto de casos sobre otro conjunto de
casos reservados
Almacenamiento de pronsticos, residuos y estadsticos de influencia
La opcin Regresin logstica multinomial ofrece una serie de funciones nicas que se detallan
a continuacin:
Pruebas chi-cuadrado de Pearson y de desviacin sobre la bondad de ajuste del modelo
Especificacin de subpoblaciones para el agrupamiento de los datos, para las pruebas de
bondad de ajuste
Listado de las frecuencias, frecuencias pronosticadas y residuos por subpoblaciones
Correccin de las estimaciones de la varianza por sobredispersin
Copyright SPSS Inc. 1989, 2010
2
Captulo 1
Captulo
Regresin Logstica
La regresin logstica resulta til para los casos en los que se desea predecir la presencia o ausencia
de una caracterstica o resultado segn los valores de un conjunto de predictores. Es similar a un
modelo de regresin lineal pero est adaptado para modelos en los que la variable dependiente es
dicotmica. Los coeficientes de regresin logstica pueden utilizarse para estimar la razn de las
ventajas (odds ratio) de cada variable independiente del modelo. La regresin logstica se puede
aplicar a un rango ms amplio de situaciones de investigacin que el anlisis discriminante.
Ejemplo. Qu caractersticas del estilo de vida son factores de riesgo de enfermedad
cardiovascular ? Dada una muestra de pacientes a los que se mide la situacin de fumador, dieta,
ejercicio, consumo de alcohol, y estado de enfermedad cardiovascular, se puede construir un
modelo utilizando las cuatro variables de estilo de vida para predecir la presencia o ausencia
de enfermedad cardiovascular en una muestra de pacientes. El modelo puede utilizarse
posteriormente para derivar estimaciones de la razn de las ventajas para cada uno de los
factores y as indicarle, por ejemplo, cunto ms probable es que los fumadores desarrollen una
enfermedad cardiovascular frente a los no fumadores.
Estadsticos. Para cada anlisis: Casos totales, Casos seleccionados, Casos vlidos. Para cada
variable categrica: codificacin de los parmetros. Para cada paso: variables introducidas o
eliminadas, historial de iteraciones, 2 log de la verosimilitud, bondad de ajuste, estadstico de
bondad de ajuste de Hosmer-Lemeshow, chi-cuadrado del modelo , chi-cuadrado de la mejora,
tabla de clasificacin, correlaciones entre las variables, grfico de las probabilidades pronosticadas
y los grupos observados, chi-cuadrado residual. Para cada variable de la ecuacin: coeficiente
(B), error tpico de B, Estadstico de Wald, razn de las ventajas estimada (exp(B)), intervalo de
confianza para exp(B), log de la verosimilitud si el trmino se ha eliminado del modelo. Para cada
variable que no est en la ecuacin: estadstico de puntuacin. Para cada caso: grupo observado,
probabilidad pronosticada, grupo pronosticado, residuo, residuo tipificado.
Mtodos. Puede estimar modelos utilizando la entrada en bloque de las variables o cualquiera
de los siguientes mtodos por pasos: Condicional hacia adelante, LR hacia adelante, Wald hacia
adelante, Condicional hacia atrs, LR hacia atrs o Wald hacia atrs.
Datos. La variable dependiente debe ser dicotmica. Las variables independientes pueden
estar a nivel de intervalo o ser categricas; si son categricas, deben ser variables dummy o
estar codificadas como indicadores (existe una opcin en el procedimiento para recodificar
automticamente las variables categricas).
Supuestos. La regresin logstica no se basa en supuestos distribucionales en el mismo sentido
en que lo hace el anlisis discriminante. Sin embargo, la solucin puede ser ms estable si los
predictores tienen una distribucin normal multivariante. Adicionalmente, al igual que con otras
formas de regresin, la multicolinealidad entre los predictores puede llevar a estimaciones sesgadas
y a errores tpicos inflados. El procedimiento es ms eficaz cuando la pertenencia a grupos es una
Copyright SPSS Inc. 1989, 2010
4
Captulo 2
variable categrica autntica; si la pertenencia al grupo se basa en valores de una variable continua
(por ejemplo CI alto en contraposicin a CI bajo), deber considerar el utilizar la regresin
lineal para aprovechar la informacin mucho ms rica ofrecida por la propia variable continua.
Procedimientos relacionados. Utilice el procedimiento Diagrama de dispersin para mostrar en
pantalla sus datos para multicolinealidad. Si se cumplen los supuestos de normalidad multivariante
y de matrices de varianzas-covarianzas iguales, puede obtener una solucin ms rpida utilizando
el procedimiento Anlisis discriminante. Si todos los predictores son categricos, puede
adems utilizar el procedimiento Loglineal. Si la variable dependiente es continua, utilice el
procedimiento Regresin lineal. Puede utilizar el procedimiento Curva COR para realizar grficos
de las probabilidades guardadas con el procedimiento Regresin logstica.
Para obtener un anlisis de regresin logstica
E Seleccione en los mens:
Analizar > Regresin > Logstica binaria...
Figura 2-1
Cuadro de dilogo Regresin logstica
E Seleccione una variable dependiente dicotmica. Esta variable puede ser numrica o de cadena.
E Seleccione una o varias covariables. Para incluir trminos de interaccin, seleccione todas las
variables contenidas en la interaccin y seleccione >a*b>.
Para introducir variables por grupos (en bloques), seleccione las covariables para un bloque
y pulse en Siguiente para especificar un nuevo bloque. Repita estos pasos hasta que haya
especificado todos los bloques.
Si lo desea, puede seleccionar casos para el anlisis. Elija una variable de seleccin y pulse Regla.
5
Regresin Logstica
Los casos definidos por la regla de seleccin se incluyen en la estimacin del modelo. Por
ejemplo, si ha seleccionado una variable y la opcin igual que y ha especificado 5 como valor,
slo se incluirn en el anlisis aquellos casos para los cuales la variable seleccionada tenga un
valor igual a 5.
Tanto para los casos seleccionados como para los no seleccionados se generan resultados de
clasificaciones y estadsticos. De esta manera, se ofrece un mecanismo para clasificar los nuevos
casos basndose en datos ya existentes; o tambin para realizar la particin de los datos en dos
subconjuntos, uno de entrenamiento y otro de prueba, que permiten la validacin del modelo
generado.
6
Captulo 2
Eliminacin hacia atrs (Razn de verosimilitud). Seleccin hacia atrs por pasos. El contraste
Puede especificar los detalles sobre cmo el procedimiento Regresin logstica manipular las
variables categricas:
Covariables. Contiene una lista de todas las covariables especificadas en el cuadro de dilogo
principal para cualquier capa, bien por ellas mismas o como parte de una interaccin. Si alguna
de stas son variables de cadena o son categricas, slo puede utilizarlas como covariables
categricas.
Covariables categricas. Lista las variables identificadas como categricas. Cada variable
incluye una notacin entre parntesis indicando el esquema de codificacin de contraste que va a
utilizarse. Las variables de cadena (sealadas con el smbolo < a continuacin del nombre) estarn
presentes ya en la lista Covariables categricas. Seleccione cualquier otra covariable categrica de
la lista Covariables y muvala a la lista Covariables categricas.
7
Regresin Logstica
disponibles son:
Indicador. Los contrastes indican la presencia o ausencia de la pertenencia a una categora. La
efecto promedio de las categoras anteriores. Tambin se conoce como contrastes de Helmert
inversos.
Helmert. Cada categora del predictor, excepto la ltima categora, se compara con el efecto
8
Captulo 2
Puede guardar los resultados de la regresin logstica como nuevas variables en el conjunto
de datos activo:
Valores pronosticados. Guarda los valores pronosticados por el modelo. Las opciones disponibles
En los resultados, una tabla muestra el nombre y el contenido de cualquier variable nueva.
Grupo de pertenencia pronosticado. Grupo con la mayor probabilidad posterior, basado en
valores pronosticados. Las opciones disponibles son De Cook, Valores de influencia y DfBeta(s).
De Cook. El anlogo, en la regresin logstica, al estadstico de influencia de Cook. Una
medida de cunto cambiaran los residuos de todos los casos si un caso particular se excluyera
del clculo de los coeficientes de regresin.
Valor de influencia. La influencia relativa de una observacin en el ajuste del modelo.
DfBeta(s). La diferencia en el valor de beta es el cambio en el valor de un coeficiente de
regresin que resulta de la exclusin de un caso particular. Se calcula un valor para cada
trmino del modelo, incluyendo la constante.
Residuos. Guarda los residuos. Las opciones disponibles son No tipificados, Logit, Mtodo de
modelo.
Residuo logit. El residuo del caso si se pronostica en la escala logit. El residuo logit es el
residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos
estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Desvianza. Los residuos basados en la desviacin del modelo.
Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros y (si lo
desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). Puede
utilizar este archivo de modelo para aplicar la informacin del modelo a otros archivos de datos
para puntuarlo.
9
Regresin Logstica
de los casos. Los casos con valores pronosticados que han sobrepasado el punto de corte para
la clasificacin se clasifican como positivos, mientras que aqullos con valores pronosticados
menores que el punto de corte se clasifican como negativos. Para cambiar los valores por defecto,
introduzca un valor comprendido entre 0,01 y 0,99.
10
Captulo 2
N mximo de iteraciones. Le permite cambiar el nmero mximo de veces que el modelo itera
antes de finalizar.
Incluir constante en el modelo. Le permite indicar si el modelo debe incluir un trmino constante.
Captulo
La opcin Regresin logstica multinomial resulta til en aquellas situaciones en las que desee
poder clasificar a los sujetos segn los valores de un conjunto de variables predictoras. Este tipo
de regresin es similar a la regresin logstica, pero ms general, ya que la variable dependiente
no est restringida a dos categoras.
Ejemplo. Para conseguir una produccin y distribucin de pelculas ms eficaz, los estudios de cine
necesitan predecir qu tipo de pelculas es ms probable que vayan a ver los aficionados. Mediante
una regresin logstica multinomial, el estudio puede determinar la influencia que la edad, el sexo
y las relaciones de pareja de cada persona tiene sobre el tipo de pelcula que prefieren. De esta
manera, el estudio puede orientar la campaa publicitaria de una pelcula concreta al grupo de la
poblacin que tenga ms probabilidades de ir a verla.
Estadsticos. Historial de iteraciones, coeficientes de los parmetros, covarianza asinttica y
matrices de correlacin, pruebas de la razn de verosimilitud para los efectos del modelo y los
parciales, 2 log de la verosimilitud. Chi-cuadrado de la bondad de ajuste de Pearson y de la
desviacin. R2 de Cox y Snell, de Nagelkerke y de McFadden. Clasificacin: frecuencias
observadas respecto a las frecuencias pronosticadas, por cada categora de respuesta. Tablas de
contingencia: frecuencias observadas y pronosticadas (con los residuos) y proporciones por patrn
en las covariables y por categora de respuesta.
Mtodos. Se ajusta un modelo logit multinomial para el modelo factorial completo o para un
modelo especificado por el usuario. La estimacin de los parmetros se realiza a travs de un
algoritmo iterativo de mxima verosimilitud.
Datos. La variable dependiente debe ser categrica. Las variables independientes pueden ser
factores o covariables. En general, los factores deben ser variables categricas y las covariables
deben ser variables continuas.
Supuestos. Se asume que la razn de ventajas de cualquier par de categoras es independiente de
las dems categoras de respuesta. Segn esta suposicin, por ejemplo, si se introduce un nuevo
producto en un mercado, las cuotas de mercado de todos los dems productos se vern afectadas
de manera igualmente proporcional. De igual manera, dado un patrn en las covariables, se asume
que las respuestas son variables multinomiales independientes.
Obtencin de una regresin logstica multinomial
E Seleccione en los mens:
Analizar > Regresin > Logstica multinomial ...
11
12
Captulo 3
Figura 3-1
Cuadro de dilogo Regresin logstica multinomial
13
Regresin logstica multinomial
Por defecto, el procedimiento de Regresin logstica multinomial genera un modelo con los
principales efectos que producen las covariables y los factores, pero puede especificar un modelo
personalizado o solicitar la seleccin de un modelo por pasos con este cuadro de dilogo.
Especificar modelo. Un modelo de efectos principales contiene los efectos principales de las
covariables y los factores, pero no contiene efectos de interaccin. Un modelo factorial completo
contiene todos los efectos principales y todas las interacciones factor por factor. No contiene
interacciones de covariable. Puede crear un modelo personalizado para especificar subconjuntos
de interacciones entre los factores o bien interacciones entre las covariables, o solicitar una
seleccin por pasos de los trminos del modelo.
Factores y covariables. Muestra una lista de los factores y las covariables.
Trminos de entrada forzada. Los trminos aadidos a la lista de entrada forzada siempre se
incluyen en el modelo.
14
Captulo 3
Trminos por pasos. Los trminos aadidos a la lista por pasos se incluyen en el modelo segn uno
paso se aade al modelo el trmino ms significativo, hasta que ninguno de los trminos por
pasos que quede fuera del modelo tenga una contribucin estadsticamente significativa si
se aade al modelo.
Eliminacin hacia atrs. Este mtodo se inicia introduciendo en el modelo todos los trminos
especificados en la lista por pasos. En cada paso se elimina del modelo el trmino menos
significativo, hasta que todos los trminos por pasos restantes representen una contribucin
estadsticamente significativa para el modelo.
Pasos sucesivos hacia adelante. Este mtodo se inicia con el modelo que se seleccionara
mediante el mtodo de entrada hacia delante. A partir de ah, el algoritmo alterna entre la
eliminacin hacia atrs de los trminos por pasos del modelo, y la entrada hacia delante de los
trminos fuera del modelo. Se sigue as hasta que no queden trminos que cumplan con los
criterios de entrada o exclusin.
Pasos sucesivos hacia atrs. Este mtodo se inicia con el modelo que se seleccionara
mediante el mtodo de eliminacin hacia atrs. A partir de ah, el algoritmo alterna entre la
entrada hacia delante de los trminos fuera del modelo, y la eliminacin hacia atrs de los
trminos por pasos del modelo. Se sigue as hasta que no queden trminos que cumplan con
los criterios de entrada o exclusin.
Incluir la interseccin en el modelo. Le permite incluir o excluir del modelo un trmino de
interseccin.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada.
Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas.
Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas.
Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.
15
Regresin logstica multinomial
valor ms alto la ltima. En orden descendente, el valor mximo define la primera categora
y el valor inferior define la ltima.
16
Captulo 3
Puede especificar los siguientes estadsticos para una regresin logstica multinomial:
Resumen de procesamiento de casos. Esta tabla contiene informacin sobre las variables
categricas especificadas.
Modelo. Estadsticos del modelo global.
Pseudo R cuadrado. Imprime el estadstico de Cox y Snell, de Nagelkerke y el R2 McFadden.
Resumen de pasos. Esta tabla resume los efectos introducidos o eliminados en cada paso,
interseccin o nulo.
17
Regresin logstica multinomial
Criterios de informacin. Esta tabla imprime tanto el criterio de informacin de Akaike (AIC)
los residuos) y las proporciones por patrn en las covariables y por categora de respuesta.
Tabla de clasificacin. Imprime una tabla de las respuestas observadas respecto a las respuestas
pronosticadas.
Estadsticos de bondad de ajuste de chi-cuadrado. Imprime los estadsticos de chi-cuadrado de
para los efectos parciales del modelo. El contraste para el modelo global se imprime de
manera automtica.
Correlaciones asintticas. Imprime la matriz de las correlaciones entre las estimaciones de
los parmetros.
Covarianzas asintticas. Imprime la matriz de las covarianzas de las estimaciones de los
parmetros.
Definir subpoblaciones. Le permite seleccionar un subconjunto de factores y covariables de manera
que pueda definir los patrones en las covariables utilizados por las probabilidades de casilla
y las pruebas de bondad de ajuste.
18
Captulo 3
Puede especificar los siguientes criterios para una regresin logstica multinomial:
Iteraciones. Le permite especificar el nmero mximo de veces que desea recorrer el algoritmo, el
nmero mximo de pasos en la subdivisin por pasos, las tolerancias de convergencia para los
cambios en el log de la verosimilitud y los parmetros, la frecuencia con que se imprime el
progreso del algoritmo iterativo y en qu iteracin el procedimiento debe comenzar a comprobar
la separacin completa o casi completa de los datos.
Convergencia del logaritmo de la verosimilitud. Se asume la convergencia si el cambio absoluto
estimaciones de los parmetros es menor que este valor. Este criterio no se aplica si el valor es
igual a 0.
Delta. Le permite especificar un valor no negativo inferior a 1. Este valor se aade a cada casilla
de la singularidad.
19
Regresin logstica multinomial
Puede especificar las siguientes opciones para una regresin logstica multinomial:
Escala de dispersin. Le permite especificar el valor de escalamiento de la dispersin que se va
a utilizar para corregir la estimacin de la matriz de covarianzas de los parmetros. Desviacin
estima el valor de escalamiento mediante el estadstico de la funcin de desviacin (chi-cuadrado
de la razn de verosimilitud. Pearson estima el valor de escalamiento mediante el estadstico
chi-cuadrado de Pearson. Tambin puede especificar su propio valor de escalamiento. Debe ser
un valor numrico positivo.
Opciones por pasos. Estas opciones le ofrecen el control de los criterios estadsticos cuando se
utilizan mtodos por pasos para generar un modelo.Se ignoran salvo que se especifique un modelo
por pasos en el cuadro de dilogo Modelo.
Probabilidad de entrada. Se trata de la probabilidad del estadstico de la razn de verosimilitud
20
Captulo 3
pasos. Puede elegir entre la prueba de la razn de verosimilitud o la prueba de Wald. Este
criterio se ignora a no ser que se seleccione el mtodo de eliminacin hacia atrs, pasos
sucesivos hacia adelante o pasos sucesivos hacia atrs.
Efectos por pasos mnimos en el modelo. Al utilizar los mtodos de eliminacin hacia atrs o
pasos sucesivos hacia atrs, se especifica el mnimo nmero de trminos que puede incluirse
en el modelo. La interseccin no se cuenta como trmino de modelo.
Efectos por pasos mximos en el modelo. Al utilizar los mtodos de entrada hacia delante
o pasos sucesivos hacia adelante, se especifica el mximo nmero de trminos que puede
incluirse en el modelo. La interseccin no se cuenta como trmino de modelo.
Restringir jerrquicamente la entrada y la eliminacin de trminos. Esta opcin permite elegir si
El cuadro de dilogo Guardar permite guardar las variables en el archivo de trabajo, as como
exportar la informacin de modelo a un archivo externo.
Variables guardadas.
21
Regresin logstica multinomial
estimadas.
Probabilidad de la categora real. Es la probabilidad estimada de la clasificacin de un patrn
desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). Puede
utilizar este archivo de modelo para aplicar la informacin del modelo a otros archivos de datos
para puntuarlo.
Captulo
Anlisis probit
adecuada que se debe utilizar? Podra llevar a cabo un experimento en el que se expongan
muestras de hormigas a diferentes concentraciones del pesticida y despus registrar el nmero de
hormigas muertas y el nmero de hormigas expuestas. Aplicando el anlisis probit a estos datos
puede determinar la fuerza de la relacin entre concentracin y mortalidad, as como determinar la
concentracin adecuada de pesticida si desea asegurar la exterminacin de, por ejemplo, el 95%
de las hormigas expuestas.
Estadsticos. Coeficientes de regresin y errores tpicos, interseccin y su error tpico,
chi-cuadrado de Pearson de la bondad de ajuste, frecuencias observadas y esperadas e intervalos
de confianza para los niveles efectivos de la variable o variables independientes. Grficos:
grficos de respuestas transformadas.
Este procedimiento utiliza los algoritmos propuestos y aplicados en NPSOL por Gill, Murray,
Saunders y Wright para la estimacin de los parmetros de modelo.
Datos. Para cada valor de la variable independiente (o para cada combinacin de valores para
22
23
Anlisis probit
probit informa de las estimaciones de los valores efectivos para las diferentes tasas de respuesta
(incluyendo la dosis efectiva para la mediana), mientras que la Regresin logstica informa de las
estimaciones de las razones de las ventajas (odds ratios) para las variables independientes.
Para obtener un anlisis probit
E En los mens, seleccione:
Analizar > Regresin > Probit...
Figura 4-1
Cuadro de dilogo Anlisis probit
E Seleccione una variable para la frecuencia de respuesta. Esta variable indica el nmero de casos
que presentan una respuesta al estmulo de prueba. Los valores de esta variable no pueden ser
negativos.
E Seleccione una variable para el total observado. Esta variable indica el nmero de casos a los que
se aplic el estmulo. Para cada caso, los valores de esta variable no pueden ser negativos ni
menores que los valores de la variable de frecuencia de respuesta.
Si se desea, puede seleccionarse una variable de factor. Si lo hace, pulse en Definir rango para
definir los grupos.
E Seleccione una o varias covariables. La covariable contiene el nivel del estmulo aplicado en
24
Captulo 4
respuesta.
Permite especificar los niveles de la variable de factor que sern analizados. Los niveles de
factor deben codificarse como enteros consecutivos; se analizarn todos los niveles del rango
que especifique.
25
Anlisis probit
pareja de los niveles del factor. Tambin muestra los lmites de confianza al 95% para cada
potencia relativa de la mediana. Las potencias relativas de la mediana no estn disponibles si
no dispone de una variable de factor, o si dispone de ms de una covariable.
Prueba de paralelismo. Contraste sobre la hiptesis de que todos los niveles del factor tienen
muestra. Los datos deben contener un caso que represente el nivel de control, para el cual el
valor de las covariables sea 0. Probit estima la tasa de respuesta natural utilizando como valor
inicial la proporcin de respuestas para el nivel de control.
Valor. Establece la tasa de respuesta natural del modelo (seleccione este elemento cuando
Captulo
Regresin no lineal
Regresin no lineal es un mtodo para encontrar un modelo no lineal para la relacin entre la
variable dependiente y un conjunto de variables independientes. A diferencia de la regresin lineal
tradicional, que est restringida a la estimacin de modelos lineales, la regresin no lineal puede
estimar modelos con relaciones arbitrarias entre las variables independientes y las dependientes.
Esto se lleva a cabo usando algoritmos de estimacin iterativos. Tenga en cuenta que este
procedimiento no es necesario para los modelos polinmicos simples de la forma Y = A + BX**2.
Definiendo W = X**2, obtenemos un modelo lineal simple, Y = A + BW, que se puede estimar
usando mtodos tradicionales como el procedimiento Regresin lineal.
Ejemplo. Puede pronosticarse la poblacin basndose en el tiempo Un diagrama de dispersin
muestra que parece haber una estrecha relacin entre la poblacin y el tiempo, pero la relacin es
no lineal y por eso exige la utilizacin de los mtodos de estimacin especiales del procedimiento
Regresin no lineal. Creando una ecuacin adecuada, como la del modelo logstico de crecimiento
poblacional, podemos obtener una buena estimacin del modelo, lo que nos permitir hacer
predicciones sobre la poblacin para pocas que no se han sido medidas.
Estadsticos. Para cada iteracin: estimaciones de los parmetros y suma de cuadrados residual.
Para cada modelo: suma de cuadrados para regresin, residual, total corregido y no corregido,
estimaciones de los parmetros, errores tpicos asintticos y matriz de correlaciones asintticas
de estimaciones de los parmetros.
Nota: La regresin no lineal restringida utiliza los algoritmos propuestos y aplicados en NPSOL
por Gill, Murray, Saunders y Wright para la estimacin de los parmetros de modelo.
Datos.Las variables dependiente e independientes deben ser cuantitativas. Las variables
categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse
como variables binarias (dummy) o como otro de los tipos de variables de contraste.
Supuestos. Los resultados son vlidos slo si se ha especificado una funcin que describa con
precisin la relacin entre las variables independientes y las dependientes. Adems, la eleccin
de buenos valores iniciales es muy importante. Incluso si se ha especificado la forma funcional
correcta para el modelo, si no utiliza valores iniciales adecuados, puede que su modelo no logre
converger o puede que obtenga una solucin que sea ptima localmente en vez de una que sea
ptima globalmente.
Procedimientos relacionados. Muchos modelos que en un principio parecen ser no lineales pueden
ser transformados en un modelo lineal, el cual pueda ser analizado usando el procedimiento
Regresin lineal. Si no est seguro de cul es el modelo adecuado, el procedimiento Estimacin
curvilnea puede ayudarle a identificar relaciones funcionales tiles que estn presentes en los
datos.
Copyright SPSS Inc. 1989, 2010
26
27
Regresin no lineal
E Seleccione una variable numrica dependiente de la lista de variables del conjunto de datos activo.
E Para construir una expresin para el modelo, introduzca la expresin en el campo Expresin del
Un modelo segmentado (uno que adquiere diferentes formas en distintas partes de su dominio) se
debe especificar usando la lgica condicional dentro de la declaracin nica del modelo.
28
Captulo 5
lgica (entre parntesis) multiplicada por la expresin que resultar cuando esa expresin lgica
es verdadera.
Por ejemplo, considere un modelo segmentado que sea igual a 0 para X<=0, X para 0<X<1 y 1
para X>=1. La expresin para este ejemplo es:
(X<=0)*0 + (X>0 & X < 1)*X + (X>=1)*1.
Todas las expresiones lgicas entre parntesis deben ser evaluables como 1 (verdadero) o
0 (falso). As:
Si X<=0, la anterior se reduce a 1*0 + 0*X + 0*1 = 0.
Si 0<X<1, se reduce a 0*0 + 1*X + 0*1 = X.
Si X>=1, se reduce a 0*0 + 0*X + 1*1 = 1.
Se pueden construir con facilidad ejemplos ms complicados reemplazando diferentes expresiones
lgicas y expresiones de resultado. Recuerde que las desigualdades dobles, como 0<X<1, deben
escribirse como expresiones compuestas, de la forma (X>0 & X < 1).
Se pueden utilizar variables de cadena dentro de las expresiones lgicas:
(ciudad=Madrid)*costliv + (ciudad=Guadalajara)*0.59*costliv
Esto da lugar a una expresin (el valor de la variable costliv) para los madrileos y a otra (el
59% de ese valor) para los habitantes de Guadalajara. Las constantes de cadena deben ir entre
comillas o apstrofos, como se muestra aqu.
Los parmetros son las partes del modelo que son estimadas por el procedimiento Regresin no
lineal. Los parmetros pueden ser constantes aditivas, coeficientes multiplicativos, exponentes o
valores usados para evaluar funciones. Todos los parmetros que hayan sido definidos aparecern
(con sus valores de inicio) en la lista Parmetros del cuadro de dilogo principal.
Nombre. Debe especificarse un nombre para cada parmetro. Debe ser un nombre de variable
vlido y debe ser el nombre utilizado en la expresin del modelo del cuadro de dilogo principal.
29
Regresin no lineal
Nota: Esta seleccin persistir en este cuadro de dilogo durante el resto de la sesin. Si cambia el
modelo, asegrese de desactivarla.
Nombre
Regresin asinttica
b1 + b2 *exp( b3 * x )
Regresin asinttica
b1 ( b2 *( b3 ** x ))
Densidad
( b1 + b2 * x )**(1/ b3 )
Gauss
Gompertz
b1 *exp( b2 * exp( b3 * x ))
Johnson-Schumacher
b1 *exp( b2 / ( x + b3))
Log-modificado
( b1 + b3 * x ) ** b2
Log-logstico
b1 + b2 *exp( b3 * x )
b1* x /( x + b2 )
Morgan-Mercer-Florin
( b1 * b2 + b3 * x ** b4 )/( b2 + x ** b4 )
Peal-Reed
Razn de cbicas
(b1 + b2 * x + b3 * x ** 2 + b4 * x ** 3) / (b5 * x ** 3)
Razn de cuadrticas
( b1 + b2 * x + b3 * x **2)/( b4 * x **2)
Richards
Verhulst
b1 /(1 + b3 * exp( b2 * x ))
Von Bertalanffy
Weibull
b1 b2 *exp( b3 * x ** b4 )
Densidad de rendimiento
(b1 + b2 * x + b3 * x **2)**(1)
30
Captulo 5
31
Regresin no lineal
Una restriccin es una limitacin sobre los valores permitidos para un parmetro durante la
bsqueda iterativa de una solucin. Las expresiones lineales se evalan antes de realizar un paso,
de modo que se puedan utilizar restricciones lineales para omitir los pasos que pueden provocar
desbordamientos. Las expresiones no lineales se evalan despus de realizar el paso.
Cada ecuacin o desigualdad requiere los siguientes elementos:
Una expresin que incluya al menos un parmetro del modelo. Escriba la expresin o bien
utilice el teclado, que le permita pegar nmeros, operadores o parntesis en la expresin.
Puede escribir el parmetro o parmetros requeridos junto con el resto de la expresin o
bien pegarlos de la lista de Parmetros situada a la izquierda. No se pueden usar variables
ordinarias en una restriccin.
Uno de los tres operadores lgicos <=, =, o bien >=.
Una constante numrica, con la que se compara la expresin utilizando el operador lgico.
Escriba la constante. Las constantes numricas deben escribirse en formato americano, con el
punto como separador de la parte decimal.
32
Captulo 5
Puede guardar una serie de variables nuevas en el archivo de datos activo. Las opciones
disponibles son: Residuos, Valores pronosticados, Derivadas y Valores de la funcin de prdida.
Estas variables se pueden utilizar en anlisis subsiguientes para contrastar el ajuste del modelo o
para identificar casos problemticos.
Residuos. Guarda los residuos con el nombre de variable resid.
Valores pronosticados. Guarda los valores pronosticados, con el nombre de variable pred_.
Derivadas. Se guarda una derivada para cada parmetro del modelo. Los nombres de las
derivadas se construyen aadiendo como prefijo una "d." a los primeros seis caracteres de los
nombres de los parmetros.
Valores de la funcin de prdida. Esta opcin est disponible si especifica su propia funcin de
prdida. El nombre de variable loss_ est asignada a los valores de la funcin de prdida.
33
Regresin no lineal
Este cuadro de dilogo permite controlar diversos aspectos del anlisis de regresin no lineal:
Estimaciones autodocimantes. Mtodo para la estimacin del error tpico de un estadstico que usa
muestras repetidas del conjunto original de datos. Se realiza mediante muestreo con repeticin
para obtener numerosas muestras del mismo tamao que el conjunto de datos original. La
ecuacin no lineal se estima para cada una de estas muestras. A continuacin, se calcula el error
tpico de cada estimacin del parmetro como la desviacin tpica de las estimaciones creadas
por el mtodo autodocimante. Se utilizan los valores de los parmetros obtenidos a partir de los
datos originales como los valores de inicio para las estimaciones autodocimantes. Requiere el
algoritmo de programacin cuadrtica secuencial.
Mtodo de estimacin. Permite seleccionar un mtodo de estimacin, si esto es posible.
34
Captulo 5
Captulo
Estimacin ponderada
Los modelos de regresin lineal tpicos asumen que la varianza es constante en la poblacin objeto
de estudio. Cuando ste no es el caso (por ejemplo cuando los casos con puntuaciones mayores en
un atributo muestran ms variabilidad que los casos con puntuaciones menores en ese atributo),
la regresin lineal mediante mnimos cuadrados ordinarios (MCO, OLS) deja de proporcionar
estimaciones ptimas para el modelo. Si las diferencias de variabilidad se pueden pronosticar a
partir de otra variable, el procedimiento Estimacin ponderada permite calcular los coeficientes de
un modelo de regresin lineal mediante mnimos cuadrados ponderados (MCP, WLS), de forma
que se les d mayor ponderacin a las observaciones ms precisas (es decir, aqullas con menos
variabilidad) al determinar los coeficientes de regresin. El procedimiento Estimacin ponderada
contrasta un rango de transformaciones de ponderacin e indica cul se ajustar mejor a los datos.
Ejemplo. Cules son los efectos de la inflacin y el paro sobre los cambios en el precio de las
acciones Debido a que los valores con mayor valor de cotizacin suelen mostrar ms variabilidad
que aquellos con menor valor de cotizacin, la estimacin de mnimos cuadrados ordinarios no
generar estimaciones que sean ptimas. El mtodo de Estimacin ponderada permite capturar el
efecto del precio de cotizacin sobre la variabilidad de los cambios en el precio, al calcular el
modelo lineal.
Estadsticos. Valores de la log-verosimilitud para cada potencia de la variable de ponderacin
puesta a prueba,R mltiple, R-cuadrado, R cuadrado corregida, tabla de ANOVA para el modelo
MCP, estimaciones de los parmetros tipificados y no tipificados y log-verosimilitud para el
modelo MCP.
Datos.Las variables dependiente e independientes deben ser cuantitativas. Las variables
debe ser normal. La relacin entre la variable dependiente y cada variable independiente debe ser
lineal y todas las observaciones deben ser independientes. La varianza de la variable dependiente
puede cambiar segn los niveles de la variable o variables independientes, pero las diferencias se
deben poder pronosticar en funcin de la variable de ponderacin.
Procedimientos relacionados. El procedimiento Explorar se puede utilizar para inspeccionar los
datos. Este procedimiento proporciona pruebas de normalidad y homogeneidad de la varianza, as
como representaciones grficas. Si la variable dependiente parece tener la misma varianza para
todos los niveles de las variables independientes, puede utilizar el procedimiento Regresin lineal.
Si los datos parecen violar un supuesto (como puede ser la normalidad), intente transformarlos.
Si los datos no estn relacionados linealmente y una transformacin no ayuda, utilice un
Copyright SPSS Inc. 1989, 2010
35
36
Captulo 6
Variable de ponderacin. Los datos son ponderados por el inverso de esta variable elevada a
una potencia La ecuacin de regresin se calcula para cada uno de los valores del rango de
potencias especificado y se indica la potencia que maximiza el logaritmo de la funcin de
verosimilitud.
Rango de potencias. Se utiliza en conjuncin con la variable de ponderacin para calcular las
ponderaciones. Se ajustarn varias ecuaciones de regresin, una para cada valor del rango de
potencias. Los valores introducidos en el cuadro Rango de potencias y en el cuadro Hasta,
deben encontrarse entre -6,5 y 7,5, ambos inclusive. Los valores de la potencia irn del valor
menor al mayor, con el incremento determinado por el valor especificado. El nmero total de
valores del rango de potencias est limitado a 150.
37
Estimacin ponderada
activo. Esta variable se denomina WGT_n, siendo n un nmero elegido para proporcionar a la
variable un nombre exclusivo.
Mostrar ANOVA y estimaciones. Permite controlar cmo se muestran los estadsticos en los
resultados. Las alternativas disponibles son Para la mejor potencia y Para cada valor de potencia.
Captulo
Los modelos de regresin lineal tpica asumen que los errores de la variable dependiente no
estn correlacionados con la variable o variables independientes. Cuando ste no es el caso
(por ejemplo, cuando las relaciones entre las variables son bidireccionales), la regresin lineal
mediante mnimos cuadrados ordinarios (OLS) deja de proporcionar estimaciones ptimas del
modelo. La regresin por mnimos cuadrados en dos fases utiliza variables instrumentales que
no estn correlacionadas con los trminos de error para calcular los valores estimados de los
predictores problemticos (en la primera fase ) y despus utiliza dichos valores calculados para
estimar un modelo de regresin lineal para la variable dependiente (la segunda fase). Dado que
los valores calculados se basan en variables que no estn correlacionadas con los errores, los
resultados del modelo en dos fases son ptimos.
Ejemplo. Est relacionada la demanda de un artculo con su precio y con los ingresos del
consumidor? La dificultad de este modelo radica en que el precio y la demanda tienen efectos
recprocos el uno sobre el otro. Es decir, el precio puede influir en la demanda y la demanda
tambin puede influir en el precio. Un modelo de regresin por mnimos cuadrados en dos fases
permite utilizar los ingresos de los consumidores y el precio retardado para calcular un predictor
sustituto del precio, el cual no est correlacionado con los errores de medida de la demanda.
Se reemplaza el precio en el modelo especificado originariamente por este sustituto y despus
se estima el nuevo modelo.
Estadsticos. Para cada modelo: coeficientes de regresin tipificados y no tipificados, R mltiple,
Rcuadrado, Rcuadrado corregida, error tpico de la estimacin, tabla de anlisis de varianza, valores
pronosticados y residuos. Adems, los intervalos de confianza al 95% para cada coeficiente de
regresin y las matrices de correlacin y covarianza para las estimaciones de los parmetros.
Datos.Las variables dependiente e independientes deben ser cuantitativas. Las variables
categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse
como variables binarias (dummy) o como otro de los tipos de variables de contraste. Las variables
explicativas endgenas deben ser cuantitativas (no categricas).
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente
debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para
todos los valores de la variable independiente. La relacin entre la variable dependiente y cada
variable independiente debe ser lineal.
Procedimientos relacionados. Si piensa que ninguna de las variables predictoras est correlacionada
con los errores de la variable dependiente, puede utilizar el procedimiento Regresin lineal. Si
los datos parecen violar alguno de los supuestos (como la normalidad o la varianza constante),
pruebe a transformarlos. Si los datos no estn relacionados linealmente y una transformacin no
Copyright SPSS Inc. 1989, 2010
38
39
Regresin por mnimos cuadrados en dos fases
Instrumental. Estas son las variables utilizadas para calcular los valores pronosticados de las
variables endgenas en la primera etapa del anlisis de mnimos cuadrados en dos fases. Las
listas de variables explicativas e instrumentales pueden contener las mismas variables. Debe
haber al menos tantas variables instrumentales como explicativas. Si las variables explicativas
e instrumentales coinciden, los resultados sern los mismos que los del procedimiento de
Regresin lineal.
Las variables explicativas no especificadas como instrumentales se consideran endgenas.
Normalmente, todas las variables exgenas de la lista Explicativas se especifican tambin como
variables instrumentales.
40
Captulo 7
de los parmetros.
Apndice
Esquemas de codificacin de
variables categricas
Desviacin
Desviacin desde la media global. En trminos matriciales, estos contrastes tienen la forma:
media
( 1/k
1/k
...
1/k
1/k )
gl(1)
( 11/k
1/k
...
1/k
1/k )
gl(2)
.
( 1/k
11/k
.
...
1/k
1/k )
...
11/k
1/k )
.
gl(k1)
.
( 1/k
1/k
1/3
1/3 )
( 2/3
1/3
1/3 )
( 1/3
2/3
1/3 )
Para omitir una categora distinta de la ltima, especifique el nmero de la categora omitida entre
el parntesis que sucede a la palabra clave DEVIATION. Por ejemplo, el siguiente subcomando
obtiene las desviaciones para la primera y tercera categoras y omite la segunda:
/CONTRAST(FACTOR)=DEVIATION(2)
41
42
Apndice A
Suponga que factor tiene tres categoras. La matriz de contraste resultante ser
( 1/3
1/3
1/3 )
( 2/3
1/3
1/3 )
( 1/3
1/3
2/3 )
Simple
Contrastes simples. Compara cada nivel de un factor con el ltimo. La forma de la matriz general es
media
( 1/k
1/k
...
1/k
1/k )
gl(1)
(1
...
1 )
gl(2)
.
(0
1
.
...
1 )
...
1 )
.
gl(k1)
.
(0
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes
simples para una variable independiente con cuatro categoras son los siguientes:
( 1/4
1/4
1/4
1/4 )
(1
1 )
(0
1 )
(0
1 )
Para utilizar otra categora en lugar de la ltima como categora de referencia, especifique entre
parntesis tras la palabra clave SIMPLE el nmero de secuencia de la categora de referencia, que
no es necesariamente el valor asociado con dicha categora. Por ejemplo, el siguiente subcomando
CONTRAST obtiene una matriz de contraste que omite la segunda categora:
/CONTRAST(FACTOR) = SIMPLE(2)
Suponga que factor tiene cuatro categoras. La matriz de contraste resultante ser
( 1/4
1/4
1/4
1/4 )
(1
0)
(0
0)
(0
1)
43
Esquemas de codificacin de variables categricas
Helmert
Contrastes de Helmert. Compara categoras de una variable independiente con la media de las
categoras subsiguientes. La forma de la matriz general es
media
( 1/k
1/k
...
1/k
1/k )
gl(1)
(1
1/(k1)
...
1/(k1)
1/(k1) )
gl(2)
.
(0
1
.
...
1/(k2)
1/(k2) )
1
...
1/2
1/2
1 )
gl(k2)
(0
gl(k1)
(0
1/4
1/4
1/4 )
(1
1/3
1/3
1/3 )
(0
1/2
1/2 )
(0
1 )
Diferencia
Diferencia o contrastes de Helmert inversos. Compara categoras de una variable independiente con
( 1/k
1/k
1/k
...
1/k )
gl(1)
( 1
...
0)
gl(2)
.
( 1/2
1/2
.
...
0)
1/(k1)
...
1)
.
gl(k1)
.
( 1/(k1)
1/(k1)
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes de
diferencia para una variable independiente con cuatro categoras son los siguientes:
( 1/4
1/4
1/4
1/4 )
( 1
0)
( 1/2
1/2
0)
( 1/3
1/3
1/3
1)
44
Apndice A
Polinmico
Contrastes polinmicos ortogonales. El primer grado de libertad contiene el efecto lineal a travs de
todas las categoras; el segundo grado de libertad, el efecto cuadrtico, el tercer grado de libertad,
el cbico, y as sucesivamente hasta los efectos de orden superior.
Se puede especificar el espaciado entre niveles del tratamiento medido por la variable
categrica dada. Se puede especificar un espaciado igual, que es el valor por defecto si se omite la
mtrica, como enteros consecutivos desde 1 hasta k, donde k es el nmero de categoras. Si la
variable frmaco tiene tres categoras, el subcomando
/CONTRAST(DRUG)=POLYNOMIAL
es idntico a
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)
Repetido
Compara niveles adyacentes de una variable independiente. La forma de la matriz general es
media
( 1/k
1/k
1/k
...
1/k
1/k )
gl(1)
(1
...
0)
gl(2)
.
(0
1
.
...
0)
...
1 )
.
gl(k1)
.
(0
45
Esquemas de codificacin de variables categricas
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes
repetidos para una variable independiente con cuatro categoras son los siguientes:
( 1/4
1/4
1/4
1/4 )
(1
0)
(0
0)
(0
1 )
Estos contrastes son tiles en el anlisis de perfiles y siempre que sean necesarias puntuaciones de
diferencia.
Especial
Un contraste definido por el usuario. Permite la introduccin de contrastes especiales en forma de
matrices cuadradas con tantas filas y columnas como categoras haya de la variable independiente.
Para MANOVA y LOGLINEAR, la primera fila introducida es siempre el efecto promedio, o
constante, y representa el conjunto de ponderaciones que indican cmo promediar las dems
variables independientes, si las hay, sobre la variable dada. Generalmente, este contraste es un
vector de contrastes.
Las restantes filas de la matriz contienen los contrastes especiales que indican las comparaciones
deseadas entre categoras de la variable. Normalmente, los contrastes ortogonales son los ms
tiles. Este tipo de contrastes son estadsticamente independientes y son no redundantes. Los
contrastes son ortogonales si:
Para cada fila, la suma de los coeficientes de contrastes es igual a cero.
Los productos de los correspondientes coeficientes para todos los pares de filas disjuntas
tambin suman cero.
Por ejemplo, supongamos que el tratamiento tiene cuatro niveles y que deseamos comparar los
diversos niveles del tratamiento entre s. Un contraste especial adecuado sera
(1
1)
(3
1 )
(0
1 )
compare 2 con 3 y 4
(0
1 )
compare 3 con 4
todo lo cual se especifica mediante el siguiente subcomando CONTRAST para MANOVA, LOGISTIC
REGRESSION y COXREG:
/CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1
3 -1 -1 -1
0 2 -1 -1
0 0 1 -1 )
46
Apndice A
0
1 -1 )
Cada fila, excepto la fila de las medias suman cero. Los productos de cada par de filas disjuntas
tambin suman cero:
Filas 2 y 3:
Filas 2 y 4:
Filas 3 y 4:
No es necesario que los contrastes especiales sean ortogonales. No obstante, no deben ser
combinaciones lineales de unos con otros. Si lo son, el procedimiento informar de la dependencia
lineal y detendr el procesamiento. Los contrastes de Helmert, de diferencia y polinmicos son
todos contrastes ortogonales.
Indicador
Codificacin de la variable indicadora. Tambin conocida como variable auxiliar o dummy, no
est disponible en LOGLINEAR o MANOVA. El nmero de variables nuevas codificadas es k1. Los
casos que pertenezcan a la categora de referencia se codificarn como 0 para las kvariables 1.
Un caso en la categora isima se codificar como 0 para todas las variables indicadoras excepto
la isima, que se codificar como 1.
Apndice
Notices
Licensed Materials Property of SPSS Inc., an IBM Company. Copyright SPSS Inc. 1989,
2010.
Patent No. 7,023,453
The following paragraph does not apply to the United Kingdom or any other country where such
provisions are inconsistent with local law: SPSS INC., AN IBM COMPANY, PROVIDES THIS
47
48
Apndice B
IBM, the IBM logo, and ibm.com are trademarks of IBM Corporation, registered in many
jurisdictions worldwide. A current list of IBM trademarks is available on the Web at
http://www.ibm.com/legal/copytrade.shmtl.
SPSS is a trademark of SPSS Inc., an IBM Company, registered in many jurisdictions worldwide.
Adobe, the Adobe logo, PostScript, and the PostScript logo are either registered trademarks or
trademarks of Adobe Systems Incorporated in the United States, and/or other countries.
Intel, Intel logo, Intel Inside, Intel Inside logo, Intel Centrino, Intel Centrino logo, Celeron, Intel
Xeon, Intel SpeedStep, Itanium, and Pentium are trademarks or registered trademarks of Intel
Corporation or its subsidiaries in the United States and other countries.
Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both.
Microsoft, Windows, Windows NT, and the Windows logo are trademarks of Microsoft
Corporation in the United States, other countries, or both.
UNIX is a registered trademark of The Open Group in the United States and other countries.
Java and all Java-based trademarks and logos are trademarks of Sun Microsystems, Inc. in the
United States, other countries, or both.
This product uses WinWrap Basic, Copyright 1993-2007, Polar Engineering and Consulting,
http://www.winwrap.com.
Other product and service names might be trademarks of IBM, SPSS, or other companies.
Adobe product screenshot(s) reprinted with permission from Adobe Systems Incorporated.
Microsoft product screenshot(s) reprinted with permission from Microsoft Corporation.
ndice
estadsticos, 35
funciones adicionales del comando, 37
historial de iteraciones, 37
log de la verosimilitud, 35
mostrar ANOVA y estimaciones, 37
estimaciones de los parmetros
en Regresin logstica multinomial, 16
Anlisis probit
criterios, 24
definicin de rango, 24
ejemplo, 22
estadsticos, 22, 24
funciones adicionales del comando, 25
intervalos de confianza fiduciaria, 24
iteraciones, 24
potencia relativa de la mediana, 24
prueba de paralelismo, 24
tasa de respuesta natural, 24
funcin de desviacin
estimacin del valor del escalamiento para la dispersin,
19
bondad de ajuste
en Regresin logstica multinomial, 16
histrico de iteraciones
en Regresin logstica multinomial, 18
interseccin
incluir o excluir, 13
intervalos de confianza
en Regresin logstica multinomial, 16
intervalos de confianza fiduciaria
en el anlisis probit, 24
iteraciones
en el anlisis probit, 24
en Regresin logstica, 9
en Regresin logstica multinomial, 18
legal notices, 47
ley de Metcherlich de devoluciones decrecientes
en Regresin no lineal, 29
log de la verosimilitud
en Estimacin ponderada, 35
en Regresin logstica multinomial, 16
matriz de correlaciones
en Regresin logstica multinomial, 16
matriz de covarianzas
en Regresin logstica multinomial, 16
modelo de densidad
en Regresin no lineal, 29
modelo de densidad de rendimiento
en Regresin no lineal, 29
modelo de Gauss
en Regresin no lineal, 29
modelo de Gompertz
en Regresin no lineal, 29
modelo de Johnson-Schumacher
en Regresin no lineal, 29
modelo de Michaelis Menten
en Regresin no lineal, 29
D de Cook
en Regresin logstica, 7
delta
correccin para casillas con 0 observaciones, 18
DfBeta
en Regresin logstica, 7
eliminacin hacia atrs
en Regresin logstica, 5
estadstico de bondad de ajuste de Hosmer-Lemeshow
en Regresin logstica, 9
Estimacin ponderada, 35
almacenamiento de la mejor ponderacin como una
variable nueva, 37
ejemplo, 35
49
50
ndice
modelo de Morgan-Mercer-Florin
en Regresin no lineal, 29
modelo de Peal-Reed
en Regresin no lineal, 29
modelo de razn de cuadrticas
en Regresin no lineal, 29
modelo de razn de cbicas
en Regresin no lineal, 29
modelo de Richards
en Regresin no lineal, 29
modelo de Verhulst
en Regresin no lineal, 29
modelo de Von Bertalanffy
en Regresin no lineal, 29
modelo de Weibull
en Regresin no lineal, 29
modelo log-modificado
en Regresin no lineal, 29
modelos de efectos principales
en Regresin logstica multinomial, 13
modelos factoriales completos
en Regresin logstica multinomial, 13
modelos no lineales
en Regresin no lineal, 29
modelos personalizados
en Regresin logstica multinomial, 13
potencia relativa de la mediana
en el anlisis probit, 24
prueba de paralelismo
en el anlisis probit, 24
R cuadrado de McFadden
en Regresin logstica multinomial, 16
R-cuadrado de Cox y Snell
en Regresin logstica multinomial, 16
R-cuadrado de Nagelkerke
en Regresin logstica multinomial, 16
razn de verosimilitud
bondad de ajuste, 16
estimacin del valor del escalamiento para la dispersin,
19
regresin asinttica
en Regresin no lineal, 29
Regresin lineal
estimacin ponderada, 35
Regresin por mnimos cuadrados en dos fases, 38
Regresin logstica
binaria, 1
Regresin Logstica, 3
almacenamiento de nuevas variables, 7
coeficientes, 3
contrastes, 6
covariables categricas, 6
covariables de cadena, 6
definicin de la regla de seleccin, 5
ejemplo, 3
establecimiento de reglas, 5
estadstico de bondad de ajuste de Hosmer-Lemeshow, 9
estadsticos, 3
estadsticos y grficos, 9
funciones adicionales del comando, 10
iteraciones, 9
medidas de influencia, 7
mtodos de seleccin de variables, 5
opciones de representacin, 9
probabilidad para el mtodo por pasos, 9
punto de corte para la clasificacin, 9
residuos, 7
trmino constante, 9
valores pronosticados, 7
regresin logstica binaria, 1
Regresin logstica multinomial, 11, 16
categora de referencia, 15
criterios, 18
estadsticos, 16
exportacin de informacin del modelo, 20
funciones adicionales del comando, 21
guardar, 20
modelos, 13
Regresin no lineal, 26
algoritmo de Levenberg-Marquardt, 32
almacenamiento de variables nuevas, 32
derivadas, 32
ejemplo, 26
estadsticos, 26
estimaciones bootstrap, 32
funcin de prdida, 30
funciones adicionales del comando, 34
interpretacin de resultados, 33
lgica condicional, 27
mtodos de estimacin, 32
modelo segmentado, 27
modelos no lineales comunes, 29
parmetros, 28
programacin cuadrtica secuencial, 32
residuos, 32
restricciones para los parmetros, 31
valores iniciales, 28
valores pronosticados, 32
Regresin por mnimos cuadrados en dos fases, 38
almacenamiento de nuevas variables, 40
covarianzas de los parmetros, 40
ejemplo, 38
estadsticos, 38
funciones adicionales del comando, 40
variables instrumentales, 38
regresin restringida
en Regresin no lineal, 31
restricciones para los parmetros
en Regresin no lineal, 31
seleccin hacia delante
en Regresin logstica, 5
51
ndice