Académique Documents
Professionnel Documents
Culture Documents
Nota
Antes de utilizar esta informacin y el producto al que hace referencia, lea la informacin en Avisos en la pgina 33.
Informacin del producto
Esta edicin se aplica a la versin 22, release 0, modificacin 0 de IBM
por Gill,
Murray, Saunders y Wright para la estimacin de los parmetros de modelo.
Regresin no lineal: Consideraciones sobre los datos
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas,
como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables
binarias (dummy) o como otro de los tipos de variables de contraste.
Supuestos. Los resultados son vlidos slo si se ha especificado una funcin que describa con precisin la
relacin entre las variables independientes y las dependientes. Adems, la eleccin de buenos valores
iniciales es muy importante. Incluso si se ha especificado la forma funcional correcta para el modelo, si
no utiliza valores iniciales adecuados, puede que su modelo no logre converger o puede que obtenga una
solucin que sea ptima localmente en vez de una que sea ptima globalmente.
Procedimientos relacionados. Muchos modelos que en un principio parecen ser no lineales pueden ser
transformados en un modelo lineal, el cual pueda ser analizado usando el procedimiento Regresin
lineal. Si no est seguro de cul es el modelo adecuado, el procedimiento Estimacin curvilnea puede
ayudarle a identificar relaciones funcionales tiles que estn presentes en los datos.
Para obtener un anlisis de regresin no lineal
1. Elija en los mens:
Analizar > Regresin > No lineal...
2. Seleccione una variable numrica dependiente de la lista de variables del conjunto de datos activo.
3. Para construir una expresin para el modelo, introduzca la expresin en el campo Expresin del
modelo o bien pegue en el campo los componentes (variables, parmetros, funciones).
4. Identifique los parmetros del modelo pulsando en Parmetros.
Copyright IBM Corp. 1989, 2013 19
Un modelo segmentado (uno que adquiere diferentes formas en distintas partes de su dominio) se debe
especificar usando la lgica condicional dentro de la declaracin nica del modelo.
Lgica condicional (Regresin no lineal)
Se puede especificar un modelo segmentado utilizando la lgica condicional. Para usar la lgica
condicional dentro de la expresin del modelo o de la funcin de prdida, debe construir la suma de una
serie de trminos, uno para cada condicin. Cada trmino se compone de una expresin lgica (entre
parntesis) multiplicada por la expresin que resultar cuando esa expresin lgica es verdadera.
Por ejemplo, considere un modelo segmentado que sea igual a 0 para X<=0, X para 0<X<1 y 1 para X>=1.
La expresin para este ejemplo es:
(X<=0)*0 + (X>0 & X<1)*X + (X>=1)*1.
Todas las expresiones lgicas entre parntesis deben ser evaluables como 1 (verdadero) o 0 (falso). As:
Si X<=0, la anterior se reduce a 1*0 + 0*X + 0*1 = 0.
Si 0<X<1, se reduce a 0*0 + 1*X + 0*1 = X.
Si X>=1, se reduce a 0*0 + 0*X + 1*1 = 1.
Se pueden construir con facilidad ejemplos ms complicados reemplazando diferentes expresiones lgicas
y expresiones de resultado. Recuerde que las desigualdades dobles, como 0<X<1, deben escribirse como
expresiones compuestas, de la forma (X>0 & X < 1).
Se pueden utilizar variables de cadena dentro de las expresiones lgicas:
(ciudad='Madrid')*costliv + (ciudad='Guadalajara')*0.59*costliv
Esto da lugar a una expresin (el valor de la variable costliv) para los madrileos y a otra (el 59% de ese
valor) para los habitantes de Guadalajara. Las constantes de cadena deben ir entre comillas o apstrofos,
como se muestra aqu.
Regresin no lineal: Parmetros
Los parmetros son las partes del modelo que son estimadas por el procedimiento Regresin no lineal.
Los parmetros pueden ser constantes aditivas, coeficientes multiplicativos, exponentes o valores usados
para evaluar funciones. Todos los parmetros que hayan sido definidos aparecern (con sus valores de
inicio) en la lista Parmetros del cuadro de dilogo principal.
Nombre. Debe especificarse un nombre para cada parmetro. Debe ser un nombre de variable vlido y
debe ser el nombre utilizado en la expresin del modelo del cuadro de dilogo principal.
Valor inicial. Permite especificar un valor de inicio para el parmetro, preferiblemente lo ms prximo
posible a la solucin final esperada. Los valores iniciales no adecuados pueden dar como resultado un
fallo de convergencia o una convergencia sobre una solucin local (en vez de global) o fsicamente
imposible.
Usar los valores iniciales del anlisis previo. Si ya se ha ejecutado una regresin no lineal desde este
cuadro de dilogo, puede seleccionar esta opcin para obtener los valores iniciales de los parmetros a
partir de sus valores en la ejecucin previa. De esta forma podr continuar buscando cuando el algoritmo
est convergiendo lentamente. Los primeros valores iniciales seguirn apareciendo en la lista Parmetros
del cuadro de dilogo principal.
20 IBM SPSS Regression 22
Nota: esta seleccin persistir en este cuadro de dilogo durante el resto de la sesin. Si cambia el
modelo, asegrese de desactivarla.
Modelos comunes de regresin no lineal
La tabla que se muestra ms abajo proporciona ejemplos de la sintaxis del modelo para muchos modelos
de regresin no lineal publicados. Es probable que los modelos seleccionados al azar no se ajusten bien a
sus datos. Son necesarios valores iniciales adecuados para los parmetros; algunos modelos requieren
restricciones para llegar a converger.
Tabla 1. Ejemplos de sintaxis de modelo
Nombre Expresin del modelo
Regresin asinttica b1 + b2 *exp( b3 * x )
Regresin asinttica b1 (b2 * (b3 ** x))
Densidad (b1 + b2 * x) ** (1 / b3)
Gauss b1 * (1 b3 * exp(b2 * x ** 2))
Gompertz b1 * exp(b2 * exp(b3 * x))
Johnson-Schumacher b1 * exp(b2 / (x + b3))
Log-modificado ( b1 + b3 * x ) ** b2
Log-logstico b1 ln(1 + b2 * exp(b3 * x))
Ley de Metcherlich de devoluciones
decrecientes
b1 + b2 * exp(b3 * x)
Michaelis Menten b1* x /( x + b2 )
Morgan-Mercer-Florin ( b1 * b2 + b3 * x ** b4 )/( b2 + x ** b4 )
Peal-Reed b1 / (1+ b2 * exp((b3 * x + b4 * x **2 + b5 * x ** 3)))
Razn de cbicas (b1 + b2 * x + b3 * x ** 2 + b4 * x ** 3) / (b5 * x ** 3)
Razn de cuadrticas ( b1 + b2 * x + b3 * x **2)/( b4 * x **2)
Richards b1 / ((1 + b3 * exp(b2 * x)) ** (1 / b4))
Verhulst b1 / (1 + b3 * exp(b2 * x))
Von Bertalanffy (b1 ** (1 b4) b2 * exp(b3 * x)) ** (1 / (1 b4))
Weibull b1 b2 * exp(b3 * x ** b4)
Densidad de rendimiento (b1 + b2 * x + b3 * x ** 2) ** (1)
Regresin no lineal: Funcin de prdida
La funcin de prdida en regresin no lineal es la funcin que es minimizada por el algoritmo.
Seleccione Suma de los residuos al cuadrado para minimizar la suma de los residuos al cuadrado o bien
Funcin de prdida definida por el usuario para minimizar una funcin diferente.
Si selecciona Funcin de prdida definida por el usuario, debe definir la funcin de prdida cuya suma
(en todos los casos) deber minimizarse por la eleccin de los valores de los parmetros.
v La mayora de las funciones de prdida incluyen la variable especial RESID_, que representa el
residuo. La funcin de prdida predeterminada Suma de los residuos al cuadrado se podra introducir
explcitamente como RESID_**2. Si tiene que utilizar el valor predicho la funcin de prdida, ste es
igual a la variable dependiente menos el residuo.
v Se puede especificar una funcin de prdida condicional utilizando la lgica condicional.
Captulo 5. Regresin no lineal 21
Puede escribir una expresin en el campo Funcin de prdida definida por el usuario, o bien pegar en el
campo los componentes de la expresin. Las constantes de cadena deben ir entre comillas o apstrofos y
las constantes numricas deben escribirse en formato americano, con el punto como separador de la parte
decimal.
Regresin no lineal: Restricciones para los parmetros
Una restriccin es una limitacin sobre los valores permitidos para un parmetro durante la bsqueda
iterativa de una solucin. Las expresiones lineales se evalan antes de realizar un paso, de modo que se
puedan utilizar restricciones lineales para omitir los pasos que pueden provocar desbordamientos. Las
expresiones no lineales se evalan despus de realizar el paso.
Cada ecuacin o desigualdad requiere los siguientes elementos:
v Una expresin que incluya al menos un parmetro del modelo. Escriba la expresin o bien utilice el
teclado, que le permita pegar nmeros, operadores o parntesis en la expresin. Puede escribir el
parmetro o parmetros requeridos junto con el resto de la expresin o bien pegarlos de la lista de
Parmetros situada a la izquierda. No se pueden usar variables ordinarias en una restriccin.
v Una de los tres operadores lgicos <=, = o >=.
v Una constante numrica, con la que se compara la expresin utilizando el operador lgico. Escriba la
constante. Las constantes numricas deben escribirse en formato americano, con el punto como
separador de la parte decimal.
Regresin no lineal: Guardar variables nuevas
Puede guardar una serie de variables nuevas en el archivo de datos activo. Las opciones disponibles son:
Residuos, Valores pronosticados, Derivadas y Valores de la funcin de prdida. Estas variables se pueden
utilizar en anlisis subsiguientes para contrastar el ajuste del modelo o para identificar casos
problemticos.
v Residuos. Guarda los residuos con el nombre de variable resid.
v Valores pronosticados. Guarda los valores pronosticados, con el nombre de variable pred_.
v Derivadas. Se guarda una derivada para cada parmetro del modelo. Los nombres de las derivadas se
construyen aadiendo como prefijo una "d." a los primeros seis caracteres de los nombres de los
parmetros.
v Valores de funcin de prdida. Esta opcin est disponible si especifica su propia funcin de prdida. El
nombre de variable loss_ est asignada a los valores de la funcin de prdida.
Regresin no lineal: Opciones
Este cuadro de dilogo permite controlar diversos aspectos del anlisis de regresin no lineal:
Estimaciones de bootstrap. Mtodo para la estimacin del error estndar de un estadstico que usa muestras
repetidas del conjunto original de datos. Se realiza mediante muestreo con repeticin para obtener
numerosas muestras del mismo tamao que el conjunto de datos original. La ecuacin no lineal se estima
para cada una de estas muestras. A continuacin, se calcula el error estndar de cada estimacin del
parmetro como la desviacin estndar de las estimaciones creadas por bootstrapping. Se utilizan los
valores de los parmetros obtenidos a partir de los datos originales como los valores de inicio para cada
muestra de bootstrap. Requiere el algoritmo de programacin cuadrtica secuencial.
Mtodo de estimacin. Permite seleccionar un mtodo de estimacin, si esto es posible. (Determinadas
opciones de ste y otros cuadros de dilogo requieren el algoritmo de programacin cuadrtica
secuencial.) Entre las alternativas disponibles se encuentran Programacin cuadrtica secuencial y
Levenberg-Marquardt.
v Programacin cuadrtica secuencial. Este mtodo est disponible para los modelos restringidos y los no
restringidos. La programacin cuadrtica secuencial se utiliza automticamente si especifica un modelo
22 IBM SPSS Regression 22
restringido, una funcin de prdida definida por el usuario o el bootstrapping. Puede introducir
nuevos valores para N mximo de iteraciones y Lmite para los pasos, puede cambiar la seleccin en
las listas desplegables de Tolerancia de la optimidad, Precisin de la funcin y Tamao para pasos
infinitos.
v Levenberg-Marquardt. Algoritmo predeterminado para los modelos no restringidos. No puede utilizar el
mtodo de Levenberg-Marquardt si especifica un modelo restringido, una funcin de prdida definida
por el usuario, o el bootstrapping. Se pueden introducir nuevos valores para N mximo de iteraciones
y cambiar las selecciones de las listas desplegables de Convergencia de la suma de cuadrados y
Convergencia en los parmetros.
Regresin no lineal: Interpretacin de los resultados
Los problemas de la regresin no lineal presentan con frecuencia dificultades de clculo:
v La eleccin de valores iniciales para los parmetros influye en la convergencia. Intente elegir valores
iniciales que sean razonables y, si es posible, prximos a la solucin final esperada.
v A veces, un algoritmo se ejecuta mejor que otro en un determinado problema. En el cuadro de dilogo
Opciones, seleccione el otro algoritmo si est disponible. Si especifica una funcin de prdida o ciertos
tipos de restricciones, no podr utilizar el algoritmo de Levenberg-Marquardt.
v Cuando la iteracin se detiene slo porque se ha dado el nmero mximo de iteraciones, el modelo
final probablemente no sea una buena solucin. Seleccione Usar los valores iniciales del anlisis
previo del cuadro de dilogo Parmetros para continuar la iteracin o, mejor an, elija otros valores
iniciales.
v Los modelos que requieren la exponenciacin de o por valores de datos grandes pueden causar
desbordamientos (nmeros demasiado grandes o demasiado pequeos para que su equipo los
represente). A veces esto se puede evitar eligiendo los valores iniciales adecuados o imponiendo
restricciones sobre los parmetros.
Caractersticas adicionales del comando NLR
La sintaxis de comandos tambin le permite:
v Nombrar un archivo del cual leer valores iniciales para las estimaciones de los parmetros.
v Especificar ms de una sentencia de modelo y de funcin de prdida. Con ello se facilita la tarea de
especificacin de un modelo segmentado.
v Suministrar sus propias derivadas en vez de utilizar las calculadas por el programa.
v Especificar el nmero de muestras de bootstrap que se van a generar.
v Especificar criterios de iteracin adicionales, incluyendo el establecer un valor crtico para la
comprobacin de las derivadas y definir un criterio de convergencia para la correlacin entre los
residuos y las derivadas.
Los criterios adicionales para el comando CNLR (regresin no lineal restringida) permiten:
v Especificar el nmero mximo de iteraciones secundarias permitidas dentro de cada iteracin principal.
v Establecer un valor crtico para la comprobacin de las derivadas.
v Establecer un lmite para los pasos.
v Especificar una tolerancia de colapso para determinar si los valores iniciales estn dentro de los lmites
especificados.
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.
Captulo 5. Regresin no lineal 23
24 IBM SPSS Regression 22
Captulo 6. Estimacin ponderada
Los modelos de regresin lineal estndar asumen que la varianza es constante en la poblacin objeto de
estudio. Cuando ste no es el caso (por ejemplo cuando los casos con puntuaciones mayores en un
atributo muestran ms variabilidad que los casos con puntuaciones menores en ese atributo), la regresin
lineal mediante mnimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones ptimas
para el modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra variable, el
procedimiento Estimacin ponderada permite calcular los coeficientes de un modelo de regresin lineal
mediante mnimos cuadrados ponderados (MCP, WLS), de forma que se les d mayor ponderacin a las
observaciones ms precisas (es decir, aqullas con menos variabilidad) al determinar los coeficientes de
regresin. El procedimiento Estimacin ponderada contrasta un rango de transformaciones de
ponderacin e indica cul se ajustar mejor a los datos.
Ejemplo. Cules son los efectos de la inflacin y el paro sobre los cambios en el precio de las acciones
Debido a que los valores con mayor valor de cotizacin suelen mostrar ms variabilidad que aquellos con
menor valor de cotizacin, la estimacin de mnimos cuadrados ordinarios no generar estimaciones que
sean ptimas. El mtodo de Estimacin ponderada permite capturar el efecto del precio de cotizacin
sobre la variabilidad de los cambios en el precio, al calcular el modelo lineal.
Estadsticos. Valores de la log-verosimilitud para cada potencia de la variable de origen de ponderacin
puesta a prueba,R mltiple, R-cuadrado, R cuadrado corregida, tabla de ANOVA para el modelo MCP,
estimaciones de los parmetros tipificados y no tipificados y log-verosimilitud para el modelo MCP.
Estimacin ponderada: Consideraciones sobre los datos
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas,
como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables
binarias (dummy) o como otro de los tipos de variables de contraste. La variable de ponderacin deber
ser cuantitativa y estar relacionada con la variabilidad de la variable dependiente.
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debe
ser normal. La relacin entre la variable dependiente y cada variable independiente debe ser lineal y
todas las observaciones deben ser independientes. La varianza de la variable dependiente puede cambiar
segn los niveles de la variable o variables independientes, pero las diferencias se deben poder
pronosticar en funcin de la variable de ponderacin.
Procedimientos relacionados. El procedimiento Explorar se puede utilizar para inspeccionar los datos.
Este procedimiento proporciona pruebas de normalidad y homogeneidad de la varianza, as como
representaciones grficas. Si la variable dependiente parece tener la misma varianza para todos los
niveles de las variables independientes, puede utilizar el procedimiento Regresin lineal. Si los datos
parecen violar un supuesto (como puede ser la normalidad), intente transformarlos. Si los datos no estn
relacionados linealmente y una transformacin no ayuda, utilice un modelo alternativo en el
procedimiento Estimacin curvilnea. Si la variable dependiente es dicotmica, por ejemplo si se lleva o
no a cabo una determinada venta o si un artculo es o no defectuoso, utilice el procedimiento Regresin
logstica. Si la variable dependiente est censurada (por ejemplo, el tiempo de supervivencia despus de
una intervencin quirrgica), utilice los procedimientos Tablas de mortalidad, Kaplan-Meier o Regresin
de Cox, disponibles en la opcin Estadsticas avanzadas. Si los datos no son independientes (por ejemplo,
si observa a la misma persona en diversas condiciones), utilice el procedimiento Medidas repetidas,
disponible en la opcin Estadsticas avanzadas.
Para obtener un anlisis de Estimacin ponderada
1. Seleccione en los mens:
Copyright IBM Corp. 1989, 2013 25
Analizar > Regresin > Estimacin ponderada...
2. Seleccione una variable dependiente.
3. Seleccionar una o ms variables independientes.
4. Seleccione la variable que sea el origen de heterocedasticidad como variable de ponderacin.
v Variable de ponderacin. Los datos son ponderados por el inverso de esta variable elevada a una
potencia. La ecuacin de regresin se calcula para cada uno de los valores del rango de potencias
especificado y se indica la potencia que maximiza el logaritmo de la funcin de verosimilitud.
v Rango de potencia. Se utiliza en conjuncin con la variable de ponderacin para calcular las
ponderaciones. Se ajustarn varias ecuaciones de regresin, una para cada valor del rango de potencias.
Los valores introducidos en el cuadro Rango de potencias y en el cuadro Hasta, deben encontrarse
entre -6,5 y 7,5, ambos inclusive. Los valores de la potencia irn del valor menor al mayor, con el
incremento determinado por el valor especificado. El nmero total de valores del rango de potencias
est limitado a 150.
Estimacin ponderada: Opciones
Puede especificar las opciones para el anlisis de estimacin ponderada:
Guardar la mejor ponderacin como nueva variable. Aade la variable de ponderacin al archivo activo.
Esta variable se denomina WGT_n, siendo n un nmero elegido para proporcionar a la variable un
nombre exclusivo.
Mostrar ANOVA y estimaciones. Permite controlar cmo se muestran los estadsticos en los resultados.
Las alternativas disponibles son Para la mejor potencia y Para cada valor de potencia.
Caractersticas adicionales del comando WLS
La sintaxis de comandos tambin le permite:
v Proporcionar un nico valor para la potencia.
v Especificar una lista de valores para la potencia o mezclar un rango de valores con una lista de valores
para la potencia.
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.
26 IBM SPSS Regression 22
Captulo 7. Regresin por mnimos cuadrados en dos fases
Los modelos de regresin lineal estndar asumen que los errores de la variable dependiente no estn
correlacionados con la variable o variables independientes. Cuando ste no es el caso (por ejemplo,
cuando las relaciones entre las variables son bidimensionales), la regresin lineal mediante mnimos
cuadrados ordinarios (OLS) deja de proporcionar estimaciones ptimas del modelo. La regresin por
mnimos cuadrados en dos fases utiliza variables instrumentales que no estn correlacionadas con los
trminos de error para calcular los valores estimados de los predictores problemticos (en la primera fase
) y despus utiliza dichos valores calculados para estimar un modelo de regresin lineal para la variable
dependiente (la segunda fase). Dado que los valores calculados se basan en variables que no estn
correlacionadas con los errores, los resultados del modelo en dos fases son ptimos.
Ejemplo. Est relacionada la demanda de un artculo con su precio y con los ingresos del consumidor?
La dificultad de este modelo radica en que el precio y la demanda tienen efectos recprocos el uno sobre
el otro. Es decir, el precio puede influir en la demanda y la demanda tambin puede influir en el precio.
Un modelo de regresin por mnimos cuadrados en dos fases permite utilizar los ingresos de los
consumidores y el precio retardado para calcular un predictor sustituto del precio, el cual no est
correlacionado con los errores de medicin de la demanda. Se reemplaza el precio en el modelo
especificado originariamente por este sustituto y despus se estima el nuevo modelo.
Estadsticos. Para los modelos: coeficientes de regresin tipificados y no tipificados, R mltiple, R
cuadrado
,
R
cuadrado
corregida, error estndar de la estimacin, tabla de anlisis de varianza, valores pronosticados y
residuos. Adems, los intervalos de confianza al 95% para cada coeficiente de regresin y las matrices de
correlacin y covarianza para las estimaciones de los parmetros.
Regresin por mnimos cuadrados en dos fases: Consideraciones sobre los datos
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas,
como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables
binarias (dummy) o como otro de los tipos de variables de contraste. Las variables explicativas endgenas
deben ser cuantitativas (no categricas).
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debe
ser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos los
valores de la variable independiente. La relacin entre la variable dependiente y cada variable
independiente debe ser lineal.
Procedimientos relacionados. Si piensa que ninguna de las variables predictoras est correlacionada con
los errores de la variable dependiente, puede utilizar el procedimiento Regresin lineal. Si los datos
parecen violar alguno de los supuestos (como la normalidad o la varianza constante), pruebe a
transformarlos. Si los datos no estn relacionados linealmente y una transformacin no ayuda, utilice un
modelo alternativo en el procedimiento Estimacin curvilnea. Si la variable dependiente es dicotmica,
por ejemplo si se ha completado o no una determinada venta, utilice el procedimiento Regresin logstica.
Si los datos no son independientes (por ejemplo, si observa a la misma persona en diversas condiciones),
utilice el procedimiento Medidas repetidas, disponible en la opcin Modelos avanzados.
Para obtener un anlisis de regresin de mnimos cuadrados en dos fases
1. Elija en los mens:
Analizar > Regresin > Mnimos cuadrados en dos fases...
2. Seleccione una variable dependiente.
3. Seleccione una o ms variables (predictoras) explicativas.
4. Seleccione una o ms variables instrumentales.
Copyright IBM Corp. 1989, 2013 27
v Instrumental. Estas son las variables utilizadas para calcular los valores pronosticados de las variables
endgenas en la primera etapa del anlisis de mnimos cuadrados en dos fases. Las listas de variables
explicativas e instrumentales pueden contener las mismas variables. Debe haber al menos tantas
variables instrumentales como explicativas. Si las variables explicativas e instrumentales coinciden, los
resultados sern los mismos que los del procedimiento de Regresin lineal.
Las variables explicativas no especificadas como instrumentales se consideran endgenas. Normalmente,
todas las variables exgenas de la lista Explicativas se especifican tambin como variables instrumentales.
Regresin por mnimos cuadrados en dos fases: Opciones
Puede seleccionar las opciones siguientes para su anlisis:
Guardar variables nuevas. Permite aadir nuevas variables al archivo activo. Las opciones disponibles
son Predicciones y Residuos.
Mostrar covarianza de parmetros. Permite imprimir la matriz de covarianzas de las estimaciones de los
parmetros.
Caractersticas adicionales del comando 2SLS
El lenguaje de sintaxis de comandos tambin permite estimar varias ecuaciones simultneamente.
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.
28 IBM SPSS Regression 22
Captulo 8. Esquemas de codificacin de variables
categricas
En muchos procedimientos, se puede solicitar la sustitucin automtica de una variable independiente
categrica por un conjunto de variables de contraste, que se podrn introducir o eliminar de una
ecuacin como un bloque. Puede especificar cmo se va a codificar el conjunto de variables de contraste,
normalmente en el subcomando CONTRAST. Ese apndice explica e ilustra el funcionamiento real de los
distintos tipos de contrastes solicitados en CONTRAST.
Desviacin
Desviacin desde la media global. En trminos matriciales, estos contrastes tienen la forma:
mean ( 1/k 1/k ... 1/k 1/k)
df(1) (1-1/k -1/k ... -1/k -1/k)
df(2) ( -1/k 1-1/k ... -1/k -1/k)
. .
. .
df(k-1) ( -1/k -1/k ... 1-1/k -1/k)
donde k es el nmero de categoras para la variable independiente y, de forma predeterminada, se omite
la ltima categora. Por ejemplo, los contrastes de desviacin para una variable independiente con tres
categoras son los siguientes:
( 1/3 1/3 1/3)
( 2/3 -1/3 -1/3)
(-1/3 2/3 -1/3)
Para omitir una categora distinta de la ltima, especifique el nmero de la categora omitida entre el
parntesis que sucede a la palabra clave DEVIATION. Por ejemplo, el siguiente subcomando obtiene las
desviaciones para la primera y tercera categoras y omite la segunda:
/CONTRAST(FACTOR)=DEVIATION(2)
Suponga que factor tiene tres categoras. La matriz de contrastes resultante ser
( 1/3 1/3 1/3)
( 2/3 -1/3 -1/3)
(-1/3 -1/3 2/3)
Simple
Contrastes simples. Compara cada nivel de un factor con el ltimo. La forma de la matriz general es
mean ( 1/k 1/k ... 1/k 1/k)
df(1) ( 1 0 ... 0 -1)
df(2) ( 0 1 ... 0 -1)
. .
. .
df(k-1) ( 0 0 ... 1 -1)
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes simples
para una variable independiente con cuatro categoras son los siguientes:
( 1/4 1/4 1/4 1/4)
( 1 0 0 -1)
( 0 1 0 -1)
( 0 0 1 -1)
Para utilizar otra categora en lugar de la ltima como categora de referencia, especifique entre
parntesis tras la palabra clave SIMPLE el nmero de secuencia de la categora de referencia, que no es
necesariamente el valor asociado con dicha categora. Por ejemplo, el siguiente subcomando CONTRAST
obtiene una matriz de contrastes que omite la segunda categora:
/CONTRAST(FACTOR) = SIMPLE(2)
Copyright IBM Corp. 1989, 2013 29
Suponga que factor tiene cuatro categoras. La matriz de contrastes resultante ser
( 1/4 1/4 1/4 1/4)
( 1 -1 0 0)
( 0 -1 1 0)
( 0 -1 0 1)
Helmert
Contrastes de Helmert. Compara categoras de una variable independiente con la media de las categoras
subsiguientes. La forma de la matriz general es
mean (1/k 1/k ... 1/k 1/k 1/k)
df(1) ( 1 -1/(k-1) ... -1/(k-1) -1/(k-1) -1/(k-1))
df(2) ( 0 1 ... -1/(k-2) -1/(k-2) -1/(k-2))
. .
. .
df(k-2) ( 0 0 ... 1 -1/2 -1/2)
df(k-1) ( 0 0 ... 0 1 -1)
donde k es el nmero de categoras de la variable independiente. Por ejemplo, una variable
independiente con cuatro categoras tiene una matriz de contrastes de Helmert con la siguiente forma:
( 1/4 1/4 1/4 1/4)
( 1 -1/3 -1/3 -1/3)
( 0 1 -1/2 -1/2)
( 0 0 1 -1)
Diferencia
Diferencia o contrastes de Helmert inversos. Compara categoras de una variable independiente con la
media de las categoras anteriores de la variable. La forma de la matriz general es
mean ( 1/k 1/k 1/k ... 1/k)
df(1) ( -1 1 0 ... 0)
df(2) ( -1/2 -1/2 1 ... 0)
. .
. .
df(k-1) (-1/(k-1) -1/(k-1) -1/(k-1) ... 1)
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes de
diferencia para una variable independiente con cuatro categoras son los siguientes:
( 1/4 1/4 1/4 1/4)
( -1 1 0 0)
(-1/2 -1/2 1 0)
(-1/3 -1/3 -1/3 1)
Polinmico
Contrastes polinmicos ortogonales. El primer grado de libertad contiene el efecto lineal a travs de
todas las categoras; el segundo grado de libertad, el efecto cuadrtico, el tercer grado de libertad, el
cbico, y as sucesivamente hasta los efectos de orden superior.
Se puede especificar el espaciado entre niveles del tratamiento medido por la variable categrica dada. Se
puede especificar un espaciado igual, que es el valor predeterminado si se omite la mtrica, como enteros
consecutivos desde 1 hasta k, donde k es el nmero de categoras. Si la variable frmaco tiene tres
categoras, el subcomando
/CONTRAST(DRUG)=POLYNOMIAL
es idntico a
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)
De todas maneras, el espaciado igual no es siempre necesario. Por ejemplo, supongamos que frmaco
representa las diferentes dosis de un frmaco administrado a tres grupos. Si la dosis administrada al
segundo grupo es el doble que la administrada al primer grupo y la dosis administrada al tercer grupo es
30 IBM SPSS Regression 22
el triple que la del primer grupo, las categoras del tratamiento estn espaciadas por igual y una mtrica
adecuada para esta situacin se compone de enteros consecutivos:
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)
No obstante, si la dosis administrada al segundo grupo es cuatro veces la administrada al primer grupo,
y la dosis del tercer grupo es siete veces la del primer grupo, una mtrica adecuada sera
/CONTRAST(DRUG)=POLYNOMIAL(1,4,7)
En cualquier caso, el resultado de la especificacin de contrastes es que el primer grado de libertad para
frmaco contiene el efecto lineal de los niveles de dosificacin y el segundo grado de libertad contiene el
efecto cuadrtico.
Los contrastes polinmicos son especialmente tiles en contrastes de tendencias y para investigar la
naturaleza de superficies de respuestas. Tambin se pueden utilizar contrastes polinmicos para realizar
ajustes de curvas no lineales, como una regresin curvilnea.
Repetido
Compara niveles adyacentes de una variable independiente. La forma de la matriz general es
mean (1/k 1/k 1/k ... 1/k 1/k)
df(1) ( 1 -1 0 ... 0 0)
df(2) ( 0 1 -1 ... 0 0)
. .
. .
df(k-1) ( 0 0 0 ... 1 -1)
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes repetidos
para una variable independiente con cuatro categoras son los siguientes:
( 1/4 1/4 1/4 1/4)
( 1 -1 0 0)
( 0 1 -1 0)
( 0 0 1 -1)
Estos contrastes son tiles en el anlisis de perfiles y siempre que sean necesarias puntuaciones de
diferencia.
Especial
Un contraste definido por el usuario. Permite la introduccin de contrastes especiales en forma de
matrices cuadradas con tantas filas y columnas como categoras haya de la variable independiente. Para
MANOVA y LOGLINEAR, la primera fila introducida es siempre el efecto promedio, o constante, y representa el
conjunto de ponderaciones que indican cmo promediar las dems variables independientes, si las hay,
sobre la variable dada. Generalmente, este contraste es un vector de contrastes.
Las restantes filas de la matriz contienen los contrastes especiales que indican las comparaciones entre
categoras de la variable. Normalmente, los contrastes ortogonales son los ms tiles. Este tipo de
contrastes son estadsticamente independientes y son no redundantes. Los contrastes son ortogonales si:
v Para cada fila, la suma de los coeficientes de contrastes es igual a cero.
v Los productos de los correspondientes coeficientes para todos los pares de filas disjuntas tambin
suman cero.
Por ejemplo, supongamos que el tratamiento tiene cuatro niveles y que deseamos comparar los diversos
niveles del tratamiento entre s. Un contraste especial adecuado sera
(1 1 1 1) weights for mean calculation
(3 -1 -1 -1) compare 1st with 2nd through 4th
(0 2 -1 -1) compare 2nd with 3rd and 4th
(0 0 1 -1) compare 3rd with 4th
Captulo 8. Esquemas de codificacin de variables categricas 31
todo lo cual se especifica mediante el siguiente subcomando CONTRAST para MANOVA, LOGISTIC REGRESSION
y COXREG:
/CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 )
Para LOGLINEAR, es necesario especificar:
/CONTRAST(TREATMNT)=BASIS SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 )
Cada fila, excepto la fila de las medias suman cero. Los productos de cada par de filas disjuntas tambin
suman cero:
Rows 2 and 3: (3)(0) + (1)(2) + (1)(1) + (1)(1) = 0
Rows 2 and 4: (3)(0) + (1)(0) + (1)(1) + (1)(1) = 0
Rows 3 and 4: (0)(0) + (2)(0) + (1)(1) + (1)(1) = 0
No es necesario que los contrastes especiales sean ortogonales. No obstante, no deben ser combinaciones
lineales de unos con otros. Si lo son, el procedimiento informar de la dependencia lineal y detendr el
procesamiento. Los contrastes de Helmert, de diferencia y polinmicos son todos contrastes ortogonales.
Indicador
Codificacin de la variable indicadora. Tambin conocida como variable auxiliar o dummy, no est
disponible en LOGLINEAR o MANOVA. El nmero de variables nuevas codificadas es k1. Los casos en la
categora de referencia se codifican como 0 para todas las variables k1. Un caso en la categora i
sima
se
codificar como 0 para todas las variables indicadoras excepto la i
sima
, que se codificar como 1.
32 IBM SPSS Regression 22
Avisos
Esta informacin se ha desarrollado para productos y servicios ofrecidos en EE.UU.
Es posible que IBM no ofrezca los productos, servicios o funciones que se tratan en este documento en
otros pases. Pngase en contacto con el representante local de IBM si desea obtener informacin sobre los
productos y servicios disponibles en su zona. Cualquier referencia a un producto, programa o servicio de
IBM no pretende afirmar ni implicar que solamente se pueda utilizar ese producto, programa o servicio
de IBM. En su lugar, se puede utilizar cualquier producto, programa o servicio funcionalmente
equivalente que no infrinja los derechos de propiedad intelectual de IBM. Sin embargo, es
responsabilidad del usuario evaluar y comprobar el funcionamiento de todo producto, programa o
servicio que no sea de IBM.
IBM puede tener patentes o solicitudes de patente en tramitacin que abarquen temas descritos en este
documento. Este documento no le otorga ninguna licencia para estas patentes. Puede enviar preguntas
acerca de las licencias, por escrito, a:
IBM Director of Licensing
IBM Corporation
North Castle Drive
Armonk, NY 10504-1785
EE.UU.
Para consultas sobre licencias relativas a informacin de doble byte (DBCS), pngase en contacto con el
Departamento de propiedad intelectual de IBM de su pas o enve sus consultas, por escrito, a:
Intellectual Property Licensing
Legal and Intellectual Property Law
IBM Japan Ltd.
1623-14, Shimotsuruma, Yamato-shi
Xanagawa 242-8502 Japn
El prrafo siguiente no se aplica al Reino Unido ni a ningn otro pas donde estas disposiciones sean
incompatibles: INTERNATIONAL BUSINESS MACHINES CORPORATION PROPORCIONA ESTA
PUBLICACIN "TAL CUAL" SIN GARANTAS DE NINGN TIPO, NI EXPLCITAS NI IMPLCITAS,
INCLUYENDO PERO NO LIMITNDOSE A ELLAS, LAS GARANTAS IMPLCITAS DE NO
VULNERACIN, COMERCIALIZACIN O IDONEIDAD PARA UN FIN CONCRETO. Algunos estados
no permiten la renuncia a expresar o a garantas implcitas en determinadas transacciones , por lo tanto ,
esta declaracin no se aplique a usted.
Esta informacin puede incluir imprecisiones tcnicas o errores tipogrficos. Peridicamente, se efectan
cambios en la informacin aqu y estos cambios se incorporarn en nuevas ediciones de la publicacin.
IBM puede efectuar mejoras y/o cambios en los productos y/o programas descritos en esta publicacin
en cualquier momento y sin previo aviso.
Cualquier referencia a sitios Web que no sean de IBM en esta informacin slo es ofrecida por comodidad
y de ningn modo sirve como aprobacin de esos sitios Web. Los materiales de dichos sitios Web no
forman parte de los materiales para este producto de IBM y el uso de dichos sitios Web corre a cuenta y
riesgo del Cliente.
IBM puede utilizar o distribuir la informacin que usted le suministre del modo que IBM considere
conveniente sin incurrir por ello en ninguna obligacin para con usted.
33
Los licenciatarios de este programa que deseen obtener informacin sobre l con el fin de permitir: (i) el
intercambio de informacin entre programas creados independientemente y otros programas (incluido
este) y (ii) el uso mutuo de informacin que se ha intercambiado, deben ponerse en contacto con:
Tel. 901 100 400
ATTN: Licensing
200 W. Madison St.
Chicago, IL; 60606
Estados Unidos
Esta informacin estar disponible, bajo las condiciones adecuadas, incluyendo en algunos casos el pago
de una cuota.
El programa bajo licencia descrito en este documento y todo el material bajo licencia para el mismo son
proporcionados por IBM bajo los trminos del Acuerdo de Cliente de IBM, el Acuerdo Internacional de
Programa Bajo Licencia de IBM o cualquier acuerdo equivalente entre ambas partes.
Cualquier dato de rendimiento mencionado aqu ha sido determinado en un entorno controlado. Por lo
tanto, los resultados obtenidos en otros entornos operativos pueden variar de forma significativa. Es
posible que algunas mediciones se hayan realizado en sistemas en desarrollo y no existe ninguna garanta
de que estas mediciones sean las mismas en los sistemas comerciales. Adems, es posible que algunas
mediciones hayan sido estimadas a travs de extrapolacin. Los resultados reales pueden variar. Los
usuarios de este documento deben consultar los datos que corresponden a su entorno especfico.
Se ha obtenido informacin acerca de productos que no son de IBM de los proveedores de esos
productos, de sus publicaciones anunciadas o de otros orgenes disponibles pblicamente. IBM no ha
probado estos productos y no puede confirmar la precisin del rendimiento, la compatibilidad o
cualquier otra reclamacin relacionada con productos no IBM. Las preguntas acerca de las aptitudes de
productos que no sean de IBM deben dirigirse a los proveedores de dichos productos.
Todas las declaraciones sobre el futuro del rumbo y la intencin de IBM estn sujetas a cambio o retirada
sin previo aviso y representan nicamente metas y objetivos.
Esta informacin contiene ejemplos de datos e informes utilizados en operaciones comerciales diarias.
Para ilustrarlos lo mximo posible, los ejemplos incluyen los nombres de las personas, empresas, marcas
y productos. Todos esos nombres son ficticios y cualquier parecido con los nombres y direcciones
utilizados por una empresa real es pura coincidencia.
Cada copia, parcial o completa, de estos programas de ejemplo, o cualquier trabajo obtenido a partir de
los mismos, debe incluir el siguiente aviso de copyright:
Esta informacin contiene ejemplos de datos e informes utilizados en operaciones comerciales diarias.
Para ilustrarlos lo mximo posible, los ejemplos incluyen los nombres de las personas, empresas, marcas
y productos. Todos esos nombres son ficticios y cualquier parecido con los nombres y direcciones
utilizados por una empresa real es pura coincidencia.
Cada copia, parcial o completa, de estos programas de ejemplo, o cualquier trabajo obtenido a partir de
los mismos, debe incluir el siguiente aviso de copyright:
(nombre de la compaa) (ao). Algunas partes de este cdigo se derivan de programas de ejemplo de
IBM Corp.
Copyright IBM Corp. _escriba el ao o aos_. Todos los derechos reservados.
34 IBM SPSS Regression 22
Marcas comerciales
IBM, el logotipo de IBM e ibm.com son marcas registradas o marcas comerciales registradas de
International Business Machines Corp., registradas en muchas jurisdicciones en todo el mundo. Otros
nombres de producto y servicio pueden ser marcas registradas de IBM u otras compaas. Hay disponible
una lista actual de marcas registradas de IBM en la Web en Informacin de marca registrada y copyright
en www.ibm.com/legal/copytrade.shtml.
Adobe, el logotipo Adobe, PostScript y el logotipo PostScript son marcas registradas o marcas comerciales
de Adobe Systems Incorporated en Estados Unidos y/o otros pases.
Intel, el logotipo de Intel, Intel Inside, el logotipo de Intel Inside, Intel Centrino, el logotipo de Intel
Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium y Pentium son marcas comerciales o marcas
registradas de Intel Corporation o sus filiales en Estados Unidos y otros pases.
Linux es una marca registrada de Linus Torvalds en Estados Unidos, otros pases o ambos.
Microsoft, Windows, Windows NT, y el logotipo de Windows son marcas comerciales de Microsoft
Corporation en Estados Unidos, otros pases o ambos.
UNIX es una marca registrada de The Open Group en Estados Unidos y otros pases.
Java y todas las marcas comerciales y los logotipos basados en Java son marcas comerciales o registradas
de Oracle y/o sus afiliados.
Avisos 35
36 IBM SPSS Regression 22
ndice
A
Anlisis probit
Caractersticas adicionales del
comando 17
criterios 16
definicin de rango 16
ejemplo 15
estadsticos 15, 16
ndice de respuesta natural 16
intervalos de confianza fiduciaria 16
iteraciones 16
potencia relativa de la mediana 16
prueba de paralelismo 16
B
bondad de ajuste
en Regresin logstica
multinomial 11
C
casillas con 0 observaciones
en Regresin logstica
multinomial 11
categora de referencia
en Regresin logstica
multinomial 10
chi-cuadrado de Pearson
bondad de ajuste 11
estimacin del valor del escalamiento
para la dispersin 12
clasificacin
en Regresin logstica multinomial 9
contrastes
en Regresin logstica 5
covariables
en Regresin logstica 5
covariables categricas 5
covariables de cadena
en Regresin logstica 5
criterio de convergencia
en Regresin logstica
multinomial 11
D
D de Cook
en Regresin logstica 6
delta
correccin para casillas con 0
observaciones 11
DfBeta
en Regresin logstica 6
E
eliminacin hacia atrs
en Regresin logstica 4
estadstico de bondad de ajuste de
Hosmer-Lemeshow
en Regresin logstica 6
Estimacin ponderada 25
almacenamiento de la mejor
ponderacin como una variable
nueva 26
Caractersticas adicionales del
comando 26
ejemplo 25
estadsticos 25
historial de iteraciones 26
log-verosimilitud 25
mostrar ANOVA y estimaciones 26
estimaciones de los parmetros
en Regresin logstica
multinomial 11
F
funcin de desvianza
estimacin del valor del escalamiento
para la dispersin 12
H
historial de iteraciones
en Regresin logstica
multinomial 11
I
interceptacin
incluir o excluir 9
intervalos de confianza
en Regresin logstica
multinomial 11
intervalos de confianza fiduciaria
en el anlisis probit 16
iteraciones
en el anlisis probit 16
en Regresin logstica 6
en Regresin logstica
multinomial 11
L
ley de Metcherlich de devoluciones
decrecientes
en Regresin no lineal 21
log-verosimilitud
en Estimacin ponderada 25
en Regresin logstica
multinomial 11
M
matriz de correlaciones
en Regresin logstica
multinomial 11
matriz de covarianzas
en Regresin logstica
multinomial 11
modelo de densidad
en Regresin no lineal 21
modelo de densidad de rendimiento
en Regresin no lineal 21
modelo de Gauss
en Regresin no lineal 21
modelo de Gompertz
en Regresin no lineal 21
modelo de Johnson-Schumacher
en Regresin no lineal 21
modelo de Michaelis Menten
en Regresin no lineal 21
modelo de Morgan-Mercer-Florin
en Regresin no lineal 21
modelo de Peal-Reed
en Regresin no lineal 21
modelo de razn de cuadrticas
en Regresin no lineal 21
modelo de razn de cbicas
en Regresin no lineal 21
modelo de Richards
en Regresin no lineal 21
modelo de Verhulst
en Regresin no lineal 21
modelo de Von Bertalanffy
en Regresin no lineal 21
modelo de Weibull
en Regresin no lineal 21
modelo log-modificado
en Regresin no lineal 21
modelos de efectos principales
en Regresin logstica multinomial 9
modelos factoriales completos
en Regresin logstica multinomial 9
modelos no lineales
en Regresin no lineal 21
modelos personalizados
en Regresin logstica multinomial 9
P
potencia relativa de la mediana
en el anlisis probit 16
prueba de paralelismo
en el anlisis probit 16
R
R-cuadrado de Cox y Snell
en Regresin logstica
multinomial 11
37
R cuadrado de McFadden
en Regresin logstica
multinomial 11
R-cuadrado de Nagelkerke
en Regresin logstica
multinomial 11
razn de verosimilitud
bondad de ajuste 11
estimacin del valor del escalamiento
para la dispersin 12
regresin asinttica
en Regresin no lineal 21
Regresin lineal
estimacin ponderada 25
Regresin por mnimos cuadrados en
dos fases 27
Regresin Logstica 3
almacenamiento de nuevas
variables 6
binaria 1
Caractersticas adicionales del
comando 7
coeficientes 3
contrastes 5
covariables categricas 5
covariables de cadena 5
definicin de la regla de seleccin 4
ejemplo 3
establecimiento de reglas 4
estadstico de bondad de ajuste de
Hosmer-Lemeshow 6
estadsticos 3
estadsticos y grficos 6
iteraciones 6
medidas de influencia 6
mtodos de seleccin de variables 4
opciones de representacin 6
probabilidad para el mtodo por
pasos 6
punto de corte para la clasificacin 6
residuos 6
trmino constante 6
valores pronosticados 6
regresin logstica binaria 1
Regresin logstica multinomial 9, 11
Caractersticas adicionales del
comando 13
categora de referencia 10
criterios 11
estadsticos 11
exportacin de informacin del
modelo 13
guardar 13
modelos 9
Regresin no lineal 19
algoritmo de Levenberg-
Marquardt 22
almacenamiento de variables
nuevas 22
Caractersticas adicionales del
comando 23
derivadas 22
ejemplo 19
estadsticos 19
estimaciones de bootstrap 22
funcin de prdida 21
interpretacin de resultados 23
Regresin no lineal (continuacin)
lgica condicional 20
mtodos de estimacin 22
modelo segmentado 20
modelos no lineales comunes 21
parmetros 20
programacin cuadrtica
secuencial 22
residuos 22
restricciones para los parmetros 22
valores iniciales 20
valores pronosticados 22
Regresin por mnimos cuadrados en dos
fases 27
almacenamiento de nuevas
variables 28
Caractersticas adicionales del
comando 28
covarianzas de los parmetros 28
ejemplo 27
estadsticos 27
variables instrumentales 27
regresin restringida
en Regresin no lineal 22
restricciones para los parmetros
en Regresin no lineal 22
S
seleccin hacia delante
en Regresin logstica 4
seleccin por pasos
en Regresin logstica 4
en Regresin logstica multinomial 9
separacin
en Regresin logstica
multinomial 11
singularidad
en Regresin logstica
multinomial 11
subdivisin por pasos
en Regresin logstica
multinomial 11
T
tablas de clasificacin
en Regresin logstica
multinomial 11
tablas de probabilidades de casilla
en Regresin logstica
multinomial 11
trmino constante
en Regresin lineal 6
V
valor del escalamiento para la dispersin
en Regresin logstica
multinomial 12
valores de influencia
en Regresin logstica 6
38 IBM SPSS Regression 22
Impreso en Espaa