Vous êtes sur la page 1sur 22

análisis de regresión lineal simple en arqueología

Author(s): pedro lópez garcía


Source: Boletín de Antropología Americana, No. 29 (julio 1994), pp. 131-151
Published by: Pan American Institute of Geography and History
Stable URL: http://www.jstor.org/stable/40978070 .
Accessed: 22/06/2014 15:17

Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at .
http://www.jstor.org/page/info/about/policies/terms.jsp

.
JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of
content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms
of scholarship. For more information about JSTOR, please contact support@jstor.org.

Pan American Institute of Geography and History is collaborating with JSTOR to digitize, preserve and extend
access to Boletín de Antropología Americana.

http://www.jstor.org

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
pedrolópez garcía*

análisisde regresión
lineal
simpleen arqueología

Durante los años setenta los arqueólogos en dondeel uso y abuso de métodoscuantita-
influenciadospor el análisis locacional y la tivosfueevidente. Es porestarazónque en este
geografía, intentarontrascender los límitesde artículose exploraun caso de esteperíodoen
los análisistradicionales de estructuras estáti- particular.
cas,llevandoa cabo estudiosde patrón de asen- La intenciónprincipalde este estudio1es
tamiento, desarrollodejerarquíassocialesyde presentar una seriede implicacionesque con-
sociedadescomplejaselaborandoy adaptando lleva la aplicaciónde un métodoestadístico
modelosde la estadísticaclásica,involucran- conocidocomoanálisisde regresiónsimple,y
do variablesaleatorias;peroestollevolas cosas endondese puedenhacerobservaciones simul-
al caso extremo enque la arqueologíaprocesual táneasde unavariablealeatoriaY y otravaria-
tratóde demostrar que un númerolimitadode ble X (que es fija). En este caso Y es una
variablesecológicasy demográficas, jugaron funciónlinealde X y se le conocecomovaria-
un papel predominanteen dar formaa los ble respuesta,mientrasque a X se le conoce
sistemassocioculturales.Con todo esto, se como variableexplicativa.Para llevara cabo
incrementó el uso de modelos cuantitativos un análisis de esta naturaleza es necesario
de otrascienciassociales y cien- realizarvariasetapas,en las cuales se sigueun
procedentes
ciasbiológicaspararesolverproblemas asocia- razonamientopara deduciruna ecuación de
dos con la clasificaciónarqueológica.Aunque predicción, que se basa en ajustarunmodeloa
si bienes ciertoque la arqueologíaprocesual unconjuntode datosy así poderusarestemo-
comenzó a enfrentar los problemasdel co- delo paraobtenerunaestimacióny unapredic-
ción.
mercio,desarrollopolíticoy cambiode orga-
nizaciónsocialentiempos también Para ejemplificareste procedimientodel
prehistóricos
tuvounfuerte cálculode las estimacioneshemoselegidoun
impactoen muchosarqueólogos,
resultando en ungrannúmerode publicaciones
1
Quieroagradecera las siguientespersonasque colabo-
raronconmigopararealizaresteartículo.Al doctorJai-
* Profesor de la Escuela Nacionalde Antro- me LitwakKing,a GerardoJiménez,a BeatrizOspina,
investigador
pologíae Historia,México. a la doctoraPatriciaFourniery Carlos Diaz.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
132 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

caso particular, que corresponde a un estudio La regiónque Brumfiel seleccionóparapro-


realizadoporElizabethBrumfielen el año de barsu hipótesissobrepresiónpoblacionalfue
1976(Brumfiel1976), en el cual llevó a cabo la Cuenca de México porlas razonesque jus-
cuatroanálisisde regresiónsimple,conel úni- tificaen su investigación y que sonlas siguien-
co inconveniente de que las conclusionesa las tes:
que arribóla autorasólo son respaldadaspor 1) Existióun patrónde complejidadsocial
los valorescalculados para el coeficientede en aumentodentrode la Cuenca,asi comouna
determinación, lo cual consideramos que noes extensióndensamente ocupada,y la presencia
suficiente para establecer uncriterio de sopor- de comunidadesarquitectónicamente comple-
te en la comprobación de una hipótesisde tra- jas fechadasparael periodoFormati vo(Parsons
bajo y muchomenospara afirmarla. Por esta 1971a).Porotrolado,los cacicazgosfunciona-
razón,esteejemploes bastanteútilparaconsi- rondentrodel Valle para el año 550 a.c. y la
derarsi un modelomatemático puedeserade- formación del estadoes generalmente conside-
cuadoparaunconjuntode datos,porlo que en radaa coincidircon el dramáticodesarrolloo
la comprobacióndel modelo hay que tener crecimiento de Teotihuacanalrededorde 100
en cuentaque si los supuestosteóricosque sus- d.c. Las investigaciones intensivasde la mitad
tentana éstese cumplenparael ajusteque se de la Cuencaen la parteorientehanproporcio-
estáhaciendoa partir de los datos,y si hayalgu- nadodatosa partirde los cuales se puedenes-
na desviación delmismo,debemosencontrar las timarpoblacionesrelativas.Finalmente, estos
causas. Además,debemosteneren cuentaque datossugierenque el incremento poblacional
al ajustarel modelopuedenexistirobservacio- puedehabersidounproblemaparalos habitan-
nes discrepantes, conocidas como puntos tesde la subregión y estose basa en estimacio-
aberrantes o puntosinfluyentes, porlo que es neshechasparael Formativomediode 10,000
necesariohacerel diagnóstico parala detección habitantes(850-550 a.c), lo cualindicaque esta
de estospuntosy muchasveces hacerlas co- población se incrementóen la Cuenca en la
rreccionespertinentes. zona orientalpara el Formativotardío(550 -
En el trabajode Brumfiel(1976), que lleva 250 a.c.) hasta 70,000 habitantes,y para el
como títuloRegional Growthin theEastern Formativoterminal (250- 100 d.c) llegó hasta
ValleyofMexico:A Testofthe"Population Pres- untotalde 110,000habitantes (ibid.).Existie-
sure" Hypothesis,la autoraremarcala idea rona su vez cambiosen el patrónde asenta-
principal de presentarunmétodoque puedeser miento,lo que reflejavínculosde competencia
utilizadopara probarhipótesissobrepresión en las relacionesentreunidadespolíticasde
poblacionalen el caso existentede la forma- tamañoy complejidadcreciente durante el For-
cióndelestadoprimario. Con estohacemosuna mativo(Brumfiel1976).
pequeña aclaración es
y que a partirde que
Brumfield aplicaestemétodo,hanhabidocam-
bios sustancialesen

1) El análisisestadísticoy el uso de gráficos.


2) El desarrollode programas parael análisis
de datoshastala fecha.
3) El análisisde regresiónha tenidouna re-
visióny una seriede modificaciones que
hacen posible ajustarvariosmodelosen
lugarde unosolamente, lo cualpermite que
está técnicasea una de las más exactasy
actualizadasen cuantoa los métodosesta-
dísticosse refiere.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 133

Variables ño de los asentamientos en hectáreasy el po-


tencialproductivo. En la Tabla 1. 1 se muestran
En la investigaciónde Brumfiel(1976),la super- los datosoriginalesparael periodoFormativo
ficieocupadaporcada asentamiento se utilizò en la Cuencade Mexico.
comounindicador del tamañode la población; Brumfielafirmaque se puede predecirel
el potencialproductivo de cada sitiose registró tamañode los asentamientos con bastantepre-
sobrela base de dos factores :1acantidadde te-
cisión sobrela base de su potencialproducti-
rrenoagrícoladisponibleparalos ocupantesde
vo, y concluyeque el tamañode los sitiosy el
cada asentamiento y la fertilidadrelativade la
potencialproductivo estáncorrelacionados. La
tierra(la estimaciónde tierraagrícoladisponi-
ble fuehechaejecutandounanálisisde áreade precisiónde la predicciónes expresadaen tér-
minosde la "varianzaexplicada",esdecir,la
captaciónparacada asentamiento del Formati-
vo considerado, midiendoel númerode hectá- proporción de la variaciónen (y) que es expli-
reasde tierraapropiadosparacultivodentrode cada porla variable(x), a travésdel modelo.
un radio de 5 kilómetrospara cada sitio.La Paralos asentamientos del Formativo terminal
relativade los terrenos mayores de 80 Ha. se hizo una prueba,y otra
fertilidad agrícolasse
obtuvode censosagrícolasrecientes, de 1960). paralos sitiosmenoresde 80 Ha. que son los
De esta forma,se multiplicóla cantidaddel que aquí utilizamos.Para el análisisBrumfiel
áreade captacióny la fertilidad en cada asen- transformó el tamañode los sitiosen logaritmo
tamiento,para obteneruna variablellamada base 10, esto resultaconvenienteen algunos
potencialproductivo de cada sitio. casos en que la linealidadentrelas variablesno
De lo dicho anteriormente, podemosver es muyclara y, además,es un recursoal cual
que Brumfield estudiala relaciónentreel tama- se recurre con el finde estabilizarla varianza.

Tabla 1.1
Ejemplo de Brumfiel.Datos utilizadosen el análisis de regresión

(1) (2) (3) (4) (5)


Sitio Tamaño Log IO de Tierra Fertilidad Potencial
en he. tamaño arable relativa productivo

Sitios del FormativoTerminal

tx-1 74 1.87 89.9 .90 80.9


tx-17 118 2.07 54.2 .84 45.5
tx-30 50 1.70 50.8 .84 42.6
tx-50 52 1.72 51.0 1.10 56.1
ix-4 37 1.57 21.4 .85 18.2
ix-5 32 1.50 19.6 .73 14.1
ix-10 32 1.50 34.0 .73 24.8*
ch-5 54 1.73 54.7 .96 52.3
ch-14 75 1.88 29.4 1.92 56.4
ch-18 38 1.58 24.8 .96 23.7
ch-25 35 1.54 6.0 1.92 11.5
ch-26 90 1.95 12.7 1.92 24.4
ch-27 129 2.11 26.4 1.92 50.7
ch-29 43 1.63 51.4 .82 42.1
* El valormarcadocon el asteriscoen el texto
originalde Brumfiel(1976), esta dado como 28.4 lo, que
seguramentecorresponde a un errorde transcripciónde los datos.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
134 BOLETÍN DE ANTROPOLOGIAAMERICANA• 29 JULIO 1994

Modelo de regresiónsimple que los valoresobservadosde y se desviarán


porencimao pordebajode la líneaenunacan-
En el modelode regresiónlineal simple,una tidadaleatoriae. Esto implicaque el valorde
variabley dependiente,
o "explicada"se rela- Y nuncapuede ser predichoexactamente. La
cionacon unavariableX independienteo "ex- incertidumbre relativaa Y es la presenciade ei,
la
plicativa"por siguienteecuación. es decir,es una variablealeatoriaque imparte
aleatoriedada Y.
Y=ßO+ßlx (1.1)
Supuestosdel modelode regresiónsimple
En dondeßo es la ordenadaal origeny ßl
es la pendiente (cambioen el valormediode y Los supuestosque debemoshaceren un estu-
porcambiounitarioen el valorde x). ßOy ßl dio de regresiónsimpleson los siguientes:
sonparámetros de regresión desconocidos,lla-
mados,coeficientes de regresiónde la pobla- 1) La relaciónentreY y X es lineal,o al me-
ción,y debenserestimadosa partir de los datos nos puede ser aproximada,por una línea
de la muestra. Se diceque el modelolineal(1.1) recta.
es unmodelomatemático determinista, ya que 2) El término ei tienemediaceroy varianza
al sustituirun valor de X en la ecuación,el constante.
valorde y queda determinado y no se conside- E(ei)=0; var(ei)=G2'.y ei N(0,c2)i=l,2,...n.
ramargenalgunoporel error;sinembargolos Los erroresestánnormalmente distribuidos
modelosdeterministas resultanapropiadospara 3) Los erroressonindependientes es decir,no
la estimaciónsolamentecuandolos erroresde estáncorrelacionados.covíe^ej^O.V i ¿j
predicción sonpequeños.Cuandosongrandes, Que es lo mismoque decirque los ei es-
que es el caso general,hayque tomaren cuen- tánnormalmente e identicamente distribui-
ta el errorde prediccióny, en particular, dar dos con mediaceroy varianzaa2 .
algunaidea de su magnitud. Ello ocurreal ela-
borarunmodelomatemático probabilistico, un El métodoparaobtenerlos parámetros en
modeloque contieneuno o más componentes esteejemploes el métodode mínimoscuadra-
aleatoriosque se añadena la partedeterminista dos que produceestimadores paramétricos de
del modelo para tomaren cuenta el error ßO y ßl, en tal formaque se escogenvalores
aleatorio e inexplicado de la predicción que minimizanla suma de cuadradosde las
(Mendenhall1990:443-444). Así, el modelo diferencias entrelos valoresobservadosYi y
probabilistico que relacionatamañodel sitioy los valoresestimadosyi. Para comprobarlos
con el potencialproductivo X estádado porla supuestosteóricosdel modelo,se haceundiag-
siguienteexpresión. nósticoparadetectar si existeno no insuficien-
cias en el modeloo en los datos.
Así esta discusiónteóricase tomacomo
base para el análisis del ejemplo tomadode
dondepl es el estimador de ßl y se le conoce Brumfiel (1976), y ademásdel uso de gráficos
como coeficientede regresiónmuestraly a y y la respectivaevaluacióndel modelode regre-
que es el valorestimadode Y cuandoX es igual sión. De esta forma,se puedediagnosticar si
a Xi, y e se supone que es una variable hayalgo extrañoen una o másde las observa-
aleatoria.Debido a que los datosnuncacaen ciones.Aquí aclaramosque la identificación de
exactamenteen una línea recta,la diferencia observacionesextrañasno es un finen si mis-
observadaylos
entrelos valoresde la respuesta mo.Las observaciones puedenserinformativas
valoresdadosporel modelo,se llamanresiduos paramejorar el modeloo paradeterminar si hay
ei. Se suponeque el promedioo valorespera- observaciones que puedan ser excluidas
do de y está relacionadolinealmente con X, y (Atkinson1985).

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 135

En los métodos aquí utilizados se hace Para versi la relaciónentrela respuestay la


énfasisen la identificación de observaciones variableexplicativapuedeserexplicadaporun
que soninfluyentes,en el el sentidode que son modelolineal(supuesto1), graficamos prime-
crucialesa las inferenciasextraidasde los da- ro los valoresde las n parejasde datos(x,y).
tos.Para llegara detectarsi los supuestosdel Paranuestro ejemplotenemosque las variables
modelode regresiónsimplese cumplen,hay son y: log10(tamañodel sitio en hectáreas),
una granvariedadde estadísticasde diagnós- además de x: potencialproductivo,segúnse
ticosparaayudaren la identificación de obser- muestraen la Figura1.1 dondese presentael
vaciones discrepantes. Las estadísticas diagramade dispersiónde y contrax:
diagnósticascaen en tresgrupos. generales que
En la Figura1.1 la impresión
los puntosmuestran unbuenpatrónde compor-
1) Estadísticasresiduales,las cualesidentifi- tamiento en línearecta.Brumfielconcluyeque
can puntosaberrantespotencialesen el paraestecaso la variabilidadde X con respec-
espaciode la respuesta(espacio de y). to a y se explicaen más de un 82% y es signi-
2) Estadísticasde palancas,que identifican ficativaal .01, porlo que hayuna correlación
puntosaberrantes potencialesde la varia- positivaentretamañodel sitioy potencialpro-
ble explicativa(espacio de x). ductivoparalos asentamientos del Formativo
3) Estadísticasde influencia,las cuales com- terminal.
binanlos efectosde los residualesy las En efecto,si se obtienenlas estadísticas
palancas para identificarpuntos influ- globalesde esteanálisisse compruebalo dicho
yentes. por Brumfiel(véase la Tabla 1.2), pero aquí
hayque tenercuidadoen el sentidode que con
Las observaciones que tenganpalancasex- el coeficientede determinación no se puede
tremas o residualesgrandessonpotencialmente concluirque el modelosea exactamenteade-
influyentes. de influencia
Las estadísticas con- cuado para los datos,ya que cuando se está
firmansi los casos son potencialmente influ- haciendoun análisisde regresiónen estaparte
yenteso no ejercenuna fuerzaexcesivaen la sólo hemosllegado a lo que se conoce como
regresión.La mayoríade las estadísticasde análisisde agregado,en dondese consideraa
influenciamidenel cambiode la estimación en todoslos casos en conjuntoparaobtenerla es-
de regresión
los coeficientes al excluiruncaso. timaciónde los parámetros. La segundaetapa

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
136 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

2i
-
1,9 I I

O 1,8 -
ö)

- ■I
«j 1,7 I
§ I
S 1,6 - ,
3 ■
O 1.5 - ■ .
(0

I2 1,4 I I I I I I I I
10 20 30 40 50 60 70 80 90
I potencial productivo
Figura 1.1 Diagramade dispersiónde Y vs. X.

Tabla 1.2
Ajuste del modelo del ejemplo de B rumfiel (1976)

Variable indep. Coeficiente Error est. Valor-t Niv.sig.

Constante 1.4372 0.035499 40.4857 0.0000


pot.prod. 0.0057 0.000811 7.0217 0.0001

r-sq(ajust.)=0.8285

Análisisde varianzaparael modelode regresión

Fuente Sum.decuad. g.l. Cuad.med. F p-value


Modelo 0.155136 1 0.155136 49.3039 .0001
Error 0.028318 9 0.00314652

Total 0.183455 10
r-cuad.= 0.845636
Errorestándarde la estim.0.0560939
r-ajust.= 0.82848

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 137

consisteen el análisis de casos en donde se ei comouna medidadel gradode acuerdocon


estudiaporseparadoa cada parejade datosy el modeloy los datos,y si el valorobservado
ver sus efectosen la estimación;esto lleva de Yi en los datoses comparadocon sus valo-
muchasvecesa modificar el modelopropuesto res correspondientes de yi calculado por la
o permite la exclusiónde casos que tenganun ecuación de regresión, se obtienen los
fuerte impactoen la estimación de la regresión. residualesei que midenestadiscrepancia entre
Aunquelos resultadosdel ajustedel mode- los datosy el modeloajustado.Se tieneenton-
lo indicanque los resultados sonsignificativos ces que:
tantopara pO como para pi para el modelo
completo,usualmenteno podemosdetectar ei = ys- y§ (1-3)
desviaciones de los supuestossubyacentes exa-
minando el resumen de las estadísticas Si volvemosa la Figura1.1 y se trazala lí-
estándares, talcomo las estadísticasde la t,la nea de regresiónque mejorajustaa los datos,
F o la R2,pueséstassonpropiedades "globales" se puedeobservarque el patrónde las desvia-
del modeloy porlo tanto,no aseguranlo ade- cionesde la línea de regresiónsugiereque el
cuado de éste. Asi, de acuerdocon lo dicho modelopuedenorepresentar adecuadamente la
anteriormente analizaremos másendetalleeste relación,lo que podemos observarcon los
ejemplo comenzando por las estadísticasde segmentosverticalesque partende la rectade
diagnósticos.Diagnósticosde regresiónes el predicción a cada punto y que son los
nombrecon el que se le conoce a las técnicas corrimientos de los puntosrespectodel valor
paradetectarproblemasen regresión, proble- pronosticado de y. Esto puedeversede mane-
mas con el modeloo con los datos. ra más convincente en la Figura1.2. Debido a
lo anterior es conveniente calcular los
Análisisde residuales residualesde los puntos.
En la Tabla 1.3 se muestranlos cálculos
Si la estimación
de los parámetros dadosporla realizados para los valores observados y
ecuaciónde regresión de ( 1.1) es y = 1.437234 los valoresajustados(predichos), juntocon el
+ 0. 005693XÍy definimos a las desviaciones cálculode los residualescomunesei.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
138 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

2 I

I
o 1,8 -

*/<; y'

CO

NX
/^

(0

& 1,4I I I _J I I I I
10 20 30 40 50 60 70 80 90
I potencial productivo
Figura1.2 Ajustede la líneade Regresión
parael modelodelejemplode Brumfíel.

Tabla 1.3
Valoresobsevados,valoresestimados lineal
y residualespara la regresión
de loglOdel tamañode sitioscontrapotencialproductivo

Númerode Valores Valores Residuales


observación observados ajustados
1 1.8700 1.8979 -0.0279
2 1.7000 1.6802 0.0198
3 1.7200 1.7566 0.0366
4 1.5700 1.5408 0.0292
5 1.5000 1.5186 -0.0186
6 1.5000 1.5785 -0.0785
7 1.7300 1.7362 -0.0062
8 1.8800 1.7585 0.1215
9 1.5800 1.5727 0.0073
10 1.5400 1.5028 0.0372
11 1.6300 1.6771 -0.0471

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 139

Al granearlos residualescontralos valores das estandarizando a cada residual.Paralograr


predichosyi, se observauna seriede residua- estandarizara cada residuales necesariointro-
les en su mayoríacercanosal cero,así como ducirunconceptoque es el de palancas,el cual
dos observaciones, es deciruna positivamente esta íntimamente ligado con las medidasde
altay otranegativa,que corresponden a las ob- influenciaen la respuesta.La varianzade los
servacionesnúmero8 y 6 (véase Figura1.3) residualeses estimadaporlos elementosde la
y se marcanconunasterisco enla Tabla 1.3.Esta diagonalprincipalde la matrizH(matrizsom-
evidenciajunto con la que se presentaen el brero);dividiendoa cada residualpor su des-
diagramade dispersión de la Figura1.1 soporta viación estándar, tenemos el residual
la indicaciónde que hay algo extrañoacerca estandarizado, denotadoporri' En la matrizH
de la observación8 y,porotrolado, la obser- el i-ésimoelementode la diagonales hiicono-
vaciónnúmero6 aunqueen menorgrado. cida comopalancay sus valoresestánacotados
Los erroresen el modelode regresiónson de acuerdocon la desigualdad
variablesaleatoriasnormalese independiente-
mentedistribuidas con mediaceroy varianza 0 < hii < 1
común(supuestos 2 y 3). Los residuales
observa-
dos no sonindependientes y no tienenvarianza En consecuencia,se puedetenerun cono-
común. Si las varianzas son heterogé- cimientode qué tangrandese puedehacerun
neas en los residualesson fácilmente corregi- residual,antesde que su desviaciónde cerose

0,15 I

I
0,1 -

0,05 - |
CO ■
|

i
<
' !I i
UJ I
oc
"
-0,05 -

I
-0,1I I I I I I
1,4 1,5 1,6 1,7 1,8 1,9 2
I PREDICHOS
Figura 1.3 Residualesvs. PredichosY.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
140 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

pueda atribuira algo que no sea el azar. Los La ventaja de los residuales estandariza-
valores de hii están dados por: dos r'i es que si el modelo (1.1) es correcto
éstos tienen la misma varianza. Lo anteriores
hii = 1/n+ (xi-x"i)/2E(xi-xT)2 (1 .4) adecuado para los gráficosde probabilidadnor-
mal, que se analizaran más adelante y, por otro
En donde x = Xxi/nes la media aritmética lado, para graficaro ver la homogeneidad de
de xi,yla discusión de las palancas se centraen varianzas(Atkinson 1985). Otra cantidad es
la idea de que una observación es medida por considerar si la exclusión de la i-ésima obser-
el valor de hii. Es claro a partirde la expresión vación tiene un marcado efecto en la predic-
(1 .3), que el valor mínimoque puede tomarhii ción. Esto se puede hacer mediante el cálculo
es 1/n.Este valor mínimoes válido para todos de otroresidual,conocido como residual exter-
los valores que incluyen a la constante y el namente estudentizado, el cual utiliza a a2 la
máximo valor de hii es 1, que ocurre cuando estimación de exclusión S(i), que también es
el modelo ajustado es extraño a la predicción independientede yi, y está dado por la expre-
en xi y el residual es idéntico a 0(Rawlings sión:
1988). El otro límite es sobre el valor total de
hii, de hecho la traza es: ri Sr'i
"
s(i) (1.8)
s(i)^(l-hii)
Zhii = tr(H) = P' (1.5)
En donde S(i) es estimada si la i-ésima
En donde p' es el númerode parámetrosen observación es excluida del análisis, una for-
la ecuación y el valor promedio de hii es p7n. ma alternativapara el cálculo del residual ex-
Los valores de hii > 2p7n son tomados para ternamenteestudentizado es si se sustituyea
indicarobservaciones con palancas suficiente- S(i), por lo que se tendría:
mente altas en el sentido usual de distancia
r'i
euclidiana. Los casos con hii grandes son po-
tencialmentelos más influyentesen el ajuste i2
|n-p-r j
del modelo. Una potencialinfluenciano depen- L n-p-1
J (1.9)
derá de y, pero si de las X's. Otro aspecto im-
portante es el efecto de las palancas en la Cada residual estudentizado se distribuye
varianza de los residuales. No todos los como una t-studentcon (n- p' -1) grados de
residuales definidos en (1.3) tienen la misma libertad, cuando la normalidad de los ei es
varianza. Para hallar la varianza se tiene mantenida. Como ei y ri', los ri* no son
independientesel uno del otro, y se puede ver
varri = c2O-hii) (1.6) que el residual estudentizadopuede ser obteni-
do de los residuales comunes sin corrernueva-
mentela regresióncon la observación omitida.
Por lo tanto,si un residual tiene una palan-
ca alta éste tendráuna varianza pequeña a di- De hecho el residual de (1.8) es simplemente
un escalamiento de los residuales comunes.
ferenciade los puntos con palancas pequeñas.
Con las ecuaciones (1.3) para el cálculo de las
Para hallar residuales con varianza constante
(1 .6) es dividida por una estimaciónde su error palancas (1 .5, 1.6), para los residuales estanda-
rizados y la ecuación (1.9), para los residuales
estándar o S2, de esta forma se obtienen los
externamenteestudentizados, podemos detec-
residuales estandarizados para cada caso.
tar más fácilmentesi hay alguna observación
El residual estandarizado r'i es:
que sea discrepante,ya sea en el espacio de X's
. a. o en el de la respuesta. En la Tabla 1.4 presen-
n yi-yi
" tamos los cálculos realizados para esta etapa del
(1.7) análisis.
s^(l-hii) s^(l-hii)

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 141

Tabla 1.4

Residual Residual
Numerode Palancas estandarizado estudentiz
observación hü r'i r i*

1 0.4674 -0.6853 -0.6636


2 0.0945 0.3727 0.3541
3 0.1561 -0.7167 -0.6959
4 0.1763 0.5645 0.5419
5 0.2144 -0.3607 -0.3426
6 0.1297 -1.5064 -1.6423
7 0.1311 -0.1015 -0.0957
8 0.1583 2.3583 3.5985
9 0.1362 0.1427 0.1347
10 0.2422 0.7550 0.7355
11 0.0937 -0.8852 -0.8734

Se mencionóque el límitede hiiparaiden- de unpoco másde unadesviaciónestándar, lo


tificarpuntospotencialmente influyentes era cual confirma lo dichoanteriormente paralos
hii > 2p7n. De nuestroejemplotenemosque residualescomunes.Admitiendoel hechode
4/11 = 0.36364. Cualquiervalorque excede que esteresiduales el másextremo en la mues-
estelímitese puedeesperarque estéinfluyen- trade 11, los residualesrestantestiendena
do en la regresión;en la Tabla 1.4 se puede mostrar unatendenciasugiriendo que estaob-
observarque sólo la observación1 es la que servaciónestá jalando la línea de regresión
excedeestevalor,es decirque tieneunapalan- hacia arriba.
ca más altaque cualquierade las otrasobser-
vaciones.Estotambién puedeobservarse en un Influenciade casos
gráfico de hii vs. el índice, el cual muestra la
altapalancaasociadaconla observación 1. Este Otroaspectodel análisisde casos es el intento
gráficoreflejala posiciónde las 11 observacio- de entender la influenciao importancia de cada
nesenel espaciode X (Figura1.4). Lo másim- observaciónen ajustarel modelo.La idea ge-
portante de estaobservaciónes que el residual nerales estudiarlos cambiosen una partees-
asociado con este puntoes relativamente pe- pecíficadel análisiscuandolos datospresentan
queño.La contribución que estáhaciendoesta anomalíasen el ajuste.En la secciónanterior
observaciónno es detectadaporel gráficode se derivóunaseriede cálculosparadetectar las
los residualesen la formaen que las observa- diferencias significativasentrelos valoresob-
ciones8 y 6 fuerondetectadas.Una vez que la servadosy los predichos de la respuestaencada
observación1 ha sidoidentificada comoinflu- observación.Para examinarla influenciade
yenteen X, la siguienteetapaes determinar si cada observaciónes necesarioderivarotras
hay errores en los valores de y en las demás lascualespermiten
estadísticas, observarloscam-
observaciones. Con la mismatablayobservan- bios en la estimaciónde los p' parámetros.
do los valoresde los residualesestandarizados, Las estadísticas influyentespueden ser
se mencionóque estostienenvarianzacomún. calculadasdirectamente de los resulta-
a partir
Un residual que tiene varias desviaciones dosde la regresión utilizandotodoslos datos.El
estándarde ceroidentifica un posibleresidual procedimiento generalparaevaluarunpuntoen
que está influyendo en la respuesta;aquí ve- el análisisde regresiónes determinar el cam-
mos que la observación8 excede más de dos bio que ocurrecuandola i-ésimaobservación
desviacionesestándary la observación6 exce- es omitidadel análisis.Como primeraaproxi-

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
142 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

0,5 I

0,4 -

0,3 -

co ■ I
8 0,2 - !
g f
0,1 -

0I I I I I I I I I I I I
0 2 4 6 8 10 12
I indice
Figura 1.4 Palancasvs. el índice.

macióntenemosel estadístico de Cook o Di, el que sea igual a ri. Esta modificacióntiene
cual mideel efectosobrep, cuandouna obser- como principalventaja señalar puntoscon
vaciónparticulares omitida,los valoresgran- palancasaltasen donde"y" y "x" no concuer-
des de Di, indican observaciones que son dan,lo cual es consecuencia de que exista
influyentesen los parámetrosdel modelo.La algún erroren la variable explicativa. La
ecuaciónparacalcularel estadísticode Cook ecuación para el estadísticomodificadode
estádada por: Cook es entonces:

ri2hii r'2hii i (n-p')hii f2


Ci = |r*il* - -
p's2(l-hii)2"(p'(l-hii) (1.10) Lp'(l-hii) J (1.11)

Una versiónmodificadadel estadísticode Esteestadísticoda unamedidade la influen-


Cook es sugeridapor Atkinson(1985), to- de re-
cia del i-ésimocaso en los coeficientes
mandola raízcuadradade ( 1. 10), y escalan- gresióny en la varianzade los coeficientes.
do a ésta por el factorde (n-p)/ppara que Estasdos medidasDi y Ci dan un granpeso a
todas las hii tenganel mismopeso y tomen observacionesinfluyentes, en esteestadístico
el valor de p/n.Se utiliza además a S(i) co- un puntode corteparadetectarobservaciones
mo estimadorde s, y el efectodel escalar es influyentes estádado por2^(n-p)/n.Atkinson
tomarel estadísticomodificadode Cook para (1985) recomienda que los valoresseñalados

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 143

En dondey(i) es la mediaestimadaparala
i-ésimaobservación,peroen dondela i-ésima
observaciónno se utilizaen la estimación
de p.
Nóteseque g ha sido estimadacon S(i), el es-
timadorde o se calcula sinla i-ésimaobserva-
ción, mientrasque S(i) se obtienesin volver
estimarla regresiónutilizando:

ri2
V y
(n-p'-l)S2(i) = (n-p')S-2
y
(1-hii) (1.13)

La únicadiferenciaentrelos DFFITS y la
Ci es que los DFFITS sonescaladosde diferen-
te maneraa Ci, esto es, que el signodel resi-
dual es preservado.Se sugiereque DFFITS
mayoresen valor absolutoa 2p/nse utilicen
como un criteriopara señalarobservaciones
influyentes.
Por último,tenemosotraestadísticaque
mide el efecto que hay en la matriz de
varianzas-covarianzas de los parámetros esti-
mados; ésta se conoce con el nombrede
COVRATIOi. Aquí el impactoque tienela i-
ésima observaciónen la matrizde varianzas-
covarianzasde los coeficientesde regresión
estimados,es medidopor el cocientede los
determinantes de las dos matricesde varianzas-
covarianzas.Belsey,KuhyWelsch(1980) for-
mulanestocomo:

COVRATIO=det(S2(Ì)[X>(Ì)X(Ì))rl
det(s2(i)[x'x]-l)

'
i ri V
= ' n-p'-l
, + - Y 0-hii)
[V n-p n-p / J
de Ci sean graneados en la misma forma
que los de residuales,comose ilustraen la Fi-
gura1.5. 1
~
Otramedidaque estácercanamente relacio- r n-p'-l r*i2 1P
nada es proporcionadapor lo que se llama - + (1-hii)
L n-p n-p J (1.14)
DFFITS, definidacomo:
Así los determinantesde la matrizde
A. A r .. _ 1/2 varianzas-covarianzassonunamedidagenera-
yi-y(i)i I nn 1
y n
DFFITS = , lizada de la varianza. De esta forma,el
S(i)Vhii Ll-hii J s(i)(l-hii)1/2 COVRATIO reflejael impactode la i-ésima
(1.12) observaciónen la precisiónde la estimación
de

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
144 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

3,5I ¡
3 -

2,5 -

2 -

'"I
1,5-

0,5 -
II 11 11 L I i I I
I

0 2 4 6 8 10 12
I INDICE
Figura1.5 Gráfico
de Ci vs.el índice.

los coeficientes
de regresión. Valorescercanos 1.5 los valoresde las cantidadesdiagnósticas
a 1 son indicadoresde que la i-ésimaobserva- nuevamente resultanseraltos para estas mis-
cióntienepoco efectoen la precisiónde las es- mas observaciones.Si vemos los puntosde
timaciones. Por otro lado, un valor de cortede las estadísticasinfluyentes podemos
COVRATIO mayorque 1 indicaque la presen- determinar si estospuntosestáninfluyendo en
cia de la i-ésimaobservaciónincrementala la regresión.Así,parala Di es 4/11 = 0. 36364,
precisiónde la estimación;un cocientemenor porlo que se concluyeque paraéstela obser-
a 1 indicaque la presenciade la observación vación 8 sobrepasa el puntode corte. Para
daña o dificultala precisiónde la estimación. Ci = 2[(1 l-2)/l1]1/2
= 1.80907,es evidenteque
Belsey,Kuhy WelschC^SO) sugierenque va- nuevamentela observación8 es influyente,
loresde COVRATIO fuerade los límitesde 1 mientras que los DFFITS es 2^2/11 = 0. 85280
± 3 (p7 n ) son consideradosextremospara y,porúltimo,paralos valoresde COVRATIOi
propósitosde identificar puntosinfluyentes. el limitees 1 ± 3(2/11) o lo que es igual a
Una vez que se hanmencionadolas estadísti- <0.45455 ; 1.54545>; en la Tabla 1.5 se pue-
cas influyentes,
procederemos conel cálculode de observarque la observaciónque cae porde-
éstasparacada observación, en el ejemploque bajo del límiteinferior es de nuevola 8. Esto
aquí interesa.Estoscálculosse presentan en la significaque presenciade esta observación
la
Tabla 1.5 produceunincremento en la precisiónde la es-
Con el análisisanteriorpudimosobservar timacióny,porlo tanto,el residualgrandede
que habíaalgo extrañocon la observaciónnú- éstacausa que S2 sea muchomayorque S2(8).
mero8 y en menorgradocon la 6. En la Tabla Por otrolado, la observación5 y la 1 también

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISISDE REGRESIÓNLINEAL SIMPLE... 145

Tabla 1.5
Cálculo de las estadísticasde influencia

Númerode Est. de Cook Mod. de Cook


observación Di Ci DFFITS COVRATIO

1 0.2061 1.3189 -0.6217 2.13835


2 0.0073 0.2428 0.1144 1.35490
3 0.0475 0.6349 -0.2993 1.25699
4 0.0341 0.5319 0.2507 1.42959
5 0.0178 0.3797 -0.1790 1.56475
6 0.1690 1.3447 -0.6339 0.81334
7 0.0008 0.0789 -0.0372 1.45321
8 0.5232 3.3108 1.5607 0.21927
9 0.0016 0.1135 0.0535 1.45851
10 0.0911 0.8822 0.4159 1.46542
11 0.0405 0.5958 -0.2809 0.85918

excedenel límitesuperiorde esteestadístico. en los rangos de las observaciones. Si


Claramentela observación8 tieneuna gran z(l),z(2),. . ., los valoresde los datosdespués
influenciaenla estimación de mínimoscuadra- de ser ordenados de menora mayory por
dos dep. Estoresultaevidentesi grafícamos los mediode la funcióninversade la distribución
valoresde los DFFITS y los residualesexter- normalacumulativa, se tieneque z(i) =<P1 (p),
namenteetudentizados vs. el índice,lo cual se dondep es escogidacomounafuncióndel ran-
muestraen la Figura1.6. go de los residuales.Muchas eleccionesde p
Porúltimo,se debeverificar el supuestode hansido planteadas;una de ellas es utilizando
normalidadde los errores(supuesto2). Hay el valoresperadode la iésimaestadísticade or-
variastécnicaspararevisarla normalidad de los dendada porla siguienteexpresión(Atkinson
errores,unade las aproximaciones gráficasmás 1985:36).
conocidases un gráficode probabilidadnor-
mal.Si r(l) < r(2) < . . . < r(n),hayn residuales / ri -3/8 ' (1.15)
comunesordenados(porejemplolos residuales E(yi) = 0>1
' n + 1/4/
ordenadosdel negativomayoral positivoma-
yor).En un gráficode probabilidad normalse Donde ri es el rangode ri y n es el tama-
graficar(i) vs. 100 * (i - l/2)/nutilizandoun ño de la muestra;esta funciónproporciona
papelespecial,llamadopapel de probabilidad una buena aproximaciónsi n>5. A continua-
normal.Si los erroresestánnormalmente dis- ción se presentael gráficode probabilidad
tribuidos,estospuntosdebencaeraproximada- normal para los datos de Brumfiel (Fi-
menteen unalínearecta;porotrolado,si se da gura 1.7).
el caso de no-normalidad de los errores,los En estegráficoes evidenteque hayunaten-
datosno seguiránunatendencialinealgeneral. dencialineal,sinembargoen el extremosupe-
Puedenocurriralgunasfluctuaciones de tipo riorderechose detectauna observaciónque
aleatorioen estetipode gráficosdebidoa que estáen una posiciónmuyremotaen compara-
los residualesson variablesaleatorias.El pa- ciónconel resto.Estaobservación nuevamente
queteordenalos valoresde los datosantesde correspondea la número8, lo cual indica
ser graficados:el eje verticalcorrespondea que estaobservación estárompiendo el supues-
los valoresesperadospara la normalbasados to de normalidad.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
146 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

2 i

1,5 -

1 -

(0

-0,5
-
IM1 ¡
_!I | | | I I
0 2 4 6 8 10 12
I ÍNDICE
Figura 1.6 Graficode los Dffitsvs. el índice.

co 4 i 1

- 3 -
■o

I 2-
c
E 1 ~
I

| 0__J ■
' ■
§ -1 -

ä _2i lili i
0 2 4 6 8 10 12
I índice
Figura 1.6 Residualesexternamente
estudentizadosvs. el índice.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 147

100 i 1 1
I
90 -
I
80 -
I
70-
,
60 - ■

50 - ■

40 -
I
30 -

20 - ■

10 - ■
- J
0Li_J
-0,1 -0,05 0
,
0,05 0,1
, 1
0,15
I Residuales
Figura1.7 Gráfico normal.
de probabilidad

Interpretacióny análisis de resultados ocupó una superficie de 75 hectáreas;perosi


observamosla Tabla 1.7 (Brumfiel1976:244)
En esteejemplohemoshechoun seguimiento donde se muestrala clasificación de estos
de lo que se conoce como diagnóstico del asentamientos hechapor los mismosautores,
modelode regresión, ycualquieraproximación podemosobservarque existen6 centrosloca-
que utiliceuna técnicacomoéstaen un análi- les en esta región. Estos asentamientosse
sis debe por lo menosrevisarlos supuestos muestran en el Mapa 1. 1 (ibid.243). De acuer-
implícitosdel modelode regresión ya que, en do con esto se tendría una jerarquía de
caso contrario,no se puede confiaren las asentamientos a variosniveles,lo cual lleva a
inferenciasnien las prediccionesobtenidasde carecerde unacorrelaciónperfecta entreel ta-
un análisisde esta naturaleza.Ahorabien,se mañode los asentamientos el
y potencialpro-
detectóque la observación8 es la que mayor ductivo, cosa que afirmaBrumfiely que
peso tieneen el cálculode mínimoscuadrados sostieneconel coeficiente de determinación.Al
parala regresión. Si revisamosla información inicio de este ejemplo mencionamos que
que existeparaestepunto,es un asentamiento Brumfiel excluyelos asentamientos conmásde
del Formativo terminalque clasificanParsons 80 hectareas(Tx-TF- 17,Ch-TF-26y Ch-TF-27)
y Brumfiel (1976:244) como el sitionúmero paraesteanálisis,los cuales son tambiéncen-
Ch-TF-14;se tratade un centrolocal con una tros locales; si consideramos estos tres
poblaciónentre2,000y4,000 habitantes y que asentamientostenemosentoncesun análisis

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
148 BOLETÍN DE ANTROPOLOGIAAMERICANA• 29 JULIO 1994

Tabla 1.7
Clasificaciónde los asentamientosutilizadosen el análisis de regresión

Sitio número Clasificación Area en he. Población

tx-tf-1 centrolocal 74.0 2500


tx-tf-30 centrolocal 50.0 2000
tx-tf-50 centrolocal 52.0 1500
ix-tf-4 centrolocal 37.0 1850
ix-tf-5 centrolocal 32.0 1600
ix-tf-10 aldea grandedispersa 32.0 1600
ch-tf-5 caserío 54.0 50-100
ch-tf-14 centrolocal 74.0 2000-4000
ch-tf-18 pequeñocaserío 38.0 5-10
ch-tf-25 pequeñaaldea dispersa 35.0 150
ch-tf-29 pequeñocaserío 43.0 10

que sólo está considerando una granmayoría transformar e inclusivetransformando también


de centros regionales y excluyendo a los a la variablerespuestaa la mismaescala que la
asentamientos que estánpordebajo de estaje- variableexplicativa,sin lograrningunamejo-
rarquía. ríaen cuantoal ajustese refiere.
Porotrolado,si se excluyea la observación Creemosque el erroren el ajustese debe a
(8) del análisisy se correunnuevoanálisis,las que la variablepredictora X debe serfijay sin
estadísticasvaríansin cambios aparentesen errory, en este caso, está funcionandocomo
los coeficientes perovuelvena surgirobserva- variablealeatoriatantoporla incertidumbre en
ciones influyentes y puntosdiscrepantes;en el cálculode tierraarable,así comoel índicede
este caso la observaciónnúmero6 es la que fertilidadrelativael cual fuetomadode censos
afectael análisis.De hechose corrieron varias agrícolas modernos; resultadifícilquererextra-
pruebasparaaproximarse al mejormodelo,ex- polar estos resultadosa una tecnologíamuy
cluyendola observación8, otrapruebaelimi- alejada en el tiempoy, por otrolado, en el
nando sólo a la observación6, otra sin las cálculo de áreas de captaciónpodríaser otra
observaciones 8 y6, unamássinla observación fuentede errorya que, siendola Cuenca una
1 que es la que tieneun mayorimpactoen el zona lacustre,quizás la estimaciónno sea ade-
espaciode x, se corrióotrapruebasinla obser- cuada pormediodel radiode 5 kilómetros uti-
vación1 y 6, y porúltimootrasinlas observa- lizadoen las áreasde captación, sinoque sería
ciones 1, 8 y 6 que resultaronser las mas preferible otrotipode estimaciónde formadi-
impactantes en todoslos análisis. ferente,porejemploel ajustede una elípticaa
Pero esto no fuesuficientepara elegirun cada sitioesto porqueel acceso a recursosno
buenmodeloyaque excluyendoalgunaobser- es siempreigualen todasdirecciones.
vación vuelven a surgir observaciones En la selecciónde los asentamientos para
aberrantes en el nuevomodelo,haciendoque el análisissólo se consideran11 de éstosy,de
los supuestosdel modelono se cumplany lle- acuerdo con la informaciónpara la región
ven a deficienciasen cada modeloque se co- de Chalco, hayun totalde 63 asentamientos
rrió. Lo mismo ocurrió para los datos sin parael Formativo terminal;porotraparte,para

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISIS DE REGRESIÓN LINEAL SIMPLE... 149

- Lagode r~' v, ^
J ^Z >TS

r ikm '- -^^^ 'ffr<t^Ä


- ' tBT Ch-26 - ch-27 roS

Mapa 1.1 de los asentamientos


Distribución del Formativoterminal(Brumfiele. 1976:243).

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
150 BOLETÍN DE ANTROPOLOGIA AMERICANA • 29 JULIO 1994

Ixtapalapahayun totalde 13 asentamientos y caso linealsimplecomo parael múltiplema-


por ultimo,paraTexcoco hay un totalde 52 los ajustes.
asentamientos registrados. Así se tendríaque Así nuevamenteinsistimosen que las va-
evaluarla selecciónde los asentamientos en la riables no estánbien declaradas y, por otro
muestraporunmétodode selecciónaleatoria, lado, la explicaciónmás logica del impacto
dando una probabilidadigual a cada asenta- de las observacionesinfluyentesen los datos
mientosi se hicierael análisiscon una mues- hacen pensarque el modelo lineal no repre-
trapequeñacomoen estecaso o, porotrolado, senta adecuadamentela relación para estos
correrun análisis incluyendoal totalde los valoresextremos,y difícilmente lo presenta-
asentamientos registrados. ría algún otro modelo que ajuste con esta
Otro aspecto que cabe mencionares que informaciónya que se esta hablando de un
paraexplicarunahipótesiscomola que propo- modelo causal.
ne Brumfiel seríamas conveniente considerar
el métodode regresiónmultiple,en dondese Bibliografía
involucranun mayornúmerode variables
predictoras y, porlo tanto,un mayornúmero AtkinsonA. C.
de parámetros a estimar paraconestobuscarun 1985 Plots,Transformations,andRegression.
mejor modelo, ya sea que ésteresulteserlineal ClarendonPressOxford.
o no lineal. Belsley,D.A.Kuh,E. and Welsch,R.E.
Para no quedarnoscon la duda,con la in- 1980 Regression Diagnostics: Identifyin
formacióndisponiblede Brumfielcorrimos InfluenciaiData and Sources of Col-
tambiénel modelode regresión múltipleresul- linearity.JohnWiley and Sons. New
tandounajustemuymalo,aún incluyendova- York.
riablesdummy, o indicadorasque son aquellas Brumfiel,Elizabeth
asignadasa una categoríao condicióny pue- 1976 RegionalGrowthin theEasternValley
den tomarel valor de uno si la observación of Mexico:A test of the "Population
pertenecea una categoríao satisfacealguna Pressure" Hipothesis, en The Early
condición,por otrolado la variabletomael Mesoamerican Village. Ed. Flannery
valorde cero.De igualmanerase corrieron una Kent V. Academic Press. New York,
seriede simulacionesobteniendotantoparael San Francisco, London.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions
PEDRO LOPEZ GARCIA ANALISISDE REGRESIÓNLINEAL SIMPLE... 151

DraperN. R. theTexcoco region,México". Mem-


1981 AppliedRegressionAnalysis.NewYork oirs of the Museum of Anthropol-
Wiley. ogy, Universityof Michigan,3,Ann
Gunt,RichardF. Arbor.
1980 RegressvwAnalysisand its Applica- 1976 "Prehispanic Patterns
Settlement inthe
tions.MarcelDekkerInc.NewYorkand southern Valleyof México:theChalco
Basel. and Xochimilcoregions".Manuscript,
MendenhallW. MuseumofAntropology, Universityof
1990 Estadística para administradores. Michigan.
IberoaméricaS.A. de C.V., México. Rawlings,JohnO.
R.
Parsons,Jeffrey 1988 Applied Regression Analysis.
1971 "Prehispanic settlementpatternsin WadsworthInc. Belmont,California.

This content downloaded from 62.122.79.21 on Sun, 22 Jun 2014 15:17:07 PM


All use subject to JSTOR Terms and Conditions

Vous aimerez peut-être aussi