Académique Documents
Professionnel Documents
Culture Documents
Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at .
http://www.jstor.org/page/info/about/policies/terms.jsp
.
JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of
content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms
of scholarship. For more information about JSTOR, please contact support@jstor.org.
Pan American Institute of Geography and History is collaborating with JSTOR to digitize, preserve and extend
access to Boletín de Antropología Americana.
http://www.jstor.org
análisisde regresión
lineal
simpleen arqueología
Durante los años setenta los arqueólogos en dondeel uso y abuso de métodoscuantita-
influenciadospor el análisis locacional y la tivosfueevidente. Es porestarazónque en este
geografía, intentarontrascender los límitesde artículose exploraun caso de esteperíodoen
los análisistradicionales de estructuras estáti- particular.
cas,llevandoa cabo estudiosde patrón de asen- La intenciónprincipalde este estudio1es
tamiento, desarrollodejerarquíassocialesyde presentar una seriede implicacionesque con-
sociedadescomplejaselaborandoy adaptando lleva la aplicaciónde un métodoestadístico
modelosde la estadísticaclásica,involucran- conocidocomoanálisisde regresiónsimple,y
do variablesaleatorias;peroestollevolas cosas endondese puedenhacerobservaciones simul-
al caso extremo enque la arqueologíaprocesual táneasde unavariablealeatoriaY y otravaria-
tratóde demostrar que un númerolimitadode ble X (que es fija). En este caso Y es una
variablesecológicasy demográficas, jugaron funciónlinealde X y se le conocecomovaria-
un papel predominanteen dar formaa los ble respuesta,mientrasque a X se le conoce
sistemassocioculturales.Con todo esto, se como variableexplicativa.Para llevara cabo
incrementó el uso de modelos cuantitativos un análisis de esta naturaleza es necesario
de otrascienciassociales y cien- realizarvariasetapas,en las cuales se sigueun
procedentes
ciasbiológicaspararesolverproblemas asocia- razonamientopara deduciruna ecuación de
dos con la clasificaciónarqueológica.Aunque predicción, que se basa en ajustarunmodeloa
si bienes ciertoque la arqueologíaprocesual unconjuntode datosy así poderusarestemo-
comenzó a enfrentar los problemasdel co- delo paraobtenerunaestimacióny unapredic-
ción.
mercio,desarrollopolíticoy cambiode orga-
nizaciónsocialentiempos también Para ejemplificareste procedimientodel
prehistóricos
tuvounfuerte cálculode las estimacioneshemoselegidoun
impactoen muchosarqueólogos,
resultando en ungrannúmerode publicaciones
1
Quieroagradecera las siguientespersonasque colabo-
raronconmigopararealizaresteartículo.Al doctorJai-
* Profesor de la Escuela Nacionalde Antro- me LitwakKing,a GerardoJiménez,a BeatrizOspina,
investigador
pologíae Historia,México. a la doctoraPatriciaFourniery Carlos Diaz.
Tabla 1.1
Ejemplo de Brumfiel.Datos utilizadosen el análisis de regresión
2i
-
1,9 I I
O 1,8 -
ö)
- ■I
«j 1,7 I
§ I
S 1,6 - ,
3 ■
O 1.5 - ■ .
(0
I2 1,4 I I I I I I I I
10 20 30 40 50 60 70 80 90
I potencial productivo
Figura 1.1 Diagramade dispersiónde Y vs. X.
Tabla 1.2
Ajuste del modelo del ejemplo de B rumfiel (1976)
r-sq(ajust.)=0.8285
Total 0.183455 10
r-cuad.= 0.845636
Errorestándarde la estim.0.0560939
r-ajust.= 0.82848
2 I
I
o 1,8 -
*/<; y'
CO
NX
/^
(0
& 1,4I I I _J I I I I
10 20 30 40 50 60 70 80 90
I potencial productivo
Figura1.2 Ajustede la líneade Regresión
parael modelodelejemplode Brumfíel.
Tabla 1.3
Valoresobsevados,valoresestimados lineal
y residualespara la regresión
de loglOdel tamañode sitioscontrapotencialproductivo
0,15 I
I
0,1 -
0,05 - |
CO ■
|
i
<
' !I i
UJ I
oc
"
-0,05 -
I
-0,1I I I I I I
1,4 1,5 1,6 1,7 1,8 1,9 2
I PREDICHOS
Figura 1.3 Residualesvs. PredichosY.
pueda atribuira algo que no sea el azar. Los La ventaja de los residuales estandariza-
valores de hii están dados por: dos r'i es que si el modelo (1.1) es correcto
éstos tienen la misma varianza. Lo anteriores
hii = 1/n+ (xi-x"i)/2E(xi-xT)2 (1 .4) adecuado para los gráficosde probabilidadnor-
mal, que se analizaran más adelante y, por otro
En donde x = Xxi/nes la media aritmética lado, para graficaro ver la homogeneidad de
de xi,yla discusión de las palancas se centraen varianzas(Atkinson 1985). Otra cantidad es
la idea de que una observación es medida por considerar si la exclusión de la i-ésima obser-
el valor de hii. Es claro a partirde la expresión vación tiene un marcado efecto en la predic-
(1 .3), que el valor mínimoque puede tomarhii ción. Esto se puede hacer mediante el cálculo
es 1/n.Este valor mínimoes válido para todos de otroresidual,conocido como residual exter-
los valores que incluyen a la constante y el namente estudentizado, el cual utiliza a a2 la
máximo valor de hii es 1, que ocurre cuando estimación de exclusión S(i), que también es
el modelo ajustado es extraño a la predicción independientede yi, y está dado por la expre-
en xi y el residual es idéntico a 0(Rawlings sión:
1988). El otro límite es sobre el valor total de
hii, de hecho la traza es: ri Sr'i
"
s(i) (1.8)
s(i)^(l-hii)
Zhii = tr(H) = P' (1.5)
En donde S(i) es estimada si la i-ésima
En donde p' es el númerode parámetrosen observación es excluida del análisis, una for-
la ecuación y el valor promedio de hii es p7n. ma alternativapara el cálculo del residual ex-
Los valores de hii > 2p7n son tomados para ternamenteestudentizado es si se sustituyea
indicarobservaciones con palancas suficiente- S(i), por lo que se tendría:
mente altas en el sentido usual de distancia
r'i
euclidiana. Los casos con hii grandes son po-
tencialmentelos más influyentesen el ajuste i2
|n-p-r j
del modelo. Una potencialinfluenciano depen- L n-p-1
J (1.9)
derá de y, pero si de las X's. Otro aspecto im-
portante es el efecto de las palancas en la Cada residual estudentizado se distribuye
varianza de los residuales. No todos los como una t-studentcon (n- p' -1) grados de
residuales definidos en (1.3) tienen la misma libertad, cuando la normalidad de los ei es
varianza. Para hallar la varianza se tiene mantenida. Como ei y ri', los ri* no son
independientesel uno del otro, y se puede ver
varri = c2O-hii) (1.6) que el residual estudentizadopuede ser obteni-
do de los residuales comunes sin corrernueva-
mentela regresióncon la observación omitida.
Por lo tanto,si un residual tiene una palan-
ca alta éste tendráuna varianza pequeña a di- De hecho el residual de (1.8) es simplemente
un escalamiento de los residuales comunes.
ferenciade los puntos con palancas pequeñas.
Con las ecuaciones (1.3) para el cálculo de las
Para hallar residuales con varianza constante
(1 .6) es dividida por una estimaciónde su error palancas (1 .5, 1.6), para los residuales estanda-
rizados y la ecuación (1.9), para los residuales
estándar o S2, de esta forma se obtienen los
externamenteestudentizados, podemos detec-
residuales estandarizados para cada caso.
tar más fácilmentesi hay alguna observación
El residual estandarizado r'i es:
que sea discrepante,ya sea en el espacio de X's
. a. o en el de la respuesta. En la Tabla 1.4 presen-
n yi-yi
" tamos los cálculos realizados para esta etapa del
(1.7) análisis.
s^(l-hii) s^(l-hii)
Tabla 1.4
Residual Residual
Numerode Palancas estandarizado estudentiz
observación hü r'i r i*
0,5 I
0,4 -
0,3 -
co ■ I
8 0,2 - !
g f
0,1 -
0I I I I I I I I I I I I
0 2 4 6 8 10 12
I indice
Figura 1.4 Palancasvs. el índice.
macióntenemosel estadístico de Cook o Di, el que sea igual a ri. Esta modificacióntiene
cual mideel efectosobrep, cuandouna obser- como principalventaja señalar puntoscon
vaciónparticulares omitida,los valoresgran- palancasaltasen donde"y" y "x" no concuer-
des de Di, indican observaciones que son dan,lo cual es consecuencia de que exista
influyentesen los parámetrosdel modelo.La algún erroren la variable explicativa. La
ecuaciónparacalcularel estadísticode Cook ecuación para el estadísticomodificadode
estádada por: Cook es entonces:
En dondey(i) es la mediaestimadaparala
i-ésimaobservación,peroen dondela i-ésima
observaciónno se utilizaen la estimación
de p.
Nóteseque g ha sido estimadacon S(i), el es-
timadorde o se calcula sinla i-ésimaobserva-
ción, mientrasque S(i) se obtienesin volver
estimarla regresiónutilizando:
ri2
V y
(n-p'-l)S2(i) = (n-p')S-2
y
(1-hii) (1.13)
La únicadiferenciaentrelos DFFITS y la
Ci es que los DFFITS sonescaladosde diferen-
te maneraa Ci, esto es, que el signodel resi-
dual es preservado.Se sugiereque DFFITS
mayoresen valor absolutoa 2p/nse utilicen
como un criteriopara señalarobservaciones
influyentes.
Por último,tenemosotraestadísticaque
mide el efecto que hay en la matriz de
varianzas-covarianzas de los parámetros esti-
mados; ésta se conoce con el nombrede
COVRATIOi. Aquí el impactoque tienela i-
ésima observaciónen la matrizde varianzas-
covarianzasde los coeficientesde regresión
estimados,es medidopor el cocientede los
determinantes de las dos matricesde varianzas-
covarianzas.Belsey,KuhyWelsch(1980) for-
mulanestocomo:
COVRATIO=det(S2(Ì)[X>(Ì)X(Ì))rl
det(s2(i)[x'x]-l)
'
i ri V
= ' n-p'-l
, + - Y 0-hii)
[V n-p n-p / J
de Ci sean graneados en la misma forma
que los de residuales,comose ilustraen la Fi-
gura1.5. 1
~
Otramedidaque estácercanamente relacio- r n-p'-l r*i2 1P
nada es proporcionadapor lo que se llama - + (1-hii)
L n-p n-p J (1.14)
DFFITS, definidacomo:
Así los determinantesde la matrizde
A. A r .. _ 1/2 varianzas-covarianzassonunamedidagenera-
yi-y(i)i I nn 1
y n
DFFITS = , lizada de la varianza. De esta forma,el
S(i)Vhii Ll-hii J s(i)(l-hii)1/2 COVRATIO reflejael impactode la i-ésima
(1.12) observaciónen la precisiónde la estimación
de
3,5I ¡
3 -
2,5 -
2 -
'"I
1,5-
0,5 -
II 11 11 L I i I I
I
0 2 4 6 8 10 12
I INDICE
Figura1.5 Gráfico
de Ci vs.el índice.
los coeficientes
de regresión. Valorescercanos 1.5 los valoresde las cantidadesdiagnósticas
a 1 son indicadoresde que la i-ésimaobserva- nuevamente resultanseraltos para estas mis-
cióntienepoco efectoen la precisiónde las es- mas observaciones.Si vemos los puntosde
timaciones. Por otro lado, un valor de cortede las estadísticasinfluyentes podemos
COVRATIO mayorque 1 indicaque la presen- determinar si estospuntosestáninfluyendo en
cia de la i-ésimaobservaciónincrementala la regresión.Así,parala Di es 4/11 = 0. 36364,
precisiónde la estimación;un cocientemenor porlo que se concluyeque paraéstela obser-
a 1 indicaque la presenciade la observación vación 8 sobrepasa el puntode corte. Para
daña o dificultala precisiónde la estimación. Ci = 2[(1 l-2)/l1]1/2
= 1.80907,es evidenteque
Belsey,Kuhy WelschC^SO) sugierenque va- nuevamentela observación8 es influyente,
loresde COVRATIO fuerade los límitesde 1 mientras que los DFFITS es 2^2/11 = 0. 85280
± 3 (p7 n ) son consideradosextremospara y,porúltimo,paralos valoresde COVRATIOi
propósitosde identificar puntosinfluyentes. el limitees 1 ± 3(2/11) o lo que es igual a
Una vez que se hanmencionadolas estadísti- <0.45455 ; 1.54545>; en la Tabla 1.5 se pue-
cas influyentes,
procederemos conel cálculode de observarque la observaciónque cae porde-
éstasparacada observación, en el ejemploque bajo del límiteinferior es de nuevola 8. Esto
aquí interesa.Estoscálculosse presentan en la significaque presenciade esta observación
la
Tabla 1.5 produceunincremento en la precisiónde la es-
Con el análisisanteriorpudimosobservar timacióny,porlo tanto,el residualgrandede
que habíaalgo extrañocon la observaciónnú- éstacausa que S2 sea muchomayorque S2(8).
mero8 y en menorgradocon la 6. En la Tabla Por otrolado, la observación5 y la 1 también
Tabla 1.5
Cálculo de las estadísticasde influencia
2 i
1,5 -
1 -
(0
-0,5
-
IM1 ¡
_!I | | | I I
0 2 4 6 8 10 12
I ÍNDICE
Figura 1.6 Graficode los Dffitsvs. el índice.
co 4 i 1
- 3 -
■o
I 2-
c
E 1 ~
I
| 0__J ■
' ■
§ -1 -
ä _2i lili i
0 2 4 6 8 10 12
I índice
Figura 1.6 Residualesexternamente
estudentizadosvs. el índice.
100 i 1 1
I
90 -
I
80 -
I
70-
,
60 - ■
50 - ■
40 -
I
30 -
20 - ■
10 - ■
- J
0Li_J
-0,1 -0,05 0
,
0,05 0,1
, 1
0,15
I Residuales
Figura1.7 Gráfico normal.
de probabilidad
Tabla 1.7
Clasificaciónde los asentamientosutilizadosen el análisis de regresión
- Lagode r~' v, ^
J ^Z >TS