Académique Documents
Professionnel Documents
Culture Documents
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
ANLISISDECORRESPONDENCIAS(AC)
Esunatcnicadescriptivaoexploratoriacuyoobjetivoesresumirunagrancantidaddedatosenun
nmeroreducidodedimensiones,conlamenorprdidadeinformacinposible.
Enestalnea,suobjetivoessimilaraldelosmtodosfactoriales,salvoqueenelcasodelanlisisde
correspondenciaselmtodoseaplicasobrevariablescategricasuordinales.
Elanlisisdecorrespondenciassimplesseutilizaamenudoenlarepresentacindedatosquese
puedenpresentarenformadetablasdecontingenciadedosvariablesnominalesuordinales.Otras
utilizacionesimplicaneltratamientodetablasdeproximidadodistanciaentreelementos,ytablas
depreferencias.
Sisetratadeunatabladecontingenciadedosvariablescualitativas,unavariablecuyascategoras
aparecenenfilasylaotravariablecuyascategorassonrepresentadasencolumnas,elanlisisde
correspondenciasconsisteenresumirlainformacinpresenteenlasfilasycolumnasdemaneraque
puedaproyectarsesobreunsubespacioreducido,yrepresentarsesimultneamentelospuntosfilay
lospuntoscolumna,pudindoseobtenerconclusionessobrerelacionesentrelasdosvariables
nominalesuordinalesdeorigen.
Laextensindelanlisisdecorrespondenciassimplesalcasodevariasvariablesnominales(tablasde
contingenciamultidimensionales)sedenominaAnlisisdeCorrespondenciasMltiples,yutilizalos
mismosprincipiosgeneralesquelatcnicaanterior.Engeneralseorientaacasosenloscualesuna
variablerepresentatemsoindividuosyelrestosonvariablescualitativasuordinalesque
representancualidades.
EntrelautilizacindelAnlisisdeCorrespondenciasSimpleyMltiple,estudios:
PreferenciasdeconsumoenInvestigacindeMercados.
Posicionamientodeempresasapartirdelaspreferenciasdeconsumidores.
Bsquedadetipologasdeindividuosrespectoavariablescualitativas(patronesde
enfermedadesenmedicina,perfilespsicolgicos,comportamientodeespeciesenbiologa,etc.).
ElAnlisisdeCorrespondenciastienedosobjetivosbsicos:
Asociacinentrecategorasdecolumnasofilas:Medirlaasociacindesolounafilaocolumna,para
ver,porejemplo,silasmodalidadesdeunavariablepuedensercombinadas.
Asociacinentrecategorasdefilasycolumnas:Estudiarsiexisterelacinentrecategorasdelasfilas
ycolumnas.
Elanlisisdecorrespondenciassolorequierequelosdatosrepresentenlasrespuestasaunaseriede
preguntasyqueestnorganizadasencategoras.Dependiendosiexistendosomsvariablesel
anlisissersimpleomltiple.
UnanlisisdecorrespondenciasenSPSS:Analizar/Reduccindedatos/Anlisisdecorrespondencias.
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
PLANTEAMIENTODELPROBLEMA
ElAnlisisdeCorrespondenciasesunatcnicaestadsticaqueseutilizaparaanalizar,desdeun
puntodevistagrfico,lasrelacionesdedependenciaeindependenciadeunconjuntodevariables
categricasapartirdelosdatosdeunatabladecontingencia.
Paraelloasociaacadaunadelasmodalidadesdelatabla,unpuntoenelespacioRn(generalmente
n=2)deformaquelasrelacionesdecercana/lejanaentrelospuntoscalculadosreflejenlas
relacionesdedependenciaysemejanzaexistentesentreellas.
SecomienzaanalizandoelproblemabidimensionalqueeselqueanalizaelAnlisisde
Correspondenciaspropiamentedicho.Posteriormentesetrata,brevemente,delproblema
ndimensional(n3)queeselproblemaqueanalizaelAnlisisdeCorrespondenciasMltiples.
SeaXeYdosvariablescategricas,respectivamente,convalores{x1,...,xk}e{y1,...,ym}.Seobservan
dichasvariablesenNelementosdeunapoblacin.Lainterseccinentreunafilayunacolumnada
lugaraunaceldaocasilla,cuyafrecuenciaobservadaes nij
Y
X
x1
x2
M
M
xi
M
M
xk
y1
y2
n11
n12
(e 11 )
(e 12 )
n21
n22
(e 21 )
(e 22 )
M
M
ni1
M
M
ni2
(e i1 )
(e i2 )
M
M
nk1
M
M
nk2
(e k1 )
(e k2 )
N1
N 2
yj
.......
n1 j
.......
(e 1 j )
n2 j
.......
M
M
(e 2 j )
ym
.......
n1m
.......
nij
(eij )
.......
M
M
nim
nkj
.......
(e kj )
M
M
M
M
nkm
.......
M
M
Nk
(e km )
N j
N j = nij
i =1
N = Ni = N j
Ni
(e im )
.......
j =1
N2
(e 2m )
.......
Ni = nij
n2m
.......
.......
.......
N1
(e 1m )
Nm
e ij =
Ni . N j
N
LosPERFILESMARGINALESdescribenladistribucinmarginaldelasvariablesXeY,respectivamente,
sereflejanenlassiguientestablas:
X = xi
Frecuencias
relativasmarginales
Y = yj
Frecuencias
relativasmarginales
SantiagodelaFuenteFernndez
x1
x2
N1
N2
y1
y2
N1
N2
......
......
......
......
xi
Ni
N
yj
N j
N
......
......
......
......
xk
Nk
N
ym
Nm
N
Total
1
Total
1
AnlisisdeCorrespondencias
LosPERFILESCONDICIONALESdescribenlasdistribucionescondicionadasasociadasalaTablade
Correspondencias.
LosperfilesfiladescribenlasdistribucionescondicionadasdelavariableYporlasdistintas
modalidadesdelavariableX.SeobtienenapartirdelaTabladeCorrespondenciasyelperfil
marginaldeXmediantelassiguientesexpresiones:
f(Y / X = xi )
y1
.......
x1
n11
N1
.......
x2
n21
N2
.......
xi
M
xj
M
xk
M
ni1
Ni
M
nj 1
Nj
M
nk1
Nk
.......
.......
.......
.......
.......
yj
n1 j
N1
n2 j
N2
M
nij
Ni
M
nj j
Nj
M
nkj
Nk
.......
ym
Total
.......
n1m
N1
.......
n2m
N2
.......
.......
M
nim
Ni
.......
.......
nj m
dij = 1 ni1 n j1
Nj
M
nkm
Nk
N1 Ni
N j
1
Distanciachicuadradoenlatablaentreperfilesfila: dij =
h=1 Nh
Distancia
chicuadradoentre
perfilesfilas(i,j):
.......
.......
nih njh
Ni Nj
LosperfilescolumnadescribenlasdistribucionescondicionadasdelavariableXporlasdistintas
modalidadesdelavariableY.Seobtienenapartirdelatabladecorrespondenciasyelperfil
marginaldeXmediantelassiguientesexpresiones:
f(X / Y = y j )
y1
.......
yi
.......
x1
n11
N1
.......
n1i
N i
.......
x2
n21
N1
.......
n2i
N i
.......
xi
M
xk
Total
M
ni1
N1
M
nk1
N1
.......
.......
.......
M
nii
N i
M
nki
N i
.......
.......
.......
yj
n1 j
N j
n2 j
N j
M
nij
M
nkj
N j
Distanciachicuadradoentreperfilescolumnas(i,j): dijc
SantiagodelaFuenteFernndez
ym
.......
n1m
Nm
.......
n2m
Nm
M
nim
Nm
.......
N j
.......
.......
.......
.......
nkm
Nm
1 n1i n1 j
=
N1 Ni N j
AnlisisdeCorrespondencias
Distanciachicuadradoenlatablaentreperfilescolumnas: dijc
1 nhi nhj
=
N
N
h=1 Nh
i
j
Trabajarconperfilesfacilitalainterpretacin,perotambinpuedeproducirunavisinequivocada
delarelacinentrevariablesenlamedidaquetodoslospuntostienenlamismaimportancia:los
marginalesdelosperfilesycolumnasonigualesa1.Paraevitaresteproblemaelanlisisde
correspondenciasdeberutilizarunadistanciaquenoolvidelasdiferenciasentrelosefectivosde
cadalnea(ocolumna).Ladistanciachicuadradocumplelacondicindeponderarcadaperfilporun
peso.Ascadafila(ocolumna)estafectadadeunpesoproporcionalasuimportanciaenel
conjunto,pesoconocidocomomasa.Alconsiderarcadapuntoconunamasaproporcionalasu
frecuenciaseevitaprivilegiarlascategorasconpocosefectivos.Setrata,dehecho,deunadistancia
eucldeaponderadaporelinversodelamasadelascolumnascuandosemideladistanciaentrefilas,
oporlamasadelasfilasparaladistanciaentrelascolumnas.
Ladistanciachicuadradocumpleelprincipiodelaequivalenciadistribucional,quepostulaquesidos
categorastienenperfilesidnticospuedensersustituidasporunasolacategoraquesealasumade
suspesos,sinqueconellosemodifiqueladistanciaentrelasfilasocolumnas.Laimportanciade
estapropiedadestribaenquegarantizalaestabilidadenlosresultadosconindependenciadela
codificacinenlasvariables;demodoqueesposibleagruparcategorasquetienenperfiles
coincidentes,tantoporfilascomoporcolumnas.Sielresultadosemantieneestabletrasunir
categoras,deigualmodoestosresultadosnomejoranalrealizarmssubdivisionesdecategoras
homogneas.
DEPENDENCIAEINDEPENDENCIAENTABLASDECORRESPONDENCIAS
LaexistenciaonodealgntipoderelacinentrelasvariablesXeYseanalizamediantecontrastes
dehiptesissobrelaindependenciadedichasvariables.Eltestdehiptesishabitualmenteutilizado
eseldelaChicuadradodePearson.
Secontrastalahiptesisnulaquepresuponelaindependenciaentreambasvariables,medianteel
estadstico 2 dePearson.
(nij eij )2
i =1 j =1
eij
Sedefineelestadsticoobservado:
SantiagodelaFuenteFernndez
Ni . N j
N
,elestadsticoobservadosepuedeexpresartambin:
AnlisisdeCorrespondencias
2
nij N j
n
N
N
N j ij i
i
2
k m (n e )
k m
k m
N i N
N j N
ij
ij
=
=
N j
N i
eij
i=1 j=1
i=1 j=1
i=1 j=1
N
N
As,pues,paraunniveldesignificacin :
(2k 1).(m1) < 2;(k 1).(m1) X e Y son independie ntes al nivel
2
2
(k 1).(m1) ;(k 1).(m1) X e Y no son independie ntes al nivel
Silahiptesisnulaserechaza,lasvariablesXeYsondependientes.Enestecasoconvieneanalizar
losperfilescondicionalesfilaycolumnaascomolosresiduosdelmodeloparaestudiarqutipode
dependenciaexisteentreellas.Losresiduosmsutilizadossonlosllamadosresiduostipificados
corregidosquevienendadosporlaexpresin:
ANLISISDELOSRESIDUOS:Losresiduossonlasdiferenciasentrelafrecuenciaobservadayla
frecuenciaesperadaencadacasilla: rij = nij eij .Enelcasodequeelcontrastede 2 hayaresultado
significativo,estosresiduosindicarnqucasillascontribuyenenmayorgradoalvalordel
estadstico.
Cuantomayorseaelvalordelosresiduosmayoreslaprobabilidaddequeunadeterminada
combinacindevaloresdelasvariables,estoes,unacasilla,seasignificativa.
Paraqueelanlisisdelosresiduosresulteadecuadoesnecesarioquepreviamentestoshayansido
ajustadosyestandarizados,paralocualsesueleaplicarlafrmulapropuestaporHaberman(1978),
queconsisteendividirelvalordelresiduoencadacasillaporsuerrortpico.
Residuostipificados rij =
nij eij
eij
Residuostipificadoscorregidos rijc =
rij
V(rij )
N
N
N(0,1)
ANLISISDECORRESPONDENCIASCLASICO
Conlosperfilesdefilasycolumnasdescritosseelaboralamatrizdecoordenadas(distancias)
utilizandoladistanciachicuadrado,quepermitircalibrarlamagnituddelasdiferenciasentrela
tabladedatosanalizadayunatabladedatossinrelacinentrelasvariables.
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
Elmtodoconsisteenencontrarladescomposicinenvaloressingularesdelamatriz:
C = (rij ) siendo rij =
nij eij
eij
paraconstruirunsistemadecoordenadas(generalmente,bidimensional)asociadoalasfilasy
columnasdelatabladecontingencia,quereflejelasrelacionesexistentesentredichasfilasy
columnas.
Enlarepresentacintienenunpapelimportantelasllamadasdistancias2entreperfiles,quesonlas
queelanlisisdecorrespondenciasintentareproducirensusrepresentacionesgrficas.Dichas
distanciassondistanciaspitagricasponderadasentreperfilesquevienendadasporlassiguientes
expresiones:
m
1
Distanciaentreperfilesfila: dij =
h=1 Nh
Distanciaentreperfilescolumnas: dijc
nih njh
Ni Nj
1 nhi nhj
=
h=1 Nh
Ni N j
k
Lasdistanciasnosemidenentredosfilasodoscolumnassinoconrelacinalperfilmediodefilao
columna,esdecir,conrelacinalpromediodelascoordenadasdeesafila(ocolumna)ponderada
porsumasa(pesoproporcionalasuimportanciaenelconjunto).
Esteperfilmedioaparecersituadoenelorigendecoordenadasyesconocidocomocentrode
gravedad.Lamediadelasdistanciasalcuadradodecadapuntodefilaalcentrodegravedadse
conocecomoinerciadefilas,oinerciadecolumnascuandosetratadelascolumnas,einerciatotal
delanubedepuntoscuandoseconsiderantodosloselementosdelatabla.Unainerciabaja
significaquetodoslosproductosestnsituadosmuycercadelcentrodegravedadyqueen
consecuenciasonmuysimilares,mientrasquealtosvaloresdeinerciaendeterminadascategoras
implicangrandesdiferenciasdelperfilmediodelasfilasolascolumnas.
PosteriormenteseprocedeadiagonalizarlamatrizCdevarianzacovarianzaconelfindeobtener
losvectoresyvalorespropiosquedefinirnlosnuevosejessobrelosqueserproyectadalanubede
puntos.Cuandolacantidaddeinerciaexplicadaconlosprimerosfactoresseaaltabastarcon
seleccionarunpequeonmerodestos(dosotres)yrepresentarlanubedepuntossobregrficos
dedosotresdimensiones,obteniendoasunavisinsimplificadadelasrelaciones.
Elanlisisdecorrespondenciasbuscaencontrardosmatrices(A,B)decoordenadascartesianas:
a1
a2 querepresentealospuntos
A =
filacon ai = (ai1 ,L , aih )
M
a
k
b1
b2
B=
M
b
m
querepresentealospuntos
columnacon b j = (b j1 ,L,b jh )
(generalmenteh=2)
HaydiversasformasdecalcularlasmatricesAyB,conocidascomonormalizaciones.Unaformamuy
utilizadaeslaconocidacomonormalizacinsimtricaocannica(ACC),quebuscasatisfacerqueel
productoescalar (ai .b j ) seaproporcionalalosresiduostipificados rij .
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
LasmatricesAyBsecalculanapartirdelasexpresiones A = Dk
Dk=diagonal{n1,n2,...,nk},Dm=diagonal{n1,n2,...,nm},
1/2
UD y B = Dm
VD con
INTERPRETACINBARICNTRICA:
k Nh
N ahj = 0 ( j = 1,L ,h)
h=1
m Nh
bhj = 0 ( j = 1,L,h)
h=1 N
( )j=1,L,m tendrnunamedia
m n
ih
j . aij = N bhj (i = 1,L,k) ( j = 1,L,H)
h=1 i
k n
hi
ahj (i = 1,L,m) ( j = 1,L,H)
j .bij =
h=1 Ni
Lascoordenadasdelospuntosfila(columna)son
mediasponderadasdelascoordenadasdelos
puntoscolumna(fila)salvounfactordadopor
losvaloressingulares,esdecir,lospuntosfila
(columna)son,salvounfactordedilatacin
(1/j),elbaricentrodelospuntoscolumna(fila).
INTERPRETACINRESULTADOS:
LaInerciaTotal(medidaanlogaalavariacintotalenelcasodelascomponentesprincipales)
cuantificaelgradodedependenciaentrelasvariables(X,Y):
IT =
2
H
H k
H m
1 k m (ni j ei j )
= h2 = Ni a2ih = N j b2jh
N i=1 j=1 e ij
h=1
h=1 i=1
h=1 j=1
ApartirdelaInerciaTotal(IT)secalculanlasproporcionesdeinerciaexplicadaparacadaunadelas
2i
queayudanaponderarlaimportanciadecadaunadelasdimensiones
dimensiones
IT i=1,L,H
cuandosetratedeexplicarlasdependenciasobservadas.
Lasproporcionesdeinerciaacumuladaexplicadaporlasisimasprimerasdimensiones
2
i i
permitendecidirelnmeromnimodedimensionesnecesarioparaexplicardichas
h=1 IT i=1,L,H
dependencias.
CONTRIBUCIONESTOTALES:Cuantificanlaimportanciadecadaunadelasmodalidadesdelas
variablesanalizadasenlaconstruccindelosejesfactorialesconstruidosporelanlisisde
correspondencias(ACC):
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
Ni a2ih
Ni a2ih
=
=
contribuci
n
i
sima
fila
:
C
(
i
)
t
r
h2
Nj a2jh
j=1
k
m
C t (i) = C t ( j) = 1
i=1
j=1
N b2
N b2
contribucin i sima columna : C t ( j) = j jh = j jh
m
h2
Ni b2ih
i=1
Seutilizanparainterpretarelsignificadodelosejesutilizando,paracadaunodeellos,las
modalidadesconcontribucionesmsfuertes.
CONTRIBUCIONESRELATIVAS:Midenlaimportanciadecadafactorparaexplicarlaposicin(enel
diagramacartesiano)decadaunadelasmodalidadesdelasvariablesanalizadas,representandola
partedeladistanciaalorigendecoordenadas,explicadapordichofactor.Vienendadaspor:
a2
Cr (i) = H ih
contribucin relativa i sima fila :
a2il
l=1
k
m
=
=
C
(
i
)
C
(
j
)
1
r
r
i=1
j=1
b2jh
contribucin relativa i sima columna : Cr ( j) =
H
b2jl
l=1
Seutilizanparaanalizarlasproximidadesentrelospuntoshaciendohincapienaquellosfactores
cuyascontribucionesseanmselevadascuandosedeseaexplicardichasproximidades.
ELEMENTOSSUPLEMENTARIOS:Sonfilasocolumnasdelatabladecontingencianoutilizadasenel
clculodelosejesfactorialesperoque,unavezcalculadosstos,sesitaneneldiagramacartesiano
conelfindeayudarenlainterpretacindelosresultadosobtenidos.Suscoordenadassecalculan
utilizandolasrelacionesbaricntricasexistentesentrelospuntosfilaycolumna.
SantiagodelaFuenteFernndez
AnlisisdeCorrespondencias
ANLISISDECORRESPONDENCIASMLTIPLES
Seaplicaatablasdecontingenciasendondeporfilashay(n)individuosyporcolumnas(s)variables
categricascon (pi = 1, 2,L , s) mutuamenteexcluyentesyexhaustivas.
Latabladedatostienelaforma: Z = [Z1 , Z2 ,L , Zs ] ,
1 si el individuo i simo elige la mod alidad j
siendo Zi unamatriz (n.pi ) ,deformaque: zij =
0 si el individuo i simo no elige la mod alidad j
Elanlisisdecorrespondenciasmltiplessebasaenrealizarunanlisisdecorrespondenciassobrela
llamadamatrizdeBurt: B = Z' Z
LamatrizdeBurtseconstruyeporsuperposicindecajas.Enlosbloquesdiagonalesaparecen
matricesdiagonalesconteniendolasfrecuenciasmarginalesdecadaunadelasvariablesanalizadas.
Fueradeladiagonalaparecenlastablasdefrecuenciascruzadascorrespondientesatodaslas
combinaciones2a2delasvariablesanalizadas.
Setomancomodimensionesaquellascuyadistribucinalainerciasupera(1/p).
ACM:ANLISISFACTORIAL(AFC)DEUNATABLADISYUNTIVA
nindividuos
qvariablescualitativas
pkmodalidadesdelavariablek
q
p = pk total de columnas
k =1
Z = (z ij )
Mrgenes
z individuos que tienen mod alidad j sima
j
Matrizadiagonalizar: S =
SantiagodelaFuenteFernndez
1
z ij =
0
zij = nq
j
1
1
Z' Z D 1 = BD 1 con D = diagonal (z j )
q
q
AnlisisdeCorrespondencias
ACM:NUBEDEPUNTOS,PERFILES
Puntos(coordenadas):
zij
zi
zij
Tabla :
1
Z
q
z i q 1
=
=
nq nq n
Perfilesfila(individuos)
nq
Mtrica: diagonal
z
j
n p
2
2
2
Distancia : d (i, i' ) = (z ij z i' j )
q j =1
Peso:
Puntos(coordenadas):
Peso:
Perfilescolumna(modalidades)
zij
z j
z j
nq
nq
nq
= diagonal = diagonal (n)
q
z i
Mtrica: diagonal
Distancia2: d ( j, j') = n
2
j =1
n p
n
(zij zi' j )2 =
q j=1
q
z ij z ij'
z j z j'
jMii' j
Perfilesdecolumna:
p
d2 ( j, j' ) = n
j=1
zij zij'
card [ individuos ( j, no j' )] + card [ individuos ( j' , no j)]
=n
z j . z j'
z j z j'
2
Entremsobjetostenganslounadejoj'mayoresladistancia.
INTERPRETACIN
Dosmodalidadesescogidasporlosmismosindividuoscoinciden
Dosindividuossoncercanossiescogenlasmismasmodalidades
Modalidadesconpocoefectivoestnalejadasdelcentrodegravedad
SantiagodelaFuenteFernndez
10
AnlisisdeCorrespondencias
ANLISISDECORRESPONDENCIASMLTIPLES(ACM):INERCIA
1
n
1
n
Centrodegravedaddenubedemodalidades: G = ,L,
p
d ( j, G) = n
2
j =1
p
zij 1
= n
j =1
z j n
zij 2 zij 1 n
+ 2 = 1
2
z
n
z
n z j
j
j
Ladistanciaesmayorsielefectivoespequeo.
Inerciadelamodalidadj: I( j) =
z j
nq
d2 ( j, G) =
zj n
z
1 = 1 1 j
q
nq z j
n
Haymayorinerciasielefectivoespequeo.
Inerciadelavariablek: I(k) =
pk
1 z 1
=
I
(
j
)
q 1 n j = q (pk 1)
j =1
j =1
pk
Lainerciacrececonelnmerodemodalidades.Si pk = 2 a mnimo
Inerciatotal: I =
1
q
I(k) = q (pk 1) = q (p q) = q 1
k
Notienesignificadoestadstico.
SOLUCINDEANLISISDECORRESPONDENCIASMLTIPLES
1
Z' Z D 1 u = u
q
1 1
1
factor
=
D
u
D Z ' Z =
Diagonalizacin:
q
En :
p
En n :
SantiagodelaFuenteFernndez
1 1
Z D Z' =
q
11
AnlisisdeCorrespondencias
=
D
Z'
Relacionesdetransicin:
1
= q Z
Relacionesbaricntricas:
P(i)modalidadesquetienei
I(j)modalidadesquetienej
j =
z ij
j =1 i
j =
1
q
jP(i)
n z
1
1
ij
i =
i = 1
zj
j =1 z j
jI( j)
INTERPRETACINANLISISCORRESPONDENCIASMLTIPLES
Proximidadentreindividuosentrminosdeparecido:Dosindividuosseparecensitienencasi
lasmismasmodalidades.Esdecir,dosindividuosestnprximossehanelegidoglobalmentelas
mismasmodalidades.
Proximidadentremodalidadesdevariablesdiferentesentrminosdeasociacin:Son
cercanospuestoqueglobalmenteestnpresentesenlosmismosindividuos.Esdecir,dos
modalidadesestnprximassihansidoelegidasglobalmenteporelmismoconjuntode
individuos.
Proximidadentremodalidadesdeunamismavariableentrminosdeparecido:(a)Son
excluyenteporconstruccin.(b)Sisoncercanasesporquelosindividuosquelasposeen
presentancasielmismocomportamientoenlasotrasvariables.
SantiagodelaFuenteFernndez
12
AnlisisdeCorrespondencias
Ejemplo:Sealatablaformadapor10individuosdeunaempresa,quesedistribuyensegnel
gnero,losaosenlaempresaylosingresosobtenidos:
Individuos
1
2
3
4
5
6
7
8
9
10
Gnero
Mujer
Mujer
Hombre
Mujer
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Aos
5
3
4
1
2
5
2
3
1
4
Ingreso
Medio
Alto
Bajo
Bajo
Medio
Alto
Medio
Bajo
Alto
Medio
Apartirdelatablaoriginalseconstruyelatabladisyuntiva(matrizZ)contantascolumnascomo
categoras:
Gnero
Mujer
Hombre
1
0
1
0
0
1
1
0
1
0
0
1
1
0
0
1
0
1
1
0
1
0
0
0
1
0
0
0
0
1
0
2
0
0
0
0
1
0
1
0
0
0
Aos
3
0
1
0
0
0
0
0
1
0
0
4
0
0
1
0
0
0
0
0
0
1
5
1
0
0
0
0
1
0
0
0
0
Ingresos
Bajo Medio
0
1
0
0
1
0
1
0
0
1
0
0
0
1
1
0
0
0
0
1
Alto
0
1
0
0
0
1
0
0
1
0
Enlatabladisyuntivacompleta(matrizZ),sihayalgunavariablecontinua,debetransformarseen
nominal,ordenndoseenintervalosalosquesedaunrangodevalores.
Lasfrecuenciasmarginalesdelaslneasdelatabladisyuntivacompletasonigualesalnmero
depreguntas(s),ylasfrecuenciasmarginalesdelascolumnascorrespondenalnmerode
sujetosquehanelegidolamodalidad(j)delapregunta(q),porloqueparacadasubtabla,el
nmerototaldeindividuosesn.
Enconsecuencia,siparanindividuossedisponederespuestasrespectoa,porejemplo,dos
variablesnominalesquetienenrespectivamentep1yp2modalidades,entoncesesequivalente
someteraunAnlisisdeCorrespondenciasSimpleslatabladecontingencia(p1,p2)yanalizarla
tablabinariadenlneasy(p1+p2)columnasquedescribelasrespuestas.
setiene,
SantiagodelaFuenteFernndez
13
AnlisisdeCorrespondencias
M
Gnero
H
1
2
3
Z = Aos
4
5
a
B
M
Ingresos
A
a
M
Gnero
H
1
2
3
Z' = Aos
4
5
a
B
M
Ingresos
A
a
Gnero
M H
Aos
1 2 3 4 5
Ingresos
B M A
1
1
0
0
0
1
1
1
0
1
0
0
1
0
0
1
0
1
1
0
0 0 0 0 1
0 0 1 0 0
0 0 0 1 0
1 0 0 0 0
0 1 0 0 0
0 0 0 0 1
0 1 0 0 0
0 0 1 0 0
1 0 0 0 0
0 0 0 1 0
0 1 0
0 0 1
1 0 0
1 0 0
0 1 0
0 0 1
0 1 0
1 0 0
0 0 1
0 1 0
Gnero
M H
Aos
1 2 3 4 5
Ingresos
B M A
1
0
0
0
0
1
0
1
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
1
0
1
0 0 1 0 1
0 0 0 1 0
1
0
1
0
0
0
0
1
1
0
0
1
0
0
0
0
0
1
0
0
0
0
1
0
1
0
0
1
0
0
0
0
0 0 1
0 1 0
0
1
0
0
1
0
0
1
0
1
1
0
0
0
0
0
1
0
0
0
0
1
0
0
RelacionandocadavariablecontodaslasdemslatabladisyuntivaseconvierteaunatabladeBurt
quecontienetodaslastablasdecontingenciasimplesentrelasvariables(cruzadasdosados).
ApartirdelatabladisyuntivacompletasepuedeconstruirlatabladecontingenciadeBurt(B),que
esunatablasimtricadeorden(p,p): B = Z'. Z
Besunayuxtaposicindetablasdecontingenciayestformadades2bloquesdelaforma:
Cadabloqueesunasubmatrizformadaportablas
decontingenciadelasvariablesdosados,salvo
losbloquesqueseestnenladiagonalquesonlas
tablasdecontingenciadecadavariableconsigo
misma.
SantiagodelaFuenteFernndez
14
AnlisisdeCorrespondencias
conlocual,
LatabladisyuntivacompletaesequivalentealatabladeBurtyambosproducenlosmismos
factores.
ConlatabladeBurtsepodrnobtenerlaspuntuaciones(distanciasalcentrodegravedad),
contribucionesabsolutasdecadamodalidadyvariablealosejesofactoresobtenidos(contribucin
decadamodalidadovariablealainerciadelosnuevosejes)ycontribucionesrelativaso
correlacionesdecadamodalidadconlosnuevosejes.
ComoenlatabladeBurtlasfilasylascolumnasrepresentanlasmismasmodalidades,elestudiode
ambasofreceigualesresultados,porloquesloserepresentanlosdelasfilas.
ParalaresolucinenelSPSS(Analizar/Reduccindedatos/Escalonamientoptimo),enprimer
lugarhayqueintroducirlosdatosdelamismaformaqueenelanlisisdecorrespondenciassimples,
creandoportantotresvariables.Lasdosprimerascorrespondenalosrangosdetodaslas
modalidadesy,enlatercera,seincluirnlasfrecuenciasconjuntasdelosparesdemodalidades,las
cualesfuncionarncomoponderaciones.
EXAMENDELOSPUNTOS:
Lasdistanciasdelasmodalidades,mientrasmsalejadasseencuentrendelorigen,mejor
representadosestarn.Cuantomsalejadasestnlasmodalidadesentresenelgrficomenor
asociacinexistirentreellasycuantomscercanas,msasociacinexistirentreellas.
Lacontribucindelospuntosalainerciadecadadimensinocontribucindecadaunadelas
filasalainerciaovarianzaexplicadaencadaunodelosejesconsiderados
Lacontribucindelasdimensionesalainerciadecadapunto.Serefierealacorrelacin
existenteentrecadaunodeloscaracteresylosnuevosejes.
SantiagodelaFuenteFernndez
15
AnlisisdeCorrespondencias
LGICADELANLISISDECORRESPONDENCIAS(AC)
Antesdecomenzarconunaexposicindetalladaconvieneprecisarqueelobjetivoenestudioesla
utilidadprcticaeinterpretativaquesederivadesuaplicacin.Partiendodeestaconcepcinse
tratademostrarlalgicadelanlisisdecorrespondenciasutilizandounejemplodeunasupuesta
investigacincomercial.
Unfabricantedeproductodelimpiezadeseaconocerlascaractersticasmsimportantesdecada
unodesusproductos,paraellorealizaunaencuestaentresusclientes.Latablaadjuntamuestralas
frecuenciasdeasociacindecadaproductoconlascaractersticasanalizadas.
Conelobjetivodeconocerlarelacinentrelosproductosylascaractersticaselanlisisde
correspondenciasconviertelatabladecontingenciaendosnubesdepuntosdepuntosfilay
columna,paraposteriormenterealizarunarepresentacindecadanubequepermitadetectarlas
relacionesentrelasfilas(productos),lascolumnas(caractersticas)yfilasycolumnas
conjuntamente.
Pararealizarestoelanlisisdecorrespondenciasnotrabajadirectamenteconlosdatosdelatabla,
puestoquesuobjetivonoesdetectarlasdiferenciasabsolutasexistentesentrelasvaloracionesde
cadaproducto,sinoquerealizaunastransformacionesdelosdatosylosconvierteenperfilesdefilas
ycolumnas.
Losperfilesdefilasecalculandividiendoelnmerodepersonasqueeligenunadeterminada
caractersticadeunproductoentretodoslosqueutilizaneseproducto,obteniendoladistribucin
condicionaldelascaractersticas(columnas)dentrodecadafila(producto):<<delas275personas
queutilizaronelproductoA,68consideranquedejalasuperficiebrillante,elratio(68/275=0,274)
proporcionaunperfilde0,274.Elratio(205/883=0,232)proporcionaelperfilmediodebrillode
0,232.
Anlogamente,losperfilesdecolumna.Enestecaso,delas205eleccionesrecibidas,68
correspondenalproductoA:elratio(68/205=0,332)proporcionaunperfilcolumnade0,332
SantiagodelaFuenteFernndez
16
AnlisisdeCorrespondencias
Cuandodosproductostienenvariascaractersticasenlamismaproporcin,poseenelmismoperfil,
seconsideransimilares(productosAyC).Lomismosucedeconlascaractersticas(columnas).
Frentealasencillezdelalecturabasadaenlosperfiles,losvaloresabsolutospresentanmayor
complicacin.
Laproblemticadelosnmerosabsolutosconsisteenquelosproductosmuyutilizadosconsiguen
numerosaseleccionesentodaslasceldillas(productoC),mientrasquelosproductospocosutilizados
tienenceldasconvaloresreducidos(productoB).
Alcalcularlasdiferenciasentrelosproductosutilizandolosvaloresabsolutoselresultadoobtenido
plasmaladiferenciaenteladistribucindelascaractersticas,unidaaladiferenciaentreelnmero
deeleccionesdecadaproducto.Estoes,elmayornmerodeeleccionesdelproductoCdificulta
realizarunacorrectacomparacinconelproductoA.
Enestesentido,elobjetivodelanlisisdecorrespondenciasnoesdetectarlasdiferenciasabsolutas
entrelasvaloracionesdelosproductos.
Habiendodetectadocmotrabajarconperfilesfacilitalainterpretacin,hayqueprevenirno
producirunavisinequivocadadelarelacinentrevariablesenlamedidaquetodoslospuntos
tienenlamismaimportancia:losmarginalesdelosperfilesdefilaycolumnasonigualesa1.
Paraevitaresteproblemaelanlisisdecorrespondenciasdebeutilizarunadistanciaquenoolvide
lasdiferenciasentrelosefectivosdecadalnea(ocolumna).
Ladistanciachicuadradocumpleestacondicin,alponderarcadaperfilporunpeso.Ascadafila(o
columna)estponderadaporunpesoproporcionalasuimportanciarealenelconjunto,peso
conocidocomomasa.Alconsiderarcadapuntoconunamasaproporcionalasufrecuenciaseevita
privilegiarlascategorasconpocosefectivos.
Dehecho,setratadeunadistanciaeucldeaponderadaporelinversodelamasadelascolumnas
cuandosemideladistanciaentrefilas,oporlamasadelasfilasparaladistanciaentrelascolumnas.
Ladistanciachicuadradocumpletambinelprincipiodeequivalenciadistribucional,quepostula
quesidoscategorastienenperfilesidnticospuedensersustituidasporunasolacategoraquesea
lasumadesuspesos,sinqueconellosemodifiqueladistanciaentrelasfilasocolumnas.
Estapropiedadgarantizalaestabilidaddelosresultadosconindependenciadelacodificacindelas
variables,demodoqueesposibleagruparcategorasquetienenperfilescoincidentestantoporfilas
comoporcolumnas.Sielresultadosemantieneestabletrasunircategoras,deigualformaestos
resultadosnomejoranalrealizarmssubdivisionesdecategorashomogneas.
Conlosperfilesdefilaycolumnaseelaboralamatrizdecoordenadas(distancias)utilizandola
distanciachicuadrado,quepermitircalibrarlamagnituddeladiferenciaentrelatabladedatos
analizadayunatabladedatossinrelacinentrelasvariables.
Lasdistanciasnosemidenentredosfilasodoscolumnassinoconrelacinalperfilmediodefilaso
columnaso,dichodeotramanera,conrelacinalpromediodelascoordenadasdeesafila(o
columna)ponderadaporsumasa.Esteperfilmedioaparecesituadoenelorigendecoordenadasyse
leconocecomocentrodegravedad.
SantiagodelaFuenteFernndez
17
AnlisisdeCorrespondencias
Lamediadelasdistanciasalcuadradodecadapuntodefilaalcentrodegravedadseconocecomo
inerciadefilas,oinerciadecolumnascuandosetratadelascolumnas,einerciatotaldelanubede
puntoscuandoseconsiderantodosloselementosdelatabla.
Unainerciabajasignificaquetodoslospuntosestnsituadosmuycercadelcentrodegravedady
queportantosonmuysimilares;mientrasquealtosvaloresdelainerciaendeterminadascategoras
implicangrandesdiferenciasdelperfilmediodelasfilasolascolumnas.
Posteriormenteseprocedeadiagonalizarlamatrizdevarianzacovarianzaconelfindeextraerlos
vectoresyvalorespropiosquedefinirnlosnuevosejessobrelosqueserproyectadalanubede
puntos.Cuandolacantidaddeinerciaexplicadaconlosprimerosfactoresseaaltabastar
seleccionarunpequeonmerodeestos(tanslodosotres)yrepresentarlanubedepuntossobre
grficosdedosotresdimensiones,obteniendoasunavisinsimplificadadelasrelaciones.
Trabajarconperfilesdefila(paracompararlasdistribucionesdelascaractersticasencadaproducto)
yconperfilesdecolumna(paracompararcmosedistribuyecadacaractersticaenlosproductos)
precisadedosanlisisdiferentes:unosobrelosperfilesdefilasyotrossobrelosperfilesde
columnas,puestoqueseconsideransimtricoslospapelesdelasfilasydelascolumnas.
Alrealizarestosanlisisesposibleutilizarunasfrmulasquerelacionanaambasdimensiones,
conocidascomofrmulasdetransicin,quepermitenobtenerlascoordenadasfactorialesdelotro
conjuntosinnecesidaddeunanuevadiagonalizacin.
Ademsdelahorrodetiempoqueestosuponealreducirlosclculosaunasolafactorizacin,estas
relacionespermitenrepresentarsobreunmismoplanolospuntosdefilaycolumna,permitiendoas
interpretarladistanciadeunpuntoaotro.Dehecho,unadelasgrandesventajasdelanlisisde
correspondenciaseslafacilidadparasacarconclusionesbasndoseenlainterpretacingrfica.
Debeconsiderarsequelosfactoresodimensionesextradasnoexplicanlatotalidaddelainercia,ni
tampococadaunadeellasaportanlomismo;deformaquesernecesarioextraerunnmerode
factoresqueexpliquenunporcentajeelevadodelavariabilidadtotal,altiempoquedeber
interpretarsecadaunoenrelacinconlacantidaddeinerciaexplicada.Elanlisisdelas
contribucionesabsolutasyrelativasindicarlasmodalidadesmsrelacionadasconcadafactor,
mientrasqueelsignodelascoordenadassituarncadacategoraenunapartedelfactor.
Lacontribucinabsolutaexpresalaaportacindeunelementoalainerciaexplicadaporelfactor,
mientrasquelacontribucinrelativarecogelacontribucindeunfactoralaexplicacindeunafilao
columna.
PROCESOINTERPRETACINDELGRFICO:
1. Localizacindelasmodalidadesconmayorescontribucionesabsolutas,diferenciandomediante
elsignodelascoordenadaslasquesesitanenelladopositivoyenelladonegativodelfactor.
2. Anlisisdelacalidadderepresentacin(contribucinrelativa)delrestodemodalidades.Cuando
unamodalidadtieneunabajacontribucinrelativaesprobablequeestmuyrelacionadacon
otrofactor,demodoqueparasuestudioserconvenienteconsiderar,sinolatotalidaddelos
ejes,almenosunnmeroelevadodestos.
3. Bsquedadeaquellasmodalidadesque,aunquenocontribuyenalaformacindelfactor,se
encuentranbienrepresentadas.Estasmodalidadessonilustrativasdelasignificacindela
dimensin.
4. Considerandotodosestoselementosseprocedeconladenominacindecadafactor,analizando
porseparadolavariablefilaycolumna.
SantiagodelaFuenteFernndez
18
AnlisisdeCorrespondencias
5. Seprocedealanlisisgrficoconelfindedetectarsimilitudesentrelasmodalidadesdefila(o
columna).Respectoalasituacindelasmodalidadesenelgrficohayqueprecisarqueenel
origendecoordenadasseencuentranlascategorassimilaresalamediadelasfilas(ocolumnas),
quesonlasquetienenmenortasadeinercia,yportantolasquemenosaportanenladefinicin
decadadimensin.Porotraparte,lasmodalidadesmsalejadasdelorigensecaracterizanpor
sugrancontribucinenladefinicindecadafactor.Enelejemplodelosproductosdelimpieza,
sidosfilas(productos)tienencaractersticassemejantessesituarnprximasunadelaotraenel
planodecoordenadas.Lamismaconsideracinseutilizaparainterpretarlascaractersticas
(columnas)prximas.Resumiendo,mayoromenorproximidadentrelasmodalidadesenelplano
equivaleamayoromenorgradoderelacinointerdependenciaentrelasmismas.
6. Interpretacinconjuntadeambasvariables.Generalmente,pudedecirsequedosmodalidades
defilaycolumnaconunasituacincercanaenelgrficoestnindicandoasociacinentreellas,
muchomscuandoseencuentranlejosdelcentrodegravedad.
7. Proyeccindemodalidadesilustrativasosuplementarias.Lainterpretacindelanlisispuede
enriquecerseconlarepresentacingrficadelasmodalidadessuplementarias,elementosqueno
participanenladefinicindelosejesperoqueseproyectansobreelgrficoobtenido.
Hastaestemomentoelanlisissehacentradoenunatablabidimensional,aunqueelefectoprctico
yeficaciadelanlisisdecorrespondenciasaumentacuandosetrabajacongrandestablasdedatos.
Sealarqueelanlisisdecorrespondencias,ensuformatomssimple,trataderepresentardos
variablescualitativasqueformanpartedeunatabladecontingencia,aunqueexisteuna
generalizacindelanlisisdecorrespondenciasparamsdedosvariablescategricasquerecibeel
nombredeanlisisdecorrespondenciasmltiples.
Lalgicadelanlisisyelprocesodeclculoessimilarenambos,demodoqueseanotanaqulos
aspectosdiferenciadosdelanlisisdecorrespondenciasmltiples:
Enelanlisisdecorrespondenciasmltipleslosvalorespropiosgeneranunaideapesimistadela
variabilidadexplicada,siendoconvenientemedirlatasadeinerciarealizandounamodificacin
destosutilizandolacorreccindeBenzcri(1979):
1.
2.
3.
4.
CalcularB=1/Q,siendoQelnmerodevariables.
Seleccionarlosvalorespropios(VP)igualesosuperioresaB.
Calcularlosvalorespropiostransformados(VPT): VPT = (VP B)2 .
Calcularelporcentajedevarianzaexplicada(VPE)conlosvalorespropiostransformados.
Cadavalorpropiotieneunatasadeinerciasobreeltotaldevarianzaexplicadaportodoslos
ValoresPropiostransformados.
5. Calcularelporcentajeacumuladodevarianzaexplicada.
Lapartedeinerciadebidaaunamodalidadderespuestaaumentacuantomenorseaelnmero
depersonasdeestamodalidad,cuantomenorseasumasa.Porelloesconvenientenointroducir
enelanlisislasmodalidadesconescasonmeroderespuestas,ydehechoalgunosprogramas
estadsticoseliminanlasmodalidadesconunnmeroderespuestasinferioral2%delamuestra.
Lapartedeinerciaproducidaporunavariableaumentacuantomayorseaelnmerodeopciones
derespuesta,demodoquedebeprocurarsequelasvariablestenganunnmerohomogneode
categoras.
SantiagodelaFuenteFernndez
19
AnlisisdeCorrespondencias
Elpuntodepartidaesunatabladisyuntivacompletadondelascategorasderespuestadeuna
preguntaseexcluyenmutuamente,yunanicamodalidadesescogidaobligatoriamenteporel
encuestado(ounidadconlaquesetrabaje).
Enestatabla,lasfilasestnformadasporlosindividuosencuestados,ylascolumnasporcada
unadelascategorasdelasvariablessometidasalanlisis,demodoquecadaceldaestformada
porun1cuandoelindividuoposeeunacaracterstica,yun0cuandonoesas.
TABLAORIGINAL
P1
1
2
3
2
1
3
n1
n2
n3
n4
n5
n6
P2
1
2
1
3
2
2
P3
1
1
2
1
2
2
Enlatablaoriginalpresentadasehadejadounanicacolumnaparalascategorasdecada
pregunta,mientrasquelatabladisyuntivatantascolumnascomocategoras.
Aslasrespuestasdelsegundosujeto(2,2,1)soncodificadasenlatabladisyuntivacomo(0,1,0)
enP1,(0,1,0)enP2,y(1,0)enP3.
TABLADISYUNTIVACOMPLETA
Categoras
n1
n2
n3
n4
n5
n6
Total
1
1
0
0
0
1
0
2
P1
2
0
1
0
1
0
0
2
3
0
0
1
0
0
1
2
1
1
0
1
0
0
0
2
P2
2
0
1
0
0
1
1
2
P3
3
0
0
0
1
0
0
2
1
1
1
0
1
0
0
2
2
0
0
1
0
1
1
2
Total
3
3
3
3
3
3
Relacionandocadavariablecontodaslasdemslatabladisyuntivaseconvierteaunatablade
Burtquecontienetodaslastablasdecontingenciasimplesentrelasvariables(cruzadasdosa
dos).
TABLADEBURT
categoras
n1
n2
n3
1
2
0
0
P1
2
0
2
0
P2
n1
n2
n3
1
1
0
0
1
1
1
1
0
2
0
0
0
3
0
0
0
1
1
1
1
1
2
0
P3
n1
n2
1
1
2
0
0
2
1
1
1
2
1
0
3
0
0
3
P1
SantiagodelaFuenteFernndez
3
0
0
2
1
1
0
1
P2
2
1
1
1
P3
3
0
1
0
1
1
2
0
2
1
0
2
20
AnlisisdeCorrespondencias
Elvalor2delaesquinasuperiorizquierdasonlaspersonasquehanelegidoelvalor1enP1
(pregunta1).Enlasdosprimerastablasestaspersonashansidoidentificadasconn1yn5.
Enlapregunta2(P2),el1delaizquierdarepresentaalapersonaquehaelegido1enP1yel1
enP2,setratadelapersonan1.
Enlapregunta2,el1delcentroesel1queeligiel1enP1yel2enP",personan5.
Enlapregunta2,el1delasegundalnearepresentaalapersonaquehaelegido2enP1y3en
P2,identificadaconn4.
otambin:
TABLADISYUNTIVACOMPLETA
Categoras
n1
n2
n3
n4
n5
n6
Total
P1
1 2 3
1
0
0
Z=
0
1
0
1
0
1
0
0
1
0
Z' . Z = 1
0
0
0
1
0
0
1
0 0
1 0
0 1
0 1
1 0
0 0
1 0
0 1
P1
2
0
1
0
1
0
0
2
1
1
0
0
0
1
0
2
3
0
0
1
0
0
1
2
P2
1 2 3
P3
1 2
1
0
1
0
0
0
1
1
0
1
0
0
0
1
0
0
1
1
0
0
0
1
0
0
0 1 0
1 0 0
0 0 1
0 0 0
0 1 1
1 0 0
1 0 0
0 1 1
SantiagodelaFuenteFernndez
1
0
0
1
0
0
0
1
1
1
0
1
0
0
0
2
1
0
Z' = 1
0
P2
2
0
1
0
0
1
1
2
0 0
1 0
0 1
0 1
1 0
0 0
1 0
0 1
0 0
1 0 0
1 0
0 1 0
0 1
1 0 0
1 0
0 0 1
0 0
0 1 0
0 1
0 1 0
P3
3
0
0
0
1
0
0
2
1
1
1
0
1
0
0
2
2
0
0
1
0
1
1
2
Total
3
3
3
3
3
3
0 1 0
1 0 0
0 0 1
0 0 0
0 1 1
1 0 0
1 0 0
0 1 1
1 0
1 0
0 1
=
1 0
0 1
0 1
21
AnlisisdeCorrespondencias
LatabladisyuntivacompletaesequivalentealatabladeBurtyambosproducenlosmismos
factores.
SantiagodelaFuenteFernndez
22
AnlisisdeCorrespondencias
Ejemplo1.Lossiguientesdatoscorrespondenaladistribucindelnmerodeparadosdetres
provinciasdeCastillaLenenelao2005clasificadosporSexo,ProvinciayNiveldeEstudios.
PRIMERANLISISDELAINFORMACIN:Secomienzaconunanlisisunivariadodelasvariables
consideradas,conlafinalidaddeidentificardeterminadospatronesdecomportamiento.
Sesolicitanlosporcentajesdefilaycolumna:
Alcompararlosporcentajesdefilaseobservaqueun9,8%delosHombresdeAvilaparados
tienenunniveldeestudiosprimario(cifraquecontrastaalacorrespondientedistribucin
marginalenlaquenicamenteun2%delosparadosposeendichoniveldeestudios),mientras
queenMujeresdeSoriaparadasun0,8%tienenestudiosprimarios.
Alcompararlosporcentajescolumna,porejemplo,seobservaqueun16,9%delosparadoscon
unniveldeestudiosprimariosonHombresdevila(ciframuchomselevadaquela
correspondientealadistribucinmarginalenlaquetansloun3,4%sonHombresdevila).
Parainterpretarelinteriordelatabla,desdeunpuntodevistaprctico,esmssencilloutilizarlos
residuosestandarizadoscorregidos.
SantiagodelaFuenteFernndez
23
AnlisisdeCorrespondencias
Enlosresiduosestandarizadoscorregidoslamayorpartesonmayoresque2envalorabsoluto(aun
niveldel95%deconfianza,residuosconunvalorabsolutomayorque2seconsiderancomovalores
anormalmentealtos).
Observando,adems,elpatrndelossignos:
Losresiduospositivosparaloshombrestiendenasituarseenlosnivelesdeestudiosmsbajos
(estudiosprimariosycertificadoescolar)yparalasmujeresenlosnivelesdeestudiossuperiores
(graduadoescolar,bachilleratoydiplomadosentodaslasprovincias;formacinprofesionalen
BurgosySoria,yuniversitarioenSoria).
REDUCIRDATOS/ANLISISDECORRESPONDENCIAS:
SantiagodelaFuenteFernndez
24
AnlisisdeCorrespondencias
EnlaparteinferiordelcuadrodedilogoaparecenunaseriedeRestriccionesparalascategorasque
permitenunirlascategorasodefinirunacategoracomosuplementaria.Lareduccindelnmero
decategorasactivasqueseoriginaalunircategorasodefinirdeterminadascategorascomo
suplementariasestsujetaaciertasrestricciones:(a)elnmeromximodecategorasquepueden
unirseequivalealtotaldecategorasmenos1.(b)elnmeromximodecategorassuplementarias
eseltotaldecategorasmenos2.
ElsubmenModeloseencuentradivididoencuatro
partes(nmerodedimensiones,medidade
distancia,mtododeestandarizaciny
normalizacin)
Dimensionesenlasolucin:Nmerodedimensionesnecesariasparaexplicarlamayorpartedela
variacin.Elnmeromximodefactoresesigualalnmerodefilasmenos1(oaldecolumnas
menos1),elqueseamenor.Enesteejemplo,condosvariables,respectivamente,con6y7
categorascadavariable,elnmeromximoser(61=5).Sinembargo,elinvestigadordeber
especificarelmenornmerodefactoresparaexplicarelmximodeinercia,buscandosiempreel
equilibrioentreparsimoniaeinterpretabilidad.
Aunquepordefectoelprogramaselecciona2dimensiones,cuandoserealizaelprimeranlisisdeun
conjuntodedatosesconvenientesolicitarunnmeroelevadodedimensiones,conelfindeexplicar
unaltoporcentajedeinercia,ydisponerasdelamximainformacinparadecidirla
dimensionalidadadecuada.
Medidasdedistancia:Entrelasfilasylascolumnas,sepuedenmedirentredosmedidas:
Distanciachicuadrado:Lasmodalidadesseponderanenfuncindelamasadelasfilaso
columnas.Utilizadaparaelanlisisdecorrespondenciasestndar.
SantiagodelaFuenteFernndez
25
AnlisisdeCorrespondencias
Distanciaeucldea:Razcuadradadelasumacuadrticadelasdiferenciasentreparesdefilasy
entreparesdecolumnas.JoaristiyLizasoaindesaconsejanlautilizacindeestadiferencia
porqueconsideraatodosloselementosconelmismopeso,llegandoadesvirtuarelanlisisde
correspondencias.
Mtododeestandarizacin:Cuandoserealizaladistanciachicuadradoelprogramacentralas
filasylascolumnasalpresentarnicamentelaopcinSeeliminanlasmediasdefilasy
columnas.Conladistanciaeucldeaseactivantodaslasopcionesdisponibles.
Mtododenormalizacin:Lanormalizacinseutilizaparadistribuirlainerciadelatablapor
filasy/ocolumnas,demodoqueelmtodoelegidonicamenteafectaralaspuntuacionesya
lasvarianzasdelasfilasycolumnas.Elrestoderesultadosnocambian(autovalores,inercia
explicadaporcadafactoryelporcentajedeinerciaexplicada).ElSPSScontemplacincomtodos
dedistribucindeinercia:
) Simtrico(cannico):Encadadimensinlaspuntuacionesdefilasonelpromedioponderado
delaspuntuacionesdecolumnadivididasporelautovalorcorrespondiente,mientrasquelas
puntuacionesdecolumnasonelpromedioponderadodelaspuntuacionesdefiladivididas
porelautovalor.Seaconsejautilizarestemtodocuandosedeseanexaminarlasdiferencias
(osimilitudes)entrelasdosvariables.Eselmtodoelegidoparanuestroejemplo.
) Principalporfila:Laspuntuacionesdelafilasonlamediaponderadadelapuntuacindelas
columnas,maximizandoaslasdistanciasentrelascategorasdelavariablefila.Mtodo
aconsejablecuandoelobjetivoesanalizarlasdiferenciasentrelascategorasdelavariable
situadaenlasfilas.
) Principalporcolumna:Cuandoelobjetivoesanalizarlasdiferenciasosimilitudesentrelas
categorasdelavariablecolumnaseutilizaestemtodo,queconsideralaspuntuacionesde
lascolumnascomolamediaponderadadelapuntuacindelasfilas,llegandoasamaximizar
lasdistanciasentrelascolumnas.
) Principal:Lasdistanciasobtenidasconestemtodorepresentanladistanciaexistenteentre
cadafila(ocolumna)aladistanciapromediodelperfilfila(ocolumnas).Estemtodose
utilizacuandosedeseanexaminarlasdiferenciasentrelascategorasdelavariablefilaylas
diferenciasentrelascategorasdelavariablecolumna,peronolasdiferenciasentre
variables.ConestemtodonoesposiblerepresentarelDiagramadedispersinbiespacial
(submenEstadsticos).
) Personalizado:Introduciendounvalorentre1y1enlaventanasituadaaladerechadeesta
opcin.Elvalor1realizaunanlisisprincipalporcolumna,el1unanlisisprincipalporfila,y
el0unanlisissimtrico.Dentrodeestoslimites,elvalorelegidodispersarlainerciasobre
laspuntuacionesdefilaocolumnaengradosdiversos.Unadelasventajasdeestemtodoes
quepermitecreardiagramasdedispersinbiespacialesamedida.
ElsubmenEstadsticosseencuentranvarias
opciones.
SantiagodelaFuenteFernndez
26
AnlisisdeCorrespondencias
Tabladecorrespondencias:Muestraunatabladecontingenciadelasvariablesdeentrada
(ficherodedatos),incluyendoelnmerodecasosencadaceldaylostotalesmarginalesdefilay
columna.
Inspeccindelospuntosdelafila:Paracadacategoradelavariablefilasemuestranlasmasas,
puntuaciones,inercia,contribucinabsoluta(contribucindeladimensinalainercia)y
relativa(contribucindeladimensinalainerciadelpunto).
Inspeccindelospuntosdecolumna:Masas,puntuaciones,inercia,contribucindela
dimensinalainercia(contribucinabsoluta)ycontribucindeladimensinalainerciadel
punto(contribucinrelativa)paracadacategoradelavariablesituadaenlacolumna.
Permutacionesdelatabladecorrespondencias:Realizaunaordenacindelatablade
correspondenciassituandolasfilasylascolumnasenordenascendenteenfuncindelas
puntuacionesdelaprimeradimensin.Esposiblerepresentarelrestodedimensiones
colocandounnmeroenlaventanaDimensinmximaparalaspermutaciones,alrealizarlose
generaunatablapermutadaparacadadimensin,desdelaprimerahastaelnmero
especificado.
Perfilesdefila:Proporcindecadacategoraconrelacinalmarginaldefila.
Perfilesdecolumna:Proporcindecadacategoraconrelacinalmarginaldecolumna.
Estadsticosdeconfianzaparapuntosdefila:Desviacintpicaycorrelacionesparalospuntos
defilaactivos.
Estadsticosdeconfianzaparapuntosdecolumna:Desviacintpicaycorrelacionesparalos
puntosdecolumnaactivos.
ElsubmenGrficos:
SantiagodelaFuenteFernndez
Diagramadedispersinbiespacial:Grficode
dispersinconlaspuntuacionesdefilay
columna.Sealarquenoesposiblerepresentar
estegrficocuandoseutilizaelmtodode
normalizacinprincipal.
Puntosdefila:Grficodedispersinconlas
puntuacionesdelafila.
Puntosdecolumna:Grficodedispersincon
laspuntuacionesdelacolumna.
27
AnlisisdeCorrespondencias
Grficosdelnea:Generanungrficoparacadadimensindelavariableseleccionada.
) Categoradefilatransformadas:Representacingrficadelascoordenadasdelavariable
fila.
) Categoradecolumnatransformadas:Representalosvaloresdelavariablecolocadaenla
columna.
Todaslassolucionesgrficaspermitendelimitarelnmerodecaracteresdelasetiquetasdevalor
quesernutilizadasenlarepresentacingrfica(AnchodeetiquetadeIDparadiagramasde
dispersinoparagrficosdelneas).Aunqueelprogramapermiteutilizarhasta20caracteres,se
aconsejautilizarcuatroocincoparafacilitarlaclaridadeinterpretacindelgrfico.
EnlatablasemuestranlascontribucionesdecadaunadelasH=mnimo{61,71}dimensiones
calculadasalainerciatotal.
Laprimeradimensincontribuyecon0,825(82,5%)adichainercia,ylasdosprimerasdimensiones
contribuyenconun96,9%,mientrasquelastresprimerasdimensionescontribuyenaun98,9%,por
loqueseconcluyequelasdependenciasobservadasenlatablavienenadecuadamentecapturadas
porlas2primerasdimensiones.
Elanlisisdelascontribucionesrelativadelexamendelospuntosdefila,reflejaunaelevada
representatividad,convalorescercanosalaunidadenlaltimacolumna,delascategorasenlos
factores.
Enlatabladeexamendelospuntosfila(primerfactor):HombresdeBurgostieneunapuntuacinde
(0,781)yHombresdeAvila(1,235),respectivamente,contribuyenasuinerciaconunapuntuacin
SantiagodelaFuenteFernndez
28
AnlisisdeCorrespondencias
de(0,143)y(0,236).Enlapartepositivadelprimerfactorseencuentranlasmujeres,esdecir,el
primerfactordiscriminaporsexos.
Enelexamendelospuntosfila(segundofactor):discriminaseparando,esencialmenteaHombresde
Avilaconunapuntuacinde(1,082)yaHombresdeSoria(0,290).Lospuntosquemscontribuyen
asuinerciason,consecuentemente,lospuntosfiladeHombresAvila(0,433)yHombresSoria
(0,295).
Porotraparte,elsegundofactortieneunacontribucinrelativaalainercianadadespreciabledelos
puntosfiladeAvila(hombresymujeres),MujeresdeBurgosyHombresdeSoria.
SantiagodelaFuenteFernndez
29
AnlisisdeCorrespondencias
Enlafiguraadjuntaseobservaquelaprimeradimensindiscriminaporsexos.Lasegundadimensin
discriminaporprovinciasseparando,especialmenteaviladeSoria.
Enlatablasemuestralamasa(pesoproporcionalasuimportanciaenelconjunto)decadacolumna,
lascoordenadasdelascolumnasenlosfactores,lacontribucindecadacolumnaalainerciatotal,
lascontribucionesabsolutasyrelativas.
SantiagodelaFuenteFernndez
30
AnlisisdeCorrespondencias
Elprimerfactordiscriminalosnivelesdeestudiomsbajosprimaria(0,253)ycertificadoescolar
(0,398)frentealresto,siendostasmodalidadesjuntoaladediplomados(0,178)lasquems
contribuyenasuinercia.Deotraparte,elprimerfactoreselquemscontribuyealainerciade
todoslosperfilesdecolumna.
Elsegundofactorseparaelperfilcorrespondientealniveldeestudiosdeprimaria(0,600)delresto
delosniveles.Destacarqueelsegundofactortieneunacontribucinrelativanadadespreciableala
inerciadelosquetienenestudiosdeprimaria(0,291)yestudiosdeformacinprofesional(0,235).
SantiagodelaFuenteFernndez
31
AnlisisdeCorrespondencias
Porltimosepresentaungrficoconjuntodelospuntoscorrespondientesalosperfiles
condicionalesdefilaycolumna:
Seobservaquelaprimeradimensindiscriminaentresexosdebidoalatendenciaahaberms
paradosvaronesenlosnivelesdeestudiosmsbajos(estudiosprimariosycertificadoescolaridad)y
msparadosmujeresenelrestodelosniveles.Estehechodemanifiestoanalizandolasrelaciones
deproximidadyalejamientodelospuntosfilaycolumna.
SantiagodelaFuenteFernndez
32
AnlisisdeCorrespondencias
As,porejemplo,lacercanaentrelospuntosfilaHombresdevilaycolumnaEstudiosPrimarioses
debidaalatendenciaenambosperfilesatenermayornmerodeparadosdelamodalidad
representadaporelotroperfil.
Tambinseobservaquelasegundadimensinponedemanifiestolaasociacinpositivaexistente
entrelascategoras(MujerdeBurgosyMujerdevilayDiplomado)ylasde(MujerdeSoriay
Universitario)mostrandounaespecializacineneltipodeparoexistenteenlasmujeresde
CastillaLen.
EnMujeresdeBurgosyvilatiendeahabermayoresnivelesdeparorelativoenDiplomado,
mientrasqueenMujeresdeSoriahaymayorniveldeparorelativoenUniversitario.
SantiagodelaFuenteFernndez
33
AnlisisdeCorrespondencias
Ejemplo2.EnlatablaadjuntasepresentalaEncuestadePresupuestosFamiliaresduranteel
perodo19901991,realizadoenladistintasComunidadesAutnomasespaolas.Enlasfilasse
recogencadaComunidadAutnoma,mientrasquelascolumnasrecogenlascantidadesgastadasen
cadaconceptosegnlosnuevegrandesgruposdegastoformuladosporelINE:
Grupo1:alimentos,bebidasytabaco
Grupo2:vestidoycalzado
Grupo3:vivienda,calefaccinyalumbrado
Grupo4:muebles,enseresyserviciosdelhogar
Grupo5:serviciosmdicosygastossanitarios
Grupo6:transportesycomunicaciones
Grupo7:esparcimiento,enseanzaycultura
Grupo8:otrosbienesyservicios
Grupo9:otrosgastosnomencionados
Deestemodo,elcrucedeunafilayunacolumnarepresentanlaspesetasqueloshabitantesdeuna
Comunidaddedicanaundeterminadoconcepto.
PLANTEAMIENTODELPROBLEMA:ElobjetivoprincipaldelasEncuestasdePresupuestosFamiliares
esactualizarlasponderacionesdelosdistintosbienesyserviciosqueintegranlacestadelacompra
paralaelaboracindelIPC(ndicedePreciosalConsumo).Aunqueensuorigenestasencuestas
analizabannicamenteelgastodelasunidadesfamiliares,enlaactualidadrecogengrancantidadde
informacinsobrelasfamiliasentrevistadas(nmerodemiembros,origendelosingresos,etc.),
informacinqueproporcionaunavisindetalladadelosmodosdevidaalpermitirestablecer
conexionesentrelospatronosdegastos,losingresosdelaunidadfamiliar,elequipamientodel
hogar,lascondicionesdelavivienda,etc.
Enesteejercicioseutilizacomocriterioclasificadorladistribucindelosgastosfamiliares.Eneste
sentido,lapreguntaesencialdelainvestigacincuestionalaexistenciaderelacinodependencia
entreComunidadAutnomaytipodegasto,esdecir,sihayComunidadesquepuedencaracterizarse
porunaseriedegastosdiferenciados,osimsbienComunidadytipodegastosonindependientes.
SealarquecuandosepostulaquelasComunidadesAutnomastienenpatronosdiferencialesde
gastoseasumelaexistenciadeunaestructuradeindependenciaentretiposdegastosy
ComunidadesAutnomas.Enestalnea,surgenvariaspreguntas:Culessonlascaractersticasde
esarelacin?,QuComunidadesAutnomastienenpautassimilares(diferenciadas)degasto?,
QugruposdegastotienenunadistribucinsemejanteenlasComunidades?,.
SantiagodelaFuenteFernndez
34
AnlisisdeCorrespondencias
Elanlisisdecorrespondenciaspermiteplanteartambincmolascategorasdeunavariable
explicanlasdiferencias(similitudes)observadasenlaotra,esdecir,Qugastosexplicanlas
diferencias(osimilitudes)entrelasComunidades?,QuComunidadesexplicanlasimilitud(o
diferencia)enlospatronesdegasto?.
Lagranheterogeneidaddelasregionesespaolasesadoptadacomopuntodepartidaparaanalizar
ladistribucindelosgastosenbienesyserviciosporpartedelasfamiliasdecadaComunidad
Autnoma,partiendodelahiptesisqueenfuncindeldesarrollodecadaComunidadsus
habitantesmanifestarndiferentescomportamientosenrelacinaladistribucindesusgastos.
PRIMERANLISISDELAINFORMACIN:Secomienzaconunanlisisunivariadodelasvariables
consideradas,conlafinalidaddeidentificardeterminadospatronesdecomportamiento.
SantiagodelaFuenteFernndez
35
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
36
AnlisisdeCorrespondencias
Elpvalue=0<0,05,serechazalahiptesisnula,
yseconcluyequelospatronesdegastoson
distintossegnlaComunidadAutnomade
residencia.
Sehasolicitadolosporcentajesdefilaycolumna.Compararlosporcentajesdefilaconla
distribucindegastosparatodoelpaspermitedetectarlasComunidadesqueempleanms
proporcindelgastoendeterminadosconceptos:enAndalucaempleanenalimentacinel31,6%
delosgastos,mientrasqueenNavarraempleanel24%delosgastos.
Parainterpretarelinteriordelatabla,desdeunpuntodevistaprctico,esmssencilloutilizarlos
residuosestandarizadoscorregidos,quesemuestranenlasiguientetabla:
Encadacasillaserecogenlosvaloresabsolutosylosresiduosestandarizados.Unanlisisdestas
permitirdetectarlosgruposdegastoquepredominanencadaComunidadAutnoma:
GRUPO1(alimentos,bebidaytabaco):LasComunidadesconunmayorresiduopositivosonCeutay
MelillaconAndaluca,esteelevadovalordetectalaexistenciadeunarelacinelevadaentreestos
elementos,enotraspalabras,estasComunidadesdestacanpordedicarunmayorporcentajede
ingresosalosgastosenalimentacin,bebidaytabaco.Porotraparte,loselevadoscoeficientes
negativosdeNavarra,BalearesyMadridreflejanqueelporcentajedeingresosdedicadosaeste
gastoesdeficienteconrelacinalrestodegrupos.
SantiagodelaFuenteFernndez
37
AnlisisdeCorrespondencias
GRUPO2(vestidoycalzado):EnestosconceptosdestacanCantabria,AragnyExtremadura;porel
contrario,CanariasyMadridpresentanunelevadocoeficientenegativo.
GRUPO3(vivienda,calefaccinyalumbrado):HaygastoselevadosenCantabria,CastillayLeny
Catalua.GastosreducidosenCeutayMelilla,ExtramadurayCanarias.
GRUPO4(muebles,enseresyserviciosdelhogar):NavarraylaComunidadValenciapresentaun
altocoeficiente,reflejandoquededicanunaltoporcentajedeingresosaestosconceptos.Porel
contrario,elporcentajedeingresosdedicadosaesteconceptoesdeficienteenCeutayMelilla,
CantabriayMadrid.
GRUPO5(serviciosmdicosygastossanitarios):GastoselevadosenBaleares,CanariasyCatalua.
GastosreducidosenCeutayMelilla,CastillaLaManchayMurcia.
GRUPO6(transportesycomunicaciones):GastoselevadosenBaleares,CanariasyMurcia.Gastos
reducidosenCeutayMelilla,ylaRioja.
GRUPO7(esparcimiento,enseanzaycultura):GastoselevadosenCatalua,MadridyCanarias.
GastosreducidosenMurcia,CastillayLen,Cantabria,CeutayMelilla.
GRUPO8(otrosbienesyservicios):GastoselevadosenMadridyPasVasco.Gastosreducidosen
GaliciayCantabria.
Elanlisisclsicodelastablasdecontingenciapermiteresolverelobjetivopropuesto,aunque
presentadificultadpararevelarlasestructurasdedependenciaentrelascategorasdelasvariables.
Porotraparte,amedidaquelatablaaumentadetamaosevaincrementandolacomplejidadpara
unaadecuadainterpretacin.Subrayarquelautilizacindetablasdecontingencianopermite
representargrficamentelasrelacionesentrevariables.
Seutilizaelanlisisfactorialdecorrespondenciasenlamedidaquesuobjetivoesprofundizarenel
conocimientodelasrelacionesqueseestablecenentredosvariablescualitativasobservadasenuna
mismapoblacin.
SantiagodelaFuenteFernndez
38
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
39
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
40
AnlisisdeCorrespondencias
Enlatabladecorrespondenciasserecogenlascantidadesmediasgastadasporhogarencada
ComunidadAutnoma,queoscilanentre2.677.012pesetasdeNavarray1.644.985pesetasde
CeutayMelilla.Enlascolumnasaparecenlascantidadesgastadasencadaconceptosegnlosnueve
gruposdegasto,seobservaqueen1991loshogaresespaolesgastaronenelGrupo1(alimentos,
bebidasytabaco)10.693.554pesetas,yconsiderandoqueelgastototaldelasComunidadesfue
37.339.465pesetas,elgastoenelGrupo1representa0,286(10.693.554/37.339.465)delosgastos
efectuados.
Estedatode0,286correspondealamasa(pesoproporcionalasuimportanciaenelconjunto)del
perfildelaprimerafila.Lamasaindicaelpromediototaldegasto,estoes,unaComunidad
Autnomaidealcuyopatrndegastocoincideconelconjuntonacional.
Enlatablaperfilesdecolumnaparalosdistintosgrupos,queseinterpretancomolaparticipacinde
cadaComunidadAutnomaenlosgruposdegasto:Andalucacontribuyeconun5,7%delgastototal
dealimentacin.
Enlneaconloexpuesto,losperfilessonlasproporcionesdecadaceldillaenfuncindela
distribucinmarginaldelafilaylacolumnacorrespondiente.Laimportanciadeestainformacin
radicaenqueelanlisisdecorrespondenciasdeterminaladistanciaentrelasmodalidades
considerandolasdistribucionesmarginalesylamasadecadacelda.
Estehechoobligaaconsiderarlasdiferenciasentreloselementosentrminosdedistancias,de
maneraquecuantomayorsealadiferenciaentreperfilesconmasasimilar,mayorserladistancia
entrelasComunidades.
ANLISISPERFILESDEFILA:
UnanlisisdetalladomuestragrandessimilitudesenladistribucindegastosdeCanariasyMadrid,
concluyendoqueambasComunidadestienenunospatronesdegastossimilares.
Siseconsideranlasdiferenciasentreloselementosenfuncindelasdistancias,estasComunidades
tendrnescasasdistancias.Deformaanloga,cuantomayorsealadiferenciaentrelosperfiles
mayorserladistanciaentrelasComunidades.
Resaltarquealestablecerlasdiferenciasentrelasmodalidadesnohayquefijarsenicamenteenlas
distanciasentrelosperfiles,tambinhayqueprestaratencinalasdistanciasponderadasen
funcindesumasa.
Lamasa(pesoproporcionalasuimportanciaenelconjunto)indicalainfluenciadeunobjetoen
baseasufrecuenciamarginal.Lamasaafectaalcentroide(baricentro),queeselperfilmediodela
columnaofila.Lasfilas(ocolumnas)conunamasaelevadaNavarra(0,072),Madrid(0,069)y
Catalua(0,068),porejemploinfluyenenlainerciaaunqueestncercadelcentroide;mientras
quelasfilas(ocolumnas)conunamasapequeaExtremadura(0,042),CeutayMelilla(0,044)
influyensobrelainercianicamentecuandoestnlejosdelcentroide.
Traslosperfilesdefilasycolumnas,SPSSofreceunatablaresumendondeaparecenelnmerode
dimensionescalculadas,losvalorespropiosoautovaloresdecadadimensin,lainercia,elvalorde
chicuadradoconsusignificacin,laproporcindeinerciaexplicadaparacadadimensin,yla
proporcinexplicadaacumulada.
SantiagodelaFuenteFernndez
41
AnlisisdeCorrespondencias
Elnmeromximodedimensionesesunnmeroinferioralnmerodecategorasdelavariable
conmenoscategoras(91=8).Aligualqueelanlisisdecomponentesprincipales,laprimera
dimensinexplicalamayorcantidaddeinercia,lasegundaunacantidadmenor,yashastala
ltima.
Aunqueelobjetivodelanlisisdecorrespondenciasesrepresentarlarelacinentrefilasycolumnas
conelmenornmerodedimensiones,convienecomenzarelanlisissolicitandounnmeroelevado
dedimensionesparaobservarlacontribucinrelativadecadauna.
Enestecasosehansolicitadocincodimensiones,aunqueSPSSproporcionainformacinsobreel
valorpropioyelporcentajedevarianzaexplicadadetodaslasdimensiones.Noocurrelomismocon
ladesviacintpicaylacorrelacinentredimensiones,quenicamentepresentalosvaloresdelas
dimensionesespecificadas.
Enlasegundacolumnaaparecenlosvalorespropiosoautovalores,esdecir,lacorrelacinentre
laspuntuacionesdefilasydecolumnas.Lainerciadecadadimensineselcuadradodecada
autovalor,queesunamedidarelativadelaimportanciadecadadimensin.
Enlaterceracolumnaelestadsticochicuadrado,sumaponderadadetodaslasdistanciasal
cuadradoentrelosperfilesdefilayelperfilmediodelafila,yentrelosperfilesdecolumnayel
perfilmediodecolumna.Susignificacin0,000<0,05hacequeserechacelahiptesisnula,
indicandounarelacinsignificativaentrelasvariablesutilizadas.Cuantomayorseaestadistancia
menorsersusignificacin,loqueconduciraunaelevadainterrelacinentrelasvariables,y
unamayordiferenciadelosperfilesrespectoalperfilmedio.
Lainerciatotaleslasumaponderadadetodaslasdistanciasalcentroide(baricentro)que
coincideconladistanciachicuadradodivididaentreeltotaldecasos:(chicuadrado/N=
489287,344/37339465=0,013).
Unavezqueseconocelainerciaexplicadaportodaslasdimensionesessencillovalorarla
aportacinindividualdecadauna:elcocientedelainerciadecadadimensinentreeltotal
(0,007/0,013=0,547)informaquelaprimeradimensinexplicael54,7%delainercia,
mientrasquelasegundadimensinsloexplicael18,9%.
Enlasiguientecolumnasemuestralaproporcindeinerciaacumulada,queindicalaexplicacin
conseguidacuandoseconsideraunmodelocondos,tresomsdimensiones.Enestesentido,el
modelocondosdimensionesexplicael73,7%,llegandoaunaexplicacindel84,3%alseleccionar
lastresprimerasdimensiones.
Lassiguientescasillasproporcionaninformacinpararealizarelintervalodeconfianzadela
poblacindequelasehanextradolosdatos,presentandoladesviacintpicaparacadadimensin
ylacorrelacinentrelasdimensionessolicitadas.Cuandolasdesviacionestpicassonpequeases
probablequelasolucinpresentadaestcercadelvalorpoblacional.
SantiagodelaFuenteFernndez
42
AnlisisdeCorrespondencias
Enlatablaaparecendesviacionestpicasmuypequeas,indicandoquelosresultadosseranmuy
similaresauncuandoserealizaseesteanlisisenotrasmuestrasdeigualtamao,extradasdela
mismapoblacinyconunprocedimientoidntico.
Acontinuacin,aparecenlastablasExamendelospuntosfilayExamendelospuntoscolumna:
SantiagodelaFuenteFernndez
43
AnlisisdeCorrespondencias
Latablamuestralamasa(pesoproporcionalasuimportanciaenelconjunto)decadacolumna,las
coordenadasdelascolumnasenlosfactores,lacontribucindecadacolumnaalainerciatotal,las
contribucionesabsolutasyrelativas.
Lainerciadeunadimensineslasumaponderadadelasdistanciasalcuadradoentrecadapuntoy
elcentrodecoordenadas.LascontribucionesabsolutasaparecenbajoelttuloContribucindelos
puntosalainerciadeladimensin,yaparecelacontribucindecadapuntoaladefinicindela
dimensino,expresadodeotraforma,laproporcindelainerciaexplicadaporunfactordebidaa
cadacategora.Lasumadelascontribucionesabsolutasdetodaslasmodalidadesenunfactorser
igualalaunidad.
Lacontribucindecadapuntodependedeladistanciadecadacategoraalcentrodegravedadyde
sumasa,siendoelproductodelacoordenadaalcuadradoporlamasadelacategora,divididopor
elvalorpropiodelfactor:Lacontribucin0,529delosgastosdealimentacinseobtienedela
expresin[(0,395)2.0,286]/0,085=0,529.
Conesteenfoque,sepuedeafirmarquelascontribucionesabsolutasponderanladistanciadecada
modalidadenfuncindesumasa,demodoquenobastaconobservarlascoordenadas(comoenel
anlisisdecomponentesprincipales)sinoqueesnecesarioconsiderarelnmerodeelementos
incluidosencadamodalidad,sumasa.Estoexplicaquepuntoslejanosdelcentroide(baricentro)
tengancontribucionesabsolutaspequeas,yviceversa,queComunidadesconcoordenadasbajas
consiganelevadascontribucionesenlaexplicacindelfactor.
Lasmodalidadesdegastosdominantesdelprimerfactorsonlosgastosenalimentacin(conuna
contribucinde0,529alainerciadeleje),seguidosdelosgastosentransportesy
comunicaciones(conunacontribucinde0,169alainerciadeleje),yenesparcimiento(conuna
contribucinde0,121).Conestastresmodalidades(alimentacin,transportesycomunicaciones,
SantiagodelaFuenteFernndez
44
AnlisisdeCorrespondencias
yesparcimiento)seexplicael82%delainerciadeesteprimerfactor.Elprimerfactorexplicael
54,7%delainerciatotal(tablaresumen).
Enelsegundofactorlosgastosenvestidocalzado(conunacontribucinde0,362alainerciadel
eje)yesparcimiento(conunacontribucinde0,262)lleganaexplicarel62,4%delainerciadel
segundofactor.Elsegundofactorexplicael18,9%delainerciatotal(tablaresumen).
Eltercerfactorestexplicadofundamentalmenteporlosgastosenvivienda(conuna
contribucinde0,274alainerciadeleje),otrosbienesyservicios(contribucinde0,103)yotros
gastosnomencionados(contribucinde0,223),llegandoaexplicarel60%delainerciadeltercer
factor.Eltercerfactorsloexplicael10,6%delainerciatotal(tablaresumen).
Enelcuartofactordestacalacontribucinenvestidocalzado(0,217)ytransportes(0,151),en
definitivapuededecirsequenotieneningunacontribucinabsolutaelevada.Elcuartofactor
sloexplicael5,2%delainerciatotal(tablaresumen).
Enelquintofactordestacanlasaportacionesdelosgastosenmuebles(0,252),gastossanitarios
(0,119)yotrosbienesyservicios(0,350),llegandoaexplicarel72,1%delainerciadelquinto
factor.Elquintofactorsloexplicael4,7%delainerciatotal(tablaresumen).
Lascontribucionesrelativasexpresanlacontribucindecadafactoralainerciadecadacategora,es
decir,lacalidaddelarepresentacindeunpuntosobreunadimensin.
Lacontribucinrelativasecalculadividiendolacoordenadaalcuadradoentreladistanciadela
categoraalcentrodegravedad,ylasumadelascontribucionesrelativasdeunamodalidadentodos
losfactoresesigualalaunidad.
Laltimacolumnadelascontribucionesrelativas,convalorescercanosalaunidad,reflejalaelevada
calidaddetodoslospuntossobrelascincodimensiones;sibienlastresprimerasdimensiones
explicanlamayorpartedelosgruposdegasto,aexcepcindelgastoenmueblesyenotrosgastos
nomencionados.
INFORMEPUNTUALDELAINVESTIGACIN:Elobjetivodelanlisisdecorrespondenciasesreducir
unaseriedevariablesobservadasaunconjuntomenordevariableslatentesllamadasfactores,con
lamenorprdidadeinformacin.
Enunprincipiosehaciareferenciaalaconvenienciadeextraerunnmeroelevadodedimensiones
paraanalizarlacontribucindecadauna,alavezquesehamencionadoenlaconvenienciade
buscarelequilibrioentreparsimoniaeinterpretabilidad.Concincofactoresseexplicael94%dela
inercia,mientrasquecontresfactoresseexplicael84,3%delainerciatotal.Enestalnea,es
aconsejablerealizarelanlisisconlostresprimerosfactores,decisinquequedaavaladaporla
ausenciadeelevadascontribucionesabsolutasapartirdelacuartadimensin.
Paraconstruirelnuevomodelosemodificalalnea
/DIMENSION=5coneleditordesintaxis,osecambia
elnmerodedimensionesenelcuadrodedilogode
lafiguraadjunta
SantiagodelaFuenteFernndez
45
AnlisisdeCorrespondencias
Losresultadosanalizadoshastaelmomentonocambian,aexcepcindelascontribucionesrelativas:
Elanlisisdelascontribucionesrelativasdelasdostablas(examendelospuntosfilaycolumnacon
tresdimensiones),convalorescercanosalaunidadenlaltimacolumna,siguereflejandouna
elevadacalidaddelarepresentacindelascategorasenlosfactores,aunquedeterminadosgrupos
degastoGrupo4(muebles,enseresyserviciosdelHogar)yGrupo8(otrosbienesyservicios)y
algunasComunidadesAutnomasValencia,Galicia,PasVasco,etc.disminuyanligeramentesu
representatividad.
SantiagodelaFuenteFernndez
46
AnlisisdeCorrespondencias
ANLISISCOMPONENTESGRFICOS:Enlastablasde
examendelospuntosfilaycolumnacontresdimensionesse
recogenlaspuntuacionesdecolumnasyfilasquesern
utilizadascomocoordenadasenlasrepresentaciones
grficas.
SecomienzananalizandolosGrficosdeLneasenlamedida
queimplicanelacercamientomssencilloalarealidad
estudiada.
Estosgrficosnosonmsqueunarepresentacindelaspuntuacionesdelascategorasdecada
dimensin,siendomuyilustrativosparaconocerladistanciadecadacategoraalpuntode
coordenadas.
Alestarrepresentadaslascoordenadasdecadacategoraestosgrficospermitenunarpida
comparacinentrelasdistanciasdelascategorasrespectoalorigendecoordenadas,conociendoas
loselementosquedefinencadafactor.
EnlatabladeExamendelospuntosdeFila(primerfactor):Andalucatieneunapuntuacinde
(0,240)enlaprimeradimensin,raznporlaqueestaComunidadAutnomaaparecesituadaalgo
msabajodelvalor(0,20).Enlapartederecha,CeutayMelilla,conunapuntuacinde(0,737),es
elvalormsbajodetodoslosvaloresconsiderados.
EnelgrficodeExamendeLneasdeFila(primerfactor)aparecenenlapartenegativalas
ComunidadesdeCeutayMelilla,Andaluca,ExtremadurayGalicia.
SantiagodelaFuenteFernndez
47
AnlisisdeCorrespondencias
Enlapartenegativadelprimerfactor(elevadosgastosenalimentacin):CeutayMelilla,Andaluca,
ExtremadurayGalicia.Sealarque,comoejemplo,encasoscomoExtremadurayGalicia,sepoda
pensarquecomoestasdosmodalidadesaparecenjuntastienenperfilessemejantes;perocuandola
calidadderepresentacinesbajasedebematizarestasemejanza:Estostresfactoresexplicanel
50,3%deGalicia,esdecir,lasemejanzaseproduceconsiderandonicamentelamitaddeesta
modalidad,pudiendosucederqueestasComunidadesseanmuydiferentesencualquierotro
aspectonorecogidoporestostresfactores;esdecir,encualquierotroaspectoincluidoenel50%
restantequequedasinespecificar.
ParaanalizarelorigendeesteproblemaseconsideraqueGaliciasediferenciadelperfilmedio,yde
otrasComunidades,engruposdegastosdistintosalosdestacadosporestostresfactores.Dehecho,
alobservarlatablaExamendelospuntosdeFila(cincodimensiones)seapreciaqueloscinco
primerosfactoresexplicanel78,3%deestaComunidad,destacandolaelevadacontribucinde
Galiciaenelquintofactor.
GRFICO DE LNEA DE LAS COLUMNAS
EnelgrficodeExamendeLneasdeColumna(primerfactor)sedesvelaquelosgastosdesanidad,
esparcimientoyalimentacinestnmuylejosdelorigendecoordenadas,respectivamente,losdos
primerossituadosenlapartepositivayelterceroenlapartenegativa.
Elgrupo'Otrosbienesyservicios'ylosgastosenviviendaseencuentransituadosmuycercadel
origendecoordenadas,deformaquetienenunescasopoderdiscriminanteenlaprimera
dimensin.
Altapresenciadegastosentransportes,sanidadyesparcimiento(extremopositivodelprimer
factor):Baleares,Navarra,MadridyCatalua.
SantiagodelaFuenteFernndez
48
AnlisisdeCorrespondencias
Enlasegundadimensinseaprecianlaspuntuacionesextremasdelosgastosenvestidoyen
esparcimiento,elprimeroconsignonegativoyelsegundopositivo,quesernelementosdefinitorios
delasegundadimensin.
GRFICO DE LNEA DE LAS FILAS
Predominiodegastosenvestidoycalzado(partenegativadelsegundofactor):Cantabriay
Aragn.
Presenciaelevadadegastosenesparcimiento(extremopositivodelsegundofactor):Ceutay
Melilla,MadridyCanarias.
GRFICO DE LNEA DE LAS COLUMNAS
SantiagodelaFuenteFernndez
49
AnlisisdeCorrespondencias
Enlaterceradimensin,serecogenpuntuacionesextremasenesparcimientoyvivienda(signo
positivo)yenotrosgastosnoincluidosanteriormente(partenegativa).
GRFICO DE LNEA DE LAS FILAS
Elevadosgastosenotrosgastos(extremonegativodeltercerfactor):MurciayNavarra.
Predominodegastosenesparcimientoyvivienda(partepositivadeltercerfactor):Cataluay
Cantabria.
GRFICO DE LNEA DE LAS COLUMNAS
SantiagodelaFuenteFernndez
50
AnlisisdeCorrespondencias
Lasrepresentacionesgrficasanteriores,conunagranfacilidaddeinterpretacin,dejanaspectossin
explicar,raznporlaqueesnecesarioanalizarlosgrficosdedispersinquepresentanlas
puntuacionesdefila(ocolumna)enlosdiversosfactores.
Mientrasquelosgrficosdelneanicamenteconsiderabanlapuntuacindecadacategoraenun
factor,losgrficosdedispersinrealizanunarepresentacinenvariasdimensionesreflejandouna
mejorcaracterizacindelarealidad.
LaspuntuacionesdecadaComunidad(filas)enlastresdimensionesseleccionadassecombinanpara
realizarunarepresentacindelosdosprimerosfactores,odelprimeroconeltercerfactor.
SantiagodelaFuenteFernndez
51
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
52
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
53
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
54
AnlisisdeCorrespondencias
INTERPRETACINDELOSRESULTADOS:Elobjetivoerarealizarunatipologizacindelas
ComunidadesAutnomasconsiderandocomocriterioclasificadorladistribucindelosgastos
familiares.
AplicandoelanlisisdecorrespondenciassimplesalosdatosobtenidosporlaEncuestade
PresupuestosFamiliares(19901991)seobtienendosfactoresqueconjuntamenteexplicanel73,7%
delainerciatotal(tablaresumen:proporcininerciaacumulada).
Unaprimeraobservacindelascontribucionesabsolutasdelprimerfactorreflejalagranaportacin
dedosgruposdegasto:GrupoI(alimentacin,bebidasytabaco)conunacontribucinabsolutade
0,529,GrupoVI(transportesycomunicaciones)conunacontribucinabsolutade0,169(tabla
examendelospuntoscolumna).Estasdosmodalidadesexplicanel69,8%delainerciadelfactor.
Lascontribucionesrelativas(tablaexamendelospuntoscolumna)mejoranlainterpretacinal
desvelarqueelGrupo5(mdicosyserviciossanitarios),conunacontribucinrelativade0,614se
encuentranfuertementeexplicadosporesteprimerfactor.
ElanlisisdecoordenadasindicaquelosgastosenelGrupoI(alimentacin,bebidasytabaco)se
encuentransituadosenlaparteizquierdadelfactor(0,395)(Tablaexamendelospuntoscolumna
contresdimensiones,GrficodeLneadelasColumnas)conunacontribucinabsolutade0,529,
mientrasquealaderechadelorigendecoordenadasseencuentranlosgastosdelGrupoVI
(transportesycomunicaciones)conunarepresentacinde0,318,contribucinabsolutade0,169y
Grupo5(mdicosyserviciossanitarios)conunarepresentacinde0,507,contribucinabsoluta
0,088.
AunqueenlapartederechadeesteprimerfactoraparecetambinelGrupoIV(muebles,enseresy
serviciosdelhogar),elanlisisdecontribucinabsoluta(0,026)desvelaqueestegrupodegasto
tieneescasainfluenciaenladefinicindelfactor.Labajacontribucinrelativade(0,263)est
indicandoqueestosgastosestnmuypocodefinidosporelmodelodelosdosfactores.
Concluyendo,elprimerfactorqueexplicael54,7%delainerciatotal(tablaresumen:proporcin
inerciaexplicada),estsealandounaoposicinentrelosgastosdelGrupo5(mdicosyservicios
sanitarios)yGrupoVI(transportesycomunicaciones),frentealgastoenelGrupoI(alimentos,
bebidasytabaco).Lostiposdegastosdefinitoriosdelprimerfactor,juntoconlasComunidades
Autnomasenlosquepredominan,aparecenrepresentadosenlosextremosderechoeizquierdadel
grficopuntosdecolumnaparagastos.
Unapanormicanacional:CeutayMelilla,Andaluca,ExtremadurayGaliciatienenungastosuperior
enelGrupoI(alimentos,bebidasytabaco),respectivamente,(683373/1644985=41,5%),
(604906/1915446=31,6%),30,3%y30,4%(tabladecorrespondenciaspermutadasdeacuerdoconla
dimensin1).
LalejanaposicindeCeutayMelillarespectoalorigendecoordenadas,unidaasuelevada
contribucinabsolutahacensospecharquepuedatratarsedeuncasoatpicoquepodraafectar
gravementealaestabilidadinternadelapresentacin.Estetipodepuntosdificultanla
interpretacindelgrficoalconcentrarelrestodelospuntosenunreapequea,aunqueel
principalproblemaquesepresentaesquesueliminacincambiatotalmentelaorientacindelos
ejes,amenazandolaestabilidadinternadelmodelo.Pararesolverladudaserealizaranvarios
anlisissinestacategora,sielplanoylosejespermanecenestables,serechazaquesetratedeun
casoatpico.
SantiagodelaFuenteFernndez
55
AnlisisdeCorrespondencias
SantiagodelaFuenteFernndez
56