Vous êtes sur la page 1sur 10

Anlisiscuantitativo

1. Analizarvariablesindividuales
2. Analizarlasrelacionesentrevariables

Unavezrecibidoslosdatosyantesdesometerlosalanlisis,suelesertilllevaracaboalgunasoperaciones
preliminares.Estopuedeincluir:
apartarlosdatosquesonobviamenteerrneosoirrelevantes.Estohadeserhechoconprecaucin:no
debiramosborrardatosquesonsolamente"anmalos"ynoarmonizanconnuestrashiptesis.Pueden
tambindemostrarquelahiptesisesdefectuosa.
normalizaroreducirnuestrosdatossignificaqueeliminamoslainfluenciadealgnfactorbienconocido
perosininters.Porejemplo,podemoseliminarelefectodelainflacindividiendotodoslospreciosporel
ndicedepreciosdelafechadelacompra.
Enelanlisispropiamentedichodelosdatos,elpropsitoesextraerunainvarianteoestructuraquenosinteresea
partirdelosdatos.Estonosignificaqueintroduzcamoslosdatosenunordenadoryesperemosqueelordenadornos
muestrequestructuraspuedenencontrarseenellos.Losordenadoresnosonlobastantelistosparaeso.
Enlugardeello,eshabitualqueyaenunmomentotantempranocomoeliniciodelproyecto,elinvestigadortenga
unmodelomatemticoqueaplicaralosdatos.Estemodelotambinproporcionalashiptesiseventualesparael
proyectodeinvestigacin,oalmenosactacomounahiptesisdetrabajoinicialmentenoexactaquese
puntualizarduranteelanlisis.
Losdatosempricospuedenentoncesanalizarsedelmodosiguiente:primero,elinvestigadordisponelosdatosde
acuerdoconelmodeloydespusconsideraenqugradoelmarcoesadecuadoalosdatososihadebuscarseun
modeloqueseadaptemejor.
Enotraspalabras,elinvestigadorsueleprimerodecidirqutipodepatrneselqueestbuscandoenlosdatos.Esto
determinarlosmtodosparaunanlisismatemtico.As,laprimeracuestinalahoradeelegirelmtodode
anlisises:Queremosusarlasvariablesmedidasparaclasificarcasosoindividuos?Odeseamosanalizarvariables
inconexas,obienlasrelacionesentrediversasvariables?
Otradecisinimportanteserefierealpropsitofinaldesuproyecto.Usteddeseadescribircmoeselactual(o
anterior)estadodesuobjeto,ousteddeseadescubrircmoelobjetodebeser:qugradodelascualidadesmedidas
seraptimo?EsteltimotipodeanlisissediscutebajodelttuloAgregarunadimensinnormativaaunanlisis
descriptivo.

Analizarvariablesindividuales
Acontinuacinhayunalistadealgunosmtodoshabitualesparaelanlisisestadsticodeunasolavariable.Los
mtodoshansidodispuestosdeacuerdoconlaescalademedicindelavariable.

Escala
nominal

Mtodosdepresentacindelos
datos
Medias:

Escala
ordinal

Escalade
intervalo

TabulacinPresentacingrfica

Lamoda
Lamediana

Escalade
proporcin

Medidasdedispersin:

Mediaaritmtica
Desviacindecuartil
Elrango

Desviacinestndar

Presentacingrficadeunavariable
Unmodosimpledepresentarunadistribucindevaloresesmostrarcada
valorcomounpuntoenunaescala.Sihayungrannmerodevalores,puede
sermejorclasificarlosprimeroyentoncespresentarlafrecuenciadecada
clasecomounhistograma(Fig.deladerecha).
Sinuestrosestudiostienenquevercon
personas,ocurrirconbastantefrecuencia
quenuestrasmedicionesestarn
distribuidasdeacuerdoconciertacurva,la
llamadacurvadeGauss(alaizquierda)
quees,porconsiguiente,llamadala
distribucinnormal.Unadesuspropiedadesesqueel68%detodaslas
medicionesdiferirdelamedia(enlafigura:M)ennomsqueladesviacin
estndar,yel95%ennomsqueeldobledeladesviacinestndar.
Avecesquerremosponerelnfasisnoenla
distribucinabsoluta,sinoenlaproporcionalodeporcentaje.Undiagrama
apropiadoparaestoeselgrficodesectores,tambinllamado"detarta"o"de
queso"(aladerecha):

Medias
Unamediaesunaestadsticaquecaracterizaelvalortpicodenuestrosdatosy
eliminaladispersinaleatoriadevalores.Paracadaunadelasdistintasescalasde
medicinhayuntipoadecuadodemedia,
lamoda
lamediana
lamediaaritmtica.
Modaeselvalormscomnennuestroconjuntodedatos.
Medianaeselvalorenelmediodelaseleccin,sitodoslosvaloresestndispuestosdelmenoralmayor.
Media(aritmtica)eslasumadetodoslosvaloresdivididoporsunmero,o

Deentrelasmediasquesehanpresentadomsarriba,elinvestigadorpuedeelegirhabitualmenteaquellaque
muestramejorelvalortpicodelavariable.Lamediaaritmticaeselmspopular,peropuedeofreceruncuadro
equivocadoporejemploendatosqueincluyenunvalorquedifierenengranmedidadelosotros(vaselaimagende
abajo).
Lomismoocurresiladistribucinestdesviada,comoenlaimagendeladerecha.Enelejemplo,serelacionanlos
minutosquelosdistintossujetostardanenllevaracabounatarea.Losmsrpidosnecesitaron5minutos,peroel

resultadomscomn(=lamoda)fuedesiete
minutos.Elvalorenelmedio,esdecir,lamediana,
sehamostradoen"M"rojoenlaimagen.La
medianatenaaquelvalor11.
Qupasaconlamedia?Comoalsujetomslento
lellevelacabar34minutos,lamediaseelevaa
11.98minutos,loquenodauncuadroexactodel
resultadomedioenestecaso.Estomuestraquelos
datosestndesviadoseltipodemediadebe
elegirseconcuidado.Unapresentacingrfica
muchasvecesseramsilustrativaquecalcularuna
solaestadstica.
Ladistribucinmostradaenestafiguraest
escoradapositivamente,porquelasmedicionesquehandadovaloresmayoresquelamediana(11)seextiendenen
unampliorango(de11a34),mientrasquelasmedicionesquehandadovalorespordebajodelamedianase
concentranpocosvalores(5...11).
Sepuedetambin,siesnecesario,acudiraunaestadsticaparadescribirlacantidaddedesviacin.
Alelegirlamediamsapropiada,debemostenerencuentalaescalaquefueusadaenlarecoleccindelosdatos.Si
laescalaeranominal,lanicamediaposibleeslamoda.Silaescalafueordinal,podemosusarlamedianaola
moda.
Finalmente,silamediafuecalculadaapartirdeunamuestra,debemosexaminarsurepresentatividadestadstica,o
quprobableesquelamismamediaseaciertaenlapoblacindelaquelamuestraseextrajo.Unacomprobacin
apropiadaparaestoeslapruebat.

Indicarladispersindelosdatos
Unavezquehemoscalculadoelvalormedio,puedeseravecesinteresantedescribiraqudistanciaentornoala
mediaestndiseminadoslosvaloressingulares.Paraestefin,podemoselegirentrediversasestadsticas.Laeleccin
dependedeltipodemediaquehayamosusado:
Enconexinconlamodaladispersindevaloresraramenteesinteresante.
Enlugardeello,sihemoscalculadounamediana,muchasvecesquerremossealarladiseminacindevalores
entornoaella.Unaformaadecuadaparaestoesladesviacindecuartiles.Un"cuartilmsalto"esaquel
valorqueessobrepasadoporel25%delconjuntodetodaslasmedicionesdelmismo,modoel25%detodos
losvaloressonmsbajosqueel"cuartilbajo".Ladesviacinmediadeloscuartiles(marcadasconQverdeen
ladiagrama)apartirdelamedianaesllamadadesviacindecuartilesyescalculadaconfacilidaddividiendo
porlamitadladiferenciadeloscuartiles.
Unaestadsticaalternativaymuysimpleeselrango:ladiferenciaentreelmayoryelmenorvalor.
Enconexinconlamediaaritmticamuchasvecesquerremoscalcularladesviacinestndar.Silosvalores
semidenapartirdeunapoblacin,laformulaser,

Sinembargo,siladesviacinestndarsloserefiereaunamuestra,laformulaes,

Enambasfrmulas,neselnmerodelosvalores,ylosvaloresdecadavariablesustituirnaxunotrasotro.
Raramenteuninvestigadorsemolestarenrealizarporsmismoelclculo,porqueelalgoritmonecesarioparaesto
existeinclusoencalculadorasdebolsillo.
Alarazcuadradadeladesviacinestndarsellamavarianza,ytambinstaesusadaconfrecuenciaparadescribir
yanalizarladispersin.
Silaestadsticadedispersinsehacalculadoapartirdeunamuestra,surepresentatividadestadsticadebetambin
calcularsealfinal.Lapruebatesadecuadaparaesto.

Analizarlasrelacionesentrevariables
Sidosvariablesevolucionanmodotalqueenalgunamedidasesiguenentreellas,podemosdecirqueexisteuna
asociacinocovarianzaestadsticaentreellas.Porejemplo,laalturaypesodelagenteestnestadsticamente
asociadas:aunqueelpesodenadieestcausadoporsualturanilaalturaporelpesoes,noobstante,habitualquelas
personasaltaspesenmsquelaspersonasbajas.Porotroladolosdatoshabitualmenteincluyentambin
excepciones,loquesignificaqueunaasociacinestadsticaesinherentementeestocstica.
Lacienciadelaestadsticaofrecenumerososmtodospararevelarypresentarlasasociacionesentredosyhastams
variables.Losmediosmssimplessonlosmediosdepresentacingrficaytabulacin.Laintensidaddela
asociacinentrevariablespuedetambindescribirsecomounaestadsticaespecial,comoelcoeficientede
contingenciayunacorrelacinparaloquehayvariosmtodosdeanlisisdisponibles.
Si,alanalizarlosdatos,sedescubrealgunaasociacinentrelasvariables,elinvestigadorquisieraamenudosaberla
razndeestaasociacinenelmundoemprico,esdecirlquisieraexplicarestaasociacin.Lostiposusualesde
explicacionseenumeranenlapginaDescripcinyExplicacin.Comnatodosesquedanlacausadelfenmeno
seestestudiandoque.Cuandolasmedidassehanhechodeunaseriedeestosfenmenos,esusualqueunaseriede
medidas,llamadavariableindependiente,sehaceasdelacausapresumida,yunaotraseriedemedidas,la
variabledependiente,delefectopresumidoenelfenmeno.
Notaquenohaymtodosenelanlisisestadsticoparalatareadedescubrirlaexplicacincausalparauna
asociacinestadstica.Unafuertecorrelacinentre,digamos,AyB,puededeberseacuatrorazonesalternativas:
AeslacausadeB.
BeslacausadeA.
TantoAcomoBsoncausadasporC.
AyBnotienennadaqueverconunoalotro.Suasociacinenlosdatosanalizadosestunacoincidencia.
Elinvestigadordebeencontraraslacausalidadolaotraexplicacinparalaasociacindelasvariablesenalguna
otrapartequeenlasmedidas.Enmuchoscasos,lateoraoriginaldelinvestigadorpuedeproporcionaruna
explicacinsino,elinvestigadordebeusarsusentidocomnparaclarificarlacausa.
Acontinuacinmencionamosalgunosmtodosusualesdeanlisisestadsticoquepuedenusarsealestudiarla
interdependenciaentreunaomsvariables.Losmtodoshansidodispuestossiguiendoaquescalademedicin
correspondenlamayorpartedelasvariables.
Metadeanlisis
Presentardatosysuestructuraagrandesrasgos
Medirlafuerzadelaasociacinentredos
variables
Encontrarquvariablesentrevariosson

Escala
nominal

Escala
ordinal

Escalade
intervalo

Escalade
proporcin

TabulacinGrficos
Coeficientedecontingencia

Correlacinordinal

CorrelacinrdePearson
Calcularcontingenciasocorrelacionesparatodoslosparesde

asociadas:
Transcribirunaasociacinestadsticaenuna
funcinmatemtica:

variablesanlisisfactorial

Anlisisderegresin

Tabulacin
Latabulacinesunaformahabitualdepresentarlasasociacionesentredosomsvariables.Unatablatienela
ventajadequeenellapuededisponersebienunacantidadextensadedatosyseconservanlascifrasexactas.Una
desventajaesqueunatablagrandenoesilustrativa:rarasvecesrevelaalgomsquelasmsobviasregularidadeso
interdependenciasentredatos.Algunasabreviaturasconvencionalesusadasentablassepresentanbajoel
encabezadoClasificar.

Presentacingrfica
Losproductos,comoobjetosdeestudio,sonpresentadosconfrecuenciacomoimgenes,quesonunaformade
presentacingrfica.(Ejemplosdepresentacionesgrficas.)
Sielinvestigadordesearesaltaralgunosrasgoscomunesopatrones
generalesquehaencontradoenungrupodeobjetos,puedecombinar
variosobjetosenungrfico,comoenlafiguradelaizquierda.Enel
diagrama,StureBalgrdmuestracmolosedificiosviejosen
Hrnsandsiguenproporcionesuniformesdeanchurayaltura(lalnea
roja)consloalgunasexcepciones.Alinventarmtodosilustrativosde
presentacindeloshallazgosdelestudiodeproductos,lamsseria
restriccineslaimaginacindelinvestigador.
Confrecuencia,noobstante,la
aparienciadelobjetoensnoes
importanteyslointeresanlos
valoresnumricosdesusmediciones.
Siseconsideraas,loprimeroque
debiramosplantearnosalelegireltipodegrficosesculeslaestructuraque
queremosmostrardelosdatos.Porsupuestotenemosqueno"mentirconayuda
delaestadstica",perosiempreesadmisibleelegirunestilodepresentacin
realcelospatronesimportantesaleliminarodejarensegundoplanolasrelaciones
yestructurasquenonosinteresan.
Sinuestrosdatosconsistenensolamenteunaspocasmediciones,esposible
mostrarlostodoscomoundiagramadedispersin.Podemosexhibirlosvalores
dedosvariablessobrelosejesdeabscisasyordenadas,yadicionalmenteunascuantasvariablesmsutilizandolos
coloresoformasdelospuntos.Eneldiagramadeladerecha,lavariableztienedosvaloresqueseindican
respectivamenteporuncuadradoyunsigno+.
Silavariacinesdemasiadopequeaparaqueaparezcaclaramente,podemosdarlenfasiseliminandopartesdeuna
oambasescalas,vanselosejemplos.Simplementeeliminamoslapartequenonosinteresa,seaporlaparte
superioroporlainferior.Lapartedescartadadebeestarvacadevaloresmedidosempricamente.Paraasegurarnos
queellectorsedacuentadelaoperacin,esmejormostrarlonosloenlasescalas,sinotambinenlacuadrculade
fondodeldiagrama.
Porotrolado,sielrangodevariacindenuestrosdatosesmuyamplio,podemosplantearnosusarunaescala
logartmicaenunooambosejes(vaseeldiagramadelaizquierda).Laescalalogartmicaesapropiadasolamente
enunaescaladeproporcin.
Sitenemoscientosdemediciones,esprobablequenoqueramosmostrarlastodasenformadediagramade
dispersin.Unaposibilidadenestecasoesclasificarloscasosypresentarloscomounhistograma.

Elhistogramapuedeadaptarseparapresentarhastacuatroocinco
variables.Podemoshacerestovariandolasanchurasdelascolumnas,
suscolores,sustramadosyporunarepresentacintridimensional
(fig.delaizquierda.).Todasestasvariacionessecreanfcilmente
conunprogramadehojadeclculocomoExcel,peronodebenser
usadasslocomoadorno.
Lospatronesquerellenanomarcanlascolumnasdelhistograma
puedenserelegidosdeformaquesimbolicenunadelasvariables.
Porejemplo,lascolumnasquedescribenelnmerodeautomviles
puedenestarformadasporunapiladeautomvilesunossobreotros.
Estoescorrecto,contaldequenovariemoseltamaodelossmbolosusadosenunhistograma.Deotromodo,la
interpretacinseleharadifcilallector(sevinculaelnmerodeautomvilesalalongitud,elreaoelvolumende
lossmbolosdelosautomviles?)
Elinvestigadorsueleestarinteresadoenlasrelacionesdedosomsvariablesantesqueenlasparejasde
medicionestomadasseparadamente.Laformanormaldepresentardosomsvariablesinterdependientesesla
curva.Estoimplicaunavariablecontinua(esdecir,enqueelnmerodeposiblesvaloresesinfinito).
Nodebemosproducirunacurvaapartirdemedicionesquenosonvaloresdelamismavariable.Porejemplo,los
atributosdeunobjetosonvariablesdiferentes.Ejemplosdeellosonlasevaluacionespersonalesquelos
investigadoressuelenreunirconlaayudadeescalassemnticasdiferencialesdeltipodelamostradaabajo:
Estimelascaractersticasdesudormitorio.
Tacheunrecuadroencadalnea.
Claro _ _ _ _ _ _ _ Oscuro
Ruidoso _ _ _ _ _ _ _ Tranquilo
Limpio _ _ _ _ _ _ _ Sucio
Grande _ _ _ _ _ _ _ Pequeo
Careceraahoradesentidoelpresentarlasdistintasevaluacionesdeldormitorio
comounsolo"perfil"comoeneldiagramadelaizquierda(aunqueencontremos
confrecuenciaestetipodepresentacionesilgicaseninformesdeinvestigacin.)
Siqueremosatodacostaponerelacentoenquelasvariableshandeirjuntas(por
ejemploporquetodassonevaluacionesdelmismoobjeto),unmtodoapropiado
podraser,porejemplo,ungrupodehistogramas(comoeldeladerecha).
Todoslosdiagramasmostradosarribapueden
combinarseconmapasyotraspresentaciones
topolgicas.Porejemplo,lavariacinenlas
diferentesreasdelpassuelemostrarsecomoun
cartogramaquedistingalosdiferentesdistritoscondistintoscoloresotramas.
Otraformaeselcartopictogramaenquepequeosdiagramasdesectores("detarta"o"queso")odecolumnashan
sidocolocadosenelmapa.Lasconexionesentredistintasreassueleserconfrecuenciamostradasconfilascuyo
grosorindicaelnmerodeconexiones.(Ejemplo.)
Unaobratilyconcisaenespaolsobreelusodediagramasparaanlisisestadsticoes:AntonioAlaminos,
Grficos,Madrid,CentrodeInvestigacionesSociolgicas,1993(Col.Cuadernosmetodolgicos,n7)

Contingenciaycorrelacin
Lacovarianzaestadsticaentredosvariablessueleseranalizadahaciendounatablaounapresentacingrfica,pero
tambinhaydisponiblesestadsticasespecialesparaindicarsuintensidad.Losmediosdisponiblesparaelanlisisde
losvnculosentrelasvariablesdependendeconqutipodeescalasehanmedidolasvariables.Vealatablaquese

presentanterior.
Cocientedecontingenciapuedeaplicarseatodotipodevariablesincluyendoaquellasquesehanmedido
soloconunaescaladeclasificacin.UnaestadsticaalternativaesChicuadrado.
Correlacinordinalesadecuadacuandoalmenosunadelasvariablessehanmedidoconunaescalaordinal.
Laotrapuedeseruordinaloaritmtica.
Paravariablessobreescalasaritmticas,elmtodousualeslacorrelacinestndar,mejordichola
correlacindelmomentoproductoocorrelacindePearson.
Lasformulasparacalcularlasestadsticasdecontingencianosemuestranaquporquellevaracabolosclculos
manualmenteserapocoprcticoylosinvestigadoreshabitualmenteloshacenconunordenador.
Lacorrelacindelmomentoproductosueleabreviarseconlaletrar.Sielcoeficientedecorrelacinesbajo,por
ejemploalgoentre0.3y+0.3,lasdosvariablesnotienenmuchoqueverentres(msexactamente,notienencasi
ningunacovariacinlineal).Siesalto,enotraspalabras,sisuvalorseaproximayaseaa+1oa1,estosignifica
quelarelacinentrelasdosvariablesseaproximaalaecuaciny=ax+b.Elsignodelcoeficientedecorrelacin
noesimportanteelsignosiempreesidnticoalsignodelcoeficienteaenlaecuacindearriba.
Debajo,sepuedevertresdiagramasdedispersinquedemuestrentresconjuntosdiferentesdedatosdedos
variables.Cadaconjuntoconsisteenochoparesdevalores.Lascorrelacionesentrelasdosvariablessehan
calculadoysedemuestranbajocadadiagrama.Sepuedeverquenohaycorrelacinentrelasvariablesenel
conjuntoenlaizquierda,ylosotrosdosconjuntosdemuestranlascorrelacionesde0,5y1,0.

Apesardelhechoqueelanlisisdecorrelacinescapazdemanejarsolamentedosvariables,puedeutilizarloparael
anlisisinicialdeungrannmerodevariables,cuandonotenemosunaideaclaradelasrelacionesmutuasentre
ellas.Esfcilparaunordenadorcalcularunamatrizdecorrelacinentretodoslosparespotencialesdevariables.
Podemosentonceselegiresosparesquepresentanlascorrelacionesmsfuertes,ycontinuarexaminandoloscon
otrasherramientasdeanlisismsrefinadas.
Unaspectodbildelanlisisdecorrelacinesquenopuededetectarotrasrelacioneslinealesentrelasvariables.Por
ejemplo,unarelacinqueobedecealaecuaciny=ax2pasarainadvertida.Sinembargo,algunosdelosnuevos
programasdeanlisissoncapacesdedetectarinclusoestayalgunasotrasasociacioneshabitualesdevariables.
Adems,sepuedeintentar:
sustituirlosvaloresdeunavariableconsusvalorescuadrados,surazcuadradaoconalgunaotra
modificacin,yhacerdenuevolamatrizdecorrelacin.Lacomputadoratomaelcuidadodelclculo.
hacerundiagramadedispersindelasdosvariablesqueustedpiensaquizstengaunarelacin,ymirarsiel
patrnresultantesigueunaformadecualquierfuncinmatemticaapropiada.
Unavezqueustedhayaencontradounpardevariablesconunacorrelacinocontingenciafuerteustedpuede
continuar,porejemplo,conlasoperacionessiguientes:
Considere,enbasedesuteora,culvariabledelparesindependiente(esdecirlarazn)yculesel
dependiente(laconsecuencia),ysilarelacinpuedeimplicartodavamsvariables.
Descubraelpatrnexactodelarelacin.Losmtodosposiblesparaestoincluyenlosanlisisdeserie
temporalyderegresin.
Silacorrelacinsecalculaapartirdeunamuestra,debemosrecordarprobarsurepresentatividadestadsticaconla

pruebat.

Anlisisderegresin
Elinvestigadorsueletenerrazonestericasoprcticasparacreerquedeterminadavariableescausalmente
dependientedeunaomsvariablesdistintas.Sihaybastantesdatosempricossobreestasvariables,elanlisisde
regresinclasicoo"multivariate"esunmtodoapropiadoparadesvelarelpatrnexactodeestaasociacin.
Elanlisisdelaregresinencuentralaecuacinlinearquesedesvalo
menosposibledelasobservacionesempricas.Porejemplo,eneldiagramaa
laderecha,lospuntossimbolizanlasobservacionesdondesehanmedidodos
variables,ylalnearepresentalaecuaciny=8x+45,obtenidoconanlisis
delaregresindemodoquelasumadelasdiferenciascuadradasdelos
valoresmedidosdeyllegueasermnima.
Elesquemacontieneslocuatroobservaciones.Esdemasiadopocopara
producirunaecuacinplausibleporquelasobservacionespodranserel
resultadodecoincidenciaslo,sinningunadependenciaverdaderaentrelas
variables.Siustedquierehallazgosplausibleso"estadsticamente
significativos"senecesitaramuchoms,quizs40observaciones
multiplicadosporelnmerodelasvariablesindependientes.
Elalgoritmodeanlisisderegresinconstruyeunaecuacin,quetieneelsiguientepatrnconunaomsvariables
independientes.Adems,dalosparmetrosa1,a2etc.ybvalorestalesquelaecuacincorrespondealosvalores
empricoscontantaprecisincomoesposible.
y=a1x1+a2x2+a3x3+...+b
Enlaecuacin,
y=lavariabledependiente
x1,x2etc.=variablesindependientes
a1,a2etc.=parmetros
b=constante.
Unadesventajadelalgoritmodelanlisisderegresinesquepuedediscernirrelacionesslolinealesentrelas
variables.Asnopuedemanejartalesformatosusualesdeecuacincomoy=ax2+bx+c.Estadificultad,sin
embargo,puedeserevitadoporreemplazartemporalmentelavariablenolinealconunatransformacinconveniente
deello,talcomosucuadrado,razcuadrada,elinverso,ologaritmo.
Sitenemosampliosdatosconmuchasvariables,alprincipiodelanlisisnoestaremostalvezsegurosdequ
variablesestnmutuamenteconectadasycualesdebieranasserincluidasenlaecuacin.Podramosprimero
estudiarestoconunamatrizdecorrelacin,opodemosdejaralprogramadeanlisisderegresinelegirlasvariables
"correctas"(x1,x2etc.)paralaecuacin."Correctas"sonaquellasvariablesquemejoranlaexactituddelajuste
entrelaecuacinylosvaloresempricos.
Cuandounadelasvariablesindependientesestiempo,yespecialmentecuandotenemosunaseriedetiempode
medidasenintervalosiguales,elanlisisderegresinesunaherramientaconvenientepararevelarunatendenciao
undesarrolloalargoplazoenunaseriedetiempo,consideraestudiohistrico.Estatendenciasepuedeamenudo
utilizarparapronosticareldesarrollofuturodelavariabledependiente.
Enelanlisisclsicodelaregresinlaecuacindeseadacontienesolamenteunavariabledependiente.Enelcaso
quemsqueunovariabledependienteseparecenserimplicadas,unaherramientaconvenienteparasuanlisisesla
correlacincannica,nodiscutidaaqu.

Finalmente,laherramientacorrectaparacalcularlarepresentatividadestadsticadelaecuacinobtenidaporla
anlisisderegresinestlapruebat.

Anlisisfactorial
Todaslaspreguntasenuncuestionariosepuedenconsiderarcomovariables,losvaloresdelascualesson
encontradosestudiandolasrespuestasquecadapreguntarecibe.Generalmentelamayorpartedelaspreguntas
conciernenmsomenoselmismotema,yesporlotantonormalquealgunasdeestasvariablesresultanteneruna
altacorrelacinmutua.Elinvestigadorahorapudodeseardescubrirsihay"variablesdefondo"olosfactores
latentesquecombinanalgunasvariablesoriginales.Sisepodraencontrarestasvariablesdelfondo,losdatos
contenidosenloscuestionariosserancomprimidosgrandementeyllegaranasermsfcilesdecomprender.El
anlisisfactorialeselmtodonormaldeencontrarestasvariableslatentes.
Porejemplo,enunestudioacercadelaropadegentefinlandesajoven,SinikkaRuohonen(2001,p.97)examin
conuncuestionariolasactividadesdelociodelosrespondedores,ydescubriquehabaunaaltacorrelacinentre
pasartiempoenconciertos,engalerasdearte,enteatrosyenbibliotecasytambinenlecturadelibros.Todosstos
tenanunacorrelacinnegativaconmirarlatelevisinolascompeticinesdeportivas.Ruohonendioelnombrede
"factorcultural"aestofactor.lseasociademsconeducacinaltademadreypadre,yconindependenciadelas
opinionesdeotrosalcomprarropas.
OtrofactorqueRuohonenencontrynombr"estticosocial",incluyobjetivosdeseleccionarropas:destacarsus
buenosobelleza,retratarconfianzaensmismoypersonalidad,llamaratencin,demostrarcamaradera,valores
comuneseideologas.Estefactorcorrelaciontambin,enpocogrado,conintersenlaecologa,consehacerla
ropaporunamisma,ynollevarpieles.
Untercerfactor,"gastar"contuvovariosindicadoresdegastardinerocomprandolaropa,loscosmticosylasjoyas,
tanbiencomoelapreciodelestilo,delacalidadydelamoda.
Conlaayudadeunanlisisfactorial,lasvariablesdecombinacinofactoreslatentestraslosatributosmedidos
puedendetectarseyespecificarse,yelanlisistambindiceloestrechamentequeestosfactoresestnvinculados
conlasvariablesoriginalmenteverificadas.Avecessesitatambinunacondicinsuplementariasobrelos
factores,concretamentequenodebentenercorrelacinalgunaentreellosyestnporlotantoen"ngulorecto"uno
conrespectoaotro(="rotacinortogonal"delosfactoresduranteelanlisis).Estaopcin,noobstante,suele
disminuirlacorrelacinconlasvariablesoriginales.
Uninconvenientedelmtododelanlisisfactorialesquesuusoformalmentecorrectoperodesconsideradopuede
producirfcilmentelosfactoreselegantesymatemticamenteexactosquesinembargonotienenningnsignificado
empricosensato.Enelestudiocitadoarriba,Ruohonenevitestecallejnsinsalidaconelmediodeentrevistar
algunosrespondedoresdesdeunauotraextremidaddeunfactor,loscualeserancapacesclarificarsusactitudesy
estilosdevidaydarelmotivoparasusopinionesquedifierendelpromedio.
Esposiblecontinuarelanlisisfactorialagrupandolosrespondedores(uotroscasosempricos)engruposenbasede
susvaloresenlosfactoresqueseencontraronenelanlisis.Estaoperacinsufredelamismainconvenienciaque
arriba:esdifcildarunaexplicacinempricaaestosgruposartificialesyencontrarcualquierrastrodesuexistencia
verdaderaenempiria.Adems,ladispersindecasosalolargodecadafactorsiguecasisiempreladistribucin
normaldeGauss,quesignificaquelamayoradecasosestncercadelpuntomedioyelinvestigadornopuede
encontrarningunadivisindistintaengrupos.Estatrampadelinvestigadorsediscutetambinenlapgina
Clasificacin.

3.ago.2007.Enviarloscomentariosalautor:

Versinenespaol:
conaumentosporPenttiRoutio

Ubicacinoriginal:http://www2.uiah.fi/projects/metodi/

Vous aimerez peut-être aussi