Vous êtes sur la page 1sur 14

 

Un  Paradigma  para  Desarrollar  Mejores  Medidas  de  Constructos  de  Marketing  


Autor(es):  Gilbert  A.  Churchill,  Jr.  
Fuente:  Journal  of  Marketing  Research,  Vol.  16,  No.  1  (Feb.,  1979),  pp.  64-­‐73  
Publicado  por:American  Marketing  Association  
URL  Estable:  http://www.jstor.org/stable/3150876  
Fecha  de  acceso:  12/07/2013  10:02  
 
 
El   uso   del   archivo   JSTOR   indica   que   se   aceptan   los   Términos   y   Condiciones   de   uso,   disponibles   en  
http://www.jstor.org/page/info/about/policies/terms.jsp  
 
JSTOR   es   un   servicio   sin   fines   de   lucro   que   ayuda   a   docentes,   investigadores   y     estudiantes   a   descubrir,   utilizar   y  
construir   con   base   en   una   amplia   variedad   de   contenido   en   un   archivo   digital   confiable.   Utilizamos   tecnología   y  
herramientas  informáticas  para  aumentar  la  productividad  y    facilitar  nuevas  formas  de  becas.  Para  mayor  información    
acerca  de  JSTOR,    por  favor  contáctese  consupport@jstor.org.  

La  Asociación  Americana  de  Marketing  colabora  con  JSTOR  para  d igitalizar,  preservar  y  
ampliar  el  acceso  a  la  revista  Journal  of  Marketing  Research.  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
Medición  y  Estudio  de  la  Validez  de  Constructo    

   
GILBERT  A.  CHURCHILL,  JR.*  
  sigla  en  inglés)  señalan  que:  “Ningún  artículo  en  la  revista  Journal  
          Un  elemento  crítico  en  la  evolución   d e  un  cuerpo  fundamental  de  conocimiento  en  marketing,  
of  Marketing  Research  escrito  por  el  Editor  o  el  Vicepresidente  de  
 
        así  como    para  mejorar  la  práctica  d e  mpublicaciones  
arketing,  es  esl  erá  
desarrollo   de  mejores  medidas  de  las  variables  con  
publicado.”  
          las  que  trabajan  los  marketeros.  En  este     artículo  s e   d escribe   u n  e nfoque  por  el  cual  se  puede      
      lograr  este  objetivo,  y  partes  de  este  enfoque    se  ilustran  en  términos  de  una  medición  de  la   satisfacción  laboral.  
   
Un  
  Paradigma  para  Desarrollar  Mejores     Medidas  de  Constructos  de  
 
 
Marketing    
   
   
   
 
 
 
En   un   artículo   publicado   en   la   edición   de   abril   de  
La   inclusión   de   este   artículo   fue   aprobada   por   la   Comisión   de  
1978   en   la   revista   Journal   of   Marketing,   Jacoby   atribuyó   Directores   debido   a:   (1)   el   artículo   fue   enviado   antes   de   que   el  
gran   parte   de   la   culpa   de   la   mala   calidad   de   algunas   obras   autor   asumiera   como   Editor,   (2)   el   autor   no   formó   parte   en   la  
bibliográficas   en   marketing   que   hablan   sobre   las   medidas   revisión  del  artículo,  (3)  Michael  Ray,  quien  supervisó  el  proceso  de  
que   los   marketeros   utilizan   para   evaluar   sus   variables   de   revisión   para   la   edición   especial,   solicitó   formalmente   que   se   le  
interés  (p.  91):     permitiera  publicarlo.  
  _____________________________________________  
Más   insólito   que   el   gran   número   de   nuestras    
medidas  es  la  facilidad  con  la  que  se  proponen  y  la   Burleigh   Gardner,   Presidente   de   Social   Research,   Inc.,   hace  
manera   acrítica   en   la   que   se   aceptan.   De   hecho,   la   una   observación   similar   con   respecto   a   la   medición   dela  
mayoría   de   nuestras   mediciones   recibe   ese   actitud   en   un   número   reciente   de   la   revista     Marketing  
apelativo  porque  alguien  dice  que  lo  son,  no  porque   News  (5  de  mayo,  1978,  p.  1):  
hayan   demostrado   la   satisfacción   de   criterios   de    
medición   estándar   (validez,   fiabilidad   y   Hoy   en   día,   los   cientistas   sociales   están   enamorados   de  
sensibilidad).  Dicho  en  otras  palabras,  la  mayoría  de   los   números   y   las   cuentas…   Rara   vez   se   detienen   para  
nuestras   medidas   no   son   más   sofisticadas   que   las   cuestionarse  lo  siguiente    “¿Qué  se  esconde  detrás  de  los  
primeras,   asegurando   que   el   número   de   piedras   números?”  
 
que   una   persona   puede   contar   en   un   periodo   de  
Cuando   hablamos   de   actitudes,   hablamos   de  
diez   minutos   es   una   medición   de   la   inteligencia   de  
construcciones   mentales,   ya   que   se   expresan   en  
esa   persona;   después,     se   debe   llevar   a   cabo   un   respuesta  a  nuestras  preguntas.  
estudio  para  descubrir  que  las  personas  que  pueden    
contar   muchas   piedras   en   diez   minutos   también   Sin   embargo,   por   lo   general,   todo   lo   que   realmente  
tienden   a   comer   más;   y,   finalmente,   concluir   a   sabemos  son  las  preguntas  que  hacemos  y  las  respuestas  
partir   de   esto   que:   las   personas   con   más   que  obtenemos.  
inteligencia  tienden  a  comer  más.      
__________________________________________   De   hecho,   los   marketeros   parecen   estar  
    *GilbertA.   Churchill   es   un   Profesor   de   Marketing   en   la   ahogándose   con   sus   medidas,   como   lo   atestiguan   otros  
Universidad   de   Wisconsin-­‐Madison.   Las   contribuciones   artículos  que  se  refieren  a  este  mismo  asunto.          Pareciera  
importantes   de   Michael   Houston,   Shelby   Hunt,   John   Nevin,   y   que   ellos   invierten   mayor   esfuerzo   y   tiempo   de  
Michael   Rothschild   a   través   de   sus   comentarios   sobre   el   borrador   funcionamiento   en   la   rutina   GIGO   (por   su   sigla   en   inglés)-­‐  
de   este   artículo   son   en   gran   medida   reconocidas,   al   igual   que   los  
basura   dentro,   basura   a   fuera,   como   lo   consignan   los  
comentarios  más  útiles  de  los  revisores  anónimos.  Las    políticas  de  
64   técnicos   informáticos.   Como   Jacoby   afirma   tan  
publicaciones   la   American   Marketing   Association   (AMA,   por   su  
sucintamente  “¿Qué  pasa  si  un  hallazgo  es  significativo  o  si  
Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
se  ha  aplicado  lo  último  en  técnicas  de  análisis  estadístico,  si     65  
el   instrumento   de   recolección   de   información   generó   EL  PROBLEMA  Y  EL  ENFOQUE  
información  no  válida  desde  el  principio?  (1978,  p.  90).      
          ¿Cómo   se   explica   esta   brecha   entre   la   evidente            
Técnicamente,   el   proceso   de   medición   u  
necesidad   de   mejores   medidas   y   la   falta   de   este   tipo   de   operacionalización  involucra  “reglas  para  asignar  números  a  
medidas?   La   tesis   básica   de   este   artículo   es   que   aunque     objetos   para   representar   cantidades   de   atributos”  
exista   el   deseo,   es   posible   que   el   procedimiento   no   esté   (Nunnally,   1967,   p.   2).   La   definición   requiere   de   dos  
presente.  La  situación  en  marketing  pareciera  ser  paralela  a   nociones   clave.   La   primera,   corresponde   a   los   atributos   de  
la   del   dilema   que   enfrentaron   los   psicólogos   hace   más   de   20   los   objetos   que   se   miden   y   no   a   los   objetos   mismos.   La  
años,  cuando  Tryon  (1957,  p.  229)  escribió:     segunda   noción,   corresponde   a   que   la   definición   no  
  especifica   las   reglas   por   las   cuales   se   asignan   los   números.  
Si   un   investigador   inventara   una   prueba   psicológica   Sin  embargo,  el  rigor  con  el  cual  se  especifican  las  reglas  y  la  
nueva   y   luego   se   volviera   a   cualquier   trabajo   académico  
habilidad  con  la  que  se  aplica,  determina  si  el  constructo  ha  
reciente   para   orientarse   sobre   cómo   determinar   su  
sido  capturado  por  la  medida.  
fiabilidad,   se   enfrentaría   a   una   gran   variedad   de  
formulaciones   diferentes   que   estaría   inseguro   de   cómo  
       Considere   algún   constructo   arbitrario,   C,   tal   como  
proceder.   Después   de   cincuenta   años   de   pruebas   la   satisfacción   del   cliente.   Se   puede   concebir   en   un  
psicológicas,  aún  existe  confusión  en  la  problemática  para   momento   determinado     que   cada   cliente   tenga   un   nivel   de    
descubrir   hasta   qué   punto   una   medición   objetiva   de   satisfacción   “verdadero”;   llame   esto   nivel   XT.   Con   suerte,  
conducta  diferencia  a  los  individuos  de  forma  confiable.   una   vez   que   se   realice   cada   medición,   se   producirá   un  
  porcentaje  observado,  Xo,  igual  al  porcentaje  verdadero  del  
         La   psicología   ha   avanzado   desde   entonces   y   la   objeto,   XT.   Además,   si   existen   diferencias   entre   los   objetos  
atención   se   ha   movido   más   allá   de   preguntas   simples   de   con   respecto   a   sus   puntuaciones   Xo,   estas   diferencias   se  
fiabilidad   y   ahora   incluye   más   evaluaciones   “directas”   de   podrían   atribuir   por   completo   a   diferencias   verdaderas   en  
validez.   Desafortunadamente,   la   bibliografía   sobre   las   características   que   se   tratan   de   medir,   por   ejemplo,  
marketing   ha   tenido   un   desarrollo   más   lento   para   reflejar   diferencias   verdaderas   en   XT.   En   pocas   ocasiones,   el  
ese  progreso.  Una  de  las  razones  más  importantes  es  que  la   investigador   tiene   suerte.   Mucho   más   típica   es   la   medición  
bibliografía  sobre  psicología  es  dispersa.  Las  nociones  están   donde   el   porcentaje   de   diferencias   X0   también   se   refleja  
disponibles   por   pinceladas   en   una   variedad   de   fuentes.   No   (Selltiz  et  al.,  1976,  p.  164-­‐8):    
existe   un   marco   principal   que   el   marketero   puede   adoptar    
para   ayudar   a   organizar   la   variedad   de   definiciones   y   1.-­‐   Las   diferencias   verdaderas   en   otras   características  
medidas  de  fiabilidad  y  validez  en  un  todo  integrado,  por  lo   relativamente   estables,     las   que   afectan   el   porcentaje,  
que   la   decisión   sobre   qué   utilizar   y   cuándo   utilizarlo   es   por  ejemplo,    los  deseos  de  una  persona  de  expresar  sus  
obvia.     sentimientos  verdaderos.  
2.-­‐   Diferencias   debido   a   factores   personales  
       Este  artículo  es  un  intento  de  entregar  un  marco  de  
trascendentes,   por   ejemplo,   el   estado   de   ánimo   de   una  
este   tipo.   Se   sugiere   un   procedimiento   mediante   el   cual   se  
persona,  estado  de  fatiga.  
puedan   desarrollar   medidas   de   constructos   de   interés   para   3.-­‐   Diferencias   debido   a   factores   situacionales,   por  
los   marketeros.   El   énfasis   está   en   desarrollar   mediciones   ejemplo,   si   la   entrevista   se   lleva   a   cabo   en   la   casa   o   en  
que   tengan   propiedades   deseables   de   fiabilidad   y   validez.   una  dependencia  central.  
Parte   de   este   artículo   está   dedicado   a   clarificar   estos   4.-­‐   Diferencias   debido   a   variaciones   en   administración,  
conceptos,    particularmente  los  relacionados  con  la  validez;   por   ejemplo,   entrevistadores   que   realizan   diferentes  
las   nociones   de   fiabilidad   están   bien   documentadas   por   el   sondeos.  
artículo  de  Peter  que  se  refiere  a  este  tema.  Finalmente,  el   5.-­‐    Diferencias  debido  al  muestreo  de  ítems,  por  ejemplo,  
los   ítems   específicos   utilizados   en   el   cuestionario;   si   los  
artículo  contiene  sugerencias  sobre  los  enfoques  en  los  que  
ítems  o  las  palabras  de  aquellos  ítems  fueron  cambiados,  
los  marketeros  históricamente  han  confiado  para  evaluar  la  
el  porcentaje  X0  también  cambiaría.  
calidad   de   las   medidas:   sin   embargo,   sería   conveniente   6.-­‐   Diferencias   debido   a   la   falta   de   claridad   de   los  
considerar   el   abandono   en   favor   de   alternativas   más   instrumentos  de  medición,  por  ejemplo,  preguntas  vagas  
recientes.  Se  presenta  la  justificación  de  porqué  se  prefieren   o   ambiguas   interpretadas   de   diferente   forma   por   quienes  
alternativas  más  nuevas.     las  responden.  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
66  
7.-­‐  Diferencias  debido  a  factores  mecánicos,  por  ejemplo,     investigador   nunca   sabe   con   certeza   qué   son   las  
un   marcador   de   cheques   en   el   lugar   equivocado   o   una   puntuaciones  XT.  En  vez  de  eso,  las  mediciones  siempre  son  
repuesta  codificada  incorrectamente.   inferenciales.   La   calidad   de   estas   inferencias   depende  
  directamente   de   los   procedimientos     que   se   utilizan   para  
       No   todos   estos   factores   se   presentarán   en   cada   desarrollar   mediciones   y   la   evidencia   que   apoye   sus  
medición,   ni   se   limitan   a   la   información   recolectada   “bondades”.  Esta  evidencia  normalmente  toma  la  forma  de  
mediante   cuestionarios   presenciales   o   entrevistas   algún   índice   de   fiabilidad   o   validez,   de   las   cuales   hay  
telefónicas.  Estos  factores  surgen  en  estudios  en  los  que  se   muchas,  o  talvez  demasiadas.  
utilizan   cuestionarios   auto-­‐administrados   o   técnicas             El   analista   que   trabaja   para   desarrollar   una  
observacionales.   Aunque   el   impacto   de   cada   factor   en   el   medición  debe  sostenerse  mediante  nociones  tales  como  la  
porcentaje   de   X0   varía   con   el   enfoque,   sus   impactos   son   fiabilidad   de   dos   mitades,   test-­‐retest,   y   formas   alternas   de  
predecibles,   distorsionando   las   puntuaciones   observadas   fiabilidad   sí   como   con   la   apariencia,   contenido,  
lejos   de   las   puntuaciones   verdaderas.   Funcionalmente,   la   predictibilidad,   concurrencia,   pragmática,   constructo,  
relación  se  puede  expresar  como:   convergencia,   y   validez   discriminatoria.   Debido   a   que  
  algunos  de  estos  términos  se  utilizan  intercambiablemente  y  
XO=  XT  +  XS  +  XR     otros   suelen   usarse   libremente,   los   deseos   de   los   analistas  
  para   desarrollar   la   medición   de   una   variable   de   interés   en  
donde:   marketing   enfrenta   decisiones   difíciles   en   cuanto   a   cómo  
  proceder   y   qué   indica   la   fiabilidad   y   la   validez   al   ser  
XS     =   Fuentes   sistemáticas   de   error   tales   como   calculadas.  
características   estables   de   un   objeto   que   afecta   su   La  figura  1  es  un  diagrama  de  la  secuencia  de  pasos  
porcentaje  y     que  se  pueden  seguir  y  una  lista  de  algunos  cálculos  que  se  
XR   =   fuentes   aleatorias   de   error   tales   como   factores   pueden   llevar   a   cabo   en   el   desarrollo   de   mediciones   de  
personales   pasajeros   que   afectan   el   porcentaje   del  
constructos  de  marketing.    
objeto.  
 
Una  medición  es  válida  cuando  las  diferencias  en  las  
puntuaciones   observadas   reflejan   diferencias   verdaderas  
sólo   en   las   características   que   se   tratan   de   medir   y   nada  
más,   que   es     X0=XT.   Una   medición   es   fiable   hasta   el   punto  
que   las   mediciones   independientes,   pero   comparables   del  
mismo  rasgo  o  constructo  de  un  objeto  dado  concuerdan.  La  
fiabilidad   depende   en   el   modo   en   que   la   variación   de  
puntuaciones   se   atribuye   a   errores   aleatorios   o   de  
oportunidad.   Si   una   medición   es   perfectamente   confiable,  
XR=0.   Nótese   que   si   una   medición   es   válida,   es   confiable,  
pero   la   conversión   no   es   necesariamente   verdadera   ya   que  
el   porcentaje   observado   cuando   XR=0   podría   ser   igual   a   XT   +  
XS.   Así,   es   como   a   menudo   se   dice   que   la   fiabilidad   es   una  
condición   necesaria   pero   no   suficiente   para   la   validez.   La  
fiabilidad  solo  entrega  evidencias  negativas  de  la  validez  de  
la  medición.  Sin  embargo,    la  facilidad  con  la  cual  se  puede  
computar   ayuda   a   explicar   su   popularidad.   Fiabilidad   se  
suele   informar   más   sobre   la   fiabilidad   que   sobre   su  
evidencia,   la   cual   es   mucho   más   difícil   de   asegurar   pero   se    
relaciona  más  directamente  con  la  validez  de  la  medición.   La   secuencia   sugerida   ha   funcionado   bien   en  
       El  objetivo  fundamental  en  la  medición  es  producir   muchas   instancias   donde   se   producen   mediciones   con  
puntuaciones  X0  que  se  aproximen  a  puntuaciones  XT  de  la   propiedades  psicométricas  deseables  (véase  Churchill  et  al.,  
forma   más   cercana   posible.   Desafortunadamente,   el   1974,   por   un   ejemplo).   Algunos   lectores   estarán  
Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
67  

indudablemente   en   desacuerdo   con   el   proceso   sugerido   o   anunciar   que   hemos   realizado   una     “investigación   de  
con   la   omisión     de   su   coeficiente   de   fiabilidad   y   validez   calidad?”  
preferido.  La  siguiente  discusión,  detalla    ambos  pasos  y  su    
lógica,  muestra    que  algunas  de  estas  mediciones  deberían,   En   resumen,   los   marketers   se   benefician   mucho   mejor   con  
de   hecho,   realizarse   aparte   ya   que   existen   mejores   mediciones   multi-­‐ítem   que   de   ítems   simples   para   sus  
alternativas   o,   si   se   utilizan,   que   por   lo   menos   se   preparen   constructos   y   deberían   tomarse   el   tiempo   para  
con  las  evaluaciones  apropiadas  de  sus  deficiencias.   desarrollarlos.   Esta   conclusión   es   particularmente   cierta  
El   proceso   sugerido   solo   es   aplicable   a   mediciones   para   aquellos   que   investigan   las   relaciones   de  
multi-­‐ítem.  Esta  deficiencia  no  es  tan  seria  como  lo  parece.   comportamiento   de   una   perspectiva   fundamental   así   como  
Las   mediciones   multi-­‐ítem   son   las   más   recomendadas.   En   una   perspectiva   aplicada,   aunque   se   aplique   también   a   los  
primer  lugar,  los  ítems  individuales  normalmente  tienen  una   marketeros  en  ejercicio  profesional.  
unicidad   o   especificidad   considerable   en   cada   ítem   que    
tiende   a   tener   solo   una   correlación   baja   con   los   atributos   DOMINIO  ESPECÍFICO  DE  UN  CONSTRUCTO  
que   se   miden   y   también   a   relacionar     a   otros   atributos.   En    
segundo  lugar,  los  ítems  por  sí  solos  tienden  a  categorizar  a   El   primer   paso   en   el   procedimiento   sugerido   para  
las   personas   en   un   número   relativamente   pequeño   de   desarrollar   mejores   mediciones   requiere   especificar   el    
grupos.   Por   ejemplo,   una   escala   de   clasificación   de   siete   domino   del   constructo.   El   investigador   debe   ser   certero   al  
pasos   puede   distinguir   al   menos   entre   siete   niveles   de   un   delinear     lo   que   se   incluye   en   la   definición   y   lo   que   se  
atributo.   En   tercer   lugar,     los   ítems   individuales     excluye.   Hay   que   considerar,   por   ejemplo,   el   constructo   de  
normalmente   poseen   mediciones   de   error   considerables,   la   satisfacción   del   consumidor   o   cliente,   que   se   pone   en   el  
producen   respuestas   inválidas   en   el   sentido   que   la   misma   corazón   del   concepto   de   marketing.   A   pesar   que   es   una   idea  
posición   de   escala   tiene   escasas   posibilidades   para   revisar   central   en   el   pensamiento   moderno   del   marketing,   es  
en  administraciones  sucesivas  de  un  instrumento.   también   un   constructo   que   los   marketeros   no   han   medido  
En  total,  las  tres  dificultades  de  medición  se  pueden   con  exactitud.  
disminuir  con  mediciones  multi-­‐ítem:  (1)  se  pueden  obtener   Howard   y   Sheth   (1969,   p.145),   por   ejemplo,   definen  
puntuaciones   para   la   especificidad     de   ítems   cuando   se   la  satisfacción  del  consumidor  como:  
combinan   (2)   mediante   la   combinación   de   ítems,   se   puede    
hacer  distinciones  relativamente  buenas  entre  las  personas,   …el   estado   cognitivo   del   comprador   que   se   ve  
y  (3)  la  fiabilidad  tiende  a  aumentar  y  el  error  de  la  medición   recompensado   en   forma   adecuada   o   inadecuada   en   una  
situación   de   compra   por   el   sacrificio   que   ha  
disminuye  como  los  números  de  ítems    en  una  combinación  
experimentado.   La   adecuación   es   una   consecuencia   de  
aumentan.  
relacionar   la   verdadera   compra   pasada   y   la   experiencia  
 El  error  de  usar  mediciones  de  un  solo  ítem  se  ilustra  en  la   de  consumo  con  la  recompensa  que  se  esperaba  desde  la  
pregunta  propuesta  por  Jacoby  (1978,  p.  93):   marca   en   términos   de   este   potencial   anticipado   para  
  satisfacer   los   objetivos   entregados   por   una   clase   en  
¿Qué   tan   cómodos   nos   sentiríamos   al   basar   nuestra   particular  de  producto.  No  sólo  implica  la  recompensa  del  
evaluación   de   inteligencia   en   nuestra   respuesta   a   una   consumo  de  la  marca  pero  cualquier  recompensa  recibida  
sola   pregunta?   Aunque   eso   es   exactamente   lo   que   en  el  proceso  de  compra  o  consumo.    
hacemos   en   la   búsqueda   de   clientes…   Las   obras    
bibliográficas   revelan   cientos   de   instancias   en   las   cuales  
       Parece   ser   que   la   satisfacción   es   una   actitud.   Además,  
las   respuestas   a   solo   una   pregunta   son   suficientes   para  
para   medir   la   satisfacción,   parece   necesario   medir   ambas  
establecer  el  nivel  de  la  persona  en  la  variable  de  interés  
y   luego,   sirve   como   la   base   para   análisis   extensos   y  
expectativas  a  la  hora  de  comprar  y  las  reacciones  en  algún  
artículos  completos.   momento   después   de   la   compra.   Si   las   consecuencias  
…Dada  la  complejidad  de  nuestro  objetivo,  ¿qué  es  lo  que   verdaderas   igualan   o   exceden   las   consecuencias   esperadas,  
nos   hace   pensar   que   podemos   utilizar   respuestas   para   el   consumidor   está   satisfecho,   pero   si   las   consecuencias  
ítems   simples     (o   incluso   para   dos   o   tres   ítems)   como   verdaderas   no   cumplen   las   consecuencias   esperadas,   el  
mediciones   de   estos   conceptos,   para   luego   relacionar   consumidor  está  insatisfecho.  
estas   puntuaciones   a   un   huésped   de   otras   variables,   Sin   embargo,   ¿qué   expectaciones   y   consecuencias  
llegar   a   conclusiones   basadas   en   tales   investigaciones,   y  
deberían   intentar   evaluar   los   marketeros?   Ciertamente   se  
quisiera   ser   razonablemente   exhaustivo   en   la   lista   de  
Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
68  
características   de   productos   incluidos,   al   incorporar   tales   capturen    el  dominio  como  especificado.  Tales  técnicas  que  
facetas   como   el   costo,   la   durabilidad,   la   calidad,   el   son   normalmente   productivas   en   estudios   exploratorios,  
comportamiento   operativo,   y   las   características   estéticas   incluyen   búsqueda   bibliográfica,   sondeos   de   experiencias,  
(Czepeil   et   al.,   1974).   Pero,   ¿qué   sucede   con   la   reacción   de   muestras   estimuladoras   de   conocimiento,   y   generalmente  
los  compradores  con  respecto  a  la  asistencia  de  ventas  que   rinden  mayores  frutos  en  estos  casos.  (Selltiz  et  al.,  1976).  La  
recibieron   o   al   servicio   subsecuente   de   los   distribuidores   bibliografía   debería   indicar   cómo   se   ha   definido   la   variable  
independientes,   como   sería   necesario,     por   ejemplo,   anteriormente   y   cuántas   dimensiones   o   componentes   tiene.  
después   de   comprar   varios   electrodomésticos   pequeños?   La   búsqueda   de   formas   para   medir   la   satisfacción   del  
¿Qué   sucede   con   la   reacción   del   consumidor   a   las   consumidor  podría  incluir  folletos  de  los  productos,  artículos  
advertencias   siguientes   o   a   la   expansión   de   los   canales   de   en  revistas  y  periódicos  con  temática  comercial,  o  resultados  
distribución    en  los  cuales  está  disponible  el  producto?  ¿Qué   de   pruebas   de   productos   tales   como   las   publicadas   por  
sucede   con     la   disponibilidad   siguiente   de   alternativas   de   Consumer   Reports.   El   estudio   de   experiencia   no   es   una  
competencia   que   cubren   las   mismas   necesidades   o   la   muestra   de   probabilidad,   sino   que   una   muestra   de   la  
publicación   de   información   sobre   los   efectos   opinión   de   personas   que   pueden   ofrecer   algunas   ideas   y  
medioambientales   al   utilizar   ese   producto?   Para   detallar   puntos   de   vista   acerca   del     fenómeno.   Al   medir   la  
cuál   de   estos   factores   serían   incluidos   o   cómo   la   satisfacción   satisfacción   del   consumidor,   se   podría   incluir   discusiones  
del  consumidor  debe  ser  operativa  está  por  sobre  el  objetivo   con   (1)   personas   adecuadas   en   el   grupo   responsable   del  
de  este  artículo;  en  lugar  de  eso,  la  muestra  enfatiza    que  el   producto,   (2)   representantes   de   ventas,   (3)   distribuidores,  
investigador   deber   tener   certeza   para   especificar   la   (4)  consumidores,  (5)  expertos  en  investigación  de  mercado  
conceptualización   del   constructo   y   qué   se   incluye   en   el   o   publicidad,   así   como   (6)   personas   ajenas   al   área   que  
dominio  o  no.   tienen   una   experticia   especial   en   trabajos   académicos   en  
          Sin   embargo,   es   imperativo   que   los   investigadores   universidades   y   organizaciones   gubernamentales.   Los  
consulten   la   bibliografía   al   momento   de   conceptualizar   ejemplos   estimuladores   del   conocimiento   podrían  
constructos  y  especificar  sus  dominios.  Tal  vez,  si  sólo  unos   involucrar   una   comparación   de   productos   competidores   o  
pocos   lo   hubieran   hecho,   uno   de   los   problemas   una   examinación   detallada   de   algún   reclamo  
fundamentales   señalados   por   Kollat,   Engel,   y   Blackwell   particularmente   vehemente   en   cartas   no   solicitadas   con  
como   proceso   impar   en   la   de   investigación   de   consumo   respecto  al  rendimiento  del  producto.  Ejemplos  que  indican  
(específicamente,   la   utilización   de   definiciones   variadas   contrastes   fuertes   o   que   tienen   características   llamativas  
conocidas)   pudo   haberse   reducido   al   menos   (Kollat   et   al.,   serían  los  más  productivos.  
1970,  p.  328-­‐9).            Los   incidentes   críticos   y   grupos   focales   también   se  
Ciertas   definiciones   de   constructos   se   enfocan   más   pueden   utilizar   para   avanzar   a   la   etapa   de   generación   de  
que   nada   en   los   medios   más   que   en   los   finales   en   sí,   del   ítems.   Para   utilizar   la   técnica   de   incidentes   críticos,   se  
mismo   modo   el   uso   de   definiciones   diferentes   los   hace   pudieron   preparar   un   gran   número   de   escenarios   que  
difíciles   de   comparar   y   acumular   descubrimientos   y   así   describieron   situaciones   específicas   y   con   ello   consultar   a  
desarrollar   síntesis   acerca   de   lo   que   se   sabe.   Los   una   muestra   de   consumidores   experimentados   qué  
investigadores   deberían   tener   buenas   razones   para   comportamientos   específicos   (por   ejemplo,   cambios   de  
proponer   nuevas   mediciones   adicionales     dada   la   gran   producto,   manipulación   de   la   garantía)   podrían   crear   la  
disponibilidad    de  constructos  de  mayor  interés  y  deben  ser   satisfacción   o   insatisfacción   en   el   consumidor   (Flanagan,  
necesarias    aquellas  que  se  publican  para  entregar  lógicas.  El   1954;  Kerlinger,  1973,  p.536).  Los  escenarios  que  se  podrían  
investigador  debe  asegurarse  que  este  sea  el  caso  realizando   presentar  a  los  encuestados  de  forma  individual  u  8  a  10  de  
una  revisión  bibliográfica  a  conciencia  en  la  que  se  utilice  la   ellos  se  podrían  traer  en  un  grupo  focal  donde  los  escenarios  
variable  y  se  presente  un  estado  detallado  de  las  razones  y   se  pudieran  utilizar  para  desencadenar  discusiones  abiertas  
dé  evidencias  de  por  qué  la  nueva  medida  es  mejor.   entre   los   participantes,   aunque     se   pueden   ocupar     para  
  promover  el  discurso  sobre  el  tema  (Calder,  1997).  
GENERAR  MUESTRA  DE  ÍTEMS   El   énfasis   en   los   primeros   pasos   del   ítem   de  
  generación  podría  desarrollar  un  conjunto  de  ítems  los  que  
El   segundo   paso   en   el   procedimiento   para   pueden   intervenir   en   cada   una   de   las   dimensiones     del  
desarrollar   mejores   mediciones,   es   generar   ítems   que   constructo   en   cuestión.   Además,   es   posible   que   el  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
69  

investigador   quiera   incluir   ítems   con   formas   levemente           Algo  básico  para  el  modelo  de  muestra  de  dominio  
diferentes   en   el   significado,   ya   que   la   lista   original   será   es   el   concepto   de   una   matriz   infinitamente   extensa   que  
redefinida   para   producir   la   medición   final.   Los   muestra  todas  las  correlaciones  sobre  los  ítems  presentes  en  
investigadores   experimentados   pueden   dar   fe   que   las   el   dominio.   Ningún   ítem   por   si   sólo   es   adecuado   para  
aseveraciones   aparentemente   idénticas   producen   entregar   una   representación   perfecta   del   concepto,   ya   que  
respuestas   completamente   diferentes.   Mediante   la   se   puede   utilizar   una   sola   palabra   para   evaluar   las  
incorporación   de   matices   levemente   diferentes   de   diferencias   en   las   habilidades   gramaticales   de   un   sujeto   y  
significado   en   las   aseveraciones   de   la   serie   de   ítems,   el   ninguna  pregunta  per  se  puede  medir  la  inteligencia  de  una  
investigador  entrega  mejores  fundamentos  para  la  eventual   persona.   Sin   embargo,   se   puede   esperar   de     cada   ítem   que  
medida.     tenga   una   cierta   cantidad   de   distinción   o   especificidad  
        Cerca   del   fin   del   desarrollo   de   la   etapa   de   incluso  si  se  relaciona  con  el  concepto.  
aseveraciones,  el  enfoque  podría  convertirse  en  una  edición        La   correlación   promedio   en   esta   matriz  
de  ítem.  Cada  aseveración  se  revisaría  para  que  su  expresión   infinitamente   enorme,   r,   indica   la   extensión   que   algún  
sea   lo   más   precisa   posible.   Las   aseveraciones   de   doble   punto   central   común   de   cada   ítem   esté   presente   en   cada  
canalización   se   dividirían   en   dos   de   una   sola   idea,   y   si   se   ítem.   La   dispersión   de   correlaciones   de   acuerdo   al   promedio  
comprueba   como   una   aseveración   imposible,   ésta   se   indica   hasta   qué   punto   los   ítems   varían   al   compartir   el  
eliminaría  en  todo  su  conjunto.  Algunas  de  las  aseveraciones   punto   central   común.   Esta   aseveración   implica   que   la  
se   reformularían   para   dar   un   sentido   positivo,   y   otras   para   correlación   promedio   en   cada   columna   de   la   matriz  
que   tengan   un   sentido   negativo   con   el   fin   de   reducir   las   hipotética   sea   la   misma   y,   en   cambio,   la   correlación  
tendencias   de   decir   “yea”   o   “nay”   (formas   coloquiales   promedio   en   toda   la   matriz   (Ley,   1972,   p.   111;   Nunnally,  
inglesas  para  decir  "si"  o  "no").  La  atención  de  los  analistas   1967,  p.  175-­‐6).  Esto  es,  si  todos  los  ítems  en  una  medición  
se  dirigiría  en  reformular  aquellas  preguntas  que  contienen   se   trazan   desde   el   dominio   de   un   solo   constructo,   las  
una  respuesta    “socialmente  aceptada”  y  obvia.   respuestas   a   aquellos   ítems   deberían   estar   altamente  
Después   que   la   serie   de   ítems   se   edita   correlacionadas  entre  sí.    Por  otro  lado,  correlaciones  bajas  
cuidadosamente,   se   podría   esperar   a   una   reformulación   entre   ítems   indican   que   algunos   ítems   no   son   trazados    
importante  de  la  información  actual.  El  tipo  de  información   desde   el   dominio   apropiado     y   producen   error   y   no  
recolectada   dependería   del   tipo   de   escala   utilizada   para   confiabilidad.  
medir  el  constructo.    
  Coeficiente  Alfa  
PURIFICAR  LA  MUESTRA    
         La   medida   recomendada   de   la   consistencia   interna  
     Los   cálculos   que   se   llevan   a   cabo   al   purificar   una   de   un   conjunto   de   ítems   lo   entrega   el   coeficiente   alfa,   que  
medida  dependen  de  cierta  forma,  del  modelo  de  medición   es   el   resultado   directo   de   las   concepciones   del   modelo   de  
que   se   adopta.   El   modelo   defendible   más   lógico   es   el   dominio   de   la   muestra.   Véase   el   artículo   de   Peter   con  
modelo   de   muestras   dominadas   que   sostiene   que   el   respecto  a  este  tema  para  el  cálculo  del  coeficiente  alfa.    
propósito   de   cualquier   medición   en   particular   es   estimar   el          Absolutamente,   el   coeficiente   alfa   debería   ser   la  
porcentaje  que  se  obtendría  si  se  utilizaran  todos  los  ítems   primera   medición   que   se   debería   calcular   para   evaluar   la  
en   el   dominio   (Nunnally,   1967,   p.   175-­‐81).   El   puntaje   que   calidad  del  instrumento.  Esto  es  significativo  debido  a  que  la  
cualquier  sujeto    pudiera  obtener  sobre  todo  el  dominio  de   raíz   cuadrada   del   coeficiente   alfa     corresponde   a   la  
muestra  es  el  porcentaje  verdadero  de  la  persona,  XT.   correlación   estimada   de   la   prueba   de   ítem-­‐k   con  
        Sin   embargo,   en   la   práctica,     no   se   utilizan   todos   los   puntuaciones   sin   errores.   (Nunnally,   1967,   p.   191-­‐6).   De   este  
ítems  que  pudieran  ser  utilizados;  sino,    solo  una  muestra  de   modo,    un  coeficiente  alfa  bajo  indica  que  la  muestra  de  los  
ellos.   El     punto   en   que   se   correlaciona   la   muestra   de   ítems   ítems   presenta   la   captura   del   constructo   que   ha   motivado   la  
con   los   puntajes   verdaderos,   es   bueno.   Entonces,   de   medición  en  menor  grado.  En  cambio,  un  alfa  alto  indica  que  
acuerdo   al   modelo   de   muestra   dominante,   una   fuente   la   prueba   de   ítem-­‐k   correlaciona   de   buena   forma   con   las  
primaria  de  error  de  medición    es  la  muestra  inadecuada  del   puntuaciones  verdaderas.  
dominio  de  ítems  importantes.           Si   el   alfa   es   bajo,   ¿qué   deberían   hacer   los  
1
analistas?   Si   la   serie   de   ítems   es   lo   suficientemente   alta,  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
70  

este   resultado   sugiere   que   algunos   ítems   no   son   el   coeficiente   alfa   en   primer   lugar?   Es   casi   tan   fácil,   no   es  
compartidas   equitativamente   en   el   núcleo   común     y   se   arbitrario,  y  posee  una  connotación  práctica  importante.    
deberían   eliminar.   La   forma   más   fácil   de   encontrarlos   es    
calcular   la   correlación   de   cada   ítem   con   el   porcentaje   total   y   Análisis  del  factor  
marcar   estas   correlaciones   mediante   una   disminución   del    
orden   de   magnitud.   Los   ítems   con   correlaciones   cercanas   a             Algunos   analistas   prefieren   desarrollar   un   análisis  
cero   se   eliminarían.   Además,   los   ítems   que   producen   una   del  factor  con  base  en  la  información  antes  que  todo  con  la  
caída    sustancial  o  repentina  en  las  correlaciones  de  ítem-­‐to-­‐ esperanza   de   determinar   el   número   de   dimensiones     que  
total  también  se  eliminarían.   subrayan   el   constructo.   De   hecho,   el   análisis   del   factor   se  
________   puede   utilizar   para   sugerir   dimensiones,   y   la   bibliografía  
               1Lo   que   se   considera   “bajo”   para   alfa   depende   del   propósito   sobre   marketing   está   repleta   de   artículos   relacionados   con  
del   investigador.   Para   las   primeras   etapas   de   investigaciones   tal  uso.  Mucho  menos  prevalente  es  su  uso  para  confirmar  o  
básicas,   Nunnally   (1967)   sugiere   que   las   confiabilidades   de   0,50   a   refutar   componentes   aislados   por   otros   medios.   Por  
0,60   son   suficientes   y   que   la   confiabilidad   que   aumenta   bajo   0,80   ejemplo,   mediante   la   discusión   una   prueba   compuesta   de  
probablemente   sea   una   pérdida.   En   muchas   configuraciones  
ítems   en   donde   intervienen   dos   factores   comunes,   la   fluidez  
aplicadas;  sin  embargo,  donde  se  toman  decisiones  importantes  en  
verbal   y   la   facilidad   para   los   números,   Campbell   (1976,   p.  
relación   a   las   puntuaciones   específicas   de   pruebas,   “una  
confiabilidad   de   0,90   corresponde     al   mínimo   que   se   debería  
194)  comenta:  
tolerar,   y   que   la   confiabilidad   de   0,95   se   debería   considerar   el    
estándar  deseado"  (p.  226).   El  reconocimiento  de  la  multidimensionalidad  cuando  se  
ve  no  siempre  es  una  tarea  fácil.  Por  ejemplo,    las  reglas  
 
para   el   momento   de   detener   la   extracción   de   factores  
         
Si  el  constructo  tuviera,  digamos,  cinco  dimensiones  
siempre   son   arbitrarias   en   cierto   sentido.   Tal   vez,     la  
o   componentes   identificables,   el   coeficiente   alfa   se   podría   solución   más   sabia   es   comparar   siempre   entre   las   dos  
calcular   para   cada   dimensión.   Además,   las   correlaciones   mitades   y   la   consistencia   interna   estimada   luego   de   la  
entre   ítem   y   total   utilizadas   para   eliminar   ítems,   se   basarían   primera   división   de   los   componentes   en   las   dos   mitades  
en   los   ítems   en   el   componente   y   el   porcentaje   total     para   en   campos   prioritarios.   Esto   es,   cada   esfuerzo   se   debe  
esa  dimensión.  El  porcentaje  total    para  el  constructo  estaría   realizar   para   equilibrar   el   factor   que   contiene     cada   mitad  
asegurado   al   sumar   las   puntuaciones   totales   para   los   (parte)   antes   de   mirar   los   componentes  
componentes   por   separado.   La   fiabilidad   del   constructo   intercorrelacionales.  

total  no  se  mediría    a  través  del  coeficiente  alfa,  sino  que  a   -­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐-­‐  
través   de   la   fórmula   para   la   fiabilidad   de   combinaciones  
lineales  (Nunnally,  1967,  p.  226-­‐35).  
         Algunos   analistas   calculan   erradamente   la  
fiabilidad   de   dos   mitades   para   evaluar   la   homogeneidad  
interna   de   la   medición.   Esto   es,   dividen   la   muestra   en   dos  
mitades.  Por  ejemplo,  la  primera  mitad  se  puede  componer  
 
de   todos   los   ítems   enumerados   equitativamente;   y   la  
 
segunda   mitad,   de   todos   los   ítems   enumerados   impar.  
     Cuando  el  análisis  de  factores  ha  concluido,  antes  
Luego,   el   analista   calcula     un   porcentaje   total   para   cada  
de   los   pasos   de   purificación   sugeridos   anteriormente,  
mitad  y  correlaciona  estas  puntuaciones  totales  a  través  de  
pareciera   haber   una   tendencia   a   producir   muchas   más  
los  sujetos.  El  problema  con  este  enfoque  es  que  le  tamaño  
dimensiones   que   pudieran   estar   conceptualmente  
de  esa  correlación    depende  de  la  forma  en  la  que  los  ítems  
indefinidas.   Este   efecto   es   en   parte,   debido   a   los   "ítems  
se   dividen     para   formar   las   dos   mitades.   Dicho   y   hecho,   10  
basura"  los  cuales  no  tienen  el  núcleo  normal;  sin  embargo,  
ítems  (un  número  bastante  pequeño  para  la  mayoría  de  las  
sí   producen   dimensiones   adicionales   en   el   análisis   de   factor.  
mediciones),  existen  126  divisiones  posibles.2  Debido  a  que  
A   pesar   de   que   esta   aplicación   puede   ser   satisfactoria  
cada     una   de   estas   divisiones   posibles     produciría   un  
durante   los   primeros   pasos   de   la   investigación   de   un  
coeficiente   diferente   en   lo   posible,   ¿cuál   es   la   fiabilidad   de  
constructo,     el   uso   de   análisis   de   factor   en   una   moda  
dos   mitades?   Además,   ya   que   el   promedio   de   todos   estos  
confirmatoria   parecería   ser   mejor   en   pasos   más   largos.  
coeficientes  igualan  al  coeficiente  alfa,  ¿por  qué  no  calcular  
Además,   los   argumentos   teóricos   apoyan   el   proceso  
Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
71  
iterativo   de   cálculo   de   coeficiente   alfa,   la   eliminación   de   Interesadamente,     todos   los   errores     que   se  
ítems,    y  el  cálculo  subsecuente  de  alfa  hasta  que  se  logre  un   producen  en  una  prueba,  fácilmente  se  pueden  abarcar  con  
coeficiente   satisfactorio.   Entonces,   el   análisis   del   factor   se   el   modelo   de   muestra   de   dominio.   Todas   las   fuentes   de  
puede   utilizar   para   confirmar   si   el   número   de   dimensiones   error   que   ocurren   dentro   de   una   medición   tenderán   a  
contextualizadas  se  pueden  verificar  empíricamente.   disminuir   la   correlación   promedio   entre   los   ítems   en   la  
  prueba,  sin  embargo,  la  correlación  promedio  es  todo  lo  que  
Iteración   se   necesita   para   estimar   la   fiabilidad.     Suponga,   por  
       El   procedimiento   anterior   puede   producir   varios   ejemplo,  que  uno  de  los  ítems  es  vago  y  los  que  responden  
resultados.   El   resultado   más   deseado   ocurre   cuando   la   tienen   que   adivinar   lo   que   quiere   decir.   Esta   especulación    
medición   produce     un   coeficiente   alfa   satisfactorio   (o   alfas,   tenderá   a   disminuir   el   coeficiente   alfa,   sugiriendo   que   esto  
si  hay  dimensiones  múltiples)    y  las  dimensiones  concuerdan   es   error   en   la   medición.   El   cálculo   subsecuente   de  
con  las  conceptualizadas.  La  medición  está  lista  para  algunas   correlaciones   total   elemento   entonces   sugerirá     que   estos  
pruebas   adicionales   para   lo   cual     se   debería   recolectar   una   ítems  se  eliminen.  
muestra   nueva   de   información.   Segundo,   el   análisis   de   El   coeficiente   alfa   es   la   estadística   básica     para   la  
factor   suele   sugerir   que   las   dimensiones     que   fueron   determinación   de   la   fiabilidad   de   una   medición   basada   en  
conceptualizadas   como   independientes   claramente   se   consistencia   interna.   El   coeficiente   alfa   no   estima  
sobreponen.  En  este  caso,  los  ítems  que  tienen  cargas  puras   adecuadamente,   errores   causados   por   factores   externos     al  
en  el  factor  nuevo  se  pueden  retener  para  calcular  un  nuevo   instrumento,   tales   como   diferencias   en   situaciones   de  
alfa.   Si   este   resultado   es   satisfactorio,   las   pruebas   prueba   y   participantes   en   el   tiempo.   Si   el   investigador  
adicionales  se  indican  con  información  nueva.   quiere  un  coeficiente  de  fiabilidad  que  evalúe  el  error  entre  
       El  tercer  y  último  resultado  ocurre  cuando  el  (o  los)   pruebas,  se  debe  recolectar  información  adicional.  También  
coeficiente(s)   alfa   es   (son)   demasiado   bajo(s)   y   la   se   sugiere   recolectar   información   audiovisual   para   regular   la  
reconstrucción   de   los   ítems     que   forma   cada   dimensión   no   posibilidad   que   los   hallazgos   previos   estén   al   azar.   Si   el  
es   productiva.   En   este   caso,     la   estrategia   apropiada   es   constructo  es  más  que  un  artefacto  de  medición,  se  debería  
saltarse  al  paso  1  y  2    y  repetir  el  proceso  para  acertar  con  lo   reproducir   cuando   la   muestra   purificada   de   ítems   se   someta  
que   pudo   haber   estado   mal.   Tal   vez   el   constructo   no   se   a  una  muestra  nueva  de  sujetos.  
delineó   apropiadamente.   O   la   serie   de   ítems   no   simplificó   Debido  a  que  el  artículo  de  Peter  trata  la  evaluación  
todos   los   aspectos   del   dominio.   Quizás     el   énfasis   entre   la   de   la   fiabilidad,   no   se   examina   aquí   excepto     para   sugerir  
medición  fue  de  cierto  modo  distorsionado  al  editarse.  O  la   que   el   test-­‐retest   de   fiabilidad   no   se   debería   utilizar.     El  
muestra  de  sujetos  fue  sesgada,  o  el  constructo  estuvo  muy   problema   básico   con   la   fiabilidad   de   los   test-­‐retest  
ambiguo   como   para   definir   la   medición.   Las   últimas   corresponde   a   los   recuerdos   de   los   participantes,   quienes  
conclusiones   sugerirían   un   cambio   fundamental   en   la   tienden   to   contestar   un   ítem     de   la   misma   forma   en   una  
estrategia,   comenzando   con   un   replanteamiento   de   las   segunda   aplicación   así   como   lo   hicieron   en   la   primera.   De  
relaciones  básicas  que  motivaron  la  investigación  en  primer   este   modo,   incluso   si   un   analista   pusiera   juntos   los  
lugar.   instrumentos   en   el   que   los   ítems   estén   mal   correlacionados,  
    sugiriendo    que  no  hay  esencia  normal  y  por  lo  tanto,  no  hay  
Evaluar  fiabilidad  con  información  nueva   constructo,   es   posible   e   incluso   probable   que   los   que  
  respondieron  cada  ítem  pudieran  correlacionar  bien  las  dos  
La   fuente   principal   de   error   en   una   prueba   o   mediciones.   La   correlación   alta   del   total   de   las   puntuaciones  
medición   es   la   muestra   de   los   ítems.   Si   la   muestra   es   en   las   dos   pruebas   sugeriría   que   la   medición   tuvo   un   nivel  
apropiada   y   los   ítems   "se   ven   bien",   se   dice   que   la   medición   de   error   reducido,   cuando   de   hecho,   poco   se   demuestra  
tiene   validez   de   apariencia   y   contenido.   El   seguir   los   pasos   sobre  la  validez  mediante  las  correlaciones  directas  de  test-­‐
sugeridos   tenderá   a   producir   mediciones   con   contenido   retest.  
válido.  Sin  embargo,  ¡esa  no  es  toda  la  historia!  ¿Qué  sucede    
con   los   factores   de   trascendencia   personal,   o   las   preguntas   Evaluar  validez  de  constructo  
ambiguas   que   producen   especulación,   o   una   de   las    
influencias   extrañas,   otras   que   la   muestra   de   ítems,   que   Al   especificar   el   dominio   del   constructo,   generar  
tienden  a  producir  error  en  la  medición?   ítems   que   agoten   al   dominio,   y   subsecuentemente  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
72  

purifiquen   la   escala   resultante,   deberían   producir   una   Una   forma   útil   de   evaluar   la   validez   de  
medición  que  sea  válida  y  fiable  de  apariencia  y  contenido.   convergencia   y   de   discriminante     de   una   medición   es   a  
Puede   o   no   producir   una   medición   que   tenga   validez   de   través   de   matriz   multimétodo-­‐multirrasgo,   es   decir,   una  
constructo.  La  validez  de  constructo,    que  yace  en  el  centro   matriz   de   correlaciones   de   orden   cero   entre   rasgos  
de   los   procesos   científicos,   se   relaciona   directamente   a   la   diferentes     cuando   cada   rasgo     se   mide   con   diferentes  
pregunta   de   qué   instrumento   es   el   que   se   mide-­‐qué   métodos   (Campbell   y   Fiske,   1959).   La   tabla   1,   por   ejemplo,  
constructo,   rasgo,   o   concepto   subyace   el   desempeño   de   una   es  la  matriz  para  una  medición  de  tipo  Likert  diseñada  para  
persona,  puntaje  en  una  medición.   evaluar   la   satisfacción   laboral   de   un   vendedor   (Churchill   et  
Los   pasos   que   proceden   deberían   producir   un   al.,   1974).   Los   cuatro   elementos   esenciales   de   un   matriz  
conjunto   de   ítems   internamente   consistentes   o   multimétodo-­‐multirrasgo   se   identifican   mediante   los  
internamente   homogéneos.     La   consistencia   es   necesaria,   números   que   se   ubican   en   la   esquina   superior   izquierda   de  
pero   no   suficiente   para   la   validez   de   constructo     (Nunnally,   cada  segmento  dividido.  
1967,  p.  92).   Solo  la  fiabilidad  diagonal  (1)  correspondiente  a  la  medición  
En  vez  de  establecer  la  validez  de  constructo  de  una   Likert   se   muestra;   la   información   no   se   recolectó   para   la  
medición,   el   analista   también   debe   determinar   (1)   la   escala  termómetro  ya  que  no  fue  de  interés  en  sí  misma.  Las  
extensión   con   la   que   la   medición   se   correlaciona   con   otras   entradas   reflejan   la   fiabilidad   de   formas   alternas    
mediciones   diseñadas   para   medir   la   misma   cosa   y   (2)   si   la   administradas   dos   semanas   aparte.   Si   esto   es   no   está  
medición  se  comporta  como  se  espera.   disponible,  se  puede  utilizar  coeficiente  alfa.  
  La   evidencia   sobre   la   validez   de   convergencia   de  
Correlaciones  con  otras  mediciones     una   medición   se   da   en   la   validez   diagonal   (3)   mediante   la  
  extensión   para   lo   cual   las   correlaciones   son  
Un   principio   fundamental   en   ciencias   es   que   significativamente   diferentes   desde   cero   y   suficientemente  
cualquier   constructo   en   particular   o   rasgo   debería   ser   largas   para   favorecer   examinaciones   de   validez   más  
medible   para   lo   menos   dos,   y   preferentemente   más,   profundas.   Los   coeficientes   de   validez   en   La   Tabla   1   de  
métodos  diferentes.  De  otro  modo,  el  investigador  no  tiene   0,450;   0,395   y   0,464   son   todos   significativos   en   el   nivel  
forma   de   saber   si   el   rasgo   es   algo   excepto   un   artefacto   del   0,01.La   validez   de   discriminante;   sin   embargo,   sugiere   tres  
proceso   de   medición.   Todas   las   mediciones   del   rasgo   no   comparaciones  que  se  mencionan  así:    
pueden   ser   igualmente   buenas;   sin   embargo,   la   ciencia    
continuamente   enfatiza   mejoras   de   la   medición   de   las   1.-­‐  entradas  en  la  validez  diagonal  (3)  debería  ser  más  alta  
variables   con   las   que   esta   funciona.   La   evidencia   de   la   que   las   correlaciones   que   ocupan   la   misma   fila   y   columna  
en   el   bloque   heterométodo   (4).   Este   es   un   requisito  
fiabilidad   de   convergencia   de   la   medición   se   entrega   por   la  
mínimo   como   el   simple   hecho   de   que   la   correlación   entre  
extensión   que   correlaciona   altamente   con   otros   métodos  
dos  mediciones  diferentes  de  la  misma  variable  debieran  
diseñados  para  medir  el  mismo  constructo.   ser  más  altas  que  las  correlaciones  “entre  esa  variables  y  
Las   mediciones   no   deberían   ser   solo   de   validez   de   cualquier   otra   que   no   tenga   ni   rasgo   ni   método   en  
convergencia,   sino   también   de   validez   discriminante.   La   común”  (Campbell  y  Fiske,  1959,  p.  82).  Las  entradas  en  la  
validez  discriminante  corresponde  a  la  extensión  a  la  que  la   Tabla  1    cumplen  esta  condición.  
medición   es   de   hecho   noble   y   no   simplemente   una   reflexión   2.-­‐     Los   coeficientes   de   validez   (3)   deben   ser   más   altos  
de   alguna   otra   variable.   Según   los   argumentos   persuasivos   que   las   correlaciones   en   los   triángulos   heterorasgo-­‐
de     Campbell   y   Fiske   (1959),   “las   pruebas   se   pueden   dejar   monométodo   (2)   que   sugiere   que   la   correlación   en   un  
rasgo   medido   mediante   métodos   diferentes   deban   ser  
nulas   debido   a   correlaciones   demasiado   altas   con   otras  
más   altos   que   las   correlaciones   entre   rasgos   que   tienen  
pruebas   que   fueron   pretendidas   para   diferenciarse”   (p.81).    
métodos   en   común.     Es   un   requisito   más   estricto   que   el  
En   palabras   más   simples,   las   escalas   que   correlacionan   que   se   requiere   en   las   comparaciones   heterométodo   del  
demasiado   alto   pueden   estar   midiendo   el   mismo   constructo   paso   1   como   los   elementos   fuera   de   la   diagonal   en   los  
en   vez   de   uno   diferente.   La   validez   discriminante   se   indica   bloques   monometodos   pueda   ser   más   alto   debido   a   la  
como   “correlaciones   previsiblemente   bajas   entre   la   varianza   de   métodos.   La   evidencia   en   la   tabla   1   es  
medición   de   interés   y   otras   mediciones   que   se   supone   que   consistente  con  el  requisito.      
no   miden   la  misma   variable   o   concepto”   (Heeler   and   Ray,   p.   3.-­‐   Los   patrones   de   correlación   deberían   ser   los   mismos  
362).   en  todos  los  triángulos  heterorasgo,  por  ejemplo,  ambos  
(2)  y  (4).  
Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
73  

    Algunas   veces,   la   naturaleza   de   los   rasgos   excluye   la  


 Este   requisito   es   un   tick   en   la   significancia     de   los   oportunidad   de   medirla   mediante   métodos   diferentes   como  
rasgos   cuando   se   comparan   a   los   métodos   y   se   pueden   introducir  la  posibilidad  de  método  de  la    varianza.  Cuando  
alcanzar  mediante  un  ordenamiento  por  rango  de  categorías   aparece   esta   situación,   los   esfuerzos   del   investigador   se  
de   los   coeficientes     de   correlación   en   cada   triangulo   deberían   dirigir   para   obtener   la   mayor   diversidad   posible   en  
heterorasgo  aunque  una  inspección  visual  a  menudo  basta,   términos   de   fuentes   de   información   y   procedimientos   de  
un  coeficiente  de  correlación  de  ordenamiento  de  rango  de   puntajes.   Si   los   rasgos   no   son   independientes,   las  
categorías  tal  como  el  coeficiente  de  concordancia  se  puede   correlaciones   monométodo   serán   enormes   y   las  
computarizar  si  hay  gran  cantidad  de  comparaciones.   correlaciones   heterométodo   entre   rasgos   serán   también  
       El  último  requisito  esta  por  lo  general,    aunque  no   sustanciales  y  la  evidencia  sobre  la  validez  de  discriminantes  
por  completo,  cubierto  por  la  información  en  la  Tabla  1.  En   de  la  medición  no  será  fácilmente  establecida  como  cuando  
cada  triangulo  heterorasgo,  las  correlaciones  por  pareja  son   son   independientes.   De   este   modo,     Campbell   y   Fiske   (1959,  
consistentes  en  signo.  Además,  cuando  las  correlaciones  en   p.   103)   sugieren   que   es   preferible   incluir   al   menos   dos  
cada   triangulo   heterorasgo   se   ordenan   de   positivo   más   conjuntos  de    rasgos  independientes  en  la  matriz.  

grande   a   negativo   más   grande,   el   mismo   orden   emerge    


excepto  para  el  triángulo  de  la     ¿Se  comporta  la  muestra  como  se  esperaba?  
   
izquierda   más   abajo   en   el   bloque   heterométodo.   Aquí   la   La   consistencia   interna   es   una   condición   necesaria  
correlación  entre  la  satisfacción  laboral  y  la  ambigüedad  de   pero   insuficiente   para   la   validez   de   constructo.   Los  
funciones   es   más   alta,   por   ejemplo,   menos   negativa   que   la   observables   pueden   relacionarse   al   mismo   constructo;   sin  
que   esta   ente   la   satisfacción   de   trabajo   y   el   conflicto   de   embargo,   no   prueba   que   relacionan   con   el   constructo  
funciones   mientras   que   el   opuesto   fue   verdad   en   los   otros   específico     que   motivó   la   investigación   en   primer   lugar.   Un  
tres  triángulos  heterorasgo  (véase  Ford  et  al.,  1975,  p.  107,   paso   sugerido   final   sería   mostrar   que   la   medición   se  
para   descubrir   por   qué   esta   sola   violación   del   patrón   comporta   como   se   esperaba   en   relación   a   otros   constructos.  
deseado  no  representa  una  distorsión  seria  en  la  medición).   Así   se   trata   de   evaluar   si   el   porcentaje   de   escala   puede  
Idealmente,   los   métodos   y   rasgos   que   generan   la   diferenciar   las   posiciones   de   “grupos   conocidos”   o   si   la  
matriz   multimétodo-­‐multirrasgo   deberían   ser   lo   más     escala   predice   correctamente   alguna   medición   de   criterio  
independientes   posible   (Campbell   y   Fiske,   1959,   p.   103).   (validez   de   criterio).   ¿Se   relaciona   la   satisfacción   laboral   de  
Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
74  

un  vendedor,  como  se  midió  por  la  escala,  por  ejemplo,  a  la   Una  mejor  forma  de  evaluar  la  posición  del  individuo  por  sus  
probabilidad   que   de   que   la   persona   lo   abandone?   Esto   características   es   comparar   el   promedio   de   una   persona   con  
debería,   de   acuerdo   a   lo   que   se   sabe   sobre   empleados   el  promedio  logrado  por  otras.  El  nombre  técnico  para  este  
insatisfechos,  y  si  no,    se  tendría  que  cuestionar  la  calidad  de   proceso   es   “desarrollo   de   normas,”   aunque   es   algo   que  
la   medición   de   la   satisfacción   laboral   del   vendedor.   Nótese   todos  hacen  implícitamente  cada  día.    
que  aunque  hay  lógica  circular  en  el  argumento  anterior,  el   De   este   modo,   al   decirle   a   una   persona   “seguro   que  
cual  se  basa  en  cuatro  posiciones  separadas  (Nunnally,  1967,   es   alto,”   se   dice   que   el   individuo   es   más   alto   que   otros  
p.  93):   previamente   encuestados.   Cada   persona   tiene   un   estándar  
  mental   de   qué   es   un   promedio   y   clasifican   a   las   personas  
1.   La   satisfacción   de   constructos   de   trabajo   (A)   y   la   altas   o   bajas   sobre   la   base   de   como   comparan   con   este  
probabilidad  de  abandono  (B)  se  relacionan.   estándar  mental.  
2.  La  escala  X  entrega  una  medición  de  A.        En   mediciones   psicológicas,   tales   procesos   se  
3  .Y  entrega  una  medición  de  B.   formalizan  al  hacer  explícitos  los  estándares  implícitos.  Mas  
4  .X  e  Y  se  correlacionan  positivamente.   particularmente,     el   resultado   es   puesto   en   un   porcentaje  
  específico   en   unidades   desconocidas   mediante   la  
Solo   la   cuarta   posición   se   examinó     directamente   comparación  de  este  porcentaje  con  la  distribución  total  de  
con   información   empírica.   Para   establecer   que   X   porcentajes,   y   esta   distribución   se   resume   calculando   una  
verdaderamente   media   a   A,   se   debe   asumir   que   las   derivación   estándar   y   significativa   así   como   otras  
posiciones   1   y   3   son   correctas.   Se   debe   tener   una   buena   estadísticas   tales   como   rango   percentil   de   cualquier  
medición   para   B,   y   la   teoría   que   relaciona   a   Ay   B   debe   ser   porcentaje  en  particular    (véase  Ghiselli,  1964,  p.  37-­‐102,  por  
verdad.   De   este   modo,   el   analista   trata   de   establecer   la     un  argumento  particularmente  lúcido  y  convincente  sobre  la  
validez   de   constructo   de   una   medición   relacionándola   a   un   necesidad   y   los   procedimientos   para   el   desarrollo   de  
número   o   a   otros   constructos   y   no   simplemente   a   uno.   normas).  
Además,   también   se   intenta   utilizar   aquellas   teorías   e          La   calidad   de   la   norma   es   una   función   tanto   del  
hipótesis   que   han   sido   suficientemente   bien   examinadas   número   de   casos   y   la   representatividad   en   el   que   el  
para  inspirar  confidencialidad  en  su  verdad  probable.  Es  por   promedio  se  basa.  Mientras  mayor  sea  el  número  de  casos,  
esto  que  la  satisfacción  laboral  no  se  puede  relacionar  con  el   más   estable   serán   las   normas   y   más   definitivas   serán   las  
desarrollo  laboral  debido  a  que  hay  más  desacuerdos  sobre   conclusiones     que   se   pueden   sacar.   Si   la   muestra   es  
la  relación  entre  estos  constructos  (Schwab  and  Cummings,   representativa   dentro   del     grupo   total   entonces   las   normas  
1970).   representan  algo  importante.  A  menudo,  esto  requiere  que  
  se   desarrollen   necesariamente   normas   diferentes   para  
DESARROLLO  DE  NORMAS   grupos   por   separado,   por   ejemplo,   por   sexo   o   por  
  ocupación.   La   necesidad   por   tales   normas   es  
    Normalmente,   una   puntuación   bruta   en   un   particularmente   normal   en   investigación   básica,   aunque   a  
instrumento   de   medición   utilizado   en   una   investigación   de   veces   también   se   utiliza   en   investigación   de   marketing  
marketing   no   entrega   información   en   cuanto   a   la   posición   aplicado.  
de   un   objeto   dado   sobre   las   características   que   se   miden,   ya      Nótese   que   estas   normas   no   necesitan   ser  
que   las   unidades   en   las   que   la   escala   se   expresa   no   son   desarrolladas   si   se   quiere   solo   comparar   entre   los  
conocidas.     Por   ejemplo,   ¿qué   implica   una   puntuación   de   vendedores  i  y  j  para  determinar  quién  está  más  satisfecho,  
350   en   una   escala   Likert   de   100   encuestados   con   un   puntaje   o   determinar   cómo     ha   cambiado   en   el   tiempo   la  
entre  1  y  5  sobre  la  satisfacción  laboral  de  un  vendedor?  Se   satisfacción  de  un  individuo  en  particular.  Para  realizar  estas  
podría  llegar  a  decir  que  debido  a  que  la  posición  neutral  es   comparaciones,    todo  lo  que  se  necesita  hacer  es  comparar  
3,   un   puntaje   de   350   con   100   encuestados   implica   una   las  puntuaciones  brutas.  
satisfacción   altamente   positiva.   El   analista   debe   ser      
cuidadoso   en   hacer   tales   interpretaciones,   ya   que   hay   RESUMEN  Y  CONCLUSIONES  
claramente  una  diferencia  si  supone  que  el  promedio  de  350    
representa  el  promedio  más  alto  o  el  más  bajo  nunca  antes    El   propósito   de   este   artículo   es   resumir   un  
alcanzado  en  dicho  instrumento.     procedimiento  que  se  pueda  seguir  para  desarrollar  mejores  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
75  
mediciones  de  variables  de  marketing.  El  marco  conceptual   proceso  que  se  ha  sugerido  en  esta  investigación.  Como  los  
representa  un  intento  de  unificar  y  reunir  en  un  solo  lugar  la   científicos,   los   marketeros   deben   estar   dispuestos   a   hacer  
información  dispersa  sobre  cómo  se  desarrollan  mediciones   este  compromiso  para  “investigar  de  calidad.”  Aquellos  que  
mejoradas   y   cómo   se   evalúa   la   calidad   de   las   mediciones   realizan   investigación   aplicada   tal   vez   no   pueden  
que  se  han  avanzado.   “comprometerse”  con  la  ejecución  de  cada  uno  de  los  pasos,  
Si   bien   es   cierto,   los   marketeros   necesitan   poner   más   aunque  lo  más  probable  es  que  muchas  de  sus  conclusiones  
atención   en   el   desarrollo   de   las   mediciones,   puesto   que   no  tengan  sentido,  se  relacionen  estrechamente.  Aunque  el  
muchas   de   las   mediciones   con   las   que   ahora   trabajan   son   punto   se   podría   discutir   en   profundidad,   se   podría   esperar  
desafortunadamente   inadecuadas,   tal   como   lo   sugieren   que   por   lo   menos,   los   investigadores   y   participantes   que  
muchas  revisiones  bibliográficas.  A  pesar  del  costo  asociado   realizan   investigación   aplicada   completen   el   proceso  
al   tiempo   y   dinero   para   seguir   con   el   proceso   que   aquí   se   mediante  el  paso  4.  La  ejecución  de  los  pasos  1-­‐4  se  puede  
sugiere,   los   beneficios   respecto   a   la   generación   de   un   lograr   con   información   transversal,   una   sola   vez   y   que   al  
conjunto  de  conocimientos  son  substanciales.  Como  sugiere   menos  indiquen  si  uno  o  más  rasgos  aislados  son  capturados  
Torgerson   (1958),   discutir   el   ordenamiento   de   distintas   por   las   mediciones   así   como   la   calidad   con   la   cual   estos  
ciencias  a  lo  largo  de  un  continuo  teórico-­‐correlacional  (p.2):   rasgos  se  evalúan.  Como  mínimo  la  ejecución  de  los  pasos  1-­‐
  No  es  solo  una  mera  coincidencia  que  las  ciencias  se   4   debería   recudir   la   tendencia   prevalente   a   aplicar   análisis  
ordenaran   de   la   misma   forma   como   si   estuvieran   extremadamente   sofisticados   a   información   defectuosa;   por  
clasificadas   sobre   la   base   de   que   mediciones   satisfactorias   lo   tanto,   ejecutar   otra   rutina   GIGO.   Y   una   vez   que   se   han  
han   logrado   variables   importantes.   El   desarrollo   de   una   ejecutado  los  pasos  1-­‐4,  la  información  recolectada  con  cada  
ciencia   teórica….   pareciera   ser   virtualmente   imposible   a   aplicación   del   instrumento   de   medición   puede   entregar  
menos  que  sus  variables  se  pudieran  medir  adecuadamente.   mucha   más   evidencia   relacionada   a   los   otros   pasos.   Como  
El  progreso  en  el  desarrollo  de  marketing  como  una  ciencia   señala   Ray,   en   la   introducción   a   este   tema,   los  
ciertamente  dependerá  de  la  mediciones  que  los  marketeros   investigadores   de   marketing   ya   están   recolectando  
desarrollen   para   estimar   las   variables   que   les   interesen   información   relevante   para   los   pasos   5-­‐8.   Solo   necesitan  
(Bartels,  1951;  Buzzell,  1963;  Converse,  1945;  Hunt,  1976).     planear   la   recopilación   de   información   y   analizar   con   más  
A   las   personas   que   hacen   investigación   de   una   cuidado  para  contribuir   a  la  mejora  de  las  mediciones  de  
naturaleza   fundamental   les   aconseja   llevar   a   cabo   todo   el   marketing.    
 

   

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 
  76  

Este  contenido  fue  descargado  de  164.77.114.99  el  Vie,  12  de  julio  de  2013  10:02:51  AM  
Todo  uso  está  sujeto  a  Términos  y  Condiciones  de  JSTOR  
 

Vous aimerez peut-être aussi