Vous êtes sur la page 1sur 9

DESARROLLO Y REFINAMIENTO DE LAS MEDICIONES DE ESCALA

Las claves para disear mediciones de escala confiables, de alta calidad, son: 1) entender el
problema de informacin definido, 2) establecer los requerimientos de datos detallados, 3)
identificar y desarrollar los constructos crticos, y 4) entender que una escala de medicin
completa consta de tres componentes (la cuestin o interrogante, las dimensiones y
atributos, y los descriptores de punto de escala). Una vez entendidos el problema de
informacin y los requerimientos de datos, el investigador tiene que desarrollar los
constructos, como ya se explic en este captulo, para saber qu tipos de datos ha de reunir.
El investigador debe elegir con cuidado el nivel apropiado de formato de escala (es decir,
nominal, ordinal, de intervalo, de razn matemtica o de intervalo ordinal) para usarlo en la
recoleccin de datos puros. Por ejemplo, si se determina que la situacin del problema de
informacin requiere patrones de datos de intervalo, pero el investigador hace las preguntas
aplicando un diseo de escala nominal, se reunir un nivel incorrecto de datos y la
informacin final que se pueda generar no ser til para resolver el problema inicial. Para
ilustrar este punto en la figura 12.10 se ofrecen ejemplos de los diferentes niveles de
respuestas puras aplicables al requerimiento de informacin inicial. Por consiguiente, la
forma en que se formulen las preguntas incluidas en una escala completa afectara
directamente a la cantidad de datos puros, y las preguntas de escala de razn matemtica
consiguen los datos ms especficos.

Algunos criterios para la elaboracin de una escala

Al entender la importancia de la formulacin de la pregunta, el investigador puede centrar


ahora su atencin en el desarrollo de los descriptores de escala ms apropiados para usarlos
como elementos de puntos de escala primaria. Si bien no hay un conjunto acordado de
criterios para establecer los descriptores de punto de escala real, aqu ofrecemos varios.

Inteligibilidad de las preguntas

El investigador debe tomar en consideracin la capacidad intelectual y la habilidad para


expresarse de las personas a quienes se administrar la escala. El investigador debe suponer
que los encuestados prospectos desconocen los requerimientos de informacin del proyecto
de investigacin. Es decir, los investigadores no deben asumir de manera automtica que los
encuestados entienden las preguntas que se hacen o las elecciones de respuesta. El criterio
de inteligibilidad para el diseo de la escala se relacin con el grado en que las preguntas son
entendidas por los encuestados. El investigador tiene que usar el lenguaje apropiado tanto
en las preguntas como en las elecciones de respuesta.

El investigador debe tratar las conjeturas por parte del encuestado. Los encuestados deben
ser capaces de entender que tipos de datos se estn pidiendo y como han de responder. Vea
el ejemplo de escala el investigador ha usado solo la primera oracin (en lo concerniente a
los diferentes mtodos bancarios que usted puede o no emplear, querramos conocer su
opinin sobre los mismos). Esto sugerira que el investigador asumiera que los encuestados
entenderan automticamente como completar la pregunta de escala. Sin la segunda oracin
(las instrucciones exactas), los encuestados quiz no sepan que hacer. Tales supuestos por
parte del investigador podran acrecentar con facilidad la probabilidad de respuestas de
datos incompletos. El factor de intangibilidad promueve as el uso de instrucciones para el
encuestado en los diseos de medicin de escala, especialmente en las encuestas auto
administradas. Para las entrevistas en persona o por telfono, es muy posible que las
instrucciones para el entrevistador tengan que ser incluidas en la parte de la pregunta o
preparacin de las mediciones de escala. En los captulos 14 y 15 se darn ms explicaciones
sobre los requerimientos de instrucciones.

Ejemplo de estructura de escala de intervalo ordinal

Propiedades de los descriptores de escala primaria

El investigador tiene que asegurarse de que los descriptores de escala concuerdan con el tipo
de datos que est buscando. De este modo, otro criterio es que el investigador debe
considerar la propiedad de los descriptores. Esto es, los adjetivos o adverbios usados para
distinguir las magnitudes relativas tienen relacionarse con los descriptores de escala
primaria. Digamos, por ejemplo, que el investigador quiere encontrar opiniones de los
encuestados acerca de si el supermercado Winn-Dixie tiene precios competitivos en la
carne. La tarea crucial en este caso es determinar cules descriptores de cada escala
primaria representan ms apropiadamente la nocin de precios competitivos. Hay varias
formas creativas de hacer esta tarea. Primero, si el investigador disea la pregunta o
preparacin para preguntar a los encuestados si estn de acuerdo o en desacuerdo con que
Winn-Dixie tiene precios competitivos en la carne, entonces el conjunto apropiado de
descriptores de escala sera el de los niveles de acuerdo o desacuerdo (por ejemplo,
firmemente de acuerdo, de acuerdo, ni de acuerdo ni desacuerdo, en desacuerdo,
firmemente en desacuerdo). Declarar la cuestin en trminos de competitividad requerira
un conjunto ordinal de descriptores, como extremadamente competitivo,
definitivamente competitivo, generalmente competitivo, solo ligeramente
competitivo, nada competitivo. En cambio, sera inapropiado tratar de representar las
opiniones de los encuestados acerca de los precios competitivos utilizando un conjunto de
descriptores orientando por el desempeo, como excelente, muy bien, bien, trmino
medio, aceptable y mal.

Poder discriminatorio de los descriptores de escala

Este criterio de escala se relaciona con las situaciones en las que 1) el problema de
informacin requiere inclusin de magnitudes relativas en el conjunto de posibles respuestas
puras, o 2) el investigador opta por establecer la existencia de magnitudes (relativas o
absolutas) de diferencias entre los puntos de escala. El poder discriminatorio de una escala
es la capacidad de esta de diferenciar de manera significativa entre las respuestas de escala
categricas. Ms aun el investigador debe decidir cuantos puntos de escala son necesarios
para formar las magnitudes relativas de una escala de respuesta deseada; recuerde: es el
nmero de puntos de escala que se relacin de manera directa con la informacin que puede
obtenerse de hacer preguntas a los encuestados.

Aunque no hay regla clara acerca del nmero de puntos de escala que debe usarse para crear
una escala, muchos investigadores reconocen que la mayora de las escalas que incluyen las
propiedades de elaboracin de escala de orden y distancia deben de tener entre 3 y 7 puntos.
En la mayora de los caos a los encuestados se les dificulta elegir cuando hay ms de 7 niveles
de magnitudes relativas o absolutas. Para ilustrar ese punto suponga Marriot International
se interesa en determinar que caracterizaras hoteleras son las que los favorecedores
empresariales consideran importantes al elegir un hotel para u viaje de negocios. Al crear
una escala de importancia para capturar la magnitud relativa de la relevancia atribuida a
cada caracterstica del hotel, el investigador debe decidir subjetivamente cuantos niveles
reconocibles de importancia existen en la mente de los viajeros empresariales. El
investigador tiene que entender primero que los descriptores de escala dictoma bsica son
sencillamente importante y no importante; segundo debe decidir que tan detalladas o
variadas tienen que ser las respuestas de datos puros de importancia para el problema de i
formacin inicial. Por lo general, una escala completa de importancia consta de cinco niveles
diferentes de importancia y de una categora de nada importante (que le da al encuestado
seis elecciones reales). Los cinco grados de diferencia se expresan por lo comn como
Extremadamente, definitivamente, generalmente, 2un tanto y ligeramente
importante.

Al entender la composicin de la escala de importancia completa, el investigador puede


incorporar correctamente variaciones que tal vez se ajusten mejor a los requerimientos de
informacin en las diferentes situaciones. Cuando crece una escala de importancia, recuerde
que los descriptores de la escala raz no son simplemente importante y no importante.
En realidad, la mayora de los seres humanos no piensan o expresan su sensacin de nada
importante en grados de no importante (por ejemplo, extremadamente no importante,
definitivamente no importante o generalmente no importante). Adems, hay ocasiones
en que tratar de incorporar grados de magnitud relativa a la escala da por resultado la
disminucin de su poder discriminatorio. Suponga en el ejemplo recin citado del hotel
Marriot, que el investigador disee una escala de importancia compuesta de 15 descriptores
de escala y que la presente como sigue:

ESCALA DE IMPORTANCIA
NADA IMPORTANTE: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15: EXTREMADAMENTE IMPORTANTE

Aun cuando la escala indica que nada importante es 1 extremadamente importante es


15, es muy improbable que el investigador o el encuestado puedan agregar interpretaciones
de descriptor diferencial significativas a los puntos de escala del 2 al 14. Este problema
potencial del poder discriminatorio puede existir en cualquier tipo de diseo de escala.

Confiabilidad de escala

La confiabilidad de escala se refiere en que una escala puede reproducir los mismos
resultados de medicin en repetidos intentos. Como se explic en captulos anteriores, el
error aleatorio produce una incongruencia en mediciones de escala que conduce a una
confiabilidad menor de escala. Dos de las tcnicas que pueden ayudar a un investigador
evaluar la confiabilidad de las escalas son el pre prueba y pos prueba.

Primero, la tcnica de pre prueba y post prueba consiste en repetir la administracin de la


medicin de escala a la misma muestra de encuestados en dos ocasiones diferentes, o a dos
distintas muestras de encuestados de la misma poblacin meta definida en casi las mismas
condiciones, de ser posible. La idea de este mtodo es sencillamente que si se presentan las
variaciones aleatorias, se revelarn por las variaciones en las puntuaciones entre las dos
mediciones muestreadas. Si hay muy pocas diferencias entre la primera y la segunda
administracin de la escala, la escala de medicin se considera estable y por ende confiable.
Por ejemplo, suponga que determinar la efectividad de la enseanza asociada con un curso
de investigacin de mercado implicara el uso de una escala de 28 reactivos diseados para
medir el grado en que los encuestados estn de acuerdo o en desacuerdo con cada reactivo.
Para reunir los datos puros necesarios sobre la efectividad de la enseanza, su profesor
administra esta escala a la clase despus de la sptima semana del semestre y de nuevo
despus de la semana 12. Aplicando un procedimiento de anlisis de media aritmtica para
crear estructuras de datos en los reactivos para cada periodo de medicin, el profesor hace
un anlisis de correlacin a esos valores de media aritmtica. Si las correlaciones entre las
mediciones de valores de media aritmtica de los periodos de evaluacin fueran altas, el
profesor concluira que la confiabilidad de la escala de 28 reactivos es alta.

Hay varios problemas con el mtodo de pre prueba y post prueba. Primero, algunos de los
estudiantes que llenaron la escala la primera vez podran no estar presentes en la segunda
administracin de la misma. Segundo, los estudiantes podran volverse sensibles a la
medicin de escala y, en consecuencia, quizs alteren sus respuestas en la segunda medicin.
Tercero, el ambiente o los factores personales pueden cambiar entre las dos
administraciones, lo que causara cambios en las respuestas del estudiante en la segunda
medicin.

Algunos investigadores creen que los problemas asociados con la tcnica de confiabilidad de
pre prueban y post prueba pueden evitarse utilizando la tcnica de la forma equivalente. Con
esta tcnica, el investigador crea dos mediciones de escala similares pero diferentes (es decir,
equivalentes) para el constructo dado (por ejemplo, efectividad de la enseanza) y
administra ambas formas a la misma muestra de encuestados de la misma poblacin meta
definida. En el ejemplo de la efectividad de la enseanza del curso de investigacin de
mercado, el profesor armara dos escalas de 28 reactivos cuya diferencia principal consistira
en la redaccin de los enunciados de reactivo, no en los puntos de elaboracin de escala de
acuerdo o en desacuerdo. Aunque la redaccin de los enunciados cambie, su significado se
mantendra constante. Despus de administrar cada una de las mediciones de escala, el
profesor calcula los valores de media aritmtica de cada reactivo y luego hace el anlisis de
correlacin. La confiabilidad de forma equivalente se evaluara midiendo las correlaciones de
las puntuaciones de valores de media aritmtica del reactivo en las dos mediciones de escala.
Los valores de correlacin altos se interpretaran como una alta confiabilidad de medicin de
escala.

Hay dos ventajas potenciales asociadas con la tcnica de confiabilidad de la forma


equivalente. Primero, si el proceso de prueba sugiere que se puede lograr la equivalencia,
pudiera no valer el tiempo, esfuerzo y gasto de determinar que dos escalas similares pero
diferentes se pueden usar para medir el mismo constructo. Segundo, es muy difcil y acaso
imposible crear dos mediciones de escala totalmente equivalentes. Pueden suscitarse dudas
acerca de cul medicin de escala es la ms adecuada para medir la efectividad de la
enseanza.

Cuando se investigan constructos multidimensionales, las mediciones de escala condensadas


tienden a ser las escalas ms apropiadas. En este tipo de escala, cada medicin representa
algn aspecto del constructo. De tal suerte, el constructo es medido por la escala entera, no
solo por un componente. La coherencia interna se refiere al grado en el que las diversas
dimensiones de un constructo multidimensional se correlacionan con a escala. En otras
palabras, el conjunto de atributos de reactivo que integran la escala debe ser internamente
coherente: hay dos tcnicas de bastante aceptacin que se usan para evaluar la coherencia
interna: las pruebas divididas en dos y las de coeficiente alfa (esta ltima tambin llamada
alfa de Cronbach). En una prueba dividida en dos, los reactivos de la escala se dividen en dos
partes iguales (atributos impares contra pares, o aleatoriamente). La prueba dividida en dos,
los reactivos de la escala se dividen en dos partes iguales (atributos impares contra pares, o
aleatoriamente) y las puntuaciones sumadas de estas mitades resultantes se correlacionan
una con otra. Las correlaciones altas entre las mitades indican buena (o aceptable)
coherencia interna. Un coeficiente alfa toma el promedio de todas las medidas partidas a la
mitad posibles que resultan de fraccionar los reactivos de la escala. El valor del coeficiente
puede fluctuar entre 0 y 1, y en la mayora de los casos un valor de menos de 0.6 indicara
habitualmente una coherencia interna entre marginal y baja (o insatisfactoria).

Equilibrio de escala positivos o negativos

Este criterio de desarrollo de escala se relaciona con la decisin del investigador de mantener
la objetividad en una escala diseada para capturar respuestas puras tanto positivas como
negativas. Para mantener la objetividad de la escala, el investigador debe disear un balance
de descriptores positivos y negativos como puntos de escala. Por ejemplo, supngase J. D.
Poder aos Associates quiere agregar a su Encuesta de vehculos nuevos una medicin
global de escala de reactivo nico que calculara la satisfaccin de un comprador con el
rendimiento total de su vehculo nuevo. Puesto que la mayora de la gente considerara
positiva la sensacin de satisfaccin y negativa la de insatisfaccin, J. D. Power aos
Associates tendra que decidir si la medicin de escala sera objetiva y no desviados (o
sesgara) las sensaciones del encuestado en un sentido y otro. Al tener magnitudes relativas
iguales de satisfaccin (positivas) y de insatisfaccin (negativas) la medida de la escala global
mantendra un nivel de objetividad. Un diseo de medicin de escala balanceado as podra
verse como sigue:

Con una medicin de escala equilibrada, la objetividad se mantiene tanto en la parte o


preparacin de la escala como en la de los suscriptores.

Supngase ahora que J.D. Power aos Associates se interesa principalmente en evaluar las
satisfacciones de los compradores de vehculos nuevos con el rendimiento total de su
vehculo y que los datos de insatisfaccin no le parecen tan importantes. Este tipo de
requerimiento de datos pudiera satisfacerse mejor utilizando una medicin de escala global
no equilibrada que hizo mayor nfasis en los descriptores de escala positivos (de satisfaccin)
que en los negativos (de insatisfaccin). El diseo de medicin de escala No equilibrado
pudiera verse como el siguiente:

Un diseo de medicin de escala balanceado as podra verse como sigue:

Con base en sus experiencias con su nuevo vehculo, desde que lo tiene y lo conduce, en
qu medida est actualmente satisfecho o insatisfecho con el rendimiento total del auto?

(POR FAVOR, MARQUE LA RESPUESTA APROPIADA)

- Completamente satisfecho (ninguna Insatisfaccin).


- Definitivamente satisfecho.
- Generalmente satisfecho.
- Ligeramente satisfecho (alguna insatisfaccin).
- Ligeramente insatisfecho (alguna satisfaccin).
- Generalmente insatisfecho.
- Definitivamente insatisfecho.
- Completamente insatisfecho (ninguna insatisfaccin).

El diseo de medicin de escala no equilibrada pudiera verse como el siguiente:

Con base en sus experiencias con su nuevo vehculo, desde que lo tiene y lo conduce, en
qu medida est actualmente satisfecho o insatisfecho con el rendimiento total del auto?

(POR FAVOR, MARQUE LA RESPUESTA APROPIADA)

- Completamente satisfecho.
- Definitivamente satisfecho.
- Generalmente satisfecho.
- Ligeramente satisfecho.
- Insatisfecho.

Es importante recordar que, con una medicin de escala No equilibrada, se pierde la


objetividad tanto en la parte de pregunta o preparacin de la escala como en la de los
descriptores.

Inclusin de una respuesta neutral

En el diseo de medicin de escala, el nmero de descriptores de punto de escala se vuelve


un criterio importante slo si los experimentos de datos puros piden la captura de datos de
opinin o de tipos especficos de datos de intencin que se concentren en tramos de continuo
positivo/negativo. La cuestin fundamental aqu estriba en ofrecer al encuestado la
oportunidad de expresar una respuesta neutral. Tener un nmero par de descriptores de
escala positivos o negativos tiende a obligar al encuestado a elegir slo una respuesta
positiva o negativa.

A una escala que no tiene un descriptor neutral para dividir los dominios positivos y negativos
se la denomina medicin de escala de eleccin obligada. En cambio, una escala que incluye
una respuesta neutral de centro recibe el nombre de medicin de escala que incluye una
respuesta neutral de centro recibe el nombre de medicin de escala de eleccin libre.

Algunos expertos creen que las escalas usadas para reunir datos de opinin deben disearse
como mediciones de escala de puntos impares, eleccin libre, ya que no todos los
encuestados tendrn el conocimiento o la experiencia suficiente con el tema dado para ser
capaces de evaluar con precisin sus pensamientos o sentimientos. Si se fuerza a los
encuestados a elegir, la escala tal vez produzca datos de ms baja calidad de lo que el
investigador desea. Sin embargo, en los diseos de escala de eleccin libre, el punto de escala
llamado neutral ofrece a los encuestados una forma muy fcil de evitar el tener que pensar
o expresar su sentir acerca del tema. Los datos puros de una respuesta de escala neutral se
vuelven intiles para efectos de diagnstico, tanto para el investigador como para el timador
de decisiones en una empresa.
Ejemplos de descriptores de escala de puntos pares, eleccin obligada y de puntos
impares, eleccin libre

MEDIDAS DESEADAS DE TENDENCIA CENTRAL Y DISPERSION

Para determinar que niveles de mediciones de escala deben desarrollarse, el investigador


tiene que considerar los anlisis de datos que se usaran despus de reunir los datos puros de
los encuestados. En consecuencia, debe tener nocin de las medidas de tendencia central y
de las medidas de dispersin asociadas con los diferentes tipos de diseos de medicin de
escala. Las medidas de tendencia central se refieren a las estadsticas bsicas de muestra
que se generan mediante el anlisis de los datos puros recolectados; estas estadsticas son la
moda, la mediana y la media aritmtica. La moda es la respuesta pura que se da con ms
frecuencia entre todos los encuestados. La mediana representa la estadstica de muestra que
parte en dos de los datos puros en un patrn jerrquico, en el que una mitad de los datos
puros esta sobre el valor estadstico y la otra mitad esta debajo. La media aritmtica es el
promedio aritmtico de todas las respuestas de datos puros.

Las medidas de dispersin se relacionan con la forma en que todos los datos puros se
dispersan realmente en torno a un valor de tendencia central dado. Estas estadsticas de
muestra le permiten al investigador reportar la diversidad de respuestas pura para una
medicin de escala particular; estas estadsticas son la distribucin de frecuencia, el rango y
la desviacin estndar de la muestra estimada. Una distribucin de frecuencia es un resumen
de la cantidad de veces que cada posible respuesta o preparacin de escala fue registrada
por el grupo total de encuestados. Esta distribucin puede convertirse de forma sencilla en
porcentajes o histogramas para facilitar la comparacin entre las respuestas de datos puros.
El rango representa la agrupacin de respuestas de datos puros en subgrupos mutuamente
excluyentes, cada uno con lmites inferior y superior identificables. La desviacin estndar de
la muestra estimada es el valor estadstico que especifica el grado de variacin en las
respuestas de datos puros de manera que permite el investigador traducir las variaciones en
interpretaciones de curva normal.

Relaciones entre los niveles de escala y las medidas de tendencia central y de dispersin:

Vous aimerez peut-être aussi