Académique Documents
Professionnel Documents
Culture Documents
Una vez que se ha captado la información de cada uno de los elementos del
conjunto en estudio, esta tiene que ser revisada, clasificada, presentada y
resumida para permitir su análisis e interpretación, y a este conjunto de
actividades se le denomina elaboración de los datos. En este capítulo se trataran
todas ellas excepto la de resumen, que se estudiara en los capítulos siguientes.
Revisión de datos
La revisión tiene por objeto: a) determinar si se han recibido todos los formularios
o, cuando menos, en una proporción que sea suficiente para no invalidar las
conclusiones que se podrían hacer; b) verificar que están registradas todas las
respuestas requeridas y c) localizar posibles incongruencias en la información
proporcionada. La revisión de datos constituye lo que se ha dado en llamar control
de calidad de la información.
Es claro que todo investigador desearía recibir todos los formularios, tener todas
las respuestas y que todas estas fuesen acordes con la realidad; pero también es
fácil imaginar que puede haber serias deficiencias. Sin embargo, algo puede
hacerse para reducir el margen de error si se conocen de antemano cuales suelen
ser las causas más frecuentes, que veremos en los siguientes párrafos.
Algunas de las medidas que podrían tomarse antes de la captación misma de los
datos podrían ser: que los formularios tengan una extensión moderada, que se
realice una propaganda adecuada no solo de que se va a investigar sino también
para que; probar la comprensión de las instrucciones con personas tan
semejantes a las que irán dirigidas como sea posible; comunicar por los conductos
adecuados a cada uno de los participantes lo que se espera de ellos y el momento
en que deban cumplir su parte; selección apropiada de personal y, para
protegerse del bajo nivel educacional de los elementos en estudio, solo queda el
no preguntar temas de complejidad o hacer la captación utilizando los recursos de
personal o equipo adecuados; procurar que la amplitud y profundidad de la
investigación no rebase la capacidad económica de sus realizadores, para que el
personal participante responda a lo que pudiera considerarse como una
remuneración justa.
El que no estén registrados todas las respuestas requeridas puede tener como
causa un formulario mal diseñado, que no tenga considerada la posibilidad de que
algunas preguntas no resulten aplicables o comprensibles a todos los miembros
del conjunto en estudio; puede deberse también a negligencia del que haga las
preguntas, ya que pudo haber omitido hacer alguna o habiéndola hecho, no haber
registrado la respuesta; otra posibilidad es que el informante se hubiese negado a
contestar la pregunta correspondiente.
La sola identificación de las posibles causas hace evidente que para evitar las
incongruencias, las medidas son prácticamente las mismas mencionadas antes.
Cuando se desea hacer una discusión sistemática de los errores que pueden
cometerse en la medición, algunos autores consideran que esta depende de: a) la
estructura cerebral del observador; b) estado de movimiento relativo del
observador y del objeto observado; c) los receptores físicos y fisiológicos del
observador; d) la interacción entre el observador y el objeto observado; e) las
propiedades del objeto observado y f) del efecto del resto del universo. Sin
embargo, con más frecuencia se identifican fundamentalmente tres causas: las
atribuciones al sujeto que hace la observación, al instrumento con el que se hace y
al objeto observado. Para ilustrar lo anterior, se dan a continuación algunos
ejemplos.
Atribuibles al sujeto: no observa a todos los elementos que debe estudiar por
negligencia (no visita ciertas viviendas porque se encuentran distantes, no se
mantiene en su puesto de observación y no hace las mediciones en los intervalos
señalados o los eventos transcurren sin que se haya percatado de ellos; posterga
el registro a tal grado que o no registra el dato definitivamente o lo que anota no es
verídico, pues habiendo olvidado el dato preciso registra lo que cree recordar,
etc.); tiene deficiencias no compensadas adecuadamente (problemas visuales o
auditivos, principalmente); nivel educacional básico insuficiente para comprender
la información que está manejando (los cursos de adiestramiento no pueden tener
una duración indefinida y, por lo tanto, deben presuponer cierta preparación
mínima, que debe ser detectada en la selección de personal, a partir de la cual
desarrollar tal adiestramiento y aunque los conocimientos mínimos requeridos
dependerán de la investigación que se vaya a realizar, se pueden mencionar como
indispensables la lectura, escritura, expresión satisfactoria y cierta capacidad para
hacer operaciones aritméticas elementales).
Propias del objeto: puede ocurrir que la persona se niegue a informar; que informe
mentiras o que no sepa o no recuerde la respuesta; que por ignorancia, descuido
o intención no se presente al estudio en las condiciones establecidas; que si se
trata de una substancia, esta sea inestable o de un material excesivamente frágil o
con elementos que no corresponden realmente al conjunto que debía estudiarse.
Clasificación de datos
En algunas otras situaciones, las categorías son establecidas con cierto grado de
arbitrariedad, como cuando se clasifica a un enfermo de tuberculosis según el
avance de la lesión, pudiendo ser esta mínima, moderadamente avanzada,
avanzada y muy avanzada, o cuando se clasifica a los individuos según estén en
contra, les sea indiferente, acepten o apoyen decididamente una proposición. Por
refinamientos en las medidas de resumen, algunos autores denominan a estas
escalas “ordinales” y a las mencionadas en el párrafo anterior “nominales”. Ambas
serán consideradas aquí como cualitativas.
Las palabras contar y medir deben resultar básicas para determinar si se trata de
una escala cuantitativa discontinua (cantar) o de una escala cuantitativa continua
(medir). En el primer caso, solo son posibles valores enteros y en el segundo,
cualquier valor (entero, decimal, etc.) es posible. Es claro que una mujer pudo
haber tenido 1, 2 o más hijos, pero no 1.5 hijos, por lo que el número de hijos es
cuantitativo discontinuo; sin embargo, debe tenerse cuidado con lagunas
características que aparentemente se cuentan pero que en realidad se miden,
como es el caso de la edad, que se proporciona contando años, aunque es
esencia se está midiendo el tiempo transcurrido desde el nacimiento hasta el
momento actual y por lo tanto, la edad es una característica continua.
CUADRO 1
MEXICO, 1970
Total 29 97 100.0
* En miles.
Siendo tantas las causas es claro que habría una gran cantidad de clasificaciones
posibles y sería muy difícil que dos coincidieran para permitir la comparación de
daños en las correspondientes regiones.
La necesidad de contar con una clasificación única se hizo evidente, y, después
de algunos intentos, (5) en 1893, el Instituto Internacional de Estadística aprobó
una clasificación preparada por el Dr. Jacques Bertillon que fue adoptada por
varios países. Esta debería revisarse cada diez años, revisiones que se llevaron a
cabo en 1900. 1909, 1920, 1929 y 1938, las dos últimas bajo el patrocinio del
Instituto y de la organización de Higiene de la Sociedad de las Naciones. La sexta
revisión, en 1948, se realizo ya bajo los auspicios de la Organización Mundial de la
Salud, que se encargo de la séptima de 1955, de la octava en 1965 y de la novena
en 1975.
CUADRO 4
DEFUNCIONES DEBIDAS A SARAMPION
POR EDAD MEXICO, 1974
Edad Muertes
0 116
1 88
2 58
3 40
4 37
5-9 64
10-19 28
20 y + 16
Total 447
CUADRO 5
DEFUNCIONES DEBIDAS A ENFERMEDADES
ISQUEMICAS DEL CORAZON MEXICO, 1974
Edad Muertes
< 15* 0
15-24 269
25-34 246
35-44 577
45-54 1240
55-64 2110
65-74 3229
75-84 2060
85 y + 1535
Total ** 11266
< significa “menor que”
** se excluyeron 13 muertes en las que se ignoraba la edad.
Fuente: estadísticas Vitales de los estados Unidos Mexicanos; S. S. A., 1974.
La razón para usar las series de intervalos descritos es aquel que las muertes por
sarampión ocurren predominantemente en menores de 5 años, en tanto que las
muertes por enfermedad isquémica del corazón se presentan en los últimos años
de la vida, y esos intervalos permiten destacar las características esenciales de las
dos series, pues si se hubieran usado intervalos, por ejemplo, de 10 años cada
uno para presentar las muertes por sarampión, casi todas hubieran quedado en el
primer intervalo de 0-9 años y los demás intervalos hubieran resultado
prácticamente sin defunción alguna o con muy pocas defunciones.
“El grado de detalle en la clasificación cruzada por causa, sexo, edad y divisiones
del territorio dependerá, por una parte, del propósito y del alcance de las
estadísticas y, por otra, de los limites prácticos en relación con el tamaño de los
cuadros correspondientes.
El valor menor es 157 y el mayor 188; el rango es, por lo tanto, 188-157=31; si se
quisieran formar 5 intervalos, la longitud tendría que ser de 7 centímetros; si se
desearan 6, la longitud tendría que ser de 6; sin embargo, resultaría más
conveniente para cálculos y para describir la serie usar longitudes de 5
centímetros, empezar con 155 y terminar con 189, quedando la clasificación
compuesta por los intervalos siguientes:
155 – 159
160 – 164
165 – 169
170 – 174
175 – 179
180 – 184
185 - 189
Las estaturas se obtienen comparando la altura que alcanza un individuo con una
escala graduada en centímetros (o en pulgadas) y es costumbre dar el valor de la
estatura como el entero que quede más próximo, de modo que si una estatura se
da como de 168 en realidad corresponde a cualquier valor entre 167.5 y 168.5. por
ello es necesario mencionar que el intervalo dado como de 155 a 159 en realidad
abarca desde 154.5 hasta 159.5 y si a este ultimo valor se le resta el precedente,
se confirma que la amplitud de cada intervalo es de 5 unidades. A los números
155 y 159 o a cualquier otra pareja de valores que defina un intervalo, de tal
manera que su límite superior no coincida con el límite inferior del intervalo
siguiente, se les denominara, en lo sucesivo, limites relativos, a los números 154.5
y 159.5 o a cualquier otra pareja de valores que defina a un intervalo sin que
queden valores no considerados entre un intervalo y el siguiente, se les llamara
limites reales.
Aunque las tres soluciones son validas, es más común decidirse por la tercera y
entonces la cifra 164.5 se convierte en 164, que es el par más próximo, y la
observación se incluye en el segundo intervalo.
Como existen tantos números pares como impares, la mitad de las ocasiones se
suprime media unidad y la otra se agrega, pues un valor como 159.5 se redondea
a 160. Por supuesto que en el ejemplo se procedió de esta manera, en el
entendido de que 164.5 debía tomarse como una manera abreviada de escribir
ese mismo número seguido de una cantidad infinita de ceros, ya que un solo digito
diferente de cero en cualquier posición después del 5, como por ejemplo
164.500000001, convertiría el valor en 165 y entonces la observación debería ser
asignada al tercer intervalo.
Obsérvese que en las series anteriores solo son posibles valores enteros, pues no
se tienen fracciones de hijos y no se habla de fracciones de glóbulos blancos, y
que también pueden manejarse “intervalos” con un solo valor o con la posibilidad
de incluir solo los valores enteros comprendidos en ellos.