Académique Documents
Professionnel Documents
Culture Documents
Representación de datos:
• En el texto
• En tablas
• En gráficos
• Nunca presentar los datos en más de una forma.
Las tablas, en primer lugar, son la forma de ordenar los datos en filas y columnas, eso
es una tabla en resumidas cuentas y es la forma de representar de forma ordenada
los resultados de un trabajo para que las personas puedan entender de mejor forma.
Cuando uno hace una investigación epidemiológica o un estudio de casos controles o
una investigación de cualquier ámbito y ve muchas muestras y muchos pacientes, no
tienen para que publicar todo lo que encontraron en cada uno de los pacientes o en
cada una de las muestras que analizaron, tienen que resumir eso y esa forma de
resumir y ordenar las cosas es presentándola en tablas y en gráficos.
Las tablas estadísticas sirven para presentar en forma ordenada los datos numéricos
obtenidos en algún estudio.
La tabla debe tener título y unas rayitas para que la gente entienda mejor, unas rayas
horizontales que permitan definir donde está el encabezado y donde está separando
los totales del contenido principal de la tabla.
En esta tabla debe estar el título y si hay una abreviatura debe ser explicada.
Acá tenemos por ejemplo, la distribución de pacientes con Síndrome de Sjögren
primario y secundario. El INE todo el mundo sabe lo que y secundario. El INE todo el
mundo sabe lo que es, así que esa abreviatura no tiene para que explicarla.
El título.
El título debe decir por lo menos lo que hay adentro de la tabla. Qué es lo que está
presentando adentro de esa tabla. Como se clasificaron los datos. Generalmente,
muchas veces uno no tiene ni que explicar porque se entiende fácilmente lo que
quiere decir esa tabla. (Ej.: Si usted pone hombres, mujeres, no tiene para que decir
“clasifiqué esta tabla de acuerdo al género”, ¿para qué?) Usted mira y entiende.
Donde se registraron los datos y cuando se registraron los datos, a veces es
necesario en la tabla que aparezca en el título cuando esa tabla se presenta de forma
aislada, como por ejemplo en un congreso. (Lo de donde y cuando eso lo va encontrar
en la sección de materiales y métodos, entonces no siempre es necesario que esté
ahí en el título pero si hay una variación en la recopilación de los datos es bueno que
esté ahí, en el título).
Casos especiales.
A veces hay casos especiales:
Tablas con pocos datos, títulos muy cortos, a veces hay secuencias de tablas que
están relacionadas una con otra, entonces no hay para qué estar repitiendo todos los
títulos si son la continuación una de otra, lo hay que hacer es ir siguiendo el orden
para entenderlas. Al pie de la tabla es necesario colocar generalmente las
abreviaturas, pueden también poner algo acerca del origen de los datos, el análisis
estadístico que se hizo o la significancia estadística generalmente con una letra más
pequeña y cualquier cosa que deba ser aclarada porque haya una inconsistencia en
los datos dentro de esa tabla, por ejemplo los totales a veces puede que no coincidan
y tiene que explicar porque no lo hacen (Ej.: un paciente que se retiró del estudio o
algún paciente que presenta más de una característica, entonces puede estar en
varias categorías asignadas.)
Un criterio de clasificación:
• Primera columna.
Más de un criterio de clasificación:
• Escala con mayor número de grupos en la primera columna.
Dos escalas de clasificación, una se refiere a los antecedentes y la otra a las
consecuencias:
• Antecedentes en la columna a la izquierda.
• Consecuencias en la fila superior.
Totales marginales.
Al colocar los datos muchas veces es necesario poner los totales. Los totales en una
tabla pueden estar en las filas, en las comunas o ambos y es bueno estar revisando
que coincidan esos totales. Generalmente esos totales se obtienen por la suma de la
horizontal y vertical. Si esos totales no se obtuvieron así, por la suma y no coincide
con los valores reales debe decir porqué.
Porcentajes.
Puede colocar porcentajes de acuerdo al total de la columna o de la fila y muchas
veces en las variables nominales y ordinales es necesario que coloque los
porcentajes porque a la persona le queda como más fácil entender. (Es más fácil
entender 5% que 1 de 20). No use porcentajes cuando tiene muy pocos datos. Por
ejemplo, estudió una enfermedad muy rara y encontró que de 5 pacientes sólo había
1 mujer, no tiene para qué calcular el porcentaje porque la mayoría de los humanos
pueden darse cuenta que ese 1 de 5 es el 20%, no se usa en Tablas de contingencia
2X2
RESFRÍA
DEPORTE SI NO Total
SI 16 20 36
NO 14 30 44
Total 30 50 80
Cuando tenemos estas tablas de 2 x 2, cada uno de los cuadrados aquí adentro de la
tabla la vamos a llamar CELDA (en inglés cell) y se usa una letra para denominarla, la
a, b, c y d. Entonces la suma de las columnas es sencilla. Estas tablas pueden
utilizarlas en la evaluación de test de diagnóstico, por ejemplo se hace un test para
ver si los pacientes tienen SIDA y puede obtener falsos positivos (se hace el test y
dice que tiene la condición cuando en la realidad no la tiene) y falsos negativos (el
gallo fue a una fiesta anoche y se contagió el SIDA y va en la mañana a hacerse el
examen y le sale negativo aunque se acaba de contagiar). Entonces cuando tenemos
una condición existe la posibilidad de tener una verdad positiva, una verdad negativa,
falsos positivos y falsos positivos.
Lo otro que puede haber que la persona no tenga le enfermedad y lo lógico es que el
test le diga que no tiene la enfermedad lo que sería una verdad negativa. (Se
desprende que la verdad positiva vendría siendo cuando el test le indica que sí tiene
la enfermedad y en realidad sí la padece).
En odontología se utiliza mucho este tipo de tablas para realizar los test de
sensibilidad y especificidad que es basado en estas tablas que se usan en diagnóstico
donde le den falsos negativos o falsos positivos o verdaderos negativos o verdaderos
positivos. La sensibilidad es la proporción de sujetos con la enfermedad que tiene el
test positivo o sea la sensibilidad de un test se obtiene al dividir los verdaderos
positivos por la suma de esa columna a + c. (Hay que ver la tabla que describe el
profesor) Y la especificidad de un test es la proporción de sujetos sin la enfermedad y
que tienen el test negativo o sea la especificidad de un test es dividir la b, los
verdaderos negativos por el total de esa columna b / b + d.
Por ejemplo si una mamá tiene úlcera en el estómago y se busca si los hijos tienen el
germen, en caso de que no lo tengan, el estudio presentará una sensibilidad baja y la
especificidad va a ser alta por ejemplo si la mamá no tiene el germen lo más probable
es que los niños tampoco presenten el helicobacter pilori.
En una variable intervalar, en las cuales por ejemplo hemos medido un promedio,
tenemos que presentar los datos así, un título, el grupo femenino, el masculino, el n,
el promedio la desviación estándar. Y generalmente al pie de la tabla esto se compara
con test estadístico que ustedes verán en quinto año.
• Debe ser sencillo y auto explicativo, ojalá con poca cantidad de elementos lo
suficiente para entender, cómodo a la vista.
• Representar fielmente los hechos.
• No impresionar con colores extremadamente llamativos ni falsear la realidad
• Ni modificando las escalas
• Ni utilizar los gráficos tridimensionales.
• Evitar colores que molestan a la vista por ejemplo con color morado sobre un fondo
negro o colores muy chillones.
• Cuando hace cajas se rellena con color pero no con rayas y si las ocupa prefiera las
oblicuas (esto lo saben muy bien las mujeres porque si es chica y se pone un traje de
rayas generalmente se ve más chica o una gorda que usa traje de rayas horizontales
se ve más gorda y más baja).
• Tiene que hacerlo agradable a la vista.
• Se recomienda que tenga una proporción de 1 es a 1,5 entre la longitud de los ejes
(sección áurea).
• En las barras, las categorías de una misma variable deben ir del mismo color, no hay
que abusar con los colores y la cantidad de categorías.
• Debe ser limpio. Generalmente sea cual sea la especialidad que siga no tiene para
que poner una abuelita con una sonrisa a menos que ese grafico lo vaya a llevar a un
jardín infantil (al Jardín infantil Pipiripao, allá lleven esos gráficos para entusiasmar a
los niños) pero si lo va a presentar en una tesis o congreso no se usa que ponga
muelitas con rositas, es absurdo.
• El gráfico debe ser limpio, de trazos netos, los títulos con letra clara y leyendas
ubicadas en lugares adecuados.
Eso es fundamental.
BARRAS SIMPLES
Presentan la distribución de frecuencias de variables nominales, ordinales e
intervalares discretas.
Cada categoría se representa por una barra: su largo indica frecuencia, promedio
(en la intervalar), porcentaje de casos u otro.
Cada barra lleva un título; si es largo (barras transversales), y si es corto (barras
verticales).
El orden de las barras está dado por su longitud o por la secuencia más lógica de
las categorías (alfabético, por regiones de Chile, etc.)
Evitar colocar títulos, números o claves, sobre o dentro de las barras.
Rápidamente ve donde hay más y con que frecuencia se da con respecto a las otras.
BARRAS AGRUPADAS
Muestran la relación de dos o más variables nominales, ordinales e intervalares
discretas.
Se dibujan grupos de barras que son subdivisiones de una clasificación más
general.
Las barras de cada grupo deben tener rayados diferentes para cada subdivisión,
con una leyenda.
Se clasifica primero por la variable con más categorías, a menos que se pierda
claridad en la demostración de los hechos o no se cumpla con el objetivo real del
gráfico.
BARRAS SUBDIVIDIDAS
Una barra que la subdivide para indicar la importancia que tiene una categoría en
cuento a su porcentaje.
Ilustran la composición proporcional de distintas categorías.
El largo representa el 100%
Se indica cuando en algunas categorías el 100 ó 0% de las unidades pertenece a
uno de los subgrupos. (En un gráfico de barras agrupadas, se presenta el problema
de no tener frecuencia para una de las barras).
Cuando se tienen más de tres subdivisiones por barra se dificulta la comparación.
SECTORIALES
El gráfico de torta.
Se utilizan para los mismos casos que los gráficos de barras, fundamentalmente
para variables nominales u ordinales.
Cada frecuencia o proporción debe ser expresada como porcentaje del total del
gráfico o porción de la torta (360º), determinando el ángulo que limita el sector que
representa la categoría correspondiente, el ángulo relacionado con el tamaño de ese
grupo.
Cada sector debe ser identificado.
Colocar el número de observaciones y la frecuencia en porcentaje, adyacente a
cada categoría.
Ordenado de mayor a menor para facilitar su entendimiento partiendo idealmente
desde las 3.15 siguiendo o en contra de las agujas del reloj. (En Excel este
ordenamiento no se puede hacer.)
HISTOGRAMAS
Presentan la distribución de frecuencias de variables intervalares continuas.
Tenemos un rango de valores que se van a representar por una serie de
rectángulos.
Consisten en una serie de rectángulos o barras adyacentes, cuyas superficies
representan la frecuencia de cada categoría.
Cuando los intervalos son iguales, las barras tienen el mismo ancho y su altura
corresponde a la frecuencia observada en el intervalo.
Este gráfico le permitirá la obtención de una campana de Gausse para saber si hay
una distribución normal de los valores o no. Puede que se de un sesgo, o sea que los
datos se acumulen en un solo lado del gráfico.
Cuando los intervalos son desiguales, las barras tienen diferente ancho. Se ajusta
al ancho de los intervalos, Histograma Ajustado.
LINEAL
Le permiten ver la relación entre variables intervalares continuas.
Tenemos un eje X y un eje Y.
En el eje X tenemos la variable independiente y en el eje Y la variable dependiente.
Y ambos generalmente debieran partir de 0. (Por ejemplo si va a medir la presión
no necesita partir de 0, hay software que tienen esta opción.)
Tiene que tener pares de observaciones o sea debe tener un valor para el eje X y
un valor para el eje Y.
El computador se va a encargar de hacerle la línea, si no tiene computador y lo va a
hacer a mano tiene que encontrar la ecuación que define la relación entre ambas
variables.
PLOTS DE DISPERSIÓN
Gráficos de dispersión y correlación, no se representa sólo una línea sino que se
presentan una serie de valores.
Tenemos variable dependiente e independiente.
Pares de observaciones, un valor para el eje X y un valor para el eje Y.
Los ejes deben tener la misma longitud y cada eje debe estar identificado.
Los puntos generalmente no se unen, tenemos como una nube de valores pero en
el computador podemos obtener como se relacionan esos valores.
Cada punto es un individuo y al sumarlos obtenemos una nube.
DE CAJAS O DE BOX PLOTS
Fue inventado en la década del 70’ pero cada vez es más utilizado porque es muy
informativo.
Se basa en una caja que tiene una línea al medio de ella que representa la mediana
y que sirve para variables intervalares. O sea aquellas variables donde uno ha podido
sacar promedio y desviación estándar.
Las líneas perpendiculares que van a ver en relación a la caja significa dispersión
de los valores pero para un cierto rango y los valores que están muy alejados de la
distribución normal los marca con un asterisco (*) y los muy alejados los va a marcar
con un cero (0).
Rápidamente con un grafico sencillo que consiste en una caja y dos bigotes ve la
distribución de las observaciones.
Bigotes son los palitos al medio de la caja, las patitas, en inglés es whisker.
Si no aparece un círculo o un asterisco quiere decir que tiene una distribución
normal.
Es un gráfico sencillo, limpio, auto explicativo y permite darse cuenta rápidamente
como se distribuye una variable intervalar.
Rápidamente ve la mediana, donde está el 50% de los valores que es el largo de la
caja (determinado por sus bisagras), el 25% de los valores superiores y el 25% de los
valores inferiores con los bigotes.
Muchas veces se ponen varias cajas en un mismo gráfico es para comparar como es
la distribución entre grupos.
Si las cajas están a muy diferentes alturas probablemente cuando se hagan los test
estadísticos va a encontrar diferencias significativas entre los grupos.
Si hay varios individuos que aparecen con un 0 es probable que la distribución no
sea normal
Y si la mediana no aparece en la mitad de la caja quiere decir que tampoco hay
distribución normal en esos valores.
BIBLIOGRAFIA