Académique Documents
Professionnel Documents
Culture Documents
INSTRUCTIVO PARA LA
ELABORACIÓN DE GRAFICOS
EN EXCEL
CATEDRA DE BIOESTADISTICA
-2008-
Guía para la elaboración de gráficos en Excel
Este es un instructivo para aprender a confeccionar gráficos en Excel a partir del uso de
Tablas Dinámicas (TD). Se usarán TD para confeccionar tablas de frecuencias a partir de la
planilla de datos construida. A partir de estas tablas se confeccionarán los gráficos
correspondientes.
La construcción de gráficos se debe realizar en Microsoft Excel (la Cátedra cuenta con la
Versión 2003), teniendo en cuenta las siguientes indicaciones:
1. La elección del tipo de gráfico depende del tipo de variable que se desea graficar
a) Variables cualitativas dicotómicas: diagramas circulares (en porcentaje)
b) Variables cualitativas ordinales: barras simples del mismo color ordenadas por
categoría (en números absolutos o en porcentaje)
c) Variables cualitativas nominales: barras simples del mismo color ordenadas por
frecuencia de mayor a menor o de menor a mayor (en números absolutos o en
porcentaje)
d) Variables cuantitativas discretas: barras simples del mismo color (en números
absolutos o en porcentaje)
e) Variables cuantitativas continuas: histograma
f) Asociación de variables cualitativas: gráfico de barras proporcionales
g) Correlación entre variables cuantitativas: gráfico de dispersión
2. En el caso de variables continuas corresponde realizar un histograma a partir de intervalos
de clase de igual amplitud, pero en el caso de que los intervalos sean menos de 5, se
puede optar por un gráfico de barras simples en el que los intervalos no necesariamente
deben tener la misma amplitud.
3. Todos los porcentajes se deben presentar redondeados, es decir, sin cifras decimales. Por
ejemplo:
a) Un número se redondea hacia arriba si la parte fraccionaria es mayor a 0,5
20,6 se redondea a 21
b) Un número se redondea hacia abajo si la parte fraccionaria es menor a 0,5
20,3 se redondea a 20
c) Si la parte fraccionaria es igual a 0,5:
I. Se redondea hacia arriba si la parte entera es impar
21,5 se redondea a 22
II. Se redondea hacia abajo si la parte entera es par
20,5 se redondea a 20
4. En el caso que el total sobre el que se calcula el porcentaje es menor de 15, no
corresponde sacar porcentajes, sólo se usan frecuencias absolutas.
5. No realizar gráficos en tres dimensiones (3D) debido a que dificulta la lectura e
interpretación de los mismos.
6. Las categorías de variables que presenten frecuencia igual a 0 (cero) no se incluyen en el
gráfico pero se comentan.
7. Los títulos de los gráficos se deben redactar en el cuerpo del texto del trabajo (Word), los
mismos deben hacer referencia a la variable que se está graficando y a la población bajo
estudio (encuestados, pacientes, niños, adultos mayores, etc.). En el caso de que se trate
de gráficos en porcentaje se debe agregar al lado del título la base respecto de la cual se
calcularon los porcentajes (n=…..).
8. Evitar el uso de abreviaciones en los títulos, tablas y gráficos.
1
9. Los comentarios de los gráficos deben ser breves y expresar lo que se considere de interés
para destacar, evitando reproducir toda la información del gráfico. Tampoco corresponde
dar opiniones personales en los comentarios, esto se realiza en la discusión.
10. Todos los gráficos se deben realizar y modificar en Excel y recién copiarlos como imagen
en el texto correspondiente al trabajo (Word), caso contrario, si se intenta modificar por
ejemplo el tamaño del gráfico en Word, se altera su formato de origen. En el caso de haber
copiado el gráfico en el texto y luego surge la necesidad de cambiarlo, se debe suprimir el
gráfico en Word, modificarlo en Excel y copiarlo nuevamente en el texto.
Para una mayor claridad se indicarán los pasos para el uso de las herramientas a través del
siguiente ejemplo:
EJEMPLO: Suponga que desea conocer el grado de conocimiento sobre Síndrome Bronquial
Obstructivo (SBO) en madres o tutores de niños menores de 5 años que concurren al
consultorio de pediatría de un cierto hospital y su asociación con el nivel de instrucción. Las
variables estudiadas fueron: edad madre/tutor (medida en años); sexo madre/tutor;
instrucción registrada como analfabeto, primario (completo e incompleto), secundario
(completo e incompleto); ocupación clasificada en trabajador permanente, trabajador
temporario y no trabaja; conocimiento sobre SBO clasificada en bueno, regular o malo, si
recibió o no información previa sobre SBO y fuentes de información considerándose las
categorías: personal de salud, familiares, amigos, medios de comunicación (tv) y otros.
A continuación se presenta la tabla con los códigos correspondientes a las categorías de cada
una de las variables estudiadas en el ejemplo.
2
Figura 1: Planilla de datos del ejemplo
Variable edad
Para graficar la variable edad, previamente se debe agregar a la base de datos original
una nueva variable denominada “grupo etáreo” obtenida a partir de la codificación de los
intervalos de edad elegidos para representar la variable edad. Una vez realizado este
procedimiento se crea la tabla dinámica.
A partir de la tabla dinámica originada, se obtienen las frecuencias absolutas para cada
intervalo de edad como se muestra en la figura 2.
3
Con las frecuencias obtenidas de la tabla dinámica se debe crear una tabla
reemplazando los códigos con los nombres de las categorías a las cuales corresponden como
se indica en la figura 11 del “instructivo para el procesamiento de datos en Excel”.
Esta tabla debe cortarse y pegarse en una nueva hoja de cálculo.
1. Seleccionar la tabla
Figura 3: Paso 1
2. Una vez seleccionada la tabla hacer clic en el ícono asistente para gráficos
Figura 4: Paso 2
4
Figura 5: Paso 3
5
5. Dentro de la solapa “Títulos” tipear Edad en “Eje de categorías (X)” y Nº de
encuestados en “Eje de valores (Y)”.
Figura 7: Paso 5
Figura 8: Paso 6
6
Figura 9: Paso 7
8. Se abre una ventana en la que se puede optar por colocar el gráfico “En una hoja
nueva” o “Como objeto en” la hoja en la cual se encuentra la tabla. Para fines
prácticos es recomendable elegir “Como objeto en”, de esta manera, en una
misma hoja se tendrán todos los gráficos. Luego hacer clic en “Finalizar”.
7
Figura 11: Paso 9
En el caso de optar por realizar un histograma para la variable edad, continuar con el
paso 10, caso contrario pasar al paso 13.
10. Hacer doble clic dentro de cualquiera de las barras del gráfico, de esta manera se
abre la ventana “Formato serie de datos”.
8
11. Dentro de esta ventana, hacer clic en la solapa “Opciones”, allí en “Ancho de
rango” colocar el número 0 (cero). Luego hacer clic en “Aceptar”.
9
13. Finalmente hacer clic con botón derecho del Mouse sobre el gráfico, seleccionar
copiar y pegarlo en el archivo de Word correspondiente.
Se recomienda pegar el gráfico en Word como una imagen, para ello debe, luego de
copiarlo en Excel, elegir “Pegado especial” en “Edición” del menú principal de Word,
5
Nº de encuestados
4
4
3
3
2
2
1
1
0
25 a 29 30 a 34 35 a 39 40 a 44
años años años años
Edad
Se observó que el grupo etáreo más frecuente fue el de 40 a 44 años con un 40% (4) de los
encuestados, seguido del grupo de 35 a 39 años con un 30% (3).
Aclaración: Este comentario sólo es a modo de ejemplo, pero recordar que no corresponde sacar porcentajes
cuando el total de datos es menor a 15.
Recomendación:
Cuando el espacio que ocupan los nombres de las categorías de las variables y el título
correspondiente a la variable (título del eje X) resulta proporcionalmente grande con respecto al
tamaño del gráfico es conveniente disminuir el tamaño de la letra, para ello se debe hacer clic
con botón derecho en las categorías, luego seleccionar “Formato de ejes” y en la solapa
“Fuente” seleccionar un tamaño menor. Proceder de la misma manera para el título de la
variable.
Esta situación se observa en el gráfico 1 por lo que seguidamente se presenta el mismo con las
modificaciones recomendadas.
5
4
Nº de encuestados
4
3
3
2
2
1
1
0
25 a 29 30 a 34 35 a 39 40 a 44
Edad (años)
En este caso particular, además de la disminución del tamaño de letra, se modificó el nombre
de las categorías eliminando la palabra años en cada una de ellas y agregándola al título.
10
Variable sexo:
Al igual que la variable “Edad” se debe utilizar la tabla dinámica para obtener las frecuencias
absolutas de cada categoría de la variable “Sexo”.
11
Figura 16: Paso 4
5. Luego dentro de la solapa “Rótulo de datos” tildar “Porcentaje”, luego hacer clic
en “Siguiente”
12
Figura 18: Paso 6
8. Finalmente hacer clic con botón derecho del Mouse sobre el gráfico, seleccionar
copiar y pegarlo como imagen en el archivo de Word correspondiente.
Femenino
50% 50%
Masculino
13
Variable Nivel de Instrucción:
Al igual que la variable “Edad” se debe utilizar la tabla dinámica para obtener las frecuencias
absolutas de cada categoría de la variable “Nivel de Instrucción”.
14
Figura 21: Paso 4
15
Figura 23: Paso 6
16
Figura 25: Paso 8
10. Finalmente hacer clic con botón derecho del Mouse sobre el gráfico, seleccionar
copiar y pegarlo como imagen en el archivo de Word correspondiente.
7
Nº de encuestados
8
6
4
2
2 1
0
Analfabeto Primario Secundario
Nivel de Instrucción
Se observó que el nivel de instrucción más frecuente fue el primario con 70% (7) de
los encuestados.
17
Variable Ocupación:
Al igual que la variable “Edad” se debe utilizar la tabla dinámica para obtener las frecuencias
absolutas de cada categoría de la variable “Ocupación”.
Al tratarse de una variable nominal corresponde ordenar las categorías por orden de frecuencia
(de mayor a menor ó de menor a mayor), para esto deberá seleccionar la tabla creada y en
“Datos” del menú principal seleccionar “Ordenar” como se muestra en la figura 27.
18
De esta manera se obtiene la tabla con los datos ordenados por frecuencia. Con esta
tabla se procede a realizar el grafico.
19
Figura 30: Paso 9
10. Finalmente hacer clic con botón derecho del Mouse sobre el gráfico, seleccionar
copiar y pegarlo como imagen en el archivo de Word correspondiente.
6 5
5
4 3
3 2
2
1
0
Trabajador No Trabaja Trabajador
Temporario Permanente
Ocupación
La ocupación más frecuente fue “trabajador permanente” con el 50% (5) de los
encuestados y la menos frecuente fue “trabajador temporario” con el 20% (2).
20
categoría codificada como 1, que representa “Si”, de cada una de las fuentes de
información.
Figura 31: Uso de la tabla dinámica para la variable “Fuente de Información” (Personal de Salud)
Con las frecuencias absolutas obtenidas de la tabla dinámica se debe crear una tabla en
la hoja de cálculo de los gráficos reemplazando el código 1 con el nombre de la fuente. Este
procedimiento se repite para todas las fuentes. Así se obtiene la siguiente tabla previamente
ordenada por frecuencia:
21
A partir de las frecuencias absolutas se calculan las frecuencias relativas
(porcentajes) correspondientes a cada fuente de información considerando como
base para dicho cálculo el total de encuestados que recibieron información, en el
ejemplo el total de personas que recibieron información es de 5. Con estas
frecuencias se construye el gráfico de barras simples, siguiendo los pasos descriptos
para graficar la variable ocupación.
70% 60%
60%
50% 40% 40%
40%
30% 20%
20%
10%
0%
Amigos Personal de TV Familia
Salud
Fuente de información
Se observó que la fuente más frecuente fue “amigos” con el 60% (3) de los encuestados que
recibieron información y la menos frecuente “familia” con el 20% (1).
Nota: Cuando se tienen variables como por ejemplo “Factores de riesgo”, en los que se ve la
presencia de distintos factores de riesgo se recomienda realizar un gráfico de barras simples,
donde cada barra representará la presencia de cada factor de riesgo estudiado (ej: Factores de
riesgo para SBO: conocimiento sobre SBO malo; presencia de fumadores en el hogar;
inadecuado saneamiento ambiental), como el ejemplo de la variable “Fuente de Información”.
22
Gráficos para la asociación de dos variables cualitativas
Con las frecuencias obtenidas de la tabla dinámica (Fig. 34) se debe crear una tabla
reemplazando los códigos con los nombres de las categorías a las cuales corresponden como
se indica en la figura 11 del “instructivo para el procesamiento de datos en Excel”.
Esta tabla debe cortarse y pegarse en una nueva hoja de cálculo. (Fig. 35)
23
Las celdas vacías indican que no hubo frecuencia en esa celda, por ejemplo se observa
que no hubo ningún individuo con conocimiento bueno que no haya recibido información.
Para graficar esta tabla se usará el gráfico de barras proporcionales. Es importante
destacar que cada barra llega al 100% en el eje vertical del gráfico y no se tuvieron que
calcular los porcentajes con anterioridad a la confección del gráfico, además es importante que
se muestre la leyenda del gráfico. Se deben agregar rótulos en el gráfico, estos aparecen en
frecuencias absolutas. Estos rótulos son necesarios para que los docentes de la cátedra
puedan realizar el cálculo del test de asociación correspondiente
24
Figura 37: Paso 4
5. En la solapa “Rótulo de datos” tildar “Valor”, luego hacer clic en “Siguiente” y por
último en “Finalizar”.
25
Figura 39: gráficos de asociación
100%
1
80%
3 Malo
60%
3 Regular
40%
Bueno
20% 2
1
0%
No recibió Si recibió
información información
Se observó que entre los que no recibieron información el 60% presentó un conocimiento malo
sobre SBO, en tanto que entre los que si recibieron información el conocimiento malo fue del
20%.
26