Académique Documents
Professionnel Documents
Culture Documents
Estadística: conjunto de métodos, técnicas o procedimientos que se utilizan para manejar los datos
numéricos, es decir, es el método que permite recolectar, elaborar, analizar e interpretar datos
numéricos. La estadística es la ciencia que se ocupa del manejo de estos datos numéricos, e implica
el estudio de la variabilidad, se clasifica en:
Estadística General.
Estadística aplicada a un campo específico.
Bioestadística.
El estudio estadístico se clasifica en:
*Cronológico: longitudinal (ej. Registro) y transversal (ej. Censo).
*Analítico: descriptivo e inductivo (en base a una hipótesis).
*Operativo: retrospectivo, prospectivo y actual.
Universo y muestra
Universo o población (N): son todas las unidades de observación, individuos o conglomerados que
tienen características susceptibles de ser estudiadas.
Tipos de universo:
1. Según su extensión el universo puede ser:
-Finito: número limitado de individuos, es bien delimitado, el número de unidades de observación
se conoce. Ej. N° de pacientes en un hospital, N° de estudiantes de una escuela, etc.
-Infinito: número ilimitado de individuos. No tiene límites conocidos. Ej. N° de pacientes que
tienen una determinada enfermedad a nivel mundial.
-Hipotético: transformación del número de infinito a finito. Ej. Llevar el N° de pacientes con
diabetes a nivel mundial (N° infinito) a un número hipotético de los mismos y utilizar dicha
suposición durante un estudio (N° finito).
2. Según su estructura el universo puede ser:
-Homogéneo: constituido por unidades de observación o elementos con características similares o
idénticas. Ej. El volumen sanguíneo de una persona.
*Nota: cuando el universo (N) es homogéneo, las muestras (n) son representativas SIEMPRE.
-Heterogéneo: formado por unidades diferentes que forman estratos por cada tipo de unidad. Ej.
Una localidad, es un universo constituido por niños, jóvenes, adultos, ancianos, de ambos sexos.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 3
Muestra (n): parte cualquiera del universo, desde 1 unidad de observación hasta una unidad menos
que el total. Ej. Un universo igual a 100 pacientes. La muestra puede ir de 1 a 99 pacientes del total.
Las muestras deben ser adecuadas en cantidad y calidad:
Cantidad: ni más de lo necesario, ni menos de lo suficiente.
Calidad: debe reflejar todas las características del universo del cual procede. Según su calidad las
muestras pueden ser:
- Representativas: reproduce en pequeño todas las características de N. (Muestras
probabilísticas)
- No representativas o seleccionadas: solo representa una o varias características (pero no
todas) de N. No son adecuadas para la inferencia estadística. La selección puede ser
voluntaria o involuntaria.
*Selección involuntaria: se toma la muestra de un solo sector del universo. Los individuos a
estudiar NO se escogen al azar. Tomada la muestra hay circunstancias que impiden estudiar la
totalidad de los individuos incluidos.
Error por muestreo: es la diferencia entre el valor dado por la muestra y el verdadero valor del
universo. Se disminuye aumentando el tamaño de la muestra.
Verdadero valor (N) – valor dado (n)
Las muestras pueden ser cualitativas y tendrán dos características:
Representabilidad: es una buena cualidad de la muestra, el procedimiento de obtención es
probabilístico o de azar. TODAS LAS MUESTRAS REPRESENTATIVAS SON MUESTRAS
PROBABILÍSTICAS.
Selección: es una cualidad negativa de la muestra respecto a representabilidad que se produce al NO
usar el azar en su obtención o usarlo de forma inadecuada.
Tipos de muestra:
Probabilística No probabilística
Las muestras son: Las muestras son:
1. Representativas. 1. No representativas.
2. No seleccionadas. 2. Seleccionadas.
Cada uno de los componentes del universo Los criterios de selección de la muestra no
tiene la misma probabilidad, diferente de dependen del azar sino de la opinión de un
cero, de ser escogido al momento de elegir experto, por disponibilidad de recursos, u
la muestra. otros criterios no azarosos.
Azar simple No disponibilidad de recursos
Azar sistemático Voluntaria
Modelo estratificado Opinática (opinión de cualquier
Modelo por conglomerado persona)
Modelo por procedimiento Por criterio (opinión de un experto)
combinado
Muestra.
Ventajas: hay representatividad de cada sector.
Desventajas: puede haber dispersión y necesita lista.
4. Modelo por conglomerado: se subdivide al universo en grupos o conglomerados de individuos y
se estudian todos los del grupo seleccionado al azar. Ej. De los tres grupos formados, según su
forma, se elige un grupo por medio del azar, para representar al universo y pasando a conformar la
muestra.
Muestra.
5. Modelo por procedimiento combinado: se pueden tomar dos o más modelos y combinarlos. Se
combina el modelo estratificado con el conglomerado.
Posible ejercicio de práctico: Se tiene el país dividido en cuatro zonas geográficas, cada una de las
cuales tiene 100 Hospitales, con50 pacientes cada uno, para un total de 400 hospitalesy 20.000
pacientes, de los cuales se desea estudiar 2000.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 5
La muestra debe ser de 2.000 pacientes, y se puede obtener por cualquiera de los métodos antes
mencionados:
1. Por azar simple: se escogen al azar los 2.000 individuos a estudiar.
2.Por azar sistemático: necesita primeramente una lista del universo, y fracción de muestreo (FM)
FM = 20.000 pacientes (que es el universo “N”) / 2.000 pacientes (es la muestra requerida “n”)
FM = 10
Esto quiere decir que utilizando la lista, cada 10 pacientes, se escoge un paciente para formar parte
de la muestra.
3. Por azar estratificado: se divide al universo en estratos, se escoge al azar de cada estrato, los
individuos que van a formar la muestra. Se escogen 500 pacientes de cada zona geográfica, para
completar la muestra requerida de 2.000 pacientes. (500 x 4 = 2.000).
500 pacientes 500 pacientes
- -
5. Por azar combinado: se obtiene esta muestra escogiendo al azar 10 hospitales de cada una de las
zonas geográficas, estudiando la totalidad de sus pacientes. (10 hosp x 4 zonas = 40 hospitales; y 40
hosp x 50 pacientes c/u = 2.000 pacientes de muestra)
10 hospitales 10 hospitales
10 hospitales 10 hospitales
*Nota: para diferenciar el azar estratificado, del combinado: en azar estratificado se escogen
INDIVIDUOS por cada estrato (en este caso, por cada zona geográfica se escogen 500 pacientes),
pero en el azar combinado se escogen GRUPOS dentro de cada estrato (en este caso por cada zona
geográfica se escogen 10 hospitales, ya eso corresponde a grupos, dentro de dicho estrato, y NO
individuos). Por otra parte, el azar por conglomerado estudia un solo grupo elegido al azar dentro de
un estrato (40 hospitales de una sola zona geográfica completa toda la muestra requerida de 2.000
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 6
pacientes; a diferencia del azar combinado, para obtener esos 40 hospitales, se distribuyen 10
hospitales en cada zona geográfica, y se completa la muestra requerida). Es importante diferenciar
cada modelo, pues en los prácticos lo evalúan.
Edad (años)
0-4
5-9 Esta escala SI ES EXHAUSTIVA y está BIEN DEFINIDA
10-14
15-19
-Explícita
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 7
-Coherente: esto es que las clases guarden relación entre sí. Ej. Si se habla de grupos etarios,
corresponde a: niño, joven, adulto, anciano. En cambio si se habla de edad en años: 0-4, 5-9, 10-14,
15-19.
Particularidades de las clases de la escala:
Si las escalas son cualitativas, no tienen clases, y no se utiliza el intervalo de clase (IC).
Si la escala es cuantitativa, sí tiene clases y el intervalo de clase (IC) sí se calcula.
Ej. Edad (años)
0-4 (1° clase)
5-9 (2° clase) Clases
10-14 (3° clase)
15-19 (4° clase)
Los límites de clase son aparentes y/o verdaderos.
Los límites verdaderos se utilizan para hacer cálculos.
*Límites verdaderos*
Cuando la variable es Cuantitativa Discontinua, los límites aparentes (LA) son iguales a los
límites verdaderos (LV). => LA=LV
Ej. N° de hijos.
LAI LAS LVI LVS
1 - 3 1 - 3
4 - 6 4 - 6
*LAI: límite aparente inferior *LAS: límite aparente superior
*LVI: límite verdadero inferior *LVS: límite verdadero superior
Cuando la variable es Cuantitativa Continua… Ej. Peso (kg).
Para determinar los límites verdaderos debe tomarse en cuenta la U.M.M. (unidad mínima de
medición), que es la mínima existencia teórica que puede haber entre dos elementos.
LVI= LAI – ½ UMM
LVS= LAS + ½ UMM
Ej. Peso (kg)
LAI LAS LVI LVS LVI= 60 – 0,5 =59,5
60 - 64 59,5 - 64,5 LVS= 64 + 0,5 = 64,5
Para las variables Cuantitativas Continuas Especiales (edad, tiempo y dinero).
El límite verdadero inferior es igual al límite aparente inferior (LVI = LAI).
Mientras que el límite verdadero superior:
LVS= LAS + 1UMM
Ej. Edad (años)
LAI LAS LVI LVS LVS = 64 + 1 = 65
60 - 64 60 - 65
*Amplitud de clase: diferencia entre los límites verdaderos de clase. (AC = LVS – LVI)
Ej. Peso (kg) 60 – 65 AC= 65-60 = 5
*Punto medio de clase: suma de los límites verdaderos de clase divididos entre 2.
Ej. Peso (kg) LAI LAS Punto medio: LVI + LVS / 2
60 – 65 = 59,5 + 65,5 / 2 = 62,5
*Amplitud total o rango: Valor Máximo – valor mínimo + 1 U.M.M.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 8
Análisis:
1. Según edad, el rango más frecuente para desarrollar cardiopatía isquémica (CI) es de 60-69 años,
donde se encuentran 41 pacientes, representando el 34,5% del total.
Nota: hay que fijarse en la columna del total (**), el mayor N° es igual a 41pacientes que se
encontraron en el rango de edades de 60-69; los pacientes que con mayor frecuencia egresaron del
HURP con CI, comprenden el rango de edad de 60-69 años.
2. Según sexo, el sexo masculino es el más frecuente, donde se encuentran 76 pacientes del total de
egresados.
Nota: hay que fijarse en la fila del total (*), el mayor N° es igual a 76, que se encontraron en el sexo
masculino, por ende, los pacientes que con mayor frecuencia egresaron del HURP con CI son de
sexo masculino.
3. En el grupo etario de 60 – 69 años, hay mayor frecuencia del sexo masculino.
Nota: se sabe que el rango de edades que predomina es de 60-69 años, porque hay un mayor
número de pacientes egresados con CI que presentan esa edad, pero lo que no se sabía es que sexo
predomina en ese rango de edad de 60-69 años.
4. De 40-79 años predomina el sexo masculino sobre el femenino.
Nota: esto contesta la pregunta ¿El sexo masculino predomina más que el femenino en que rango de
edades? Para contestar dicha pregunta, habrá que fijarse en las columnas de masculino y femenino
y comparar los datos.
5. En las edades de 80-89 años predomina el sexo femenino sobre el masculino.
Nota: al fijarse en la columna del sexo femenino y masculino, el único rango de edades en el que
hay más egresados con CI de sexo femenino que masculino es de 80-89 años, en todos los demás
rangos de edades los pacientes masculinos egresan con más frecuencia.
Ahora ¿En qué rango de edad tiene más riesgo de sufrir CI un paciente de sexo masculino o de
sexo femenino? Hay que hacer un cálculo por rango de edad y por sexo:
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 10
40-49 años
Masculino: 6/9 * 100 = 66,67% Femenino: 3/9 * 100 = 33,33%
Nota: por cada rango de edad, y por sexo se va a dividir el N° (masculino o femenino), entre el N°
total en ese rango de edad y se multiplica por 100. Si se nota la primera fila de la tabla en el rango
de edad de 40-49 años, el N° de pacientes egresados de sexo masculino son 6, este dato dividido
entre el total de pacientes egresados en ese rango de edad que son 9, y multiplicado por 100, da
igual a 66,67%. Ese es el porcentaje que dichos pacientes masculinos de 40-49 años de edad,
tienden a sufrir alguna CI. Para saber en qué rango de edad un paciente masculino o una paciente
femenina tienen más riesgo de sufrir CI, habrá que hacer todo el procedimiento mencionado
anteriormente.
50-59 años
Masculino: 21/29 * 100 = 72,41% Femenino: 8/29 * 100 = 27,59%
60-69 años
Masculino: 26/41 * 100 = 63,41% Femenino: 15/41 * 100 = 36,59%
70-79 años
Masculino: 18/28 * 100 = 64,29% Femenino: 10/28 * 100 = 35,71%
80-89 años
Masculino: 5/12 * 100 = 41,67 % Femenino: 7/12 * 100 = 58,33%
Ahora se selecciona el mayor porcentaje en el sexo masculino y en el femenino:
En el rango de edad de 80-89 años una paciente de sexo femenino tiene un mayor riesgo de sufrir
una CI, con una incidencia del 58,33%.
En el rango de edad de 50-59 años un paciente de sexo masculino tiene un mayor riesgo de sufrir
una CI, con una incidencia del 72,41%.
Y ¿cuál es el rango de edad en general que tiene un mayor riesgo de sufrir CI? (Independientemente
del sexo; para esto se verifica el mayor porcentaje obtenido).
El rango de edad de 50-59 años, en pacientes masculinos arrojó una incidencia del 72,41%
14. F 50 139
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 11
15. F 60 140
“Pacientes hipertensos hospitalizados según edad.
Departamento de Medicina, Hospital Ruiz y Páez.
Primer trimestre. Año 2015”.
Tabla N° 1:
Edad (años) Pacientes Porcentaje
20-28 3 20% 1. Edad (años) 2. Edad (años)
20-28 20-28
29-37 4 26,66% 29-37 29-37 *Siempre que
38-46 1 6,67% 38-46 38-46 se aproxime la
47-55 5 33,33% 47-55 47-55 escala no es
56-66* 56-64 exhaustiva.
56-64 1 6,67% *Nota: Se aumentó la amplitud 65-73*
65-73* 1 6,67% de la última clase. *Nota: se agregó una clase
adicional.
TOTAL: 15 100% 1. Se puede aumentar la amplitud de la última clase para hacer una
escala exhaustiva.
Fuente: Tabla general de la clase. 2. Otra opción es agregar otra clase adicional. Si se va a hacer gráfico de
una tabla es preferible esta opción.
*Nota: Se agregó una clase adicional.
Nota: Para realizar ésta tabla habrá que vaciar los datos que fueron suministrados anteriormente, al
principio del ejercicio (la tabla en cuanto a sexo, edad, y PA sistólica), en este caso como es una
tabla de distribución de frecuencias, es con una sola variable, y se utiliza en esta ocasión la edad.
Primeramente se calcula el intervalo de clase (IC) con los datos de edad, el IC = 9. Luego, se
construye la tabla empezando con el valor mínimo de edad, que es 20, y este será el límite aparente
inferior (LAI) de la 1°clase; y luego se le suma el intervalo de clase que es 9 (20+9 =29), y 29 será
el LAI pero de la 2° clase, y así sucesivamente, como aparece en la Tabla N° 1. Según el número de
clases debe ser 5, pero como el IC dio 9,4 y se aproximó a 9 debido a que la variable acepta
números enteros, esto influye y hace que la escala no sea exhaustiva, es decir, no incluye a todos los
individuos, porque llegaría hasta 64, y dentro de los datos de edad hay un valor que es igual a 66, es
así que debido a la aproximación que se realizó en el IC ya no se incluye este valor (66) en la tabla.
Bajo estas circunstancias, hay dos opciones que van a afectar a una de las clases de la tabla y que es
necesario colocar en una nota explicativa debajo del cuadro.
Primero, se puede aumentar la amplitud de la última clase para hacer de esta escala exhaustiva, e
incluir al valor que falta de los datos de edad que es 66 años. Pero esta opción no es recomendable
si los datos de la tabla se van a graficar.
Y segundo, se puede agregar una clase adicional, se hace exhaustiva la escala y es recomendable en
caso de querer graficar los datos del cuadro.
Luego de hacer la modificación de la clase (por cualquiera de las opciones mencionadas
anteriormente), se debe notificar en una nota explicativa, (como aparece en los dos ejemplos arriba
en la nube).
En cuanto a vaciar los datos de la tabla general a la tabla N° 1, los datos proporcionados en la tabla
general son de 15 pacientes, y con respecto a la edad, estos datos van a variar. Ya para calcular el
IC fue necesario establecer cuál era el valor máximo y cuál era el valor mínimo (66 y 20
respectivamente), esto quiere decir que los datos que restan están dentro de este rango, y luego de
construir la tabla, con las distintas clases, se debe ubicar cada dato (cada edad) de la tabla general en
la clase que le corresponde. Por ej. El primer dato de la tabla general es 35 años, este dato se
agruparía en la 2° clase de la tabla que va de 29 a 37 años. Y así sucesivamente se hace con el resto
de las edades, hasta completar toda la tabla.
Para calcular el porcentaje, se divide la frecuencia de cada clase entre el total, y luego se multiplica
por 100. Ej. 1° Clase: 3/15 * 100 = 20% 2° Clase: 4/15 * 100 = 26,66%
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 12
Tipos de gráficos
1. Diagrama de Barras: representado por rectángulos horizontales o verticales. Las barras deben
ser de igual anchura, y el espacio interbarra que las separa no debe ser mayor a ellas. La escala de
frecuencia debe comenzar en cero (0), NUNCA se corta, sin excepción. Si la escala es nominal las
barras se agrupan de mayor a menor. Y si es ordinal no se puede romper el orden, debe respetarse el
orden de la tabla.
-Barras simples: se utiliza para las DISTRIBUCIONES DE FRECUENCIA en escala
CUALITATIVA o CUANTITATIVA DISCONTINUA.
- Barras múltiples: se emplea para representar DATOS DE ASOCIACIÓN cuyas dos escalas sean
CUALITATIVAS o CUANTITATIVAS DISCONTINUAS. En la abscisa va la variable que se
quiera resaltar.
2. Diagrama Sectorial: (no se utiliza en clase), se usa para DISTRIBUCIONES DE
FRECUENCIA con escala CUALITATIVA o CUANTITATIVA DISCONTINUA. Es alternativa a
la gráfica de barras. Pueden representarse cifras absolutas o porcentajes. Cada uno de los
porcentajes se multiplica por 3,6 y da en grados, para pasarlos a circunferencia se utiliza un
transportador. Cada 1% = 3,6 del círculo.
3. Histograma: el fenómeno que se estudia queda representado por una serie de rectángulos que
siempre se colocan vertical, y deben ir unos al lado de los otros sin ningún espacio que los separe.
Se utiliza para representar DISTRIBUCIONES DE FRECUENCIA con escala CUANTITATIVA
CONTINUA. Existen dos modalidades:
1. Cuando la amplitud de clase es igual se grafican los datos tal cual aparecen en la tabla. Aquí se
utilizan los límites verdaderos de las escalas.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 14
4. Polígono de frecuencias: se utiliza para representar DATOS DE ASOCIACIÓN con una escala
CUANTITATIVA CONTINUA y una CUALITATIVA. Son puntos ubicados en la parte media de
cada clase, a la altura que teóricamente alcanzaría la barra y se une por medio de líneas continuas o
discontinuas. Tiene dos modalidades igual que el histograma.
Ejemplos: Tabla N° 1:
Defunciones en menores de 50 años según causa. Estado Bolívar. 2014
Causa/Defunción N° Muertes
Accidente de tránsito 670
Enfermedades cardiovasculares 150
Cáncer 200
Otras causas 400
Total: 1.420
Fuente: Tabla general de la clase.
Gráfico N° 1:
Defunciones en menores de 50 años según causa. Estado Bolívar. 2014
N° Defunciones
680
510
340
170
0
Accidente Cáncer Enfermeda- Otras Causas de defunción
de tránsito des cardio- Causas
vasculares
Fuente: Tabla N° 1.
Nota: Este es un ejemplo de un gráfico de barras simples. Hay ciertos criterios que se deben cumplir
al realizar un gráfico, son los siguientes.
En el eje de las abscisas (eje de las “x”) tiene que ir la escala (variable) con sus diferentes clases. En
este caso la escala o variable es cualitativa nominal, y son las distintas causas de defunción, y sus
clases están en la tabla N°1. Si la escala fuera ordinal, al graficar dichos valores se tendría que
respetar el orden en el cual las clases se expresan en la tabla. Pero en este caso, como la escala es
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 15
240 Cáncer
0
Masculino Femenino Sexo
N° Defunción Sexo
480 Masculino
Femenino
360
240
120
0
Accidentes de tránsito Cáncer Enfermedades cardiovasculares Otras causas Causas
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 16
Análisis: En las defunciones del 2014 se observó una mayor frecuencia en el sexo masculino.
La causa más frecuente de defunción fueron los accidentes de tránsito.
En el sexo masculino la causa más frecuente de defunción fueron los accidentes de tránsito.
En el sexo femenino la causa más frecuente de defunción fueron otras causas.
La forma más frecuente de defunción fueron los accidentes de tránsito.
Nota: En esta tabla de datos asociados en la cual hay dos variables, se puede realizar un gráfico de
barras múltiples, el cual se hace de las dos formas que se observó anteriormente. En el eje de las
abscisas siempre irá la variable que se quiera resaltar, mientras que la otra variable que no se
destaque se mostrará en forma de leyenda.
En cuanto al análisis, éste se expresará con respecto a los datos que estén en la tabla, por ejemplo el
sexo que predomina es el masculino, porque según los datos tabulares el sexo masculino tiene 770
N° defunciones sobre el sexo femenino que su frecuencia es de 650. Y la causa más frecuente de
defunción es accidentes de tránsito porque es el que tiene la mayor frecuencia igual a 670. Se podría
concluir también cual es la defunción más frecuente en el sexo masculino, o en el sexo femenino,
todo esto, proporcionado por los datos de la tabla.
Tabla N°3:
Defunciones en menores de 50 años según edad. Estado Bolívar. 2014
Edad (años) N° Muertes
0-9 50
10-19 150
20-29 450
30-39 450
40-49 320
Total: 1.420
Fuente: Tabla general de la clase.
Gráfico N° 3:
Defunciones en menores de 50 años según edad. Estado Bolívar. 2014
N° Defunciones
460
345
230
115
0
0 10 20 30 40 50 Edad (años)
Fuente: Tabla N° 3.
Análisis: El rango de edad que tiene una mayor frecuencia de defunción es el que comprende de 20-
40 años.
Nota: Este gráfico es el histograma, se utiliza en caso de ser una sola escala cuantitativa continua,
este gráfico presenta dos modalidades como se explicó anteriormente, esta modalidad depende de la
amplitud de clase (AC) y si ésta es constante o no, es decir si la AC es igual en todas las clases, o
no. En la tabla N°3 la AC es igual, ya que en todas las clases la diferencia entre las edades es igual a
10. Por ej. La clase 1 va de 0-9 años, y la clase 2 va de 10-19 años, la diferencia que hay entre los
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 17
límites aparentes inferiores de las clases 1 y 2 (10 - 0) es igual a 10, así mismo, la diferencia entre
los límites aparentes superiores de las clases 1 y 2 (19 - 9) es igual a 10.
Es así que si la AC es igual, al momento de graficar la escala en el eje de las abscisas, se utilizan los
límites verdaderos (regresar a la pág. 7 donde se explican los límites verdaderos). En este caso la
escala es cuantitativa continua especial (edad) los límites verdaderos inferiores son iguales a los
aparentes inferiores, mientras que los límites verdaderos superiores es el límite aparente superior
más 1 U.M.M. Es así que lo que se graficaría en el eje horizontal sería: 0 – 10 – 20 – 30 – 40 – 50
Si fuera una variable cuantitativa continua (ej. Peso), los criterios para determinar los límites
verdaderos dicen que se debe tomar en cuenta es ½ U.M.M., y se graficaría en el eje horizontal:
0 – 9,5 – 19,5 – 29,5 – 39,5 – 49,5.
Tabla N°4:
Defunciones en menores de 50 años según edad. Estado Bolívar. 2014
Edad (años) N° Muertes Fi/AC
0-9 50 50/10 = 5
10-14 100 100/5 = 20
15-29 500 500/15 = 33,33
30-39 450 450/10 = 45
40-49 320 320/10 = 32
Total: 1.420
Fuente: Tabla general de la clase.
Gráfico N° 4:
Defunciones en menores de 50 años según edad. Estado Bolívar. 2014
N° Defunciones
48
36
24
12
0
0 10 15 30 40 50 Edad (años)
Fuente: Tabla N° 4.
Análisis: La mayor frecuencia en defunción está en el rango de edad correspondiente de 30-40 años.
Nota: En este caso para representar los datos tabulares se utiliza un histograma, pero en la
modalidad en la que las AC no son iguales, ya que en la primera clase la AC es 10, en la segunda
clase es igual a 5, y en la tercera clase la AC es igual a 15. Es así que es necesario dividir la
frecuencia entre la amplitud de cada clase y el resultado es lo que se graficará en el eje vertical de
las ordenadas, por ej. En la primera clase se divide la frecuencia que es 50 entre la amplitud de esa
clase que es 10, el resultado es igual a 5, eso es lo que se va a graficar.
Es necesario acotar que en el eje de las ordenadas donde irán representadas las frecuencias, se
verifica la mayor frecuencia (de la columna Fi/AC), en este caso es 45, se busca un número par que
sea mayor a 45, y que al dividirlo entre 4 dé un número entero, este es el 48 dividido entre 4 = 12.
Es así que se grafica 0, 12, 24, 36, 48 en el eje vertical.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 18
Tabla N°5:
Defunciones en menores de 50 años según edad y sexo. Estado Bolívar. 2014
Edad Sexo N° Muertes
(años) Masculino Femenino
0-9 30 20 50
10-19 100 50 150
20-29 200 250 450
30-39 250 200 450
40-49 220 100 320
Total: 800 620 1.420
Fuente: Tabla general de la clase.
Gráfico N° 5:
Defunciones en menores de 50 años según edad y sexo. Estado Bolívar. 2014
N° Defunciones
260 Sexo
Masculino
195 Femenino
130
65
0
0 10 20 30 40 50 Edad (años)
Fuente: Tabla N° 5.
Análisis: El rango de edad con más frecuencia de defunciones en el sexo masculino es el
correspondiente de 30-40 años. Y el rango de edad con más frecuencia a defunciones en el sexo
femenino es el que corresponde de 20-30 años.
Nota: este gráfico es un polígono de frecuencias.
Grupos control de los estudios comparativos: son imprescindibles para poder cotejar los resultados
obtenidos. Tipos:
- Control simultáneo: se estudia al mismo tiempo con el grupo experimental, y deben
tener características similares.
- Control histórico: se comparan los resultados observados en el grupo experimental con
los obtenidos en épocas pasadas.
- Universo como grupo control: compara los resultados del grupo experimental con el
resto del universo.
- Los mismos individuos como su propio grupo control.
Diseño del estudio:
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 19
- Tendencias centrales
- Medidas de dispersión
* Ambas escalas cuantitativas:
- Coeficiente de correlación
- Coeficiente de regresión
3. Series cronológicas: tendencias calculadas, cambios porcentuales y técnicas de regresión.
Ej. Tabla N° 1: “Pacientes según niveles de glicemia y sexo. Ambulatorio Nueva Guayana.
Enero 2015”.
Niveles de Sexo Total
glicemia (mg/dl) Masculino Femenino
60 – 79 12 23 35
80 – 99 24 31 55
100 – 119 32 18 50
120 – 139 41 26 67
140 – 159 11 9 20
Total 120 107 227
Fuente: Tabla general de la clase.
Proporc. Masc.= Hombres ÷ Total = 0,75 (ó ¾ ) Por cada 4 personas, 3 son hombres.
297 396
O, existe una probabilidad de 0,22 de seleccionar un paciente con un nivel de glicemia de 100- 119
mg/dl.
* Proporc. Masc. (100 – 139) = 32 + 41 /120 = 0,60
Por cada paciente masculino, hay una probabilidad de 0,60 de que tengan niveles de glicemia de
100 – 139 mg/dl.
Nota: con respecto a las proporciones, si se quiere conocer la proporción de masculinidad o
feminidad en un rango específico, se divide el total de masculino o femenino de ese rango, entre el
total general de masculino o femenino, tal es el caso del ej. N° 2.
- Porcentajes: es una misma proporción multiplicada por 100. Es dividir el número de cada
categoría entre el total, y multiplicarlo por 100.
Hombres Total
÷
297 =3960,75 * 100 = 75%
÷
Mujeres = 0,25
Total * 100 = 25%
99 396
2
Si la serie es impar: Ma = 15 + 1 / 2 = 8 [En la posición 8 está la mediana]
Posición 8 = 57 kg [Datos proporcionados por la tabla anterior]
Si la serie es par (como es el caso de la tabla anterior con 16 observaciones):
Ma = 16 + 1 / 2 = 8,5 [La posición 8,5 no existe, pero en este caso se toman en cuenta la suma de
las posiciones inmediatamente cercanas a 8,5 como lo es la posición 8 y la 9]:
Ma = 57 kg + 59 kg / 2 = 58 kg [57 kg (pos 8) y 59 kg (pos 9) según la tabla]
Análisis: En el estudio, la mitad de los individuos tienen un peso igual o menor a 58 kg, y la otra
mitad igual o mayor a 58 kg.
- Modo (Mo): es aquel valor que se observa con frecuencia en una serie.
Amodal -0: no hay observaciones con mayor frecuencia. Ej. 1-1-2-2-3-3-4-4
Modal -1 Bimodal -2 Polimodal -3 o más
Ej. Los datos que se repiten con más frecuencia de la tabla anterior: Mo = 57-60-64 Polimodal.
Medidas de dispersión: permite conocer cómo se distribuye un fenómeno alrededor de la 𝒙 ̅o Ma.
± √∑ 𝑑 2
- Desviación estándar o típica 𝑛
d = (xi -𝒙̅) => (frecuencia – media aritmética)
𝑑2 = (xi -𝒙̅ )2
Dicho esto, se podría sustituir también la fórmula de desviación estándar de la siguiente manera:
± √∑ 𝑥 2 −𝒙̅2
𝑛
Pasos a seguir [Utilizando los datos de la tabla anterior]:
̅= Restar la frecuencia menos la media aritmética (que ya fue calculada y es igual a 60,75)
1. xi - 𝒙
Peso (kg) ̅
d = xi - 𝒙 d 2 = (xi - 𝒙
̅)2
1. 40 40 – 60,75 = -20,75 20,75 2 = 430,56
2. 46 46 – 60,75 = -14,75 14,75 2 = 217,56
3. 48 -12,75 162,56
4. 51 -9,75 95,06
5. 53 -7,75 60,06
6. 55 -5,75 33,06
7. 57 -3,75 14,06
8. 57 -3,75 14,06
9. 59 -1,75 3,06
10. 60 -0,75 0,56
11. 60 -0,75 0,56
12. 64 3,75 14,06
13. 64 3,75 14,06
14. 68 7,75 60,06
15. 75 14,75 217,56
16. 115 54,75 2.997,56
∑ = 972 ∑=0 ∑ = 4.334,46
(Tiene que dar cero)
P = n + 1x Percentil a calcular
100
P50 SIEMPRE es igual a la mediana (Ma).
P50 = 16 + 1x 50 = 8,5 ≈ 9 => Posición 9 en la tabla = 59 kg.
100
Análisis: Del total de los individuos el 50% tiene un peso menor o igual a 59 kg.
Para series agrupadas, es necesario tener en cuenta una fórmula general para el cálculo de medidas
de posición, es la siguiente:
MP(x) = LRI + PMx – Faa x AC
Fi
Donde:
MP(x) = Medida de posición (x).
LRI = Límite real (o verdadero) inferior de la clase donde está la medida de posición (MP) a buscar.
PMx = Posición de medida (x). – Percentil, cuartil, mediana –
Faa = Frecuencia acumulada anterior (de la clase anterior).
Fi = Frecuencia absoluta.
AC = Amplitud de clase.
Buscar la posición de medida deseada (PMx) con la fórmula de percentiles y cuartiles y mediana
para datos agrupados:
- Percentiles (P): P(x) = Px . n
100
- Cuartiles (Q): Q(x) = Qx . n
4
- Mediana (Ma): Ma = ∑n /2
Se calcula la posición y luego se aplica la fórmula de medidas de posición MP(x).
3° Paso Buscar el valor de esa posición con la fórmula general de MP(x).
Cuartiles:
Qx = Qx . n => Ej. Q1 = 1 . 108 / 4 = 27 => Posición 27 en la segunda clase
4
Nota: Esta posición 27 en la tabla corresponde a la segunda clase, pero es con respecto a la
frecuencia acumulada (Fa), ya que en la columna de Fa la segunda clase llega hasta el dato n° 44, es
decir, si se nota en la tabla la primera Fa es 16, esto significa que abarca las observaciones de la 1 a
la 16. La segunda Fa es 44, esto significa que abarca las observaciones de la 17 a la 44. La posición
del cuartil es 27, y es así que estaría ubicado en ésta segunda clase.
Una vez calculada la posición, se calcula el valor de esa posición con la fórmula general MP(x).
Percentiles:
P(x) = Px . n Ej. P (67) = 67 x 108 = 72,36 => Posición 72,36 (no se aproxima)
100 100 5° Clase.
MP (P67) = 36 + 72,36 – 68 x 5 = 36 + 0,31 x 5 = 37,55 años
14
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 25
Análisis: El 67% de los individuos presentaron una edad menor o igual a 37,55 años.
Mediana: valor que ocupa el centro de la serie con respecto al número de término.
Ma = ∑n / 2 => 108/2 = 54 => Posición 54. 3° Clase.
MP (Ma) = 26 + 54 – 44 x 5 = 26 + 0,71 x 5 = 29,55 años
14
Análisis: En el estudio, la mitad de los individuos tienen una edad igual o menor a 29,55 años, y la
otra mitad igual o mayor a 29,55 años.
Media aritmética: valor que tendrían todas las observaciones si entre ellas no
existiera variación.
Método corto: se usa cuando las amplitudes de cada clase, son iguales. Es decir, cuando las AC son
constantes e iguales.
̅ = A +∑ Fi . dj x AC
𝒙
n
1° Paso: Calcular A.
A = punto medio de la clase central. O punto medio de la clase central superior si existen dos clases
centrales. En este caso la clase central sería la 3° clase (flecha).
Edad (años) Fi Fa
16 – 20 16 16
21 – 25 28 44
26 – 30 14 58
31 – 35 10 68
36 – 40 14 82
41 – 45 26 108
Total 108
21 – 25 28 44 -1 -44
26 – 30 14 58 0 0
31 – 35 10 68 +1 10
36 – 40 14 82 +2 28
41 – 45 26 108 +3 78
Total ∑ = 108 ∑ = 56
Método largo: se usa cuando las amplitudes de cada clase son distintas. También se puede usar en
cualquier circunstancia (según el prof.)
̅ = ∑ Fi . Xi
𝒙 Xi = Punto medio de cada clase.
n Punto medio (PM) = LVI + LVS / 2
Edad (años) Fi Fa
16 – 20 16 16
21 – 25 28 44
26 – 30 14 58
31 – 35 10 68
36 – 40 14 82
41 – 45 26 108
Total 108
1° Paso: Calcular Xi de cada clase.
PM (1° clase) = 16 + 21 / 2 = 18,5
PM (2° clase) = 21 + 26 / 2 = 23,5
PM (3° clase) = 26 + 31 / 2 = 28,5
PM (4° clase) = 31 + 36 / 2 = 33,5
PM (5° clase) = 36 + 41 / 2 = 38,5
PM (6° clase) = 41 + 46 / 2 = 43,5
Nota: Si la AC es igual, se le suma la AC al primer punto medio calculado, para no perder tiempo.
Esto es SOLAMENTE cuando la AC es constante e igual. Sino, hay que calcular cada uno.
2° Paso: Multiplicar Fi . Xi, y sumar al final.
Edad (años) Fi Fa Xi Fi . Xi
16 – 20 16 16 18,5 296
21 – 25 28 44 23,5 658
26 – 30 14 58 28,5 399
31 – 35 10 68 33,5 335
36 – 40 14 82 38,5 539
41 – 45 26 108 43,5 1.131
Total ∑ = 108 ∑ = 3.358
3° Paso: Sustituir en la fórmula
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 27
̅ = ∑ Fi . Xi
𝒙
n
̅ = 3.358 = 31,09 ≈ 31,1 años
𝒙
108
Análisis: Todos los individuos tendrían una edad promedio de 31,1 años si entre ellos no existiese
variación con respecto a la edad.
*Notas:
Los estadísticos utilizados para analizar variables cuantitativas continuas en series agrupadas son las
mismas de series no agrupadas, solo que varían en la forma de calcularlos, pero el análisis sigue
siendo igual, estos estadísticos son:
- De posición (percentiles, cuartiles)
- De tendencia central (media aritmética, moda, mediana)
- De variabilidad o de dispersión (desviación estándar)
Para calcular cuartiles (Q) y percentiles (P) en series agrupadas, donde hay más de 30 individuos, se
elimina el factor de corrección +1. En series agrupadas donde haya menos de 30 individuos
estudiados, sí se coloca el factor de corrección +1.
n + 1 x cuartil a calcular => Menores a 30 individuos estudiados
4
n . Q(x) => Mayores a 30 individuos estudiados
4
No se aproxima, en la única parte donde se aproxima es en el 2° paso en las medidas de posición en
series no agrupadas. Si la posición da 2,85 se aproxima a 3. Y si da 2,25 se aproxima a 2.
El Q3 es igual al P75. Si se pide analizar el Q3 no se analiza en un 75%, sino que se analiza en ¾
partes.
El Q1 es igual al P25. Y el Q2 es igual al P50 y a la Mediana.
Ej. P12 = 12 . 108 /100 = 12,96 (Sin aproximar) => Posición 12,96. 1° Clase.
MP(P12) = 16 + 12,96 – 0 x 5 = 16 + 0,81 x 5 = 20,05 años.
16
Análisis: El 12% de los individuos estudiados tienen una edad menor o igual a 20,05 años.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 29
La mediana, además de ser una medida de tendencia central, porque ocupa el centro de la serie con
respecto al número de término, también es una medida de posición, por lo tanto hay que cumplir
con los pasos para calcular medidas de posición (acumular la frecuencia, buscar la posición de la
mediana, y buscar el valor de posición con la fórmula general de medidas de posición MP(x))
Y con respecto a “dj”, los desvíos unitarios, es la diferencia que hay de la posición de cada una de
las clases con respecto a la clase que se toma como central.
Coeficiente de correlación: tabla de datos asociados con dos variables cuantitativas continuas.
Para esta tabla se utiliza el gráfico de correlación o de Pearson. En el eje “x” de las abscisas se van a
escribir los valores de las variables independientes, y en el eje “y” de las ordenadas, los valores de
las variables dependientes. En este gráfico no necesariamente se comienza de cero (0), en este
gráfico deben aceptarse todos los valores, sean muy altos o muy bajos. Para definir las variables
dependientes o no, se utiliza la lógica, por ej. El peso depende de la estatura, entonces la talla que es
la variable independiente es “x”, y el peso que es la variable dependiente, es “y”.
El gráfico consiste en colocar los puntos donde coincida el peso con la estatura. Hay asociación
cuando los puntos tienden a agruparse alrededor de una línea diagonal. Entre más cerca estén de esa
línea diagonal, mayor será el grado de asociación. Si todos los puntos caen sobre la línea recta hay
una asociación perfecta.
- A medida que aumentan los valores de la variable independiente, y aumentan los de la
variable dependiente, existe una correlación directamente proporcional.
- A medida que aumentan los valores de la variable independiente, y disminuyen los de la
variable dependiente, existe una correlación inversamente proporcional.
En clase, se calculará el coeficiente sin necesidad de hacer el gráfico.
Coeficiente de correlación de Pearson (r)
∑ 𝒙 .𝒚
- 𝒙̅ .𝒚
̅ ̅= media de x
𝒙 ̅= media de y
𝒚
𝒏
r= dex . dey dex = desviación de x dey = desviación de y
N° “y” “x”
Peso (kg) Talla (cm)
1. 63 165
2. 83 178
3. 90 176
4. 60 170
5. 66 160
6. 69 150
7. 53 164
8. 65 172
9. 58 166
10. 55 167
1° Paso: Multiplicar talla por peso (x . y), y sumarlos al final. Ej. 63 . 165 = 10.395
N° “y” “x” X.Y
Peso (kg) Talla (cm)
1. 63 165 10.395
2. 83 178 14.774
3. 90 176 15.840
4. 60 170 10.200
5. 66 160 10.560
6. 69 150 10.350
7. 53 164 8.692
8. 65 172 11.180
9. 58 166 9.628
10. 55 167 9.185
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 30
2° Paso: calcular la media de “x” y de “y”. Como son datos no agrupados, se suman todos los datos
y se dividen entre el n° de observaciones.
̅= ∑ Xi / n => 1.668 / 10 =>𝒙
𝒙 ̅ = 166,8 Xi= valores de cada talla
̅= ∑ Yi / n => 662 / 10 =>𝒚
𝒚 ̅ = 66,2 Yi = valores de cada peso
̅ )2
Dx2 = (x - 𝒙 Ej. (-1,8)2 = 3,24
“y” “x”
N° Peso (kg) Talla (cm) x.y x-̅ 𝒙 (x - ̅
𝒙 )2
1. 63 165 10.395 - 1,8 3,24
2. 83 178 14.774 11,2 125,44
3. 90 176 15.840 9,2 84,64
4. 60 170 10.200 3,2 10,24
5. 66 160 10.560 - 6,8 46,24
6. 69 150 10.350 - 16,8 282,24
7. 53 164 8.692 - 2,8 7,84
8. 65 172 11.180 5,2 27,04
9. 58 166 9.628 - 0,8 0,64
10. 55 167 9.185 0,2 0,04
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804 ∑ = 587,6
Dy = y – 𝒚
̅ Ej. 63 – 66,2 = -3,2
“y” “x”
N° Peso (kg) Talla (cm) x.y x-𝒙 ̅ ̅ )2
(x - 𝒙 y-𝒚 ̅
1. 63 165 10.395 - 1,8 3,24 - 3,2
2. 83 178 14.774 11,2 125,44 16,8
3. 90 176 15.840 9,2 84,64 23,8
4. 60 170 10.200 3,2 10,24 -6,2
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 31
̅ )2
Dy2 = (y - 𝒚 Ej. (-3,2)2 = 10,24
“y” “x”
N° Peso (kg) Talla (cm) x.y x-𝒙 ̅ ̅ )2
(x - 𝒙 y-𝒚 ̅ ̅ )2
(y - 𝒚
1. 63 165 10.395 - 1,8 3,24 - 3,2 10,24
2. 83 178 14.774 11,2 125,44 16,8 282,24
3. 90 176 15.840 9,2 84,64 23,8 566,44
4. 60 170 10.200 3,2 10,24 -6,2 38,44
5. 66 160 10.560 - 6,8 46,24 -0,2 0,04
6. 69 150 10.350 - 16,8 282,24 2,8 7,84
7. 53 164 8.692 - 2,8 7,84 -13,2 174,24
8. 65 172 11.180 5,2 27,04 -1,2 1,44
9. 58 166 9.628 - 0,8 0,64 -8,2 67,24
10. 55 167 9.185 0,2 0,04 -11,2 125,44
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804 ∑ = 587,6 ∑ = 1.273,6
𝟏𝟏𝟎.𝟖𝟎𝟒
- 166,8 𝑥 66,2
𝟏𝟎
r= 7,67 x 11,29
r= 11.080,4 - 11.042,16
86,59
r = 38,24
86,59
r = 0,44
Grado de correlación que existe entre las dos variables. Valores entre los cuales está comprendido el
coeficiente de correlación: -1…0…+1
Coeficiente de correlación:
- De 0 a +0,40: Correlación directamente proporcional leve.
- De 0 a -0,40: Correlación inversamente proporcional leve.
- De +0,41 a +0,84: Correlación directamente proporcional moderada.
- De -0,41 a -0,84: Correlación inversamente proporcional moderada.
- De +0,85 a +1: Correlación directamente proporcional fuerte o alta.
- De -0,85 a -1: Correlación inversamente proporcional fuerte o alta.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 32
Análisis: En el estudio, con respecto a peso y talla, existe una correlación directamente proporcional
moderada igual a 0,44.
Para saber qué porcentaje de las variaciones de la variable dependiente pueden ser atribuidas a
variaciones de la independiente, es decir, qué porcentaje de las variaciones de peso dependen de las
variaciones de la talla, para esto se utiliza el:
Coeficiente de determinación (CD): estima qué porcentaje de las variables dependientes pueden
ser atribuidas a cambios, o varían con las variables independientes.
¿Qué porcentaje de las variaciones de peso pueden ser atribuidos a cambios de la estatura?
CD = r2x 100
CD = (0,44)2x 100
CD = 19,36%
Análisis: En el estudio, el 19,36% de las variaciones del peso pueden ser atribuidas a cambios y/o
variaciones de la estatura.
*El 80,64% restante dependerá de otras variables, que no competen.
Para saber cuántas unidades varía la variable dependiente con la variación de una unidad de la
variable independiente, es decir, cuántos kg va a variar el peso por la variación de 1 cm en la
estatura, para esto se utiliza el:
Coeficiente de Regresión: b = ∑ dex . dey = ∑ dex . dey => Ej. -1,8 . -3,2 = 5,76
∑ dx2 587,6
b = 382,4 = 0,65
587,6
Análisis: Por cada centímetro que aumente la estatura, aumentan 0,65 kg de peso.
*Porque es directamente proporcional, si aumenta la variable independiente, también aumenta la
dependiente.
Se pueden estimar valores de la variable dependiente una vez conocidos los valores de la
independiente, para esto se utiliza:
Ecuación de la línea recta: se puede predecir qué peso tendrá un individuo que tenga determinada
estatura. Ej. Calcular el peso de un individuo con talla = 173 cm.
y (x) = 𝑦̅ − 𝑏 . 𝑥̅ + 𝑏 . 𝑥
y (173) = 66,2 – (0,65 . 166,8) + (0,65 . 173)
y (173) = 66,2 – 108,42 + 112,45
y (173) = 70,23
Análisis: El peso estimado para un individuo con una talla igual a 173 cm, es de 70,23 kg.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 33
*Nota: El valor de la variable independiente tiene que estar comprendida entre el valor máximo y el
valor mínimo que está en la tabla, no sirve para predecir valores que estén fuera del rango de la
serie estudiada.
Si el valor de la variable independiente, en este caso es la talla, aumenta por encima de su media,
entonces también tiene que aumentar la variable dependiente, esto si la correlación es directamente
proporcional, ya que si aumenta la independiente, también debe aumentar la dependiente. De los
contrario, la correlación es inversamente proporcional, esto cuando al aumentar la variable
independiente, disminuye la dependiente, o viceversa.
Series Cronológicas
Estudian la variación de un fenómeno a través del tiempo, por ej. Casos o muertes de una
enfermedad, número de estudiantes, entre otros. Al presentar una tabla con datos de serie
cronológica se muestra la variación de un fenómeno de una época a otra, por lo que no se usan los
porcentajes. Cuando se utilizan poblaciones las cuales varían en el tiempo a través de los años, es
importante la utilización de las tasas para la comparación de datos.
La finalidad de las series cronológicas es tratar de determinar una tendencia a base de una serie de
registros en relación al tiempo (meses, años, semanas epidemiológicas). Dependiendo del registro
del fenómeno y de cómo se presente, la tendencia puede ser en ascenso o en descenso.
Componentes de una serie cronológica:
- Tendencias:representa movimientos lentos y graduales de un conjunto de datos que originan un
desplazamiento uniforme y se identifican como cambios permanentes y fundamentales.
- Variaciones estacionales:representa los movimientos oscilatorios dentro de períodos cortos; un año o
menos.
- Fluctuaciones cíclicas: son de largo plazo, movimientos oscilatorios alrededor de una tendencia, se
caracterizan por crecimiento y caídas, se revierte y puede iniciarse otro ciclo.
- Sucesos aleatorios o irregulares: es una variación esporádica ocasionada por incidente o accidente.
Estadísticos de las series cronológicas
1. Número Índice: es un número relativo que permite ver la evolución de un fenómeno en base a una
o varias series cronológicas. Es la relación que tiene la 1° observación con el resto de las
observaciones que estén en la serie cronológica.
Mortalidad maternacasos y tasa (100.000 NVR)Venezuela 2001-2008
Años N° de Muertes Tasa (100000 NVR)
2001 256 51,0
2002 313 59,3
2003 327 60,1
2004 356 67,2
2005 335 68,0
2006 321 57,7
2007 318 54,7
2008 351 59,9
El número índice es una razón de cada uno de los años con el primero, multiplicado por 100, esto
quiere decir que se compara un determinado año a calcular, con el primer año dado en la tabla de
series cronológicas, y se dividen, luego este resultado se multiplica por 100.
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑎ñ𝑜 𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑟
𝑁𝐼(𝑥) = 𝑥 100
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑎ñ𝑜
Ej. Número índice del año 2007: [Tasa del año 2007=54,7… Tasa del primer año (2001) = 51,0]
54,7
𝑁𝐼(2007) = 51,0
𝑥 100 = 107,25%
Nota: Para considerar que la tasa de un determinado año ha aumentado con respecto a la tasa del
primer año, es necesario considerar el valor que esté por encima del 100%. Ej. El resultado del
número índice igual a 140,50% lo que esté por encima del 100% que es 40,50% es lo que aumenta
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 34
en realidad una tasa. Mientras que la disminución es lo que esté por debajo del 100%. Ej. 90% =
10% es lo que disminuye una determinada tasa, porque es la diferencia entre 90% y 100%.
Análisis: La tasa de mortalidad materna en Venezuela en el año 2007 aumentó un 7,25 % con
respecto a la del 2001.
2. Variación promedio anual (VPA): Permite calcular la variación del fenómeno en el período
estudiado, que puede ser ascendente o descendente. Es lo que varía en promedio la tasa cada año.
𝑇𝑎𝑠𝑎𝑑𝑒𝑙ú𝑙𝑡𝑖𝑚𝑜𝑎ñ𝑜 − 𝑇𝑎𝑠𝑎𝑑𝑒𝑙𝑝𝑟𝑖𝑚𝑒𝑟𝑎ñ𝑜
𝑉𝑃𝐴 =
𝑁°𝑑𝑒𝑙𝑎𝑝𝑠𝑜𝑠
𝑁° 𝑑𝑒 𝑙𝑎𝑝𝑠𝑜𝑠 = 𝑁° 𝑑𝑒 𝑎ñ𝑜𝑠 − 1
59,9 − 51,0
𝑉𝑃𝐴 = 7
= 1,27
Análisis: La tasa de mortalidad materna en Venezuela aumentó en promedio 1,27 defunciones
maternas cada año por cada 100.000 NVR, en el período 2001 – 2008.
O también: La mortalidad materna tiene una VPA de 1,27 cada año.
La tasa de mortalidad materna en el período 2001-2008 aumenta 1,27 cada año.
Uno de los usos que se le da a la variación promedio anual (VPA) es:
3. Proyecciones: se pueden hacer proyecciones futuras para años inmediatos, es decir, deben ser de
corto tiempo, con una estimación máxima de 1 a 2 años. Esto quiere decir que a partir de la tasa del
último año de series cronológicas se puede estimar la tasa de años próximos, bien sea 1 año o 2 años
después de la última observación de la tabla, esto mediante la fórmula que se dará a continuación.
Y(X)= Tasa del último año + VPA x N° de años que ha pasado (entre el último año y la fecha a
calcular) (1 ó 2 años máximo).
Ej. Proyección para el año 2010: [Del 2008 que es el último año al 2010, el n° de años que ha pasado es igual a 2]
Y(x) = 59,9 + 1,27 x 2 => 59,9 + 2,54 = 62,44
Análisis: La tasa de mortalidad materna que se espera para el año 2010 es de 62,44.
4. Aumento o descenso porcentual:Es lo que aumenta o desciende, porcentualmente, el fenómeno
estudiado en el período dado.
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑢𝑙𝑡 𝑎ñ𝑜 − 𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑎ñ𝑜
𝐴𝑜𝐷% = 𝑥 100
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑎ñ𝑜
59,9 −51,0
𝐴𝑜𝐷% = 51,0
𝑥 100= 17,45%
Análisis: La tasa de mortalidad materna en Venezuela aumentó 17,45% en el período 2001-2008.
O también: La tasa de mortalidad materna del año 2008 en relación al 2001, aumenta en un 17,45%.
Cálculo e interpretación del coeficiente de regresión (b)
Expresa cuántas unidades varía la variable dependiente con la variación o cambios de la variable
∑ 𝑑𝑒𝑥 . 𝑑𝑒𝑦
independiente. 𝑏= ∑ 𝑑𝑥 2
Años Años (X) Tasas (Y) dex dx2 dey dex . dey
x-𝒙̅ y-𝒚̅
2001 1 51 -3,5 12,25 -8,7 30,45
2002 2 59,3 -2,5 6,25 -0,4 1
2003 3 60,1 -1,5 2,25 0,4 -0,6
2004 4 67,2 -0,5 0,25 7,5 -3,75
2005 5 68,0 0,5 0,25 8,3 4,15
2006 6 57,7 1,5 2,25 -2 -3
2007 7 54,7 2,5 6,25 -5 -5
2008 8 59,9 3,5 12,25 0,2 0,2
Total ∑ = 36 ∑ = 477,9 ∑ = 42 ∑ = 16,45
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 35
Dada la tabla anterior, primeramente hay que determinar cuál es la variable dependiente y cuál es la
independiente, en este caso, las tasas dependen de los años, por lo que los años son la variable
independiente (x) y las tasas son las dependientes (y).
Luego se procede a calcular el promedio o media aritmética de cada una de las variables:
𝑥̅ = 36 / 8 = 4,5 𝑦̅ = 477,9 / 8 = 59,7
Después se debe hacer el cálculo de la desviación estándar tanto de “x” como de “y” (dex…dey),
que es igual a “x” o “y” menos su media aritmética, como se demuestra en la columna 4 y 6 de la
tabla. Los resultados que interesan son éstos, la “dex” y la “dey”, porque en la fórmula de
coeficiente de regresión se debe multiplicar dex . dey, y estos valores se expresan en la columna 7
de la tabla. La sumatoria de los valores de ésta última columna, es lo que se va a sustituir en la
fórmula. El otro valor que corresponde al denominador de la fórmula es la sumatoria de “dx2” y ésta
se obtiene elevando la “dex” al cuadrado.
∑ 𝑑𝑒𝑥 . 𝑑𝑒𝑦 16,45
𝑏= ∑ 𝑑𝑥 2
=>𝑏 = 42 = 0,39
Ecuación de la línea recta: permite proyectar el fenómeno a futuro. Se debe sustituir los valores en
la fórmula.
y (x) = 𝑦̅ − 𝑏 . 𝑥̅ + 𝑏 . 𝑥
𝑌(2010) = 59,7 − 0,39𝑥4,5 + 0,39𝑥10
𝑌(2010) = 59,7 − 1,8 + 3,9 = 61,8
Análisis: La tasa de mortalidad materna en Venezuela esperada para el 2010 es de 61,8 defunciones
maternas por cada 100.000 nacidos vivos registrados.
16 - 2 - 2008
- - 5
Luego el mes del 2° censo es agosto representado por el n° 8, y el mes del 1° censo es febrero,
representado por el n° 2, la diferencia entre ambos es 6 (8 – 2 = 6).
N => 7 - 8 - 2013 –
16 - 2 - 2008
- 6 - 5
Tenemos que el día del 2° censo es 7 y el día del 1° censo es 16, la diferencia entre ambos da un
valor negativo (7 – 16 = -9), lo cual NO puede ser, porque siempre el día del 2° censo debe ser
mayor que el del 1° censo, para que la diferencia entre ambos dé un resultado positivo.
Para esto se procede a “pedir prestado” un mes, es decir, se tiene en cuenta que un mes equivale a
30 días, se le suman 30 días al día del 2° censo (30 + 7 = 37 días), y es así que la diferencia entre los
días de ambos censos da 21 (37 – 16 = 21).
N =>37 - 8 - 2013 –
16 - 2 - 2008
21 - 6 - 5
Pero ahora se debe modificar el mes, ya que se “pidió prestado” un mes equivalente a 30 días, al
mes del 2° censo, entonces éste dejará de ser 8, y pasará a ser 7 (8 – 1 que se prestó = 7).
N => 37 - 7 - 2013 –
16 - 2 - 2008
21 - 5 - 5
Y ese es el resultado final: N = 21 días, 5 meses, y 5 años. Pero ahora surge una situación, este valor
“N” debe ser expresado solamente en años. Se debe tener en cuenta que 1 año se puede expresar en
días, es decir, 1 año equivale a 365 días. Y también 1 año se puede expresar en meses, ya que 1 año
equivale a 12 meses. Dicho esto, se procede a lo siguiente:
21 días / 365 días = 0,05 años
5 meses / 12 meses = 0,41 años
5 años =5 años
5,46 años
N = 5,46 años.
Para calcular “n” que es el tiempo transcurrido entre el 1° censo (16 de Febrero de 2008) y la fecha
estimada (23 de Junio de 2015), se procede a realizar un cálculo similar al anterior.
N => 23 - 6 - 2015 –
16 - 2 - 2008
7- 4 - 7
En este caso, la resta se da sin novedades, se resta la fecha estimada menos la fecha del 1° censo,
sin necesidad de “pedir prestado” los 30 días equivalentes a un mes. Es así que el resultado final es:
n = 7 días, 4 meses y 7 años. Se procede a convertir los días y meses a años:
7 días / 365 días = 0,01 años
4 meses / 12 meses = 0,33 años
7 años =7 años
7,34 años
n = 7,34 años.
El último paso es sustituir en la fórmula los datos que se tienen:
Px = P1 + P2 – P1 n
N
Px (23-6-2015) = 360.958 hab + 380.556 hab – 360.958 habx 7,34
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 37
5,46
Px (23-6-2015) = 360.958 hab + 3.589 x 7,34 => 360.958 + 26.343
Px (23-6-2015) = 387.301 habitantes
Análisis: La población estimada para el municipio Heres para el 23 de Junio de 2015 es de 387.301
habitantes.
Notas:
Las fechas indicadas de cada censo no son valores que se colocan en la fórmula, sino que
sirven para calcular “n” y “N” que sí son valores que se colocan en la fórmula.
Px es el número estimado de habitantes para una determinada fecha, puede ser cualquier
fecha (que sea luego de las fechas correspondientes al 1° y 2° censos), se utilizó 23 de Junio
de 2015 porque fue la fecha que se hizo el presente ejercicio en clase.
Al momento de sustituir valores en la fórmula, la parte en donde P2 – P1 / N dio un
resultado igual a 3.589,37 NO SE COLOCAN DECIMALES, pero se puede aproximar,
porque se están estudiando habitantes, y son números enteros, en este caso se dejó el valor
de 3.589. Pero si el decimal es mayor a 5, obviamente se aproxima.
Uso del método aritmético:
En poblaciones > 1.000.000 habitantes se hace un cálculo a corto plazo (1 a 2 años).
En poblaciones > de 40.000 habitantes y < 1.000.000. Se hace un cálculo a corto y mediano
plazo de hasta 5 años.
Poblaciones ≤ 40.000 habitantes, se hace un cálculo a corto – mediano y largo plazo hasta
de 7 a 10 años.
Tasas demográficas
Estadísticas de natalidad
Se refiere al estudio del número de nacimientos ocurridos en determinada colectividad y a su
distribución de acuerdo a características especiales.
Términos importantes
Fecundidad: Capacidad real de reproducirse (Nº de hijos concebidos).
Fertilidad: Capacidad potencial de reproducirse.
Natalidad Total: Niños concebidos, nacidos vivos o no.
Natalidad Efectiva: Niños concebidos, sólo nacidos vivos, útil en estudios demográficos.
Medición de la Natalidad: se utilizan tres tipos de tasas generalmente.
Tasa bruta de natalidad: Expresa el crecimiento de una población y se interpreta como el
número de nacidos vivos registrados por cada 1000 habitantes.
TN = NVRx 1.000
P
Donde: TN: Tasa de natalidad.
NVR: Nacidos vivos registrados en determinada región durante un determinado año.
P: Población de esa región para el 1° de Julio del año en estudio.
Ej. Nacidos vivos registrados (NVR) del estado Bolívar = 28.789
Población del estado Bolívar = 1.477.425 hab.
TN = 28.789 / 1.477.425 x 1.000
TN = 19,5
Análisis: En la población del estado Bolívar, hay 19,5 NVR por cada 1.000 habitantes.
La tasa bruta de natalidad al aplicarla a una población conocida permite estimar el número de
nacimientos esperados.
Nacimientos esperados = TN x P / 1.000
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 38