Guia Primer Parcial Estadistica

ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G.
Estadística: conjunto de métodos, técnicas o procedimientos que se utilizan para manejar los datos
numéricos, es decir, es el método que permite recolectar, elaborar, analizar e interpretar datos
numéricos. La estadística es la ciencia que se ocupa del manejo de estos datos numéricos, e implica
el estudio de la variabilidad, se clasifica en:
 Estadística General.
 Estadística aplicada a un campo específico.
 Bioestadística.
El estudio estadístico se clasifica en:
*Cronológico: longitudinal (ej. Registro) y transversal (ej. Censo).
*Analítico: descriptivo e inductivo (en base a una hipótesis).
*Operativo: retrospectivo, prospectivo y actual.
Método científico, características: 1. Fáctico 2. Objetivo 3. Sujeto a verificación

Las etapas del método científico son:
1. Observación exacta del fenómeno a estudiar.
2. Formulación de una hipótesis.
3. Verificación de la hipótesis.
Características de una Hipótesis:
1. Conceptualmente claras 2. Definidas operacionalmente 3. Específicas
4. Objetivas 5. Sujetas a técnicas disponibles para someterlas a prueba.
Etapas del Método Estadístico:
1. Planificación del estudio 2. Recolección de la información
3. Elaboración de los datos recogidos 4. Análisis e interpretación de los datos
1. PLANIFICACIÓN DEL ESTUDIO:etapa netamente intelectual, creadora, se estudian los

detalles relativos a la recolección, elaboración y análisis de la información. Es indispensable para:
1. Calcular el tiempo que dura la investigación.
2. Calcular el número de personas necesarias.
3. Presupuesto para realizar la investigación.
4. Define metas y objetivos de la investigación.
5. Evita improvisaciones.
6. Disminuye errores.
Pasos de la planificación:
1. Planteamiento del problema. 2. Búsqueda y evaluación de la información.
3. Formulación de hipótesis. 4. Verificación de hipótesis.
5. Conclusiones y recomendaciones.
2. RECOLECCIÓN DE LA INFORMACIÓN:proceso para buscar la información requerida

para un problema de investigación. Tiene que ser llevada a cabo de acuerdo a la planificación y la
tiene que vigilar el investigador, para que sea una información fidedigna.
Características de una buena información:
1. Oportuna: que esté disponible al momento de que el investigador la necesite.
2. Pertinente: que sirva de utilidad en la investigación.
ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G. 2
3. Íntegra: que dicha información sea completa.

4. Exacta: si la información no es exacta, el estudio no tiene validez.
Errores en la recolección de la información determinados por:
1. Observador: por falta de experiencia y entrenamiento, condiciones físicas y de trabajo.
2. Método de observación: hay que escoger los aparatos más eficaces para minimizar errores.
3. Individuos observados: distintas variaciones que se pueden dar entre dichos individuos.
Fuentes de recolección:
1. Fuente primaria: datos recogidos directamente en el sitio determinado.
Procedimientos generales:
- Observación: es el método clásico de la investigación científica. Pero es costoso por
requerir personal especializado.
- Interrogatorio: es más subjetivo y se puede utilizar en una gran masa de población.
Influye mucho la forma en que se hacen las preguntas, el interrogatorio puede ser
directo o indirecto.
Métodos de recolección en fuente primaria*:
- Ocasionales: ej. Encuesta o experimento.
- Periódico: ej. Método censal.
- Continuo: ej. Sistema de registro, historia clínica, epidemiológica, mortalidad.
Nota: el formulario es la forma impresa para recoger información, es la parte administrativa y
destinada a la investigación. Es recomendable hacer las preguntas cerradas, habrá mayor facilidad al
realizar las tablas, y al clasificar las respuestas.
2. Fuente secundaria: datos recogidos por otro investigador previamente. En fuente 2° no
existen ni procedimientos generales, ni métodos de recolección, en fuente 1° sí.
Universo y muestra
Universo o población (N): son todas las unidades de observación, individuos o conglomerados que
tienen características susceptibles de ser estudiadas.
Tipos de universo:
1. Según su extensión el universo puede ser:
-Finito: número limitado de individuos, es bien delimitado, el número de unidades de observación
se conoce. Ej. N° de pacientes en un hospital, N° de estudiantes de una escuela, etc.
-Infinito: número ilimitado de individuos. No tiene límites conocidos. Ej. N° de pacientes que
tienen una determinada enfermedad a nivel mundial.
-Hipotético: transformación del número de infinito a finito. Ej. Llevar el N° de pacientes con
diabetes a nivel mundial (N° infinito) a un número hipotético de los mismos y utilizar dicha
suposición durante un estudio (N° finito).
2. Según su estructura el universo puede ser:
-Homogéneo: constituido por unidades de observación o elementos con características similares o
idénticas. Ej. El volumen sanguíneo de una persona.
*Nota: cuando el universo (N) es homogéneo, las muestras (n) son representativas SIEMPRE.
-Heterogéneo: formado por unidades diferentes que forman estratos por cada tipo de unidad. Ej.
Una localidad, es un universo constituido por niños, jóvenes, adultos, ancianos, de ambos sexos.
Muestra (n): parte cualquiera del universo, desde 1 unidad de observación hasta una unidad menos
que el total. Ej. Un universo igual a 100 pacientes. La muestra puede ir de 1 a 99 pacientes del total.
Las muestras deben ser adecuadas en cantidad y calidad:
Cantidad: ni más de lo necesario, ni menos de lo suficiente.
Calidad: debe reflejar todas las características del universo del cual procede. Según su calidad las
muestras pueden ser:
- Representativas: reproduce en pequeño todas las características de N. (Muestras
probabilísticas)
- No representativas o seleccionadas: solo representa una o varias características (pero no
todas) de N. No son adecuadas para la inferencia estadística. La selección puede ser
voluntaria o involuntaria.
*Selección involuntaria: se toma la muestra de un solo sector del universo. Los individuos a
estudiar NO se escogen al azar. Tomada la muestra hay circunstancias que impiden estudiar la
totalidad de los individuos incluidos.
Error por muestreo: es la diferencia entre el valor dado por la muestra y el verdadero valor del
universo. Se disminuye aumentando el tamaño de la muestra.
Verdadero valor (N) – valor dado (n)
Las muestras pueden ser cualitativas y tendrán dos características:
Representabilidad: es una buena cualidad de la muestra, el procedimiento de obtención es
probabilístico o de azar. TODAS LAS MUESTRAS REPRESENTATIVAS SON MUESTRAS
PROBABILÍSTICAS.
Selección: es una cualidad negativa de la muestra respecto a representabilidad que se produce al NO
usar el azar en su obtención o usarlo de forma inadecuada.
Tipos de muestra:
Probabilística No probabilística
Las muestras son: Las muestras son:
1. Representativas. 1. No representativas.
2. No seleccionadas. 2. Seleccionadas.
Cada uno de los componentes del universo Los criterios de selección de la muestra no
tiene la misma probabilidad, diferente de dependen del azar sino de la opinión de un
cero, de ser escogido al momento de elegir experto, por disponibilidad de recursos, u
la muestra. otros criterios no azarosos.
 Azar simple  No disponibilidad de recursos
 Azar sistemático  Voluntaria
 Modelo estratificado  Opinática (opinión de cualquier
 Modelo por conglomerado persona)
 Modelo por procedimiento  Por criterio (opinión de un experto)
combinado
Las muestras no probabilísticas, no representativas o seleccionadas, pueden ser llamadas también

Muestras por Conveniencia, en donde la selección de los individuos a estudiar no interviene el azar.
Se usa en casos donde las investigaciones tienen recursos limitados. Ej. Se quiere ensayar una droga
para una enfermedad y solo se cuenta con pocas dosis.
También se utilizan cuando no se conoce la lista detallada de la población a estudiar, y cuando el

interés del estudio está centrado en individuos con determinadas características.
Para seleccionar las muestras probabilísticas existen diferentes procedimientos o modelos

probabilísticos:
1. Por azar simple: proceso aleatorio que da a todas y a cada una de las unidades del universo o
estrato una probabilidad de elección conocida. Se elabora una lista del universo y mediante dos
tipos de métodos utilizados (Método de lotería o tabla de números al azar), se escogen los
individuos para conformar la muestra.
Desventajas: necesita lista, puede NO haber representatividad, hay probable dispersión.
Ventajas: fácil, rápido, económico.
2. Por azar sistemático: se usa en universos homogéneos. Primero se tiene que elaborar una lista
con los individuos que constituyen el universo. Se calcula la fracción de muestreo (FM):
FM= Universo/Muestra, y se escoge un individuo de cada valor de la FM por sorteo.
Ej. FM= 200/40 = 5. El universo está constituido por 200 individuos de los cuales 40 requieren ser
tomados por muestra. Se realiza la división, el resultado es igual a 5, esto significa que utilizando la
lista elaborada y mencionada anteriormente, se elegirán cada 5 personas usando el azar simple,
también por lotería o tablas de números aleatorios. La constante al mismo tiempo, marca la
escogencia de los individuos a través de un sistema.
Desventajas: además de las desventajas del azar simple, pueden cometerse errores cuando la lista ha
sido elaborada bajo criterios de orden, por ej. N° pares primero, y luego N° impares, o por sexo.
3. Modelo estratificado: el universo en estudio se divide en estratos o sectores según alguna
característica en común, y luego se procede a escoger de cada estrato, por azar simple, la muestra
del tamaño deseado. Ej. Se divide al universo según su forma: triángulo, cuadrado, círculo.
Luego se selecciona al azar de cada grupo una observación que pasará a formar la muestra.
Muestra.
Ventajas: hay representatividad de cada sector.
Desventajas: puede haber dispersión y necesita lista.
4. Modelo por conglomerado: se subdivide al universo en grupos o conglomerados de individuos y
se estudian todos los del grupo seleccionado al azar. Ej. De los tres grupos formados, según su
forma, se elige un grupo por medio del azar, para representar al universo y pasando a conformar la
muestra.
Muestra.
5. Modelo por procedimiento combinado: se pueden tomar dos o más modelos y combinarlos. Se
combina el modelo estratificado con el conglomerado.
Posible ejercicio de práctico: Se tiene el país dividido en cuatro zonas geográficas, cada una de las
cuales tiene 100 Hospitales, con50 pacientes cada uno, para un total de 400 hospitalesy 20.000
pacientes, de los cuales se desea estudiar 2000.
100 Hospitales- c/u 50 100 Hospitales- c/u 50

pacientes pacientes
100 Hospitales- c/u 50 100 Hospitales- c/u 50

pacientes pacientes
Total:100 hospitales x4 zonas geográficas = 400 hospitales en todo el país.
100 hospitales en c/zona x50 pacientes en c/u = 5.000 pacientes en c/zona geográfica.
Se suman TODOS los pacientes de cada zona: 5.000 pacientes en c/zona x4 zonas geográficas =
20.000 pacientes.
La muestra debe ser de 2.000 pacientes, y se puede obtener por cualquiera de los métodos antes
mencionados:
1. Por azar simple: se escogen al azar los 2.000 individuos a estudiar.
2.Por azar sistemático: necesita primeramente una lista del universo, y fracción de muestreo (FM)
FM = 20.000 pacientes (que es el universo “N”) / 2.000 pacientes (es la muestra requerida “n”)
FM = 10
Esto quiere decir que utilizando la lista, cada 10 pacientes, se escoge un paciente para formar parte
de la muestra.
3. Por azar estratificado: se divide al universo en estratos, se escoge al azar de cada estrato, los
individuos que van a formar la muestra. Se escogen 500 pacientes de cada zona geográfica, para
completar la muestra requerida de 2.000 pacientes. (500 x 4 = 2.000).
500 pacientes 500 pacientes
500 pacientes 500 pacientes

4. Por azar conglomerado: se utiliza el azar y se escogen 40 hospitales de una zona geográfica y
se estudian todos los pacientes de cada hospital conformando así la muestra. Teniendo en cuenta
que cada hospital tiene 50 pacientes, entonces en 40 hospitales habrán 2.000 pacientes (40 hosp x
50 pacientes = 2.000)
40 hospitales -
- -
5. Por azar combinado: se obtiene esta muestra escogiendo al azar 10 hospitales de cada una de las
zonas geográficas, estudiando la totalidad de sus pacientes. (10 hosp x 4 zonas = 40 hospitales; y 40
hosp x 50 pacientes c/u = 2.000 pacientes de muestra)
10 hospitales 10 hospitales
10 hospitales 10 hospitales
*Nota: para diferenciar el azar estratificado, del combinado: en azar estratificado se escogen
INDIVIDUOS por cada estrato (en este caso, por cada zona geográfica se escogen 500 pacientes),
pero en el azar combinado se escogen GRUPOS dentro de cada estrato (en este caso por cada zona
geográfica se escogen 10 hospitales, ya eso corresponde a grupos, dentro de dicho estrato, y NO
individuos). Por otra parte, el azar por conglomerado estudia un solo grupo elegido al azar dentro de
un estrato (40 hospitales de una sola zona geográfica completa toda la muestra requerida de 2.000
pacientes; a diferencia del azar combinado, para obtener esos 40 hospitales, se distribuyen 10
hospitales en cada zona geográfica, y se completa la muestra requerida). Es importante diferenciar
cada modelo, pues en los prácticos lo evalúan.
3. ELABORACIÓN DE LA INFORMACIÓN: es la etapa del método estadístico que

permite organizar, clasificar y presentar la información recopilada, procedimientos indispensables
para hacer el análisis. Sus pasos son:
1. Revisión y corrección de la información.
2. Clasificación y computación de los datos.
3. Presentación en cuadros y gráficos.
1. En cuanto a revisión y corrección de la información, se deben revisar cada uno de los

formularios recogidos, con el fin de ver si están completos y si la información es fidedigna, ya que
las conclusiones que se deriven del estudio nunca podrán ser más exactas que los datos en los cuales
se basan.
2. La computación consiste en contar cuántos individuos presentan o no alguna característica
especial o averiguar en qué forma se distribuyen de acuerdo a determinada escala de clasificación.
Las escalas de clasificación son formas estadísticas que contienen la variable considerada en el
estudio. Pueden ser:
Escalas cualitativas:
- Nominal: no implica ningún orden. Ej. Raza, sexo, nacionalidad, grupo sanguíneo,
estado civil.
- Ordinal: si lleva un orden específico. Ej. Clase social (clase alta, media, baja), grado
escolar (1°, 2°, 3°…), grado de dolor (leve, moderado, severo).
Escalas cuantitativas:
- Continua: aceptan decimales. Ej. Peso (45,7 kg), estatura, presión arterial, temperatura.
- Discontinua: no aceptan decimales, son número enteros. Ej. N° de hijos, N° partos.
*Una buena escala de clasificación deber ser:
-Exhaustiva: que incluya a todos los individuos.
-Bien definida: que no exista duda en donde incluir a los individuos. Esto es que una escala sea
mutuamente excluyente, es decir debe haber un solo sitio donde se pueda incluir al individuo. Ej.
Edad (años)
0-5
5-10 Esta escala NO ES EXHAUSTIVA y está MAL DEFINIDA
10-15 Porque no incluye a todos los individuos y por ejemplo, a los individuos de
15-19 5, 10 y 15 años, se pueden incluir en dos clases, y debería ser en una sola.
Edad (años)
0-4
5-9 Esta escala SI ES EXHAUSTIVA y está BIEN DEFINIDA
10-14
15-19
-Explícita
-Coherente: esto es que las clases guarden relación entre sí. Ej. Si se habla de grupos etarios,
corresponde a: niño, joven, adulto, anciano. En cambio si se habla de edad en años: 0-4, 5-9, 10-14,
15-19.
Particularidades de las clases de la escala:
 Si las escalas son cualitativas, no tienen clases, y no se utiliza el intervalo de clase (IC).
 Si la escala es cuantitativa, sí tiene clases y el intervalo de clase (IC) sí se calcula.
Ej. Edad (años)
0-4 (1° clase)
5-9 (2° clase) Clases
10-14 (3° clase)
15-19 (4° clase)
 Los límites de clase son aparentes y/o verdaderos.
 Los límites verdaderos se utilizan para hacer cálculos.
*Límites verdaderos*
 Cuando la variable es Cuantitativa Discontinua, los límites aparentes (LA) son iguales a los
límites verdaderos (LV). => LA=LV
Ej. N° de hijos.
LAI LAS LVI LVS
1 - 3 1 - 3
4 - 6 4 - 6
*LAI: límite aparente inferior *LAS: límite aparente superior
*LVI: límite verdadero inferior *LVS: límite verdadero superior
 Cuando la variable es Cuantitativa Continua… Ej. Peso (kg).
Para determinar los límites verdaderos debe tomarse en cuenta la U.M.M. (unidad mínima de
medición), que es la mínima existencia teórica que puede haber entre dos elementos.
LVI= LAI – ½ UMM
LVS= LAS + ½ UMM
Ej. Peso (kg)
LAI LAS LVI LVS LVI= 60 – 0,5 =59,5
60 - 64 59,5 - 64,5 LVS= 64 + 0,5 = 64,5
 Para las variables Cuantitativas Continuas Especiales (edad, tiempo y dinero).
El límite verdadero inferior es igual al límite aparente inferior (LVI = LAI).
Mientras que el límite verdadero superior:
LVS= LAS + 1UMM
Ej. Edad (años)
LAI LAS LVI LVS LVS = 64 + 1 = 65
60 - 64 60 - 65
*Amplitud de clase: diferencia entre los límites verdaderos de clase. (AC = LVS – LVI)
Ej. Peso (kg) 60 – 65 AC= 65-60 = 5
*Punto medio de clase: suma de los límites verdaderos de clase divididos entre 2.
Ej. Peso (kg) LAI LAS Punto medio: LVI + LVS / 2
60 – 65 = 59,5 + 65,5 / 2 = 62,5
*Amplitud total o rango: Valor Máximo – valor mínimo + 1 U.M.M.
*Intervalo de clase (IC) = Valor Máximo – valor mínimo + 1 U.M.M.

N° clases (se elige, el prof. lo dice)*
Ej. Datos no agrupados, Edad (años):
17, 19, 20, 18, 21, 24, 22, 23, 19, 20, 18, 23, 22, 21, 24
IC = 24 – 17 + 1 UMM = 2
4*
*Clasificación de los datos:
- Distribución de frecuencia - Datos de asociación - Series cronológicas
3. En cuanto a Presentación en Cuadros y Gráficos, los elementos que conforman un cuadro

estadístico son:
* Título, para que sea completo y preciso, se deben contestar 4 preguntas:
¿Qué (o quién) se estudia? Ej. Pacientes, mortalidad.
¿Cómo se estudia? Son las variables o escalas. Ej. Edad, sexo, Presión arterial sistólica.
¿Dónde se estudia? Lugar, ciudad, país.
¿Cuándo se estudia? Fecha.
Intentar NO utilizar artículos. NO se utilizan abreviaciones. Colocar el título en pirámide.
* Cuadro, propiamente consta de casillas dispuestas en columnas y filas.
La 1° columna es la matriz, se coloca la escala de clasificación con más clases.
La 1° fila es la fila de encabezamiento.
* Notas explicativas, pueden ir debajo del título o en la parte inferior del cuadro.
 Si la nota explicativa está arriba de la tabla, es decir, debajo del título, significa que la
acción va a afectar a toda la tabla o cuadro.
 Si la nota explicativa está debajo de la tabla, en la parte inferior del cuadro, se coloca un
asterisco (*) en la clase afectada, y quiere decir que solo esa clase está siendo afectada.
 La fuente de la información se coloca debajo del cuadro, pero arriba de las notas
explicativas. Se tienen que cumplir las mismas condiciones que para el título.
Presentación Tabular de Distribución de Frecuencias (1 escala: sexo):
Ej. Título: Pacientes egresados con diagnóstico de Cardiopatía Isquémica
según sexo. Hospital Universitario Ruiz y Páez.
Ciudad Bolívar. 2004
¿Qué? Pacientes egresados con diagnóstico de cardiopatía isquémica.
¿Cómo? Sexo.
¿Dónde? HURP. Ciudad Bolívar.
¿Cuándo? 2004.
Sexo N° %
Masculino 76 63,87 %  76*100/119 = 63,865 => 63,87%
Femenino 43 36,13 %  43*100/119 = 36,13%
Total 119 100%
Fuente: Archivo Historias Médicas. Hospital Universitario Ruiz y Páez. 2004.

Análisis: De los pacientes egresados del Hospital Universitario Ruiz y Páez con cardiopatía
isquémica en el 2004, 76 eran de sexo masculino y representan el 63,87%, y 43 eran de sexo
femenino y representan el 36,13% del total de egresados.
Presentación tabular de Datos de Asociación (se utilizan 2 escalas: sexo y edad):

Título: Pacientes egresados con diagnóstico de Cardiopatía Isquémica
según edad y sexo. Hospital Universitario Ruiz y Páez.
Ciudad Bolívar. 2004
Nota:
*Lo único que cambia del ejemplo anterior es el ¿Cómo? Porque se utilizan 2 escalas: edad y sexo.
*La escala o variable que tenga más clases es la que se coloca en la matriz. En este caso, la edad,
porque el sexo solo tiene 2 clases (F y M).
*Cuando se tiene una variable con más de 2 clases no se colocan porcentajes. Por ej. El sexo tiene 2
clases, así que puede colocarse su valor absoluto, y su valor relativo (que es el %). En las variables
con más de 2 clases, solo se colocará el valor absoluto.
Sexo TOTAL**
Edad Masculino Femenino
(años) N° %
40 – 49 6 3 9 7,6
50 – 59 21 8 29 24,3
60 – 69 26 15 41 34,5
70 – 79 18 10 28 23,6
80 – 89 5 7 12 10,0
TOTAL* 76 43 119 100%
Análisis:
1. Según edad, el rango más frecuente para desarrollar cardiopatía isquémica (CI) es de 60-69 años,
donde se encuentran 41 pacientes, representando el 34,5% del total.
Nota: hay que fijarse en la columna del total (**), el mayor N° es igual a 41pacientes que se
encontraron en el rango de edades de 60-69; los pacientes que con mayor frecuencia egresaron del
HURP con CI, comprenden el rango de edad de 60-69 años.
2. Según sexo, el sexo masculino es el más frecuente, donde se encuentran 76 pacientes del total de
egresados.
Nota: hay que fijarse en la fila del total (*), el mayor N° es igual a 76, que se encontraron en el sexo
masculino, por ende, los pacientes que con mayor frecuencia egresaron del HURP con CI son de
sexo masculino.
3. En el grupo etario de 60 – 69 años, hay mayor frecuencia del sexo masculino.
Nota: se sabe que el rango de edades que predomina es de 60-69 años, porque hay un mayor
número de pacientes egresados con CI que presentan esa edad, pero lo que no se sabía es que sexo
predomina en ese rango de edad de 60-69 años.
4. De 40-79 años predomina el sexo masculino sobre el femenino.
Nota: esto contesta la pregunta ¿El sexo masculino predomina más que el femenino en que rango de
edades? Para contestar dicha pregunta, habrá que fijarse en las columnas de masculino y femenino
y comparar los datos.
5. En las edades de 80-89 años predomina el sexo femenino sobre el masculino.
Nota: al fijarse en la columna del sexo femenino y masculino, el único rango de edades en el que
hay más egresados con CI de sexo femenino que masculino es de 80-89 años, en todos los demás
rangos de edades los pacientes masculinos egresan con más frecuencia.
Ahora ¿En qué rango de edad tiene más riesgo de sufrir CI un paciente de sexo masculino o de
sexo femenino? Hay que hacer un cálculo por rango de edad y por sexo:
40-49 años
Masculino: 6/9 * 100 = 66,67% Femenino: 3/9 * 100 = 33,33%
Nota: por cada rango de edad, y por sexo se va a dividir el N° (masculino o femenino), entre el N°
total en ese rango de edad y se multiplica por 100. Si se nota la primera fila de la tabla en el rango
de edad de 40-49 años, el N° de pacientes egresados de sexo masculino son 6, este dato dividido
entre el total de pacientes egresados en ese rango de edad que son 9, y multiplicado por 100, da
igual a 66,67%. Ese es el porcentaje que dichos pacientes masculinos de 40-49 años de edad,
tienden a sufrir alguna CI. Para saber en qué rango de edad un paciente masculino o una paciente
femenina tienen más riesgo de sufrir CI, habrá que hacer todo el procedimiento mencionado
anteriormente.
50-59 años
60-69 años
70-79 años
80-89 años
Masculino: 5/12 * 100 = 41,67 % Femenino: 7/12 * 100 = 58,33%
Ahora se selecciona el mayor porcentaje en el sexo masculino y en el femenino:
En el rango de edad de 80-89 años una paciente de sexo femenino tiene un mayor riesgo de sufrir
una CI, con una incidencia del 58,33%.
En el rango de edad de 50-59 años un paciente de sexo masculino tiene un mayor riesgo de sufrir
una CI, con una incidencia del 72,41%.
Y ¿cuál es el rango de edad en general que tiene un mayor riesgo de sufrir CI? (Independientemente
del sexo; para esto se verifica el mayor porcentaje obtenido).
El rango de edad de 50-59 años, en pacientes masculinos arrojó una incidencia del 72,41%
Presentación tabular de las series cronológicas

Las series cronológicas no se totalizan, se utilizan las tasas, y las tasas implican la incidencia de un
riesgo. Ej.: Mortalidad por accidentes cerebrovasculares. Estado Bolívar. 2000-2004.
¿Qué se estudia? La mortalidad.
Ejercicio tipo examen. Tabla de distribución de frecuencias.

En un estudio realizado a una muestra de pacientes hipertensos hospitalizados en el departamento
de medicina del Hospital Ruiz y Páez, en el primer trimestre del año 2015, se encontró:
Tabla General:
Pacientes Sexo Edad PA sistólica
1. M 35 135
2. F 20 120 IC= Valor Máx – valor mín + 1UMM
3. M 46 143 N° Clases
4. M 50 143 IC (edad) = 66 – 20 + 1UMM
5. M 66 148 5
6. M 23 123 IC (edad) = 9,4 => 9
7. F 50 139
8. F 28 120
9. F 29 123 *Siempre que se aproxime, la
escala no es exhaustiva. Se
10. M 33 130 aproxima porque los valores de
11. M 36 133 la variable (edad) no están
12. F 48 140 expresados en decimales, sino
13. M 49 148 que están en N° enteros.
14. F 50 139
15. F 60 140
“Pacientes hipertensos hospitalizados según edad.
Departamento de Medicina, Hospital Ruiz y Páez.
Primer trimestre. Año 2015”.
Tabla N° 1:
Edad (años) Pacientes Porcentaje
20-28 3 20% 1. Edad (años) 2. Edad (años)
20-28 20-28
29-37 4 26,66% 29-37 29-37 *Siempre que
38-46 1 6,67% 38-46 38-46 se aproxime la
47-55 5 33,33% 47-55 47-55 escala no es
56-66* 56-64 exhaustiva.
56-64 1 6,67% *Nota: Se aumentó la amplitud 65-73*
65-73* 1 6,67% de la última clase. *Nota: se agregó una clase
adicional.
TOTAL: 15 100% 1. Se puede aumentar la amplitud de la última clase para hacer una
escala exhaustiva.
Fuente: Tabla general de la clase. 2. Otra opción es agregar otra clase adicional. Si se va a hacer gráfico de
una tabla es preferible esta opción.
*Nota: Se agregó una clase adicional.
Nota: Para realizar ésta tabla habrá que vaciar los datos que fueron suministrados anteriormente, al
principio del ejercicio (la tabla en cuanto a sexo, edad, y PA sistólica), en este caso como es una
tabla de distribución de frecuencias, es con una sola variable, y se utiliza en esta ocasión la edad.
Primeramente se calcula el intervalo de clase (IC) con los datos de edad, el IC = 9. Luego, se
construye la tabla empezando con el valor mínimo de edad, que es 20, y este será el límite aparente
inferior (LAI) de la 1°clase; y luego se le suma el intervalo de clase que es 9 (20+9 =29), y 29 será
el LAI pero de la 2° clase, y así sucesivamente, como aparece en la Tabla N° 1. Según el número de
clases debe ser 5, pero como el IC dio 9,4 y se aproximó a 9 debido a que la variable acepta
números enteros, esto influye y hace que la escala no sea exhaustiva, es decir, no incluye a todos los
individuos, porque llegaría hasta 64, y dentro de los datos de edad hay un valor que es igual a 66, es
así que debido a la aproximación que se realizó en el IC ya no se incluye este valor (66) en la tabla.
Bajo estas circunstancias, hay dos opciones que van a afectar a una de las clases de la tabla y que es
necesario colocar en una nota explicativa debajo del cuadro.
Primero, se puede aumentar la amplitud de la última clase para hacer de esta escala exhaustiva, e
incluir al valor que falta de los datos de edad que es 66 años. Pero esta opción no es recomendable
si los datos de la tabla se van a graficar.
Y segundo, se puede agregar una clase adicional, se hace exhaustiva la escala y es recomendable en
caso de querer graficar los datos del cuadro.
Luego de hacer la modificación de la clase (por cualquiera de las opciones mencionadas
anteriormente), se debe notificar en una nota explicativa, (como aparece en los dos ejemplos arriba
en la nube).
En cuanto a vaciar los datos de la tabla general a la tabla N° 1, los datos proporcionados en la tabla
general son de 15 pacientes, y con respecto a la edad, estos datos van a variar. Ya para calcular el
IC fue necesario establecer cuál era el valor máximo y cuál era el valor mínimo (66 y 20
respectivamente), esto quiere decir que los datos que restan están dentro de este rango, y luego de
construir la tabla, con las distintas clases, se debe ubicar cada dato (cada edad) de la tabla general en
la clase que le corresponde. Por ej. El primer dato de la tabla general es 35 años, este dato se
agruparía en la 2° clase de la tabla que va de 29 a 37 años. Y así sucesivamente se hace con el resto
de las edades, hasta completar toda la tabla.
Para calcular el porcentaje, se divide la frecuencia de cada clase entre el total, y luego se multiplica
por 100. Ej. 1° Clase: 3/15 * 100 = 20% 2° Clase: 4/15 * 100 = 26,66%
Ejercicio tipo examen. Tabla de datos asociados.

En un estudio realizado a una muestra de pacientes hipertensos hospitalizados en el departamento
de medicina del Hospital Ruiz y Páez, en el primer trimestre del año 2015, se encontró:
Tabla General:
Pacientes Sexo Edad PA sistólica
1. M 35 135
2. F 20 120
3. M 46 143 IC= Valor Máx – valor mín + 1UMM
4. M 50 143 N° Clases
5. M 66 148 IC (PAs) = 148 – 120 + 1UMM
6. M 23 123 5
7. F 50 139 IC (PAs) = 5,8 => 6
8. F 28 120
9. F 29 123
10. M 33 130
11. M 36 133
12. F 48 140
13. M 49 148
14. F 50 139
15. F 60 140
“Pacientes hipertensos hospitalizados según sexo y presión arterial sistólica.
Departamento de Medicina, Hospital Ruiz y Páez.
Primer trimestre. Año 2015”.
Presión arterial Sexo Total

sistólica (mmHg) Femenino Masculino N° %
120 – 125 3 1 4 26,67%
126 – 131 0 1 1 6,67%
132 – 137 0 2 2 13,33%
138 – 143 4 2 6 40%
144 – 149 0 2 2 13,33%
TOTAL: 7 8 15 100%
Fuente: Tabla general de la clase.
Análisis: La presión arterial sistólica más frecuente en los pacientes, corresponde al rango de 138-
143 mmHg, la cual representa un 40% del total.
La presión arterial sistólica más frecuente en el sexo femenino corresponde al rango de 138-143
mmHg. Mientras que la presión arterial sistólica más frecuente en sexo masculino corresponde al
rango de 132 – 149 mmHg.
Elaboración de la información: Gráficos estadísticos.

El gráfico es la representación en el plano de la información estadística, con el fin de obtener una
impresión visual global del material presentado, que facilite su rápida comprensión. Los
gráficos dan una idea mucho más sintética que los cuadros, muestran variaciones de determinado
fenómeno y son utilizados con fines analíticos. Generalidades, se considera:
1.Título, completo y conciso 2.Gráfico 3.Fuente: Tabla estadística 4.Notas explicativas.
Cuerpo de un gráfico: intercesión entre dos líneas perpendiculares entre sí, de igual longitud, o en
dado caso puede ser mayor la abscisa que la ordenada.
 En la línea horizontal o abscisa, van las diferentes clases de escala.
 En la línea vertical u ordenada, va la frecuencia, o el número de veces que se observa el

fenómeno estudiado.
 Las escalas son de igual longitud,
si son pocas clases. Si son muchas
clases se utiliza la escala 2 es a 1.
Es incorrecto realizar una escala
vertical o una horizontal
exagerada, lo correcto es que la
proporción entre las dos escalas
sea adecuada. (imagen a, b, c)
 Las escalas deben comenzar en

cero (0). Excepto cuando hay
poca distancia entre las
frecuencias, se puede cortar y no
se comienza de cero. Si hay poca
distancia entre las frecuencias no
se pueden apreciar las
fluctuaciones del fenómeno. Lo
correcto es cortar aunque la
escala quede interrumpida.
(imagen d, e)
 Tipos de tablas: distribución de

frecuencias, datos asociados,
series cronológicas.
Tipos de gráficos
1. Diagrama de Barras: representado por rectángulos horizontales o verticales. Las barras deben
ser de igual anchura, y el espacio interbarra que las separa no debe ser mayor a ellas. La escala de
frecuencia debe comenzar en cero (0), NUNCA se corta, sin excepción. Si la escala es nominal las
barras se agrupan de mayor a menor. Y si es ordinal no se puede romper el orden, debe respetarse el
orden de la tabla.
-Barras simples: se utiliza para las DISTRIBUCIONES DE FRECUENCIA en escala
CUALITATIVA o CUANTITATIVA DISCONTINUA.
- Barras múltiples: se emplea para representar DATOS DE ASOCIACIÓN cuyas dos escalas sean
CUALITATIVAS o CUANTITATIVAS DISCONTINUAS. En la abscisa va la variable que se
quiera resaltar.
2. Diagrama Sectorial: (no se utiliza en clase), se usa para DISTRIBUCIONES DE
FRECUENCIA con escala CUALITATIVA o CUANTITATIVA DISCONTINUA. Es alternativa a
la gráfica de barras. Pueden representarse cifras absolutas o porcentajes. Cada uno de los
porcentajes se multiplica por 3,6 y da en grados, para pasarlos a circunferencia se utiliza un
transportador. Cada 1% = 3,6 del círculo.
3. Histograma: el fenómeno que se estudia queda representado por una serie de rectángulos que
siempre se colocan vertical, y deben ir unos al lado de los otros sin ningún espacio que los separe.
Se utiliza para representar DISTRIBUCIONES DE FRECUENCIA con escala CUANTITATIVA
CONTINUA. Existen dos modalidades:
1. Cuando la amplitud de clase es igual se grafican los datos tal cual aparecen en la tabla. Aquí se
utilizan los límites verdaderos de las escalas.
2. Cuando la amplitud de clase es diferente, se divide la frecuencia sobre la amplitud de clase

(Fi/AC) y el resultado es el dato que se inscribe para el gráfico. La amplitud de clase (AC) es igual
a las diferencias entre los límites verdaderos.
4. Polígono de frecuencias: se utiliza para representar DATOS DE ASOCIACIÓN con una escala
CUANTITATIVA CONTINUA y una CUALITATIVA. Son puntos ubicados en la parte media de
cada clase, a la altura que teóricamente alcanzaría la barra y se une por medio de líneas continuas o
discontinuas. Tiene dos modalidades igual que el histograma.
Distribución de frecuencias Datos asociados
Cualitativas Barras simples Barras múltiples

Diagrama Sectorial Polígono de frecuencia
Cuantitativas Barras simples Barras múltiples
discontinuas Diagrama Sectorial
Cuantitativas Histograma Polígono de frecuencia
continuas
Ejemplos: Tabla N° 1:
Defunciones en menores de 50 años según causa. Estado Bolívar. 2014
Causa/Defunción N° Muertes
Accidente de tránsito 670
Enfermedades cardiovasculares 150
Cáncer 200
Otras causas 400
Total: 1.420
Gráfico N° 1:
Defunciones en menores de 50 años según causa. Estado Bolívar. 2014
N° Defunciones
680
510
340
170
0
Accidente Cáncer Enfermeda- Otras Causas de defunción
de tránsito des cardio- Causas
vasculares
Fuente: Tabla N° 1.
Nota: Este es un ejemplo de un gráfico de barras simples. Hay ciertos criterios que se deben cumplir
al realizar un gráfico, son los siguientes.
En el eje de las abscisas (eje de las “x”) tiene que ir la escala (variable) con sus diferentes clases. En
este caso la escala o variable es cualitativa nominal, y son las distintas causas de defunción, y sus
clases están en la tabla N°1. Si la escala fuera ordinal, al graficar dichos valores se tendría que
respetar el orden en el cual las clases se expresan en la tabla. Pero en este caso, como la escala es
cualitativa nominal, se grafican de la que tenga mayor frecuencia (que es accidentes de

tránsito=670) hasta las que tengan menor frecuencia (enfermedades cardiovasculares=150), y
“Otras causas” SIEMPRE se graficará al final, de última, independientemente de su frecuencia.
En el eje de las ordenadas (eje de las “y”) se graficará la frecuencia en la cual incide cada una de las
clases de la escala. Por ejemplo, en la tabla N°1 el N° de muertes por accidentes de tránsito es de
670 (accidente de tránsito es la clase, y 670 es su frecuencia).
El criterio para graficar el eje de las abscisas correspondiente a la frecuencia que es el N° de
defunciones, se procede a verificar la mayor incidencia de muertes, es decir, la mayor frecuencia en
la tabla, en este caso la mayor frecuencia es 670 (670 de accidentes de tránsito, es mayor a las
demás frecuencias: 150 de ECV, 200 de cáncer, y 400 de otras causas). En este eje de las abscisas
no se van a representar todas las frecuencias sino que se busca un número par que sea igual o
inmediatamente mayor a la frecuencia (que es 670) y que sea divisible entre 4, y que el producto de
esa división sea un número entero. El número que se utiliza en este gráfico es 680, se divide entre
cuatro y da igual a 170. Ahora 170 será la diferencia entre cada frecuencia que se va a graficar, es
decir, en el eje “y” se empieza de cero (0) luego 170, después 340, 510 hasta llegar a 680 (verificar
en el gráfico N°1).
Tabla N°2:
Defunciones en menores de 50 años según causa y sexo. Estado Bolívar. 2014
Causa/Defunción Sexo N° Muertes
Masculino Femenino
Accidente de tránsito 470 200 670
Enfermedades cardiovasculares 100 50 150
Cáncer 50 150 200
Otras causas 150 250 400
Total: 770 650 1.420
Gráfico N°2:
Defunciones en menores de 50 años según causa y sexo. Estado Bolívar. 2014
N° Defunción Causas
480 Accidentes de tránsito
360 Enfermedades cardiovasculares
240 Cáncer
120 Otras causas
0
Masculino Femenino Sexo
N° Defunción Sexo
480 Masculino
Femenino
360
240
120
0
Accidentes de tránsito Cáncer Enfermedades cardiovasculares Otras causas Causas
Análisis: En las defunciones del 2014 se observó una mayor frecuencia en el sexo masculino.
La causa más frecuente de defunción fueron los accidentes de tránsito.
En el sexo masculino la causa más frecuente de defunción fueron los accidentes de tránsito.
En el sexo femenino la causa más frecuente de defunción fueron otras causas.
La forma más frecuente de defunción fueron los accidentes de tránsito.
Nota: En esta tabla de datos asociados en la cual hay dos variables, se puede realizar un gráfico de
barras múltiples, el cual se hace de las dos formas que se observó anteriormente. En el eje de las
abscisas siempre irá la variable que se quiera resaltar, mientras que la otra variable que no se
destaque se mostrará en forma de leyenda.
En cuanto al análisis, éste se expresará con respecto a los datos que estén en la tabla, por ejemplo el
sexo que predomina es el masculino, porque según los datos tabulares el sexo masculino tiene 770
N° defunciones sobre el sexo femenino que su frecuencia es de 650. Y la causa más frecuente de
defunción es accidentes de tránsito porque es el que tiene la mayor frecuencia igual a 670. Se podría
concluir también cual es la defunción más frecuente en el sexo masculino, o en el sexo femenino,
todo esto, proporcionado por los datos de la tabla.
Tabla N°3:
Defunciones en menores de 50 años según edad. Estado Bolívar. 2014
Edad (años) N° Muertes
0-9 50
10-19 150
20-29 450
30-39 450
40-49 320
Total: 1.420
Gráfico N° 3:
N° Defunciones
460
345
230
115
0
0 10 20 30 40 50 Edad (años)
Análisis: El rango de edad que tiene una mayor frecuencia de defunción es el que comprende de 20-
40 años.
Nota: Este gráfico es el histograma, se utiliza en caso de ser una sola escala cuantitativa continua,
este gráfico presenta dos modalidades como se explicó anteriormente, esta modalidad depende de la
amplitud de clase (AC) y si ésta es constante o no, es decir si la AC es igual en todas las clases, o
no. En la tabla N°3 la AC es igual, ya que en todas las clases la diferencia entre las edades es igual a
10. Por ej. La clase 1 va de 0-9 años, y la clase 2 va de 10-19 años, la diferencia que hay entre los
límites aparentes inferiores de las clases 1 y 2 (10 - 0) es igual a 10, así mismo, la diferencia entre
los límites aparentes superiores de las clases 1 y 2 (19 - 9) es igual a 10.
Es así que si la AC es igual, al momento de graficar la escala en el eje de las abscisas, se utilizan los
límites verdaderos (regresar a la pág. 7 donde se explican los límites verdaderos). En este caso la
escala es cuantitativa continua especial (edad) los límites verdaderos inferiores son iguales a los
aparentes inferiores, mientras que los límites verdaderos superiores es el límite aparente superior
más 1 U.M.M. Es así que lo que se graficaría en el eje horizontal sería: 0 – 10 – 20 – 30 – 40 – 50
Si fuera una variable cuantitativa continua (ej. Peso), los criterios para determinar los límites
verdaderos dicen que se debe tomar en cuenta es ½ U.M.M., y se graficaría en el eje horizontal:
0 – 9,5 – 19,5 – 29,5 – 39,5 – 49,5.
Tabla N°4:
Edad (años) N° Muertes Fi/AC
0-9 50 50/10 = 5
10-14 100 100/5 = 20
15-29 500 500/15 = 33,33
30-39 450 450/10 = 45
40-49 320 320/10 = 32
Total: 1.420
Gráfico N° 4:
N° Defunciones
48
36
24
12
0
0 10 15 30 40 50 Edad (años)
Análisis: La mayor frecuencia en defunción está en el rango de edad correspondiente de 30-40 años.
Nota: En este caso para representar los datos tabulares se utiliza un histograma, pero en la
modalidad en la que las AC no son iguales, ya que en la primera clase la AC es 10, en la segunda
clase es igual a 5, y en la tercera clase la AC es igual a 15. Es así que es necesario dividir la
frecuencia entre la amplitud de cada clase y el resultado es lo que se graficará en el eje vertical de
las ordenadas, por ej. En la primera clase se divide la frecuencia que es 50 entre la amplitud de esa
clase que es 10, el resultado es igual a 5, eso es lo que se va a graficar.
Es necesario acotar que en el eje de las ordenadas donde irán representadas las frecuencias, se
verifica la mayor frecuencia (de la columna Fi/AC), en este caso es 45, se busca un número par que
sea mayor a 45, y que al dividirlo entre 4 dé un número entero, este es el 48 dividido entre 4 = 12.
Es así que se grafica 0, 12, 24, 36, 48 en el eje vertical.
Tabla N°5:
Defunciones en menores de 50 años según edad y sexo. Estado Bolívar. 2014
Edad Sexo N° Muertes
(años) Masculino Femenino
0-9 30 20 50
10-19 100 50 150
20-29 200 250 450
30-39 250 200 450
40-49 220 100 320
Total: 800 620 1.420
Gráfico N° 5:
Defunciones en menores de 50 años según edad y sexo. Estado Bolívar. 2014
N° Defunciones
260 Sexo
Masculino
195 Femenino
130
65
0
0 10 20 30 40 50 Edad (años)
Análisis: El rango de edad con más frecuencia de defunciones en el sexo masculino es el
correspondiente de 30-40 años. Y el rango de edad con más frecuencia a defunciones en el sexo
femenino es el que corresponde de 20-30 años.
Nota: este gráfico es un polígono de frecuencias.
4. ANÁLISIS E INTERPRETACIÓN DE LOS DATOS: es la etapa del método estadístico

que se encarga de la evaluación de la información disponible, del cumplimiento de los planes, y de
la adecuada recolección de la información para brindar un estudio fidedigno.
Grupos control de los estudios comparativos: son imprescindibles para poder cotejar los resultados
obtenidos. Tipos:
- Control simultáneo: se estudia al mismo tiempo con el grupo experimental, y deben
tener características similares.
- Control histórico: se comparan los resultados observados en el grupo experimental con
los obtenidos en épocas pasadas.
- Universo como grupo control: compara los resultados del grupo experimental con el
resto del universo.
- Los mismos individuos como su propio grupo control.
Diseño del estudio:
- Concurrente: ambos grupos (experimental y control) se eligen de una misma población

o universo de igual forma.
- Externo: se elige en un momento distinto o en otro lugar, o comparado con otros
controles históricos.
Factores del análisis estadístico:

1. Propósito del estudio:
- Descriptivo: resume adecuadamente la información, y resalta o destaca las características
del grupo en estudio.
- Comparativo: averigua si hay o no diferencias entre los grupos de estudio, y halla razones
valederas para explicar las diferencias entre los grupos.
2. Tipo de información recogida:
- Distribución de frecuencia: clasifica de acuerdo a una única escala. Ej. Edad, sexo, estatura.
- Datos de asociación: clasifica simultáneamente de acuerdo a dos escalas.
- Serie cronológica: el tiempo para estudiar la evolución de un fenómeno.
3. Escala de clasificación utilizada:
- Cualitativa: de acuerdo a características comunes para distinguirse de otros que no lo
poseen. Ej. Raza, sexo, estado civil, procedencia, patologías. Estas escalas cualitativas
pueden ser de dos tipos (nominales, u ordinales).
- Cuantitativa: es más precisa, permite diferenciar en los individuos lo observado. Ej. Peso,
edad, frecuencia cardíaca, tensión arterial, número de hijos, número de habitaciones,
ingreso de dinero. Estas escalas cuantitativas pueden ser continuas o discontinuas.
4. N° de individuos estudiados:
- Series no agrupadas: número de individuos poco numerosos, se pondrán uno al lado de otro
sin agrupar en categorías. Son menos de 30 observaciones o muestras.
- Series agrupadas: cantidad apreciable de individuos, y se clasifican por un número de
grupos y clases. Son más de 30 observaciones.
Técnicas de análisis de los estudios descriptivos

1. Distribución de frecuencias:
* Cuantitativas [Series no agrupadas]
- Tendencias centrales:
 Promedio o media aritmética
 Mediana
 Moda
- Medidas de dispersión:
 Desviación estándar
 Percentiles y cuartiles
* Cualitativas:
- Frecuencias relativas:
 Razones
 Proporciones
 Porcentajes y tasas
2. Datos de asociación:
* Ambas escalas cualitativas:
- Frecuencias relativas:
 Porcentajes
 Tasas
* Escala cualitativa y cuantitativa:
- Frecuencias relativas
- Tendencias centrales
- Medidas de dispersión
* Ambas escalas cuantitativas:
- Coeficiente de correlación
- Coeficiente de regresión
3. Series cronológicas: tendencias calculadas, cambios porcentuales y técnicas de regresión.
Análisis de Distribución de frecuencias con escala cualitativa: Frecuencias relativas

Al analizar una distribución de frecuencia es necesario recordar que ésta amerita el estudio de una
sola escala, bien sea cualitativa o cuantitativa. En el esquema anterior se puede apreciar cada una de
las clasificaciones con respecto al tipo de información recogida, y al tipo de escala clasificación. Al
referirse al análisis de una distribución de frecuencia con escala cualitativa, se utiliza la técnica de
frecuencias relativas, la cual abarca razones, proporciones, porcentajes y tasas.
- Razón: es la relación entre los individuos de una categoría con el número de individuos de
otra categoría. Ej.
Razón Hombres Mujeres
297 99
Masc. ÷ =3 Por cada mujer hay 3 hombres.
Ej. Tabla N° 1: “Pacientes según niveles de glicemia y sexo. Ambulatorio Nueva Guayana.
Enero 2015”.
Niveles de Sexo Total
glicemia (mg/dl) Masculino Femenino
60 – 79 12 23 35
80 – 99 24 31 55
100 – 119 32 18 50
120 – 139 41 26 67
140 – 159 11 9 20
Total 120 107 227
* Razón Masculina = N° total masculino/N° total femenino => 120/107 = 1,12

Por cada paciente del ambulatorio Nueva Guayana 1,12 son del sexo masculino.
* R fem (60 – 99 mg/dl) = N° total femenino/ N° total masculino:
23 + 31 / 12 + 24 => 54/36 = 1,50
Por cada 1,50 de pacientes del sexo femenino habrá uno del sexo masculino en niveles de glicemia
de 60 – 99 mg/dl.
O, la razón de feminidad indica que hay un paciente masculino por cada 1,50 pacientes femeninos
con niveles de glicemia de 60 – 99 mg/dl.
* R masc (140 – 159 mg/dl) = 11/9 = 1,22
Por cada paciente del sexo femenino con niveles de 140 – 159 mg/dl, hay 1,22 del sexo masculino.
- Proporción: es la relación del número de observaciones de una categoría con el total

general del grupo. Ej.
Hombres Mujeres Total
+
297 =
99 396
Proporc. Masc.= Hombres ÷ Total = 0,75 (ó ¾ ) Por cada 4 personas, 3 son hombres.
297 396
Ej. Utilizando datos de la tabla N° 1.

* Proporc. (100 – 119) = 50/227 = 0,22
Por cada paciente que se realizó el estudio 0,22 tienen un nivel de glicemia de 100-119 mg/dl.
O, existe una probabilidad de 0,22 de seleccionar un paciente con un nivel de glicemia de 100- 119
mg/dl.
* Proporc. Masc. (100 – 139) = 32 + 41 /120 = 0,60
Por cada paciente masculino, hay una probabilidad de 0,60 de que tengan niveles de glicemia de
100 – 139 mg/dl.
Nota: con respecto a las proporciones, si se quiere conocer la proporción de masculinidad o
feminidad en un rango específico, se divide el total de masculino o femenino de ese rango, entre el
total general de masculino o femenino, tal es el caso del ej. N° 2.
- Porcentajes: es una misma proporción multiplicada por 100. Es dividir el número de cada
categoría entre el total, y multiplicarlo por 100.
Hombres Total
÷
297 =3960,75 * 100 = 75%
÷
Mujeres = 0,25
Total * 100 = 25%
99 396
Ej. Utilizando datos de la tabla N° 1.

* Proporc. 100 – 119 = 0,22 * 100 = 22%
Del total de pacientes que se realizaron la pesquisa el 22% manejan niveles de glicemia de 100-119
mg/dl.
* Proporc. Masc. (100 – 139) = 0,60 * 100 = 60%
Del total de pacientes masculinos, el 60% manejan niveles de glicemia de 100-139 mg/dl.
O, el porcentaje de pacientes masculinos que presentan niveles de glicemia igual a 100-139 mg/dl
es de un 60%.
- Tasas: miden el riesgo que acontezca un determinado fenómeno. El numerador no será

mayor que el denominador. Se utilizan más que todo en series cronológicas.
N° de veces que ocurre un determinado fenómeno x 10n
Población en la cual ocurre el fenómeno
Análisis de Distribución de frecuencias con escala cuantitativa: Series no agrupadas

Paso N°1: ordenar los siguientes datos (de menor a mayor):
53 – 40 – 64 – 57 – 48 – 55 – 51 – 68 – 60 – 57 – 46 – 64 – 59 – 115 – 75 – 60
Peso (kg) 9. 59 Tendencias centrales:

1. 40 10. 60 - - Promedio o Media
2. 46 11. 60 aritmética (𝒙 ̅ ): es la cifra que se obtiene al sumar los
3. 48 12. 64 valores observados entre el número de observaciones.
4. 51 13. 64 ̅ =∑ 𝒏
𝒙
5. 53 14. 68 n (n° observaciones)
6. 55 15. 75 Ej. 972/16 = 60,75 kg.
7. 57 16. 115 Análisis: Todos los individuos tendrían un promedio de 60,75
8. 57 ∑ = 972
kg si entre ellos no existiera variación.
-
- Mediana (Ma): es la observación que divide a los observadores en 2 partes iguales. Siendo
la primera mitad menor o igual, y la segunda mitad es mayor o igual.
Se deben ordenar las observaciones de menor a mayor, una vez dados los datos, es lo primero que se
debe hacer.
1. Serie impar: observación central marca la mediana.
2. Serie par: las dos observaciones centrales entre 2, marcarán la mediana.
Ma = n + 1 (n: número de observaciones, o muestra)
2
Si la serie es impar: Ma = 15 + 1 / 2 = 8 [En la posición 8 está la mediana]
Posición 8 = 57 kg [Datos proporcionados por la tabla anterior]
Si la serie es par (como es el caso de la tabla anterior con 16 observaciones):
Ma = 16 + 1 / 2 = 8,5 [La posición 8,5 no existe, pero en este caso se toman en cuenta la suma de
las posiciones inmediatamente cercanas a 8,5 como lo es la posición 8 y la 9]:
Ma = 57 kg + 59 kg / 2 = 58 kg [57 kg (pos 8) y 59 kg (pos 9) según la tabla]
Análisis: En el estudio, la mitad de los individuos tienen un peso igual o menor a 58 kg, y la otra
mitad igual o mayor a 58 kg.
- Modo (Mo): es aquel valor que se observa con frecuencia en una serie.
Amodal -0: no hay observaciones con mayor frecuencia. Ej. 1-1-2-2-3-3-4-4
Modal -1 Bimodal -2 Polimodal -3 o más
Ej. Los datos que se repiten con más frecuencia de la tabla anterior: Mo = 57-60-64 Polimodal.
Medidas de dispersión: permite conocer cómo se distribuye un fenómeno alrededor de la 𝒙 ̅o Ma.
± √∑ 𝑑 2
- Desviación estándar o típica 𝑛
d = (xi -𝒙̅) => (frecuencia – media aritmética)
𝑑2 = (xi -𝒙̅ )2
Dicho esto, se podría sustituir también la fórmula de desviación estándar de la siguiente manera:
± √∑ 𝑥 2 −𝒙̅2
𝑛
Pasos a seguir [Utilizando los datos de la tabla anterior]:
̅= Restar la frecuencia menos la media aritmética (que ya fue calculada y es igual a 60,75)
1. xi - 𝒙
Peso (kg) ̅
d = xi - 𝒙 d 2 = (xi - 𝒙
̅)2
1. 40 40 – 60,75 = -20,75 20,75 2 = 430,56
2. 46 46 – 60,75 = -14,75 14,75 2 = 217,56
3. 48 -12,75 162,56
4. 51 -9,75 95,06
5. 53 -7,75 60,06
6. 55 -5,75 33,06
7. 57 -3,75 14,06
8. 57 -3,75 14,06
9. 59 -1,75 3,06
10. 60 -0,75 0,56
11. 60 -0,75 0,56
12. 64 3,75 14,06
13. 64 3,75 14,06
14. 68 7,75 60,06
15. 75 14,75 217,56
16. 115 54,75 2.997,56
∑ = 972 ∑=0 ∑ = 4.334,46
(Tiene que dar cero)
̅ ) 2= Elevar el resultado anterior al cuadrado.

2. (xi - 𝒙
3. Sustituir en la fórmula. Dividir (4.334,46) entre n (que es el n° de observaciones, igual a 16).
± √∑ 𝑥 2 −𝒙
̅2 ± √∑ 4.334,46
𝑛
=> 16
= ± √270,90 = ± 16,46 kg.
Análisis: Todos los individuos tienen una variación en su peso de ± 16,46 kg en relación a la 𝑥̅ que
es igual a 60,75 kg.
- Percentil: permite determinar ubicación posicional de la observación. Es una medida de
posición, y es el ÚNICO sitio donde SE APROXIMA.
P = n + 1x Percentil a calcular
100
P50 SIEMPRE es igual a la mediana (Ma).
P50 = 16 + 1x 50 = 8,5 ≈ 9 => Posición 9 en la tabla = 59 kg.
100
Análisis: Del total de los individuos el 50% tiene un peso menor o igual a 59 kg.
P76 = 16 + 1 / 100 x 76 = 12,9 ≈ 13 => Posición 13 = 64 kg

Análisis: Del total de los individuos el 76% tiene un peso menor o igual a 64 kg.
- Cuartiles:n+1x cuartil a calcular ¼ 2⁄4¾ 4⁄4
4 I II III IV
Q1 = 16 + 1 / 4 x 1 = 4 25% 50% 75% 100%
Posición 4 = 51 kg
Análisis: Una cuarta parte (o un 25%) de los individuos, tienen un peso menor o igual a 51 kg.
El Q2 es igual a la mediana.
Q3 = 16 + 1 / 4 x 3 = 12,75 ≈ 13 => Posición 13 = 64 kg
Análisis: Tres cuartas partes (o un 75%) de los individuos, tienen un peso menor o igual a 64 kg.
- Quintiles:n+1x quintil a calcular

5
- Deciles: n+1x decil a calcular
10
________________________________________________________________________________
Series Agrupadas(más de 30 datos u observ.)

*Frecuencia de clase o frecuencia absoluta (Fi): se
determina el número de individuos que pertenece a cada
Edad (años) Fi Fa clase.
16 – 20 16 16 1° Paso *Frecuencia relativa (Fr): es la frecuencia absoluta
21 – 25 28 44 dividida por la frecuencia total de todas las clases y se
expresa en porcentaje.
26 – 30 14 58 Fr = Fi/n x 100
31 – 35 10 68 *Frecuencia acumulada (Fa): es la acumulación
36 – 40 14 82 descendente (de la 1° a la última clase) de Fi:
-La 1° Fa corresponde a la 1° Fi.
41 – 45 26 108
-La 2° Fa se obtiene sumando la primera y segunda Fi…
Total 108 Y así sucesivamente.
Para series agrupadas, es necesario tener en cuenta una fórmula general para el cálculo de medidas
de posición, es la siguiente:
MP(x) = LRI + PMx – Faa x AC
Fi
Donde:
MP(x) = Medida de posición (x).
LRI = Límite real (o verdadero) inferior de la clase donde está la medida de posición (MP) a buscar.
PMx = Posición de medida (x). – Percentil, cuartil, mediana –
Faa = Frecuencia acumulada anterior (de la clase anterior).
Fi = Frecuencia absoluta.
AC = Amplitud de clase.
Para el cálculo de medidas de posición

1°Acumular
Paso la frecuencia.
2° Paso
Buscar la posición de medida deseada (PMx) con la fórmula de percentiles y cuartiles y mediana
para datos agrupados:
- Percentiles (P): P(x) = Px . n
100
- Cuartiles (Q): Q(x) = Qx . n
4
- Mediana (Ma): Ma = ∑n /2
Se calcula la posición y luego se aplica la fórmula de medidas de posición MP(x).
3° Paso Buscar el valor de esa posición con la fórmula general de MP(x).
 Cuartiles:
Qx = Qx . n => Ej. Q1 = 1 . 108 / 4 = 27 => Posición 27 en la segunda clase
4
Nota: Esta posición 27 en la tabla corresponde a la segunda clase, pero es con respecto a la
frecuencia acumulada (Fa), ya que en la columna de Fa la segunda clase llega hasta el dato n° 44, es
decir, si se nota en la tabla la primera Fa es 16, esto significa que abarca las observaciones de la 1 a
la 16. La segunda Fa es 44, esto significa que abarca las observaciones de la 17 a la 44. La posición
del cuartil es 27, y es así que estaría ubicado en ésta segunda clase.
Una vez calculada la posición, se calcula el valor de esa posición con la fórmula general MP(x).
MP(x) = LRI + PMx – Faa x AC

Fi
MP (Q1) = 21 + 27 – 16 x 5 = 21 + 11 x 5 => 21 + 0,39 x 5 =>22,95 años
28 28
Análisis: Una cuarta parte correspondiente al 25% de los individuos estudiados presentaron una
edad menor o igual a 22,95 años.
Nota: Con respecto a los datos presentados en la fórmula general de medidas de posición MP(x),
hay que recordar que antes se había calculado la posición de medida, en este caso del cuartil 1, y
este resultó en la posición 27 correspondiente a la segunda clase de la tabla, por el contexto
explicado anteriormente. El límite real inferior que ha de ser utilizado es el de ésta segunda clase, y
corresponde a 21 (no en todos los casos el límite real o verdadero inferior va a ser igual al aparente
inferior, hay que recordar que la edad, que es la variable que se está estudiando en este ejercicio es
una variable cuantitativa continua especial, y es necesario tener presente siempre cuales son los
criterios que rigen los límites verdaderos y aparentes para cada tipo de variable). La posición de
medida PM(x) es la que ya se ha calculado con la fórmula anterior, la posición 27. La frecuencia
acumulada anterior, corresponde a 16, porque no es la de la segunda clase que hay que tomar en
cuenta, es la frecuencia acumulada de la clase anterior a la cual se está estudiando, es decir en este
caso de la primera clase. La frecuencia absoluta si es la correspondiente a la clase que se está
estudiando, entonces debe ser la Fi de la segunda clase, igual a 28. Y la amplitud de clase es la
diferencia que hay entre los límites verdaderos, y ésta es igual a 5.
Ej. Q3 = 3 . 108 / 4 = 324/4 = 81 => Posición 81. 5° clase.

MP (Q3) = 36 + 81 – 68 x 5 = 36 + 0,92 x 5 = 40,6 años
14
Análisis: Tres cuartas partes de los individuos presentan una edad menor o igual a 40,6 años.
 Percentiles:
P(x) = Px . n Ej. P (67) = 67 x 108 = 72,36 => Posición 72,36 (no se aproxima)
100 100 5° Clase.
MP (P67) = 36 + 72,36 – 68 x 5 = 36 + 0,31 x 5 = 37,55 años
14
Análisis: El 67% de los individuos presentaron una edad menor o igual a 37,55 años.
Ej. P (52) = 52 x 108 = 56,16 => Posición 56,16. 3° Clase.

100
MP (P52) = 26 + 56,16 – 44 x 5 = 26 + 0,87 x 5 = 30,35 años
14
Análisis: El 52% de los individuos presentaron una edad menor o igual a 30,35 años.
 Mediana: valor que ocupa el centro de la serie con respecto al número de término.
Ma = ∑n / 2 => 108/2 = 54 => Posición 54. 3° Clase.
MP (Ma) = 26 + 54 – 44 x 5 = 26 + 0,71 x 5 = 29,55 años
14
Análisis: En el estudio, la mitad de los individuos tienen una edad igual o menor a 29,55 años, y la
otra mitad igual o mayor a 29,55 años.
 Media aritmética: valor que tendrían todas las observaciones si entre ellas no
existiera variación.
Método corto: se usa cuando las amplitudes de cada clase, son iguales. Es decir, cuando las AC son
constantes e iguales.
̅ = A +∑ Fi . dj x AC
𝒙
n
1° Paso: Calcular A.
A = punto medio de la clase central. O punto medio de la clase central superior si existen dos clases
centrales. En este caso la clase central sería la 3° clase (flecha).
Edad (años) Fi Fa
16 – 20 16 16
21 – 25 28 44
26 – 30 14 58
31 – 35 10 68
36 – 40 14 82
41 – 45 26 108
Total 108
Punto medio (PM) = LVI + LVS / 2 => 26 + 31 / 2 = 28,5 =>A = 28,5

2° Paso: Se obtiene la sumatoria de Fi y dj.
Dj. Son los desvíos unitarios de las clases. Se realiza colocando cero (0) en la clase central, las
clases superiores son negativas (-) y las inferiores son positivas (+).
Edad (años) Fi Fa dj
16 – 20 16 16 -2
21 – 25 28 44 -1
26 – 30 14 58 0
31 – 35 10 68 +1
36 – 40 14 82 +2
41 – 45 26 108 +3
Total 108
3° Paso: Multiplicación de Fi . dj en cada clase, y se suman al final.
Edad (años) Fi Fa dj Fi . dj
16 – 20 16 16 -2 - 32
21 – 25 28 44 -1 -44
26 – 30 14 58 0 0
31 – 35 10 68 +1 10
36 – 40 14 82 +2 28
41 – 45 26 108 +3 78
Total ∑ = 108 ∑ = 56
4° Paso: Sustituir en la fórmula.

̅ = A +∑ Fi . dj x AC
𝒙
n
̅
𝒙 = 28,5 + 56 x 5 = 28,5 + 0,52 x 5 ̅ = 31,1 años.
=>𝒙
108
Análisis: Todos los individuos tendrían una edad promedio de 31,1 años si entre ellos no existiese
variación con respecto a la edad.
Método largo: se usa cuando las amplitudes de cada clase son distintas. También se puede usar en
cualquier circunstancia (según el prof.)
̅ = ∑ Fi . Xi
𝒙 Xi = Punto medio de cada clase.
n Punto medio (PM) = LVI + LVS / 2
Edad (años) Fi Fa
16 – 20 16 16
21 – 25 28 44
26 – 30 14 58
31 – 35 10 68
36 – 40 14 82
41 – 45 26 108
Total 108
1° Paso: Calcular Xi de cada clase.
PM (1° clase) = 16 + 21 / 2 = 18,5
PM (2° clase) = 21 + 26 / 2 = 23,5
PM (3° clase) = 26 + 31 / 2 = 28,5
PM (4° clase) = 31 + 36 / 2 = 33,5
PM (5° clase) = 36 + 41 / 2 = 38,5
PM (6° clase) = 41 + 46 / 2 = 43,5
Nota: Si la AC es igual, se le suma la AC al primer punto medio calculado, para no perder tiempo.
Esto es SOLAMENTE cuando la AC es constante e igual. Sino, hay que calcular cada uno.
2° Paso: Multiplicar Fi . Xi, y sumar al final.
Edad (años) Fi Fa Xi Fi . Xi
16 – 20 16 16 18,5 296
21 – 25 28 44 23,5 658
26 – 30 14 58 28,5 399
31 – 35 10 68 33,5 335
36 – 40 14 82 38,5 539
41 – 45 26 108 43,5 1.131
Total ∑ = 108 ∑ = 3.358
3° Paso: Sustituir en la fórmula
̅ = ∑ Fi . Xi
𝒙
n
̅ = 3.358 = 31,09 ≈ 31,1 años
𝒙
108
Análisis: Todos los individuos tendrían una edad promedio de 31,1 años si entre ellos no existiese
variación con respecto a la edad.
 Desviación estándar: valor que refleja en cuanto difiere en promedio el valor de

todas y cada una de las observaciones con respecto a su media aritmética.
Método corto: para amplitudes de clases iguales.
De = ±𝐼𝐶 √∑ 𝐹𝑖 . 𝑑𝑗2 - ∑ 𝐹𝑖 . 𝑑𝑗2
n n
1° Paso:∑ 𝐹𝑖 . 𝑑𝑗2 Ya se tiene Fi . dj, para elevar dj al cuadrado, lo más rápido es multiplicarlo
nuevamente por dj, y se obtiene 𝐹𝑖 . 𝑑𝑗 2. Ej. -32 . -2 = 64
Edad (años) Fi Fa dj Fi . dj Fi . dj2
16 – 20 16 16 -2 - 32 64
21 – 25 28 44 -1 -44 28
26 – 30 14 58 0 0 0
31 – 35 10 68 +1 10 10
36 – 40 14 82 +2 28 56
41 – 45 26 108 +3 78 234
Total ∑ = 108 ∑ = 56 ∑ = 392
De = ±𝐼𝐶 √∑ 𝐹𝑖 . 𝑑𝑗2 - ∑ 𝐹𝑖 . 𝑑𝑗2
n n
De = ±5 √ 392 - 56 2
108 108
De = ±5 √ 392 - 0,52 2
108
De = ±5 √3,63 - 0,27
De = ±5 √3,36
De = ±5 . 1,83 => De = ± 9,15 años.
Análisis: Todos y cada uno de los individuos tienen una variación en su edad de ± 9,15 años en
relación a su media aritmética igual a 31,1 años.
Método largo: cuando las amplitudes de clases son distintas.
De = ± √∑ 𝐹𝑖 . 𝑋𝑖2 - ̅ 𝒙2
n
̅por método largo ya se han obtenido los valores de Fi . Xi, así que se
1° Paso: al calcular la 𝒙
procede a multiplicar ese valor por Xi nuevamente. Ej. 18,5 . 296 = 5.476
Edad (años) Fi Fa Xi Fi . Xi Fi . Xi2
16 – 20 16 16 18,5 296 5.476
21 – 25 28 44 23,5 658 15.463
26 – 30 14 58 28,5 399 11.371,5
31 – 35 10 68 33,5 335 11.222,5
36 – 40 14 82 38,5 539 20.751,5
41 – 45 26 108 43,5 1.131 49.198,5
Total ∑ = 108 ∑ = 3.358 ∑ = 113.483

De = ± √∑ 𝐹𝑖 . 𝑋𝑖2 - 𝒙 ̅2 =>De = ± √113.483 - (31,1)2 =>De = ± √1.050,77 – 967,21
n 108
De = ± √83,56 = De = ± 9,14 años.
Análisis: Todos y cada uno de los individuos tienen una variación en su edad de ± 9,14 años en
relación a su media aritmética igual a 31,1 años.
 Moda (Mo): valor que se repite en la serie. Es la clase donde hay más individuos.
Según la frecuencia absoluta (Fi) es en la 2° clase, en la cual hay 28 individuos.
Edad (años) Fi
16 – 20 16
21 – 25 28
26 – 30 14
31 – 35 10
36 – 40 14
41 – 45 26
Total ∑ = 108
LVI + LVS /2 => 21 + 26 / 2 = 23,5
Análisis: Es una serie unimodal, y la moda es de 23,5. Las edades que más se repiten son de 21-25
años.
- La moda es el valor que más se repite, se debe tener en cuenta los valores de las edades, y la
frecuencia absoluta (Fi) son las veces que más se repiten las edades. ¿Cuáles son las edades
que más se repiten? De 21 a 25 años. Para evitar cálculos, la moda es el punto medio de la
clase que más se repite, es decir la clase que tiene una mayor frecuencia absoluta (Fi).
- Para que la serie fuera bimodal, tendría que haber otra clase con 28 individuos. Y se toman
en cuenta el punto medio de ambas clases.
*Notas:
Los estadísticos utilizados para analizar variables cuantitativas continuas en series agrupadas son las
mismas de series no agrupadas, solo que varían en la forma de calcularlos, pero el análisis sigue
siendo igual, estos estadísticos son:
- De posición (percentiles, cuartiles)
- De tendencia central (media aritmética, moda, mediana)
- De variabilidad o de dispersión (desviación estándar)
Para calcular cuartiles (Q) y percentiles (P) en series agrupadas, donde hay más de 30 individuos, se
elimina el factor de corrección +1. En series agrupadas donde haya menos de 30 individuos
estudiados, sí se coloca el factor de corrección +1.
n + 1 x cuartil a calcular => Menores a 30 individuos estudiados
4
n . Q(x) => Mayores a 30 individuos estudiados
4
No se aproxima, en la única parte donde se aproxima es en el 2° paso en las medidas de posición en
series no agrupadas. Si la posición da 2,85 se aproxima a 3. Y si da 2,25 se aproxima a 2.
El Q3 es igual al P75. Si se pide analizar el Q3 no se analiza en un 75%, sino que se analiza en ¾
partes.
El Q1 es igual al P25. Y el Q2 es igual al P50 y a la Mediana.
Ej. P12 = 12 . 108 /100 = 12,96 (Sin aproximar) => Posición 12,96. 1° Clase.
MP(P12) = 16 + 12,96 – 0 x 5 = 16 + 0,81 x 5 = 20,05 años.
16
Análisis: El 12% de los individuos estudiados tienen una edad menor o igual a 20,05 años.
La mediana, además de ser una medida de tendencia central, porque ocupa el centro de la serie con
respecto al número de término, también es una medida de posición, por lo tanto hay que cumplir
con los pasos para calcular medidas de posición (acumular la frecuencia, buscar la posición de la
mediana, y buscar el valor de posición con la fórmula general de medidas de posición MP(x))
Y con respecto a “dj”, los desvíos unitarios, es la diferencia que hay de la posición de cada una de
las clases con respecto a la clase que se toma como central.
Coeficiente de correlación: tabla de datos asociados con dos variables cuantitativas continuas.
Para esta tabla se utiliza el gráfico de correlación o de Pearson. En el eje “x” de las abscisas se van a
escribir los valores de las variables independientes, y en el eje “y” de las ordenadas, los valores de
las variables dependientes. En este gráfico no necesariamente se comienza de cero (0), en este
gráfico deben aceptarse todos los valores, sean muy altos o muy bajos. Para definir las variables
dependientes o no, se utiliza la lógica, por ej. El peso depende de la estatura, entonces la talla que es
la variable independiente es “x”, y el peso que es la variable dependiente, es “y”.
El gráfico consiste en colocar los puntos donde coincida el peso con la estatura. Hay asociación
cuando los puntos tienden a agruparse alrededor de una línea diagonal. Entre más cerca estén de esa
línea diagonal, mayor será el grado de asociación. Si todos los puntos caen sobre la línea recta hay
una asociación perfecta.
- A medida que aumentan los valores de la variable independiente, y aumentan los de la
variable dependiente, existe una correlación directamente proporcional.
- A medida que aumentan los valores de la variable independiente, y disminuyen los de la
variable dependiente, existe una correlación inversamente proporcional.
 En clase, se calculará el coeficiente sin necesidad de hacer el gráfico.
Coeficiente de correlación de Pearson (r)
∑ 𝒙 .𝒚
- 𝒙̅ .𝒚
̅ ̅= media de x
𝒙 ̅= media de y
𝒚
𝒏
r= dex . dey dex = desviación de x dey = desviación de y
N° “y” “x”
Peso (kg) Talla (cm)
1. 63 165
2. 83 178
3. 90 176
4. 60 170
5. 66 160
6. 69 150
7. 53 164
8. 65 172
9. 58 166
10. 55 167
1° Paso: Multiplicar talla por peso (x . y), y sumarlos al final. Ej. 63 . 165 = 10.395
N° “y” “x” X.Y
Peso (kg) Talla (cm)
1. 63 165 10.395
2. 83 178 14.774
3. 90 176 15.840
4. 60 170 10.200
5. 66 160 10.560
6. 69 150 10.350
7. 53 164 8.692
8. 65 172 11.180
9. 58 166 9.628
10. 55 167 9.185
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804
2° Paso: calcular la media de “x” y de “y”. Como son datos no agrupados, se suman todos los datos
y se dividen entre el n° de observaciones.
̅= ∑ Xi / n => 1.668 / 10 =>𝒙
𝒙 ̅ = 166,8 Xi= valores de cada talla
̅= ∑ Yi / n => 662 / 10 =>𝒚
𝒚 ̅ = 66,2 Yi = valores de cada peso
3° Paso: calcular desviación estándar de “x”

Dex = ± √ ∑ 𝐷𝑥2
n
Dx = desvíos de “x” al cuadrado. Los desvíos son la diferencia que hay entre el valor de cada una
2
de las observaciones con respecto a su media aritmética.

Dx = x – 𝒙
̅ Ej. 165 – 166,8 = -1,8
“y” “x”
N° Peso (kg) Talla (cm) x.y x-𝒙 ̅
1. 63 165 10.395 - 1,8
2. 83 178 14.774 11,2
3. 90 176 15.840 9,2
4. 60 170 10.200 3,2
5. 66 160 10.560 - 6,8
6. 69 150 10.350 - 16,8
7. 53 164 8.692 - 2,8
8. 65 172 11.180 5,2
9. 58 166 9.628 - 0,8
10. 55 167 9.185 0,2
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804
̅ )2
Dx2 = (x - 𝒙 Ej. (-1,8)2 = 3,24
“y” “x”
N° Peso (kg) Talla (cm) x.y x-̅ 𝒙 (x - ̅
𝒙 )2
1. 63 165 10.395 - 1,8 3,24
2. 83 178 14.774 11,2 125,44
3. 90 176 15.840 9,2 84,64
4. 60 170 10.200 3,2 10,24
5. 66 160 10.560 - 6,8 46,24
6. 69 150 10.350 - 16,8 282,24
7. 53 164 8.692 - 2,8 7,84
8. 65 172 11.180 5,2 27,04
9. 58 166 9.628 - 0,8 0,64
10. 55 167 9.185 0,2 0,04
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804 ∑ = 587,6
Dex = ± √ ∑ 𝐷𝑥2 => Dex = ± √ 587,6 => Dex = ± √ 58,76 = ± 7,67

n 10
4° Paso: Calcular desviación estándar de “y”

Dey = ± √ ∑ 𝐷𝑦2
n
Dy = y – 𝒚
̅ Ej. 63 – 66,2 = -3,2
“y” “x”
N° Peso (kg) Talla (cm) x.y x-𝒙 ̅ ̅ )2
(x - 𝒙 y-𝒚 ̅
1. 63 165 10.395 - 1,8 3,24 - 3,2
2. 83 178 14.774 11,2 125,44 16,8
3. 90 176 15.840 9,2 84,64 23,8
4. 60 170 10.200 3,2 10,24 -6,2
5. 66 160 10.560 - 6,8 46,24 -0,2

6. 69 150 10.350 - 16,8 282,24 2,8
7. 53 164 8.692 - 2,8 7,84 -13,2
8. 65 172 11.180 5,2 27,04 -1,2
9. 58 166 9.628 - 0,8 0,64 -8,2
10. 55 167 9.185 0,2 0,04 -11,2
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804 ∑ = 587,6
̅ )2
Dy2 = (y - 𝒚 Ej. (-3,2)2 = 10,24
“y” “x”
(x - 𝒙 y-𝒚 ̅ ̅ )2
(y - 𝒚
1. 63 165 10.395 - 1,8 3,24 - 3,2 10,24
2. 83 178 14.774 11,2 125,44 16,8 282,24
3. 90 176 15.840 9,2 84,64 23,8 566,44
4. 60 170 10.200 3,2 10,24 -6,2 38,44
5. 66 160 10.560 - 6,8 46,24 -0,2 0,04
6. 69 150 10.350 - 16,8 282,24 2,8 7,84
7. 53 164 8.692 - 2,8 7,84 -13,2 174,24
8. 65 172 11.180 5,2 27,04 -1,2 1,44
9. 58 166 9.628 - 0,8 0,64 -8,2 67,24
10. 55 167 9.185 0,2 0,04 -11,2 125,44
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804 ∑ = 587,6 ∑ = 1.273,6
Dey = ± √ ∑ 𝐷𝑦2 => Dey = ± √ 1.273,6 => Dey = ± √ 127,36 = ± 11,29

n 10
5° Paso: Sustituir valores en la fórmula de Pearson.

∑ 𝒙 .𝒚
̅ .𝒚
- 𝒙 ̅
𝒏
r= dex . dey
𝟏𝟏𝟎.𝟖𝟎𝟒
- 166,8 𝑥 66,2
𝟏𝟎
r= 7,67 x 11,29
r= 11.080,4 - 11.042,16
86,59
r = 38,24
86,59
r = 0,44
Grado de correlación que existe entre las dos variables. Valores entre los cuales está comprendido el
coeficiente de correlación: -1…0…+1
Coeficiente de correlación:
- De 0 a +0,40: Correlación directamente proporcional leve.
- De 0 a -0,40: Correlación inversamente proporcional leve.
- De +0,41 a +0,84: Correlación directamente proporcional moderada.
- De -0,41 a -0,84: Correlación inversamente proporcional moderada.
- De +0,85 a +1: Correlación directamente proporcional fuerte o alta.
- De -0,85 a -1: Correlación inversamente proporcional fuerte o alta.
Análisis: En el estudio, con respecto a peso y talla, existe una correlación directamente proporcional
moderada igual a 0,44.
Para saber qué porcentaje de las variaciones de la variable dependiente pueden ser atribuidas a
variaciones de la independiente, es decir, qué porcentaje de las variaciones de peso dependen de las
variaciones de la talla, para esto se utiliza el:
Coeficiente de determinación (CD): estima qué porcentaje de las variables dependientes pueden
ser atribuidas a cambios, o varían con las variables independientes.
¿Qué porcentaje de las variaciones de peso pueden ser atribuidos a cambios de la estatura?
CD = r2x 100
CD = (0,44)2x 100
CD = 19,36%
Análisis: En el estudio, el 19,36% de las variaciones del peso pueden ser atribuidas a cambios y/o
variaciones de la estatura.
*El 80,64% restante dependerá de otras variables, que no competen.
Para saber cuántas unidades varía la variable dependiente con la variación de una unidad de la
variable independiente, es decir, cuántos kg va a variar el peso por la variación de 1 cm en la
estatura, para esto se utiliza el:
Coeficiente de Regresión: b = ∑ dex . dey = ∑ dex . dey => Ej. -1,8 . -3,2 = 5,76
∑ dx2 587,6
“y” “x” dex dey

(x - 𝒙 y-𝒚 ̅ ̅ )2
(y - 𝒚 dex . dey
1. 63 165 10.395 - 1,8 3,24 - 3,2 10,24 5,76
2. 83 178 14.774 11,2 125,44 16,8 282,24 188,16
3. 90 176 15.840 9,2 84,64 23,8 566,44 218,96
4. 60 170 10.200 3,2 10,24 -6,2 38,44 -19,84
5. 66 160 10.560 - 6,8 46,24 -0,2 0,04 1,36
6. 69 150 10.350 - 16,8 282,24 2,8 7,84 -47,04
7. 53 164 8.692 - 2,8 7,84 -13,2 174,24 36,96
8. 65 172 11.180 5,2 27,04 -1,2 1,44 -6,24
9. 58 166 9.628 - 0,8 0,64 -8,2 67,24 6,56
10. 55 167 9.185 0,2 0,04 -11,2 125,44 -2,24
Total ∑ = 662 ∑ = 1.668 ∑ = 110.804 ∑ = 587,6 ∑ = 1.273,6 ∑ = 382,4
b = 382,4 = 0,65
587,6
Análisis: Por cada centímetro que aumente la estatura, aumentan 0,65 kg de peso.
*Porque es directamente proporcional, si aumenta la variable independiente, también aumenta la
dependiente.
Se pueden estimar valores de la variable dependiente una vez conocidos los valores de la
independiente, para esto se utiliza:
Ecuación de la línea recta: se puede predecir qué peso tendrá un individuo que tenga determinada
estatura. Ej. Calcular el peso de un individuo con talla = 173 cm.
y (x) = 𝑦̅ − 𝑏 . 𝑥̅ + 𝑏 . 𝑥
y (173) = 66,2 – (0,65 . 166,8) + (0,65 . 173)
y (173) = 66,2 – 108,42 + 112,45
y (173) = 70,23
Análisis: El peso estimado para un individuo con una talla igual a 173 cm, es de 70,23 kg.
*Nota: El valor de la variable independiente tiene que estar comprendida entre el valor máximo y el
valor mínimo que está en la tabla, no sirve para predecir valores que estén fuera del rango de la
serie estudiada.
Si el valor de la variable independiente, en este caso es la talla, aumenta por encima de su media,
entonces también tiene que aumentar la variable dependiente, esto si la correlación es directamente
proporcional, ya que si aumenta la independiente, también debe aumentar la dependiente. De los
contrario, la correlación es inversamente proporcional, esto cuando al aumentar la variable
independiente, disminuye la dependiente, o viceversa.
Series Cronológicas
Estudian la variación de un fenómeno a través del tiempo, por ej. Casos o muertes de una
enfermedad, número de estudiantes, entre otros. Al presentar una tabla con datos de serie
cronológica se muestra la variación de un fenómeno de una época a otra, por lo que no se usan los
porcentajes. Cuando se utilizan poblaciones las cuales varían en el tiempo a través de los años, es
importante la utilización de las tasas para la comparación de datos.
La finalidad de las series cronológicas es tratar de determinar una tendencia a base de una serie de
registros en relación al tiempo (meses, años, semanas epidemiológicas). Dependiendo del registro
del fenómeno y de cómo se presente, la tendencia puede ser en ascenso o en descenso.
Componentes de una serie cronológica:
- Tendencias:representa movimientos lentos y graduales de un conjunto de datos que originan un
desplazamiento uniforme y se identifican como cambios permanentes y fundamentales.
- Variaciones estacionales:representa los movimientos oscilatorios dentro de períodos cortos; un año o
menos.
- Fluctuaciones cíclicas: son de largo plazo, movimientos oscilatorios alrededor de una tendencia, se
caracterizan por crecimiento y caídas, se revierte y puede iniciarse otro ciclo.
- Sucesos aleatorios o irregulares: es una variación esporádica ocasionada por incidente o accidente.
Estadísticos de las series cronológicas
1. Número Índice: es un número relativo que permite ver la evolución de un fenómeno en base a una
o varias series cronológicas. Es la relación que tiene la 1° observación con el resto de las
observaciones que estén en la serie cronológica.
Mortalidad maternacasos y tasa (100.000 NVR)Venezuela 2001-2008
Años N° de Muertes Tasa (100000 NVR)
2001 256 51,0
2002 313 59,3
2003 327 60,1
2004 356 67,2
2005 335 68,0
2006 321 57,7
2007 318 54,7
2008 351 59,9
El número índice es una razón de cada uno de los años con el primero, multiplicado por 100, esto
quiere decir que se compara un determinado año a calcular, con el primer año dado en la tabla de
series cronológicas, y se dividen, luego este resultado se multiplica por 100.
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑎ñ𝑜 𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑟
𝑁𝐼(𝑥) = 𝑥 100
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑎ñ𝑜
Ej. Número índice del año 2007: [Tasa del año 2007=54,7… Tasa del primer año (2001) = 51,0]
54,7
𝑁𝐼(2007) = 51,0
𝑥 100 = 107,25%
Nota: Para considerar que la tasa de un determinado año ha aumentado con respecto a la tasa del
primer año, es necesario considerar el valor que esté por encima del 100%. Ej. El resultado del
número índice igual a 140,50% lo que esté por encima del 100% que es 40,50% es lo que aumenta
en realidad una tasa. Mientras que la disminución es lo que esté por debajo del 100%. Ej. 90% =
10% es lo que disminuye una determinada tasa, porque es la diferencia entre 90% y 100%.
Análisis: La tasa de mortalidad materna en Venezuela en el año 2007 aumentó un 7,25 % con
respecto a la del 2001.
2. Variación promedio anual (VPA): Permite calcular la variación del fenómeno en el período
estudiado, que puede ser ascendente o descendente. Es lo que varía en promedio la tasa cada año.
𝑇𝑎𝑠𝑎𝑑𝑒𝑙ú𝑙𝑡𝑖𝑚𝑜𝑎ñ𝑜 − 𝑇𝑎𝑠𝑎𝑑𝑒𝑙𝑝𝑟𝑖𝑚𝑒𝑟𝑎ñ𝑜
𝑉𝑃𝐴 =
𝑁°𝑑𝑒𝑙𝑎𝑝𝑠𝑜𝑠
𝑁° 𝑑𝑒 𝑙𝑎𝑝𝑠𝑜𝑠 = 𝑁° 𝑑𝑒 𝑎ñ𝑜𝑠 − 1
59,9 − 51,0
𝑉𝑃𝐴 = 7
= 1,27
Análisis: La tasa de mortalidad materna en Venezuela aumentó en promedio 1,27 defunciones
maternas cada año por cada 100.000 NVR, en el período 2001 – 2008.
O también: La mortalidad materna tiene una VPA de 1,27 cada año.
La tasa de mortalidad materna en el período 2001-2008 aumenta 1,27 cada año.
Uno de los usos que se le da a la variación promedio anual (VPA) es:
3. Proyecciones: se pueden hacer proyecciones futuras para años inmediatos, es decir, deben ser de
corto tiempo, con una estimación máxima de 1 a 2 años. Esto quiere decir que a partir de la tasa del
último año de series cronológicas se puede estimar la tasa de años próximos, bien sea 1 año o 2 años
después de la última observación de la tabla, esto mediante la fórmula que se dará a continuación.
Y(X)= Tasa del último año + VPA x N° de años que ha pasado (entre el último año y la fecha a
calcular) (1 ó 2 años máximo).
Ej. Proyección para el año 2010: [Del 2008 que es el último año al 2010, el n° de años que ha pasado es igual a 2]
Y(x) = 59,9 + 1,27 x 2 => 59,9 + 2,54 = 62,44
Análisis: La tasa de mortalidad materna que se espera para el año 2010 es de 62,44.
4. Aumento o descenso porcentual:Es lo que aumenta o desciende, porcentualmente, el fenómeno
estudiado en el período dado.
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑢𝑙𝑡 𝑎ñ𝑜 − 𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑎ñ𝑜
𝐴𝑜𝐷% = 𝑥 100
𝑇𝑎𝑠𝑎 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑎ñ𝑜
59,9 −51,0
𝐴𝑜𝐷% = 51,0
𝑥 100= 17,45%
Análisis: La tasa de mortalidad materna en Venezuela aumentó 17,45% en el período 2001-2008.
O también: La tasa de mortalidad materna del año 2008 en relación al 2001, aumenta en un 17,45%.
Cálculo e interpretación del coeficiente de regresión (b)
Expresa cuántas unidades varía la variable dependiente con la variación o cambios de la variable
∑ 𝑑𝑒𝑥 . 𝑑𝑒𝑦
independiente. 𝑏= ∑ 𝑑𝑥 2
Años Años (X) Tasas (Y) dex dx2 dey dex . dey
x-𝒙̅ y-𝒚̅
2001 1 51 -3,5 12,25 -8,7 30,45
2002 2 59,3 -2,5 6,25 -0,4 1
2003 3 60,1 -1,5 2,25 0,4 -0,6
2004 4 67,2 -0,5 0,25 7,5 -3,75
2005 5 68,0 0,5 0,25 8,3 4,15
2006 6 57,7 1,5 2,25 -2 -3
2007 7 54,7 2,5 6,25 -5 -5
2008 8 59,9 3,5 12,25 0,2 0,2
Total ∑ = 36 ∑ = 477,9 ∑ = 42 ∑ = 16,45
Dada la tabla anterior, primeramente hay que determinar cuál es la variable dependiente y cuál es la
independiente, en este caso, las tasas dependen de los años, por lo que los años son la variable
independiente (x) y las tasas son las dependientes (y).
Luego se procede a calcular el promedio o media aritmética de cada una de las variables:
𝑥̅ = 36 / 8 = 4,5 𝑦̅ = 477,9 / 8 = 59,7
Después se debe hacer el cálculo de la desviación estándar tanto de “x” como de “y” (dex…dey),
que es igual a “x” o “y” menos su media aritmética, como se demuestra en la columna 4 y 6 de la
tabla. Los resultados que interesan son éstos, la “dex” y la “dey”, porque en la fórmula de
coeficiente de regresión se debe multiplicar dex . dey, y estos valores se expresan en la columna 7
de la tabla. La sumatoria de los valores de ésta última columna, es lo que se va a sustituir en la
fórmula. El otro valor que corresponde al denominador de la fórmula es la sumatoria de “dx2” y ésta
se obtiene elevando la “dex” al cuadrado.
∑ 𝑑𝑒𝑥 . 𝑑𝑒𝑦 16,45
𝑏= ∑ 𝑑𝑥 2
=>𝑏 = 42 = 0,39
Ecuación de la línea recta: permite proyectar el fenómeno a futuro. Se debe sustituir los valores en
la fórmula.
y (x) = 𝑦̅ − 𝑏 . 𝑥̅ + 𝑏 . 𝑥
𝑌(2010) = 59,7 − 0,39𝑥4,5 + 0,39𝑥10
𝑌(2010) = 59,7 − 1,8 + 3,9 = 61,8
Análisis: La tasa de mortalidad materna en Venezuela esperada para el 2010 es de 61,8 defunciones
maternas por cada 100.000 nacidos vivos registrados.
Estadísticas de población, Estimaciones de población:

- Método natural: el crecimiento de una población (pequeña) lo determinan los nacimientos,
defunciones, migraciones, población anterior.
- Método geométrico: hay un incremento porcentual constante cada año. Se usan logaritmos
para hacer los cálculos. Hay otros métodos: crecimiento promedio anual, semipromedio
entre poblaciones censales, o tasa de crecimiento anual.
- Método distributivo
- Método aritmético: es el más importante, y se desarrolla a partir de la siguiente fórmula.
Px = P1 + P2 – P1 n Donde: Px: N° estimado de habitantes para fecha deseada
N P1: N° habitantes del 1° censo
P2: N° habitantes del 2° censo
n: Tiempo transcurrido entre el 1° censo y la fecha de estimación
N: Tiempo exacto transcurrido entre los dos censos expresados en años y fracción decimal
Ej. Datos proporcionados del municipio Heres.
P1: 16 de Febrero de 2008 (360.958 hab)
P2: 7 de Agosto de 2013 (380.556 hab)
Px: 23 de Junio de 2015
N => 7 - 8 - 2013 –
1 Mes = 30 días
16 - 2 - 2008
–
Se debe restar la fecha del 2° censo, que corresponde al 7-8-2013, menos la fecha del 1° censo que
corresponde al 16-2-2008, esto se hace para calcular “N”, que es el tiempo transcurrido entre ambos
censos. Para realizar esta resta se debe tener en cuenta que un mes equivale a 30 días; la resta debe
empezar de derecha a izquierda, es decir, primero se resta el año, luego el mes, y por último el día.
El año del 2° censo es 2013, y el año del 1° censo es 2008, la diferencia entre ambos es 5 (2013 –
2008 = 5).
N => 7 - 8 - 2013 –
16 - 2 - 2008
- - 5
Luego el mes del 2° censo es agosto representado por el n° 8, y el mes del 1° censo es febrero,
representado por el n° 2, la diferencia entre ambos es 6 (8 – 2 = 6).
N => 7 - 8 - 2013 –
16 - 2 - 2008
- 6 - 5
Tenemos que el día del 2° censo es 7 y el día del 1° censo es 16, la diferencia entre ambos da un
valor negativo (7 – 16 = -9), lo cual NO puede ser, porque siempre el día del 2° censo debe ser
mayor que el del 1° censo, para que la diferencia entre ambos dé un resultado positivo.
Para esto se procede a “pedir prestado” un mes, es decir, se tiene en cuenta que un mes equivale a
30 días, se le suman 30 días al día del 2° censo (30 + 7 = 37 días), y es así que la diferencia entre los
días de ambos censos da 21 (37 – 16 = 21).
N =>37 - 8 - 2013 –
16 - 2 - 2008
21 - 6 - 5
Pero ahora se debe modificar el mes, ya que se “pidió prestado” un mes equivalente a 30 días, al
mes del 2° censo, entonces éste dejará de ser 8, y pasará a ser 7 (8 – 1 que se prestó = 7).
N => 37 - 7 - 2013 –
16 - 2 - 2008
21 - 5 - 5
Y ese es el resultado final: N = 21 días, 5 meses, y 5 años. Pero ahora surge una situación, este valor
“N” debe ser expresado solamente en años. Se debe tener en cuenta que 1 año se puede expresar en
días, es decir, 1 año equivale a 365 días. Y también 1 año se puede expresar en meses, ya que 1 año
equivale a 12 meses. Dicho esto, se procede a lo siguiente:
21 días / 365 días = 0,05 años
5 meses / 12 meses = 0,41 años
5 años =5 años
5,46 años
N = 5,46 años.
Para calcular “n” que es el tiempo transcurrido entre el 1° censo (16 de Febrero de 2008) y la fecha
estimada (23 de Junio de 2015), se procede a realizar un cálculo similar al anterior.
N => 23 - 6 - 2015 –
16 - 2 - 2008
7- 4 - 7
En este caso, la resta se da sin novedades, se resta la fecha estimada menos la fecha del 1° censo,
sin necesidad de “pedir prestado” los 30 días equivalentes a un mes. Es así que el resultado final es:
n = 7 días, 4 meses y 7 años. Se procede a convertir los días y meses a años:
7 días / 365 días = 0,01 años
4 meses / 12 meses = 0,33 años
7 años =7 años
7,34 años
n = 7,34 años.
El último paso es sustituir en la fórmula los datos que se tienen:
Px = P1 + P2 – P1 n
N
Px (23-6-2015) = 360.958 hab + 380.556 hab – 360.958 habx 7,34
5,46
Px (23-6-2015) = 360.958 hab + 3.589 x 7,34 => 360.958 + 26.343
Px (23-6-2015) = 387.301 habitantes
Análisis: La población estimada para el municipio Heres para el 23 de Junio de 2015 es de 387.301
habitantes.
Notas:
 Las fechas indicadas de cada censo no son valores que se colocan en la fórmula, sino que
sirven para calcular “n” y “N” que sí son valores que se colocan en la fórmula.
 Px es el número estimado de habitantes para una determinada fecha, puede ser cualquier
fecha (que sea luego de las fechas correspondientes al 1° y 2° censos), se utilizó 23 de Junio
de 2015 porque fue la fecha que se hizo el presente ejercicio en clase.
 Al momento de sustituir valores en la fórmula, la parte en donde P2 – P1 / N dio un
resultado igual a 3.589,37 NO SE COLOCAN DECIMALES, pero se puede aproximar,
porque se están estudiando habitantes, y son números enteros, en este caso se dejó el valor
de 3.589. Pero si el decimal es mayor a 5, obviamente se aproxima.
Uso del método aritmético:
 En poblaciones > 1.000.000 habitantes se hace un cálculo a corto plazo (1 a 2 años).
 En poblaciones > de 40.000 habitantes y < 1.000.000. Se hace un cálculo a corto y mediano
plazo de hasta 5 años.
 Poblaciones ≤ 40.000 habitantes, se hace un cálculo a corto – mediano y largo plazo hasta
de 7 a 10 años.
Tasas demográficas
Estadísticas de natalidad
Se refiere al estudio del número de nacimientos ocurridos en determinada colectividad y a su
distribución de acuerdo a características especiales.
Términos importantes
Fecundidad: Capacidad real de reproducirse (Nº de hijos concebidos).
Fertilidad: Capacidad potencial de reproducirse.
Natalidad Total: Niños concebidos, nacidos vivos o no.
Natalidad Efectiva: Niños concebidos, sólo nacidos vivos, útil en estudios demográficos.
Medición de la Natalidad: se utilizan tres tipos de tasas generalmente.
 Tasa bruta de natalidad: Expresa el crecimiento de una población y se interpreta como el
número de nacidos vivos registrados por cada 1000 habitantes.
TN = NVRx 1.000
P
Donde: TN: Tasa de natalidad.
NVR: Nacidos vivos registrados en determinada región durante un determinado año.
P: Población de esa región para el 1° de Julio del año en estudio.
Ej. Nacidos vivos registrados (NVR) del estado Bolívar = 28.789
Población del estado Bolívar = 1.477.425 hab.
TN = 28.789 / 1.477.425 x 1.000
TN = 19,5
Análisis: En la población del estado Bolívar, hay 19,5 NVR por cada 1.000 habitantes.
La tasa bruta de natalidad al aplicarla a una población conocida permite estimar el número de
nacimientos esperados.
Nacimientos esperados = TN x P / 1.000
Ej. Tasa de natalidad del estado Bolívar = 21,7

Población del estado Bolívar = 1.477.425
Nacimientos esperados = 21,7 x 1.477.425 / 1.000
Nacimientos esperados = 32.060
 Tasa general de fecundidad: Expresa la capacidad real de reproducirse y se interpreta como
el número de nacidos vivos registrados por cada 1000 mujeres en edad fecundante.
TGF = NVRx 1.000

PFf
Donde: TGF = Tasa general de fecundidad.
PFf = Población femenina fecundante, abarca de los 12-49 años.
Ej. Nacidos vivos registrados (NVR) del estado Bolívar = 28.789
Población Femenina fecundante del estado Bolívar = 697.855 mujeres.
TGF = 28.789 / 697.855 x 1.000
TGF = 41,3
Análisis: En la población femenina de edad reproductiva, hay 41,3 NVR por cada 1.000 mujeres en
edad fértil.
 Tasa de fecundidad específica por edad: Se interpreta como el número de nacidos vivos en
mujeres de una edad específica (i) registrados por cada 1000 mujeres del mismo grupo
etario. Permite medir las fluctuaciones de la natalidad en los diferentes grupos de edad.
TF (i) = NVR (i)x 1.000
PF (i)
Ej. Edad (años) Población NVR
20-24 343.455 12.566
25-29 198.790 9.378
30 -34 118.433 4.962
35-39 28.649 1.058
40-44 8.528 825
Total 697.855 28.789
Nacidos vivos registrados (NVR) en la población femenina fecundante de edades

comprendidas entre 30-34 años, del estado Bolívar = 4.962
Población femenina fecundante de edades comprendidas entre 30-34 años, del estado
Bolívar = 118.433
TF (30-34 años)= 4.962 / 118.433 x 1.000
TF (30-34 años)= 41,9
Análisis:En la población femenina de edad reproductiva hay 41,9 NVR por cada 1.000 mujeres en
edad fértil de 30-34 años.
Nota: los datos colocados en la fórmula, son los proporcionados por la tabla en edad de 30-34 años,
su correspondiente NVR y población. Se puede hacer, igualmente, para cualquier rango de edades
que se encuentren en la tabla, sustituyendo los valores en la fórmula.
“Nunca consideres el estudio como un deber, sino como una

oportunidad para penetrar en el maravilloso mundo del saber”.
Albert Einstein.
“Enseñar es aprender dos veces”.
¡Éxitos! =)

Guia Primer Parcial Estadistica

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Guia Primer Parcial Estadistica

Transféré par

Droits d'auteur :

Formats disponibles

ESTADÍSTICA MÉDICA 150-3012 BACHILLER: SAAVEDRA L. GÉNESIS G.

Método científico, características: 1. Fáctico 2. Objetivo 3. Sujeto a verificación

1. PLANIFICACIÓN DEL ESTUDIO:etapa netamente intelectual, creadora, se estudian los

2. RECOLECCIÓN DE LA INFORMACIÓN:proceso para buscar la información requerida

3. Íntegra: que dicha información sea completa.

Las muestras no probabilísticas, no representativas o seleccionadas, pueden ser llamadas también

También se utilizan cuando no se conoce la lista detallada de la población a estudiar, y cuando el

Para seleccionar las muestras probabilísticas existen diferentes procedimientos o modelos

100 Hospitales- c/u 50 100 Hospitales- c/u 50

100 Hospitales- c/u 50 100 Hospitales- c/u 50

500 pacientes 500 pacientes

3. ELABORACIÓN DE LA INFORMACIÓN: es la etapa del método estadístico que

1. En cuanto a revisión y corrección de la información, se deben revisar cada uno de los

*Intervalo de clase (IC) = Valor Máximo – valor mínimo + 1 U.M.M.

3. En cuanto a Presentación en Cuadros y Gráficos, los elementos que conforman un cuadro

Fuente: Archivo Historias Médicas. Hospital Universitario Ruiz y Páez. 2004.

Presentación tabular de Datos de Asociación (se utilizan 2 escalas: sexo y edad):

Presentación tabular de las series cronológicas

Ejercicio tipo examen. Tabla de distribución de frecuencias.

Ejercicio tipo examen. Tabla de datos asociados.

Presión arterial Sexo Total

Elaboración de la información: Gráficos estadísticos.

 En la línea vertical u ordenada, va la frecuencia, o el número de veces que se observa el

 Las escalas deben comenzar en

 Tipos de tablas: distribución de

2. Cuando la amplitud de clase es diferente, se divide la frecuencia sobre la amplitud de clase

Distribución de frecuencias Datos asociados

Cualitativas Barras simples Barras múltiples

cualitativa nominal, se grafican de la que tenga mayor frecuencia (que es accidentes de

360 Enfermedades cardiovasculares

120 Otras causas

4. ANÁLISIS E INTERPRETACIÓN DE LOS DATOS: es la etapa del método estadístico

- Concurrente: ambos grupos (experimental y control) se eligen de una misma población

Factores del análisis estadístico:

Técnicas de análisis de los estudios descriptivos

Análisis de Distribución de frecuencias con escala cualitativa: Frecuencias relativas

* Razón Masculina = N° total masculino/N° total femenino => 120/107 = 1,12

- Proporción: es la relación del número de observaciones de una categoría con el total

Ej. Utilizando datos de la tabla N° 1.

Ej. Utilizando datos de la tabla N° 1.

- Tasas: miden el riesgo que acontezca un determinado fenómeno. El numerador no será

Análisis de Distribución de frecuencias con escala cuantitativa: Series no agrupadas

Peso (kg) 9. 59 Tendencias centrales:

̅ ) 2= Elevar el resultado anterior al cuadrado.

P76 = 16 + 1 / 100 x 76 = 12,9 ≈ 13 => Posición 13 = 64 kg

- Quintiles:n+1x quintil a calcular

Series Agrupadas(más de 30 datos u observ.)

Para el cálculo de medidas de posición

MP(x) = LRI + PMx – Faa x AC

Ej. Q3 = 3 . 108 / 4 = 324/4 = 81 => Posición 81. 5° clase.

Ej. P (52) = 52 x 108 = 56,16 => Posición 56,16. 3° Clase.

Punto medio (PM) = LVI + LVS / 2 => 26 + 31 / 2 = 28,5 =>A = 28,5

4° Paso: Sustituir en la fórmula.

 Desviación estándar: valor que refleja en cuanto difiere en promedio el valor de

2° Paso: Sustituir en la fórmula.

3° Paso: calcular desviación estándar de “x”

de las observaciones con respecto a su media aritmética.

Dex = ± √ ∑ 𝐷𝑥2 => Dex = ± √ 587,6 => Dex = ± √ 58,76 = ± 7,67

4° Paso: Calcular desviación estándar de “y”

5. 66 160 10.560 - 6,8 46,24 -0,2

Dey = ± √ ∑ 𝐷𝑦2 => Dey = ± √ 1.273,6 => Dey = ± √ 127,36 = ± 11,29

5° Paso: Sustituir valores en la fórmula de Pearson.

“y” “x” dex dey