Académique Documents
Professionnel Documents
Culture Documents
Estadística
Descriptiva
Organiza, presenta y describe un
conjunto de datos con el propósito de
facilitar su uso generalmente con el
apoyo de tablas, medidas numéricas o
gráficas.
https://youtu.be/OPkGxnEXLsI
Estadística Descriptiva
RESUMIR GENERALIZAR
Tipo VARIABLES CATEGÓRICAS
Naturaleza CUALITATIVAS
Escala (0) NOMINAL (1) ORDINAL
Ningún atributo Un atributo
Características Posee categorías a las que se asigna Posee las categorías ordenadas,
un nombre sin que exista ningún pero no permite cuantificar la
orden implícito entre ellas. distancia entre una categoría y
otra.
Atributos de la Orden Distancia Origen Orden Distancia Origen
escala
Univariable o Clasificación de Nominal Ordinal
Escala
Unidimensional Nombre *Grado de Escolaridad:
CUANTITATIVA CUALITATIVA Domicilios 1ro, 2do, 3ro, 4to, etc.
(1 variable) Estado Civil *Grado de anemia:
Nacionalidad +Leve;++moderado;+++severo
Sexo Agudo , crónico
Función *Lugar que ocupa en la familia
Lugar de Nacimiento 1ro, 2do, 3ro, 4to, etc.
Marca de un microscopio *Clase social:
Servicio de un hospital Indigente, Pobre, media, alta
fa
fr
Número de unidades experimentales
Variables CATEGÓRICAS
05 05 Aplicativo
Tratamiento
04
04 Predictivo
Pronóstico
03 03 Explicativo
Causalidad
02
02 Relacional
Bivariado
01
01 Descriptivo
Univariado
a. Tablas de Frecuencias Absolutas y Relativas Variables CATEGÓRICAS
Frecuencia Frecuencia
Sexo
Absoluta Relativa (%)
Masculino 110 55%
Femenino 90 45%
Univariado
Estadístico Total 200 100%
Frecuencia Porcentaje
Sexo
(n) (%)
Aplicativo Masculino 110 55%
Presentación Femenino 90 45%
Predictivo De
investigaciones Total 200 100%
Explicativo Porcentaje
Sexo Cantidad
(%)
Relacional Masculino 110 55%
Femenino 90 45%
Descriptivo
Capacitación Total 200 100%
Nivel de investigación DESCRIPTIVO
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Masculino 11 55
Femenino 9 45
Total 20 100
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Tabla n° 5.- Distribución según ¿Actualmente toma algún medicamento para adelgazar?
(Población, lugar y tiempo)
Medicamento para Frecuencia (n) Porcentajes (%)
adelgazar
Ninguno 206 94,5
Sibutramina 3 1,4
Garcinia 2 0,9
Xenical 2 0,9
Thermofem 2 0,9
PhenQ 1 0,5
Green Coffee 2 0,9
Total 218 100,0
Fuente.- Elaboración propia, 2018.
Nivel de investigación DESCRIPTIVO
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
Diabetes 40 18,3
Hipertensión 77 35,3
Arterial
Dislipidemia 15 6,9
Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes
05 05 Aplicativo
Tratamiento
04
04 Predictivo
Pronóstico
03 03 Explicativo
Causalidad
02
02 Relacional
Bivariado
01
01 Descriptivo
Univariado
Tablas del Nivel de investigación RELACIONAL
Tabla N° 2.- Distribución del Estado Nutricional según Sexo
Sexo Porcentaje
Estado Nutricional Porcentaje Porcentaje Total
Masculino Femenino (% )
(% ) (% )
Desnutrición 2 1% 14 6% 16 7%
Normal (Eutrófico) 62 28% 64 29% 126 57%
Sobrepeso 53 24% 12 5% 65 29%
Obesidad 8 4% 4 2% 12 5%
Obesidad mórbida 2 1% 2 1% 4 2%
Total 127 57% 96 43% 223 100%
Bivariado
Tablas de contingencia
Tablas Cruzadas
Tablas del
Nivel Relacional Tablas de doble entrada
Tablas de Cruces de Variables
Tablas Tetracóricas
Tablas 2x2 del Nivel de investigación RELACIONAL
Si No Total Si No Total
Consumo de alcohol
Si No Total
Hábito de fumar N % N % N %
N % N % N %
Si 9 50 41 35 50 37
No 9 50 75 65 84 63
50 50
PORCENTAJES (%)
35
SI NO
D I A BETES
En la tabla N° 1, se presenta que el 50% de la población diabética presenta obesidad, mientras que el 35% de los
diabéticos no presenta obesidad.
Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo)
(Objetivo estadístico COMPARAR)
Diabetes
Totales
Obesidad Si No
N % N % N %
Si 9 18 41 82 50 100
No 9 11 75 89 84 100
89
82
PORCENTAJES (%)
18
11
SI NO
O BES I DAD
En la tabla N° 2, se presenta que el 18% de la población obesa presenta diabetes, mientras que el 82% de los
obesos no presenta diabetes.
Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo)
(Objetivo estadístico ASOCIAR)
Diabetes
Totales
Obesidad Si No
N % N % N %
Si 9 7 41 31 50 37
No 9 7 75 56 84 63
31
7 7
SI NO
D I A BETES
En la tabla N° 3, se presenta que el 13% de la población presenta diabetes, de los cuales el 7% de los diabéticos son
obesos, mientras que la otra proporción de diabéticos (7%) no presenta obesidad.
Tablas 2x3 del Nivel de investigación RELACIONAL
Área académica
CS Salud CS Sociales Ingenierías Total
Estrés laboral N % N % N % N %
Si 18 90 8 53 8 53 18 90
No 2 10 7 46 7 47 2 10
Total 20 100 15 100 15 100 20 100
Tablas
según los niveles de investigación
05 05 Aplicativo
Tratamiento
04
04 Predictivo
Pronóstico
03 03 Explicativo
Causalidad
02
02 Relacional
Bivariado
01
01 Descriptivo
Univariado
Tablas del Nivel de investigación EXPLICATIVO
Ciudades de Bolivia
Edades Santa Cruz de la Sierra (416 msnm) Cochabamba (2558 msnm) La Paz (3625 msnm)
De 10 a 25 25 17 13 12 19 26 23 29 17
De 25 a 40 16 11 15 15 21 18 26 22 16
De 40 a 55 14 11 9 19 17 22 15 18 13
Total 55 39 37 46 57 66 64 69 46
Variables CUALITATIVAS
Tabla N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo)
Porcentaje
HTA Frecuencia (n) (%)
Si 110 55
No 90 45
Total 200 100
Fuente.- Elaboración propia, 2018.
Grafico N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo)
Según la tabla n° 1, la prevalencia de Hipertensión arterial fue del 55%, lo cual significa que aproximadamente 5
de cada 10 personas presentan la presión arterial sistólica elevada.
Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS
Estado Nutricional
60% 57%
40%
29%
30%
20%
10% 7% 5%
2%
0%
Desnutrición Normal Sobrepeso Obesidad Obesidad
(Eutrófico) mórbida
Según la tabla n° 2, se pudo evidenciar que el 29% de la población de estudio presenta Sobrepeso, mientras que el
7% tiene Obesidad y desnutrición.
CASOS PRACTICOS N° 7
Tablas de frecuencias
absolutas y relativas
CASOS PRACTICOS N° 8
Diagrama de sectores
y gráfico de barras
Estadística Descriptiva
RESUMIR GENERALIZAR
Tipo VARIABLES NUMÉRICAS
Naturaleza CUANTITATIVAS
Escala (2) INTERVALO (3) RAZÓN
Dos atributos Tres atributos
Características Tiene intervalos iguales y Tiene intervalos constantes entre
medibles. No tiene un origen valores; además de un origen real. El
real, por lo que puede asumir cero significa la ausencia del
valores negativos. individuo.
Univariable o Atributos de la
escala
Orden Distancia Origen Orden Distancia Origen
RESUMIR Observaciones
(RAZÓN)
Continuas: Provienen de medir y los valores poseen decimales
Se pueden representar con números enteros o fraccionados
Entre dos valores siempre existe un valor intermedio.
Menor de 2 349 39
De 2 a 5 487 54
15 a 47 Embarazadas 61 7
Eutrófico (Normal) 19 19
Sobrepeso 67 67
Obesidad 9 9
Obesidad mórbida 1 1
Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02
03
Posición
Cuartiles, Deciles, Percentiles
Forma UNIVARIANTES
Asimetría: Derecha (+), Simétrica (0), Izquierda (-)
Curtosis: Lectocúrtica(+), Mesocurtica(0), Platicurtica(0)
04
Variables NUMÉRICAS - CONTINUAS
MEDIDAS UNIVARIANTES
01
Tendencia Central
Media, Mediana, Moda
MEDIDAS DE TENDENCIA CENTRAL
Datos Cuantitativos
x
x1 Media Aritmética o Promedio
n
x2
xi
x i 1
xn n
Ventajas :
• Fácil de calcular e interpretar.
• En su cálculo intervienen todos los datos disponibles.
• Su valor es único para una serie de datos.
• Es el punto de equilibrio de la información.
Desventajas :
• No es representativa con pocos datos
• Se ve afectada por el grado de dispersión
• Es poco útil con datos muy heterogéneos
• No todos los valores contribuyen de igual forma ,los mayores tienen más peso
MEDIDAS DE TENDENCIA CENTRAL
x( k ) x( k 1) Si n es par
ME
2
x( k ) dato del centro
Ventajas :
• Valor único que no se ve afectado por los extremos por ser equidistante de ellos.
• Se localiza a la mitad de los datos , dejando el 50 % por arriba y el 50 % por debajo de
su valor.
• Es menos sensible a las variaciones de los datos.
• No se ve afectada por la dispersión de los datos.
Desventajas :
• No se emplea para hacer cálculos
• Utiliza muy poca información de los datos
• Cuanto más grande es la serie de datos , más complicado se vuelve su determinación.
MEDIDAS DE TENDENCIA CENTRAL
Predictivo Mediana = 43
Explicativo Moda = 42
Relacional
Fuente.- Elaboración propia, 2018.
Descriptivo
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda
Dispersión UNIVARIANTES
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02
MEDIDAS DE DISPERSIÓN
Desviación Amplitud de
estándar rango
Coeficiente de
Varianza
variación
Error estándar
de la media
MEDIDAS DE DISPERSIÓN
r vmax vmin
Ventajas :
• Fácil de determinar e interpretar.
• Nos indica los límites de nuestra información.
• Nos permite visualizar la amplitud de dispersión de los valores de forma
sencilla.
Desventajas :
• Ignora toda la información de la muestra
• No mide el grado de dispersión , solo su ancho
• No nos da una idea detallada de la información de las observaciones.
MEDIDAS DE DISPERSIÓN
(x x) i
2
s2 i 1
n 1
Ventajas :
• Fácil de calcular mediante su fórmula.
• Indica el grado y forma de dispersión de los datos con respecto a la media.
• Depende de todas las mediciones.
Desventajas :
• Es impráctica por ser un término cuadrático de poco sentido en la realidad.
• Es un número muy grande de referencia matemática , pero sin valor concreto
y de difícil manejo comparativo.
MEDIDAS DE DISPERSIÓN
(x x)i
2
i 1
Ventajas : n 1
• Fácil de calcular mediante su fórmula y particularmente en hojas de cálculo
como Excel que lo hacen de forma automática.
• Indica el grado y forma de dispersión de los datos con respecto a la media.
• Depende de todas las mediciones.
• Muy práctica por usar los mismos valores de las unidades que se analizan.
• Un valor grande indica que los datos se alejan mucho de la media y un valor
pequeño indica que se acercan a la media.
Desventajas :
• Si hacemos el cálculo manual , es complicado.
MEDIDAS DE DISPERSIÓN
s
cv *100
x
Ventajas :
• Sirve para comparar la variabilidad en un conjunto de datos con la de otro.
• Permite la comparación de la variabilidad de variables medidas en escalas o
unidades distintas.
• Emplea toda la información disponible para su cálculo.
• Fácil de calcular
Desventajas :
• No es una medida de dispersión con respecto al centro de la distribución de
los datos.
• Arrastra las limitaciones que tiene la media como medida de tendencia
central.
MEDIDAS DE DISPERSIÓN
s
EE
n
Estadístico g/dl
Rango = 13,7
Desviación Estándar = 1,478
La varianza = 2,186
Coef. de Variación (%) = 13,05
Error estándar = 0,0494
Fuente.- Elaboración propia, 2018.
Graficas de Estadística descriptiva CUANTITATIVA Variables Numéricas
Estadístico Kilogramos
Rango = 37
Desviación Estándar = 6,985
La varianza = 48,799
Coef. de Variación (%) = 11,80
Error estándar = 0,9596
Fuente.- Elaboración propia, 2018.
Grafico de Medidas de Dispersión Variables Numéricas
Estimación puntual e
intervalos de confianza
Variables CUANTITATIVAS
Ejercicio: Se dispone del peso (en gramos) de dos grupos de niños, de 8 niños por grupo
de un mes de edad. Los datos se muestran a continuación:
Media Varianza
Mediana Desviación típica
Moda Coeficiente de variación
Rango Error Estándar
Variables CUANTITATIVAS
Ejercicio: En un Centro de Salud se realiza seguimiento de la Hipertensión Arterial de algunos pacientes. Se dispone
de 3 Grupos, cada uno con 10 mediciones de la tensión arterial sistólica (TAS) realizadas en el día de hoy, las cuales
se muestran a continuación:
Grupo A: 173,03 165,54 141,59 158,66 158,81 156,49 150,29 154,53 162,50 158,49
Grupo B: 151,11 166,13 147,47 152,83 166,99 135,62 138,77 168,11 162,04 176,77
Grupo C: 159,97 152,99 161,92 167,70 143,35 154,06 160,82 180,08 172,93 158,72
Media Varianza
Mediana Desviación típica
Moda Coeficiente de variación
Rango Error Estándar
Grafica de Levey-Jennings para
Control de Calidad
Datos
Número Colesterol mg/dl Estadísticos
1 249 248,33 Media = 248,33
2 247 5,35 Desviación Estándar = 5,35
3 244 253,68 + 1DS = 253,68
4 248 259,02 + 2DS = 259,02
5 249 264,37 + 3DS = 264,37
6 246 242,99 - 1DS = 242,99
7 252 237,64 - 2DS = 237,64
8 246 232,30 - 3DS = 232,30
9 239 Reglas
10 253 Media
11 243 0 248,33
12 252 31 248,33
13 249 (+1) Desviación Estándar
14 243 0 253,68
15 239 31 253,68
16 251 (-1) Desviación Estándar
17 247 0 242,99
18 255 31 242,99
19 244 (+2) Desviación Estándar
20 262 0 259,02
21 253 31 259,02
22 250 (-2) Desviación Estándar
23 242 0 237,64
24 256 31 237,64
25 242 (+3) Desviación Estándar
26 243 0 264,37
27 251 31 264,37
28 255 (-3) Desviación Estándar
29 248 232,30
30 252 232,30
Grafica de Levey-Jennings para
Control de Calidad
Datos Media 1DS 2DS 3DS 1DS (-) 2DS (-) 3DS (-)
249 248,33 253,68 259,02 264,37 242,99 237,64 232,30
247 248,33 253,68 259,02 264,37 242,99 237,64 232,30
244 248,33 253,68 259,02 264,37 242,99 237,64 232,30
248 248,33 253,68 259,02 264,37 242,99 237,64 232,30
249 248,33 253,68 259,02 264,37 242,99 237,64 232,30
246 248,33 253,68 259,02 264,37 242,99 237,64 232,30
252 248,33 253,68 259,02 264,37 242,99 237,64 232,30
246 248,33 253,68 259,02 264,37 242,99 237,64 232,30
239 248,33 253,68 259,02 264,37 242,99 237,64 232,30
253 248,33 253,68 259,02 264,37 242,99 237,64 232,30
243 248,33 253,68 259,02 264,37 242,99 237,64 232,30
252 248,33 253,68 259,02 264,37 242,99 237,64 232,30
249 248,33 253,68 259,02 264,37 242,99 237,64 232,30
243 248,33 253,68 259,02 264,37 242,99 237,64 232,30
239 248,33 253,68 259,02 264,37 242,99 237,64 232,30
251 248,33 253,68 259,02 264,37 242,99 237,64 232,30
247 248,33 253,68 259,02 264,37 242,99 237,64 232,30
255 248,33 253,68 259,02 264,37 242,99 237,64 232,30
244 248,33 253,68 259,02 264,37 242,99 237,64 232,30
262 248,33 253,68 259,02 264,37 242,99 237,64 232,30
253 248,33 253,68 259,02 264,37 242,99 237,64 232,30
250 248,33 253,68 259,02 264,37 242,99 237,64 232,30
242 248,33 253,68 259,02 264,37 242,99 237,64 232,30
256 248,33 253,68 259,02 264,37 242,99 237,64 232,30
242 248,33 253,68 259,02 264,37 242,99 237,64 232,30
243 248,33 253,68 259,02 264,37 242,99 237,64 232,30
251 248,33 253,68 259,02 264,37 242,99 237,64 232,30
255 248,33 253,68 259,02 264,37 242,99 237,64 232,30
248 248,33 253,68 259,02 264,37 242,99 237,64 232,30
252 248,33 253,68 259,02 264,37 242,99 237,64 232,30
Grafica de Levey-Jennings para
Control de Calidad
260
Media
255
1DS
Colesterol mg/dl
250 2DS
3DS
245
1DS (-)
240
2DS (-)
235
3DS (-)
230
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Grafica de Levey-Jennings para
Control de Calidad
Control de Colesterol mg/dl
265 Datos Colesterol
mg/dl
260 Media
255 1DS
Colesterol mg/dl
2DS
250
3DS
245
1DS (-)
240
2DS (-)
235
3DS (-)
230
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda
Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02
UNIVARIANTES
03
Posición
Cuartiles, Deciles, Percentiles
MEDIDAS DE POSICIÓN/ORDEN/LOCALIZACIÓN
Cuartiles
Son medidas
de posición
Deciles
más usadas.
Percentiles
MEDIDAS DE POSICIÓN
P3 P50 P97
-2DE Media +2DE
MEDIDAS DE POSICIÓN
Máximo 1,83
P75 = Q3 = 75 1,71
P25 = Q1 = 25 1,63
Mínimo 1,51
CASOS PRACTICOS N° 11
http://www.who.int/childgrowth/software/es/
MEDIDAS DE POSICIÓN
http://www.who.int/childgrowth/software/es/
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda
Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02
03
Posición
Cuartiles, Deciles, Percentiles
Forma UNIVARIANTES
Asimetría: Derecha (+), Simétrica (0), Izquierda (-)
Curtosis: Lectocúrtica(+), Mesocurtica(0), Platicurtica(0)
04
MEDIDAS DE FORMA
Coeficiente de
Curtosis
asimetría
1.- Tabla de contingencia con Porcentajes por columnas (Objetivo estadístico comparar)
Diabetes
Totales
Obesidad Si No
N % N % N %
Si 9 50 41 35 50 37
No 9 50 75 65 84 63
50 50
PORCENTAJES (%)
35
SI NO
DIABETES
Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas
2.- Tabla de contingencia con Porcentajes por Filas (Objetivo estadístico comparar)
Diabetes
Totales
Obesidad Si No
N % N % N %
Si 9 18 41 82 50 100
No 9 11 75 89 84 100
Diabetes Si Diabetes No
89
82
PORCENTAJES (%)
18
11
SI NO
OBESIDAD
Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas
Diabetes
Totales
Obesidad Si No
N % N % N %
Si 9 7 41 31 50 37
No 9 7 75 56 84 63
Obesidad Si Obesidad No
56
PORCENTAJES (%)
31
7 7
SI NO
DIABETES
Estadística Descriptiva Bivariante
Un párrafo de nuestra introducción
Tabla 1.- Medidas de Tendencia Central y de Dispersión (Peso en Kg) en pacientes Con
y Sin HTA Peso en Kilogramos
Grafica 1.- Diagrama de Cajas y bigotes de (Peso en Kg) en pacientes Con y Sin HTA
COMO DETECTAR EN EL SPSS:
OUTLIERS o
Outliers
VALORES ATÍPICOS
Es una observación que es numéricamente distante del
resto de los datos, pueden ser indicativos de datos que
pertenecen a una población diferente del resto de las
muestras establecidas.
¿Qué es un Outlier o Valores atípicos?
Puntuación
extrema
¿Porqué identificar un Outlier o Valores atípicos?
Z
Muestras Pequeñas (<80) 2,5
Muestras Grandes (>80) 3
¿Cómo detectamos un Outliers en SPSS?
Analizar/Estadísticos descriptivos/Descriptivos
¿Cómo detectamos un Outliers en SPSS?
Z
Muestras Pequeñas (<80) 2,5
Muestras Grandes (>80) 3
¿Cómo detectamos un Outliers en SPSS?
¿Qué hacemos con los Outlier o Valores atípicos?
1. Identificarlos