Vous êtes sur la page 1sur 112

Unidad N° 2

Estadística
Descriptiva
Organiza, presenta y describe un
conjunto de datos con el propósito de
facilitar su uso generalmente con el
apoyo de tablas, medidas numéricas o
gráficas.

Dr. José Luis Soto Velásquez


investigacionjls@gmail.com Agosto del 2018
Estadística Descriptiva

https://youtu.be/OPkGxnEXLsI
Estadística Descriptiva

RESUMIR GENERALIZAR
Tipo VARIABLES CATEGÓRICAS
Naturaleza CUALITATIVAS
Escala (0) NOMINAL (1) ORDINAL
Ningún atributo Un atributo
Características Posee categorías a las que se asigna Posee las categorías ordenadas,
un nombre sin que exista ningún pero no permite cuantificar la
orden implícito entre ellas. distancia entre una categoría y
otra.
Atributos de la Orden Distancia Origen Orden Distancia Origen
escala
Univariable o Clasificación de Nominal Ordinal
Escala
Unidimensional Nombre *Grado de Escolaridad:
CUANTITATIVA CUALITATIVA Domicilios 1ro, 2do, 3ro, 4to, etc.
(1 variable) Estado Civil *Grado de anemia:
Nacionalidad +Leve;++moderado;+++severo
Sexo Agudo , crónico
Función *Lugar que ocupa en la familia
Lugar de Nacimiento 1ro, 2do, 3ro, 4to, etc.
Marca de un microscopio *Clase social:
Servicio de un hospital Indigente, Pobre, media, alta

Ejemplo Género Estado civil Instrucción Intensidad

Valor Final Masculino Soltero Primaria Leve


Femenino Casado Secundaria Moderado
Conviviente Superior Grave
Observaciones Dicotómicas o binarias : Tienen solamente dos categorías
(NOMINAL) Ejemplo de ordinal Dicotómica:
RESUMIR - Nuevo – Continuador
- Vivo – Fallecido
- Sano – Enfermo
Politómicas: Tienen más de dos categorías (Color de ojos, grupo
sanguíneo, profesión, etc.)
7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos
1 2 P
VARIABLE VARIABLE VARIABLE
Datos • Estadígrafos: Promedios, Media, • Diagrama de Dispersión • Análisis de los
CUANTITATIVOS Mediana, Moda, Desviación Estándar, • Coeficiente de correlación de componentes principales
Varianza, Coeficiente de Variación, Pearson • Análisis Factorial de
Error Estándar • Regresión lineal y no lineal Correspondencia
• Cuartiles, Deciles, Percentiles • Coeficiente de determinación • Correlación canónica
• Coeficientes de asimetría y Curtosis • Varianza residuales
de Fisher
• Gráficas: Histogramas, Box Plot
(Diagramas de Cajas).
Datos CUALITATIVOS • Distribución de frecuencia: Tablas de • Distribución de frecuencia • Análisis Factorial de
frecuencia, Tablas de contingencias. bidimensional Correspondencia
• Gráficos de barra, diagrama de • Coeficiente de correlación • Modelo log-lineal
sectores. Spearman
• Coeficiente de contingencia

Datos MIXTOS NO CORRESPONDE • Box Plot • Regresión múltiple


• Diagrama de error • Regresión Logística
• Coeficiente biserial de punto
Estadística Descriptiva univariante:
Variables Categóricas o Cualitativas
La estadística descriptiva resume un conjunto de datos
proporcionando información mediante tablas, parámetros y/o
gráficos. En cualquier análisis estadístico, la estadística
descriptiva es la primera parte y más importante, pues permite
conocer el comportamiento de las variables, consideradas
una a una, o la posible relación existente entre ellas.
Estadística Descriptiva univariante:
Variables Categóricas o Cualitativas
Frecuencias absolutas. Se definen las frecuencias absolutas
(fa) de una variable cualitativa como el número de ocasiones
en las que se ha dado cada una de las categorías de la
variable que queramos resumir.

Frecuencias relativas. Por otro lado las frecuencias relativas (fr)


se definen como la proporción de veces que se ha dado
cada uno de las categorías de la variable. Por tanto las
frecuencias absolutas y relativas de una variable cumplen la
siguiente relación:

fa
fr 
Número de unidades experimentales
Variables CATEGÓRICAS

Estadística Descriptiva univariante:


Frecuencias absolutas y relativas
Variables CATEGÓRICAS

Estadística Descriptiva univariante:


Frecuencias absolutas y relativas
Tablas
según los niveles de investigación

05 05 Aplicativo
Tratamiento

04
04 Predictivo
Pronóstico

03 03 Explicativo
Causalidad

02
02 Relacional
Bivariado

01
01 Descriptivo
Univariado
a. Tablas de Frecuencias Absolutas y Relativas Variables CATEGÓRICAS
Frecuencia Frecuencia
Sexo
Absoluta Relativa (%)
Masculino 110 55%
Femenino 90 45%
Univariado
Estadístico Total 200 100%

Frecuencia Porcentaje
Sexo
(n) (%)
Aplicativo Masculino 110 55%
Presentación Femenino 90 45%
Predictivo De
investigaciones Total 200 100%

Explicativo Porcentaje
Sexo Cantidad
(%)
Relacional Masculino 110 55%
Femenino 90 45%
Descriptivo
Capacitación Total 200 100%
Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Variables nominal dicotómica: CASO ÚNICO: Sexo

Tabla n° 1.- Distribución según sexo (Población, lugar y tiempo)

Sexo Frecuencia (n) Porcentaje (%)

Masculino 11 55

Femenino 9 45

Total 20 100

Fuente.- Elaboración propia, 2018.


Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


a. Tablas de Frecuencias Absolutas y Relativas
Análisis de Datos Aplicado a la Investigación Científica
Variables nominal Politómica: CERRADAS: Lugar de almuerzo
2. Usted almuerza con mayor frecuencia en: (Variable nominal politómica-Cerradas)
(X) Casa
( ) Mercado
( ) Pensión
( ) En el trabajo

Tabla n° 2.- Distribución según el lugar de almuerzo (Población, lugar y tiempo)

Lugar de almuerzo Frecuencia (n) Porcentajes (%)


Casa 169 77,5
Mercado 14 6,4
Pensión 22 10,1
En el trabajo 13 6,0
Total 218 100,0
Fuente.- Elaboración propia, 2018.
Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


a. Tablas de Frecuencias Absolutas y Relativas

Variables nominal Politómica: SEMICERRADAS: Consumo cuanto tiene Sed


¿Qué prefiere consumir cuándo tiene sed? (Variable nominal politómica-semicerradas)
( ) Gaseosa
( ) Jugos embotellados
( ) Bebidas hipertónicas
(X) Agua
( ) Otros……………………………….
Tabla n° 3.- Distribución según ¿Qué prefiere consumir cuándo tiene sed? (Población, lugar
y tiempo)
Consumo cuando Frecuencia (n) Porcentajes (%)
tienen sed
Gaseosas 37 17,0
Jugos Embotellados 48 22,0
Bebida hipertónicas 5 2,3
Agua 57 26,1
Refresco 71 32,6
Total 218 100,0
Fuente.- Elaboración propia, 2018.
Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


a. Tablas de Frecuencias Absolutas y Relativas

Variables nominal Politómica: ABIERTAS: Ciudad

¿Cuál es su ciudad de Origen?

……Santa Cruz de la Sierra..…….

Tabla n° 4.- Distribución según la ciudad de residencia (Población, lugar y tiempo)

Ciudad Frecuencia (n) Porcentajes (%)


Santa Cruz de la Sierra 133 61,0
Montero 28 12,8
Trinidad 11 5,0
Camiri 9 4,1
Otros 37 17,1
Total 218 100,0

Fuente.- Elaboración propia, 2018.


Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


a. Tablas de Frecuencias Absolutas y Relativas

Variables nominal Politómica: MIXTAS: Medicamento para adelgazar


¿Actualmente toma algún medicamento para
adelgazar?
( ) Ninguno
(X) Si ¿Cuál? ….Sibutramina…

Tabla n° 5.- Distribución según ¿Actualmente toma algún medicamento para adelgazar?
(Población, lugar y tiempo)
Medicamento para Frecuencia (n) Porcentajes (%)
adelgazar
Ninguno 206 94,5
Sibutramina 3 1,4
Garcinia 2 0,9
Xenical 2 0,9
Thermofem 2 0,9
PhenQ 1 0,5
Green Coffee 2 0,9
Total 218 100,0
Fuente.- Elaboración propia, 2018.
Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


a. Tablas de Frecuencias Absolutas y Relativas

Variables nominal Politómica: NO EXCLUYENTE: Enfermedad

¿Usted padece alguna de estas enfermedades?


( ) Diabetes
( ) Hipertensión arterial
(X) Dislipidemia
(X) Dolor articular
( ) Otros………………………….…….

Tabla n° 6.- Distribución según ¿Usted padece alguna de estas enfermedades?


(Población, lugar y tiempo)
Enfermedades Frecuencia (n) Porcentajes (%)

Diabetes 40 18,3
Hipertensión 77 35,3
Arterial
Dislipidemia 15 6,9

Dolor articular 137 62,8


Fuente.- Elaboración propia, 2018.
Nivel de investigación DESCRIPTIVO

a. Tablas de Frecuencias Absolutas y Relativas

Dicotómicas 1. Caso único

Nominales 2. Cerradas
3. Semicerradas
Politómicas 4. Abiertas
Variables
Categóricas 5. Mixtas
6. No excluyentes

Ordinales 7. Caso único


a. Tablas de Frecuencias Absolutas y Relativas

Variables ordinal: CASO UNICO: Frecuencia de consumo de alimentos

Tabla n° 7.- Distribución de la frecuencia de consumo de alimentos (Población, lugar y


tiempo)

(1) (2) (3) (4) (5)


Alimento Punteo
Menos de 1 2 a 3 veces 1 a 2 veces 3 a 4 veces 5 o más
vez al mes al mes por semana por semana veces por
semana
Hamburguesa X
Pollo frito X
Choripán /panchito/ X
salchipapa
Embutidos (jamón, mortadela, X
chorizo)
Pizza X
Fuente.- Elaboración propia, 2018.
Tablas
según los niveles de investigación

05 05 Aplicativo
Tratamiento

04
04 Predictivo
Pronóstico

03 03 Explicativo
Causalidad

02
02 Relacional
Bivariado

01
01 Descriptivo
Univariado
Tablas del Nivel de investigación RELACIONAL
Tabla N° 2.- Distribución del Estado Nutricional según Sexo

Sexo Porcentaje
Estado Nutricional Porcentaje Porcentaje Total
Masculino Femenino (% )
(% ) (% )
Desnutrición 2 1% 14 6% 16 7%
Normal (Eutrófico) 62 28% 64 29% 126 57%
Sobrepeso 53 24% 12 5% 65 29%
Obesidad 8 4% 4 2% 12 5%
Obesidad mórbida 2 1% 2 1% 4 2%
Total 127 57% 96 43% 223 100%

Bivariado
Tablas de contingencia
Tablas Cruzadas
Tablas del
Nivel Relacional Tablas de doble entrada
Tablas de Cruces de Variables
Tablas Tetracóricas
Tablas 2x2 del Nivel de investigación RELACIONAL

a.- Tablas de contingencia (Objetivo es COMPARAR)

Cáncer de Pulmón Cáncer de Pulmón

Si No Total Si No Total

Hábito de Fumar N % N % N % Hábito de Fumar N % N % N %

14 63,6 9 32,1 23 46,0 Si 14 60,9 9 39,1 23 100,0


Si
8 36,4 19 67,9 27 54,0 No 8 29,6 19 70,4 27 100,0
No

22 100,0 28 100,0 50 100,0 Total 22 44,0 28 56,0 50 100,0


Total

a.- Tablas de contingencia (Objetivo es ASOCIAR)

Consumo de alcohol

Si No Total

Hábito de fumar N % N % N %

Si 14 28,0 9 18,0 23 46,0

No 8 16,0 19 38,0 27 54,0

Total 22 44,0 28 56,0 50 100,0


Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 1.- Distribución de la diabetes según la obesidad de (Población, Lugar y Tiempo)
(Objetivo estadístico COMPARAR)
Diabetes
Totales
Obesidad Si No

N % N % N %

Si 9 50 41 35 50 37

No 9 50 75 65 84 63

Total 18 100 116 100 134 100


Fuente.- Elaboración propia, 2018.

Gráfica N° 1.- Distribución de la diabetes según la obesidad de (Población, Lugar y Tiempo)


Obesidad Si Obesidad No
65

50 50
PORCENTAJES (%)

35

SI NO
D I A BETES

En la tabla N° 1, se presenta que el 50% de la población diabética presenta obesidad, mientras que el 35% de los
diabéticos no presenta obesidad.
Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo)
(Objetivo estadístico COMPARAR)
Diabetes
Totales
Obesidad Si No

N % N % N %

Si 9 18 41 82 50 100

No 9 11 75 89 84 100

Total 18 13 116 87 134 100

Fuente.- Elaboración propia, 2018.

Gráfica N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo)


Diabetes Si Diabetes No

89
82
PORCENTAJES (%)

18
11

SI NO
O BES I DAD
En la tabla N° 2, se presenta que el 18% de la población obesa presenta diabetes, mientras que el 82% de los
obesos no presenta diabetes.
Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo)
(Objetivo estadístico ASOCIAR)
Diabetes
Totales
Obesidad Si No

N % N % N %

Si 9 7 41 31 50 37

No 9 7 75 56 84 63

Total 18 13 116 87 134 100


Fuente.- Elaboración propia, 2018.

Gráfica N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo)


Obesidad Si Obesidad No
56
PORCENTAJES (%)

31

7 7

SI NO
D I A BETES

En la tabla N° 3, se presenta que el 13% de la población presenta diabetes, de los cuales el 7% de los diabéticos son
obesos, mientras que la otra proporción de diabéticos (7%) no presenta obesidad.
Tablas 2x3 del Nivel de investigación RELACIONAL

a.- Tablas de contingencia (Objetivo es COMPARAR)

Área académica
CS Salud CS Sociales Ingenierías Total
Estrés laboral N % N % N % N %
Si 18 90 8 53 8 53 18 90
No 2 10 7 46 7 47 2 10
Total 20 100 15 100 15 100 20 100
Tablas
según los niveles de investigación

05 05 Aplicativo
Tratamiento

04
04 Predictivo
Pronóstico

03 03 Explicativo
Causalidad

02
02 Relacional
Bivariado

01
01 Descriptivo
Univariado
Tablas del Nivel de investigación EXPLICATIVO

a.- Tablas de contingencia (Efecto de 4 tratamientos para


retardar el peso en gramos de papayas de exportación)

Tratamientos Días después de la aplicación del tratamiento


3 6 9 12 15
1 250 242 225 215 205
2 252 225 205 190 183
3 251 235 217 203 195
4 250 242 238 230 225
(5) Testigo 255 210 200 185 164
Tablas del Nivel de investigación EXPLICATIVO

a.- Tablas de contingencia: Elevación de la Frecuencia Cardiaca “EFC” por el uso de


Broncodilatadores en las ciudades de Bolivia según las edades.

Ciudades de Bolivia

Edades Santa Cruz de la Sierra (416 msnm) Cochabamba (2558 msnm) La Paz (3625 msnm)

Salbutamol Fenoterol Terbutalina Salbutamol Fenoterol Terbutalina Salbutamol Fenoterol Terbutalina

De 10 a 25 25 17 13 12 19 26 23 29 17

De 25 a 40 16 11 15 15 21 18 26 22 16

De 40 a 55 14 11 9 19 17 22 15 18 13

Total 55 39 37 46 57 66 64 69 46
Variables CUALITATIVAS

Estadística Descriptiva univariante:


Representación gráfica
Diagrama de sectores. Se utiliza para visualizar de forma
sencilla las frecuencias relativas de las variables. En los gráficos
de sectores se divide una figura, habitualmente de forma
circular, de forma que el área correspondiente a cada posible
respuesta de la variable será proporcional a la frecuencia
relativa de la variable.
Variables CUALITATIVAS

Estadística Descriptiva univariante:


Representación gráfica
Gráfico de barras. Se representa una barra vertical (u
horizontal si se desea) para cada una de las categorías de la
variable de altura proporcional a su frecuencia, bien absoluta
o relativa.
Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS

Tabla N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo)
Porcentaje
HTA Frecuencia (n) (%)
Si 110 55
No 90 45
Total 200 100
Fuente.- Elaboración propia, 2018.

Grafico N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo)

Sin HTA Con HTA


45% 55%

Según la tabla n° 1, la prevalencia de Hipertensión arterial fue del 55%, lo cual significa que aproximadamente 5
de cada 10 personas presentan la presión arterial sistólica elevada.
Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS

Tabla N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)


Estado Frecuencia Porcentaje
Nutricional (n) (%)
Desnutrición 16 7
Normal (Eutrófico) 126 57
Sobrepeso 65 29
Obesidad 12 5
Obesidad mórbida 4 2
Total 223 100
Fuente.- Elaboración propia, 2018.

Grafico N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)

Estado Nutricional
60% 57%

Porcentaje (%) 50%

40%
29%
30%

20%

10% 7% 5%
2%
0%
Desnutrición Normal Sobrepeso Obesidad Obesidad
(Eutrófico) mórbida

Según la tabla n° 2, se pudo evidenciar que el 29% de la población de estudio presenta Sobrepeso, mientras que el
7% tiene Obesidad y desnutrición.
CASOS PRACTICOS N° 7

Tablas de frecuencias
absolutas y relativas
CASOS PRACTICOS N° 8

Diagrama de sectores
y gráfico de barras
Estadística Descriptiva

RESUMIR GENERALIZAR
Tipo VARIABLES NUMÉRICAS
Naturaleza CUANTITATIVAS
Escala (2) INTERVALO (3) RAZÓN
Dos atributos Tres atributos
Características Tiene intervalos iguales y Tiene intervalos constantes entre
medibles. No tiene un origen valores; además de un origen real. El
real, por lo que puede asumir cero significa la ausencia del
valores negativos. individuo.

Univariable o Atributos de la
escala
Orden Distancia Origen Orden Distancia Origen

Unidimensional Clasificación de Intervalo Continuas Discretas


CUANTITATIVA CUALITATIVA Escala
Edades: Temperatura N° hijos
(1 variable) 1 a 5 años Peso Kg N° partos
6 a 10 años Talla cm N° Leucocitos
% Grasa corp. N° huesos
Ingreso: Hb (g/dl) N° dientes
< 1000 Glucosa N° Familias
1000 a 2000 (mg/dl)
2000 a 3000 Calorías
> 3000 pH

Ejemplo Temperatura Hora del día Peso Hijos

Valor Final -10 °C 00 Horas 00,00 Kg Uno


0°C 10 Horas 10,24 kg Dos
20°C 20 Horas 10,00 Kg Tres

RESUMIR Observaciones
(RAZÓN)
Continuas: Provienen de medir y los valores poseen decimales
Se pueden representar con números enteros o fraccionados
Entre dos valores siempre existe un valor intermedio.

Discretas: Provienen de contar y los valores no tienen decimales


Solamente pueden ser representados con números enteros
7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos
1 2 P
VARIABLE VARIABLE VARIABLE
Datos • Estadígrafos: Promedios, Media, • Diagrama de Dispersión • Análisis de los
CUANTITATIVOS Mediana, Moda, Desviación • Coeficiente de correlación componentes principales
Estándar, Varianza, Coeficiente de de Pearson • Análisis Factorial de
Variación, Error Estándar • Regresión lineal y no lineal Correspondencia
• Cuartiles, Deciles, Percentiles • Coeficiente de • Correlación canónica
• Coeficientes de asimetría y determinación
Curtosis de Fisher • Varianza residuales
• Gráficas: Histogramas, Box Plot.

Datos • Distribución de frecuencia: Tablas • Distribución de frecuencia • Análisis Factorial de


CUALITATIVOS de frecuencia, Tablas de bidimensional Correspondencia
contingencias. • Coeficiente de correlación • Modelo log-lineal
• Diagrama de sectores, gráficos de Spearman
barra, • Coeficiente de contingencia
• Moda
Datos MIXTOS NO CORRESPONDE • Box Plot • Regresión múltiple
• Diagrama de error • Regresión Logística
• Coeficiente biserial de
punto
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Tabla de agrupación de intervalos (variables Numérica-DISCRETA)

Variable Indicador Valor Final Escala


Menor de 2 años
Número de años biológicos
cumplidos a la fecha de la De 2 a 5 años
Ordinal
Grupo Etáreo entrevista De 15 a 47 años Embarazadas
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Tabla de agrupación de intervalos (variables Numérica-DISCRETA)

Grupo etáreo Frecuencia Porcentaje


(Años) (n) (%)

Menor de 2 349 39

De 2 a 5 487 54

15 a 47 Embarazadas 61 7

Total 897 100


Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Tabla de agrupación de intervalos (variables cuantitativa-CONTINUA)

Variable Indicador Valor Final Escala


Desnutrido
Índice de Masa Corporal Normal (Eutrófico)
Peso( Kg ) Ordinal
Estado nutricional Sobrepeso
Talla(m) 2
Obesidad
Obesidad Mórbida
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Tabla de agrupación de intervalos (variables numérica-CONTINUA)

Estado Frecuencia Porcentaje


Nutricional (n) (%)
Desnutrido 4 4

Eutrófico (Normal) 19 19

Sobrepeso 67 67

Obesidad 9 9

Obesidad mórbida 1 1

Total 100 100


7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos
1 2 P
VARIABLE VARIABLE VARIABLE
Datos • Estadígrafos: Promedios, Media, • Diagrama de Dispersión • Análisis de los
CUANTITATIVOS Mediana, Moda, Desviación • Coeficiente de correlación componentes principales
Estándar, Varianza, Coeficiente de de Pearson • Análisis Factorial de
Variación, Error Estándar • Regresión lineal y no lineal Correspondencia
• Cuartiles, Deciles, Percentiles • Coeficiente de • Correlación canónica
• Coeficientes de asimetría y determinación
Curtosis de Fisher • Varianza residuales
• Gráficas: Histogramas, Box Plot.

Datos • Distribución de frecuencia: Tablas • Distribución de frecuencia • Análisis Factorial de


CUALITATIVOS de frecuencia, Tablas de bidimensional Correspondencia
contingencias. • Coeficiente de correlación • Modelo log-lineal
• Diagrama de sectores, gráficos de Spearman
barra, • Coeficiente de contingencia
• Moda
Datos MIXTOS NO CORRESPONDE • Box Plot • Regresión múltiple
• Diagrama de error • Regresión Logística
• Coeficiente biserial de
punto
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda

Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02

03
Posición
Cuartiles, Deciles, Percentiles

Forma UNIVARIANTES
Asimetría: Derecha (+), Simétrica (0), Izquierda (-)
Curtosis: Lectocúrtica(+), Mesocurtica(0), Platicurtica(0)
04
Variables NUMÉRICAS - CONTINUAS
MEDIDAS UNIVARIANTES
01
Tendencia Central
Media, Mediana, Moda
MEDIDAS DE TENDENCIA CENTRAL

Son indicadores estadísticos que muestran hacia que


valor se agrupan los datos y nos ayudan a saber
sobre que datos se agrupa toda la distribución.

Media Valor que representa a la población ó a un grupo de datos.

Mediana Es un dato que divide a la población en 2 grupos iguales.

Moda Es el dato que más se repite.


MEDIDAS DE TENDENCIA CENTRAL

Media Valor que representa a la población ó a un grupo de datos.

Datos Cuantitativos
x
x1 Media Aritmética o Promedio
n
x2
 xi
 x i 1

xn n
Ventajas :
• Fácil de calcular e interpretar.
• En su cálculo intervienen todos los datos disponibles.
• Su valor es único para una serie de datos.
• Es el punto de equilibrio de la información.

Desventajas :
• No es representativa con pocos datos
• Se ve afectada por el grado de dispersión
• Es poco útil con datos muy heterogéneos
• No todos los valores contribuyen de igual forma ,los mayores tienen más peso
MEDIDAS DE TENDENCIA CENTRAL

Mediana Es un dato que divide a la población en 2 grupos iguales.

Datos Cuantitativos ordenados de menor a mayor


Mediana
M E  x( k ) Si n es impar

x( k )  x( k 1) Si n es par
ME 
2
x( k )  dato del centro
Ventajas :
• Valor único que no se ve afectado por los extremos por ser equidistante de ellos.
• Se localiza a la mitad de los datos , dejando el 50 % por arriba y el 50 % por debajo de
su valor.
• Es menos sensible a las variaciones de los datos.
• No se ve afectada por la dispersión de los datos.

Desventajas :
• No se emplea para hacer cálculos
• Utiliza muy poca información de los datos
• Cuanto más grande es la serie de datos , más complicado se vuelve su determinación.
MEDIDAS DE TENDENCIA CENTRAL

Moda Es el dato que más se repite.

• La moda de un conjunto de observaciones es el valor que más


se repite, aquel cuya frecuencia absoluta es máxima.

• Puede ser única, que haya más de una, o que no exista.

• Cuando hay más de una , la distribución de los datos se


denomina acorde : bimodal , trimodal, polimodal, etc.
Tablas de Medidas de tendencia Central Variables Numéricas

Tabla N° 1.- Medidas de tendencia central (Edad) (Población, lugar y tiempo)


Univariado
Estadístico Años
Media = 43,420
Aplicativo

Predictivo Mediana = 43
Explicativo Moda = 42
Relacional
Fuente.- Elaboración propia, 2018.
Descriptivo
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda

Dispersión UNIVARIANTES
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02
MEDIDAS DE DISPERSIÓN

Son datos estadísticos que sirven para medir la


intensidad de alejamiento entre datos.

Desviación Amplitud de
estándar rango

Coeficiente de
Varianza
variación

Error estándar
de la media
MEDIDAS DE DISPERSIÓN

Amplitud de Indica el ancho, recorrido o amplitud de valores . Se define como


rango la diferencia entre la observación más grande y la más pequeña :

r  vmax  vmin
Ventajas :
• Fácil de determinar e interpretar.
• Nos indica los límites de nuestra información.
• Nos permite visualizar la amplitud de dispersión de los valores de forma
sencilla.

Desventajas :
• Ignora toda la información de la muestra
• No mide el grado de dispersión , solo su ancho
• No nos da una idea detallada de la información de las observaciones.
MEDIDAS DE DISPERSIÓN

Es una medida significativa de la dispersión de las observaciones


Varianza alrededor de la media. Se define como el promedio de las
desviaciones respecto a su media , elevadas al cuadrado :
n

 (x  x) i
2

s2  i 1

n 1
Ventajas :
• Fácil de calcular mediante su fórmula.
• Indica el grado y forma de dispersión de los datos con respecto a la media.
• Depende de todas las mediciones.

Desventajas :
• Es impráctica por ser un término cuadrático de poco sentido en la realidad.
• Es un número muy grande de referencia matemática , pero sin valor concreto
y de difícil manejo comparativo.
MEDIDAS DE DISPERSIÓN

Se define como la raíz cuadrada del promedio las desviaciones


Desviación
respecto a su media , elevadas al cuadrado , es decir la raíz
estándar
cuadrada de la varianza :
n

 (x  x)i
2

 i 1

Ventajas : n 1
• Fácil de calcular mediante su fórmula y particularmente en hojas de cálculo
como Excel que lo hacen de forma automática.
• Indica el grado y forma de dispersión de los datos con respecto a la media.
• Depende de todas las mediciones.
• Muy práctica por usar los mismos valores de las unidades que se analizan.
• Un valor grande indica que los datos se alejan mucho de la media y un valor
pequeño indica que se acercan a la media.

Desventajas :
• Si hacemos el cálculo manual , es complicado.
MEDIDAS DE DISPERSIÓN

Coeficiente de Indica el porcentaje de variación que existe con respecto al


variación Valor promedio de la distribución:

s
cv  *100
x
Ventajas :
• Sirve para comparar la variabilidad en un conjunto de datos con la de otro.
• Permite la comparación de la variabilidad de variables medidas en escalas o
unidades distintas.
• Emplea toda la información disponible para su cálculo.
• Fácil de calcular

Desventajas :
• No es una medida de dispersión con respecto al centro de la distribución de
los datos.
• Arrastra las limitaciones que tiene la media como medida de tendencia
central.
MEDIDAS DE DISPERSIÓN

O Error típicos, mide el grado de dispersión de las medias de


Error estándar
todas las posibles muestras que pudieran extraerse de la
de la media
población. Mide el grado de dispersión de las medias muéstrales
respecto a la media poblacional (desconocida) :

s
EE 
n

Sigma σ: desviación DISTRIBUCIÓN DE


estándar de los individuos LAS MEDIAS
de la población general MUESTRALES
Tablas de Medidas de Dispersión Variables Numéricas

Tabla N° 1.- Medidas de dispersión (Hemoglobina en g/dl) (Población, lugar y tiempo)

Estadístico g/dl
Rango = 13,7
Desviación Estándar = 1,478
La varianza = 2,186
Coef. de Variación (%) = 13,05
Error estándar = 0,0494
Fuente.- Elaboración propia, 2018.
Graficas de Estadística descriptiva CUANTITATIVA Variables Numéricas

Grafico N° 1.- Histograma


Un histograma es una representación gráfica de una variable en forma de barras agrupados mediante intervalos. Los datos
provienen de una variables cuantitativas continuas. Sirve para tener una idea de la distribución de los datos o muestra.
También cabe emplear variables cualitativas ordinales, siendo necesario que el número de datos sea alto.
Grafico de Medidas de Dispersión Variables Numéricas

Grafico N° 1.- Histograma (Hemoglobina en g/dl) (Población, lugar y tiempo)


Tablas de Medidas de Dispersión Variables Numéricas

Tabla N° 1.- Medidas de dispersión (Peso en embarazadas) (Población, lugar y tiempo)

Estadístico Kilogramos
Rango = 37
Desviación Estándar = 6,985
La varianza = 48,799
Coef. de Variación (%) = 11,80
Error estándar = 0,9596
Fuente.- Elaboración propia, 2018.
Grafico de Medidas de Dispersión Variables Numéricas

Gráfico N° 1.- Histograma (Peso en embarazadas) (Población, lugar y tiempo)


CASOS PRACTICOS N° 10

Estimación puntual e
intervalos de confianza
Variables CUANTITATIVAS

Ejercicio: Se dispone del peso (en gramos) de dos grupos de niños, de 8 niños por grupo
de un mes de edad. Los datos se muestran a continuación:

Grupo A: 4123 4336 4160 4165 4422 3853 3281 3990


Grupo B: 4096 4166 3596 4127 4017 3769 4240 4194

1. Indica de qué tipo de variable se trata.


2. Calcular los siguientes estadísticos del Grupo A y B:

 Media  Varianza
 Mediana  Desviación típica
 Moda  Coeficiente de variación
 Rango  Error Estándar
Variables CUANTITATIVAS

Ejercicio: En un Centro de Salud se realiza seguimiento de la Hipertensión Arterial de algunos pacientes. Se dispone
de 3 Grupos, cada uno con 10 mediciones de la tensión arterial sistólica (TAS) realizadas en el día de hoy, las cuales
se muestran a continuación:

Grupo A: 173,03 165,54 141,59 158,66 158,81 156,49 150,29 154,53 162,50 158,49
Grupo B: 151,11 166,13 147,47 152,83 166,99 135,62 138,77 168,11 162,04 176,77
Grupo C: 159,97 152,99 161,92 167,70 143,35 154,06 160,82 180,08 172,93 158,72

1. Indica de qué tipo de variable se trata.


2. Calcular los siguientes estadísticos para cada uno de los grupos:

 Media  Varianza
 Mediana  Desviación típica
 Moda  Coeficiente de variación
 Rango  Error Estándar
Grafica de Levey-Jennings para
Control de Calidad
Datos
Número Colesterol mg/dl Estadísticos
1 249 248,33 Media = 248,33
2 247 5,35 Desviación Estándar = 5,35
3 244 253,68 + 1DS = 253,68
4 248 259,02 + 2DS = 259,02
5 249 264,37 + 3DS = 264,37
6 246 242,99 - 1DS = 242,99
7 252 237,64 - 2DS = 237,64
8 246 232,30 - 3DS = 232,30
9 239 Reglas
10 253 Media
11 243 0 248,33
12 252 31 248,33
13 249 (+1) Desviación Estándar
14 243 0 253,68
15 239 31 253,68
16 251 (-1) Desviación Estándar
17 247 0 242,99
18 255 31 242,99
19 244 (+2) Desviación Estándar
20 262 0 259,02
21 253 31 259,02
22 250 (-2) Desviación Estándar
23 242 0 237,64
24 256 31 237,64
25 242 (+3) Desviación Estándar
26 243 0 264,37
27 251 31 264,37
28 255 (-3) Desviación Estándar
29 248 232,30
30 252 232,30
Grafica de Levey-Jennings para
Control de Calidad
Datos Media 1DS 2DS 3DS 1DS (-) 2DS (-) 3DS (-)
249 248,33 253,68 259,02 264,37 242,99 237,64 232,30
247 248,33 253,68 259,02 264,37 242,99 237,64 232,30
244 248,33 253,68 259,02 264,37 242,99 237,64 232,30
248 248,33 253,68 259,02 264,37 242,99 237,64 232,30
249 248,33 253,68 259,02 264,37 242,99 237,64 232,30
246 248,33 253,68 259,02 264,37 242,99 237,64 232,30
252 248,33 253,68 259,02 264,37 242,99 237,64 232,30
246 248,33 253,68 259,02 264,37 242,99 237,64 232,30
239 248,33 253,68 259,02 264,37 242,99 237,64 232,30
253 248,33 253,68 259,02 264,37 242,99 237,64 232,30
243 248,33 253,68 259,02 264,37 242,99 237,64 232,30
252 248,33 253,68 259,02 264,37 242,99 237,64 232,30
249 248,33 253,68 259,02 264,37 242,99 237,64 232,30
243 248,33 253,68 259,02 264,37 242,99 237,64 232,30
239 248,33 253,68 259,02 264,37 242,99 237,64 232,30
251 248,33 253,68 259,02 264,37 242,99 237,64 232,30
247 248,33 253,68 259,02 264,37 242,99 237,64 232,30
255 248,33 253,68 259,02 264,37 242,99 237,64 232,30
244 248,33 253,68 259,02 264,37 242,99 237,64 232,30
262 248,33 253,68 259,02 264,37 242,99 237,64 232,30
253 248,33 253,68 259,02 264,37 242,99 237,64 232,30
250 248,33 253,68 259,02 264,37 242,99 237,64 232,30
242 248,33 253,68 259,02 264,37 242,99 237,64 232,30
256 248,33 253,68 259,02 264,37 242,99 237,64 232,30
242 248,33 253,68 259,02 264,37 242,99 237,64 232,30
243 248,33 253,68 259,02 264,37 242,99 237,64 232,30
251 248,33 253,68 259,02 264,37 242,99 237,64 232,30
255 248,33 253,68 259,02 264,37 242,99 237,64 232,30
248 248,33 253,68 259,02 264,37 242,99 237,64 232,30
252 248,33 253,68 259,02 264,37 242,99 237,64 232,30
Grafica de Levey-Jennings para
Control de Calidad

Control de Colesterol mg/dl


265
Datos

260
Media

255
1DS
Colesterol mg/dl

250 2DS

3DS
245

1DS (-)
240

2DS (-)
235
3DS (-)

230
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Grafica de Levey-Jennings para
Control de Calidad
Control de Colesterol mg/dl
265 Datos Colesterol
mg/dl

260 Media

255 1DS
Colesterol mg/dl

2DS
250

3DS
245

1DS (-)
240
2DS (-)

235
3DS (-)

230
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda

Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02
UNIVARIANTES
03
Posición
Cuartiles, Deciles, Percentiles
MEDIDAS DE POSICIÓN/ORDEN/LOCALIZACIÓN

Sirven para dividir un conjunto de datos en grupos


con la misma cantidad de unidades de estudio.
Las medidas de posición más usadas son:

Cuartiles
Son medidas
de posición
Deciles
más usadas.

Percentiles
MEDIDAS DE POSICIÓN

Percentiles: Son 99 valores que dividen en cien partes


iguales el conjunto de datos ordenados.

Cuartiles: Son tres valores que dividen al conjunto de


datos ordenados en cuatro partes iguales, son un
caso particular de percentiles.
25% 25% 25% 25%
Q1 Q2 Q3
Deciles: Son nueve valores que dividen al conjunto de
datos ordenados en diez partes iguales, son también
un caso particular de los percentiles.
MEDIDAS DE POSICIÓN

Si los datos utilizados siguen una distribución


normal los percentiles y la Desviaciones
Estándar (DE) son comparables.

Las medidas en el percentil 3 corresponde a -


2DE y las del percentil a 97 +2DE

P3 P50 P97
-2DE Media +2DE
MEDIDAS DE POSICIÓN

Grafico N° 1.- Diagrama de Caja y Bigotes


Es un gráfico que está basado en cuartiles y mediante el cual se visualiza la distribución de
un conjunto de datos. Está compuesto por un rectángulo (la caja) y dos brazos (los
bigotes); suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o
mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
MEDIDAS DE POSICIÓN

Tabla N° 1.- Medidas de posición: (Talla) (Población, lugar y tiempo)

Percentiles: Cuartiles: Deciles:


p5= 1,57 D3= 1,64

p25= 1,63 Q1= 1,63 D4= 1,65

p50= 1,67 Q2= 1,67 D5= 1,67

p75= 1,71 Q3= 1,71 D6= 1,69

p95= 1,79 D7= 1,71

Fuente.- Elaboración propia, 2018.


MEDIDAS DE POSICIÓN

Grafico N° 1.- Diagrama de Caja: (Talla) (Población, lugar y tiempo)

Máximo 1,83

P75 = Q3 = 75 1,71

Mediana P50 = Q2 = 50 1,67

P25 = Q1 = 25 1,63

Mínimo 1,51
CASOS PRACTICOS N° 11

Los percentiles y los


valores de normalidad
MEDIDAS DE POSICIÓN

http://www.who.int/childgrowth/software/es/
MEDIDAS DE POSICIÓN

http://www.who.int/childgrowth/software/es/
Variables NUMÉRICAS - CONTINUAS
MEDIDAS
01
Tendencia Central
Media, Mediana, Moda

Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
02

03
Posición
Cuartiles, Deciles, Percentiles

Forma UNIVARIANTES
Asimetría: Derecha (+), Simétrica (0), Izquierda (-)
Curtosis: Lectocúrtica(+), Mesocurtica(0), Platicurtica(0)
04
MEDIDAS DE FORMA

Coeficiente de
Curtosis
asimetría

Evalúa la distribución de la frecuencia en Evalúa la distribución de la frecuencia en


sentido Vertical. sentido horizontal.
MEDIDAS DE FORMA

Asimetría: El Coeficiente de Asimetría de


Pearson.

Apuntamiento o Curtosis: Se mide con el


coeficiente de curtosis.
Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.

Dos variables Numéricas o Cuantitativas

02 Las dos variables cuantitativas se lleva a cabo a


partir de la obtención del coeficiente de covarianza
y del coeficiente de correlación de Pearson y
gráficos de nubes de puntos.

Una V. Categórica y otra V. Numérica (MIXTAS)


03 La descripción se reduce a la variable cuantitativa,
tal y como se ha descrito en la sección de análisis
univariante, para cada una de las categorías de la
variable cualitativa.
Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.

1.- Tabla de contingencia con Porcentajes por columnas (Objetivo estadístico comparar)
Diabetes
Totales
Obesidad Si No

N % N % N %

Si 9 50 41 35 50 37

No 9 50 75 65 84 63

Total 18 100 116 100 134 100


Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
Obesidad Si Obesidad No
65

50 50

PORCENTAJES (%)
35

SI NO
DIABETES
Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.

2.- Tabla de contingencia con Porcentajes por Filas (Objetivo estadístico comparar)
Diabetes
Totales
Obesidad Si No

N % N % N %

Si 9 18 41 82 50 100

No 9 11 75 89 84 100

Total 18 13 116 87 134 100


Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.

Diabetes Si Diabetes No

89
82

PORCENTAJES (%)
18
11

SI NO
OBESIDAD
Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.

3.- Tabla de contingencia con Porcentajes Total (Objetivo estadístico asociar)

Diabetes
Totales
Obesidad Si No

N % N % N %

Si 9 7 41 31 50 37

No 9 7 75 56 84 63

Total 18 13 116 87 134 100


Estadística Descriptiva Bivariante
Dos variables Categóricas o Cualitativas

01 Se describe la relación entre dos variables


categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.

Obesidad Si Obesidad No
56

PORCENTAJES (%)
31

7 7

SI NO
DIABETES
Estadística Descriptiva Bivariante
Un párrafo de nuestra introducción

Dos variables Numéricas o Cuantitativas

02 Las dos variables cuantitativas se lleva a cabo a


partir de la obtención del coeficiente de covarianza
y del coeficiente de correlación de Pearson y
gráficos de nubes de puntos.
Estadística Descriptiva Bivariante
Una V. Categórica y otra V. Numérica (MIXTAS)
03 La descripción se reduce a la variable cuantitativa,
tal y como se ha descrito en la sección de análisis
univariante, para cada una de las categorías de la
variable cualitativa.

Tabla 1.- Medidas de Tendencia Central y de Dispersión (Peso en Kg) en pacientes Con
y Sin HTA Peso en Kilogramos

Estadísticos Con HTA Sin HTA

Media = 67,49 64,90

Mediana = 66,55 64,50

Moda = 55,00 72,00

Rango = 55,30 58,40

Desv. Estandar = 12,58 13,13

Varianza = 158,23 172,32

Coef. Variación = 18,64 20,23

Error Estándar = 1,39 1,82


Estadística Descriptiva Bivariante
Una V. Categórica y otra V. Numérica (MIXTAS)
03 La descripción se reduce a la variable cuantitativa,
tal y como se ha descrito en la sección de análisis
univariante, para cada una de las categorías de la
variable cualitativa.

Grafica 1.- Diagrama de Cajas y bigotes de (Peso en Kg) en pacientes Con y Sin HTA
COMO DETECTAR EN EL SPSS:

OUTLIERS o
Outliers
VALORES ATÍPICOS
Es una observación que es numéricamente distante del
resto de los datos, pueden ser indicativos de datos que
pertenecen a una población diferente del resto de las
muestras establecidas.
¿Qué es un Outlier o Valores atípicos?

Puntuación en una variable continua que es diferente a


las demás.

Puntuación
extrema
¿Porqué identificar un Outlier o Valores atípicos?

¿Estará relacionado el consumo de helado con el consumo de cerveza?


¿Porqué identificar un Outlier o Valores atípicos?

Rpta.- Existe correlación entre el consumo de helado y el consumo de cerveza.


¿Porqué identificar un Outlier o Valores atípicos?
¿Porqué identificar un Outlier o Valores atípicos?

Rpta.- En realidad: No existe correlación entre el consumo de helado y el consumo de cerveza.


¿Porqué identificar un Outlier o Valores atípicos?
¿Cómo detectamos un Outliers?

A través de las “Puntuaciones típicas” (Z):


Miden la DISTANCIA de cada puntuación con respecto a
la media de la variable en desviaciones típicas o
estándar.

Z
Muestras Pequeñas (<80) 2,5
Muestras Grandes (>80) 3
¿Cómo detectamos un Outliers en SPSS?

Analizar/Estadísticos descriptivos/Descriptivos
¿Cómo detectamos un Outliers en SPSS?

Z
Muestras Pequeñas (<80) 2,5
Muestras Grandes (>80) 3
¿Cómo detectamos un Outliers en SPSS?
¿Qué hacemos con los Outlier o Valores atípicos?

1. Identificarlos

2. Razones -> Error de codificación?

3. Resultados de los análisis estadísticos CON y SIN outliers

Vous aimerez peut-être aussi