Vous êtes sur la page 1sur 41

Bioestadística

Viviana García Mir (PhD)

UNIVERSIDAD TÉCNICA DE MACHALA


FACULTAD DE CIENCIAS QUÍMICAS Y DE LA SALUD

1
UNIDAD III: Cálculos
estadísticos
Sumario:
Tema 3: Medidas de resumen para variables
cuantitativas
Medidas de tendencia central
Medidas de posición
Medidas de dispersión
Forma
Objetivo: Calcular las medidas describas de las
variables cuantitativas para la organización y
resumen de resultados provenientes de
situaciones prácticas en Bioquímica y farmacia.
2
BIBLIOGRAFÍA

Bibliografía Básica
• Mendenhall, W. Beaver, R.J., y Beaver B.M. (2012)
Introducción a la probabilidad y estadística, 11 ed. D.F.
México, México. Cengage Learning.

Bibliografía Complementaría
• Moncho, J. (2014) Estadística aplicada a las ciencias de la
salud. 1ra ed. España. Elsevier.
• Johnson, R. y Kuby, P. (2012) Estadística elemental. 10
ed. D.F. México, México Cengage
3
Learning. Viviana García Mir (PhD)
Medidas descriptivas
Medidas descriptivas
❖ Centralización
▪ Indican valores con respecto a los que los datos parecen
agruparse.
• Media, mediana y moda
❖ Posición
▪ Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
• Cuantiles, percentiles, cuartiles, deciles,...
❖ Dispersión
▪ Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
▪ Desviación típica, coeficiente de variación, rango, varianza
❖ Forma
▪ Asimetría
▪ Apuntamiento o curtosis
Estadísticos de Centro
❖ Moda Es el/los valor/es donde la distribución de
frecuencia alcanza un máximo.
Estadísticos de Centro

Propiedades de la moda
❖Es muy fácil de calcular.
❖Puede no ser única.
❖Puede ser útil en variables
ordinales
Estadísticos de Centro
❖ Mediana Es un valor que divide a las observaciones en
dos grupos con el mismo número de individuos
(percentil 50). Si el número de datos es par, se elige la
media de los dos datos centrales.

Altura mediana
Mediana

9 Viviana García Mir (PhD)


Mediana
Cuando el número de observaciones es impar
Sean los datos : 15, 8, 7, 8, 14
Datos ordenados : 7, 8, 8, 14, 15

Aplicando la fórmula : n + 1 5+1


------- = -------- = 3
2 2
3 ➔ la posición de la mediana en la lista de datos
En nuestro caso la mediana es el 8

10 Viviana García Mir (PhD)


Mediana
Cuando el número de observaciones es par
Sean los datos : 15, 8, 7, 8, 14, 15
Datos ordenados : 7, 8, 8, 14, 15, 15

Aplicando la fórmula : n + 1 6+1


------- = -------- = 3,5
2 2
7, 8, 8, 14, 15, 15
valores ambiguos (8 + 1)/2 = 11 ➔
es el valor de la mediana y no su posición como
en el caso anterior
11 Viviana García Mir (PhD)
Estadísticos de Centro

Mediana de 1,2,4,5,6,6,8 es 5
Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Es conveniente cuando los datos son asimétricos.
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
Propiedades de la mediana
Estadísticos de Centralización

❖Media Es la media aritmética (promedio) de los


valores de una variable. Suma de los valores
dividido por el tamaño muestral.
▪ Conveniente cuando los datos se concentran
simétricamente con respecto a ese valor.

▪ Centro de gravedad de los datos


Media
Datos organizados en tabla
▪ si está en intervalos usar como xi las marcas
de clase. Si no ignorar la columna de
intervalos.

Variable n i. Ni.
L0 – L 1 x1 n1 N1
x=
i
xn i i
L1 – L 2 x2 n2 N2
n
...
Lk-1 – Lk xk nk Nk
n
Ejemplo (continuación)
Peso M. Fr. Fr.
Clase ac.
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
58

x=
 xn
i i i
=
45  5 + 55 10 +  + 115  3
= 69,3 17
n 58
Inconvenientes de la media
Otras medias:
Otras medias:
Estadísticos de posición
Los estadísticos de posición van a ser valores de la
variable caracterizados por superar a cierto porcentaje
de observaciones en la población (o muestra).
percentiles, cuartiles, deciles, quintiles

21
Estadísticos de posición
❖ Percentil de orden k = cuantil de orden k/100
▪ La mediana es el percentil 50
▪ El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%

❖ Cuartiles: Dividen a la muestra en 4 grupos con


frecuencias similares.
▪ Primer cuartil = Percentil 25 = Cuantil 0,25
▪ Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
▪ Tercer cuartil = Percentil 75 = Cuantil 0,75
Percentiles 25, 50 y 75 (cuartiles)

23 Viviana García Mir (PhD)


Cálculo de cuartiles
Dada la siguiente distribución en el número de hijos de
cien familias, calcular sus cuartiles:

Solución:
1. Primer cuartil:
n/4= 25; Primera Ni > n/4 = 39; luego Q1 = 2.
2. Segundo cuartil:
2n/4= 50; Primera Ni > 2 n/4 = 65; luego Q2 = 3.
3. Tercer cuartil:
3n/4= 75; Primera Ni > 3 n/4 = 85; luego Q3 = 4.
24 Viviana García Mir (PhD)
Ejemplos
El 5% de los recién nacidos tiene un peso demasiado bajo.
¿Qué peso se considera “demasiado bajo”?
• Percentil 5 o cuantil 0,05
Percentil 5 del peso
25
20
frecuencia

15
10
5
0

1 2 3 4 5

Peso al nacer (Kg) de 100 niños


Ejemplos
El colesterol se distribuye simétricamente en la población. Supongamos
que se consideran patológicos los valores extremos. El 90% de los
individuos son normales ¿Entre qué valores se encuentran los individuos
normales?
Percentiles 5 y 95
20
15
frecuencia

10
5
0

180 200 220 240 260

Colesterol en 100 personas


Ejemplo
Estadísticos

Número de años de escolarización


N Válidos 1508
Perdidos 0
Número de años de escolarización
Media 12,90
Porcentaje Mediana 12,00
Moda 12
Frecuencia Porcentaje acumulado
Percentiles 10 9,00
3 5 ,3 ,3
20 11,00
4 5 ,3 ,7 25 12,00
5 6 ,4 1,1 30 12,00
6 12 ,8 1,9 40 12,00
50 12,00
7 25 1,7 3,5
60 13,00
8 68 4,5 8,0 70 14,00
9 56 3,7 11,7 75 15,00
10 73 4,8 16,6 80 16,00
11 85 5,6 22,2 ≥20%? 90 16,00

12 461 30,6 52,8


13 130 8,6 61,4
14 175 11,6 73,0
15 73 4,8 77,9
16 194 12,9 90,7 ≥ 90%?
17 43 2,9 93,6
18 45 3,0 96,6
19 22 1,5 98,0
20 30 2,0 100,0
Total 1508 100,0
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los datos,
independientemente de su causa.

❖ Amplitud o Rango (‘range’):


Diferencia entre observaciones extremas.
▪ 2,1,4,3,8,4. El rango es 8-1=7

Propiedades del rango


❖ Es fácil de calcular
❖ Sus unidades son las mismas que las de la variable.
❖ No utiliza todas las observaciones (solo dos de ellas);
❖ Se puede ver muy afectada por alguna observación extrema;
❖ El rango aumenta con el número de observaciones, o bien se
queda igual. En cualquier caso nunca disminuye.
Estadísticos de Dispersión
❖ Varianza S2: Mide el promedio de las desviaciones
(al cuadrado) de las observaciones con respecto a la
media.

1
S =  ( xi − x ) 2
2

n i

Es sensible a valores extremos (alejados de la media).


Sus unidades son el cuadrado de las de la variable
Esta medida es siempre una cantidad positiva
Estadísticos de Dispersión
Desviación típica: Es la raíz cuadrada de la
varianza
❖ Tiene las misma dimensionalidad (unidades) que la
variable. Versión ‘estética’ de la varianza.

❖ Cierta distribución que veremos más adelante


(normal o gaussiana) quedará completamente
determinada por la media y la desviación típica. A
una distancia de dos desv. típica de la media las
tendremos casi todas.

S= S 2
Dispersión en distribuciones
‘normales’

0.05
0.05

0.04
0.04

0.03
0.03

0.02
0.02

0.01
x 2s
0.01

x s
95 %
68.5 %

0.00
0.00

150 160 170 180 190


150 160 170 180 190

❖Centrado en la media y a una desv. típica de distancia hay


aproximadamente el 68% de las observaciones.
❖A dos desviaciones típicas tenemos el 95% (aprox.)
Cálculo de medidas de
dispersión
Coeficiente de varebilidad
Es la razón entre la desviación típica y la media.
▪ Mide la desviación típica en forma de
S
CV =
“qué tamaño tiene con respecto a la media”

▪ También se la denomina variabilidad relativa.


x
▪ Es frecuente mostrarla en porcentajes

❖ Es una cantidad adimensional. Interesante para comparar


la variabilidad de diferentes variables.

❖ No debe usarse cuando la variable presenta valores


negativos o donde el valor 0 sea una cantidad fijada
arbitrariamente
Asimetría o Sesgo
Una distribución es simétrica si la mitad izquierda de su
distribución es la imagen especular de su mitad
derecha.

❖ En las distribuciones simétricas, media y mediana


coinciden. Si sólo hay una moda también coincide

❖ La asimetría es positiva o negativa en función de a qué


lado se encuentra la cola de la distribución.

❖ La media tiende a desplazarse hacia las valores


extremos (colas).
Asimetría o Sesgo
Apuntamiento o curtosis

La curtosis nos indica el grado de apuntamiento


(aplastamiento) de una distribución con respecto a la
distribución normal o gaussiana. Es adimensional.

Platicúrtica: curtosis < 0

Mesocúrtica: curtosis = 0

Leptocúrtica: curtosis > 0


Apuntamiento o curtosis

Leptocúrtica: curtosis > 0


Los gráficos poseen la misma
Mesocúrtica: curtosis = 0 media y desviación típica, pero con
diferente grado de apuntamiento.
Platicúrtica: curtosis < 0

400 300 160

140
300

200
120

200
100

100
80
100
Frecuencia

Frecuencia 60

0 0
3 27 37 47 57 67 77 87 97 108 27 37 45 53 61 69 77 85 93 40
16 32 42 52 62 72 82 92 102 138 32 41 49 57 65 73 81 89 99 45 48 51 54 57 60 63 66 69 72 75 78 81 84

Leptocúrtica Mesocúrtica Platicúrtica


Ejemplo
50

40

30
% retenido

− 20
d
10

0
0.0 0.2 0.4 0.6 0.8 1.0

Diámetro medio de apertura del tamiz (mm)


d Coeficiente Coeficiente
Análisis p
(mm) de curtosis de asimetría
granulométrico
0.19 0.07 -0.640.17 1.060.01
¿Qué hemos visto?

Medidas descriptivas
▪ Medidas de centralización: Media,
mediana y moda
▪ Posición (cuartiles, percentiles,...)
▪ Medidas de dispersión (varianza,
desviación estándar, CV, rango
▪ Asimetría y Medidas de apuntamiento
(curtosis)
Trabajo autónomo

A continuación se reportan las dimensiones (en mm) de 10


jabones de un lote producido en una industria.

a) Determine el rango o recorrido para los datos


b) Calcule: media, mediana, moda, s, s2, CV.

19.5 19.8 18.9 20.4 20.2 21.5 19.5 21.7 19.5 20.9

41 Viviana García Mir (PhD)

Vous aimerez peut-être aussi