Vous êtes sur la page 1sur 27

Módulos

 I. Introducción a la Bioestadística. Método científico


 II. Estadística descriptiva univariante y bivariante
 III. Teoría de la Probabilidad. Variable aleatoria y
modelos de distribución de probabilidad
 IV. Introducción estadística inferencial: Estimación
por intervalo. Contraste de hipótesis
 V. Contrastes de hipótesis: Variables cuantitativas.
Comparación de medias
 VI. Contrastes de hipótesis: Variables categóricas.
Comparación de proporciones. Distribución ji-
cuadrado. Independencia
1
 Tema III. Teoría de la Probabilidad. Variable
aleatoria y modelos de distribución de
probabilidad

2
Probabilidad y variable aleatoria

 Cuando los resultados de un experimento aleatorio son numéricos


se dice que dan lugar a una variable aleatoria (v.a.) pues sus
resultados varían al azar
 Los diferente resultados de las v.a. siempre están afectados de
probabilidades de ocurrencia
 El conjunto de todos los posible resultados y su probabilidad de
ocurrencia constituyen la distribución de probabilidad de esa v.a.

 2 tipos de v.a.
 Discretas aquellas que solo toman valores aislados. Entre 2 valores
cualesquiera no siempre existe otro valor posible
 Continuas al menos en teoría, entre 2 valores cualesquiera siempre hay otro
valor posible

3
Probabilidad y variable aleatoria
V.a. discreta
 Nº caras en el lanzamiento de 2 monedas; nº varones en una familia con 3 hijos
x p
0 0,25
1 0,5
2 0,25

 La función de probabilidad de la v.a. muestra los posibles resultados y la probabilidad


con la que ocurren, se nota como f(x)
f(x)

4
Distribuciones de Probabilidad Teóricas v.a.
Continua
NORMAL

 Es la distribución más importante en el proceso de inferencia


estadística
 Numerosas variables de interés biosanitario siguen
aproximadamente una distribución Normal (ej. estatura, edad,
tensión arterial, ácido úrico)
 Determinada por dos parámetros: Media (µ) y Desviación Estándar
(σ)

5
Población y muestra
 Los estimadores se calculan en la muestra y varían de muestra en
muestra
 El parámetro se calcula en la población y es un valor constante
 Los estimadores se nominan con letras latinas y los parámetros con
letras griegas
 La frecuencia de ocurrencia de las observaciones en la muestra se
representa mediante una distribución de frecuencias y si en la
población, por una distribución de probabilidad
Ejemplos

Muestra

6
Distribuciones de probabilidad teóricas
Variable continua

 Si representamos en un histograma los resultados de medir en un


conjunto de individuos (N), una variable continua como el peso
 Conforme obtenemos más datos el histograma contiene cada vez más categorías
que son cada vez más estrechas…
 hasta que con un nº suficientemente grande de individuos, el contorno del
histograma se suaviza dando lugar a una curva (sin saltos)

7
Distribuciones de probabilidad teórica Normal

 La curva derecha correspondería a la distribución de probabilidad


teórica que se conoce como Normal o campana de Gauss
 Tiene forma de campana, es simétrica, mesocúrtica, y media, mediana
y moda coinciden
 En el eje de abcisas están los valores posibles de la variable, mientras
que el eje vertical puede interpretarse como la frecuencia de
ocurrencia
 Aunque la probabilidad de que suceda un cierto valor individual en una variable
continua es teóricamente 0
Siempre se calcula la probabilidad para un rango o intervalo de
valores
8
Distribuciones de probabilidad teórica Normal
 Variable aleatoria (V.a): continua
 Rango de valores: (-∞, +∞)
 Función de densidad o f(x): expresión matemática que permite
reproducir esta distribución teórica de probabilidad; equivalente a función de
probabilidad en variables discretas

 Siendo e la base de logaritmos naturales o neperianos (equivalente a


2,7183), п el número pi (equivalente a 3,1416), µ la media y σ la
desviación típica
 Los parámetros de la v.a. que sigue una distribución normal son:
µ (mu) como media y σ (sigma) como desviación típica
 Se indica x-> N(µ, σ) esto es la variable aleatoria “x” sigue una
distribución normal con parámetros µ y σ

9
Probabilidad y variable aleatoria
V.a. continua

 Peso de la población de Huesca

f(x)

 La función de densidad en la v.a. continua equivale a la función de


probabilidad en la v.a. discreta

10
Distribuciones de probabilidad teórica Normal

 x-> N(µ, σ)
 Tenemos tantas distribuciones normales como combinaciones de µ y σ
 La media sitúa la distribución en el eje de abcisas
 La desviación típica determina su forma dependiendo de la dispersión
de las observaciones; geométricamente distancia desde el eje de
simetría hasta el punto de inflexión de la curva

Las 2 primeras distribuciones normales tienen igual media pero distinta desviación
típica, una de ellas es más aplanada que la otra porque tiene mayor dispersión
La 3ª tiene distinta media pero igual DT que una de las anteriores (es la misma
curva, algo desplazada a la dcha)
11
Distribuciones de probabilidad teórica Normal

Distinta media

Distinta desviación típica

12
Distribuciones de probabilidad teórica Normal
Características
 Tiene forma de campana
 Es simétrica (asimetría=0) y mesocúrtica (curtosis=0) esto es, ni muy plana
ni muy apuntada
 Media, mediana y moda son el mismo valor
 Tener aproximadamente
 el 68% central de sus valores entre media ± 1 DT (µ ± σ)
 el 95% central de sus valores entre media ± 2 DT (µ ± 2σ)
 y casi el 100% entre la media ± 3 DT (µ ± 3σ)

13
Distribuciones de probabilidad teórica Normal
Interés
1. Numerosas variables biosanitarias siguen un patrón de variación
que puede ser aproximado por la distribución normal como peso,
talla, frecuencia cardiaca, colesterol en sangre, PAS etc
Son variables que dependen de muchos factores cada una con pesos
pequeños actuando de forma independiente
Por eso son mas frecuentes los valores centrales y más raros los
extremos.
Si pensamos en cada factor como un dado, la mayor parte de las veces
unos dan valores altos, otros bajos y muchos intermedios.
Rara vez, salen todos bajos o todos altos.

14
Distribuciones de probabilidad teórica Normal
Interés

1. Numerosas variables biosanitarias siguen un patrón de variación que


puede ser aproximado por la distribución normal

2. Es la distribución que siguen los estimadores o estadísticos que se calculan


en la muestras (ej media) que se extraen de una población, siempre que
estás tengan un tamaño suficiente (n≥30)

3. Otras distribuciones de probabilidad para variables discretas (ej binomial,


poisson) pueden ser aproximadas por la normal si se dan ciertas
condiciones

15
Distribuciones de probabilidad teórica Normal
 Siempre se calcula la probabilidad para un rango o intervalo de
valores, no para un valor individual
¿Cómo calcular probabilidades? O cómo determinar el área debajo de la
curva?
Integrando la función
Su integral entre los límites del intervalo de valores en que está
definida (-∞, +∞) es 1, equivalente el área debajo de la curva

 Podemos obviar la necesidad de integrar, tipificando o estandarizando


los valores de cualquier variable que sigue una distribución N(µ ± σ) “xi” en
un “zi” de la normal tipificada N(0,1) según el siguiente cálculo:

 Para esta distribución normal tipificada N(0, 1) existen tablas que


permiten estimar la probabilidad acumulada hasta un punto, desde un
punto o entre 2 puntos de forma sencilla

16
Distribuciones de probabilidad teórica Normal

 Este valor “z” o z-score (en inglés) representa la DISTANCIA de cualquier xi


a su media µ medido en desviaciones típicas σ
 Es decir si dos valores “xi” de dos distribuciones normales con distinta µ y σ,
tienen el mismo “z” (ej. 2), implica que se encuentran a la misma distancia de su
media en nº de desviaciones típicas
 Es decir en ambos casos el valor “xi” se encuentra a 2 desviaciones típicas de su
media
 Los valores z son positivos si xi>µ, negativos si xi<µ y 0 si xi=µ
Distribución Normal Tipificada N (0,1)
 Para pasar de “z” a “xi” , despeja obteniendo:
x= µ + zσ
σ=1

17
Tabla de probabilidad acumulada para la distribución
Normal tipificada N(0,1)
 El area en verde es la probabilidad de que el zcalculado ≤ ztabla
 Ejemplo->para encontrar la probabilidad de zcalculado ≤0,50
 busca 0,5 en primera columna y 0,00 en primera fila, la intersección te da la probabilidad de
que z sea ≤ 0,5, esto es 0,6915 o lo que es igual el 69,15% de los z son inferiores a 0,5

18
Problemas para una v.a. continua N(µ,σ)
 Ejemplo. La altura (cm) de los varones de una determinada ciudad sigue
una distribución Normal (175, 10).
 Calcula la probabilidad de que la altura de un varón elegido al azar sea menor o
igual a 188.5 cm

Pr (z ≤ 1,35)= Pr (x ≤ 188,5) = 0,9115


 Un 91,15% de esa población tendrá una altura ≤ 188,5 o la probabilidad de que
elegido un varón al azar sea ≤ 188,5 es de 0,9115

19
Problemas para una v.a. continua N(µ,σ)
 Ejemplo. La altura de los varones de una determinada ciudad sigue una
distribución Normal (175, 10).
 Calcula la probabilidad de que la altura de un varón elegido al azar sea mayor o igual a 192
cm

Pr (z ≥1,70)= 1- Pr (z ≤ 1,70)=1- 0,9554=0,0446


 Un 4,46% de esa población tendrá una altura ≥ 192 o la probabilidad de que elegido
un varón al azar sea ≥ 192 fue de 0,0446

20
Problemas para una v.a. continua N(µ,σ)
 Ejemplo. La altura de los varones de una determinada ciudad sigue una
distribución Normal (175, 10).
 Calcula la probabilidad de que la altura de un varón elegido al azar sea mayor o igual a 165
cm

Pr (z ≥-1,00)= Pr (z ≤ +1,00)=0,8413
 En la tabla sólo aparecen valores positivos de z…entonces?
 Teniendo en cuenta la simetría de la curva la Pr(z ≥-1,00)=Pr (z ≤ +1,00)

 Un 84,13% de esa población tendrá una altura ≥ 165 o la probabilidad de que elegido
un varón al azar sea ≥ 165 fue de 0,8413

21
Problemas para una v.a. continua N(µ,σ)
 Ejemplo. La altura de los varones de una determinada ciudad sigue una
distribución Normal (175, 10).
 Calcula la probabilidad de que la altura de un varón elegido al azar mida entre 165 y 188.5

Pr (-1,00 ≤ z ≤ 1,35 )= Pr (z ≤ +1,35) - Pr (z ≤ -1,00) = Pr (z ≤ 1,35) - (1 -Pr (z ≤ 1,00)= 0,9115 -


(1-0,8413)= 0,9115 - 0,1587= 0,7528

//El área que deja z=1 por encima es igual a la que deja z=-1 por debajo//

 La probabilidad de que la altura de un varón elegido al azar esté entre 165 y


188.5 cm es 0.7528

22
Tabla probabilidad acumulada para la normal tipificada
N(0,1)
 Ejemplo. La altura de los varones de una determinada ciudad sigue una
distribución Normal (175, 10).
 Calcula el percentil 95 (P95) de la variable altura
 El P95 de la variable altura sabiendo que sigue una distribución N(175, 10) es
aquel valor de la altura (x) que deja al 95% de los valores por debajo;
equivalente a calcular el z que deja por debajo una probabilidad de 0,95
 Según la tabla de la normal tipificada, ese valor es aproximadamente 1,645,
entonces…
 x= µ + zσ= 175 +1,645*10 =175+16,45 = 191,45 cm

23
Problemas para una v.a. continua N(µ,σ)
 Ejemplo. La altura de los varones de una determinada ciudad sigue una
distribución Normal (175, 10)
 Calcula el percentil 95 (P95) de la variable altura
 El P95 de la variable altura sabiendo que sigue una distribución N(175, 10) es
aquel valor de la altura (x) que deja al 95% de los valores por debajo;
equivalente a calcular el z que deja por debajo una probabilidad de 0,95
 Según la tabla de la normal tipificada, ese valor es aproximadamente 1,645,
entonces…
 x= µ + zσ= 175 +1,645*10 =175+16,45 = 191,45 cm

24
Problemas con v.a. que siguen una distribución Normal
 Ejemplo. Entre los diabéticos, el nivel de glucosa en sangre en ayunas,
puede suponerse de distribución aproximadamente Normal con parámetros
(µ= 130 mg/dl , σ= 10 mg/dl).
 Calcula la probabilidad de que un individuo diabético elegido al azar
tenga un nivel de glucosa en sangre
 Menor de 120 mg/100ml
 Mayor de 140 mg/100ml
 Entre 140 y 150 mg/100ml
 Calcula el valor de glucosa que constituye el P2,5

25
Problemas con v.a. que siguen una distribución Normal
 Ejemplo. La cantidad de colesterol en sangre se distribuye Normal con µ=
200 mg/dl y σ= 20 mg/dl.

 Calcula la probabilidad de que un individuo elegido al azar tenga una


cantidad de colesterol:
 Mayor de 180 mg/dl
 Entre 190 y 200 mg/dl
 Calcula el valor de colesterol que deja por encima al 15% de los individuos.
Ese valor es un percentil de la distribución ¿Cuál?

26
¿Qué sucede cuando una variable continua no sigue
una distribución normal?
 Cuando nuestros datos presentan como en este caso asimetría
positiva podemos aplicar una transformación matemática como
tomar logaritmos
 Ln(x) tiene el efecto de mejorar la simetría de la distribución de los
datos

27

Vous aimerez peut-être aussi