Académique Documents
Professionnel Documents
Culture Documents
VARIABLES ALEATORIAS
Y SUS DISTRIBUCIONES
1 2
1 2
3 4
3 4
1
VARIABLES ALEATORIAS VARIABLES ALEATORIAS
Considere que lanzamos dos dados
Experimentos estadísticos clásicos: y sumamos los números mostrados.
tirar los dados o El conjunto de todos los resultados
lanzar una moneda o posibles sería {2, 3, …., 11, 12}
sacar cartas al azar de una baraja o
A este conjunto se le llama el dominio
etc. del experimento
El dominio de una variable se define
simplemente como el conjunto de todos los
valores posibles que puede asumir la variable
5 6
5 6
7 8
2
PROBABILIDAD PROBABILIDAD
DESCRIPCION CUANTITATIVA DEL
CHANCE QUE OCURRA UN EVENTO
PARTICULAR. UNA PROBABILIDAD IGUAL A CERO
INDICA QUE EL EVENTO NUNCA
OCURRIRA
La probabilidad se expresa en una
escala de 0 a 1: Un evento raro tiene UNA PROBABILIDAD IGUAL A UNO
una probabilidad cercana a 0, mientras INDICA QUE EL EVENTO SIEMPRE
OCURRIRA
que un evento muy común tiene una
probabilidad cercana a 1.
9 10
9 10
PROBABILIDAD PROBABILIDAD
EN ALGUNOS EXPERIMENTOS, TODOS LOS RESULTADOS Los ejemplos anteriores ilustran el modelo de
SON IGUALMENTE PROBABLES resultados igualmente probables.
Ejemplos
En este modelo, la probabilidad P(E) que ocurra un
Al sacar el ganador de una lotería, todas las boletas de la evento E se define como:
lotería tienen la misma probabilidad de ganar.
número de resultados que satisfacen
Al tirar un dado, el número en cada una de las seis caras la condición del evento E
tiene la misma probabilidad de salir P(E) =
número total de resultados posibles
Al lanzar una moneda, existe la misma probabilidad que
caiga “cara” o que caiga “sello”.
11 12
11 12
3
PROBABILIDAD VARIABLES ALEATORIAS
Ejemplos
Todas las mediciones, incluyendo las
La probabilidad de sacar una carta de “picas” de un juego que se hacen con un instrumento
de cartas bien barajadas es 13/52 = ¼ = 0.25
químico, también son variables
evento: ‘sacar una pica' aleatorias, con un dominio asociado.
Naturalmente, el dominio de
estas mediciones será todos los
Cuando se lanza una moneda, cada resultado ‘cara' o ‘sello' posibles valores que pueden ser
tiene la misma probabilidad, ½ = 0.5
asumidos por el instrumento de
medida.
13 14
13 14
15 16
4
VARIABLES ALEATORIAS VARIABLES ALEATORIAS
En ciencia, las variables aleatorias Una variable aleatoria discreta solo
son numéricas o ´cuantitativas´, en puede asumir ciertos valores dentro
contraste con resultados de un dominio.
´cualitativos´ como “cara” y “sello”
Por el contrario, una variable aleatoria
Hay dos tipos de variables continua puede teóricamente asumir
aleatorias cuantitativas: discretas cualquier valor del dominio.
y continuas.
17 18
17 18
Variables Aleatorias
VARIABLES ALEATORIAS DISCRETAS
Discretas vs. Continuas
Si consideramos el eje cartesiano de los números reales, Aquellas que están restringidas a asumir
una variable discreta puede solamente asumir ciertos solo ciertos valores del intervalo
valores de la línea (por ejemplo, los números enteros) considerado.
mientras que una variable continua puede asumir
cualquier valor sobre la recta que representa el eje.
El número de las variables discretas puede
ser finito o infinito.
19 20
5
Variables aleatorias DISCRETAS VARIABLES ALEATORIAS DISCRETAS
21 22
Aquellas que pueden teóricamente Las mediciones que resultan del uso de
asumir cualquier valor del dominio. un instrumento son variables aleatorias
continuas cuyo dominio son todos los
Naturalmente, este conjunto de
valores posibles que podrían ser
posibles valores nunca es contable.
asumidos por el instrumento de
medida.
Las variables aleatorias continuas Ejemplos:
son usualmente el resultado de La masa de una muestra
mediciones. La concentración de plomo en una muestra de
sangre
23
El tiempo requerido para correr un kilómetro 24
23 24
6
NOTA FINAL SOBRE LAS VARIABLES LAS MEDICIONES COMO VARIABLES
ALEATORIAS CONTINUAS ALEATORIAS CONTINUAS
Aunque la distinción entre variables Las mediciones no son variables
aleatorias continuas y discretas es aleatorias verdaderamente continuas…
importante por la manera como
usamos la probabilidad para describir La razón es que cualquier instrumento
sus posibles resultados, estrictamente
de medida tiene un límite en el número
hablando cuando se trata de
de posibles resultados
mediciones reales no existe tal cosa
como una variable aleatoria
verdaderamente continua…
25 26
25 26
27 28
7
DISTRIBUCIONES DE DISTRIBUCIONES DE PROBABILIDAD
PROBABILIDAD
Por ejemplo, si deseamos medir la estatura de todos los
estudiantes de la Universidad del Valle usando una cinta
Aunque el dominio contiene todos de 10 m, entonces el dominio consistirá en todas las
los posibles resultados de un lecturas posibles de la cinta desde 0 a 10 m. Sin
embargo, aunque mediciones como 20 cm o 6 m están
experimento, hasta ahora no contenidas en el dominio, la probabilidad de obtener
estos valores es muy muy pequeña…
hemos dicho nada sobre cuales de
estos son los resultados mas
probables del experimento …
29 30
29 30
31 32
8
DISTRIBUCIONES DE PROBABILIDAD DISTRIBUCIONES DE PROBABILIDAD
PARA VARIABLES DISCRETAS PARA VARIABLES DISCRETAS
Resultado Variable aleatoria (x) Resultado Variable aleatoria (x)
CC 2 CC 2
CS 1 CS 1
SC 1 SC 1
Hemos
descrito la
SS 0 SS 0
distribución
P(x=2)=0.25 de
Cada uno de estos probabilidad
resultados es P(x=1)=0. 5 de cada
igualmente probable
P(x=0)=0.25 resultado
posible de
nuestro
P(x=xo) es la probabilidad que la variable aleatoria x asuma el valor xo
experimento
33 34
33 34
35 36
9
EJEMPLOS DE DISTRIBUCIONES DISCRETAS La Distribución Binomial
La Distribución Binomial Un experimento de Bernoulli tiene las siguientes
propiedades:
Muchos experimentos en ciencias son del 1. Cada experimento consiste de un número de pruebas
tipo “cara-o-sello”. Este tipo de idénticas (cara-o-sello). La variable aleatoria x es el
número total de pruebas “exitosas” después que se
experimento se conoce como binomial o completen todas ellas.
de Bernoulli 2. Cada prueba solo tiene 2 resultados posibles, “éxito” o
“fracaso”. La probabilidad de éxito es p y la
probabilidad de fracaso es q. Naturalmente, p+q=1.
37 38
La Distribución Binomial
Ejemplo de Distribución Binomial
La distribución de probabilidad para cualquier
experimento de Bernoulli está dada por la siguiente
función p(x):
𝑛!
𝑝 𝑥 = 𝑝 𝑥 𝑞 𝑛−𝑥
𝑥! 𝑛 − 𝑥 !
Supongamos que
n = 30 ratones y p=0.15 (la probabilidad para un
tratamiento exitoso con la droga)
Gráfica de la distribución binomial de probabilidad con n=30 y p=0.15.
39 40
39 40
10
The Galton Board
La máquina de Galton, o caja de galton, es un dispositivo
inventado por Francis Galton para demostrar el teorema del
Jakob Bernoulli (Basilea, 27 de límite central, en particular que la distribución binomial es una
aproximación a la distribución normal.
diciembre de 1654 - ibíd. 16 de
La máquina consta de un tablero vertical con varias filas de
agosto de 1705), también conocido clavos. Las bolillas caen desde la parte superior, botando
como Jacob, Jacques o James aleatoriamente y van depositándose, a medida que caen, en los
Bernoulli, fue un destacado casilleros de la parte inferior. Formando una superficie de
matemático y científico suizo; sus campana.
contribuciones a la geometría Las x bolillas chocarán con el primer clavo teniendo una
analítica, a la teoría de probabilidad de 1/2 de ir a la izquierda o hacia la derecha y, a
probabilidades y al cálculo de medida que continúan va teniendo más caminos a donde ir, es
decir, más posibilidades para que las bolitas se desvíen. A lo largo
variaciones fueron de
de esta estructura, las bolitas toman caminos aleatorios hasta
extraordinaria importancia. caer en alguno de los canales colocados en la base. Al final,
tendrán mayores probabilidades los canales interiores que los
exteriores, formándose una distribución de probabilidades
conocida como distribución binomial.
https://es.wikipedia.org/wiki/Maquina_de_Galton
https://www.youtube.com/watch?v=9xUBhhM4vbM
41 42
41 42
43 44
43 44
11
La Distribución de Poisson La Distribución de Poisson
Supongamos que estamos contando las partículas
alfa emitidas por una muestra de isótopo
radioactivo a una rata de 2.5 partículas/segundo.
La variable aleatoria en cualquiera de estos
Nuestro experiment mide el “conteo detectado en
experimentos es un número entero positivo, el
un segundo” y el dominio corresponde a todos los
número del “conteo” .
enteros positivos (y cero).
A menudo, esta variable aleatoria discreta sigue
la distribución de Poisson.
45 46
45 46
47 48
47 48
12
La Distribución de Poisson Otras aplicaciones de la distribución de Poisson
La distribución de Poisson es útil para describir una gran variedad
de procesos que involucran conteo :
▪ El número de autos que pasan a través de un cierto punto en
una ruta (suficientemente distantes de los semáforos) durante
un periodo definido de tiempo.
▪ El número de errores de ortografía que uno comete al escribir
una página.
▪ El número de llamadas telefónicas en una central telefónica por
minuto.
▪ El número de servidores web accedidos por minuto.
▪ El número de defectos en una longitud específica de una cinta
magnética.
▪ El número de mutaciones de determinada cadena de ADN
La Figura muestra las probabilidades de medir hasta 10 después de cierta cantidad de radiación.
conteos durante un período de este experimento. ▪ El número de defectos por metro cuadrado de tela.
▪ El número de estrellas en un determinado volumen de espacio.
49 50
49 50
La Distribución de Poisson
51 52
13
Fundamental en química:
La Distribución de Boltzmann La Distribución de Boltzmann
Generalmente, la energía de una molécula se están
Aquellas que
Las distribuciones de probabilidad son vitales para considera dividida en energías electrónica, vibracional
restringidas a asumir
entender la naturaleza de la materia a un nivel más y rotacional. solo ciertos valores del
fundamental. Como recordará de Química I-Q, laintervalo
energía de una
considerado.
La razón es que, cuando se miran a nivel atómico, molecula está cuantizada.
muchas propiedades de un sistema son variables Esto quiere decir, que la energía de una molécula es
aleatorias. una variable leatoria discreta.
Existe una “incertidumbre” en la materia y la energía
La naturaleza aleatoria de la energía no se debe a
que solo es aparente en pequeña escala; esta
algún error en el proceso de medición, es una
naturaleza del universo se puede predecir mediante la
propiedad innata de la materia.
mecánica cuántica.
Puesto que la energía molecular es una variable
Esto significa que, para describir tal sistema, debemos
aleatoria, deberá ser descrita mediante una
recurrir al lenguaje de las probabilidades (y a las
distribución de probabilidad.
distribuciones de probabilidad).
53 54
53 54
55 56
55 56
14
La Distribución de Boltzmann La Distribución de Boltzmann
La distribución de Boltzmann proporciona la
probabilidad de distribución de la energía de una
Observe que, a sola molécula en un momento dado.
mayores
temperaturas, hay • Por ejemplo, si medimos la energía vibracional
una probabilidad de una molécula de I2 a 298 K, de acuerdo a la
mayor que una distribución de Boltzmann hay un 64.5% de
probabilidad que la molécula se encuentre en
molécula esté en un el nivel fundamental vibracional (ν = 0).
nivel energético • En otro momento (digamos, 10 segundos
más alto. después) medimos de nuevo la energía y hay
un 22.9% de probabilidad que la molécula
Distribución de probabilidad para la energía vibracional de una haya absorbido energía calórica y esté ahora
en el primer nivel vibracional (ν = 1). Por
molécula de I2 a dos temperaturas diferentes. La energía real de
supuesto, todavía hay una probabilidad del
cada nivel está dada por Eν = (ν + 1/2 ) · 214.6 cm−1, donde ν es 64.5% que la molécula esté en su estado
el número cuántico vibracional. fundamental.
57 58
57 58
59 60
15
2 Características Importantes
2 Características Importantes
de las Variables Aleatorias 2
de las Variables Aleatorias 2
➢ Localización: la tendencia central de la
variable, que describe un valor
Propiedades mediante las cuales alrededor del cual la variable tiende a
podemos caracterizar las variables agruparse, y
aleatorias tanto discretas como ➢ Dispersión: el rango típico de valores
continuas : localización y dispersión. dentro del cual se esperaría que se
observaran los resultados del
eperimento. Da una idea del despliegue
de valores de los resultados de un
61 experimento. 62
61 62
63 64
63 64
16
Tendencia Central de una Variable Aleatoria
Tendencia Central de una Variable Aleatoria
Modo
Modo Hay distribuciones multi-
modales, es decir, que tienen más
El modo es el valor más probable de una de un modo ― distribuciones con
variable discreta. dos modos son bimodales, etc.
Más generalmente, es la localización del
máximo de la función de distribución de Aunque las distribuciones multimodales
probabilidad: el valor de xmodo tal que pueden tener varios máximos locales,
usualmente hay un máximo global único que es
p(xmodo) = Pmax el valor más probable de la variable aleatoria.
65 66
65 66
Tendencia Central de una Variable Aleatoria Tendencia Central de una Variable Aleatoria
Mediana
Modo El concepto de mediana es solo un poco más
complicado que el de modo:
es el valor Q2 tal que
67 68
17
Tendencia Central de una Variable Aleatoria Tendencia Central de una Variable Aleatoria
CUARTILES?
Mediana Una distribución se puede dividir en cuatro
“pedazos” iguales (en probabilidad), tal que :
La mediana es el segundo cuartil ̶ de allí el P(x < Q1) = P(Q1 < x <Q2) = P(Q2 < x <Q3) = P(x > Q3)
origen del símbolo Q2 (quartile).
Los límites Q1, Q2 (i.e., la mediana) y Q3 son los
cuartiles de la distribución de probabilidad.
69 70
69 70
Tendencia Central de una Variable Aleatoria Tendencia Central de una Variable Aleatoria
71 72
18
Tendencia Central de una Variable Aleatoria Tendencia Central de una Variable Aleatoria
La media
La media (o promedio) La media o valor “esperado”, E(x), de una
La media de una variable aleatroria discreta variable aleatoria se define de la manera siguiente.
es simplemente una media ponderada, con Para una variable discreta:
probabilidades como factores de
𝐸 𝑥 = 𝜇𝑥 = 𝑥𝑖 𝑝(𝑥𝑖 )
ponderación.
mientras para variable continua:
Esto significa que los valores más probables +∞
tienen mayor “influencia” (“peso”) en la 𝐸 𝑥 = 𝜇𝑥 = න 𝑥 𝑝(𝑥) 𝑑𝑥
determinación de la media; por esta razón, −∞
la media es un buen indicador de la donde p(x) es una función matemática que define
tendencia central. la distribución de probabilidad de la variable x.
73 74
73 74
75 76
19
Tendencia Central de una Variable Aleatoria Tendencia Central de una Variable Aleatoria
77 78
79 80
20
Dispersión de una Variable Aleatoria Dispersión de una Variable Aleatoria
81 82
83 84
21
Dispersión de una Variable Aleatoria
Desviación
Rango Semi-Intercuartil, QR
Diferencia entre el resultado de
QR es probablemente la medida de una medición y un valor
dispersión más utilizada; es simplemente tomado como referencia
la mitad del rango intercuartil.
85 86
85 86
𝑀𝐷 = න 𝑥 − 𝜇𝑥 𝑝(𝑥) 𝑑𝑥
−∞
87 88
87 88
22
Dispersión de una Variable Aleatoria Dispersión de una Variable Aleatoria
89 90
89 90
91 92
23
Dispersión de una Variable Aleatoria Dispersión de una Variable Aleatoria
La varianza y la desviación standard Comparación de Medidas de Dispersión
La Desviación Standard Relativa, RSD, es otra Hemos descrito 3 maneras de medir la dispersión
manera de presentar la desviación standard de una variable aleatoria:
QR, rango de semi-intercuartil,
MD, desviación absoluta media, y
σ, desviación standard
La RSD puede expresarse como una fracción o
como un percentaje. Por varias razones (fuera del alcance de este
A la RSD se le conoce también como el coeficiente curso), la varianza y la desviación standard
de variación (CV). son las mejores medidas de la dispersión de
una variable aleatoria.
93 94
93 94
95 96
24
Distribuciones de Variables Aleatorias Continuas Distribuciones de Variables Aleatorias Continuas
La función p(x) recibe el nombre
Para especificar las probabilidades de una de función de densidad de
variable aleatoria continua calculamos la probabilidad de la variable
probabilidad de que el resultado esté dentro aleatoria continua x.
97 98
97 98
99 100
99 100
25
Distribuciones de Variables Aleatorias Continuas
Distribuciones Normales
La diferencia radica en que las probabilidades de las (Gaussianas) de Probability
variables continuas se definen en términos de
rangos de valores en vez de un simple valor. La distribución de probabilidad más común
en las ciencias es la distribución Gaussiana.
De esta manera, la integración de la función de En muchísimas situaciones, se asume que
densidad de probabilidad , p(x), sobre un rango de las variable aleatorias continuas siguen esta
valores se usa para calcular dichas probabilidades. distribución; de hecho, es tan común que
uno se refiere a ella simplemente como la
Esto hace que las distribuciones de probabilidad distribución “normal” de probabilidad.
sean un poco más complicadas para las variables
continuas que para las variables discretas.
101 102
101 102
UNO ASUME QUE DETERMINACIONES REPETIDAS DE UN ANALITO HAY MUCHOS FENOMENOS NATURALES QUE PARECEN
SIGUEN UNA DISTRIBUCION NORMAL COMPARTIR ESTA MISMA DISTRIBUCION
103 104
103 104
26
La Distribución Normal Distribuciones Normales (Gaussianas) de Probabilidad
105 106
105 106
Ejemplo
107 108
27
Distribuciones Normales (Gaussianas) de Probabilidad Distribuciones Normales (Gaussianas) de Probabilidad
Solución
La velocidad del carro es una variable aleatoria normal-
mente distribuidad con μx = 60 mph y σx = 3 mph.
Necesitamos calcular la probabilidad que x sea mayor que
65 mph, que es el área sombreada bajo la curva en la figura:
109 110
109 110
111 112
111 112
28
La Distribución Normal Standard
La Distribución Normal Standard
113 114
115 116
29
La Distribución Normal Standard La Distribución Normal Standard
Podemos tomar cualquier Distribución El valor z de una variable x es su desviación
Normal y convertirla en Distribución respecto de la media μx en unidades
Normal Standard deviaciones standard σx
Ejmmplo:
Un experimento está descrito mediante una
distribución normal con μx = 25.0 y σx = 2.0.
Una medición produce x0 = 26.4; cual es el z-
score de esta medición?
Este proceso de cambio de variable es lo
que se llama “estandarizar"
117 118
117 118
𝑥 − 𝜇𝑥
Esto significa que la medición está a +0.7σ de 𝑧=
la media. 𝜎𝑥
Cero punto siete
sigmas de la media VALOR
ESTANDARIZADO
(ADIMENSIONAL)
119 120
119 120
30
Cuando use la La Distribución Normal Standard
DISTRIBUCION NORMAL STANDARD
El proceso de estandarización de una variable
aleatoria x produce otra variable z ; si x es
𝑥 − 𝜇𝑥 normalmente distribuida con media μx y desviación
𝑧= standard σx , entonces z también es normalmente
𝜎𝑥 distribuida con μ = 0 y σ = 1.
Esto ilustra un concepto muy importante: Base de la
JAMAS SE OLVIDE QUE z ES UN NUMERO QUE cualquier valor calculado usando una o más propagación
del error
NOS DICE A CUANTAS DESVIACIONES variables aleatorias también es una variable aleatorio
121 122
123 124
123 124
31
La Distribución Normal Standard La Distribución Normal Standard
Las tablas de la distribución normal standard provee Ejemplo
probabilidades acumulativas que corresponden a las En el ejemplo anterior determinamos la probabilidad de
áreas de una de las “colas” (generalmente la derecha) que el carro de Johnny excediera el límite de velocidad
bajo la función de densidad. (65 mph); la media y la desviación standard eran 60 mph
El área de la ‘cola izquierda’ está dada por y 3 mph, respectivamente.
Resolvamos el mismo problema usando las tablas de z.
125 126
127 128
32
Observaciones Importantes sobre la
Distribución Normal Standard Cálculo de áreas de la cola izquierda:
La mayoría de las tablas de z solamente proveen la P(z < −z0) 𝑥 − 𝜇𝑥
𝑧= Z < 0 porque x0 < x
mitad de la información. Esto se debe a que la 𝜎𝑥
distribución normal es simétrica y no es necesario Puesto que z es negativo en el lado izquierdo:
incluir las áreas de las colas de ambos lados
(izquierdo y derecho que corresponden a valores P(z < –z0) = P(z < z0)
de z negativos y positivos, respectivamente). La
tabla z utilizada en este curso solamente muestra
los valores positivos (cola derecha).
129 130
También: P(z1 < z < z2) = 1 – P(z > z2) – P(z < z1)
131 132
131 132
33
Uso de las “colas“ de una distribucion normal Uso de las “colas“ de
una distribucion normal en el lab
Ejemplo
Una máquina dispensadora de bebidas de soda se regula de tal En el laboratorio analítico también hay
manera que dispensa un volumen promedio de 200 mL por
vaso. Si el volumen de la bebida dispensada está normalmente
situaciones en las que es importante
distribuido con una desviación standard de 15 mL, determinar la frecuencia con la cual ciertos
resultados extremos podrían ocurrir en
a. qué fracción de los vasos contendrá uno de los lados de la curva normal.
más de 224 mL de la bebida?
b. cual es la probabilidad que un vaso de
175 mL se rebose? Típicamente, el analista debe asegurarse que no mas
c. cual es la probabilidad que un vaso que un pequeño porcentaje de las muestras sea mayor
contenga entre 191 y 209 mL?
d. Debajo de qué volumen estará el 25% o menor que algun valor limite predeterminado
las bebidas dispensadas?
133 134
133 134
Uso de las “colas“ de una distribucion normal en el lab Uso de las “colas“ de una distribucion normal en el lab
Consideremos las determinaciones de la concentración (ppm) de ión Recuerde que para usar la tabla de distribución
nitrato en una muestra de agua
Media= 0.500 ppm
normal standard, debemos primero
Desv. std. = 0.0165 ppm
estandarizar el valor (0.53) en el que estamos
Supongamos que deseamos estimar el porcentaje de
interesados.
determinaciones que excede 0.53 ppm Esto se hace en términos de z, la desviación del
valor con respecto a la media, expresada en
unidades de desviación standard, es decir :
0.53 − 0.50
= = 1.818
0.0165
Que porcentaje de las determinaciones excede 0.53?
135 136
135 136
34
Uso de las “colas“ de una distribucion normal en el lab Uso de las “colas“ de una distribucion normal en el lab
137 138
137 138
139 140
139 140
35
OTRO EJERCICIO DE TALLER
141 142
141 142
36