Vous êtes sur la page 1sur 10

6 Distribuciones de Probabilidad

Victor Hugo Colque Hinojosa


3 de Mayo, 2018

6.1 Variables aleatorias

En la mayoria de los experimentos al azar, el investigador centra su atención en una o más cantidades variables.
Por ejemplo, considere un gerente que esta estudiando la operación de un supermercado. Un experimento
aleatorio implica la selección aleatoria de un cliente saliendo de la tienda. Una variable intereszante de
estudiar puede ser el número de items comprados por el cliente. Podemos denotar esta bariable usando una
letra, como x. Valores posibles de esta variable son 0, 1, 2, 3, . . . . Los valores posibles de x son puntos
aislados o discretos en la línea de números. Por tanto se trata de una variable cuantitativa discretal. Hasta
que un cliente sea seleccionado y el número de items sea contado, el valor de x es incierto.
Otra variable de potencial interés para el gerente puede ser el tiempo y (en minutos) empleado en la fila para
pagar. Un valor posible de y es 3.0 minutos y otro es 4.2 minutos, pero cualquier otro número entre 3.0 y 4.2
es posible. Los valores posibles forman todo un intervalo (un continuo) en linea numérica. Por tanto, y es
una variable cuantitativa continua.
Variable aleatoria. Un valor numérico cuyo valor depende del resultado de un experimento
aleatorio. Una variable aleatoria asocia un valor númerico con cada resultado del experimento
aleatorio.
Variable aleatoria discreta: Una variable aleatoria es discreta si su conjunto posible de valores es
una colección de puntos aislados a lo largo de la recta numérica.
Variable aleatoria continua: Una variable aleatoria es continua si su conjunto de valores posibles
incluye todo un intervalo de la línea numérica.
Ejemplo 1. Venta de libros. Considere un experimento en el cual se anota el tipo de libro, impreso (P) o
digital (D), escogido por cada uno de tres clientes sucesivos haciendo una compra desde una tienda en linea.
Definamos la variable aleatoria x como:
x = número de clientes que compran un libro en formato digital
El resultado experimental en el cual el primer y tercer cliente compran un libro digital y el segundo compra
un libro impreso puede ser abreciado como “DPD”. El valor asociado a x es 2, porque dos de los tres clientes
seleccionaron un libro digital. Similarmente, el valor x para el resultado “DDD” (las tres compras son de
libros digitales) es 3.
Los ocho resultados experimentales posibles y el correspondiente valor de x son mostrados en la siguiente
tabla:

Resultado PPP DPP PDP PPD DDP DPD PDD DDD


Valor de x 0 1 1 1 2 2 2 3

En algunos casos, la variable aleatoria de interés es discreta, pero el número de posibles valores no es finito.
Ejemplo 2. Dos amigos acuerdan jugar un juego que consiste en una secuencia de pruebas. El juego continua
hasta que un jugador gana dos pruebas seguidas. Una variable aleatoria de interés podría ser:
$x = $ número de pruebas requeridas para completar el juego
Si A denota un triunfo del jugador 1 y B denota un triunfo del jugador 2. Los resultados posibles más simples
son AA (el caso en el que el jugador 1 gana las dos primeras pruebas y el juego termina) y BB (el caso en el

1
Figure 1: Ejemplos de variables aleatorias discretas

que el jugador 2 gana las dos primeras pruebas y el juego termina). Con cualquiera de estos dos resultados,
x = 2. Existen también dos resultados para los cuales x = 3: ABB y BAA. Algunos otros posibles resultados
y valores de x asociados son:

Resultados valor de x
AA, BB 2
BAA, ABB 3
ABAA, BABB 4
ABABB, BABAA 5
. .
. .
ABABABABAA, BABABABABB 10

y asi sucesivamente.
Cualquier entero positivo que es 2 o mayor is un valor posible. Debido a que los valores 2, 3, 4, . . . son
puntos aislados en la línea numérica, x es una variable aleatoria discreta aunqe no existe un límite superior
para el número de valores posibles.

6.2 Distribuciones de probabilidad para variables aleatorias discretas.

La distribución de probabilidad para una variable aleatoria es un modelo que describe el comportamiento
a largo plazo de la variable. Aunque sabemos que valores posibles existen para una variable aleatoria x,
sería tambien útil conocer como la variable se comporta en repetidas observaciones. ¿Cuál sería el valor
más común? ¿Que proporción de veces el valor x = 5 sería observado? ¿Si x = 3?. Una distribución de
probabilidades provee este tipo de información acerca del comportamiento a largo plazo de una variable
aleatoria.
La distribución de probabilidades de una variable aleatoria discreta x nos da la prob-
abilidad asociada con cada valor posible de x. Cada probabilidad es la frecuencia relativa de
ocurrencias a largo plazo para un valor de x cuando un experimento aleatorio es desarrollado un
gran número de veces.
La distribución de probabilidad de una variable aleatoria describe cómo se distribuyen las probabilidades
entre los valores de la variable aleatoria. En el caso de una variable aleatoria discreta x, la distribución de

2
probabilidad está definida por una función de probabilidad, denotada por p(x). La función de probabilidad
da la probabilidad de cada valor de la variable aleatoria.
Una distribución de probabilidades es una asignación de probabilidades a cada valor distinto de la variable
aleatoria discreta.
La suma de todas las probabilidades asignadas debe ser 1.
Formas comunes de mostrar una distribución de probabilidades para una variable discreta aleatoria son una
tabla, un histograma de probabilidades o una función.
Notación Si un valor posible de x es 2, a menudo escribimos p(2), siendo p(x) la función de distribución de
probabilidades, que es equivalente a P (x = 2).
Propiedades de una función de probabilidad:

0 ≤ p(x) ≤ 1 (1)

X
p(x) = 1 (2)

Ejemplo 3 Considere las ventas de automóviles en DiCarlo Motors en Saratoga, Nueva York. Durante los
últimos 300 días de operación, los datos de ventas muestran que hubo 57 días en los que no se vendió ningún
automóvil, 117 días en los que se vendió 1 automóvil, 72 días en los que se vendieron 2 automóviles, 42 días
en los que se vendieron 3 automóviles, 12 días en los que se vendieron 4 automóviles y 3 días en los que
se vendieron 5 automóviles. Suponga que considera el experimento de seleccionar un día de operación en
DiCarlo Motors y se define la variable aleatoria de interés como x = número de automóviles vendidos en un
día. De acuerdo con datos del pasado, se sabe que x es una variable aleatoria discreta que puede tomar los
valores 0, 1, 2, 3, 4 o 5. En la notación de funciones de probabilidad f (0) da la probabilidad de vender 0
automóviles, f (1) da la probabilidad de vender 1 automóvil, y así en lo sucesivo. Como los datos del pasado
54
indican que 54 de 300 días se vendieron 0 automóviles, a f (0) se le asigna el valor 300 = 0.18, lo que significa
que la probabilidad de que se vendan 0 automóviles en un día es 0.18. De manera similar, como en 117 de los
300 días se vendió un automóvil, a f (1) se le asigna el valor 117 300 = 0.39, que significa que la probabilidad
de que se venda exactamente 1 automóvil en un día es 0.39. Continuando de esta manera con los demás
valores de la variable aleatoria, se obtienen los valo- res de f (2), f (3), f (4) y f (5), valores que se muestran en
la siguiente tabla que es la distribución de probabilidad para el número de automóviles vendidos en un día en
DiCarlo Motors.

x f (x)
0 0.18
1 0.39
2 0.24
3 0.14
4 0.04
5 0.01
Total 1.00

Una ventaja importante de definir una variable aleatoria y su correspondiente distribución de probabilidad es
que una vez que se conoce la distribución de probabilidad, es relativamente fácil determinar la probabilidad
de diversos eventos que pueden ser útiles para tomar decisiones. Por ejemplo, empleando la distribución de
probabilidad de DiCarlo Motors, se observa que el número de automóviles que es más probable vender en un
día es 1, ya que f (1) = 0.39. Además se observa que la probabilidad de vender tres o más automóviles en
un día es f (3) + f (4) + f (5) = 0.14 + 0.04 + 0.01 = 0.19. Estas probabilidades, junto con otras que pueden
interesar para tomar decisiones, proporcionan información que sirve de ayuda al encargado de la toma de
decisiones para entender la venta de automóviles en DiCarlo Motors.

3
Figure 2: Representación gráfica de la distribución de probabilidad del Número de automóviles vendidos en
un dia en Dicarlo Motors

Las distribuciones de probabilidad también se representan gráficamente. En la siguiente figura, en el eje


horizontal aparecen los valores de la variable aleatoria x para el caso de DiCarlo Motors y en el eje vertical
aparecen las probabilidades correspondientes a estos valores.
Nótese que para variables continuas y discretas, la colección de todos los valores posibles y sus probabilidades
asociadas con ellos se denominan modelo probabilístico de la variable aleatoria.
Además de tablas y gráficas, para describir las funciones de probabilidad se suele usar una fórmula que da el
valor de la función de probabilidad, f (x), para cada valor x. El ejemplo más sencillo de una distribución de
probabilidad discreta dada mediante una fórmula es la distribución de probabilidad uniforme discreta. Su
función de probabilidad está definida por:
Función de probabilidad uniforme discreta

1
f (x) = (3)
n
donde:
n = número de valores que puede tomar la variable aleatoria.
Por ejemplo, si en el experimento que consiste en lanzar un dado se define una variable aleatoria x como el
número de puntos en la cara del dado que cae hacia arriba. En este experimento la variable aleatoria toma
n = 6 valores; x = 1, 2, 3, 4, 5, 6. Por tanto, la función de probabilidad de esta variable aleatoria uniforme
discreta es:

1

6 si x = 1, 2, 3, 4, 5 o 6
f (x) = (4)
0 de otra manera

Ejemplo. Refrigeradores que son eficientes energéticamente. Suponga que cada uno de cuatro clientes
seleccionados aleatoriamente que compraron un refrigerador en una tienda de electrodomésticos escogieron ya
sea un modelo eficiente energéticamente (E) o uno de un grupo más barato de modelos (G) que no tienen una
clasificación de eficientes energéticamente. Asuma que estos clientes hacen sus elecciones independientemente
uno de otro y que el 40% de los clientes seleccionan un modelo eficiente energéticamente. Esto implica que
para cualquiera de los cuatro clientes, P (E) = 0.40 y P (G) = 0.60.
Un resultado experimental posible es EGGE, en el que el primer y cuarto cliente hacen sus selecciones
independientemente, la regla de la multiplicación para eventos independientes implica que:
P (EGGE) = P (1ro selecciona E y 2do selecciona G y 3ro selecciona G y cuarto selecciona E)

4
P (EGGE) = P (E)P (G)P (G)P (E) = (0.40)(0.60)(0.60)(0.40) = 0.0576
Similarmente:
P (EGEG) = P (E)P (G)P (E)P (G) = (0.40)(0.60)(0.40)(0.60) = 0.0576 (idéntico a P (EGGE))
y
P (GGGE) = (0.60)(0.60)(0.60)(0.40) = 0.0864
El número entre cuatro clientes que compran un modelo energéticamente eficiente es una variable aleatoria.
Podemos denotar esta variable como x:
x = el número de refrigeradores energéticamente eficientes comprados por los cuatro clientes
La siguiente Tabla muestra los 16 resultados experimentales posibles, la probabilidad de cada resultado y el
valor de la variable aleatoria x que esta asociada con cada resultado

Resultado Probabilidad x Resultado Probabilidad x


GGGG 0.1296 0 GEEG 0.0576 2
EGGG 0.0864 1 GEGE 0.0576 2
GEGG 0.0864 1 GGEE 0.0576 2
GGEG 0.0864 1 GEEE 0.0384 3
GGGE 0.0864 1 EGEE 0.0384 3
EEGG 0.0576 2 EEGE 0.0384 3
EGEG 0.0576 2 EEEG 0.0384 3
EGGE 0.0576 2 EEEE 0.0256 4

La distribución de probabilidad de x es fácilmente obtenida utilizando esta información. Considere el valor


más pequeño de x, 0. El único resultado para el cual x = 0 es GGGG, entonces:
p(0) = P (x = 0) = P (GGGG) = 0.1296
Existen cuatro diferentes resultados para los cuales x = 1, entonces p(1) resulta de la adición de las cuatro
probabilidades correspondientes:
p(1) = P (x = 1) = P (EGGG o GEGG o GGEG oGGGE)
p(1) = P (EGGG) + P (GEGG) + P (GGEG) + P (GGGE)
p(1) = 0.0864 + 0.0864 + 0.0864 + 0.0864
p(1) = 4(0.0864)
p81) = 0.3456
Similarmente,
p(2) = P (EEGG) + · · · + P (GGEE) = 6(0.0576) = 0.3456
p(3) = 4(0.0384) = 0.1536
p(4) = 0.0256
La distribución de probabilidad de x esta resumida en la siguiente tabla

Valor de x 0 1 2 3 4
p(x) = 0.1296 0.3456 0.3456 0.1536 0.0256

Esta distribución de probabilidad también puede ser representada como:

5
Figure 3: Histograma de probabilidades para el ejemplo de los refrigeradores energéticamente eficientes



 0.1296 si x = 0
0.3456 si x = 1




0.3456 si x = 2

p(x) = (5)

 0.1536 si x = 3
0.0256 si x = 4




0 de otra manera

Para interpretar p(3) = 0.1536, piense en hacer el experimento aleatorio repetidamente, cada vez con un
grupo nuevo de cuatro clientes. En el largo plazo, 15.36% de estos grupos tendrá exactamente tres clientes
comprando un refrigerador energéticamente eficiente.
La distribución de probabilidad puede ser usada para determinar probabilidades de varios eventos involu-
crando la variable x. Por ejemplo, la probabilidad de que al menos dos de cuatro clientes escojan modelos
energéticamente eficientes es:
P (x ≥ 2) = P (x = 2 o x = 3 o x = 4) = p(2) + p(3) + p(4) = 0.5248
Esto significa que, a largo plazo, un grupo de cuatro compradores de refrigeradores incluirá al menos dos que
seleccionaron modelos energéticamente eficientes el 52.48% del tiempo.
Se puede representar gráficamente una distribución de probabilidad discreta utilizando un histograma de
probabiliades. Este gráfico tienen un rectángulo centrado en el valor posible de x, y el área de cada rectángulo
es proporcional a la probabilidad del valor correspondiente.

Valor esperado y varianza

El valor esperado, o media, de una variable aleatoria es una medida de la localización central de la variable
aleatoria. A continuación se da la fórmula para obtener el valor esperado de una variable aleatoria x.
Valor esperado de una variable aleatoria discreta

6
X
E(x) = µ = x · f (x) (6)

El valor de la media describe donde esta centrada la distribución de probabilidad. El valor esperado es un
promedio ponderado de los valores que toma la variable aleatoria. Los pesos son las probabilidades.
Las dos notaciones E(x) y µ se usan para denotar el valor esperado de una variable aleatoria x. La ecuación
(6) indica que para calcular el valor esperado de una variable aleatoria discreta se multiplica cada valor de la
variable aleatoria por su probabilidad correspondiente f (x) y después se suman estos productos.
Ejemplo sobre las ventas de automóviles en DiCarlo Motors, en la tabla se muestra cómo se calcula
el valor esperado del número de automóviles vendidos en un día. La suma de las entradas en la columna
x · f (x) indica que el valor esperado es 1.50 automóviles por día. Por tanto, aunque se sabe que en un día las
ventas pueden ser de 0, 1, 2, 3, 4 o 5 automóviles, DiCarlo prevé que a la larga se venderán 1.50 automóviles
por día. Si en un mes hay 30 días de operación, el valor esperado, 1.50, se emplea para pronosticar que las
ventas promedio mensuales serán de 30(1.5) = 45 automóviles.

Figure 4: Cálculo del valor esperado para el número de autos que se venden en un día en Dicarlo Motors

Ejemplo. Intentos de un Exámen. Personas que aplican para una licencia específica están permitidos de
tomar el exámen hasta un máximo de 4 oportunidades. Considere la variable aleatoria x definida como:
x = número de intentos hecho por un aplicante seleccionado aleatoriamente.
La distribución de probabilidad p(x) se muestra en la siguiente tabla:

Valor de x p(x) x · p(x)


1 0.10 0.10
2 0.20 0.40
3 0.30 0.90
4 0.40
P 1.60
3.00

Entonces, el valor esperado de x se calcula como:


P
µ = x=1,2,3,4 x · p(x)
µ = (1)p(1) + (2)p(2) + (3)p(3) + (4)p(4) = (1)(0.10) + (2)(0.20) + (3)(0.30) + 4(0.40)
µ = 0.10 + 0.40 + 0.90 + 1.60 = 3.00
Esto significa que el valor esperado del número de intentos de dar el exámen para individuos que están
aplicando para obtener la licencia es de 3.00.

7
No es accidente que el símbolo µ, para el valor esperado es el mismo símbolo usado previamente para la media
de la población. Cuando una distribución de probabilidad describe cómo los valores de x están distribuidos
entre los miembros de una población (y, por tanto, las probabilidades son las frecuencias relativas de la
población), la media o valor esperado de x es el valor promedio de x en una población.

Varianza

Aunque el valor esperado proporciona el valor medio de una variable aleatoria, también suele ser necesaria
una medida de la variabilidad o dispersión. Así como en el capítulo 4 se usó la varianza para resumir la
variabilidad de los datos, ahora se usa la varianza para resumir la variabilidad en los valores de la variable
aleatoria. A continuación se da la fórmula para calcular la varianza de una variable aleatoria.
Varianza de una variable aleatoria discreta

X
V ar(x) = σ 2 = (x − µ)2 f (x) (7)

Como indica la ecuación (7), un parte esencial de la fórmula de la varianza es la desviación x − µ, la cual mide
qué tan alejado del valor esperado, o media µ, se encuentra un valor determinado de la variable aleatoria.
Para calcular la varianza de una variable aleatoria, estas desviaciones se elevan al cuadrado y después se
ponderan con el correspondiente valor de la función de probabilidad. A la suma de estas desviaciones al
cuadrado, ponderadas, se le conoce como varianza. Para denotar la varianza de una variable aleatoria se
usan las notaciones V ar(x) y σ 2 . Note que la sumatoria se hace sobre todos los valores posibles de x.
Ejemplo. En la Figura 5 aparece en forma resumida el cálculo de la varianza de la distribución de probabilidad
del número de automóviles vendidos en un día en DiCarlo Motors. Como ve, la varianza es 1.25. La desviación
estándar, σ, se define como la raíz cuadrada positiva
p de la varianza. Por tanto, la desviación estándar del
número de automóviles vendidos en un día es σ = (1.25) = 1.118

Figure 5: Cálculo de la varianza para el número de autos que se venden en un día en Dicarlo Motors

La desviación estándar se mide en las mismas unidades que la variable aleatoria (σ = 1.1180 automóviles)
y por tanto suele preferirse para describir la variabilidad de una variable aleatoria. La varianza σ 2 se mide en
unidades al cuadrado por lo que es más difícil de interpretar. Cuando la distribución de probabilidad describe
cómo los valores de x estan distribuidos entre los miembros de la población (de modo que las probabilidades
son frecuencias relativas de la población), σ 2 y σ son la varianza y desviación estándar de la población,
respectivamente.

8
Distribución de probabilidad binomial

La distribución de probabilidad binomial es una distribución de probabilidad que tiene muchas aplicaciones.
Está relacionada con un experimento de pasos múltiples al que se le llama experimento binomial.

Un experimento binomial
Un experimento binomial tiene las cuatro propiedades siguientes.
PROPIEDADES DE UN EXPERIMENTO BINOMIAL
1. El experimento consiste en una serie de n ensayos idénticos.
2. En cada ensayo hay dos resultados posibles. A uno de estos resultados se le llama éxito y al otro se le
llama fracaso.
3. La probabilidad de éxito, que se denota p, no cambia de un ensayo a otro. Por ende, la probabilidad de
fracaso, que se denota 1 − p, tampoco cambia de un ensayo a otro.
4. Los ensayos son independientes.
La variable aleatoria binomial x es definida como:
x = número de exitos observados cuando un experimento binomial es desarrollado.
La distribución de probabilidad de x es llamada distibución de probabilidad binomial.
Si se presentan las propiedades 2, 3 y 4, se dice que los ensayos son generados por un proceso de Bernoulli.
Si, además, se presenta la propiedad 1, se trata de un experimento binomial.
Nota histórica Jacob Bernoulli (1654-1705), el primero de la familia Bernoulli de matemáticos suizos,
publicó un tratado sobre probabilidad que contenía la teoría de las permutaciones y de las combinaciones, así
como el teorema del binomio.
El término éxito no necesariamente tiene alguna de sus connotaciones usuales. Cual de los dos posibles
resultados es etiquetado “éxito” es arbitrario para la variable aleatoria de interés.
Una situación en la cual una distribución de probabilidad binomial se presenta la vimos en el ejemplo de los
refrigeradores energéticamente eficientes. En este ejemplo, x = número entre cuatro clientes que compran un
modelo energéticamente eficiente (en vez de un modelo más barato). Este es un experimento binomial con
cuatro ensayos, donde la compra de un refrigerador energéticamente eficiente es considerado como un exito
y P (exito) = P (E) = 0.40. De los 16 resultados posibles, junto con sus probabilidades aasociadas, fueron
mostradas en la Figura 3.
Considere ahora el caso de cinco clientes, un experimento binomial con cinco ensayos. Los posibles valores de
x = número que compró un refrigerador energéticamente eficiente.
son 0, 1, 2, 3, 4 y 5. Existen 32 resultados posibles del experimento binomial, cada uno es una secuencia de cinco
exitos y fracasos. Cinco de estos resultados terminan en x = 1 : SF F F F, F SF F F, F F SF F, F F F SF, F F F F S.
Devido a que los ensayos son independientes, el primero de estos resultados tiene la probabilidad:
P (SF F F F ) = P (S)P (F )P (F )P (F )P (F )
P (SF F F F ) = (0.40)(0.60)(0.60)(0.60)(0.60)
P (SF F F F ) = (0.40)(0.60)4 = 0.05184
El cálculo de la probabilidad será el mismo para cualquier resultado con solamente un éxito. Entonces,
p(1) = P (x = 1)
p(1) = P (SF F F F o F SF F F o F F SF F o F F F SF o F F F F S)

9
p(1) = 0.05184 + 0.05184 + 0.05184 + 0.05184 + 0.05184
p(1) = (5)(0.05184)
p(1) = 0.25920
Similarmente, existen 10 resultados para los cuales x = 2, debido a que existen 10 formas de seleccionar dos
entre los cinco ensayos para determinar Ss: SSF F F, SF SF F, ..., y F F F SS. La probabilidad de cada uno
resultad de multiplicar conjuntamente (0.40) dos veces y (0.60) tres veces. Por ejemplo,
P (SSF F F ) = (0.40)(0.40)(0.60)(0.60)(0.60)
P (SSF F F ) = (0.40)2 (0.603 )
P (SSF F F ) = 0.03456
entonces
p(2) = P (x = 2)
p(2) = P (SSF F F ) + · + P (F F F SS)
p(2) = (10)(0.40)2 (0.60)3
p(2) = 0.34560
La forma general de la fórmula para calcular las probabilidades asociadas con los valores posibles distintos de
x es:
p(x) = P (x Ss entre los cinco ensayos)
p(x) = (número de resultados con x Ss) · ( probabilidad de cualquier resultado con x Ss)
p(x) = (número de resultados con x Ss) · (0.40)x (0.60)5−x
Esta forma la vimos anteriormente para calcular p(2) = 10(0.40)2 (0.60)3 .
La letra n es usada para denotar el número de ensayos en el experimento binomial. Entonces el número de
resultados con x Ss es el número de formas de seleccionar x a partir de los n ensayos que serán los ensayos
exitosos. Una simple expresión para esta cantidad es:
n!
número de resultados con x exitos = x!(n−x)!

donde, para cualquier entero positivo m, el símbolo m! (leído como “m factorial”) es definido como
m! = m(m − 1)(m − 2) · (2)(1)
y o! = 1.

10

Vous aimerez peut-être aussi