Vous êtes sur la page 1sur 20

Captulo II

II
2.1. LA VARIABLE ALEATORIA

Variables aleatorias

En el captulo anterior hemos trabajado con modelos en espacios muestrales no dimensionales (el suceso no tiene definida dimensin, ni tiene un ordenamiento), que podemos llamar espacios categricos pues los resultados son un conjunto de categoras. Introduciremos ahora la formacin de modelos en espacios mtricos: los resultados sern nmeros en el campo de los reales y por ende sern ordenados, tendrn una posicin en el espacio muestral. El suceso tendr una dimensin. Transformar un espacio muestral (conjunto de resultados) en un conjunto numrico es simple, basta con definir una relacin (del punto de vista lgico - matemtico) entre el conjunto de los resultados del experimento y el conjunto numrico. Si el conjunto numrico es el de los reales, tendremos que el espacio muestral, antes representable por un diagrama de Venn, ahora es representable por una recta. Cada nmero real ser un resultado del espacio muestral. Podr tener significado en el mundo real o no y tener probabilidad nula o no, eso no importa; ahora el espacio est ordenado y es mensurable. La relacin resultado-probabilidad ser una funcin y esto nos permitir avanzar matemticamente en la modelizacin. Algunos ejemplos: a) el tiro de una moneda, con E = {cara; cruz}, podr ser definido segn la cantidad de caras obtenidas, luego E estar formado por todos los reales en los que slo el valor 0 y el valor 1 tendrn probabilidad distinta de 0. b) el juego de la ruleta, donde E = {rojo; no rojo = {negro 0} }, podr definirse en funcin de la ganancia en el juego si se apuesta $5. nicamente tendrn probabilidad distinta de 0 los resultados (nmeros reales) {-5; 5} con P(5) = 18/37 y P(5) = 19/37; el resto de los reales con P(x) = 0. c) el tiro de dos monedas, E = {CC; ZyC, ZZ} (dos caras, una ceca y una cara, dos cecas) podr cuantificarse segn la cantidad de cecas obtenidas: con P(0) = 1/4; P(1) = 1/2 y P(2) = 1/4; el resto de los reales con P(x) = 0. Cuando el espacio muestral se identifica por los nmeros reales diremos que los resultados son una variable aleatoria. La representacin del espacio muestral de una variable aleatoria es una recta . Cada punto es un resultado. Cada segmento o semirrecta, o unin de stos, es un suceso. As, i llamamos genricamente VAR a una variable aleatoria, entonces: {VAR = 2} ser la forma simblica de escribir el resultado que se identifica con el nmero real 2. {VAR = x} ser la forma simblica de escribir el resultado que se identifica con el valor genrico x.

19

Estimacin Bayesiana

{1 < VAR < 3,5} ser el suceso unin de los resultados identificados con los nmeros reales comprendidos entre 1 y 3,5. {VAR 1,5} ser el suceso conjunto de los resultados identificados con los nmeros reales menores o iguales a 1,5. VA R = x -4 VA ,5 -1 R -3 -2 -1 x 0 1 VA R = 2 2 3 4 VA R

1 < VA R < 3,5

Observe que {VAR = 2} no es una ecuacin sino simplemente una forma abreviada de decir: resultado de la experiencia identificado con el nmero 2. El desconocimiento de un nmero implica definirlo como variable aleatoria. Por ejemplo, si escribo un nmero en un papel, para Ud. ser una variable aleatoria (por ms que el nmero est escrito y no se pueda cambiar). En cambio, para m que lo escrib, no ser una variable aleatoria. La P(x) depende de la informacin disponible.

2.1.1. LA VARIABLE ALEATORIA DISCRETA 2.1.1.1. LA FUNCION DE PROBABILIDA La relacin resultado-probabilidad, o sea {VAR = x} P(VAR = x) es la funcion de probabilidad de la variable aleatoria discreta VAR; sta puede ser graficada en un diagrama cartesiano y toma la forma para los ejemplos anteriores:

P ( VA R = x ) 0 ,5

P ( VA R = x )
19 18 37 37

P ( VA R = x )
1 2

1 4

0 1 VA R cantidad de caras

-5

0 5 gan ancia

VA R

0 1 2 VA R cantidad de cecas

Atencin: cuando no haya dudas de cul es al variable aleatoria a la que nos estamos refiriendo, por simplicidad se usar P(x) en lugar de P(VAR = x) donde x es un valor genrico de la variable. Por comodidad, toda vez que definamos una funcin de probabilidad, para aquellos valores x donde no est definida la funcin implicar que P(VAR = x) = 0. Pero tenga cuidado en la operatoria matemtica de tenerlo en cuenta, por ejemplo en los lmites de una sumatoria. 2.1.1.2. CARACTERISTICAS DE LAS FUNCIONES DE PROBABILIDAD Los axiomas del clculo de probabilidades determinan que toda funcin de probabilidad debe ser: a) siempre positiva. b) con

P ( x) = 1
x

20

Captulo II

2.1.1.3. LA FUNCION DE DISTRIBUCION La relacin resultado {VAR x} P(VAR x) es llamada funcin de distribucin de la variable VAR identificada como F(VAR = x). Cuando est implcito cul es la variable a la cual nos referimos, por simplicidad escribiremos F(x). La F(x) es la acumulada por izquierda de la P(x), o sea: F (VAR = x) = P (VAR x) =

i =

P(VAR = i)

Observe que el lmite superior de la sumatoria es el valor genrico x, por lo que se obtiene una funcin que depende de x. Para los ejemplos anteriores toma la forma:

F ( VA R ) 1 0 ,5 0 1 VA R cantidad de caras

F ( VA R ) 1
19 37

F ( VA R ) 1
3 4

1 4

-5

0 5 gan ancia

VA R

0 1 2 VA R cantidad de cecas

Conociendo la P(x) podemos encontrar F(x) y viceversa.

2.1.1.4. ESPERANZA MATEMATICA DE UNA FUNCION Sea una funcin matemtica y = g(x). Definimos la esperanza o valor esperado de g(x) como: E ( y ) = E[ g ( x )] =

x =

g ( x) P ( x)

Realizar la suma de todos los valores de una funcin g(x) ponderando cada valor por la P(x) a la cual est relacionado significa encontrar su valor medio. Es el mismo concepto por el que anlogamente encontramos el promedio de notas, el baricentro de una figura, el centro de gravedad de un cuerpo, etc.

2.1.1.5. CASOS PARTICULARES DE E[g(x)] 1) Media de la variable X: Si g(x) = x entonces E ( x) = x =

x =

x P ( x)

Simbolizada con x ser la esperanza matemtica de la variable x, tambin llamado valor medio o media. Es un valor central, un indicador genrico del posicionamiento de los valores de la variable. En la siguiente figura se muestran las medias de las variables para los ejemplos anteriores:

21

Estimacin Bayesiana

P ( VA R = x ) 0 ,5

P ( VA R = x )
19 18 37 37

P ( VA R = x )
1 2

1 4

0 x = 0 ,5 1 VA R cantidad de caras

-5

= - 537 gan ancia

5 VA R

0 2 VA R x = 1 cantidad de cecas

2) Variancia de una variable x cuyo valor genrico es x. Si g(x) = (x x)2 entonces E[(x x)2] = 2x =

x =

(x

x)

P( x)

simbolizada con 2x ser la variancia de la variable x.

2x es el valor medio de las distancias (cuadrticas, as obviamos el signo) entre los valores de la variable y su media. Es un indicador del alejamiento de los valores respecto de su valor medio. Mayores variancias implican funciones de probabilidad relativamente ms achatadas.
La desviacin o desvo estndar de x se define como
2 x = x . Es un valor ms

significativo que la variancia, puesto que tiene la misma unidad que la variable y su media. Par a mantener a la vista la relacin entre variancia y desviacin estndar es que se utiliza para ambas la misma letra a su correspondiente potencia. Ejemplo: sea una caja con 4 caramelos, cada uno con probabilidad 0,30 de ser de chocolate; a) describir la P(CAN = x) siendo CAN la variable aleatoria asociada con la cantidad de caramelos de chocolate en la caja, b) la funcin de distribucin F(CAN = x); c) calcular la media, d) la variancia y e) la desviacin estndar de CAN; f) hallar la esperanza matemtica del costo de la caja c = 2x + 20 y g) del margen relativo definido como m =
10 2 x 2 x + 20

a) recordando el ejemplo de independencia de la pg. 16 con p = 0,30: P(CAN = 0) = (1 p)4 = 0,240 P(CAN = 1) = 4 p (1 p)3 = 0,412 P(CAN = 2) = 6 p2 (1 p)2 = 0,265 P(CAN = 3) = 4 p3 (1 p) = 0,075 P(CAN = 4) = p4 = 0,008 4! p x (1 p) 4 x P (CAN = x ) = x! (4 x )! 0 si x = 0; 1; 2; 3; 4 otro x

o genricamente:

su grfico es: 0 ,5 0 ,4 0 ,3 0 ,2 0 ,1 0 1 2 3 4 CAN

b) la funcin distribucin, si aplicamos la definicin, resulta:

22

Captulo II

F (VAR = x) = P (VAR x) = x / x 0 F(CAN = x) =

x =

P(VAR = x)
=0 = 0,24 = 0,652 = 0,937 = 0,992

x / 0 x < 1 F(CAN = x) = P(CAN = 0) = x / 1 x < 2 F(CAN = x) = P(CAN = 0) + P(CAN = 1) = x / 2 x < 3 F(CAN = x) = P(CAN = 0) + P(CAN = 1) + P(CAN = 2) = x / 3 x < 4 F(CAN = x) = P(CAN = 0) + P(CAN = 1) + P(CAN = 2) + P(CAN = 3) = x / x 4 otro. c) por definicin de esperanza matemtica

F(CAN = x) = P(CAN = 0) + P(CAN = 1) + P(CAN = 2) + P(CAN = 3) + P(CAN = 4) = 1

Note cmo estn definidos los intervalos para x: x es mayor o igual que un valor y menor que

CAN = E ( x) =
d) la variancia es

x =

x P(CAN = x) = 0 0,24 + 1 0,412 + 2 0,625 + 3 0,075 + 4 0,008 = 1,2

2 CAN = E[( x 1,2) 2 ] = (0 1,2) 2 0,24 + (1 1,2) 2 0,412 + (2 1,2) 2 0,265 +

+ (3 1,2) 2 0,075 + (4 1,2) 2 0,008 = 0,36 e) la desviacin estndar es


2 CAN = CAN = 0,6

f) la esperanza matemtica del costo (o media del costo) E(2x+20) = 20 0,24 + 22 0,412 + 24 0,265 + 26 0,075 + 28 0,008 = 22,4 g) la esperanza del margen relativo ser E( 10 2 x 10 4 6 4 2 )= 0,24 + 0,412 + 0,265 + 0,075 + 0,008 = 0,36 2 x + 20 20 22 24 26 28

2.1.1.6. CALCULO DE PROBABILIDADES DE SUCESOS A PARTIR DE FUNCIONES DE DISTRIBUCION Siendo la F(x) de una variable discreta una funcin discontinua (con saltos), la P(VAR x) es distinta de P(VAR < x) si P(VAR = x) 0 o sea en los puntos de discontinuidad de F(x); de tal manera que: P(a < VAR b) = F(b) F(a) P(a VAR b) = F(b) F(a ) (recordar la abreviatura F(a) = F(VAR = a) ). (entindase por F (a ) =
lm 0

F (a ) )

P(a VAR < b) = F(b ) F(a ) (lmite por izquierda) P(a < VAR < b) = F(b ) F(a) Observe las diferencias en el grfico y note que stas no existen cuando no estamos en puntos de discontinuidad (donde ambos lmites, por izquierda y por derecha, coinciden).

23

Estimacin Bayesiana

F ( VA R = x ) F (b ) F (a ) a b x

2.1.2. VARIABLE ALEATORIA CONTINUA. LA FUNCION DENSIDAD. Trabajar con modelos sean determinsticos o estadsticos donde las medidas sean pensadas en el campo de los reales (aun cuando stos no sean ms que una extensin de la imaginacin del hombre) nos permite operar matemticamente con ms sencillez en la formulacin de modelos que con nmeros enteros, fraccionarios o racionales. As pues, si consideramos el peso de una persona como un valor con lectura en el campo de los reales, sta ser una variable denominada continua, a la que no podremos asignar probabilidad para ningn valor en especial dada la infinidad de puntos resultado en la recta de los reales. Supongamos un disco tipo kermesse que gire libremente, perfectamente balanceado, nu erado en su circunferencia con una escala lineal y continua de 0 a 2 y que deber detenerse en alguna posicin. Cul es la P de que el resultado sea el nmero ? Frente a la infinidad de posibilidades (recordar frmula de equiprobabilidad) la P es nula. Pero el resultado es posible La que obviamente no es nula es la P de un suceso definido como {A} = {x VAR x + x}. En nuestro ejemplo del disco kermesse: P(0 VAR /2) = 1/4 (el suceso corresponde a un cuarto de circunferencia y estamos considerando equiprobabilidad en los resultados). De tal manera que, como lmite, tomamos el diferencial de probabilidad: dP(x) = P(x VAR x + dx) = f(VAR = x) dx . P (0 < VA R 1 2 ) f (x ) d x

x x + dx 2

f(VAR = x) o abreviadamente f(x) es la funcin densidad de probabilidad de la variable aleatoria continua VAR. En v.a. (variable aleatoria) continua leeremos probabilidades de cada suceso como el rea bajo la funcin densidad cuya base es el suceso en cuestin.

2.1.2.1. CARACTERISTICAS DE LA FUNCION DE DENSIDAD Los axiomas del clculo de probabilidades determinan que toda funcin densidad sea: a) siempre positiva. b) con rea total bajo la curva igual a 1. Por ambas condiciones, para x o para x resulta f(x) 0 .

24

Captulo II

f (x )

f( x ) x

0 -

A rea total = 1

f (x ) x

En cualquier v.a. continua, si bien los sucesos indicados son d iferentes en cuanto pueden ser cerrados o abiertos (contengan o no los extremos) resulta que para cualquier par a, b: P(a < VAR < b) = P(a VAR b) = P(a < VAR b) = P(a VAR < b) Recuerde que estas igualdades no se cumplen para todo par a, b (a menos que P(a) = 0 y P(b) = 0 ) en una v.a. discreta.

2.1.2.2. LA FUNCION DE DISTRIBUCION Con el mismo concepto ya definido para variable discreta F(VAR = x) = P(VAR x) resultar para una variable continua: F (VAR = x) =

f ( x) dx

Por las mismas condiciones de los axiomas del clculo de probabilidades o de las funciones de densidad resulta que toda funcin distribucin est acotada entre 0 y 1 y es NO decreciente (puede ser constante por tramos), adems para x F(x) 0 y para x F(x) 1 . F (x ) 1 F (x) x 0 F (x ) x 1

Para calcular la P de cualquier suceso del espacio muestral de una variable se podra operar: a) a travs de la funcin densidad: obteniendo las reas correspondientes bajo la curva; normalmente por integracin definida. b) a travs de la funcin de distribucin: por diferencias entre ordenadas de la funcin. Por ejemplo, para calcular P(a < x < b) ser: P (a < x < b) =

f ( x) dx = F (b) F (a)
a

Ejemplo: si el tiempo sin inconvenientes de un equipo (quizs se comprenda mejor la variable si la entendemos como el instante en que falla) es una v.a. TIE cuya funcin de densidad f(TIE = t) es: si t < 0 0 f (t ) = t e si t 0 a) Expresar la F de distribucin. b) Calcular la P de que el equipo dure ms de 2. c) Calcular la P de que dure entre 1 y 3. 25

Estimacin Bayesiana

d) Calcular la P de que dure entre 1 y 3 sabiendo que dur ms de 2. a) Si aplicamos la definicin resulta:

F (VAR = t ) = 0 dt = 0
0 t

para t < 0

F (VAR = t ) = 0 dt + e t dt = 1 e t para t 0
0

b) Recordando que es el clculo del rea P (t > 2) =

f (t ) dt = e t dt = e 2
2

o tambin P(t > 2) = 1 P(t 2) = 1 F(t = 2) = 1 (1 e2) = e2 c) Aqu tambin es: P (1 < t < 3) =

f (t ) dt = e
1 1

dt = e 1 e 3

o tambin P(1 < t < 3) = F(t = 3) F(t = 1) = e1 e3 d) Aplicando la frmula de P condicional P (1 t 3 / t 2) = P ({1 t 3} {t 2}) P (2 t 3) F (3) F (2) e 2 e 3 = = = P ({t 2}) P (t 2) 1 F (2) e2

2.1.2.3. ESPERANZA MATEMATICA DE VARIABLE CONTINUA Con el mismo concepto desarrollado para variables discretas definiremos:
+

E ( y ) = E[ g ( x )] =

g ( x) f (x) dx

con lo cual como casos particulares, la esperanza matemtica de la variable o media ser:
+

E ( x) = x = y la variancia

x f ( x) dx

E[( x x )

2 ]=x

(x

x)

f ( x) dx

2.1.2.4. OPERADOR ESPERANZA MATEMATIC La esperanza matemtica se puede manejar como un operador E recordando que es una sumatoria en una v.a. discreta o una integral en una v.a. continua. As, siendo a, b constantes; x variable resultan las siguientes propiedades: E(a x) = a E(x) E(a) = a E(a x + b) = a E(x) + b E[a (x)] = a E[(x)] 26

Captulo II

ACLARACION: siendo la dicotoma variable discreta-variable continua en el fondo un problema de forma (tal es as que algunos autores usan la funcin Delta de Dirac para manejar como continua cualquier variable discreta), nosotros, e n ciertos casos, desarrollamos la explicacin por separado para facilitar la aplicacin prctica. De todas maneras, las conclusiones que desarrollamos para variables continuas sern aplicables a variables discretas mutatis mutandi: integrales por sumatorias, derivadas por diferencias, etc. Salvo en ocasiones muy especiales, haremos la distincin entre v.a. discreta y v.a. continua para facilitar la comprensin del manejo de las variables o la comprensin del tema. Ocasionalmente podrn ser definidas variables mixtas con probabilidades distribuidas (con densidad de probabilidad f(x) ) en ciertos intervalos y concentradas (con probabilidad P(x) ) en algunos puntos. Las funciones de probabilidad y densidad muestran como es nuestra informacin respecto de ese espacio muestral dimensional.

2.1.3. EL TEOREMA DE TCHEBYCHEFF Dado que la variancia cuantifica el alejamiento medio de los valores de la variable respecto a su valor central (media), es de intuir la existencia de una relacin entre la probabilidad de estar lejos de la media y la variancia. El teorema de Tchebycheff establece una cota general de esta relacin y establece que la probabilidad de estar ms lejos de la media en una distancia es menor o igual al cociente entre la variancia y el cuadrado de esa distancia: P ({VAR x t} {VAR x + })

2 2

Ntese que esto es vlido para absolutamente cualquier variable (con cualquier funcin de probabilidad o densidad). Debemos aclarar sin embargo que la cota dada por el teorema es muy grosera y supera en mucho el valor exacto de probabilidad calculado en las funciones de las variables ms frecuentes (vea en el anexo el valor de acotacin comparado con probabilidad). Por lo tanto, este teorema, a nuestro entender, no tiene importancia como clculo sino como concepto.

2.2. CAMBIO DE VARIABLE Si y = g(x) (y es funcin de x), y si los valores de x responden a una cierta funcin densidad de probabilidad, tambin los de y tomarn valores aleatorios. La cuestin consiste entonces en determinar la expresin de la func in densidad de y o sea f(y) (o su correspondiente funcin de distribucin F(y) ) conociendo f(x) o F(x) . El planteo estadstico del cambio de variable es un planteo a travs de la relacin entre los resultados o sucesos en los dos espacios muestrales y no un simple cambio matemtico de variable.

2.2.1. CAMBIO DE VARIABLE CON FUNCION DE CAMBIO MONOTONA CRECIENTE Para entender bien el cambio de variable tendremos que comenzar estudiando por separado cada caso de la funcin de cambio g(x). El planteo bsico es similar, pero difiere en alguna medida si 27

Estimacin Bayesiana

g(x) es montona creciente, decreciente o no es montona. Como introduccin al planteo general veamos el caso ms sencillo: Sea la funcin de cambio de variable y = g(x) montona creciente (por ende biyectiva). y y = g (x )

dy

dx

dx}

Consideremos dos v.a. VARx y VARy relacionadas a travs de y = g(x) . El suceso {x VARx x + corresponde al suceso {y VARy y + dy} donde y = g(x). Siendo los dos sucesos correspondientes sern iguales sus probabilidades: P(x VARx x + dx) = P(y VARy y + dy) o lo que es lo mismo f ( x) dx = f ( y ) dy

Pero dy = g(x) dx siendo g(x) la derivada con respecto a x (vase grfico). Luego: f ( x) dx = f ( y ) g ' ( x ) dx f ( y) = f ( x) g ( x)

x = g 1 ( y ) (funcin inversa)

El planteo del cambio de variable lgicamente puede hacerse a travs del planteo de sucesos de menor o igual, lo que nos lleva a trabajar con las funciones de distribucin en lugar de las de densidad. Para el caso de funciones montonas crecientes la condicin del cambio de variable es la igualdad: {VAR y y} {VARx x} cuyo grfico es: VA R y y1 P (Y y ) F Y( y ) = = f( y ) x1 P (X f (x ) Nota: esta expresin de la igualdad entre funciones de distribucin ser utilizada en el tema simulacin. VA R x x ) F X( x ) = = y = g(x) F (VAR y = y ) = F (VARx = x )
x = g 1 ( y )

2.2.2. CAMBIO DE VARIABLE CON FUNCION DE CAMBIO MONOTONA DECRECIENTE Sea ahora la funcin de cambio de variable y = g(x) montona decreciente. y

dy

y = g(x) dx x

28

Captulo II

El cambio que introduce esto en el planteo es que ahora g(x) es negativa, y si aplicamos la frmula desarrollada anteriormente f ( y ) = es imposible. Pensemos mejor en sucesos menor o igual, es decir en las funciones distribucin de probabilidad. El suceso {VARx x} es equivalente en este caso al suceso {VARy y}, como se muestra en el grfico: VA R y y = g (x ) y1 P (Y y ) = 1 F- Y ( y ) = f( y ) x1 P (X f (x ) Entonces tenemos que: o lo que es lo mismo: Haciendo el cambio: P(VARx x) = P(VARy y) F(VARx = x) = 1 F(VARy = y) F (VAR y = y ) = 1 F (VARx = x )
x = g 1 ( y )

f ( x) g ( x)

resultara que f(y) tambin es negativa, lo cual


x = g 1 ( y )

VA R x x ) F X( x ) = =

Note la diferencia con el resultado para una funcin montona creciente. Para obtener f(y) no tenemos ms que derivar miembro a miembro con respecto a y, y teniendo en cuenta que dy = g(x) dx: f ( y) = f ( x) g ( x )

x = g 1 ( y )

2.2.3. CASO GENERICO DE CAMBIO DE VARIABLE Sea y = g(x) cualquier relacin aun no biyectiva. VA R y y1 y = g(x)

x1

x2

x3

VA R x

Nos encontramos bajo las mismas consideraciones del caso simple, slo que a hora aparecen diversos sucesos en el espacio muestral de la VARx que se corresponden al suceso en el espacio muestral de VARy. Luego, la P(y VARy y + dy) es igual a la suma de las P(xi VARx xi + dx): f(y) dy = f(x1) dx + f(x2) dx +. . .+ f(xn) dx que nos lleva a la expresin genrica: f ( y) =

g ( x )
f ( xi )
i i =1

xi = g 1 ( y )

29

Estimacin Bayesiana

Hemos puesto la derivada en valor absoluto para tomar en cuenta los casos donde g(x) es decreciente. Veamos un ejemplo: supongamos un juego consistente en hacer girar un disco perfectamente balanceado y numerado de 0 a 1. Se recibir un pago de y = (x )2 donde x es el valor obtenido en el disco. Obtener la f(y) y la media de la variable pago y . Analicemos la expresin del cambio de variable: de la misma vemos que para valores menores que y = existen dos valores x1 y x2 para cada valor de y. 1 1 + y x2 = y 2 2 1 si 0 x 1 La v.a. x tiene una f ( x) = 0 si x < 0 x > 1 x1 = Aplicando el cambio de variable: f ( y) = f ( x) g ( x ) +
1 x = x1 = + y 2

f ( x) g ( x)

=
1 x = x2 = y 2

1 2 x1 1
1 x1 = + y 2

1 2 x2 1
1 x2 = y 2

1 2 y

1 2 y

de donde f ( y ) =

1 y

para 0 y

Observemos el grfico: VA R y f (y ) = 1 y f ( VA R y = y ) 1 f ( VA R x = x ) Observe que fs icamente el juego hubiese sido posible con solo cambiar la escala del disco numerndolo con el valor y correspondiente a cada x: y= x=0 y = (x 1) 2 2

VA R x

y = 1 /1 6

x = 0 ,75

x = 0 ,25

y = 1 /1 6

x = 0 ,6 y = 0 ,01

x = 0 ,4 x = 0 ,5 y = 0 ,01 y=0

30

Captulo II

2.2.4. LA ESPERANZA MATEMATICA Y EL CAMBIO DE VARIABLE Recordando la definicin de esperanza matemtica y el concepto de ca mbio de variable, se deduce inmediatamente que lo que hacemos con E[g(x)] no es ms que calcular la E(y) sin obtener previamente la f(y); o sea:
+

E[ g ( x )] = E ( y ) = y =

y f ( y) dy = g ( x) f ( x) dx

Ejemplo: del ejercicio anterior calculemos la media de y: 1 1 1 E[ g ( x )] = ( x ) 2 1 dx = y dy = E ( y ) = y = 12 2 y 0 0 En e te caso, dada la particular funcin del cambio de variable, y dado que 1/2 es la media de x, la media de la variable y no es ms que la variancia de x (recuerde la definicin), o sea
2 y = x =

1 4

1 . 12

2.2.5. EL CAMBIO DE VARIABLE EN VARIABLE DISCRETA El cambio de variable en variable discreta se realiza punto a punto, resultando muy sencilla su operatoria. Cuando la funcin para el cambio de variable no es biyectiva habr que sumar las P(x) de los valores x que generen un mismo valor de y. Ejemplo: un juego consiste en pagar el valor de y = (x 2)2 donde x es la cantidad de caras obtenidas con 4 tiros de una moneda. Encontrar la f(Y = y) . Dada la relacin: Variable X x 0 1 2 3 4 resulta P(Y = 0) = P(X = 2) = 0,375 Variable Y y = (x 2)2 4 1 0 1 4

P(Y = 1) = P(X = 1) + P(X = 3) = 0,5 P(Y = 4) = P(X = 0) + P(X = 4) = 0,125 nicos valores de y con probabilidad distinta de 0.

2.2.6. CASOS PARTICULARES DE CAMBIO DE VARIABLE a) TRASLACION LINEAL Si y = ax + b el cambio de variable no es ms qu e un cambio de escala (dado por a) y un desplazamiento (dado por b). Esto significa que el tipo de funcin de f(x) es el mismo que f(y). Se podra cambiar simplemente la escala lineal del eje de VARx por el de VARy y tendramos la lectura del grfico como de f(y). 31

Estimacin Bayesiana

Puede demostrarse fcilmente (queda a cargo del lector como simple aplicacin de las definiciones) que en este caso:

y = a x + b y 2 = a2 x 2

(o sea, la media sufre la misma transformacin). (la variancia aumenta o disminuye segn sea a2 mayor o menor a 1 y el desplazamiento b lgicamente no la afecta).

b) FUNCION CUADRATICA Si y = x2 puede demostrarse por aplicacin de la definicin de media y variancia que (ver anexo II):

y = x2 + x2

o sea que x no sufre la misma transformacin que la variable.

Si y = (x x)2 generamos una funcin cuya media es la variancia de x ( x2).

2.3. EL PROBLEMA INVERSO Uno puede preguntarse: cul es la y = g(x) que relaciona dos variables, de las que conocemos las respectivas funciones de densidad f(x) y f(y)? Pueden existir infinitas funciones que las relacionen, pero si nos limitamos a las montonas crecientes, hay en este caso una nica solucin porque, siendo que F(y) = F(x) puede despejarse y = g(x) o y = g 1(y) que son la funcin cambio de variable que las relaciona. Por ejemplo: Si conocemos f(x) y f(y) dadas por:
0 si x < 0 f ( x) = 1 si 0 x 1 x >1 0 f ( y) = 1 y si y0 1 4 y> 1 4

si 0 < y

podemos hallar las respectivas funciones de distribucin:


0 F ( y ) = 2 y 1 si y0 1 4

0 si x < 0 F ( x) = x si 0 x 1 1 si x > 1

si 0 < y si y> 1 4
2

x2 x . Como F(x) = F(y), entonces x = 2 y con lo que obtenemos y = g ( x) = = 4 2 Esta es la funcin de transformacin de x en y. Recordando el ejemplo del disco numerado de 0 a 1 dado en la seccin 2.2.3, puede parecer que el resultado obtenido en este problema no es consistente con la funcin de cambio de variable dada en aquel ejemplo ( g(x) = (x 1/2)2 ). Lo que sucede es que, como dijimos anteriormente, pueden existir infinitas funciones que relacionen las variables, pero slo una montona creciente, que es la que acabamos de hallar.

2.3.1. SIMULACION DE VARIABLES: UN CASO PARTICULAR DE CAMBIO DE VARIABLE Sabra Ud. jugar a la ruleta con un mazo de naipes? Se podra realizar, por ejemplo, tomando 37 cartas y asignndole a cada una la representacin del resultado de la ruleta (del 0 al 36).

32

Captulo II

Sabra jugar a los dados con un disco de kermesse numerado en escala 0 a 2 ? Se trazaran 6 sectores iguales asignndoles a cada uno la representacin del resultado del dado. Por ejemplo, si llamamos x al resultado de una lectura del disco, podramos establecer que:

3 2 x< 3 3 2 x < 3 4 x< 3 4 5 x< 3 3 5 x < 2 3


0 x<

corresponde al as corresponde al 2 corresponde al 3 corresponde al 4 corresponde al 5 corresponde al 6

Habr descubierto Ud. la clave para esta correspondencia: las probabilidades de los sucesos correspondientes son iguales. Pues bien, stas son simulaciones fsicas de un experimento (de una variable) a travs de otro (otra variable). Ud. est realizando un cambio de variable. Veamos cmo se realiza en la prctica: pensemos en una variable VAR de las que conocemos F(VAR = x) y en una variable muy especial (ya veremos por qu) RND cuya funcin densidad f(RND = rnd) es: 0 si rnd < 0 rnd > 1 f (rnd ) = 1 si 0 rnd 1 (se la denomina uniforme de 0,1 variable random). Su funcin de distribucin F(RND = rnd) es: si rnd < 0 0 F (rnd ) = rnd si 0 rnd 1 1 si rnd > 1 Ntese que la P de que un valor sea menor que rnd es justamente rnd (ej.: la P(RND 0,3) = 0,3 ). La cuestin es cmo generar (calcular) valores de la variable VAR, o sea x conociendo valores de la variable RND, o sea rnd: pues haciendo el cambio de variable de tal manera que: F(VAR = x) = F(RND = rnd) (para obtener una funcin montona creciente), o sea F(x) = rnd (para 0 rnd 1), de donde despejamos: x = F 1(rnd) Esta es la x = g (rnd) que realiza el cambio de variable. La obtencin de valores rnd es simple, puesto que son valores equipro bables (fsicamente bastara con un disco tipo kermesse numerado con escala 0 a 1); pero existen algoritmos que realizan esta tarea en todos los lenguajes de computacin y aun en calculadoras cientficas. Este cambio de variable (simulacin) nos permite ge nerar valores de cualquier variable aleatoria muy rpidamente, lgicamente conociendo su funcin densidad o distribucin. Observe el grfico correspondiente a una simulacin: 33

Estimacin Bayesiana

VA R x x = g (0 ,4 ) 0 ,4 0 ,4 f( x ) 1 f ( rn d ) 0 ,4

X = F -1 ( rn d ) = g ( rn d )

1 rn d

El ejemplo dado en la seccin 2.2.2 es una simulacin, puesto que hemos utilizado como f(x) la f(rnd) (variable random).

2.3.2. SIMULACION DE VARIABLES DISCRETAS El concepto es el mismo que en variable continua, slo que siendo la funcin distribucin del tipo escalera, no habr una relacin punto a punto entre las variables, sino que a cada valor de la variable discreta, con P distinta de 0, le corresponder un intervalo de la variable continua RND, de tal manera de mantener la igualdad de las probabilidades correspondientes. Ejemplo: la variable aleatoria X es la cantidad de din ero ganado al apostar $5 al rojo 2 veces en la ruleta. 19 2 0,263 37 19 18 Su funcin de probabilidad es P ( x) = 2 37 37 0,5 2 18 0,236 37 0 0 0,263 y su funcin de distribucin: F ( x ) = 0,763 1 P (x ) para para para para para x = 10 para x = 0 para x = 10 otro x

x < 10 10 x < 0 0 x < 10 x 10 F (x )

-1 0

10

-1 0

10

Queremos simularla mediante la variable RND de la que ya sabemos que F(rnd) = rnd. Entonces, igualando ambas funciones de distribucin tenemos F(x) = rnd. x 10 0 -1 0 1 rn d = F ( x ) 1 f ( rn d )

P (X = x)

34

Captulo II

Hallamos de esta manera, por ejemplo, que la P(X = 10) es igual a la P(0,763 RND < 1) (el rea sombreada en el grfico). Es decir, hicimos corresponder cada valor de la variable disc reta X (-10; 0; 10) con un intervalo de la variable RND ( [0; 0,263); [0,263; 0,763); [0,763; 1) respectivamente).

2.3.3. OTROS EJEMPLOS DE SIMULACION a) Ejemplo de simulacin de variable continua. Si queremos simular valores de una variable cuya funcin distribucin es:
x 1 e 4 F ( x) = 0

si x 0 si x < 0

Igualaremos la expresin a rnd; luego despejaremos obteniendo la funcin inversa. En este caso: x = 4 ln(1 rnd) que nos permite, generando valores de rnd, encontrar valores de x que respondern probabilstica ente a la funcin de distribucin dada. Por ejemplo: rnd 0,382 0,877 0,165 x = 4 ln(1 rnd) 3,849 0,548 7,207

Estos valores x son muestras de la variable aleatoria x cuya funcin de densidad es: f ( x) = y cuya funcin de distribucin es: F ( x) = 1 e
x 4

1 4 e 4

para x 0

para

x0

b) Ejemplo de simulacin de variable discreta Sea la funcin de probabilidad P(VAR = x) correspondientes de la funcin de distribucin: de la tabla, y F(VAR = x) los valores

VAR 2 0 1 3

P(VAR = x) 0,10 0,30 0,35 0,25

F(VAR = x) 0,10 0,40 0,75 1,00

intervalos de la v.a. RND equivalentes (igual P) 0 rnd 0,1 0,1 < rnd 0,4 0,4 < rnd 0,75 0,75 < rnd 1

Los valores de la ltima columna corresponden a sucesos de la v.a. random que tienen el mismo valor de P que los del valor de la variable correspondiente. Por ej.: P(VAR = 2) = 0,10 = P(0 rnd 0,1) Observe que los lmites de los sucesos definidos en la v.a. RND coinciden con los valores de la F(x). Hemos encontrado as la regla de generacin de los sucesos equivalentes. Al generar un rnd, segn el intervalo (suceso) al que pertenezca, corresponder el valor de la variable indicado en la tabla, por ejemplo: rnd = 0,462 equivale a VAR = 1. 35

Estimacin Bayesiana

Lgicamente podrn simularse sucesos de espacios mu estrales no dimensionales con slo establecer los intervalos de la variable random con igual probabilidad que la de los sucesos que se le haga corresponder. La tcnica de simulacin es un arma poderossima para la resolucin de problemas con modelos estadsticos. A ttulo de ejemplo, suponga que Ud. debe evaluar frente a un contrincante su modelo de apuesta en el juego del truco, referente a la apuesta envido (el modelo de apuesta consiste en establecer los puntajes de envido con los que Ud. est dispuesto a aceptar y cantar). Sabra Ud. armar un modelo estadstico para determinar la variable puntos ganancia y determinar su media? Quizs podra, pero muy laboriosamente. Otra alternativa sera jugar una serie de partidas de ensayo que llevara muchsimo tiempo. La simulacin, en cambio, le permite jugar estas partidas de ensayo (con una computadora) con mucha rapidez. Con esta muestra (suficientemente grande) Ud. podr medir con adecuada precisin la variable puntaje, estimar su media y tomar dec isiones al respecto (este concepto de medir con adecuada precisin o inferir, ser desarrollado en captulos siguientes en trminos estadsticos precisos, pero Ud. seguramente ya pudo entender intuitivamente a qu nos referimos). Esta tcnica es muy econmica.

2.4. LAS VARIABLES TRUNCADAS (o condicionadas) Es la aplicacin del concepto de P condicional en el caso de un espacio muestral definido como variable aleatoria. Introduzcamos el concepto a travs de un ejemplo: Sea una mquina que fabrica caramelos en forma automtica, los caramelos que se producen tienen un peso variable con una f(VAR = x) conocida. Para obtener una produccin ms uniforme se descartan aquellos caramelos que pesen menos de a o ms de b. La pregunta es: cmo ser la f(NOD = x) de los caramelos no descartados? (podra tambin preguntarse por la de los descartados). Es un simple planteo de condicionalidad; lo trataremos a travs de las funciones de distribucin F(VAR = x) y F(NOD = x).

F ( NOD = x ) = P( NOD x ) = P[VAR x / (a < x < b)] =

P[(VAR x) (a < x < b)] P(a < x < b)

Analicemos ahora el espacio muestral de VAR y sus sucesos: a < VA R < b x1 VA R x1 VA R x2 VA R x3 a x2 b VA R = 2 x3 VA R

Pueden plantearse 3 situaciones, quedando el numerador de la expresin segn:


Si x a Si a x b Si x b En sntesis:

P[(VAR x) P[(VAR x) P[(VAR x)

(a < VAR < b)] = 0 (disjuntos) (a < VAR < b)] = P(a < VAR < x) (a < VAR < b)] = P(a < VAR < b)

(ej.: x1) (ej.: x2) (ej.: x3)

36

0 F (VAR = x ) F (VAR = a) F ( NOD = x ) = F (VAR = b) F (VAR = a ) 1

xa a xb xb

Captulo II

Por derivacin (aunque podra haberse analizado directamente): Ntese que el tipo de funcin no cambia, se trunca entre a y b y se expande hacia arriba (dividiendo por un nmero menor que 1) para mantener rea 1. Los condicionamientos (o truncamientos) pueden ser de mltiples formas; entendiendo el concepto, su tratamiento es semejante. 0 f (VAR = x) f ( NOD = x ) = F (VAR = b) F (VAR = a) 1 xa a xb xb

En todos aquellos intervalos donde los valores de la variable no forma parte del suceso condicionante ser nula la funcin de densidad o probabilidad.

2.5. LA MEZCLA DE VARIABLES La aplicacin de la frmula de la probabilidad total al caso donde se trabaja con variables aleatorias conjuntamente con espacios muestrales categricos (no dimensionales) se denomina mezcla de variables. Veamos el caso a travs de un ejemplo: supongamos dos mquinas A y B, que producen el 30% y 70% respectivamente de las piezas ( P(A) y P(B) ), que luego son introducidas en la misma bolsa (mezcladas). Las funciones de densidad del peso de las piezas son diferentes para ambas mquinas, sean stas f(VAA = x) y f(VAB = x) . Cul ser la f(MEZ = x) de las piezas de la bolsa? Observacin: P(A) debe leerse como P de que una pieza sea de mquina A y no P de mquina A: mquina no es un suceso aleatorio (a menos que se use como expresin abreviada de la descripcin anterior).

Podemos escribir por probabilidad total {A


B} = {E}

{MEZ = x} = {{MEZ = x por tanto: luego:

A}

{MEZ = x

B}}

f(MEZ = x) dx = f(MEZ = x

A) dx + f(MEZ = x

B) dx

f(MEZ = x) = f(MEZ = x/ A) P(A) + f(MEZ = x/ B) P(B)

que se transforma en la funcin densidad de la mezcla f(MEZ = x) = f(VAA = x) P(A) + f(VAB = x) P(B) Significado grfico: f f ( VA A ) f ( VA B ) f (M E Z ) x Generalizando a mezcla de n variables resulta:

37

Estimacin Bayesiana
i =n i =1

f (MEZ = x ) =

f (VA = x) P(i)
i

Ntese la equivalencia con la frmula de probabilidad total deducida para espacios no dimensionales y tambin con la de esperanza matemtica. Queda para el lector demostrar por simple aplicacin de las definiciones que: F(MEZ = x) = F(VAA = x) P(A) + F(VAB = x) P(B)
MEZ = VAA P( A) + VAB P ( B )

En cambio, la variancia de la mezcla depende tambin de las distancias entre las medias de las variables componentes, puesto que variables alejadas entre s generan funciones mezcla con puntos alejados del alor medio. Puede demostrarse por aplicacin de la definicin de variancia que para dos sucesos A y B:
2 2 2 MEZ = VAA P ( A) + VAB P ( B ) + ( VAA VAB ) 2 P( A) P( B)

2.6. LA FORMULA DE BAYES EN MODELOS CON ESPACIOS METRICOS Y NO METRICOS Es inmediato que podemos escribir, recordando la frmula de Baye P ( A / MEZ = x ) = f (MEZ = x / A) P ( A) f (VAA = x) P( A) = f (MEZ = x ) f (VAA = x) P( A) + f (VAB = x ) P ( B )

que nos recalcula la P que tenamos del suceso A bajo informacin de conocer el resultado MEZ = x; de esta forma podemos recalcular las probabilidades del espacio muestral {A B} = {E} condicional al suceso MEZ = x. NOTA: Cuando hablamos de variables iguales nos estaremos refiriendo a que tienen la misma funcin de probabilidad o densidad, y no a que toman los mismos valores en la experiencia. Luego, no ser lo mismo escribir Z = X1 + X2 que simboliza suma de dos ariables que pueden ser iguales que Y = 2 X1 que simboliza el doble de la variable.

38