Vous êtes sur la page 1sur 42

Introduccion a la Estadística

Probabilidad y sus propiedades

Andrea Rotnitzky, Analia Ferrari, Matías Cersosimo

Universidad Torcuato Di Tella

5 Marzo, 2018

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 1 / 42


Big Data
La revolucion de "Big Data": grandes cantidades de informacion
disponibles para ser analizadas e interpretadas sobre casi cualquier cosa que
querramos saber:

Registros de transacciones :
de cajeros de comercios, de transacciones con tarjetas de debito y
credito, de scans de codigos de barra, etc
Estadisticas publicas:
gobierno abierto, series economicas, estadisticas de salud (electronic
health records), de justicia, etc
Mercado de acciones :
series temporales del valor de las acciones
Datos satelitales, internet, etc :
GPS, paginas visitadas en internet, comunicaciones con celulares, uso
de redes sociales, etc
Reproducible research:
datos de estudios utilizados en articulos academicos.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 2 / 42


Estadistica y Big Data
La Estadistica nos enseña como organizar, analizar e interpretar datos para
evaluar:

Descripciones del estado de situacion


tasa de desempleo, obesidad, in‡acion ..., apoyo a un proyecto de ley,
etc

Relaciones de causa-efecto, Evaluaciones de impacto


impacto en las ventas de una estrategia de marketing, impacto en la
calidad educativa de una mejora en el salario docente, etc...

Predicciones a futuro
…nanzas: riesgo de una estrategia de inversion
marketing : propagandas tienen mas chances de ser clickeadas por el
usuario.
credit scoring : riesgo de no pago de un prestamo bancario
economia: riesgo de default de la deuda de un pais soberano

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 3 / 42


Incertidumbre

Un buen analisis de datos nos ayuda a tomar decisiones racionales e


inteligentes frente a incertidumbre sobre el futuro.

Ademas, el analisis de datos tambien esta generalmente sujeto a


incertidumbre(y sesgos):

Cuan con…able es una encuesta sobre apoyo al aborto basada en tan solo 2000
personas?
Cuan con…able es un calculo sobre la efectividad de una estrategia de marketing si
mi calculo fue basado en un estudio piloto en un grupo seleccionado de clientes?
Cuan con…able es una prediccion sobre el futuro del valor de la accion de una
empresa en un mercado volatil?
Cuan con…able es una prediccion sobre la capacidad de pago de un solicitante de
credito bancario si mi calculo esta basado en apenas algunas caracteristicas del
cliente?

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 4 / 42


Incertidumbre

Como razonamos frente a incertidumbre ?

Que logica seguimos?

La mayoria de la gente tiene una intuicion bastante mala sobre


incertidumbre...

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 5 / 42


Probabilidad

La Probabilidad de un evento incierto es un valor numerico que


cuanti…ca la posibilidad de ocurrencia del evento.

La Teoria de Probabilidad nos da reglas para operar con probabilidades y


razonar coherentemente frente a incertidumbre. Es la herramienta esencial
para
Cuanti…car la con…abilidad de los resultados de un analisis de datos -
inferencia estadistica -
La toma de decisiones racionales frente a incertidumbre.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 6 / 42


En este curso veremos...

Teoria de la Probabilidad

Algunos elementos basicos de la Inferencia Estadistica.

Mas sobre Estadistica en el proximo curso de la serie Analisis


Estadistico

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 7 / 42


PRIMERAS NOCIONES DE LA TEORIA DE PROBABILIDAD

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 8 / 42


Espacio Muestral
Espacio muestral Ω : es el conjunto de todos los resultados posibles para
una situacion incierta dada.
ω : denota un elemento generico de Ω.

Situacion incierta Espacio Muestral Ω

1 El clima mañana flluvioso, nublado, soleado g


2 La temperatura en grados centigrados mañana [ 5, 45 ]
3 La tendencia del dolar mañana fsube, baja, estable g
4 El precio del dolar mañana cualquier numero racional en [10, ∞)
5 El resultado del partido de River el domingo fgana, pierde, empata g
6 Mi estado de humor al …nalizar esta clase foptimista, pesimista, ambivalente g
7 El numero en el que caera un tiro de un dado f1, 2, 3, 4, 5, 6 g
8 Los resultados de dos tiros de una moneda f(c , c ) , (c , s ) , (s , c ) , (s , s )g
9 Los numeros de tiros al aro hasta que emboque un tiro f1, 2, 3, 4, 5, ...g
10 El numero de dias hasta que Racing salga campeon f1, 2, 3, ...g
11 El numero de alumnos que aprobara esta materia f0, 1, 2, 3, ..., 50 g (con 50 alumnos registrados)
12 La cifra en la posicion decimal 50 del numero π f0, 1, 2, 3, 4, 5, 6, 7, 8, 9 g

1, 2, 3, 4, 5, 6, 10 y 11 son situaciones inciertas "no experimentables" o no "repetibles"


7, 8 y 9 son situaciones inciertas "experimentables" o "repetibles"
12 es incierta para "mi" pero puede no serlo para otras personas
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 9 / 42
Eventos
Evento : cualquier subconjunto del espacio muestral, denotado con letra
mayuscula A, B, C etc

Situacion incierta Espacio Muestral Ω Ejemplo de un evento


Como subconjunto de Ω En palabras
Clima mañana flluvia, nube, solg fnube, solg no llueve
Temperatura mañana [ 5, 45 ] (25, 45 ] arriba de 25
Tendencia del dolar fsube , baja, estable g festable g estable
Precio del dolar racionales en [10, ∞) racionales en [20, 20.5 ] entre 20 y 20.50
Partido de River fgana, pierde, empata g fgana, empata g no pierde
Mi estado de humor fopt., pes., amb.g fopt., pes., amb.g cualquiera
El tiro de un dado f1, 2, 3, 4, 5, 6 g f2, 4, 6 g sale par
Dos tiros de una moneda f(c , c ) , (c , s ) , (s , c ) , (s , s )g f(c , c ) , (s , s )g salen tipos iguales
Tiros hasta que emboque f1, 2, 3, 4, 5, ...g f10, 11, 12, 13, ...g por lo menos 10
Dias a Racing campeon f1, 2, 3, ...g f1, 2, ..., 99 g menos de 100
Alumnos que aprobaran f0, 1, 2, 3, ..., 50 g f26, 27, ..., 50 g mas de la mitad
50ava cifra decimal de π f0, 1, 2, 3, 4, 5, 6, 7, 8, 9 g f1, 3, 5, 7, 9 g impar

NOTA: Ω es el evento "cierto" de que el resultado incierto esta dentro de los resultados posibles

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 10 / 42


Eventos mutuamente excluyentes
Does eventos A y B son mutuamente excluyentes si nunca pueden ocurrir
simultaneamente .
Con conjuntos: A y B son mutuamente excluyentes si A \ B = ∅

Situacion incierta Eventos excluyentes Eventos no excluyentes

Clima mañana A = fnube g , B = fsolg A = no llueve, B =no sol

El tiro de un dado A =par, B =impar A =par, B =mayor que 5

Tiros hasta que emboque A = 10 o mas, B = 5 o menos A = 10 o mas, B =20 o menos

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 11 / 42


Probabilidad: intuicion

Cuanti…caremos a la plausibilidad de un eventos en una escala del 0 al 1, de


modo tal que:

1 cuanti…ca la plausibilidad de ocurrencia de un evento "cierto"


0 cuanti…ca la plausibilidad de ocurrencia de un evento "imposible"

Que propiedad "razonable" deberia satisfacer una medida de plausibilidad?

Si A y B son eventos mutuamente excluyentes , es razonable pedir que


nuestra medida de plausibilidad se comporte de modo que:

La medida de plausibilidad de que ocurra A o B sea la suma de las


medida de plausibilidad de A mas la de B

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 12 / 42


Probabilidad: de…nicion

Funcion de probabilidad P : es cualquier funcion que a cada evento A le


asigna un numero P (A) tal que:

1 P (A) 0

2 P (Ω) = 1

3 (Aditividad) Si A y B son disjuntos entonces

P (AUB ) = P (A) + P (B )

mas generalmente, si A1 , A2 , ... es una secuencia (…nita o in…nita) de


conjuntos disjuntos entonces

P ( A1 [ A2 [ A3 [ ) = P (A1 ) + P (A2 ) + P (A3 ) + ...

A las propiedaes (1), (2) y (3) se los llama Axiomas de Probabilidad


Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 13 / 42
Probabilidad: manos a la obra con los primeros calculos
Teorema 1.1: Supongamos que en un cierto problema,

a) el espacio muestral Ω = fa1 , ..., aK g es …nito

b) por argumentos de simetria o similitud, es razonable suponer que


todos los elementos del espacio muestral son igualmente plausibles

Entonces
# de elementos en A
P (A) =
# de elementos en Ω
# de casos favorables a A
=
# de casos posibles

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 14 / 42


Demostracion del teorema 1.1
Sea p k P (fa k g) . Entonces, la suposicion (b) dice que
P (fa 1 g) = P (fa 2 g) = ... = P (fa K g)
Llamemos p P (fa i g) para cualquier i . Luego
1 = P (Ω) ( )
= P (fa 1 g [ fa 2 g [ ... [ fa K g)
= P (fa 1 g) + P (fa 2 g) + ... + P (fa K g) ( )
= p + p + ... + p
= K p
( ) por Prop. (1) de la def. de Prob., ( ) por Prop. (3) de la def. de Prob.
Despejando p nos da que
p = 1 /K
Si A = fa j1 , a j2 , ..., a jr g entonces
P (A ) = P (fa j1 g) + P (fa j2 g) + ... + P (fa jr g)
= p + p + ... + p
| {z }
r veces
= r p = r 1 /K
# de elementos en A
=
# de elementos en Ω
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 15 / 42
Espacio equiprobable, Probabilidad uniforme discreta
Cuando se cumplen las condiciones del teorema 1.1 el espacio muestral se
llama Espacio Equiprobable y la probabilidad resultante se llama
Probabilidad Uniforme Discreta

Ejercicio: con la informacion que hoy contas sobre cada una de estas situcaiones inciertas,
te parece razonable suponer probabilidad uniforme?

Situacion incierta Espacio Muestral Ω Es razonable suponer


probabilidad uniforme?

Clima mañana flluvia, nube, solg ??


Tendencia del dolar fsube , baja, estable g ??
Partido de River fgana, pierde, empata g ??
Mi estado de humor fopt., pes., amb.g ??
El tiro de un dado f1, 2, 3, 4, 5, 6 g SI !!!
Dos tiros de una moneda f(c , c ) , (c , s ) , (s , c ) , (s , s )g SI !!!
Alumnos que aprobaran f0, 1, 2, 3, ..., 50 g ??
50ava cifra decimal de π f0, 1, 2, 3, 4, 5, 6, 7, 8, 9 g ??

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 16 / 42


Calculo de probabilidades en espacios equiprobables

Situacion incierta Espacio Muestral Ω Es razonable suponer


probabilidad uniforme?

El tiro de un dado f1, 2, 3, 4, 5, 6 g SI

a. Cual es la probabilidad de que el dado caiga en un numero par?

Respuesta: A = f2, 4, 6 g , #A = 3, #Ω = 6. Luego, P (A ) = #A/#Ω = 3/6 = 1/2

b. Cual es la probabilidad de que el dado caiga en un numero impar mayor que


1?

Respuesta: A = f3, 5 g , #A = 2, #Ω = 6. Luego, P (A ) = #A/#Ω = 2/6 = 1/3

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 17 / 42


Calculo de probabilidades en espacios equiprobables

Situacion incierta Espacio Muestral Ω Es razonable suponer


probabilidad uniforme?

Dos tiros de una moneda f(c , c ) , (c , s ) , (s , c ) , (s , s )g SI

a. Cual es la probabilidad de los resultados salgan distintos?

Respuesta: A = f(c , s ) , (s , c )g , #A = 2, #Ω = 4. Luego,


P (A ) = #A/#Ω = 2/4 = 1/2

Cual es la probabilidad de que salga al menos una cara en algun tiro?

Respuesta: A = f(c , c ) , (c , s ) , (s , c )g , #A = 3, #Ω = 4. Luego,


P (A ) = #A/#Ω = 3/4 = 3/4

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 18 / 42


Sorteos de bolilleros

Situacion incierta Espacio Muestral Ω Es razonable suponer


probabilidad uniforme?
Sorteo de un bolillero con n bolillas f1, 2, ..., n g SI

a. Supongamos que en el bolillero k bolillas son rojas y las restantes son


blancas. Cual es la probabilidad de salga sorteada una bolilla roja?

Respuesta: Asumamos, sin perdida de generalidad, que las primeras k


bolillas son rojas.
Luego, A = f1, 2, ..., k g , #A = k, #Ω = n.
Entonces
P (A) = k/n

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 19 / 42


El arte de modelar

Situacion incierta Espacio Muestral Ω Es razonable suponer


probabilidad uniforme?
Sorteo de un bolillero con k frojo, blanco g NO !!!!
bolillas rojas y n k blancas

No esta mal de…nir al espacio muestral como frojo, negro g . Sin embargo, si lo
de…nimos asi, no es razonable suponer que el espacio muestral sea equiprobable,
excepto cuando n = 2k.

Este ejemplo ilustra los siguientes puntos interesantes:


Hay distintas formulaciones posibles de un espacio muestral. Sin embargo, algunas
son mas utiles que otras.
Que un espacio muestral sea equiprobable es una suposicion o modelo que segun
las circumstancias sera o no razonable.
Plantear para un problema (con resultados …nitos) un espacio que razonablemente
sea equiprobable a veces es obvio, a veces no lo es.
Para evaluar la razonabilidad de la suposicion de equiprobabilidad de un espacio
muestral no nos alcanza con conocer los elementos del espacio muesral sino
tambien las circumstancias que dan origen al espacio muestral.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 20 / 42


Conteo
El calculo de probabilidades en espacios equiprobables en realidad no
requiere especi…car quienes son los elementos del espacio muestral Ω y del
evento A, sino simplemente que seamos capaces de contar cuantos
elementos hay en cada conjunto.

Esto es importante porque en la gran mayoria de problemas reales tanto Ω


como A son enormes y especi…car sus elementos es una tarea tediosa,
cuando no practicamente imposible.

Hay muchas tecnicas y estrategias que facilitan el conteo de conjuntos. Aca


solo veremos algunos pocos resultados que aprenderemos con ejemplos.

Les recomiendo leer el capitulo 1 del libro de Blitzstein y Hwang si quieren


aprender mas sobre el tema.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 21 / 42


Conteo en experimentos compuestos
Ejemplo 1.Una heladeria ofrece tres gustos de helados: vanilla, chocolate y
frutilla; en dos posibles recipientes : vasito y cucurucho, pero en un solo
tamaño. De cuantos formas puedo elegir un helado?

Vanilla

Cucurucho Chocolate
2 recipientes
Frutilla X
.
Vanilla
3 sabores
=
Vasito Chocolate 6 opciones
Frutilla

Respuesta: Hay tres gustos y por cada gusto hay dos posibles recipientes, entonces hay
3 2 combinaciones posibles. O
Ojo!!!. En este problema NO importa el orden. Por ejemplo, la combinacion Cucurucho
seguida por Chocolate es la misma que la combinacion Chocolate seguida por Cucurucho.
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 22 / 42
Regla para conteo en experimentos compuestos.

Regla 1: consideremos un "experimento compuesto" E que consiste en dos


"sub-experimentos", E1 y E2 . Entonces,

(# resultados posibles de E ) = (# resultados posibles de E 1 ) (# resultados posibles de E 2 )

Si E consiste en k sub-experimentos E1 , E2 , ..., Ek , entonces,


# resultados posibles de E = (# resultados posibles de E 1 ) (# resultados posibles de E k )

El termino "experimento" en la regla 1 puede interpretarse libremente, como una situacion


incierta cualquiera la cual podemos sub-clasi…car de acuerdo a dos o mas categorias. Por
ejemplo, en el Ejemplo 1, el experimento es "registrar el gusto y recipiente del helado" y
los dos sub-experimentos son E 1 :"registrar el sabor", y E 2 :"registrar el recipiente" del
helado.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 23 / 42


Ejemplo de experimento con tres sub-experimentos
Ejemplo 2. Supongamos ahora que la heladeria ofrece cuatro tamanos
distintos: chico, mediano, grande y cuarto-kilo. De cuantas formas puedo
elegir un helado ahora?
SABOR RECIPIENTE TAMAÑO
Pequeno
Mediano
Cucurucho Grande

Cuarto Kg
Vainilla Pequeno

Mediano
Vasito Grande

Cuarto Kg

Pequeno
Mediano
Cucurucho
Grande
Cuarto Kg
Chocolate
Pequeno
Mediano
Vasito Grande

Cuarto Kg
Pequeno

Mediano
Cucurucho
Grande

Cuarto Kg
Frutilla Pequeno

Mediano
Vasito Grande
Cuarto Kg

Respuesta: 3 2 4 combinaciones distintas.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 24 / 42


Uso anidado de la Regla 1.
Ejemplo 3. En el ejercicio 1, supongamos que dos amigas Laura y Susana
comprarán helados. Cuales son todos los posibles resultados de sus
elecciones combinadas.
Respuesta. Sea L el experimento "eleccion de Laura", y sea S el
experimento "eleccion de Susana" y sea C el "experimento combinado
eleccion de Laura y Susana". Luego,
(# resultados posibles de C ) = (# resultados posibles de L ) (# resultados posibles de S )

L es a su vez un experimento combinado "eleccion de gusto y recipiente de


Laura", luego
(# resultados posibles de L) = 3 2=6
y del mismo modo,
(# resultados posibles de S ) = 3 2=6
De modo que la respuesta es 36, ya que
(# resultados posibles de C ) = 6 6 = 36
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 25 / 42
Muestreos con y sin reposición.
Muchos problemas de conteo se pueden ver como problemas equivalentes a
uno de los dos tipos de experimentos siguientes:

Muestreo con reposicion : En un bolillero hay n bolillas identicas excepto


por estar numeradas 1, 2, ...,n. El experimento consiste en sortear, de a una
por vez, k bolillas del bolillero, reponiendo la bolilla sorteada al bolillero
cada vez. El resultado del experimento es la k tupla ordenada (a1 , ..., ak )
, siendo a1 el primer numero sorteado, a2 el segundo, etc...

Muestreo sin reposicion : En un bolillero hay n bolillas identicas excepto


por estar numeradas 1, 2, ...,n. El experimento consiste en sortear, de a una
por vez, k bolillas del bolillero, sin reponer la bolilla sorteada al bolillero
cada vez. El resultado del experimento es la k tupla ordenada (b1 , ..., bk )
, siendo b1 el primer numero sorteado, b2 el segundo, etc...

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 26 / 42


Muestreos con y sin reposición.

Muestreo con reposición:


Muestreo sin reposición:
n = 3, k = 2
n = 3, k = 2

1 2 2

1
3
3
1

. 2 2 1

. 2
3
3
1

3 2 1
3
3
2

1er sorteo 2do sorteo


1er sorteo 2do sorteo

3 3 = 9 resultados 3 2 = 6 resultados
posibles posibles

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 27 / 42


Muestreos con y sin reposición.
Muchos problemas de conteo se pueden ver como problemas equivalentes a
uno de los dos tipos de experimentos siguientes:

Muestreo con reposición : n bolillas de las cuales se sortean k bolillas


reponiendo la bolilla sorteada cada vez.

# resultados posibles = nk

Muestreo sin reposición : n bolillas de las cuales se sortean k bolillas sin


reponer las bolillas sorteadas

# resultados posibles = n (n 1) (n 2) (n k + 1)
n!
=
(n k )!

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 28 / 42


Problema del cumpleaños.
Problema: En un aula de 25 alumnos, cual es la probabilidad de que al
menos dos alumnos cumplan años el mismo dia? (asuma que Feb 29 no
existe).
Resumen de la solucion: primero calcularemos Ω. Despues decidiremos
que es razonable suponer que Ω sea equiprobable y por lo tanto que
P (A) = #A/#Ω.
Espacio muestral Ω. Cada dia del año es como una bolilla en un bolillero
de 365 bolillas. Los cumpleaños de los 25 alumnos son el resultado de 25
sorteos con reposicion del bolillero (por qué con reposicion?). Luego
Ω = f(a1 , ..., a25 ) : ai es un numero entero entre 1 y 25g
#Ω = 36525

Como no hay ninguna razon para suponer que alguna asignacion de 25


fechas de cumpleaños sea mas probable que otra, entonces Ω es
equiprobable .
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 29 / 42
Problema del cumpleaños.
El evento de interes A : es el conjunto de las tuplas (a1 , ..., a25 ) en Ω que
tienen al menos dos de sus elementos coincidentes.
Calcular #A directamente es complicado (por que?). Mas facil es calcular
#Ac y luego calcular #A = #Ω #Ac .
Ac es el conjunto de tuplas (a1 , ..., a25 ) en Ω con todos sus elementos
distintos. Luego Ac coincide con el conjunto de todos los resultados posibles
de sortear 25 veces sin reposicion del bolillero.
Luego
#Ac = 365 364 (365 25 + 1)
#A = 36525 365 364 (365 25 + 1)
Por lo tanto,
36525 365 364 (365 25 + 1)
P (A) =
36525
365 364 (365 25 + 1)
1
36525
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 30 / 42
R
R es un entorno y lenguaje de programación gratuito para hacer gra…cos y
calculos estadisticos. Es un lenguage muy popular en la ciencia de datos.

Podes bajarte R del sitio http://www.r-project.org

Ademas bajate la interface Rstudio- tambien gratuita - que facilita trabajar


con R, del sitio http://www.rstudio.com

En R, el codigo y la salida para el problema del cumpleaños es


k <- 25
1-prod((365-k+1):365)/365^k
El resultado es
[1] 0.5686997

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 31 / 42


Calculo en R de la solucion del problema del cumpleaños.
En R, las lineas que empiezan con # son comentarios no ejecutables.
El codigo para calcular la probabilidad para aulas con k = 2, 3, 4, ..., 100
alumnos y guardar el resultado en un vector p es:

# generamos un vector p de dimension 99


# luego calculamos las prob. y las guardamos en p
p <- matrix(0,1,99)

for (k in 2:100){
p[1,k-1]<-1-prod((365-k+1):365)/365^k}
Imprimimos los valores de las probabilidades para aulas con 2, 3, 4, 5 y 6
estudiantes
p[1,1:5]
[1] 0.002739726 0.008204166 0.016355912 0.027135574
0.040462484
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 32 / 42
Gra…co en R de la solucion del problema del cumpleaños.
Ahora gra…camos las probabilidades contra los numeros de alumnos por
aula.

plot(2:100,p,xlab="numero de alumnos", ylab="probabilidad",


main="probabilidad de dos o mas coincidencias")

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 33 / 42


Paquetes para gra…car en R

Para construir el gra…co de las probabilidades en nuestro problema usé el


paquete para gra…car que se instala automaticamente con R.

Para construir gra…cos mas so…sticados hay un paquete ggplo2 que es


excelente. Para instalarlo usa los comandos install.packages(ggplo2)y
library(ggplo2)

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 34 / 42


Interpretacion de la probabilidad
Los axiomas de probabilidad nos dan reglas para decidir si una funcion P es
una probabilidad. Sin embargo, los axiomas no nos dicen como interpretar a
la funcion P.
Como interpretamos las siguientes a…rmaciones?
a. la probabilidad de que el tiro de una moneda caiga en cara es 1/2
b. la probabilidad de que de un bolillero con k bolillas rojas y n k blancas salga
sorteada una roja es k /n"
c. la probabilidad de que en un aula con 25 alumnos haya al menos dos con
cumpleaños el mismo dia es 0.57
d. la probabilidad de que manana me parta un rayo es 10 20 .

e. la probabilidad de que la 50ava cifra decimal del numero π sea 7 es 1/10

A grandes rasgos hay dos escuelas …losó…cas: la frecuentista y la Bayesiana.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 35 / 42


Interpretacion de la probabilidad: escuela frecuentista.
Escuela Frecuentista: la probabilidad de un evento representa la frecuencia
a la larga de la ocurrencia del evento si pudiesemos repetir el "experimento
aleatorio" in…ntas veces.

Esta interpretacion tiene sustento teorico en un Teorema que veremos mas adelante
llamado "Ley de los Grandes Numeros" .
Notemos que esta interpretacion implica que a pesar de todo, hay regularidades en
la incertidumbre...
En el caso (a), P (cara ) = 1/2 se interpreta como: en la mitad de in…nitos tiros de
una misma moneda, la moneda caera en "cara".
En el caso (b), P (roja ) = k /n se interpreta como: en k /n de in…nitos sorteos del
mismo bolillero, la bolilla sorteada sera roja.
La regularidad "a la larga" de la probabilidad es muy util. Por ejemplo, cuando se
tira una moneda para decidir que equipo arranca un partido de futbol, la
probabilidad garantiza que esta estrategia "a la larga" es objetiva.
La interpretacion es problematica en los casos (c) - (e) porque no hay realmente un
experimento ni la posibilidad de repetirlo in…nitamente.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 36 / 42


Interpretacion de la probabilidad: escuela Bayesiana.
Escuela Bayesiana: La probabilidad representa grados de creencia"
subjetivos sobre el evento en cuestion.

Hay distintas formas de "calibrar" una probabilidad subjetiva.


Una de ellas es por medio de apuestas en juegos sin perdida. Veamos
como asigno el valor a P (A) siguiendo esta logica. Consideremos dos
juegos.
Juego 1. Saco una bolilla de un bolillero con k bolillas rojas y n k
bolillas blancas. Si sale roja, recibo un premio de un millon de dolares,
si sale seca no recibo nada.
Juego 2. Si el evento A es cierto, recibo un millon de dolares, de lo
contrario no recibo nada.
Entonces, la probabilidad P (A) que le asigno al evento A es k/n si
para el par (k, n) me da lo mismo -soy indiferente a- jugar cualquiera
de los dos juegos.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 37 / 42


Bolilleros continuos
Para calibrar probabilidades que no sean fracciones k /n necesitamos
extender un poco nuestra imaginacion de la siguiente forma.

Consideremos la masa de todas las bolillas de un bolillero que tiene k


bolillas rojas y n k blancas, siendo todas las bolillas identicas excepto por
su color.

La fraccion de la masa total ocupada por bolillas rojas es k /n.

Entonces podriamos haber imaginado directamente un bolillero con dos


bolillas solamente, la bolilla roja con masa k /n y la blanca con masa
n k /n. Asi, la masa, de cada bolilla del bolillero representa la probabilidad
de cada elemento del espacio muestral frojo, blanco g .

Para conceptualizar probabilidades que no sean numeros racionales, -por


ejemplo 1/π - podemos extender esta idea, considerando ahora bolilleros
con bolillas de distinta masa, con masas que pueden ser cualquier numero
real.
Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 38 / 42
Bolilleros con in…nito numerables bolillas
A veces necesitaremos considerar espacios con in…nitas, pero numerables
bolillas.

Por ejemplo: en el experimento numero de tiros hasta que emboque al aro el


espacio muestral es
Ω = f1, 2, 3, ...g

Un espacio in…nito numerable no puede ser equiprobable, por que?

) En espacios in…nito numerables la asignacion de probabilidad


necesariamente tiene que estar asociada a un modelo de bolillero con bolillas
de distintas masas.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 39 / 42


Modelos para situaciones inciertas con resultados en un
continuo
En muchos casos, los posibles resultados de una situacion incierta son un
continuo.. es decir son todos los valores de un intervalo.

Por ejemplo, la temperatura manana a las 8 hs, o la hora a la que arribare a


mi o…cina mañana

Para esos casos, no podemos usar el modelo de bolillero, pero podemos


imaginarnos una un intervalo de una ruta con barro de distinta masa
disperso a lo largo de la ruta.

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 40 / 42


Reglas de la probabilidad
Los tres axiomas de la probabilidad implican las siguientes propiedades

1. P (∅) = 0
2. P (A c ) = 1 P (A )
3. Si A B entonces P (A ) P (B )
4. P (A [ B ) = P (A ) + P (B ) P (A \ B )
5. P (A [ B ) P (A ) + P (B )
6. Si A B entonces P (B A ) = P (B ) P (A )

Demostracion de propiedad (2) (las otras demostraciones quedan como problemas para
la practica)
Ω = A [ A c . Ademas, A y A c son disjuntos. Luego,
1 = P (Ω) = P (A [ A c ) = P (A ) + P (A c ) . Luego, P (A c ) = 1 P (A ) .

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 41 / 42


Muestreo en R
El comando sample en R nos permite simular con y sin reemplazo.
Para simular los resultados de sortear sin reposicion de un bolillero con
bolillas numeradas del 1 al 10
n <- 10
k <- 5
sample(n,k)
Con resultado [1] 4 8 10 3 7
Si repito el comando sample(n,k) obtengo [1] 6 5 3 1 8
Para generar con reposicion
n <- 10
k <- 5
sample(n,k, replace=TRUE)

Con resultado [1] 2 1 5 10 2

Rotnitzky, Ferrari, Cersosimo (UTDT) De…niciones 5 Marzo, 2018 42 / 42

Vous aimerez peut-être aussi