Académique Documents
Professionnel Documents
Culture Documents
El rea del recinto determinado por la funcin y el eje de abscisas es igual a la unidad.
Al ser simtrica respecto al eje que pasa por x = , deja un rea igual a 0.5 a la izquierda y otra
igual a 0.5 a la derecha.
Su grfica es:
La probabilidad de la variable X depender del rea del recinto sombreado en la figura. Y para
calcularla utilizaremos una tabla.
Tipificacin de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribucin N(,
) en otra variable Z que siga una distribucin N(0, 1).
Ejemplo:
En una ciudad una de cada tres familias posee telfono. Si se eligen al azar 90 familias, calcular la
probabilidad de que entre ellas haya por lo menos 30 tengan telfono.
es 1 p, y la representamos por q.
n
k
p
q
es el nmero de pruebas.
es el nmero de xitos.
es la probabilidad de xito.
es la probabilidad de fracaso.
El nmero combinatorio
Varianza
Desviacin tpica
DISTRIBUCIN DE POISSON
Se trata de un modelo discreto, pero en el que el conjunto de valores con probabilidad no nula no es
finito, sino numerable. Se dice que una variable aleatoria X sigue la distribucin de Poisson si su
funcin de densidad viene dada por:
Como vemos, este modelo se caracteriza por un slo parmetro , que debe ser positivo.
Esta distribucin suele utilizarse para contajes del tipo nmero de individuos por unidad de tiempo,
de espacio, etc.
Propiedades del modelo de Poisson
1) Esperanza: E(X) = .
2) Varianza: V(X) = .
En esta distribucin la esperanza y la varianza coinciden.
3) La suma de dos variables aleatorias independientes con distribucin de Poisson resulta en una
nueva variable aleatoria, tambin con distribucin de Poisson, de parmetro igual a la suma de
parmetros:
X1 ~ P( = 1) y
X2 ~ P( = 2)
DISTRIBUCIN WEIBULL
Se trata de un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un
mecanismo falla, etc. La funcin de densidad de este modelo viene dada por:
que, como vemos, depende de dos parmetros: > 0 y > 0, donde es un parmetro de escala y
es un parmetro de forma (lo que proporciona una gran flexibilidad a este modelo).
La funcin de distribucin se obtiene por la integracin de la funcin de densidad y vale:
Su varianza vale:
DISTRIBUCIN GEOMTRICA
Definamos una experiencia aleatoria cuyo resultado slo puede ser el suceso A o su
complementario Ac, y que se repite secuencialmente hasta que aparece el suceso A por primera vez.
Definamos la variable aleatoria X como el nmero de veces que repetimos la experiencia en
condiciones independientes hasta que se d A por primera vez. Bajo estas condiciones, decimos que
la variable X sigue una distribucin geomtrica o de Pascal de parmetro p = P(A).
La funcin de densidad puede deducirse fcilmente de la definicin:
k = 0, 1, 2, ...
Un ejemplo de este modelo podra ser la experiencia consistente en lanzar sucesivamente un dado
regular hasta que aparezca el nmero 6. Si definimos la variable aleatoria X como elnmero de
lanzamientos de un dado regular hasta que aparezca un 6, queda claro que X sigue una distribucin
geomtrica de parmetro p = 1/6.
Propiedades del modelo Geomtrico o de Pascal
1) Esperanza: E(X) = (1 p)/p
2) Varianza: V(X) = (1 p)/p2
DISTRIBUCIN HIPERGEOMTRICA
Este modelo presenta similitudes con el Binomial, pero sin la suposicin de independencia de ste
ltimo. Vemoslo:
conciso respecto a la distribucin de los datos y nos permite determinar si la muestra tiene
elementos outliers y si presenta un sesgo a la izquierda a la derecha o izquierda.
Uno de los mtodos ms utilizados en estadstica para la deteccin de outliers es el que utiliza el
concepto de cuartil de un conjunto de datos.
Si tenemos un conjunto de datos y lo ordenaremos de menor a mayor, el Cuartil 1, llammosle Q1,
es el valor tal que desde ese valor hacia su izquierda se encuentran la primera cuarta parte de los
valores de este conjunto de datos.
El Cuartil 2, llammosle Q2, es el valor tal que desde ese valor hacia su izquierda se encuentran la
primera mitad de los valores de este conjunto de datos. Y as sucesivamente. Para detectar valores
outliers moderados, tendramos:
LmInf = Q1- 1.5(Q3-Q1)
LmSup = Q3 + 1.5(Q3-1)
Los valores que sean menores que LmInf o mayores que LmSup se consideran valores outliers.
Para detectar valores outliers extremos, tendramos:
LmInf = Q1- 3 (Q3-Q1)
LmSup = Q3 + 3 (Q3-1)
Los valores que sean menores que LmInf o mayores que LmSup se consideran valores outliers.