Vous êtes sur la page 1sur 10

DISTRIBUCIN NORMAL

Variable aleatoria de la distribucin normal


Una variable aleatoria continua, X, sigue una distribucin normal de media y desviacin tpica ,
y se designa por N(, ), si se cumplen las siguientes condiciones:
1. La variable puede tomar cualquier valor: (-, +)
2. La funcin de densidad, es la expresin en trminos de ecuacin matemtica de la curva de
Gauss:

Curva de la distribucin normal

El campo de existencia es cualquier valor real, es decir, (-, +).

Es simtrica respecto a la media .

Tiene un mximo en la media .

Crece hasta la media y decrece a partir de ella.

En los puntos y + presenta puntos de inflexin.

El eje de abscisas es una asntota de la curva.

El rea del recinto determinado por la funcin y el eje de abscisas es igual a la unidad.

Al ser simtrica respecto al eje que pasa por x = , deja un rea igual a 0.5 a la izquierda y otra
igual a 0.5 a la derecha.

La probabilidad equivale al rea encerrada bajo la curva.

p( - < X + ) = 0.6826 = 68.26 %


p( - 2 < X + 2) = 0.954 = 95.4 %
p( - 3 < X + 3) = 0.997 = 99.7 %

DISTRIBUCIN NORMAL ESTNDAR


La distribucin normal estndar, o tipificada o reducida, es aquella que tiene por media el
valor cero, = 0, y por desviacin tpica la unidad, =1.
Su funcin de densidad es:

Su grfica es:

La probabilidad de la variable X depender del rea del recinto sombreado en la figura. Y para
calcularla utilizaremos una tabla.
Tipificacin de la variable

Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribucin N(,
) en otra variable Z que siga una distribucin N(0, 1).

APROXIMACIN DE LA BINOMIAL POR LA NORMAL


Teorema de Moivre
Si:
n p 5 y n q 5.
La distribucin binomial B(n, p) se puede aproximar mediante una distribucin nor ma l:

Ejemplo:

En una ciudad una de cada tres familias posee telfono. Si se eligen al azar 90 familias, calcular la
probabilidad de que entre ellas haya por lo menos 30 tengan telfono.

DISTRI BUCIN BINOMIAL

Un experimento sigue el modelo de la distribucin binomial o de Bernoulli si:


1. En cada prueba del experimento slo son posibles dos resultados: el suceso A (xito) y su
contrario .
2. La probabilidad del suceso A es constante, es decir, que no vara de una prueba a otra. Se
representa por p.
3. El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
La distribucin binomial se suele representar por B(n, p).
n es el nmero de pruebas de que consta el experimento.
p es la probabilidad de xito.
La probabilidad de

es 1 p, y la representamos por q.

Variable aleatoria binomial


La variable aleatoria binomial , X, expresa el nmero de xitos obtenidos en cada
prueba del experimento.
La variable binomial es una variable aleatoria discreta , slo puede tomar los valores 0,
1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.
FUNCIN DE PROBABILIDAD DE LA DISTRIBUCIN BINOMIAL
La funcin de probabilidad de la distribucin binomial , tambin denominada funcin de
la distribucin de Bernoulli, es:

n
k
p
q

es el nmero de pruebas.
es el nmero de xitos.
es la probabilidad de xito.
es la probabilidad de fracaso.

El nmero combinatorio

Media y varianza de la distribucin binomial


Media

Varianza

Desviacin tpica

DISTRIBUCIN DE POISSON
Se trata de un modelo discreto, pero en el que el conjunto de valores con probabilidad no nula no es
finito, sino numerable. Se dice que una variable aleatoria X sigue la distribucin de Poisson si su
funcin de densidad viene dada por:

Como vemos, este modelo se caracteriza por un slo parmetro , que debe ser positivo.
Esta distribucin suele utilizarse para contajes del tipo nmero de individuos por unidad de tiempo,
de espacio, etc.
Propiedades del modelo de Poisson
1) Esperanza: E(X) = .
2) Varianza: V(X) = .
En esta distribucin la esperanza y la varianza coinciden.

3) La suma de dos variables aleatorias independientes con distribucin de Poisson resulta en una
nueva variable aleatoria, tambin con distribucin de Poisson, de parmetro igual a la suma de
parmetros:
X1 ~ P( = 1) y

X2 ~ P( = 2)

y definimos Z = X1 + X2, entonces,


Z ~ P( = 1 + 2)
Este resultado se extiende inmediatamente al caso de n variables aleatorias independientes con
distribucin de Poisson. En este caso, la variable suma de todas ellas sigue una distribucin de
Poisson de parmetro igual a la suma de los parmetros.

DISTRIBUCIN WEIBULL
Se trata de un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un
mecanismo falla, etc. La funcin de densidad de este modelo viene dada por:

que, como vemos, depende de dos parmetros: > 0 y > 0, donde es un parmetro de escala y
es un parmetro de forma (lo que proporciona una gran flexibilidad a este modelo).
La funcin de distribucin se obtiene por la integracin de la funcin de densidad y vale:

Propiedades de la distribucin Weibull


1. Si tomamos = 1 tenemos una distribucin Exponencial.
2. Su esperanza vale:

Su varianza vale:

DISTRIBUCIN GEOMTRICA
Definamos una experiencia aleatoria cuyo resultado slo puede ser el suceso A o su
complementario Ac, y que se repite secuencialmente hasta que aparece el suceso A por primera vez.
Definamos la variable aleatoria X como el nmero de veces que repetimos la experiencia en
condiciones independientes hasta que se d A por primera vez. Bajo estas condiciones, decimos que
la variable X sigue una distribucin geomtrica o de Pascal de parmetro p = P(A).
La funcin de densidad puede deducirse fcilmente de la definicin:

f(k) = P[X = k] = (1 p)k p

k = 0, 1, 2, ...

Algunas puntualizaciones de la definicin de X:

Notse que, en esta definicin, condiciones independientes significa que p, la probabilidad


de A, y 1 p, la de su complementario Ac, no varan a lo largo de las sucesivas repeticiones
de la experiencia.

Tal y como la hemos definido, X se refiere al nmero de lanzamientos hasta que se


produce A, pero sin contabilizar el ltimo caso en que se da A. Por dicha razn X puede
tomar los valores k = 0, 1, 2, ... con probabilidad no nula.

Un ejemplo de este modelo podra ser la experiencia consistente en lanzar sucesivamente un dado
regular hasta que aparezca el nmero 6. Si definimos la variable aleatoria X como elnmero de
lanzamientos de un dado regular hasta que aparezca un 6, queda claro que X sigue una distribucin
geomtrica de parmetro p = 1/6.
Propiedades del modelo Geomtrico o de Pascal
1) Esperanza: E(X) = (1 p)/p
2) Varianza: V(X) = (1 p)/p2

DISTRIBUCIN HIPERGEOMTRICA
Este modelo presenta similitudes con el Binomial, pero sin la suposicin de independencia de ste
ltimo. Vemoslo:

Partimos de un conjunto formado por N individuos divididos en dos categoras mutuamente


excluyentes: A y Ac;
de
manera
que N1 individuos
pertenecen
a
la

categora A yN2 individuos, a la categora Ac. Por tanto, se cumple que


N = N1 + N2

Si del conjunto anterior extraemos n individuos sin reemplazamiento (n N), la


variable X que representa el nmero k de individuos que pertenecen a la categora A (de
los n extrados) tiene por funcin de densidad:

La dependencia se debe al hecho de que N es finito y las extracciones se efectan sin


reemplazamiento. El caso de extracciones con reemplazamiento sera equivalente al de N infinito y
se resolvera mediante el modelo Binomial.
Propiedades del modelo Hipergeomtrico
1) Esperanza: E(X) = n * N1/N
2) Varianza: V(X) = (n *N1 *N2 (N n))/(N2 * (N 1))

VALOR ATPICO O OUTLIER


Antes de realizar cualquier anlisis estadstico con nuestros datos, es recomendable observar si
existen entre las variables a estudiar, valores anmalos o extraos que pueden alterar el resultado
final. En estadstica, a estos valores se les denomina outliers o atpicos.
Pueden ser valores extremadamente elevados o bajos. El diagrama de cajas (boxplot), es un
instrumento grfico de la estadstica descriptiva que permite realizar un anlisis ms detallado y

conciso respecto a la distribucin de los datos y nos permite determinar si la muestra tiene
elementos outliers y si presenta un sesgo a la izquierda a la derecha o izquierda.
Uno de los mtodos ms utilizados en estadstica para la deteccin de outliers es el que utiliza el
concepto de cuartil de un conjunto de datos.
Si tenemos un conjunto de datos y lo ordenaremos de menor a mayor, el Cuartil 1, llammosle Q1,
es el valor tal que desde ese valor hacia su izquierda se encuentran la primera cuarta parte de los
valores de este conjunto de datos.
El Cuartil 2, llammosle Q2, es el valor tal que desde ese valor hacia su izquierda se encuentran la
primera mitad de los valores de este conjunto de datos. Y as sucesivamente. Para detectar valores
outliers moderados, tendramos:
LmInf = Q1- 1.5(Q3-Q1)
LmSup = Q3 + 1.5(Q3-1)
Los valores que sean menores que LmInf o mayores que LmSup se consideran valores outliers.
Para detectar valores outliers extremos, tendramos:
LmInf = Q1- 3 (Q3-Q1)
LmSup = Q3 + 3 (Q3-1)
Los valores que sean menores que LmInf o mayores que LmSup se consideran valores outliers.

Vous aimerez peut-être aussi