Vous êtes sur la page 1sur 46

7.

Distribucin normal
Sin duda, la distribucin continua de probabilidad ms importante, por la frecuencia con que se encuentra y por sus aplicaciones tericas, es la distribucin normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relacin con la teora de los errores de observacin astronmica y fsica .
Anatoli Timofyevich Fomenko Gaussian Distributions I and II
1

Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una especie (tallas, pesos, dimetros, permetros,...). Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen,... Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco.

Errores cometidos al medir ciertas magnitudes. Valores estadsticos muestrales, por ejemplo: la media. Y en general cualquier caracterstica que se obtenga como suma de muchos factores. Otras distribuciones como la binomial o la de Poisson se aproximan a la normal. Distribuciones binomiales con n grande (n >30) y p ni pequeo (np > 5) 2 ni grande ( n (1-p) > 5 ).

Distribucin normal o gaussiana


Est caracterizada por dos parmetros: la media, y la desviacin tpica, . Su funcin de densidad es:
( x ) 2 2 2

1 N (, ) = P( x) = e 2

( > 0)

La curva normal adopta un nmero infinito de formas, determinadas por sus parmetros y .
3

Caractersticas de la distribucin Normal


Tiene forma de campana, es asinttica al eje de las abscisas (para x = ) Simtrica con respecto a la media () donde coinciden la mediana (Mn) y la moda (Mo). Los puntos de inflexin tienen como abscisas los valores .

Puntos de inflexin

- , Mo, Mn +

+
4

Distribucin normal con =0 para varios valores

1.6

1.2

=0.25 =0.5 =1

p(x)

0.8

0.4

0 -2.50 -1.50 -0.50 x 0.50 1.50 2.50


5

1 N (, ) = P( x) = e 2

( x ) 2 2 2

( > 0)

=5

=5

= 10

20

30

40

50

60

70

80

90

100

110

120

Curvas normales con distintas medias y desviaciones estndar. 6

N(, ): Interpretacin geomtrica

Podemos interpretar la media como un factor de traslacin. Y la desviacin tpica como un factor de escala, grado de dispersin,
7

N(, ): Interpretacin probabilista


Entre la media y una desviacin tpica tenemos siempre la misma probabilidad: aproximadamente el 68%. Entre la media y dos desviaciones tpicas aprox. 95%
Si tomamos intervalos centrados en , y cuyos extremos estn
a distancia , a distancia 2 , a distancia 25 tenemos probabilidad 68% tenemos probabilidad 95% tenemos probabilidad 99%
8

1 N (, ) = P( x) = e 2

( x ) 2 2 2

Podemos obtener la funcin de distribucin F(x) integrando la funcin de densidad de probabilidad:

1 F ( x) = 2

( v ) 2 2 2

dv

De modo que la probabilidad de una variable aleatoria normal X en un intervalo a x b es:


b ( v ) 2 2 2

1 P (a X b) = F (b) F (a ) = e 2 a
En particular:

dv

1 2

( v ) 2 2 2

dv = 1

No podemos calcular analticamente el valor de la integral! Tabularemos sus valores numricos...

Cmo calcular probabilidades asociadas a una curva normal especfica?


Dado que tanto como pueden asumir infinitos valores, es impracticable tabular las probabilidades para todas las posibles distribuciones normales. Para solucionarlo, se utiliza la distribucin normal reducida o tipificada. Se define una variable

z=

x -

Es una traslacin , y un cambio de escala de la variable original.


10

NORMAL con media = 0 y desviacin tpica = 1


Recordemos de nuevo que en cualquier distribucin normal las probabilidades delimitadas entre :

La nueva variable z se distribuye como una

= 68 % 2 = 95 % 3 = 99 %

95% 68% 99%


68% 95% -3 -2 -1 99% 0 z 1 2 3
11

Tipificacin
Dada una variable de media y desviacin tpica , se denomina valor tipificado z, de una observacin x, a la distancia (con signo) con respecto a la media, medido en desviaciones tpicas, es decir:

z=

En el caso de variable X normal, la interpretacin es clara: asigna a todo valor de N(, ), un valor de N(0,1) que deja exctamente la misma probabilidad por debajo. Nos permite as comparar entre dos valores de dos distribuciones normales diferentes, para saber cul de los 12 dos es ms extremo.

13

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y se asignar al que tenga mejor expediente acadmico: El estudiante A tiene una calificacin de 8 en un sistema donde la calificacin de los alumnos se comporta como N(6,1). El estudiante B tiene una calificacin de 80 en un sistema donde la calificacin de los alumnos se comporta como N(70,10).
No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribucin de referencia N(0,1). Como zA > zB, podemos decir que el porcentaje de compaeros del mismo sistema de estudios que ha superado en calificacin al estudiante A es mayor que el que ha superado B. En principio A es mejor candidato para la beca.

zA =

xA A

A x B 80 70 zB = B = =1 B 10 14

86 =2 1

Apliquemos el cambio de variable tipificada a la funcin de distribucin F(x):

1 F ( x) = 2
z2 2

( v ) 2 2 2

dv

dv = dz

z =

1 p( z ) = e 2

; < z <

1 F ( z ) = p( Z z ) = 2

u2 2

du

Las probabilidades de la variable tipificada (z) estn tabuladas para los diferentes valores de la variable. Para calcular probabilidades, una vez transformada, la variable a valores de z, se busca en una tabla el rea correspondiente.
15

1 p( z ) = e 2

z2 2

; < z <

Caracterstica de la distribucin normal tipificada (reducida o estndar): No depende de ningn parmetro. Su media es 0, su varianza es 1 y su desviacin tpica es 1. La curva f(x) es simtrica respecto al eje de ordenadas y tiene un mximo en este eje. Tiene dos puntos de inflexin en z =1 y z = -1.

1 F ( z ) = p( Z z ) = 2

u2 2

du

16

Hay varios tipos de tablas de la distribucin normal La que se explica aqu representa las reas para los diferentes valores de z desde 0 hasta +.

Los valores negativos de z NO estn tabulados, ya que la distribucin es simtrica

17

18

La tabla consta de:

*Margen izquierdo : Los enteros de z y su primer decimal. * Margen superior: segundo decimal * Cuerpo de la tabla: reas correspondientes, acumuladas, desde 0 hasta 3.99 2 3 4 5 6 7 8 9

0.0 0.1 0.2 0.3 0.4 0.5

.0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359 .0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .... .1179 ..... .1554 .... ...... ..... ...... .... ...... ...... ......

.1915 ....

19

EJEMPLOS:
1.-Cul es la probabilidad de que un valor de z est entre 0 y -2.03? 2.-Cul es la probabilidad de que un valor de z est entre -2.03 y +2.03? 3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z < )

5. Hallar P ( 0.34 < z < 2.30 )

20

Ejemplo 1
Cul es la probabilidad de que un valor de z est entre 0 y -2.03?

Cmo la curva es simtrica P (-2.03 < z < 0) = P (0 < z < 2.03)

?
-3 -2 -1 0 1 2 z 3
21

Ejemplo 1
Cul es la probabilidad de que un valor de z est entre 0 y -2.03? Se busca en la tabla el rea correspondiente a z = 2.03

0 1.8 1.9 2.0 2.1

0.47882

47. 88%
-3 -2 -1 0 1 2 z 3
22

Ejemplo 2
Cul es la probabilidad de que un valor de z est entre -2.03 y 2.03 ? En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03 = 0.47882 La misma rea hay entre 0 y -2.03 , por lo tanto P ( -2.03< z< 2.03) = 0.95764

? 95.76%
47.88%
-3 -2 -1 0

47.88%
1 2 z 3
23

Ejemplo 3
Cul es la probabilidad de que un valor de z sea mayor a 1.25 ? 1.- La probabilidad de 0 < z < + = 0.500 2.- La probabilidad de 0 < z < 1.25 = 0.39435 3.- La probabilidad de z > 1.25 = 0.500 - 0.39435= 0.10565

50% 39.44% 10.56%

-3

-2

-1

z 3
24

Ejemplo 4
Hallar P( -0.34 < z < ) P(0 < z <0.34) = 0.13307 = P(-0.34 < z < 0) P (0 < z < ) = 0.50000 P( -0.34 < z < ) = 0.13307 + 0.50000 = 0.63307

63.31%

13.31%

50% z

-3

-2

-1

25

Ejemplo 5
Hallar P( 0.34 < z < 2.30) P(0< z <0.34) = 0.13307 P( 0 < z < 2.30) = 0.4893 P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623

35.62% z 3
26

-3

-2

-1

EJEMPLO Sea una variable distribuida normalmente con media = 4 y desviacin tpica = 1.5. Cul es la probabilidad de encontrar un valor x 6 (P(x 6 ))?

27

=4

= 1.5

Hallar P ( x > 6 )

1.- transformar x en un valor de z z = (6 - 4)/1.5 = 1.33 2.- Hallar P ( 0 < z < 1.33) = 3.- 0.5000 - 0.40824 = 0.40824 0.5

x z=

0.09176

?
-0.5 -3 1 -2 2.5 -1 4 0 5.5 6 1 1.33 7 2

x
8.5 3 z
28

Hasta ahora vimos como dado un valor x de la variable, hallar probabilidades transformando (estandarizacin) la variable en valores de x- z= Cmo hallar un valor de x, dada la probabilidad?
Ejemplo: Sea una variable distribuida normalmente con =4 y = 2. Hallar el valor de x que deja por encima de l un 38.20% (0.3820). Se debe desestandarizar :

x=z+

0.5000 - 0.382 = 0.118 Se busca en la tabla el valor ms aproximado:0.1179 corresponde a z =+ 0.30 Sustituyendo en la frmula

38.20%

0.30 2 + 4 = 4.60

x=? 4.60

29

30

Nota: Cuando n > 20, np 5, y n(1-p) 5 la distribucin binomial puede aproximarse por una normal con

= np
= np (1 p )
31

32

33

En una empresa se ha visto que en un 10% de sus facturas se cometen errores y se desea calcular la probabilidad que de 100 facturas, 12 de ellas los contengan:
= 100(.10) = 10

=
z1

) 3 np (1 p=

z2

12.5 10.0 = = 0.83 0.2967 z1 3 11.5 10 = = 0.5 0.1915 z2 3 P (12) = 0.2967 0.1915 = 0.1052

35

36

37

Calcular con la aguja de Buffon

43

44

45

46