Académique Documents
Professionnel Documents
Culture Documents
ESTADSTICA DESCRIPTIVA
Qu es la estadstica?
Cuando se habla de estadstica, se suele pensar en una relacin de datos numricos
presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto
popular que existe sobre el trmino y que cada vez est ms extendido debido a la
influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de
difusin, peridico, radio, televisin, etc, no nos aborde diariamente con cualquier tipo
de informacin estadstica sobre accidentes de trfico, ndices de crecimiento de
poblacin, turismo, tendencias polticas, etc.
Slo cuando nos adentramos en un mundo ms especfico como es el campo de la
investigacin de las Ciencias Sociales: Medicina, Biologa, Psicologa, ... empezamos a
percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica
herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto
beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su
variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes
Ejemplo
Consideremos la poblacin formada por todos los estudiantes de la ESPOL (finita). La
altura media de todos los estudiantes es el parmetro
alumnos del Bsico es una muestra de dicha poblacin y la altura media de los
estudiantes que conforman esta muestra es el estadstico o estimador .
dominio de la variable o rango. En funcin del tipo del dominio de la variable se las
clasifica de la siguiente manera:
Variables cualitativas,
cuando las modalidades posibles son de tipo nominal (que no se puede contar).
Por ejemplo, una variable de color
Variables cuantitativas
son las que tienen por modalidades cantidades numricas con las que podemos
hacer operaciones aritmticas. Dentro de este tipo de variables podemos
distinguir dos grupos:
o Discretas,
cuando no admiten siempre una modalidad intermedia entre dos cualesquiera
de sus modalidades.
Ejemplo: el nmero X, obtenido en el lanzamiento repetido de un dado. Es
obvio que cada valor de la variable es un nmero natural
o Continuas,
cuando admiten una modalidad intermedia entre dos cualesquiera de sus
modalidades.
Ejemplo: la estatura X de un nio al nacer. En este caso los valores de las
variables son nmeros reales, es decir
Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece
como discreta. Este es el caso en que hay limitaciones en lo que concierne a la
precisin del aparato de medida de esa variable, es decir, si medimos la altura en
metros de personas con una regla que ofrece dos decimales de precisin,
podemos obtener
En realidad lo que ocurre es que con cada una de esas mediciones expresamos
que el verdadero valor de la misma se encuentra en un intervalo de radio
. Por tanto cada una de las observaciones de X representa ms bien un
intervalo que un valor concreto.
Tal como hemos citado anteriormente, las modalidades son las diferentes situaciones
posibles que puede presentar la variable. A veces stas son muy numerosas (ejemplo:
cuando una variable es continua) y conviene reducir su nmero, agrupndolas en una
cantidad inferior de clases. Estas clases deben ser construidas, tal como se estudiar ms
adelante, de modo que sean exhaustivas e incompatibles, es decir, cada modalidad debe
pertenecer a una y slo una de las clases.
Estadstica descriptiva: Describe, analiza y representa un grupo de datos utilizando
mtodos numricos y grficos que resumen y presentan la informacin contenida en
ellos.
Estadstica inferencial: Apoyndose en el clculo de probabilidades y a partir de datos
muestrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones
sobre un conjunto mayor de datos.
Variables Discretas: cuando no admiten siempre una modalidad intermedia entre dos
cualesquiera de sus modalidades. Sus modalidades son valores enteros.
Variables Continuas: cuando admiten una modalidad intermedia entre dos cualesquiera de sus
modalidades. Sus modalidades son valores reales.
Variable cualitativa:
Aquella cuyas modalidades son de tipo nominal.
Variable cuasi cuantitativa:Modalidad del tipo nominal y que tienen orden.
Diagrama de Paretto
Un diagrama de Paretto se asemeja a un Histograma, excepto que es una grfica de
barras de frecuencias de una variable cualitativa, no de datos cuantitativos agrupados en
clases. Las barras pueden representar frecuencias o porcentajes, se organizan en orden
descendente de izquierda a derecha.
Los diagramas de Paretto se utilizan en el control de procesos para tabular las causas
asociadas con variaciones de causas atribuibles en la calidad del producto del proceso.
Ejemplo: Se encontr que en una planta de ensamblado de refrigeradores no fueron
aprobados en inspeccin final, con forme muestra el siguiente cuadro:
Defecto
Conteo
Porcentaje
% acumulado
Ensamble
98
49.0
49.0
Laca
60
30.0
79.0
Elctrico
20
10.0
89.0
Abolladuras
12
6.0
95.0
Otros
10
5.0
100.0
Distribucin de Frecuencias
Construccin de Tablas estadsticas
Consideremos una poblacin estadstica de n individuos, descrita segn un carcter o
variable C cuyas modalidades han sido agrupadas en un nmero k de clases, que
denotamos mediante
. Para cada una de las clases ci,
introducimos las siguientes magnitudes:
Frecuencia absoluta
de la clase ci es el nmero ni, de observaciones que presentan una modalidad
perteneciente a esa clase.
Frecuencia relativa
de la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el
nmero total de observaciones, es decir
Obsrvese que fi es el tanto por uno de observaciones que estn en la clase ci.
Multiplicado por
esa clase.
ni
c1
n1
...
...
cj
nj
...
...
ck
nk
n
Ni
Fi
fi
N1 = n1
...
...
...
...
...
...
Nk = n
Fk = 1
Ejemplo
Calcular los datos que faltan en la siguiente tabla:
li-1 -- li
ni
fi
Ni
0 -- 10
60
f1
60
10 -- 20
n2
0,4
N2
20 -- 30
30
f3
170
30 -- 100
n4
0,1
N4
100 -- 200
n5
f5
200
n
Solucin:
N3=170 y n3=30
=>
N2= N3-n3=170-30=140.
Adems
n1=60,
=>
n2= N2-n1=140-60=80.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia
relativa correspondiente:
As:
n5 =N5 -N4=200-190=10.
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
ni
fi
Ni
0 -- 10
60
0,3
60
10 -- 20
80
0,4
140
20 -- 30
30
0,15
170
30 -- 100
20
0,1
190
100 -- 200
10
0,05
200
200
Eleccin de las clases
En cuanto a la eleccin de las clases, deben seguirse los siguientes criterios en funcin
del tipo de variable que estudiemos:
M. clase
Frec. Abs.
Frec. Rel.
ni
fi
Ni
Fi
l0 -- l1
C1
n1
N1 = n1
F1 = f1
...
...
...
...
...
lj-1 -- lj
cj
nj
Nj = Nj-1+ nj
Fj = Fj-1 + fj
...
...
...
...
...
lk-1 -- lk
ck
nk
Nk=n
Fk =1
...
...
Este arreglo usaremos en las pginas siguientes. El considerar los intervalos por el lado
izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que
expondremos.
El nmero de intervalos, k, a utilizar no est determinado de forma fija y por tanto
tomaremos un k que nos permita trabajar cmodamente y ver bien la estructura de los
datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados:
intervalos, que
.
La amplitud de cada intervalo: ai = li - li-1 suele tomarse constante, considerando la
observacin ms pequea y ms grande de la poblacin (respectivamente
Observacin
Podra ocurrir que la cantidad a fuese un nmero muy desagradable a la hora de escribir
los intervalos (Ej. a =10,325467). En este caso, es recomendable variar simtricamente
los extremos,
simple (Ej. a =10).
Ejemplo
Sobre un grupo de n =21 personas se realizan las siguientes observaciones de sus pesos,
medidos en kilogramos:
58
42
51
54
40
39
49
56
58
57
59
63
58
66
70
72
71
69
70
68
64
M. clase
f.a.
f.r.
f.a.a.
f.r.a.
li-1 -- li
ci
ni
fi
Ni
Fi
i=1
39 -- 45,6
42,3
0,1428
0,1428
i=2
45,6 -- 52,2
48,9
0,0952
0,2381
i=3
52,2 -- 58,8
55,5
0,2857
11
0,5238
i=4
58,8 -- 65,4
62,1
0,1428
14
0,6667
i=5
65,4 -- 72
68,7
0,3333
21
21
Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con
cantidades ms simples a la hora de construir los intervalos, es la siguiente. Como la
regla para elegir l0 y l5 no es muy estricta podemos hacer la siguiente eleccin:
M. clase
f.a.
f.r.
f.a.a.
f.r.a.
li-1 -- li
ci
ni
fi
Ni
Fi
i=1
38 -- 45
41,5
0,1428
0,1428
i=2
45 -- 52
48,5
0,0952
0,2381
i=3
52 -- 59
55,5
0,3333
12
0,5714
i=4
59 -- 66
62,5
0,1428
15
0,7143
i=5
66 -- 73
69,5
0,2857
21
21
xi
ni
fi
Ni
Fi
1/8
1/8
3/8
4/8
3/8
7/8
1/8
8/8
n =8
Ejemplo
Clasificadas 12 familias por su nmero de hijos se obtuvo:
Frecuencias (ni)
F. Absolutas
F. Relativas
F. Acumuladas
xi
ni
fi
Ni
0,083
0,250
0,416
0,250
12
12
ci
ni
Ni
0 -- 2
2 -- 4
4 -- 6
6 -- 8
10
8 - 10
12
12
Ejemplo
La siguiente distribucin se refiere a la duracin en horas (completas) de un lote de 500
tubos:
Duracin en horas
Nmero de tubos
300 -- 500
50
500 -- 700
150
700 -- 1.100
275
ms de 1.100
25
Total 500
Determinar el nmero mnimo de tubos que tienen una duracin inferior a 900
horas.
ai
ni
fi
fi'
Fi
300 -- 500
200
50
0,10
0,10
0,10
500 -- 700
200
150
0,30
0,30
0,40
700 -- 1.100
400
275
0,55
0,275
0,95
1.100 -- 1.300
200
25
0,05
0,05
1,00
n =500
se ve que sumando frecuencias relativas, hasta las 900 horas de duracin hay
0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.
Esta cantidad se obtiene de modo ms directo viendo a qu altura corresponde al valor
900 en el siguiente diagrama de frecuencias acumuladas.
Como en total son 500 tubos, el nmero de tubos con una duracin igual o menor que
900 horas es
Frecuencia relativa:
Recorrido:
Amplitud:
ai = li - li-1
Marca de clase:
Frecuencias rectificadas:
Diagrama
V. Cualitativa
V. Discreta
Diferencial (barras)
Integral (en escalera)
V. Continua
, se
De forma anloga se definen los deciles como los valores de la variable que dividen a
las observaciones en 10 grupos de igual tamao. Ms precisamente, definimos D1,D2, ...,
D9 como:
ni
Ni
14
14
10
24
15
39
26
65
20
85
15
100
n =100
Solucin: Aplicando las frmulas antes enunciadas para los cuartiles tenemos lo
siguiente:
1. Primer cuartil:
2. Segundo cuartil:
3. Tercer cuartil:
Ejemplo
Calcular los cuartiles en la siguiente distribucin de una variable continua:
li-1 - li
ni
Ni
0-1
10
10
1-2
12
22
2-3
12
34
3-4
10
44
4-5
51
n =51
Solucin:
1. Primer cuartil
2. Segundo cuartil:
3. Tercer cuartil
Ejemplo
Han sido ordenados los pesos de 21 personas en la siguiente tabla:
Intervalos
f.a.
li-1 -- li
ni
38 -- 45
45 -- 52
52 -- 59
59 -- 66
66 -- 73
6
21
Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo nmero de
observaciones.
Solucin: Las cantidades que buscamos son los tres cuartiles:
,
y
. Para
calcularlos, le aadimos a la tabla las columnas con las frecuencias acumuladas, para
localizar qu intervalos son los que contienen a los cuartiles buscados:
li-1 -- li
ni
Ni
38 -- 45
45 -- 52
52 -- 59
12
59 -- 66
15
66 -- 73
21
21
Obsrvese que
ni
Ni
fi
Fi
xi
ai
0-5
10
10
0,2
0,3
2,5
5-7
25
35
0,5
0,7
12,5
7 - 12
40
0,1
0,8
9,5
12 - 15
10
50
0,2
13,5
3,33
4. Cuartiles:
Percentil Pl, Para una variable discreta, se define el percentil de orden k, como la
observacin, Pk, que deja - por debajo de s - el k % de la poblacin. Esta definicin nos
recuerda a la mediana, pues como consecuencia de la definicin es evidente que Med =
P50 . En el caso de una variable continua, el intervalo donde se encuentra
,
se calcula buscando el que deja - por debajo de s - al k % de las observaciones.
Cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se definen como: Q1 =
P25, Q2 = P50 = Med, Q3 = P75
Deciles, Dl, de forma anloga se definen como los valores de la variable que dividen a
las observaciones en 10 grupos de igual tamao.
Unidad 2
PROBABILIDAD Y VARIABLE ALEATORIA
Obsrvese que los sucesos elementales son sucesos aleatorios compuestos por un
slo elemento. Por supuesto los sucesos aleatorios son ms generales que los
elementales, ya que son conjuntos que pueden contener no a uno slo, sino a una
infinidad de sucesos elementales - y tambin no contener alguno - Sucesos aleatorios
que aparecen con gran frecuencia en el clculo de probabilidades son los siguientes:
Suceso seguro: Es aquel que siempre se verifica despus del experimento aleatorio, es
decir, el mismo E
Suceso imposible: Es aquel que nunca se verifica como resultado del experimento
aleatorio. Como debe ser un subconjunto de E, la nica posibilidad es que el suceso
imposible sea el conjunto vaco
, y de su suceso
Ejemplo
Si realizamos el experimento aleatorio de lanzar un dado al aire, tenemos:
, el
Interseccin:
Dados dos sucesos aleatorios
, se denomina suceso interseccin de A y B al
conjunto formado por todos los sucesos elementales que pertenecen a A y B a la vez, es
decir,
Diferencia:
, con su
representa mediante
, o bien A-B, al suceso aleatorio formado por todos los
sucesos elementales que pertenecen a A, pero no a B:
Diferencia simtrica:
Si
mediante
, al suceso aleatorio formado por todos los sucesos elementales que
pertenecen a A y no a B, y los que estn en B y no en A:
As:
aleatorios
; en (b)
se
; en (c) A-
Hay ciertas propiedades que relacionan la unin, interseccin y suceso contrario, que
son conocidas bajo el nombre de Leyes de Morgan:
P() = 1
P(E) , E
P(E1 U E2) = P(E1) + P(E2), si E1,E2
Proposicin
P() = 0
Demostracin
Proposicin
E
Demostracin
Proposicin
, P(E) = 1 - P(Ec)
[0, 1] es una
Demostracin
P() = 1
P(E) , E
P(E1 U E2) = P(E1) + P(E2), si E1,E2
Ejemplo
. Para
o bien
El
espacio
muestral
que
corresponde
este
experimento
es
Por otro lado, si ha salido un nmero par, de nuevo por la definicin de probabilidad de
Laplace tendramos
y entonces
que por supuesto coincide con el mismo valor que calculamos usando la definicin de
probabilidad de Laplace.
Observacin:
Obsrvese que segn la definicin de probabilidad condicionada, se puede escribir la
probabilidad de la interseccin de dos sucesos de probabilidad no nula como
Esta relacin puede ser escrita de modo equivalente, cuando dos sucesos son de
probabilidad no nula como
Probabilidad de Laplace
Si un experimento cualquiera puede dar lugar a un nmero finito de resultados posibles,
y no existe ninguna razn que privilegie unos resultados en contra de otros, se calcula la
probabilidad de un suceso aleatorio A, segn la regla de Laplace como el cociente entre
el nmero de casos favorables a A, y el de todos los posibles resultados del
experimento:
Ejemplo
Calcular la probabilidad de que al lanzar un dado se obtenga un nmero impar.
Ejemplo
En una universidad el 50% de los alumnos habla ingls, el 20% francs y el 5% los dos
idiomas Cul es la probabilidad de encontrar alumnos que hablen alguna lengua
extranjera?
Solucin:
Sea A el suceso hablar ingls:
.
:
Ejemplo
En una estacin de esqu, para navidad, la experiencia indica que hay un tiempo soleado
slo el
de los das. Por otro lado, se ha calculado que cuando un da es soleado, hay
Luego slo el
Demostracin
Los teoremas que restan nos dicen como calcular las probabilidades de sucesos cuando
tenemos que el suceso seguro est descompuesto en una serie de sucesos incompatibles
de los que conocemos su probabilidad. Para ello necesitamos introducir un nuevo
concepto: Se dice que la coleccin
excluyente de sucesos si se verifican las relaciones:
es un sistema exhaustivo y
Demostracin
Basados en lo que se observa de la figura realizamos las siguientes operaciones:
Si A1,A2,A3,A4 forma un sistema
exhaustivo y excluyente se
sucesos, podemos calcular la
probabilidad de B a partir de las
cantidades
es lo mismo,
, o lo que
Ejemplo
Se tienen dos urnas, y cada una de ellas contiene un nmero diferente de bolas blancas y
rojas:
Primera urna, U1: 3 bolas blancas y 2 rojas;
Segunda urna, U2: 4 bolas blancas y 2 rojas.
Se realiza el siguiente experimento aleatorio:
Se tira una moneda al aire y si sale cara se elige una bola de la primera urna, y si
sale sello de la segunda.
Cul es la probabilidad de que salga una bola blanca?
Solucin: La situacin que tenemos puede ser esquematizada como
U1
U2
Teorema (Bayes)
Sea
un
, a las que
Demostracin
Es una consecuencia de la definicin de probabilidad condicionada en trminos de la
interseccin, y del teorema de la probabilidad total:
Ejemplo
Se tienen tres urnas. Cada una de ellas contiene un nmero diferente de bolas blancas y
rojas:
Primera urna, U1: 3 bolas blancas y 2 rojas;
Segunda urna, U2: 4 bolas blancas y 2 rojas;
Tercera urna, U3: 3 bolas rojas.
Se realiza el siguiente experimento aleatorio:
Alguien elige al azar y con la misma probabilidad una de las tres urnas, y saca
una bola.
Si el resultado del experimento es que ha salido una bola blanca,
cul es la probabilidad de que provenga de la primera urna? Calcular lo mismo para las
otras dos urnas.
Solucin: Vamos a representar en un esquema los datos de que disponemos:
U1
U2
U3
Observacin
Obsrvese que en el ejemplo anterior, antes de realizar el experimento aleatorio de
extraer una bola para ver su resultado, tenamos que la probabilidad de elegir una urna i
cualquiera es
. Estas probabilidades se denominan probabilidades a priori. Sin
embargo, despus de realizar el experimento, y observar que el resultado del mismo ha
sido la extraccin de una bola blanca, las probabilidades de cada urna han cambiado a
. Estas cantidades se denominan probabilidades a posteriori. Vamos a
representar en una tabla la diferencia entre ambas:
a priori
a posteriori
1
Las probabilidades a priori
cambian de tal modo de las a
posteriori
que
una
vez
observado el resultado del
experimento aleatorio, se puede
afirmar con certeza que no fue
elegida la tercera urna.
reforzada si
. Una aplicacin bsica de esta tcnica la tenemos en Medicina
para decidir si un paciente padece cierta enfermedad o no, en funcin de los resultados
de un test diagnstico.
exhaustivo
excluyente
si
de
se
una coleccin de
sucesos:
verifican
Se
dice
la
las
coleccin
relaciones:
, respectivamente.
un sistema exhaustivo y
Sea un espacio muestral, una variable aleatoria X es una funcin que a cada
elemento de , le asigna un nmero real.
X: R
X() R,
Observacin
Obsrvese que X est definido sobre el espacio muestral de sucesos E, mientras que f lo
est sobre el espacio de nmeros reales .
Las propiedades de la funcin de probabilidad de v.a. se deducen de forma inmediata de
los axiomas de probabilidad:
mutuamente
excluyentes,
es
decir,
y
,
luego
, se tiene que
, le asigna un
Hay que observar que a valores no admisibles por la variable les pueden corresponder
valores de F no nulos. Por ejemplo,
2. es continua a la derecha:
3. Adems,
Aun cuando la variable tomase un nmero infinito de valores, x1, x2, ..., no hay ningn
problema en comprobar que cada xi contribuye con una cantidad f(xi) al total de modo
que
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades
de cada uno de los trminos en el sentido anterior, ya que el conjunto de valores que
puede tomar la variable es no numerable. En este caso, lo que generaliza de modo
natural el concepto de suma () es el de integral ( ). Por otro lado, para variables
continuas no tiene inters hablar de la probabilidad de que
, ya que esta
debe de valer siempre 0, para que la suma infinita no numerable de las probabilidades
de todos los valores de la variable no sea infinita.
De este modo es necesario introducir el concepto de funcin de densidad de una v.a.
continua, que se define como una funcin
propiedades siguientes:
Observacin
Por ser f una funcin integrable, la probabilidad de un punto es nula:
y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea
abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de
probabilidad nula:
Observacin
Dado un intervalo de la forma (a, b], tenemos que
tenemos la masa media de probabilidad por unidad de longitud en (a, b], es decir, su
densidad media de probabilidad. Si hacemos tender a hacia b,
, la cantidad
Demostracin
Los sucesos
. Por tanto
2
0
0
0
0
0
1/36
0
0
0
0
0
1/36
3
0
0
0
0
1/36
0
1/36
0
0
0
0
2/36
4
0
0
0
1/36
0
1/36
0
1/36
0
0
0
3/36
5
0
0
1/36
0
1/36
0
1/36
0
1/36
0
0
4/36
6
0
1/36
0
1/36
0
1/36
0
1/36
0
1/36
0
5/36
7
1/36
0
1/36
0
1/36
0
1/36
0
1/36
0
1/36
6/36
8
0
1/36
0
1/36
0
1/36
0
1/36
0
1/36
0
5/36
9
0
0
1/36
0
1/36
0
1/36
0
1/36
0
0
4/36
10
0
0
0
1/36
0
1/36
0
1/36
0
0
0
3/36
11
0
0
0
0
1/36
0
1/36
0
0
0
0
2/36
12
0
0
0
0
0
1/36
0
0
0
0
0
1/36
P(Y=y)
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
1
Sea
cual es el valor de k que hace que esta funcin sea una funcin de distribucin de
probabilidades?
y\x
1
2
3
4
P(X = x)
1
2/32
3/32
4/32
5/32
14/32
2
3/32
4/32
5/32
6/32
18/32
o P(x > y)
=
=
o P(x + y = 3)
=
=
=
Marginal de x
P(Y = y)
5/32
7/32
9/32
11/32
1
Para las v.a. continuas se realiza el mismo proceso que las discretas con la diferencia
que ya no se utilizar el smbolo sino el de integracin
valores que pueden tomar.
debido a la diferencia de
, F(xi) es igual a
funcin de densidad de una v.a. continua, que se define como una funcin
integrable, que verifica las dos propiedades siguientes:
),
, a:
el momento central de tercer orden es denominado sesgo y denota si los datos estn
agrupados de igual manera de un lado y de otro (insesgado) de la esperanza E[X] o
estn agrupados de un lado ms que de otro (sesgado).
Sea X una variable cuantitativa y
Si los datos estn agrupados en una tabla, mp admite otra expresin equivalente:
Ejemplo
El momento de orden 2 es la varianza muestral:
Es sencillo comprobar que los momentos de orden p impar, son siempre nulos en el caso
de variables simtricas, ya que para cada i que est a un lado de la media, con
, le corresponde una observacin j del otro lado de la media tal que
. Elevando cada una de esas cantidades a p impar, y sumando se
tiene que
Apoyndonos en este ndice, diremos que hay asimetra positiva si a3>0, y que la
asimetra es negativa si a3<0.
El momento de cuarto orden es denominado Estadsticos de apuntamiento (picudez),
Se define el coeficiente de aplastamiento de Fisher como:
donde m4 es el momento emprico de cuarto orden. Es ste un coeficiente adimensional,
invariante ante cambios de escala y de origen. Sirve para medir si una distribucin de
frecuencias es muy puntiaguda o no. Para decir si la distribucin es larga y estrecha, hay
que tener un patrn de referencia. El patrn de referencia es la distribucin normal o
gaussiana para la que se tiene
Leptocrtica:
Cuando
normal;
Mesocrtica:
Cuando
la normal;
Platicrtica:
Cuando
normal;
ni
fi
x1
n1
f1
...
...
...
xk
nk
fk
Observacin
Hemos supuesto implcitamente en la definicin de media que tratbamos con una
variable X discreta. Si la variable es continua tendremos que cambiar los valores de xi
por las marcas de clase correspondientes. En general, la media aritmtica obtenida a
partir de las marcas de clase ci, diferir de la media obtenida con los valores reales, xi.
Es decir, habr una perdida de precisin que ser tanto mayor cuanto mayor sea la
diferencia entre los valores reales y las marcas de clase, o sea, cuanto mayores sean las
longitudes ai, de los intervalos.
Proposicin
La suma de las diferencias de la variable con respecto a la media es nula, es decir,
Demostracin
Basta desarrollar la sumatoria para obtener
Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la
variable, por ejemplo x1, mediante el valor central , es compensado por los dems
errores:
Si los errores se consideran con signo positivo, en este caso no pueden compensarse.
Esto ocurre si tomamos como medida de error alguna de las siguientes:
Ejemplo
Obtener las desviaciones con respecto a la media en la siguiente distribucin y
comprobar que su suma es cero.
li-1 - li
ni
0 - 10
10 - 20
20 - 30
30 - 40
Solucin:
li-1 - li
ni
xi
xi ni
0 - 10
-19
-19
10 - 20
15
30
-9
-18
20 - 30
25
100
+1
+4
30 - 40
35
105
+11
+33
n =10
La media aritmtica es:
Proposicin (Knig)
Para cualquier posible valor k que consideremos como candidato a medida central,
mejora en el sentido de los mnimos cuadrados, es decir
Demostracin
Sea
lo
Proposicin
Dados r grupos con n1, n2, ..., nr observaciones y siendo
, ...,
las respectivas
observaciones
Demostracin
Vamos a llamar xij a la j-sima observacin del grupo i; Entonces tenemos
Observacin
A pesar de las buenas propiedades que ofrece la media, sta posee algunos
inconvenientes:
Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas
las observaciones intervienen en el clculo de la media, la aparicin de una observacin
extrema, har que la media se desplace en esa direccin. En consecuencia, no es
recomendable usar la media como medida central en las distribuciones muy asimtricas;
Depende de la divisin en intervalos en el caso de variables continuas.
Si consideramos una variable discreta, por ejemplo, el nmero de hijos en las familias
de Guayaquil el valor de la media puede no pertenecer al conjunto de valores de la
variable;
Por ejemplo
Clculo abreviado
hijos.
Luego
La media armnica
, se define como el recproco de la media aritmtica de los recprocos, es decir,
Por tanto,
La media cuadrtica
, es la raz cuadrada de la media aritmtica de los cuadrados:
La mediana
Consideramos una variable discreta X cuyas observaciones en una tabla estadstica han
sido ordenadas de menor a mayor. Llamaremos mediana, Med al primer valor de la
variable que deja por debajo de s al
de las observaciones. Por tanto, si n es el
nmero de observaciones, la mediana corresponder a la observacin [n/2]+1, donde
representamos por
En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la
frmula de la mediana se complica un poco ms (pero no demasiado): Sea (li-1,li] el
intervalo donde hemos encontrado que por debajo estn el
de las observaciones.
Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas,
mediante interpolacin lineal (teorema de Thales) como se ve en la figura anterior
Observacin
La relacin anterior corresponde a definir para cada posible observacin,
,
su frecuencia relativa acumulada, F(x), por interpolacin lineal entre los valores F(lj-1) =
Fj-1 y F(lj) = Fj de forma que
Observacin
Entre las propiedades de la mediana, vamos a destacar las siguientes:
Defectos de la Mediana
Ejemplo
Sea X una variable discreta que ha presentado sobre una muestra las modalidades
ni
0 - 10
60
10 - 20
80
20 - 30
30
30 - 100
20
100 - 500
10
Solucin:
li-1 - li
ni
ai
xi
xi ni
Ni
0 - 10
60
10
300
60
60
10 - 20
80
10
15
1.200
140
80
20 - 30
30
10
25
750
170
30
30 - 100
20
70
65
1.300
190
2,9
100 - 500
10
400
300
3.000
200
0,25
n =200
La media aritmtica es:
La primera frecuencia absoluta acumulada que supera el valor n/2=100 es Ni =140. Por
ello el intervalo mediano es [10;20). As:
La moda
Llamaremos moda a cualquier mximo relativo de la distribucin de frecuencias, es
decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior y su
posterior.
Figura: Clculo geomtrico de la moda
Observacin
De la moda destacamos las siguientes propiedades:
Es muy fcil de calcular.
Puede no ser nica.
Es funcin de los intervalos elegidos a travs de su amplitud, nmero y lmites
de los mismos.
Aunque el primero o el ltimo de los intervalos no posean extremos inferior o
superior respectivamente, la moda puede ser calculada.
Relacin entre media, mediana y moda
En el caso de distribuciones unimodales, la mediana est con frecuencia comprendida
entre la media y la moda (incluso ms cerca de la media).
En distribuciones que presentan cierta inclinacin, es ms aconsejable el uso de la
mediana. Sin embargo en estudios relacionados con propsitos estadsticos y de
inferencia suele ser ms apta la media.
Veamos un ejemplo de clculo de estas tres magnitudes.
Ejemplo
Consideramos una tabla estadstica relativa a una variable continua, de la que nos dan
los intervalos, las marcas de clase ci, y las frecuencias absolutas, ni.
Intervalos
ci
ni
0 -- 2
2 -- 4
4 -- 6
6 -- 8
8 - 10
Para calcular la media podemos aadir una columna con las cantidades
de los trminos de esa columna dividida por n =12 es la media:
Intervalos
ci
ni
Ni
02
24
46
20
68
10
21
8 10
12
18
12
. La suma
64
Para el clculo de la moda, lo primero es encontrar los intervalos modales, buscando los
mximos relativos en la columna de las frecuencias absolutas, ni. Vemos que hay dos
modas, correspondientes a las modalidades i =1, i =3. En el primer intervalo modal,
(l0,1]=(0,2], la moda se calcula como
En este caso, como se ve en la figura siguiente, la moda no toma un valor nico, sino el
conjunto
Media armnica:
recprocos, es decir,
Media cuadrtica:
Si los datos estn agrupados en una tabla estadstica es ms sencillo usar la relacin
Como se observa, la desviacin media guarda las mismas dimensiones que las
observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero
esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la distancia
que induce la desviacin media en el espacio de observaciones no es la natural (no
permite definir ngulos entre dos conjuntos de observaciones). Esto hace que sea muy
engorroso trabajar con ella a la hora de hacer inferencia a la poblacin.
Varianza y desviacin tpica
Como forma de medir la dispersin de los datos hemos descartado:
, pues sabemos que esa suma vale 0, ya que las desviaciones con
respecto a la media se compensan al haber trminos en esa suma que son de
signos distintos.
Para tener el mismo signo al sumar las desviaciones con respecto a la media
podemos realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero
como hemos mencionado, tiene poco inters por las dificultades que presenta.
La varianza no tiene la misma magnitud que las observaciones (Ej. si las observaciones
se miden en metros, la varianza lo hace en
). Si queremos que la medida de
dispersin sea de la misma dimensionalidad que las observaciones bastar con tomar su
raz cuadrada. Por ello se define la desviacin tpica, , como
Ejemplo
Calcular la varianza muestral y desviacin tpica de las siguientes cantidades medidas
en metros: 3,3,4,4,5
Solucin:
Para calcular dichas medidas de dispersin es necesario calcular previamente el valor
con respecto al cual vamos a medir las diferencias. sta es la media:
La varianza es:
entonces
Demostracin
Para cada observacin xi de X,
definicin
, se tiene que
Observacin
Las consecuencias del anterior resultado eran de esperar: Si los resultados de una
medida son trasladados una cantidad b, la dispersin de los mismos no aumenta. Si
estos mismos datos se multiplican por una cantidad a <1, el resultado tender a
concentrarse alrededor de su media (menor varianza). Si por el contrario a>1 habr
mayor dispersin.
Otra propiedad fundamental de la varianza es la siguiente:
Proposicin
Dados r grupos, cada uno de ellos formado por ni observaciones de media
varianza
. Entonces la varianza,
observaciones vale
y de
Demostracin
Dicho de otro modo, pretendemos demostrar que la varianza total es igual a la media
de las varianzas ms la varianza de las medias. Comenzamos denotando mediante xij la
observacin j-sima en el i-simo grupo, donde
. Entonces
Observacin
Adems de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre
la desviacin tpica), ser conveniente tener siempre en mente otras que enunciamos a
continuacin:
Ambas son sensibles a la variacin de cada una de las puntuaciones, es decir, si
una puntuacin cambia, cambia con ella la varianza. La razn es que si miramos
su definicin, la varianza es funcin de cada una de las puntuaciones.
, obtenemos
Grados de libertad
Los grados de libertad de un estadstico calculado sobre n datos se refieren al nmero
de cantidades independientes que se necesitan en su clculo, menos el nmero de
restricciones que ligan a las observaciones y el estadstico. Es decir, normalmente n-1.
Ejemplo:
Consideramos una serie de valores de una variable,
tomados de forma independiente.
Su media es
y se ha calculado a partir de las n =5 observaciones independientes
xi, que estn ligadas a la media por la relacin:
Sin embargo esas cantidades no son totalmente independientes, pues estn ligadas por
una restriccin:
Basta dar una rpida mirada a la definicin del coeficiente de variacin, para ver que las
siguientes consideraciones deben ser tenidas en cuenta:
Slo se debe calcular para variables con todos los valores positivos. Todo ndice
de variabilidad es esencialmente no negativo. Las observaciones pueden ser
positivas o nulas, pero su variabilidad debe ser siempre positiva. De ah que slo
debemos trabajar con variables positivas, para la que tenemos con seguridad que
.
Observacin
Es importante destacar que los coeficientes de variacin sirven para comparar las
variabilidades de dos conjuntos de valores (muestras o poblaciones), mientras que si
deseamos comparar a dos individuos de cada uno de esos conjuntos, es necesario usar
los valores estandarizados.
Ejemplo
Dada la distribucin de edades (medidas en aos) en un colectivo de 100 personas,
obtener:
1. La variable estandarizada Z.
2. Valores de la media y varianza de Z.
3. Coeficiente de variacin de Z.
Horas trabajadas
Num. empleados
0 -- 4
47
4 -- 10
32
10 -- 20
17
20 -- 40
4
100
Solucin:
queda:
li-1 -- li
xi
ni
xi ni
xi2 ni
0 -- 4
47
94
188
4 -- 10
32
224
1.568
10 -- 20
15
17
255
3.825
20 -- 40
30
120
3.600
n =100
693
9.181
A partir de estos valores podremos calcular los valores estandarizados para las marcas
de clase de cada intervalo y construir su distribucin de frecuencias:
zi
ni
zi ni
zi2 ni
-0,745
47
-35,015
26,086
0,011
32
0,352
0,004
1,220
17
20,720
25,303
3,486
13,944
48,609
n =100
0,021
100,002
La covarianza
, es una manera de generalizar la varianza, esta mide el grado de
variacin entre dos variables y se define como:
Como se ve, la frmula es muy parecida a las de las varianzas. Es sencillo comprobar
que se verifica la siguiente expresin de
, ms til en la prctica:
Proposicin
Si las observaciones no estn ordenadas en una tabla de doble entrada, entonces se tiene
que
o lo que es lo mismo
Ejemplo
Se han clasificado 100 familias segn el nmero de hijos varones ( ) o hembras (
en la tabla siguiente:
0
10
),
1.
Hallar las medias, varianzas y desviaciones tpicas marginales.
2.
Qu nmero medio de hijas hay en aquellas familias que tienen 2 hijos?
3.
Qu nmero medio de hijos varones hay en aquellas familias que no tienen
hijas?
4.
Qu nmero medio de hijos varones tienen aquellas familias que a lo sumo
tienen 2 hijas?
5.
Hallar la covarianza
Solucin: En primer lugar, definimos las variables X = nmero de hijos varones, e Y =
nmero de hijas y construimos la tabla con las frecuencias marginales, y con otras
cantidades que nos son tiles en el clculo de medias y varianzas:
y1
y2
y3
y4
y5
24
10
28
28
28
44
24
48
96
62
16
48
144
63
32
128
40
23
32
26
14
100
156
396
209
32
52
42
20
146
32
104
126
80
342
cuando
El nmero medio de hijas en las familias con 2 hijos varones se obtiene calculando la
distribucin condicionada de
n3j
n3j yj
10
24
31
Del mismo modo, el nmero medio de hijos varones de las familias sin hijas, se calcula
con la distribucin condicionada
ni1
ni1 xi
14
15
23
42
El nmero medio de hijos varones en las familias que a lo sumo tienen dos hijas, se
calcula usando las marginales de la tabla obtenida a partir de las columnas y1, y2 e y3
ni1
ni2
ni3
19
19
10
22
22
20
40
13
39
28
81
129
La covarianza es:
Demostracin:
Ntese que
entonces
. Ms precisamente, la
Teorema (Tshebishev)
Si X es v.a. con
, entonces
Unidad 3
VARIABLES ALEATORIAS DISCRETAS
Un ejemplo tpico de este tipo de variables aleatorias consiste en lanzar una moneda al
aire y considerar la v.a.
y su funcin de distribucin:
Distribucin binomial
Se dice que una v.a. X sigue una ley binomial de parmetros n y p,
la suma de n v.a. independientes de Bernoulli con el mismo parmetro, p:
, si es
Observacin
Es sencillo comprobar que realmente f es una ley de probabilidad, es decir,
. Para ello basta observar que la sucesin
es una progresin
geomtrica de razn q, a la que podemos aplicar su frmula de sumatoria:
Observacin
En la distribucin geomtrica el conjunto de posibles valores que puede tomar la
variable ( ) es infinito numerable, mientras que en la de Bernoulli y en la binomial,
estos eran en nmero finito.
Distribucin binomial negativa
Sobre una sucesin de v.a. de Bernouilli independientes,
De
nuevo,
el
conjunto
de
posibles
valores
de
. Su ley de
esta
v.a.
discreta
es
.
Observacin
La distribucin binomial negativa tambin se puede definir como el nmero de pruebas
hasta la aparicin de r xitos. Como el nmero de pruebas contabiliza tanto los xitos
como los fracasos se tendra segn sta definicin que
Distribucin hipergeomtrica
Por claridad, consideremos el siguiente ejemplo: Tenemos una baraja de cartas
espaolas (N = 40 naipes), de las cuales nos vamos a interesar en el palo de oros (D =10
naipes de un mismo tipo). Supongamos que de esa baraja extraemos n = 8 cartas de una
vez (sin reemplazamiento) y se nos plantea el problema de calcular la probabilidad de
que hayan k = 2 oros (exactamente) en esa extraccin. La respuesta a este problema es
En lugar de usar como dato D es posible que tengamos la proporcin existente, p, entre
el nmero total de oros y el nmero de cartas de la baraja
Este ejemplo sirve para representar el tipo de fenmenos que siguen una ley de
distribucin hipergeomtrica. Diremos en general que una v.a. X sigue una distribucin
hipergeomtrica de parmetros, N, n y p, lo que representamos del modo
, si su funcin de probabilidad es
Observacin
Este tipo de leyes se aplican a sucesos con probabilidad muy baja de ocurrir,
obtenindose como la distribucin lmite de una sucesin de variable binomiales,
, donde
,y
(por tanto
).
Geomtrica ( o de fracasos): Si X1, X2, ..., Xi, ... son una sucesin de v.a.
independientes de Bernoulli (p), entonces, una v.a. X posee una distribucin
geomtrica,
. la ley de probabilidad de X es
Binomial negativa: Si X1, X2, ..., Xi, ... son una sucesin de v.a. independientes de
Bernoulli (p), entonces, se define la v.a. X como el nmero de fracasos obtenidos hasta
la aparicin de r xitos en la sucesin
. En este caso se dice que X sigue una ley
de distribucin binomial negativa de parmetros r y p. Su ley de probabilidad es
Poisson (o de los sucesos raros): Este tipo de leyes se aplican a sucesos con
probabilidad muy baja de ocurrir, obtenindose como la distribucin lmite de una
sucesin de variable binomiales, es decir, una v.a. X posee una ley de distribucin de
probabilidades del tipo Poisson si
con = n p.
con
Distribucin binomial
Los principales momentos de X cuando
partir de
Distribucin de Poisson
La funcin caracterstica de
es
y la especificidad del
. Cual es la probabilidad de que exactamente a cuatro
personas le de un resultado positivo? Si en la muestra hay cuatro personas a las que el
test le da positivo, cul es la probabilidad de que entre estas, exactamente dos estn
sanas? Calcular la probabilidad de que el test suministre un resultado incorrecto para
dos personas. Calcular la probabilidad de que el resultado sea correcto para ms de 7
personas.
Solucin:
Los datos de que disponemos son:
Sea X1 la v.a. que contabiliza el nmero de resultados positivos. Es claro que llamando
, se tiene que X sigue una distribucin binomial
Por ello la probabilidad de que a cuatro personas le de el resultado del test positivo es:
Si queremos calcular a cuantas personas les dar el test un resultado positivo aunque en
realidad estn sanas, hemos de calcular previamente
predictivo de falsos positivos:
, o sea, el ndice
Es importante observar este resultado. Antes de hacer los clculos no era previsible que
si a una persona el test le da positivo, en realidad tiene una probabilidad
aproximadamente del
de estar sana. Sea X2 la variable aleatoria que contabiliza al
nmero de personas al que el test le da positivo, pero que estn sanas en realidad.
Entonces
Como la probabilidad de que el test sea correcto para ms de siete personas, es la de que
sea incorrecto para menos de 3, se tiene
Es claro que
, por tanto el
Observacin
La distribucin exponencial tambin puede ser definida como el nmero de pruebas
realizadas hasta la obtencin del primer xito (como hubiese sido ms adecuado en el
ejemplo anterior). En este caso es un ejercicio sencillo comprobar que X slo puede
tomar valores naturales mayores o iguales a 1, y que:
. Como
Unidad 4
VARIABLES ALEATORIAS CONTINUAS
la funcin de distribucin de
Figura:
es:
Funcin
de
densidad
de
distribucin de
Distribucin normal
La distribucin normal, recibe este nombre ya que una gran mayora de las v.a
continuas de la naturaleza siguen esta distribucin. Se dice que una v.a. X sigue una
distribucin normal de parmetros
Observacin
Estos dos parmetros y
coinciden adems con la media (esperanza) y la varianza
respectivamente de la distribucin como se demostrar ms adelante:
Para el lector es un ejercicio interesante comprobar que sta alcanza un nico mximo
(moda)
en
que
es
simtrica
con
respecto
al
mismo,
por
tanto
Estandarizacin
Se conoce por Estandarizacin al proceso de restar la media y dividir por su
desviacin tpica a una variable X. De este modo se obtiene una nueva variable
de media
estandarizada.
y desviacin tpica
Esta nueva variable carece de unidades y permite hacer comparables dos medidas que
en un principio no lo son, por aludir a conceptos diferentes. As por ejemplo nos
podemos preguntar si un elefante es ms grueso que una hormiga determinada, cada uno
Las consecuencias desde el punto de vista prctico son importantes, ya que eso impide
el que podamos escribir de modo sencillo la funcin de distribucin de la normal, y nos
tenemos que limitar a decir que:
sin poder hacer uso de ninguna expresin que la simplifique. Afortunadamente esto no
impide que para un valor de x fijo, F(x) pueda ser calculado. De hecho puede ser
calculado con tanta precisin (decimales) como se quiera, pero para esto se necesita usar
tcnicas de clculo numrico y ordenadores. Para la utilizacin en problemas prcticos
de la funcin de distribucin F, existen ciertas tablas donde se ofrecen (con varios
decimales de precisin) los valores F(x) para una serie limitada de valores xi dados.
Normalmente F se encuentra tabulada para una distribucin Z, normal de media 0 y
varianza 1 que se denomina distribucin normal estandarizada:
. Entonces
, se obtiene Z
, y nos interesa
1.
Hacemos el cambio
y calculamos
2.
Usamos la tabla de probabilidades para la normal estndar, relativa a la distribucin
para obtener (de modo aproximado)
3.
Como
tenemos que el valor obtenido en la tabla, FZ(z) es la probabilidad buscada.
Vamos ahora a demostrar algunas de las propiedades de la ley normal que hemos
mencionado anteriormente.
Proposicin
Sea
. Entonces
Demostracin
Por ser la normal una ley de probabilidad se tiene que
es decir, esa integral es constante. Con lo cual, derivando la expresin anterior con
respecto a
se obtiene el valor 0:
luego
Luego
aunque en realidad esta no da resultados muy precisos a menos que realmente n sea un
valor muy grande o
Ejemplo
Durante cierta epidemia de gripe, enferma el
de la poblacin. En un aula con 200
estudiantes de Medicina, cul es la probabilidad de que al menos 40 padezcan la
enfermedad? Calcular la probabilidad de que haya 60 estudiantes con gripe.
Solucin:
La v.a. que contabiliza el nmero de alumnos que padece la gripe es
cuya media es
y su varianza es
. Realizar los clculos
con la ley binomial es muy difcil, ya que intervienen nmeros combinatorios de gran
tamao, y potencias muy elevadas. Por ello utilizamos la aproximacin normal de X,
teniendo en cuenta que se verifican las condiciones necesarias para que el error sea
aceptable:
Dada la dificultad numrica para calcular esa cantidad, y como la distribucin binomial
no est habitualmente tabulada hasta valores tan altos, vamos a utilizar su aproximacin
normal, XN. Pero hay que prestar atencin al hecho de que XN es una v.a. continua, y por
tanto la probabilidad de cualquier punto es cero. En particular,
Ejemplo
Segn un estudio, la altura de los varones de cierta ciudad es una v.a. X, que podemos
considerar que se distribuye segn una ley de normalidad de valor esperado
y desviacin tpica
asegurado que el
Solucin:
Tenemos que
seguros de que el
de los habitantes tengan sus alturas comprendidas en l hay
varias estrategias posibles:
1.
Podemos tomar el percentil 50, ya que este valor deja por debajo suya a la mitad, 0,5, de
la masa de probabilidad. Este valor, x0,5, se definira como:
donde
Por tanto podemos decir que la mitad de la poblacin tiene una altura inferior a
. Este resultado era de esperar, ya que en la distribucin es simtrica y
habr una mitad de individuos con un peso inferior a la media y otro con un peso
superior (como se ve en la figura).
Figura:
Intervalo
donde
tenemos
asegurado que el 50% de la poblacin tiene
un peso comprendido en l. Como se
2.
Anlogamente podemos considerar el percentil 50, y tomar como intervalo aquellos
pesos que lo superan. Por las mismas razones que en el problema anterior, podremos
decir:
El
3.
Los anteriores intervalos, an dando un resultado correcto, no son satisfactorios en el
sentido de que son muy grandes, y no tienen en cuenta la simetra de la distribucin
normal para tomar un intervalo cuyo centro sea . Vamos a utilizar entonces otra
tcnica que nos permita calcular el intervalo centrado en la media, y que adems ser el
ms pequeo posible que contenga al
de la poblacin.
Para ello observamos que la mayor parte de probabilidad est concentrada siempre
alrededor de la media en las leyes normales. Entonces podemos tomar un intervalo que
contenga un
del derecho.
Figura:
Intervalo
donde
tenemos
el que lo deja por encima (o lo que es lo mismo, el que deja por debajo al
de las
observaciones). Del mismo modo que antes estos valores pueden ser buscados en una
tabla de la distribucin normal, tipificando en primera instancia para des estandarizar
despus:
donde
Anlogamente se calculara
donde
Por la simetra de la distribucin normal con respecto al origen, tenemos que z0,25= - z0,75.
Luego
En conclusin:
El
De entre los tres intervalos que se han calculado el que tiene ms inters es el ltimo, ya
que es simtrico con respecto a la media, y es el ms pequeo de todos los posibles (ms
preciso). Este ejemplo es en realidad una introduccin a unas tcnicas de inferencia
estadstica que trataremos posteriormente, conocidas con el nombre de clculo de
intervalos de confianza.
Distribucin Gamma
X es una v.a. Gamma con parmetros y , es decir
cuando
si y solo si
2.
Si
, entonces
La media es
la varianza es
Distribucin exponencial
La distribucin exponencial es el equivalente continuo de la distribucin geomtrica
discreta. Esta ley de distribucin describe procesos en los que:
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que, el
tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un
instante tf, no depende del tiempo transcurrido anteriormente en el que no ha pasado
nada.
Ejemplos de este tipo de distribuciones son:
El tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento de la ley
que sigue este evento se utiliza en Ciencia para, por ejemplo, la datacin de fsiles o
cualquier materia orgnica mediante la tcnica del carbono 14, C14;
El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un
paciente;
En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de
tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos
sigue un modelo probabilstico exponencial. Por ejemplo, el tiempo que transcurre entre
que sufrimos dos veces una herida importante.
Ejemplo
En un experimento de laboratorio se utilizan 10 gramos de
. Sabiendo que la
duracin media de un tomo de esta materia es de 140 das, cuantos idas transcurrirn
hasta que haya desaparecido el
de este material?
Solucin:
El tiempo T de desintegracin de un tomo de
exponencial:
aos?
Solucin:
Sea T la variable aleatoria que mide la duracin de un marcapasos en una persona.
Tenemos que
Entonces
En segundo lugar
o sea, en la duracin que se espera que tenga el objeto, no influye en nada el tiempo que
en la actualidad lleva funcionando. Es por ello que se dice que la distribucin
exponencial no tiene memoria.
Distribucin Ji cuadrado:
Si tenemos una v.a.
, cuando =2 y = n/2, X se convierte en la v.a. Jicuadrado lo cual es fcil de deducir y se lo deja como demostracin para el estudiante.
Otra manera de obtener la v.a. Ji-cuadrado es la siguiente
, la v.a. X = Z2 se distribuye segn una ley de
Los percentiles de esta distribucin que aparecen con ms frecuencia en la prctica los
podemos encontrar en una tabla de probabilidades para la v.a. Ji cuadrado (
Figura: Funcin de densidad de
valores pequeos de n.
para
para
).
En consecuencia, si tenemos
, se tiene
Observacin
La ley de distribucin
muestra su importancia cuando queremos determinar la
variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central
siguiendo un mecanismo normal. Como ilustracin tenemos el siguiente ejemplo:
Ejemplo
Un instrumento para medir el nivel de glucemia en sangre, ofrece resultados bastantes
aproximados con la realidad, aunque existe cierta cantidad de error que se distribuye
de modo normal con media 0 y desviacin tpica
.
De este modo, el valor esperado para E1 es 0, es decir, que los errores ei van a tender a
compensarse entre unos pacientes y otros. Obsrvese que si
no fuese conocido a
Sin embargo, el resultado E1 no nos indica en qu medida hay mayor o menor dispersin
en los errores con respecto al 0. En cuanto a E2 podemos afirmar lo siguiente:
Teorema (Cochran)
Sean
Distribucin Beta
Si X es una v.a., entonces
y su varianza
si y solo si
Uniforme: Se dice que una v.a. X posee una distribucin uniforme en el intervalo [a,
b],
, si su funcin de densidad es la siguiente:
.
Con esta ley de probabilidad, la probabilidad de que al hacer un experimento aleatorio,
el valor de X este comprendido en cierto sub intervalo de [a, b] depende nicamente de
la longitud del mismo, no de su posicin.
Normal: Se dice que una v.a. X sigue una distribucin normal de parmetros
lo que representamos del modo
cuando
Exponencial: esta es el equivalente continuo de la distribucin geomtrica discreta.
Esta ley de distribucin describe procesos en los que nos interesa saber el tiempo hasta
que ocurre determinado evento, sabiendo que, el tiempo que pueda ocurrir desde
cualquier instante dado t, hasta que ello ocurra en un instante tf, no depende del tiempo
transcurrido anteriormente en el que no ha pasado nada.
Prdida de la memoria de la v.a. exponencial: la duracin que se espera que tenga algn
objeto en especial elctrico, no influye en nada el tiempo que en la actualidad lleva
, la suma de sus
si y solo si
Como esta distribucin es muy simple, vamos a calcular sus momentos ms usuales
directamente a partir de la definicin, en lugar de usar la funcin caracterstica:
Distribucin normal
La funcin caracterstica de la distribucin normal, se comprueba ms adelante que es
,y
, ya que
y calculamos
Como
, deducimos que
Distribucin Gamma
La funcin generadora de momentos de la v.a. Gamma es
de modo que
los valores 0.33 y 0.67 lo obtenemos de la tabla de la v.a. normal estndar, la forma de
leer los valores es la siguiente: