Académique Documents
Professionnel Documents
Culture Documents
Donde N = total de la poblacin y = Promedio poblacional.
Varianza poblacional:
Estadsticos: Son medidas numricas descriptivas, asociadas a la muestra, se consideras variables aleatorias.
Algunos de ellos: = La media o promedio. s
2
= La varianza. s = Desviacin tpica. Los estadsticos como
estn asociados a la muestra aleatoria, tienen distribucin de probabilidad, ya que segn la muestra tomada,
ste varia.
Promedio muestral:
Donde N = total de la poblacin y = Promedio poblacional.
Varianza muestral:
Leccin 7: Medidas de tendencia central: La media, la mediana y
la moda
INTRODUCCIN
En las secciones anteriores se presentaron las tcnicas para agrupar los datos (distribuciones o tablas de
frecuencia) y se plantearon las tcnicas grficas para descubrir los patrones de distribucin ocultos en un
conjunto de datos; se mencion que la estadstica cumpla una funcin descriptiva mediante el uso de cuadros
o tablas y grficos para la clasificacin, ordenacin y presentacin de datos estadsticos, limitando el anlisis
de la informacin a la interpretacin porcentual de las distribuciones de frecuencia.
El anlisis estadstico propiamente dicho, parte de la bsqueda de parmetros sobre los cuales pueda recaer la
representacin de toda la informacin. En esta seccin y en la prxima (medidas de tendencia central y de
dispersin) se definir algunas medidas numricas que se emplean para describir conjuntos de datos.
Una de las caractersticas ms sobresalientes de la distribucin de datos es su tendencia a acumularse hacia el
centro de la misma; esta caracterstica se denomina tendencia central. Las medidas de posicin o de tendencia
central nos permiten determinar la posicin de un valor respecto a un conjunto de datos, el cual
consideraremos como representativo o tpico para el total de las observaciones.
Pgina 42 de 177
Antes de entrar a definir las medidas de tendencia central, repasaremos algunas notaciones simblicas que
son de gran utilidad y son esenciales en la estadstica.
SUMATORIAS Y OTRAS NOTACIONES IMPORTANTES
El uso de la notacin simblica es esencial en estadstica. Por ejemplo, para distinguir entre los valores de n
observaciones se emplea la notacin simblica x
1
, x
2
,, x
n
. En el anlisis estadstico de un conjunto de datos
se requiere del uso de sumas de nmeros, por lo cual, es conveniente introducir una notacin simple para
trminos en secuencia. De esta manera, la suma de x
1
, x
2
,, x
n
se designa por:
, x ... x x x x
n 3 2 1
n
1
i
+ + + + =
= i
Y se lee suma de las x
i
, con i variando desde 1 hasta n. La letra i recibe el nombre de ndice de suma toma
valores enteros sucesivos hasta e incluyendo a n, que es el lmite superior o el valor ms grande de i.
Considere, por ejemplo, la sucesin de nmeros: 1, 4, 7, 10, 13,, y suponga que se desea referirse a la suma
de los cuadrados de los primeros cuatro trminos de la sucesin. En la notacin de sumatoria esto se escribira
como
166 100 49 16 1 10 7 4 1 y
2 2 2 2
4
1
2
i
= + + + = + + + =
= i
De
a) x ... x x x x
2
n
2
3
2
2
2
1
n
1 i
2
i
+ + + + =
=
,
b) a), - x ( ... a) - (x a) - (x a) - (x ) (x
n 3 2 1
n
1
i
+ + + + =
= i
a
c) , a) - x ( ... a) - (x a) - (x a) - (x ) (x
2
n
2
3
2
2
2
1
n
1
2
i
+ + + + =
= i
a
d) , y x ... y x y x y x y x
n n 3 3 2 2 1 1
n
1
i i
+ + + + =
= i
1. Si c es cualquier constante, entonces nc c
1
=
=
n
i
2. Si c es cualquier constante, entonces
= =
=
n
i
n
i 1
i
1
i
x c cx
3. ( )
= = =
+ = +
n
i
n
i
n
i 1
i
1
i
1
i i
y x y x
Como ejemplo, consideremos la sucesin de nmeros 1, 2, 3, 4, y sean a=10 y c=5, entonces,
Pgina 43 de 177
( )
( ) ( ) ( )
( ) ( ) ( )
150
20 100 30
20 10 10 16 9 4 1
5 5 5 5 4 3 2 1 10 4 3 2 1
5 x a x 5 ax x
2 2 2 2
4
1 i
4
1 i
i
4
1 i
2
i
4
1
i
2
i
=
+ + =
+ + + + + =
+ + + + + + + + + + + =
+ + = + +
= = = = i
Otro smbolo til e (pi). Esta letra se emplea para indicar el producto de los trminos de una
secuencia. Por ejemplo, dada la secuencia de observaciones x
1
, x
2
,, x
n
se designa por:
n 3 2 1
n
1 i
i
x .... x . x . x x
[
=
=
Donde la letra i tiene el mismo propsito que en la suma.
MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central, llamadas as porque tienden a localizarse en el centro de la informacin son
de gran importancia en el manejo de las tcnicas estadsticas, sin embargo, su interpretacin no debe hacerse
aisladamente de las medidas de dispersin, ya que la representatividad de ellas est asociada con el grado de
concentracin de la informacin.
Las principales medidas de tendencia central son:
Media aritmtica
Mediana
Moda
Sin embargo, existen otras medidas menos comunes; las medidas de tendencia central, tambin denominadas
medidas de posicin, pueden ser pueden ser de dos tipos:
1. CENTRALES:
Medias: Aritmtica, Geomtrica, Armnica
Medianas
Moda
2. NO CENTRALES O DE POSICIN:
Cuantiles:
Cuartiles
Deciles
Centiles o percentiles
La frmula de clculo de cada una de ellas depende de cmo se encuentren presentados los datos: agrupados
o sin agrupar. Por datos agrupados entenderemos los presentados en una tabla de frecuencias (variable
discreta o continua), mientras que por datos sin agrupar se entender los que se encuentran enlistados.
Media Aritmtica
Es la medida de posicin mas empleada, la ms conocida y sencilla de calcular, de gran estabilidad en el
muestreo y sus frmulas admiten tratamientos algebraicos. Tambin se le conoce como promedio aritmtico o
Pgina 44 de 177
simplemente como la media de un conjunto de observaciones. Cotidianamente e inconscientemente estamos
utilizando la media aritmtica. Cuando por ejemplo, decimos que un determinado fumador consume una
cajetilla de cigarrillos diaria, no aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que
contiene un paquete, sino que es el resultado de la observacin, es decir, dicho sujeto puede consumir 18 un
da, 10 otro, 20, 21, 22; pero segn nuestro criterio, el nmero de unidades estar alrededor de 20.
Su desventaja principal es el de ser muy sensible a valores extremos, es decir, puede afectarse de manera
desproporcionada por la presencia de valores grandes, o de valores muy pequeos.
Se designar el smbolo (la letra griega miu) para designar una media poblacional, y x (que se leer como
x-barra) para designar una media muestral.
Media para datos sin agrupar
1. Sean x
1
, x
2
,, x
N
, los N datos correspondientes a una poblacin. Entonces la media poblacional es,
=
=
= =
+ + + +
=
N
1 i
i
N
1 i
i
N 3 2 1
x
N
1
N
x
N
x ... x x x
2. Sean x
1
, x
2
,, x
n
, los n datos correspondientes a una muestra. Entonces la media muestral es,
=
=
= =
+ + + +
=
n
1 i
i
n
1 i
i
n 3 2 1
x
N
1
n
x
n
x ... x x x
x
Ejemplo
Hallar la media aritmtica de los siguientes nmeros: 10, 8, 6, 5, 10, 7.
SOLUCION:
8
6
7 10 5 6 8 10
x
6
1
6
x
x
6
1 i
i
6
1 i
i
=
+ + + + +
= = =
=
=
Ejemplo
Cantidad de cigarrillos consumidos por un fumador en una semana.
Lunes 18
Martes 21
Mircoles 22
Jueves 21
Viernes 20
Sbado 19
Domingo 19
Entonces la media aritmtica es
20
7
19 19 20 21 22 21 18
7
x
x
7
1
i
=
+ + + + + +
= =
El fumador consume en promedio 20 cigarrillos diarios.
Para algn campo de la ciencia, especficamente en la fsica, se dice que la media aritmtica es el CENTRO
DE GRAVEDAD de los datos.
Media para datos agrupados
Cuando se cuenta con una variable discreta que se encuentra agrupada en una distribucin de frecuencias de
k valores, la media aritmtica se calcula por la frmula:
Pgina 45 de 177
= =
=
i i
k
1 i
i i
f x
n
1
n
.f x
x
Ejemplo
Al organizar los datos en el ejemplo de la cantidad de cigarrillos consumidos por un fumador en una semana,
se obtiene la siguiente distribucin de frecuencias.
Cantidad
(X
i
)
Frecuencia
(f
i
)
18 1
19 2
20 1
21 2
22 1
Total 7
20
7
140
7
22(1) 21(2) 20(1) 19(2) 18(1)
7
f x
x
7
1
i i
= =
+ + + +
= =
Para facilidad del clculo de la media, se puede recurrir a construir primeramente en el cuadro, el valor del
numerador as,
Cantidad (X
i
) Frecuencia (f
i
) X
i
f
i
18 1 18
19 2 38
20 1 20
21 2 42
22 1 22
Total 7 140
Si la informacin se encuentra relacionada en una distribucin de frecuencias por intervalo (variable continua),
se toman como valores de la variable las marcas de clase de los intervalos; recurdese que por marca de
clase se entiende el punto medio entre los lmites de cada clase o intervalo.
Ejemplo
Mediante la siguiente distribucin de frecuencias que nos muestra los espesores en pulgadas, de recipientes
de acero, hallar la media aritmtica.
Pgina 46 de 177
Espesores
en pulg
0.307 - 0.310 0.311 - 0.314 0.315 - 0.318 0.319 - 0.322 0.323 - 0.326 0.327 - 0.330
f 3 5 5 22 14 1 N= 50
SOLUCION:
Espesores
en pulg
0.307 - 0.310 0.311 - 0.314 0.315 - 0.318 0.319 - 0.322 0.323 - 0.326 0.327 - 0.330
f 3 5 5 22 14 1 N= 50
mi 0,3085 0,3125 0,3165 0,3205 0,3245 0,3285
fmi 0,9255 1,5625 1,5825 7,051 4,543 0,3285 15,99
De esta manera, el espesor promedio de los recipientes de acero es de 0,32 pulgadas.
Media Aritmtica Ponderada
En lo que se ha venido presentando, se observa que la media aritmtica se calcula otorgndole a los datos
igual importancia a cada uno de ellos; sin embargo, existen casos donde los datos se encuentran ponderados
por un determinado peso.
La media aritmtica ponderada tiene en cuenta la importancia relativa de cada uno de los datos, para lo cual, la
definimos de la siguiente manera:
=
=
=
n
1 i
i
n
1 i
i i
w
w
w x
x ,
Donde
w
x es la media ponderada,
x
i
es el valor de la variable para el i-simo elemento, y
w
i
es la ponderacin de la i-sima variable para el i-simo elemento.
Ejemplo
Las calificaciones de un estudiante estn conformadas por los siguientes factores: Un examen cuyo valor es el
60% en el cual obtuvo una nota de 3,0; talleres de resolucin de ejercicios con ponderacin del 25% con una
calificacin de 3,5 y por ltimo, laboratorios de consulta y resolucin de ejercicios con un valor del 15% y una
nota de 4,5. Cul es la nota final del primer corte del estudiante?
SOLUCIN
El ejercicio brinda los siguientes datos.
Ponderaciones: w
1
= 0,6; w
2
= 0,25 y w
3
= 0,15.
Datos de la Variable: x
1
= 3,0; x
2
= 3,5 y x
3
= 4,5.
De esta manera, se tiene que:
3,35
00 , 1
35 , 3
00 , 1
675 , 0 0,875 1,80
0,15 0,25 0,60
4,5(0,15) 3,5(0,25) 3,0(0,60)
w
w x
x
3
1 i
i
3
1
i i
w
= =
+ +
=
+ +
+ +
= =
=
= i
As, la nota definitiva es 3,4.
Pgina 47 de 177
Para datos agrupados, tenemos que la frmula para calcular la media aritmtica ponderada est dada por,
i
n
1 i
i
n
1 i
i i i
w
f w
w f x
x
=
=
=
Propiedades de la media aritmtica
1. La suma de las diferencias de los datos con respecto a la media aritmtica es igual a cero, es decir,
( ) 0 x - x
1 i
i
=
=
n
Para comprobar esta propiedad recurriremos a las propiedades de la sumatoria descritas previamente.
Tenemos que:
( )
= = =
=
n
1 i
n
1 i
i
1 i
i
x x x - x
n
Sin embargo,
=
=
=
=
n
1 i
i
n
1 i
i
x x n
que tenemos despejando ,
n
x
x
Cabe mencionar que una vez calculada la media aritmtica, esta es una constante, por tanto, por
propiedades de la sumatoria:
x n x
n
1 i
=
=
De esta manera, reemplazando las dos igualdades en la ecuacin original tenemos que:
( )
0
x n - x n
x x x - x
n
1 i
n
1 i
i
1 i
i
=
=
=
= = =
n
Veamos un ejemplo de comprobacin; para ello consideremos los datos dados para el problema del
fumador cuya media es de 20 cigarrillos por da:
X x
i
- x
18 18 20 = -2
21 21 20 = 1
22 22 20 = 2
21 21 20 = 1
20 20 20 = 0
19 19 20 = -1
19 19 20 = -1
Suma 0
Para una distribucin de frecuencias, consideremos el mismo ejemplo con los datos agrupados:
Pgina 48 de 177
X f
i
x
i
- x (x
i
- x )f
i
18 1 18 20 = -2 -2
21 2 21 20 = 1 2
22 1 22 20 = 2 2
20 1 20 20 = 0 0
19 2 19 20 = -1 -2
Suma 7 0
2. La suma de las diferencias cuadrticas de los datos, con respecto a la media aritmtica es mnima.
( )
2
1 i
i
x - x
=
n
es mnima para x ; quiere decir que para cualquier otro parmetro p, diferente a la media
aritmtica hacer mayor la expresin
( )
2
1 i
i
p - x
=
n
>
( )
2
1 i
i
x - x
=
n
.
3. La media aritmtica de una constante es igual a la constante. Es decir, dada x
i
=k, para i=1, 2, 3,, n.
k n.k
n
1
k
n
1
x
n
1
x
n
1 i
n
1 i
i
= = = =
= =
Ejemplo
Si un alumno presenta 5 parciales y en todos ellos alcanza una calificacin de cuatro, su nota promedio
ser de cuatro:
4 5.4
5
1
4
5
1
x
n
1
x
5
1 i
n
1 i
i
= = = =
= =
4. Si a cada uno de los resultados de una variable le sumamos o le restamos una constante C, la media
aritmtica de la nueva variable queda alterada en esa constante. Formalmente, la media de una variable
mas (o menos) una constante es igual a la media aritmtica de la variable mas (o menos) la constante.
Sean x
1
, x
2
,, x
n
datos de una variable X cuya media aritmtica es x . Definimos una variable Y de tal
manera que y
1
= x
1
c, y
2
= x
2
c,, y
n
= x
n
c, es decir y
i
= x
i
c, i=1, 2,, n.
Entonces la media aritmtica de la nueva variable es:
( ) n.c
n
1
x c
n
1
x
n
1
c x
n
1
c x
n
1
y
n
1
y
n
1 i
n
1 i
i
n
1 i
n
1 i
i
n
1 i
i
n
1 i
i
= =
(
= = =
= = = = = =
Es decir,
c x y =
Ejemplo
Consideremos la siguiente distribucin de frecuencias:
Pgina 49 de 177
( ) 7 , 6 134
20
1
n x
n
1
x
5
1
i i
= = =
= i
( ) 7 , 8 174
20
1
n y
n
1
y
5
1
i i
= = =
= i
8,7 2 6,7 2 x y = + = + =
El ejemplo es vlido para la diferencia:
Ejemplo
Se tienen 100 baldosas y se midi sobre ellas su resistencia en Kg/m
2
, obteniendo los siguientes datos:
Con base en estos datos, tenemos que la resistencia media de las 100 baldosas es:
( )
2
5
1
i i
Kg/m 448 800 . 44
100
1
n m
n
1
x = = =
= i
Si hacemos Y = X 450:
( )
2
5
1
i i
Kg/m 2 200
100
1
n y
n
1
y = = =
= i
Pgina 50 de 177
2 - 450 - 448 450 x y = = =
5. Si cada uno de los datos se multiplica por una constante K, entonces la media aritmtica queda
multiplicada por esa constante.
Sean x
1
, x
2
,, x
n
los datos de una variable X cuya media aritmtica es x .
De igual forma, sea y
1
= k.x
1
, y
2
= k.x
2
,, y
i
= k.x
i
,, y
n
= k.x
n
.
La media aritmtica de la nueva variable es x k. y = :
x k. x
n
1
k. x
n
k
k.x
n
1
y
n
1
y
5
1
5
1
i i
n
1
i
n
1
i
= = = = =
= = = = i i i i
Ejemplo
Considerando la siguiente distribucin de frecuencias y tomando k=2 se tiene que:
( ) 7 , 6 134
20
1
n x
n
1
x
5
1
i i
= = =
= i
( ) 4 , 13 268
20
1
n y
n
1
y
5
1
i i
= = =
= i
13,4 2(6,7) x 2. y = = =
Ejemplo
Si multiplicamos cada una de las resistencias de las 100 baldosas por una constante
100
1
k = , tenemos:
( ) 48 , 4 448
100
1
n m
n
1
y
7
1
i y
i
= = =
= i
( ) x
100
1
448
100
1
48 , 4 y = = = =
6. Empleando las dos propiedades anteriores, podemos calcular la media de una combinacin lineal de
variables, esto es, una transformacin de variables:
Pgina 51 de 177
Sean x
1
, x
2
,, x
n
los datos de una variable X cuya media aritmtica es x ; de manera similar, sean C y K,
dos constantes y Y una variable aleatoria tal que Y = C.X K. Entonces la media aritmtica de la nueva
variable es k x c. y = .
Ejemplo
En una empresa constructora de vivienda los salarios semanales tienen una media de $169.000. Como
una solucin al conflicto laboral surgido se proponen dos soluciones al conflicto:
1. Aumento del 6% en el salario semanal, ,
2. Aumento del 4% ms una bonificacin semanal de $5.800 a cada obrero.
Cul de las dos alternativas mejora la situacin de los obreros?
Tenemos que, sea X la variable salario mensual, entonces:
Y
1
= 1,06.X 179.140 00) 1,06(169.0 x 1,06. y = = = , es decir, si aplicamos la primera opcin,
obtendramos un nuevo salario semanal de $179.140.
Y
2
= 1,04.X + 5800 181.560 175.760 5.800 00) 1,04(169.0 5.800 x 1,04. y = = + = + = , es decir, si
aplicamos la segunda opcin, obtendramos un nuevo salario semanal de $181.560.
7. La media de una muestra es igual a la media ponderada de las sub-muestras, tomndose como
ponderacin los tamaos de las sub-muestras, es decir,
,
n
.x n ... .x n .x n
x
k k 2 2 1 1
+ + +
=
Donde n = n
1
+ n
2
+ + n
k
.
Ejemplo
( ) 15 , 2 43
20
1
n x
n
1
x
5
1
i i
= = =
= i
,
( ) 33 , 1 16
12
1
n x
n
1
x
3
1
i i
1
1
= = =
= i
,
( ) 375 , 3 27
8
1
n x
n
1
x
2
1
i i
2
2
= = =
= i
De esta manera,
( ) ( )
15 , 2
20
3 4
8 12
3,375 8 1,33 12
n n
x . n x . n
x
2 1
2 2 1 1
= =
+
+
=
+
+
=
La Mediana
Otra medida de tendencia central, utilizada principalmente en estadstica no paramtrica es la mediana, la
cual, a diferencia de la media, no busca el valor central del recorrido de la variable segn la cantidad de
observaciones, sino que busca determinar el valor que tiene aquella observacin que divide la cantidad de
Pgina 52 de 177
observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenacin de los datos, y
debido a ello, este clculo depende de la posicin relativa de los valores obtenidos. Es necesario, antes que
nada, ordenar los datos de menor a mayor (o viceversa).
Hay que tener en cuenta que si x
1
, x
2
,, x
N-1
, x
N
, se utiliza para denotar el conjunto de las observaciones,
donde el subndice indica el orden en el dato que fue obtenido o registrado, suele utilizarse x
(1)
, x
(2)
,, x
(N-1)
,
x
(N)
, para representar las mismas observaciones, pero ahora ordenadas de menor a mayor, por lo tanto ahora
aparece primero el dato ms pequeo y ltimo el ms grande.
Mediana para datos sin agrupar
Para determinar el valor de la mediana en datos enlistados, hay que tener en cuenta la cantidad de datos que
se recolectaron; es decir, si se tiene un nmero de datos IMPAR o si por el contrario, el nmero de datos es
PAR; a continuacin se presentara la mecnica a emplear para su clculo.
a. Nmero impar de observaciones: La mediana es el valor del dato central as, la mediana puede
expresarse como:
|
.
|
\
| +
= =
2
1 N
x Me Mediana
, en caso de que N (o n) sea impar.
Ejemplo
En el ejercicio de los cigarrillos consumidos por un fumador, los datos suministrados fueron:
Lunes (x
1
)=18, martes (x
2
)=21, mircoles (x
3
)=22, jueves (x
4
)=21, viernes (x
5
)=20, sbado (x
6
)=19 y
domingo (x
7
)=19.
En primer lugar, tenemos siete (7) datos, un nmero IMPAR.
Ordenando ascendentemente los datos tenemos:
x
(1)
= 18, x
(2)
= 19, x
(3)
= 19, x
(4)
= 20, x
(5)
= 21, x
(6)
= 21, x
(7)
= 22.
Una vez ordenados los datos, determinamos el valor de la variable que se encuentra en la posicin central
de los datos, es decir:
( )
20 x x x x Me
4
2
8
2
1 7
2
1 N
= = = = =
|
.
|
\
|
|
.
|
\
| +
|
.
|
\
| +
De esta manera, consideramos que en el 50% de los das de la semana este fumador consume mximo
20 cigarrillos; mientras que en el restante 50% de los das fuma mas de 20 cigarrillos.
Ntese que tras del cuarto dato ordenado se encuentran 3 valores observados, la misma cantidad de
observaciones que superan el valor de la mediana, esto es:
La mediana divide la cantidad de datos en dos partes iguales.
b. Nmero par de observaciones: La mediana esta determinado por el valor de la semisuma (promedio
aritmtico) de los valores de los dos datos centrales, esto es:
2
x x
Me Mediana
1
2
N
2
N
|
.
|
\
|
+ |
.
|
\
|
+
= = , en caso de que N (o n) sea par.
Pgina 53 de 177
Ejemplo
Consideremos el consumo mensual de agua en m
3
, por una fbrica de confecciones La Hilacha.
Enero (x
1
) = 10, Mayo (x
5
) = 14, Septiembre (x
9
) = 18
Febrero (x
2
) = 12, Junio (x
6
) = 19, Octubre (x
10
) = 22
Marzo (x
3
) = 15, Julio (x
7
) = 17, Noviembre (x
11
) = 15
Abril (x
4
) = 18, Agosto (x
8
) = 18, Diciembre (x
12
) = 13
En primer lugar, tenemos doce (12) datos, un nmero PAR.
Ordenando ascendentemente los datos tenemos:
x
(1)
= 10, x
(2)
= 12, x
(3)
= 13, x
(4)
= 14, x
(5)
= 15, x
(6)
= 15,
x
(7)
= 17, x
(8)
= 18, x
(9)
= 18, x
(10)
= 18, x
(11)
= 19, x
(12)
= 22.
Una vez ordenados los datos, determinamos el valor de la variable que se encuentra en la posicin central
de los datos, es decir:
( ) ( ) ( ) ( )
16
2
32
2
7 1 15
2
x x
2
x x
2
x x
Me
7 6 1 6 6
1
2
12
2
12
= =
+
=
+
=
+
=
+
=
+
|
.
|
\
|
+ |
.
|
\
|
De esta manera, tenemos que el 50% de los meses la empresa tuvo un consumo de agua menor a 16 m
3
,
mientras en el restante 50% de los meses el consumo supero esta cifra.
Como se puede observar, en este caso la mediana no es un dato perteneciente a la informacin recogida,
sin embargo, es un parmetro que divide la informacin dejando el 50% por encima y el 50% por debajo
de ella, esto es:
Mediana para datos agrupados - Variable Discreta
En el caso de variables discretas donde cada categora es el valor de la variable, se puede tomar como un
caso de intervalo de amplitud 1 y en este caso el clculo de la mediana funciona exactamente como lo visto
para datos sin agrupar; sin embargo, existe un par de reglas prcticas basadas en las frecuencias absolutas
que pueden ser de utilidad:
a. Cuando N
j-1
<
2
n
y N
j
>
2
n
, entonces M
e
= x
j
.
b. Cuando N
j-1
=
2
n
, entonces M
e
=
2
x x
j 1 - j
+
.
A continuacin se presentar un par de ejemplos, casos tpicos, donde se trabaja con datos agrupados para
variables discretas.
Pgina 54 de 177
Ejemplo Caso a:
Consideremos la siguiente distribucin de frecuencias para una variable cualquiera:
X
i
n
i
N
i
0 2 2
1 3 5 N
j-1
2 6 11 N
j
3 5 16
4 4 20
20
Para este caso, tenemos un nmero par de datos, de acuerdo a lo planteado para el caso de datos sin agrupar,
la mediana tomara el valor del promedio de los dos valores centrales, esto es, los valores que se encuentren
en la posicin 10 y 11; por tanto, la mediana para este caso es igual a 2. Comprobemos lo anterior con la
frmula presentada:
Tenemos que 10
2
20
2
n
= = , adems N
j-1
<
2
n
es decir, 5<10 y N
j
>
2
n
o sea 11>10, por tanto,
M
e
= x
j
= 2.
Ejemplo Caso b:
Consideremos la anterior distribucin de frecuencias con un leve cambio:
X
i
n
i
N
i
0 2 2
1 3 5
x
j-1
2 5 10 N
j-1
x
j
3 6 16 N
j
4 4 20
20
Tenemos que 10
2
20
2
n
= = , adems N
j-1
=
2
n
es decir, N
3
=10=
2
n
, por tanto
5 , 2
2
5
2
3 2
2
x x
Me
j 1 - j
= =
+
=
+
=
Podemos comprobar el resultado anterior, transformando la distribucin de frecuencias en una variable cuyos
datos no estn agrupados,
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
xi 0 0 1 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4
5 , 2
2
5
2
3 2
Me = =
+
=
Mediana para datos agrupados - Variable Continua
Pgina 55 de 177
Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisin los valores
que toman los datos, ya que esa informacin se ha perdido en privilegio del agrupamiento interval. Por lo tanto,
en este caso, debemos buscar otro mtodo para determinar el valor de la mediana. Consideremos como
Ij
x al
lmite inferior del j-simo intervalo, de manera anloga como
Sj
x al lmite superior del j-simo intervalo.
Para la variable continua tambin se tienen dos casos, como se ver a continuacin:
a. Cuando N
j-1
=
2
n
, entonces Me =
1 - Sj
x .
b. Cuando N
j-1
<
2
n
y N
j
>
2
n
, se puede calcular la mediana empleando las frecuencias absolutas mediante
la siguiente frmula
A
n
N
2
n
LI Me
j
1 - j
|
|
|
|
.
|
\
|
+ = ,
donde,
LI: Lmite Inferior del intervalo mediano, es decir, el intervalo donde se encuentra la
mediana, el cual se determina observando en que intervalo se encuentra la posicin
2
n
.
n: Nmero de observaciones.
N
j-1
: Frecuencia absoluta acumulada anterior al intervalo mediano.
n
j
: Frecuencia absoluta del intervalo mediano.
A: Amplitud del intervalo.
con base en las frecuencias relativas mediante la siguiente frmula
A
f
F 0,5
LI Me
j
1 - j
|
|
.
|
\
|
+ = ,
Donde:
LI: Lmite Inferior del intervalo mediano, es decir, el intervalo donde se encuentra la
mediana, el cual se determina observando en que intervalo se encuentra la posicin
2
n
.
n: Nmero de observaciones.
F
j-1
: Frecuencia relativa acumulada anterior al intervalo mediano.
f
j
: Frecuencia relativa del intervalo mediano.
A: Amplitud del intervalo.
Pgina 56 de 177
Ejemplo Caso a
Consideremos la siguiente distribucin de frecuencias:
X
i-1
X
i
n
i
N
i
2 6 2 2
6 10 3 5
10 14 x
Sj
5 10 N
j-1
14 18 6 16 N
j
18 22 4 20
20 -
Tenemos que 10
2
20
2
n
= = , adems N
j-1
=
2
n
es decir, N
3
=10=
2
n
, por tanto
M
e
= x
Sj
= x
S3
= 14.
Ejemplo Caso b
Consideremos la anterior distribucin de frecuencias con un leve cambio:
X
i-1
X
i
n
i
N
i
2 6 2 2
6 10 3 5 N
j-1
10 14 x
Sj
6 n
j
11 N
j
Intervalo
Mediano
14 18 5 16
18 22 4 20
20 -
Tenemos que 10
2
20
2
n
= = , adems N
j-1
= N
2
= 5 <
2
n
=10; y N
j
= N
3
= 11 >
2
n
=10, por tanto:
13,33 Me
,33 3 10
) 4 (
6
5
10
) 4 (
6
5 10
10
) 10 14 (
6
5
2
20
10
A
n
N
2
n
LI Me
j
1 - j
=
+ =
|
.
|
\
|
+ =
|
.
|
\
|
+ =
|
|
|
|
.
|
\
|
+ =
|
|
|
|
.
|
\
|
+ =
Pgina 57 de 177
La Moda
La moda, o valor modal, como su nombre lo indica, es el valor ms comn, es el valor de la variable que ms
se repite; es decir, aquel valor de la variable (que puede no ser un nico valor) que observa con mayor
frecuencia dentro de una distribucin. Un conjunto de datos puede tener una sola moda, en este caso se suele
llamar distribucin unimodal, si tiene dos modas se denomina bimodal, o varias modas y llamarse multimodal.
Sin embargo puede ocurrir que la distribucin no posea moda.
Clculo para datos sin agrupar
En los datos sin agrupar o en los datos agrupados para variables discretas donde cada clase es un valor
diferente de la variable, basta una simple inspeccin ocular.
Ejemplo
Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12.
Para este conjunto de datos, el valor que mas se repite es 5, por tanto este valor representa la moda, esto es:
Mo = 5.
Clculo para datos agrupados
Se debe utilizar de preferencia cuando la amplitud de los intervalos es constante, para ello podemos observar y
comprender su clculo as:
Variable Discreta
Consideremos el ejemplo de los salarios de 50 operarias de cierta fbrica en particular, presentado en la
siguiente tabla:
Pgina 58 de 177
Miles de
Pesos/Da
X
i
n
i
50 1
51 3
52 5
53 9
54 12
55 10
56 5
57 3
58 2
50
El valor que presenta mayor frecuencia es 54 con una repeticin de 12 personas con el mismo salario, de esta
manera, afirmamos que el salario ms comn dentro de la fbrica es de $54.000 diarios.
Consideremos el ejemplo del fumador, cuyos datos se encuentran resumidos a continuacin:
Cantidad
(X
i
)
Frecuencia
(f
i
)
18 1
19 2
20 1
21 2
22 1
Total 7
Observamos que los valores de mayor frecuencia corresponden a 19 y 21, por tanto, se trata de una
distribucin bi-modal con Mo
1
= 19 y Mo
2
= 21.
Variable Continua
Existen diversas frmulas para la estimacin del valor modal cuando de una variable continua se refiere; sin
embargo, tomaremos como valor modal la marca de clase del respectivo intervalo modal. Cabe mencionar que
por intervalo modal entenderemos aquel intervalo que presenta la mayor frecuencia observada.
Sin embargo, presentaremos las frmulas que se pueden encontrar en los diversos textos para su debido
conocimiento y aplicacin
Clculo a partir de la frecuencia relativa
Pgina 59 de 177
A
f f 2f
f f
LI Mo
1 m 1 - m m
1 - m m
|
|
.
|
\
|
+ =
+
Donde,
Mo: Moda
LI: Lmite inferior del intervalo modal
f
m
: Frecuencia relativa del intervalo modal (clase modal)
f
m-1
: Frecuencia relativa del intervalo pre-modal (clase pre-modal)
f
m+1
: Frecuencia relativa del intervalo pos-modal (clase pos-modal)
A: Amplitud del intervalo modal.
La frmula para estimar la moda a partir de la frecuencia absoluta es similar a la presentada anteriormente, tan
solo se trabaja con las frecuencias absolutas:
A
n n 2n
n n
LI Mo
1 m 1 - m m
1 - m m
|
|
.
|
\
|
+ =
+
Ejemplo
Consideremos el ejemplo de las 100 baldosas; cuyos datos se resumen a continuacin:
Kg/m
2
X
i
m
i
n
i
100 200 150 4
200 300 250 10
300 400 350 21 Clase premodal
400 500 450 33 Clase modal
500 600 550 18 Clase posmodal
600 700 650 9
700 800 750 5
100
Observamos que el cuarto intervalo presenta la mayor cantidad de datos, por tanto, este intervalo se denomina
intervalo o clase modal. De esta manera, tenemos que el valor modal esta dado por:
44 , 444 00 1
18 1 2 2(33)
21 33
400 A
n n 2n
n n
LI Mo
1 m 1 - m m
1 - m m
=
|
|
.
|
\
|
+ =
|
|
.
|
\
|
+ =
+
Pgina 60 de 177
A pesar de que el valor 444,44 no es un dato real de la informacin, asumimos ese parmetro como el de
mayor ocurrencia.
Relacin: Media - Mediana - Moda
Cuando trabajamos un problema de estadstica, debemos decidir si vamos a utilizar la media, la mediana o la
moda como medidas de tendencia central. Las distribuciones simtricas que slo contienen una moda, siempre
tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida
de tendencia central, pues ya est hecha la seleccin.
Obviamente, si todas las observaciones estuvieran concentradas en un solo valor de la variable, media,
mediana y moda coincidiran en el mismo. Si las observaciones se fueran distribuyendo en forma simtrica, a la
izquierda y a la derecha de ese valor central, media, mediana y modo seguiran coincidiendo.
En una distribucin positivamente sesgada (es decir, sesgada hacia la derecha), la moda todava se encuentra
en el punto ms alto de la distribucin, la mediana est hacia la derecha de la moda y la media se encuentra
todava ms a la derecha de la moda y la mediana; es decir, en una distribucin asimtrica a la derecha, la
media, es mayor que la mediana y que la moda, tal como lo presenta el siguiente grfico
Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central ms que las
observaciones de la parte derecha, generando una distribucin asimtrica hacia la izquierda; en este caso
como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones,
su valor se correr a la izquierda tambin y por el mismo motivo, la media ser menor que la mediana y ambas
Pgina 61 de 177
menor que la moda; es decir, en una distribucin negativamente sesgada, la moda sigue siendo el punto ms
alto de la distribucin, la mediana est hacia la izquierda de ella y la media se encuentra todava ms a la
izquierda de la moda y la mediana.
Este corrimiento de la media se explica porque si tomamos un conjunto de datos cualquiera a los cuales
calculamos media, mediana y moda y agregamos un dato extremo y volvemos a calcular la media, la mediana
y la moda, veremos que la media puede variar notablemente, mientras que la mediana y la moda permanecen
idnticas. Esta no variacin de la mediana y la moda reciben el nombre de robustez. Las medidas basadas en
el orden como la mediana- gozan de sta en tanto que las medidas basadas en la suma como la media- se
ven ms afectadas por las observaciones extremas y son, por lo tanto, poco robustas.
Cuando la poblacin est sesgada negativa o positivamente, con frecuencia la mediana resulta ser la mejor
medida de posicin, debido a que siempre est entre la moda y la media. La mediana no se ve altamente
influida por la frecuencia de aparicin de un solo valor como es el caso de la moda, ni se distorsiona con la
presencia de valores extremos como la media.
Relacin Emprica entre Media, Mediana y Moda
Para curvas de frecuencia unimodales que sean poco asimtricas tenemos la siguiente relacin emprica
Media Moda = 3(media- mediana).
CUANTILES: Cuartiles, Deciles y Percentiles
Son medidas de localizacin similares a las anteriores, las cuales las denominamos medidas de tendencia
central, sin embargo, tambin pueden ser llamadas medidas de localizacin ya que, igual determinan
posiciones centrales de la informacin. Se les denomina CUANTILES (Q). Su funcin es informar del valor de
la variable que ocupar la posicin (en tanto por cien) que nos interese respecto de todo el conjunto de
variables.
Podemos decir que los Cuantiles son unas medidas de posicin que dividen a la distribucin en un cierto
nmero de partes de manera que en cada una de ellas hay el mismo de valores de la variable.
Las ms importantes son:
CUARTILES, dividen a la distribucin en cuatro partes iguales (tres divisiones): C
1
, C
2
, C
3
, correspondientes al
25%, 50%, 75%.
DECILES, dividen a la distribucin en 10 partes iguales (9 divisiones): D
1
,..., D
9
, correspondientes a
10%,...,90%.
Pgina 62 de 177
PERCENTILES, cuando dividen a la distribucin en 100 partes (99 divisiones): P
1
,..., P
99
, correspondientes a
1%,...,99%.
Existe un valor en cual coinciden los cuartiles, los deciles y percentiles esto es cuando son iguales a la
Mediana y as veremos
100
50
10
5
4
2
= =
Para su clculo distinguiremos entre distribuciones agrupadas y enlistadas:
En las distribuciones sin agrupar, primero hallaremos el lugar que ocupa:
Entonces tendremos que:
N
i-1
< (%).n < N
i
Q = x
i
En el supuesto que (%).n = Ni
2
1 +
+
=
i i
x x
Q
Primero encontraremos el intervalo donde estar el cuantil:
Lugar N
i-1
< (%) n< N
i
Intervalo [L
i-1
, L
i
) , en este caso:
( )
i
i
i
n
N N
L Q
1
1
%
+ =
a
i
Ejemplo: DISTRIBUCIONES AGRUPADAS:
En la siguiente distribucin
x
i
f
i
F
i
5 3 3
10 7 10
15 5 15
20 3 18
25 2 20
n = 20
Calcular la mediana (Me); el primer y tercer cuartil (C
1
, C
3
); el 4 decil (D
4
) y el 90 percentil (P
90
).
Mediana (Me)
Lugar que ocupa la mediana lugar 20/2 = 10.
Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos el clculo:
5 , 12
2
15 10
2
1
=
+
=
+
=
+ i i
x x
Me
Primer cuartil (C
1
)
Lugar que ocupa en la distribucin (). 20 = 20/4 = 5
Como N
i-1
< (25%).n < N
i
, es decir 3 < 5 < 10 esto implicara que C
1
= x
i
=10
Tercer cuartil (C
3
)
Lugar que ocupa en la distribucin (3/4).20 = 60/4 = 15, que coincide con un valor de la frecuencia absoluta
acumulada, por tanto realizaremos el clculo:
5 , 17
2
20 15
2
1
3
=
+
=
+
=
i i
x x
C
Cuarto decil (D
4
)
Lugar que ocupa en la distribucin (4/10).20 = 80/10 = 8.
Como N
i-1
< (%).n < N
i
ya que 3 < 8 < 10 por tanto D
4
=10.
Pgina 63 de 177
Nonagsimo percentil (P
90
)
Lugar que ocupa en la distribucin (90/100).20 = 1800/100 = 18, que coincide con un valor de la frecuencia
absoluta acumulada, por tanto realizaremos el clculo:
5 , 22
2
25 20
2
1
90
=
+
=
+
=
i i
x x
P
Ejemplo:
DISTRIBUCIONES AGRUPADAS: Hallar el primer cuartil, el cuarto decil y el 90 percentil de la siguiente
distribucin:
[L
i-1
, Li) f
i
F
i
[ 0 , 100) 90 90
[100 , 200) 140 230
[[200 , 300) 150 380
[300 , 800) 120 500
n = 500
Primer cuartil (C
4
)
Lugar ocupa el intervalo del primer cuartil: (1/4). 500 = 500/4 = 125.
Por tanto C
4
estar situado en el intervalo [100 200).
Aplicando la expresin directamente, tendremos:
125 100
140
90 125
100
4
=
+ = C
Cuarto decil (D
4
)
Lugar que ocupa: (4/10).500 = 200.
Por tanto D
4
estar situado en el intervalo [100 200).
Aplicando la expresin tendremos:
57 , 178 100
140
90 200
100
4
=
+ = D
Nonagsimo percentil (P
90
)
Lugar que ocupa: (90/100).500 = 450.
Por tanto P
90
estar situado en el intervalo [300 800).
Aplicando la expresin tendremos:
67 , 591 500
120
70
300 500
120
380 450
300
90
= + =
+ = P
Leccin 8: Medidas de dispersin: Rango, Varianza, Desviacin
tpica, coeficiente de variacin, puntaje estandarizado.
Como se mencion anteriormente, las medidas de tendencia central tienen como objetivo sintetizar los datos
en un valor representativo; como complemento, las medidas de dispersin nos dicen hasta que punto estas
medidas de tendencia central son representativas como sntesis de la informacin; de esta manera, las
medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin
respecto al valor central como la media aritmtica. Cuanto menor es la dispersin, tanto mayor ser la precisin
Pgina 64 de 177
del sistema de medicin. Si los estadgrafos de posicin se relacionan con el concepto de exactitud, los de
dispersin se relacionan con la precisin de las tcnicas.
La dispersin es importante porque:
- Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si
los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos.
- Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de
identificarlos antes de abordar esos problemas.
- Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia
dispersin de valores con respecto al centro de distribucin o esto presenta riesgos inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones
ms grandes.
Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo medimos la
variabilidad de una distribucin emprica? Vamos a considerar slo algunas medidas de dispersin: el rango, el
rango inter-cuartlico, la varianza, la desviacin estndar y el coeficiente de variacin.
EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la
diferencia entre el mximo valor (X
n
X
Max
) y el mnimo (X
1
X
Min
) en un conjunto de datos, de manera ms
formal:
R = X
Mx
X
Mn
= X
n
- X
1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de 1er ao, a saber: 18,23, 27,34 y 25., para calcular
el rango o recorrido de la variable, se tiene que:
R = X
n
X
1
= 34 18 = 16 aos
Rango para datos agrupados
Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases abiertos
podemos aproximar el rango mediante el uso de los lmites de clases. Se aproxima el rango tomando el lmite
superior de la ltima clase menos el lmite inferior de la primera clase, de manera ms formal:
R= (lim. Sup. de la clase n lim. Inf. de la clase 1)
Pgina 65 de 177
Ejemplo:
Dada la siguiente distribucin de frecuencia determinar el rango o recorrido:
Clases
P.M.
m
i
n
i
fi Ni Fi
7,420 21,835 14,628 10 0,33 10 0,33
21,835 36,250 29,043 4 0,13 14 0,46
36,250 50,665 43,458 5 0,17 19 0,63
50,665 65,080 57,873 3 0,10 22 0,73
65,080 79,495 72,288 3 0,10 25 0,83
79,495 93,910 86,703 5 0,17 30 1,00
Total 30 1,00
El rango de la distribucin de frecuencias se calcula as:
R = (lim. Sup. de la clase n lim. Inf. De la clase 1)
= (93.910 7.420) = 86.49
Propiedades del Rango o Recorrido:
- El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que simplemente es la
distancia entre los valores extremos (mximo y mnimo) en una distribucin.
- Puesto que el recorrido se basa en los valores extremos, ste tiende a ser errtico. No es extrao que en
una distribucin de datos econmicos o comerciales incluya a unos pocos valores en extremo pequeos o
grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersin con respecto a esos
valores anormales, ignorando a los dems valores de la variable.
- La principal desventaja del recorrido es que slo esta influenciado por los valores extremos, puesto que no
cuenta con los dems valores de la variable. Por tal razn, siempre existe el peligro de que el recorrido
ofrezca una descripcin distorsionada de la dispersin.
- En el control de la calidad se hace un uso extenso del recorrido cuando la distribucin a utilizarse no la
distorsionan y cuando el ahorro del tiempo al hacer los clculos es un factor de importancia.
RANGO INTERCUARTLICO:
Teniendo en cuenta la principal desventaja del rango (toma en cuenta solo los valores extremos), surge el
rango intercuartlico, denotado por RI, su clculo se limita a la diferencia entre el tercer y el primer cuartil, es
decir
Pgina 66 de 177
Esto nos dice en cuntas unidades de los valores que toma la variable se concentra el cincuenta por ciento
central de los casos.
VARIANZA
Se representa por S
2
. Se define como el promedio de las desviaciones de los datos entre si. La suma de los
cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la
distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea
la media aritmtica.
Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado. Precisamente la
manera de simbolizarla es S
2
.
Propiedades de la varianza:
- Es siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente cuando X
i
= X
- La varianza es la medida de dispersin cuadrtica optima por ser la menor de todas.
- Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Vemoslo:
- Si a X
i
le sumamos una constante X
i
= X
i
+ K. tendremos (sabiendo que )
- Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el
cuadrado de dicha constante. Vemoslo:
Si a xi = xi k tendremos (sabiendo que )
- Si en una distribucin obtenemos una serie de subconjuntos disjuntos, la varianza de la distribucin inicial se
relaciona con la varianza de cada uno de los subconjuntos mediante la expresin
Siendo
Ni el n de elementos del subconjunto (i)
Pgina 67 de 177
2
i
S
la varianza del subconjunto (i)
LA DESVIACIN ESTNDAR
Tambin recibe el nombre de desviacin tipo o desvo tpico. Es posible identificar conjuntos de datos que a
pesar de ser muy distintos en trminos de valores absolutos, poseen la misma media. Una medida diferencial
para identificar esos conjuntos de datos es la concentracin o dispersin alrededor de la media.
- Desviacin estndar para datos sin agrupar
Una manera que aparece como muy natural para construir una medida de dispersin sera promediar las
desviaciones de la media, pero como vimos
Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que
todas las desviaciones sean positivas. La raz cuadrada del promedio de estas cantidades recibe el
nombre de desviacin estndar, o desviacin tpica y es representada por la siguiente frmula:
La desviacin estndar slo puede utilizarse en el caso de que las observaciones se hayan medido con
escalas de intervalos o razones.
A mayor valor de la desviacin estndar, mayor dispersin de los datos con respecto a su media. Es un
valor que representa los promedios de todas las diferencias individuales de las observaciones respecto
a un punto de referencia comn, que es la media aritmtica. Se entiende entonces que cuando este
valor es ms pequeo, las diferencias de los valores respecto a la media, es decir, los desvos, son
menores y, por lo tanto, el grupo de observaciones es ms homogneo que si el valor de la
desviacin estndar fuera ms grande. O sea que a menor dispersin mayor homogeneidad y a mayor
dispersin, menor homogeneidad.
- Desviacin estndar para datos agrupados
1. Clculo usando las frecuencias absolutas
2. Clculo usando las frecuencias relativas
Pgina 68 de 177
Propiedades de la Desviacin Estndar
- La desviacin estndar es siempre un valor no negativo.
- Es la medida de dispersin ptima por ser la ms pequea.
- La desviacin estndar toma en cuenta las desviaciones de todos los valores de la variable.
- Si a todos los valores de la variable se le suma una misma constante la desviacin estndar no vara.
- Si a todos los valores de la variable se multiplican por una misma constante, la desviacin estndar
queda multiplicada por el valor absoluto de dicha constante.
EL COEFICIENTE DE VARIACIN:
Para comparar la dispersin de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que
corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad
que no dependa de las unidades o del tamao de los datos. Este coeficiente nicamente sirve para comparar
las dispersiones de variables correspondientes a escalas de razn.
Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado
coeficiente de variacin:
(Las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad
de medida de la media). A menor coeficiente de variacin consideraremos que la distribucin de la variable
medida es ms homognea.
PUNTAJE ESTANDARIZADO:
Cuando se tiene una distribucin simtrica, su polgono de frecuencias revelar una forma de campana muy
comn en estadstica. Esta curva es llamada curva normal, de error, de probabilidad o campana de Gauss.
En ella la media aritmtica se localiza en la mitad de la distribucin. En el eje horizontal se ubican los valores
que toma la variable y en el vertical la frecuencia absoluta o relativa. El rea bajo la curva tendr un valor del
100%
Figura: Curva normal o campana de Gauss
Pgina 69 de 177
El puntaje tpico o estandarizado o variable normalizada, es una medida de dispersin muy utilizada como
variable estadstica en este tipo de distribucin, denominada distribucin normal. El puntaje estandarizado
mide la desviacin de una observacin con respecto a la media aritmtica, en unidades de desviacin estndar,
determinndose as la posicin relativa de una observacin dentro del conjunto de datos. Por lo general se
simboliza por Z.
s
x X
Z
=
Por ser adimensional, el puntaje Z es til para comparar datos individuales de distribuciones que tienen
distintas unidades de medida, as como diferentes medias y desviaciones estndar.
Propiedades:
1. 0 =
z
2. 1
2
= z o
Al terminar el segundo semestre de lao 2010, un grupo de 150 estudiantes de primer semestre de Ingeniera
de un CEAD, obtuvieron los siguientes resultados en el puntaje final de los cursos Lgica Matemtica y
Estadstica Descriptiva:
- Lgica Matemtica: puntuacin media de 3.9 y varianza 3.2.
- Estadstica Descriptiva: puntuacin media de 3.7 y desviacin estndar 1.7.
a. En cul curso hubo mayor dispersin absoluta? En cul hubo mayor dispersin relativa?
b. Si un estudiante obtuvo como nota final en Lgica Matemtica 3.8 y en Estadstica Descriptiva 3.5. En
cul curso fue su puntuacin relativa superior?
Solucin:
a. Para determinar la dispersin absoluta:
Lgica Matemtica: 79 . 1 2 . 3 2 . 3
2
= = = s s
Estadstica Descriptiva: 7 , 1 = s
Se tiene entonces que en Lgica Matemtica hubo una mayor dispersin absoluta que en Estadstica
Descriptiva.
EJEMPLO
10.110.1
Pgina 70 de 177
Para la dispersin Relativa:
Lgica Matemtica: % 9 . 45 100
9 . 3
79 . 1
= = CV
Estadstica Descriptiva: % 46 100
7 . 3
7 . 1
= = CV
En Estadstica Descriptiva hubo una mayor dispersin relativa 46% > 45.9%
b. Para el clculo de la puntuacin relativa, se hace uso del puntaje estandarizado. Es decir, se requiere
estandarizar las calificaciones convirtindolas en puntuaciones Z.
Lgica Matemtica: 06 . 0
79 . 1
9 . 3 8 . 3
=
=
s
x x
Z
Estadstica descriptiva: 12 . 0
7 . 1
7 . 3 5 . 3
=
=
s
x x
Z
Estos valores de puntuacin Z negativos indican que ambas calificaciones se encuentran por debajo de la
media. Este es un principio del puntaje estandarizado: Siempre que un valor sea menor que la media, su
puntuacin Z correspondiente ser negativa.
Estos resultados afirman entonces que el estudiante con calificaciones de 3.8 en Lgica Matemtica y 3.5 en
Estadstica Descriptiva, est por debajo del promedio del grupo en ambos cursos.
Dado que -0.06 se encuentra ms cera a 0 (la media de la variable estandarizada), se dice que la puntuacin
relativa del estudiante fue superior en Lgica Matemtica.
Leccin 9: Medidas de forma: Asimetra y Curtosis.
Despus de conocer cmo vara un grupo de datos respecto a su media e identificar otras medidas de
variacin, a continuacin se estudiar algunos aspectos sobre la forma de las curvas que presentan los datos.
Asimetra: La primera caracterstica que se estudia es el coeficiente de asimetra, el cual mide el grado de
simetra en la distribucin de los datos, ya que conocer la distribucin de los datos, permite tomar ciertos
caminos para el anlisis de los mismos.
Si un conjunto de datos tiene distribucin simtrica es porque se cumple: Mo Me x = =
En las distribuciones asimtricas la media se corre en el sentido del alargamiento o sesgo por efecto de las
frecuencias y de los valores extremos de la variable; la mediana tambin se corre pero menos que la media ya
que en ella slo influyen las frecuencias; en tanto que la moda no es influenciada ni por las frecuencias ni por
los valores extremos. Una distribucin es asimtrica positiva cuando presenta un alargamiento o sesgo a la
derecha: x Me Mo < < Una distribucin ser asimtrica negativa cuando presenta un alargamiento o
sesgo a la izquierda: Mo Me x < <
Las asimetras positivas son las ms frecuentes que las sesgadas hacia la izquierda, porque con frecuencia es
ms fcil obtener valores excepcionalmente grandes que valores excepcionalmente pequeos. Ejemplo de ello
es la distribucin de valores en los consumos de servicios pblicos, las calificaciones en pruebas, los sueldos,
etc.
Se reconocen, entre otras, las siguientes medidas para calcular el grado de la asimetra:
Pgina 71 de 177
- Coeficiente de Pearson. Asimetra en funcin de la media y la moda. Vara entre 3 y es 0 en la
distribucin normal.
s
Me x
As
s
Mo x
As
) ( 3
=
=
- Media cuartil de asimetra o media de Bowley. Vara entre 1 y es 0 en la distribucin normal.
1 3
2 3 1
2
Q Q
Q Q Q
As
+
=
Si 0 = As la distribucin es simtrica.
Si 0 > As la distribucin es asimtrica positiva.
Si 0 < As la distribucin es asimtrica negativa.
Apuntamiento O Curtosis: Las curvas de distribucin, comparadas con la curva de distribucin normal,
pueden presentar diferentes grados de apuntamiento o altura de la cima de la curva. Esta agudeza en la cima
se observa en la moda. Si la curva es ms plana que la normal se dice que la curva es platicrtica; si es ms
aguda que la normal, recibe el nombre de apuntada o leptocrtica. Si la distribucin es normal, la curva se
conoce tambin como mesocrtica.
La curtosis es la medida de la altura de la curva y est dada por:
4
4
s n
f Z
Ap
i i
Si 3 = Ap la distribucin es normal o mesocrtica.
Si 3 > Ap la distribucin es apuntada o leptocrtica.
Si 3 < Ap la distribucin es achatada o platicrtica.
Otra medida de curtosis que se emplea est basada en el rango semiintercuartlico y los percentiles 10 y 9:
) ( 2
10 90
1 3
10 90
2
P P
Q Q
P P
Q
Ap
D
=
En el siguiente ejemplo se puede comprender de una manera prctica, la forma de calcular ste tipo de
medidas.
Pgina 72 de 177
El coordinador acadmico del programa de Administracin de Empresas, desea conocer el rendimiento
acadmico de los estudiantes de primer semestre en el 2010, en los cursos de Lgica Matemtica,
Competencias Comunicativas, Cultura Poltica, Estadstica Descriptiva y Herramientas Informticas. Para esto
selecciona una muestra de 55 estudiantes de los distintos programas que se ofrecen en el CEAD. La siguiente
tabla, arroja los resultados de la investigacin realizada por el funcionario.
Tabla: Distribucin de frecuencias de las calificaciones de primer semestre
Calificacin
Lgica
Matemtica
Competencias
Comunicativas
Cultura
Poltica
Estadstica
Descriptiva
Herramientas
Informticas
0,0 1 3 2 1 1
0,5 4 3 2 1 2
1,0 7 5 3 2 3
1,5 9 6 4 4 7
2,0 9 7 6 11 9
2,5 8 7 8 14 11
3,0 6 7 9 12 9
3,5 4 6 9 6 7
4,0 3 5 7 3 3
4,5 2 3 4 1 2
5,0 2 3 1 0 1
Total 55 55 55 55 55
En la tabla siguiente se reporta un resumen de las medidas estadsticas por cada uno de los cursos.
Medida
Lgica
Matemtica
Competencias
Comunicativas
Cultura
Poltica
Estadstica
Descriptiva
Herramientas
Informticas
x 2.25 2.5 2.75 2.53 2.5
Me 2.0 2.5 3.0 2.5 2.5
Mo 1.5 y 2.0 2.0, 2.5 y 3.0 3.0 y 3.5 2.5 2.5
2
s 1.45 1.84 1.45 0.76 1.12
s 1.20 1.36 1.20 0.87 1.06
1
Q
1.5 1.5 2.0 2.0 2.0
2
Q
2.0 2.5 3.0 2.5 2.5
3
Q
3.0 3.5 3.5 3.0 3.4
a-) Asimetra:
Para Lgica Matemtica: Se observa que x Me Mo < < , lo que indica que la distribucin tiene asimtrica
positiva. Para confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley: En este caso se
trabajar con la media de Bowley, pues la distribucin tiene dos modas y no permite un resultado seguro con el
coeficiente de Pearson.
EJEMPLO
10.110.1
Pgina 73 de 177
0 33 . 0
5 . 1 3
) 2 ( 2 3 5 . 1 2
1 3
2 3 1
> =
+
=
+
=
Q Q
Q Q Q
As
El polgono de frecuencias de las calificaciones de Lgica Matemtica confirma los resultados.
Figura: Curva asimtrica positiva Polgono de frecuencias de calificaciones de Lgica Matemtica
La curva lleva a concluir que la mayora de los estudiantes estn por debajo de la media en el curso de Lgica
Matemtica y son pocos los estudiantes que la superan.
Para Competencias Comunicativas: Se observa que x Me Mo = = , lo que indica que la distribucin es
simtrica. Para confirmarlo se hace uso del coeficiente de Bowley, pues la distribucin tiene tres modas y no
permite un resultado seguro con el coeficiente de Pearson.
0
5 . 1 5 . 3
) 5 . 2 ( 2 5 . 3 5 . 1 2
1 3
2 3 1
=
+
=
+
=
Q Q
Q Q Q
As
El polgono de frecuencias de las calificaciones de Competencias Comunicativas confirma los resultados.
Figura: Curva simtrica platicrtica
Polgono de frecuencias de calificaciones de Competencias Comunicativas
con el coeficiente de Pearson.
Para determinar el grado de apuntamiento o curtosis, se debe determinar el puntaje tpico o estandarizado de
cada clase y luego aplicar la frmula que lo calcula. En la siguiente tabla se indican estos valores.
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
Pgina 74 de 177
Tabla: Clculo de Z para la distribucin de frecuencias de las calificaciones de Competencias Comunicativas
Calificacin f Z
i i
f Z
4
0,0 3 -1,838235294 34,2551328
0,5 3 -1,470588235 14,0309024
1,0 5 -1,102941176 7,39910869
1,5 6 -0,735294118 1,7538628
2,0 7 -0,367647059 0,12788583
2,5 7 0 0
3,0 7 0,367647059 0,12788583
3,5 6 0,735294118 1,7538628
4,0 5 1,102941176 7,39910869
4,5 3 1,470588235 14,0309024
5,0 3 1,838235294 34,2551328
Total 55 0 115,133785
3 62 . 0
36 . 1 55
13 . 115
4 4
4
< =
=
Ap
s n
f Z
Ap
i i
Por lo tanto, la curva es simtrica platicrtica o achatada.
Estos resultados indican que la mayora de los estudiantes en Competencias Comunicativas estn en el rango
de la media del curso, adems sus notas son muy homogneas alrededor de la media.
Para Cultura Poltica: Se observa que x Me Mo > > , lo que indica que la distribucin es asimtrica negativa.
Para confirmarlo se hace uso de la media de Bowley, pues la distribucin tiene dos modas y no permite un
resultado seguro con el coeficiente de Pearson.
0 33 . 0
0 . 2 5 . 3
) 0 . 3 ( 2 5 . 3 0 . 2 2
1 3
2 3 1
< =
+
=
+
=
Q Q
Q Q Q
As
El polgono de frecuencias de las calificaciones de Cultura Poltica confirma los resultados.
Figura: Curva asimtrica negativa
Polgono de frecuencias de calificaciones de Cultura Poltica
Esto quiere decir que las calificaciones de la mayora de los estudiantes del curso Cultura Poltica estn por
encima de la media.
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
1
2
3
4
5
6
7
8
9
10
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
Pgina 75 de 177
Para Estadstica Descriptiva: Se observa que x Me Mo = = , lo que indica que la distribucin es simtrica.
Para confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley:
0 03 . 0
87 . 0
5 . 2 53 . 2
~ =
=
s
Mo x
As
y 0
0 . 2 0 . 3
) 5 . 2 ( 2 0 . 3 0 . 2 2
1 3
2 3 1
=
+
=
+
=
Q Q
Q Q Q
As
Para determinar el grado de apuntamiento o curtosis, se debe determinar el puntaje tpico o estandarizado de
cada clase y luego aplicar la frmula que lo calcula. En la tabla siguiente tabla se indican estos valores.
Tabla: Clculo de Z para la distribucin de frecuencia de las calificaciones de Estadstica Descriptiva
Calificacin f Z
i i
f Z
4
0,0 1 -2,908045977 71,516306
0,5 1 -2,333333333 29,6419753
1,0 2 -1,75862069 19,1301647
1,5 4 -1,183908046 7,85835926
2,0 11 -0,609195402 1,51502275
2,5 14 -0,034482759 1,9794E-05
3,0 12 0,540229885 1,02210536
3,5 6 1,114942529 9,27173856
4,0 3 1,689655172 24,4519547
4,5 1 2,264367816 26,289837
5,0 0 -1,352941176 0
Total 55 -4,571331981 190,697484
3 05 . 6
87 . 0 55
70 . 190
4 4
4
> =
=
Ap
s n
f Z
Ap
i i
Por lo tanto, la curva es simtrica leptocrtica o apuntada.
Lo anterior indica que las calificaciones de Estadstica Descriptiva de la muestra de 55 estudiantes estn muy
cerca de la media y que existe adems, un pico en 2.5, sealando una alta frecuencia en esta calificacin.
Figura: Curva simtrica leptocrtica
Polgono de frecuencias de calificaciones de Estadstica Descriptiva
Para Herramientas Informticas: Se observa que x Me Mo = = , lo que indica que la distribucin es
simtrica. Para confirmarlo se hace uso del coeficiente de Pearson:
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
Calificacin
F
r
e
c
u
e
n
c
i
a
Pgina 76 de 177
0
06 . 1
5 . 2 5 . 2
=
=
s
Mo x
As
El polgono de frecuencias de las calificaciones de Herramientas Informticas confirma los resultados. La curva
es simtrica mesocrtica o normal.
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION EN EXCEL
El proceso a seguir, cuando los datos estn SIN AGRUPAR, es decir, tal como se recolectaron, si trabajamos
con la variable nmero de hermanos, para la aplicacin de las diferentes medidas, sern las siguientes:
- Consideremos los datos del CUADRO No. 1, que contiene informacin de 10 variables correspondiente a
50 estudiantes seleccionados como muestra, de una poblacin de 1.080 estudiantes, que a continuacin se
reedita:
Cuadro No. 1.
No.
orden
Facultad Sexo
No.
hermanos
No.
libros
ledos
Promedio
calificacin
matemticas
Actualmente
trabaja
Calificaciones
ICFES
Edad
(aos)
Estatura
(Cm)
Peso
(Kg)
2 2 2 2 2 4,1 1 360 20 158 48
9 3 2 0 6 3,4 2 320 20 170 70
12 3 1 6 3 3,6 2 330 18 174 78
35 2 2 0 7 3,6 1 280 22 155 60
41 3 1 3 5 4,1 2 320 16 170 72
63 3 2 4 2 3,1 2 320 24 172 69
74 2 2 2 4 3,6 2 325 20 169 66
113 1 1 1 3 3,4 2 280 23 178 82
147 3 1 1 8 5,0 1 310 17 174 83
175 1 2 3 2 2,6 1 270 15 165 60
199 2 2 0 2 3,9 2 290 26 171 66
214 1 1 1 7 3,5 2 310 22 172 80
234 1 1 1 2 3,6 2 320 20 168 70
268 3 1 3 12 3,9 1 310 21 166 64
327 3 1 1 8 5,0 1 310 17 174 83
331 1 2 0 6 3,4 2 380 20 165 58
364 1 2 3 2 3,3 2 280 16 166 58
400 3 2 0 6 3,6 2 280 17 148 46
405 1 2 2 11 4,6 2 400 24 165 60
470 1 2 3 2 3,0 1 300 20 164 70
507 3 1 1 8 5,0 1 310 17 174 83
512 1 2 0 3 2,8 1 310 20 171 59
545 2 1 6 10 3,9 2 310 17 171 64
557 2 1 6 2 3,1 1 270 21 168 60
587 3 1 1 4 3,3 2 300 32 160 65
589 3 2 2 3 2,6 1 270 17 165 59
590 1 1 0 2 2,7 1 280 19 168 71
616 3 2 0 3 3,8 2 265 19 156 54
621 3 1 0 3 3,0 2 290 17 171 82
653 1 1 1 3 3,4 2 280 23 178 82
Pgina 77 de 177
665 2 1 1 2 3,2 2 360 21 158 72
669 3 2 1 1 4,0 1 315 16 165 61
721 2 1 3 4 2,6 1 410 18 140 46
747 2 2 2 2 4,0 1 330 18 158 60
748 1 2 3 2 3,3 2 310 17 159 58
761 3 1 3 5 4,1 2 320 16 170 72
771 3 1 1 1 2,8 1 290 24 171 79
825 2 2 8 2 3,7 1 320 22 167 54
873 1 2 3 5 4,2 2 350 22 169 64
876 3 2 6 2 4,0 2 380 20 165 58
923 1 1 1 3 4,2 1 390 22 174 80
933 1 2 3 10 2,8 2 260 20 165 58
936 2 2 3 10 2,8 2 260 28 158 55
943 3 2 2 6 3,8 2 280 20 168 64
976 3 2 0 3 3,8 2 265 19 156 54
982 3 1 0 6 3,0 2 410 18 174 86
1001 3 1 3 5 3,1 2 280 17 169 76
1017 2 1 5 2 3,8 2 290 15 162 70
1025 2 1 1 2 3,2 2 360 21 158 72
1037 3 2 0 2 3,3 2 325 19 164 60
- Ubiqumonos en la barra de MENU, con el MOUSE haciendo CLIC en HERRAMIENTAS debiendo
aparecer la siguiente figura:
Pgina 78 de 177
Figura No. 1. Microsoft Excel
- Al hacer CLIC en el submen ANLISIS DE DATOS , debe aparecer la siguiente figura (Fig. 2):
Figura No. 2. Funciones para anlisis
Con la figura No. 2, correspondiente a ANLISIS DE DATOS, procederemos a seleccionar una de las
funciones, en nuestro caso la opcin identificada como ESTADSTICA DESCRIPTIVA, luego al hacer CLIC en
sta y ACEPTAR debe aparecer la figura siguiente (Fig. 3):
Pgina 79 de 177
Figura No. 3. Estadstica Descriptiva
- Teniendo en cuenta la Figura No. 3 ESTADSTICA DESCRIPTIVA, se comienza el procesamiento de los
datos. Recordemos que el RANGO DE ENTRADA es el correspondiente a la variable nmero de hermanos
registrados en el Cuadro No. 1.
- En la misma figura anterior, aparecen unas opciones de salida, con alternativa de ser una HOJA NUEVA o
en un LIBRO NUEVO.
- Adems, aparecen: RESUMEN DE ESTADSTICAS; NIVEL DE CONFIANZA PARA LA MEDIA: 95% o
cualquier otro valor establecido; K-ESIMO MAYOR y, finalmente, K-ESIMO MENOR, activando o haciendo
CLIC en cada uno de ellos, En caso de considerar la obtencin de un mayor nmero de resultados para el
anlisis.
- Al hacer CLIC en ACEPTAR, se obtiene la informacin, tal como puede observarse en la figura No. 4.
Figura No. 4. Resultados
- Para lograr los anteriores resultados en todas y cada una de las opciones (Resumen de estadsticas; nivel
de confianza para la media, K-simo mayor y K-simo menor), deben sealarse.
Los resultados de la figura No. 4, nos muestra un cuadro resumen con los valores de la Media, Error Tpico;
Mediana; Asimetra; Mnimo; Mximo; Suma; Conteo para la variable NUMERO DE HERMANOS.
Medidas
Resultados
Media 2,04
Error tpico 0,27547362
Mediana 1,5
Moda 1
Desviacin estndar 1,94789263
Varianza de la muestra 3,79428571
Curtosis 0,92539916
Coeficiente de asimetra 1,11511128
Rango 8
Mnimo 0
Mximo 8
Suma 102
Cuenta 50
Mayor (1) 8
Menor(1) 0
Nivel de confianza (95.0%) 0,55358463
Pgina 80 de 177
CAPTULO 3. ANLISIS DE REGRESIN
Leccin 10: Regresin lineal Simple
La palabra Regresin fue utilizada por primera vez por Francis Galton, (1.822 1.911) en sus estudios de
Biologa sobre la herencia, done l noto que las caractersticas promedio de la siguiente generacin de un
grupo particular, tenda a moverse en la direccin de las caractersticas promedio de la poblacin, ms que a la
generacin previa de dicho grupo.
La regresin es considerada una asociacin cuantitativa entre las variables que participan en el fenmeno.
Existen diversas clases de regresin, las cuales son visibles por medio de un modelo matemtico, el cual
relaciona las variables.
Segn el modelo matemtico se conocen diversas clases de regresin:
- Regresin lineal: x y | o + =
- Regresin cuadrtica:
2
2 1
x x y | | o + + =
- Regresin logartmica: ) (x Ln y + =o
As existen otros tipos de regresin, que describen fenmenos particulares.
Las variables que se estudian en una regresin son:
Variable de Respuesta: Es la variable Y, la cual se observa bajo condiciones experimentales, pero no se
puede controlar, lo que se mide por medio del llamado Error aleatorio. En todo modelo, se asume que la
variable de respuesta Y tiene distribucin normal, con media x X Y E | o + = ) ( y con varianza .
2
o Adems,
los valores observados y
1
, y
2
, y
3
,,y
n
. no estn correlacionados estadsticamente: Cov(y
i
, x
i
) = 0 para i j.
Variables Predictoras: Son las variables x
1
, x
2
, x
3
,,x
n
; cuyos valores se asumen de antemano, por lo cual no
son variables aleatorias, ya que pueden ser controlables en el fenmeno o experimento.
Diagrama de Dispersin.
Una distribucin bidimensional o bivariante puede representarse grficamente en un plano cartesiano, ubicando
en el eje horizontal o abscisa los valores de la primera variable denominada X y en el eje vertical u ordenada,
los valores de la segunda variable, Y. De manera pues que se grafican tantas parejas ordenadas como
observaciones hayan de las variables.
A este conjunto de puntos o nube de puntos se le denomina diagrama de dispersin, dado que los puntos se
ubican de forma dispersa en el plano cartesiano. En muchos casos el slo diagrama de dispersin indica una
tendencia de agrupacin de los puntos, que puede ser lineal (hacia arriba o hacia abajo), exponencial,
curvilnea o poligonal.
Parte del anlisis estadstico que hace el investigador es determinar cul es la mejor lnea o curva que
representa a ese conjunto de datos. El mejor ajuste se hace cuando se elabora bien la grfica, se conoce la
distribucin y se va adquiriendo experiencia en su clculo y determinacin.
Pgina 81 de 177
X
Y
X
Y
X
Y
X
Y
X
Y
X
Y
Figura: Grficas de dispersin
(a) lineal; (b) curvilnea; (c) sin relacin
(a) (b) (c)
Regresin Lineal Simple.
La regresin examina la relacin entre dos variables restringiendo una de ellas respecto a la otra, con el objeto
de estudiar las variaciones de la primera cuando la otra permanece constante. La regresin es un mtodo que
se emplea para pronosticar o predecir el valor de una variable en funcin de los valores dados de la otra o de
las otras variables.
La regresin lineal simple, se caracteriza porque se tiene la variable de respuesta y Una sola variable
explicativa o independiente. Los datos se pueden representar por medio de parejas ordenadas (x
i
, y
i
) para i = 1,
2, 3, , n.
En la regresin lineal simple, la media ) (
i
x y se relaciona linealmente con los valores x
i
, por medio de la
llamada ecuacin de regresin: . ) (
i i i
x x y | o + = Donde y son los parmetros del modelo, que se
relacionan linealmente, son desconocidos y corresponden a los coeficientes de correlacin.
El modelo de regresin lineal simple se expresa como se presenta a continuacin:
i i i
x y c | o + + =
Donde
i
es llamado Error Aleatorio o Error del Modelo, el cual tiene como caractersticas:
Media: 0 =
c
y Varianza:
2
o la cual no es medible.
Los parmetros se estiman por medio de datos muestrales, obteniendo una ecuacin de regresin ajustada.
As cada par de observaciones satisface:
i i i
e bx a y + + =
Donde
a = Estimador de .
b = Estimador de
e
i
= Los residuales. Se miden as:
i i i
y y e
=
Pgina 82 de 177
Grafica: Regresin el Modelo Lineal
Cuando se considera, despus de una inspeccin en la grfica de dispersin, que una lnea recta es la mejor
curva que se ajusta al conjunto de puntos se procede entonces a emplear el mtodo de la regresin lineal
simple. La mejor lnea es aquella que hace mnima la suma de los cuadrados de las diferencias entre los
puntos dados y los obtenidos mediante la lnea ajustada o estimada. Es por eso que a este mtodo tambin se
le conoce como el mtodo de los mnimos cuadrados.
La ecuacin de regresin ajustada ser:
bx a y + =
Donde:
y
=
2 2
Y
n
Pgina 83 de 177
Algunos autores calcular los valores de a y b en trminos de las medias de de los conjuntos de datos con las
siguientes dos ecuaciones:
x b y a
x x n
y x y x n
b
i i
i i i i
=
=
2 2
) (
Donde:
x
i
: Valores de la variable independiente
y
i
: Valores de la variable dependiente
n: tamao de la muestra
El departamento de publicidad de una industria alimenticia desea saber si existe una relacin entre las ventas y
el nmero de comerciales de televisin transmitidos por da. Para ello, toma una muestra aleatoria de siete
ciudades. La siguiente tabla muestra los resultados obtenidos.
Tabla: Relacin de ventas de un producto y la emisin del comercial en televisin
Ventas
Cantidad de millones por mes
Comerciales
Nmero transmitido por da
8,4 9
5,2 6
7,1 8
10 11
12,9 12
12,1 13
14,4 14
a-) Disear el diagrama de dispersin para identificar el comportamiento de los datos.
b-) Determinar la ecuacin de regresin estimada.
Solucin:
a-) Para conocer el tipo de relacin que puede existir entre estas dos variables, el primer paso es determinar
es si el diagrama de dispersin efectivamente insina una tendencia lineal.
Figura: Diagrama de dispersin de ventas de un producto y la emisin del comercial en televisin
EJEMPLO
10.110.1
0
2
4
6
8
10
12
14
16
0 2 4 6 8 10 12 14 16
Ventas, cientos de unidades por mes
N
m
e
r
o
d
e
c
o
m
e
r
c
i
a
l
e
s
t
r
a
n
s
m
i
t
i
d
o
s
p
o
r
d
a
0
2
4
6
8
10
12
14
16
0 2 4 6 8 10 12 14 16
Ventas, cientos de unidades por mes
N
m
e
r
o
d
e
c
o
m
e
r
c
i
a
l
e
s
t
r
a
n
s
m
i
t
i
d
o
s
p
o
r
d
a
Pgina 84 de 177
El diagrama confirma la sospecha, se procede ahora a determinar la ecuacin de la recta que ms se ajusta.
b-) Para determinar la ecuacin de regresin:
bx a y + =
=
2 2
) (
X
Millones por mes
Y
Comerciales
XY X
2
8,4 9 75,6 70,56
5,2 6 31,2 27,04
7,1 8 56,8 50,41
10 11 110 100
12,9 12 154,8 166,41
12,1 13 157,3 146,41
14,4 14 201,6 207,36
70,1 73 787,3 768,19
85 , 0
32 , 463
8 , 393
) 1 , 70 ( 19 , 768 * 7
) 73 )( 1 , 70 ( 3 , 787 * 7
) (
2 2 2
= =
=
i i
i i i i
x x n
y x y x n
b
92 , 1 01 , 10 * 85 , 0 43 , 10 = = a Con la otra ecuacin:
92 , 1
7
415 , 13
7
) 1 , 70 85 . 0 ( 73
= =
=
=
n
X b Y
a
As la ecuacin de regresin ajustada es: 92 , 1 85 , 0 + = x y
Con los datos del ejemplo anterior, cual seran las ventas si se pasan:
a-) 10 comerciales
b-) 7 comerciales.
Solucin:
a-) Como x = 10. Entonces: 42 , 10 92 , 1 ) 10 ( 85 , 0 = + = y
xy
: Covarianza de x e y.
x
y
y
Desviacin tpica de las distribuciones marginales de x e y. Si (x
i
, y
i
) son
valores de una muestra aleatoria proveniente de una poblacin bivariada, entonces el coeficiente de correlacin
muestral esta dado por:
yy xx
xy
s s
s
r =
Donde:
( )( ) ( ) ( )
2
2
2
2
1 1 1
= = =
i i yy i i xx i i i i xy
y
n
y s x
n
x s y x
n
y x s
Es pertinente tener presente que si se tiene dos correlaciones: r
1
= 0,3 y r
2
= 0,9 est indicado que las dos son
positivas, pero NO se puede pensar que: r
2
= 3r
1
X
Y
X
Y
X
Y
X
Y
Pgina 86 de 177
Un estudio sobre la transformacin de una sustancia en cierto proceso a diferentes temperaturas, origin la
siguiente tabla:
x
0
C 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
y Kg 8,1 7,8 8,5 9,8 9,5 8,9 8,6 10,2 9,3 9,2 10,5
Hallar el coeficiente de correlacin de Pearson e interpretar el resultado.
Solucin:
x y x
2
y
2
xy
1,0 8,1 1,0 65,61 8,1
1,1 7,8 1,21 60,84 8,58
1,2 8,5 1,49 72,25 10,2
1,3 9,8 1,69 96,04 12,74
1,4 9,5 1,96 90,25 13,3
1,5 8,9 2,25 79,21 13,35
1,6 8,6 2,56 73,96 13,76
1,7 10,2 2,89 104,04 17,34
1,8 9,3 3,24 86,49 16,74
1,9 9,2 3,61 84,64 17,48
2,0 10,5 4,0 110,25 21,0
16,50 100,4 25,85 923,58 152,59
yy xx
xy
s s
s
r =
( )( ) 99 , 1 4 , 100 50 , 16
11
1
59 , 152 = =
xy
s
( ) 1 , 1 50 , 16
11
1
85 , 25
2
= =
xx
s
( ) 201 , 7 4 , 100
11
1
58 , 923
2
= =
yy
s
708 , 0
81 , 2
99 , 1
201 , 7 1 , 1
99 , 1
= = = r
Como r es positivo y relativamente grande, entonces hay una alta relacin entre las variables temperatura y
cantidad de masa, lo que nos indica que a mayor temperatura, mayor cantidad de transformacin de masa.
DETERMINACIN: El coeficiente de determinacin es una medida de la bondad de ajuste del modelo de
regresin. El coeficiente de determinacin establece el grado de proporcin de la variacin total de la variable
de respuesta, (Y) que es explicado por el modelo, especficamente por la variacin de la variable explicativa.
Lo anterior significa que es necesario medir el porcentaje de la informacin recogida o explicada por el modelo
de regresin obtenido.
EJEMPLO
10.110.1
Pgina 87 de 177
Medidas de Variacin: Por el anlisis de regresin, se sabe que el i-simo residual
i i i
y y e
= se puede
minimizar por el mtodo de mnimos cuadrados, cantidad conocida como la suma de cuadrados del error SSE,
el cual es la medida del error que se comete cuando se utiliza la ecuacin de regresin, para hallar y
i
a partir
del modelo obtenido.
( )
2
=
i i
y y SSE
De la misma manera, para el i-simo valor de la variable de respuesta y
i
, se tiene la diferencia y y
i
que es
la medida del error ocasionado al utilizar y para estimar el valor de la variable de respuesta, obteniendo lo
llamado suma total de cuadrados SST.
( )
2
= y y SST
i
La otra medida de regresin, es la desviacin de los valores estimados medidos en la lnea de regresin
respecto al valor promedio, originando la llamada suma de cuadrados de la regresin SSR.
( )
2
= y y SSR
i
Las tres sumas de cuadrados, se relacionan en una de las ecuaciones ms importantes en estadstica: SST =
SSR + SSE
A partir de la ecuacin anterior, se puede ver que el modelo ajusta perfectamente cuando 0 =
i i
y y
esto
indica que el valor de la variable de respuesta estara sobre la lnea de regresin. As como SSE = 0, entonces
SST = SSR. Tomando esta ecuacin, se hace la siguiente relacin.
1 = =
SST
SSR
SST
SSR
SST
SST
Ajuste perfecto.
Entonces el Coeficiente de Determinacin:
SST
SSR
r =
2
Lo anterior significa:
( )
( ) total Variacin
licada Variacin
y y
y y
r
i
i
exp
2
2
2
El coeficiente de determinacin toma valores entre 0 y 1, inclusive. Cuando el coeficiente es cercano a uno,
indica que el modelo es explicado muy bien por la lnea de regresin. Cuando el coeficiente es cercano a cero,
entonces la variacin de la variable de respuesta no es causada por la variable explicativa.
Resumiendo: Cuando 1
2
r hay dependencia total de y respecto a x. 0
2
r hay independencia entre las
variables.
Obtencin de las Variaciones: Las variaciones SST y SSR, se pueden calcular de la siguiente manera:
( )( )
=
i i i
y x
n
y SST
1
2
( )( )
( )
=
2
2
2
1
1
i i
i i i i
x
n
x
y x
n
y x
SSR
Pgina 88 de 177
Un estudio sobre la transformacin de una sustancia en cierto proceso a diferentes temperaturas, origin la
siguiente tabla:
x
0
C 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
y Kg 8,1 7,8 8,5 9,8 9,5 8,9 8,6 10,2 9,3 9,2 10,5
Hallar el coeficiente de determinacin e interpretar el resultado.
Solucin:
x y x
2
y
2
xy
1,0 8,1 1,0 65,61 8,1
1,1 7,8 1,21 60,84 8,58
1,2 8,5 1,49 72,25 10,2
1,3 9,8 1,69 96,04 12,74
1,4 9,5 1,96 90,25 13,3
1,5 8,9 2,25 79,21 13,35
1,6 8,6 2,56 73,96 13,76
1,7 10,2 2,89 104,04 17,34
1,8 9,3 3,24 86,49 16,74
1,9 9,2 3,61 84,64 17,48
2,0 10,5 4,0 110,25 21,0
16,50 100,4 25,85 923,58 152,59
( )( ) 98 , 772 4 , 100 50 , 16
11
1
58 , 923 = = SST
( )( )
( )
60 , 3
1 , 1
99 , 1
50 , 16
11
1
85 , 25
4 , 100 50 , 16
11
1
59 , 152
2
2
2
= =
= SSR
r
2
= 0,004657
Lo que indica el coeficiente es que slo el 0,4657% de la variacin, es explicada por el modelo.
Leccin 12: Regresin Mltiple.
Cuando se emplea ms de una variable independiente para evaluar una variable dependiente es conveniente
utilizar un mtodo de regresin mltiple, que consiste en el mismo procedimiento de una regresin lineal
simple: describir la ecuacin de regresin, determinar el error de estimacin y analizar la correlacin entre las
variables.
A continuacin se desarrollarn estos conceptos suponiendo dos variables independientes. Para ms variables
independientes, slo basta con seguir los mismos pasos.
La ecuacin de regresin est dada por:
2 2 1 1
X b X b a Y + + =
EJEMPLO
10.110.1
Pgina 89 de 177
Donde:
Variable dependiente.
Intercepto de la variable Y.
Valores de las dos variables independientes.
Pendientes asociadas con cada variable independiente, respectivamente.
Los valores de las tres constantes numricas se obtienen resolviendo el siguiente sistema de ecuaciones:
+ + =
+ + =
+ + =
2
2 2 2 1 1 2 2
2 1 2
2
1 1 1 1
2 2 1 1
X b X X b X a Y X
X X b X b X a Y X
X b X b na Y
Una vez obtenida la ecuacin de regresin, se determina el error estndar de la estimacin de regresin
mltiple:
3 3
) (
2 2 1 1
2 2
=
n
Y X b Y X b Y a Y
Se
n
Y Y
Se
Y el coeficiente de determinacin mltiple, estar dado por:
2
2
2
2 2 1 1 2
+ +
=
y n Y
y n Y X b Y X b Y a
R
Donde:
: Y Valores de la variable dependiente.
Intercepto de la variable Y.
Valores de las dos variables independientes.
Pendientes asociadas con cada variable independiente, respectivamente.
: y Media de los valores de la variable dependiente.
El jefe de produccin de una empresa manufacturera desea estimar los gastos indirectos de produccin con
base en el nmero de horas de trabajo y en el nmero de horas mquina. En la siguiente tabla se relaciona la
informacin correspondiente al primer semestre del ao.
El jefe de produccin define:
X
1
: Horas de trabajo (cientos).
X
2
: Horas de mquina (cientos)
Y : Gastos indirectos de produccin (cientos de miles de pesos)
:
Y
: a
: ,
2 1
X X
: ,
2 1
b b
: a
: ,
2 1
X X
: ,
2 1
b b
EJEMPLO
10.110.1
Pgina 90 de 177
) 4 ( 83 . 6 83 . 1 5 . 7
1211 3756 85 2260
17 . 1204 17 . 13754 85 5 . 2252
2 1
2 1
2 1
b b
b b a
b b a
=
=
+ + =
) 3 ( 1211 3756 85 2260
) 2 ( 3756 11715 265 7032
) 1 ( 85 265 6 159
2 1
2
2 2 2 1 1 2 2
2 1 2 1 2
2
1 1 1 1
2 1 2 2 1 1
+ + = + + =
+ + = + + =
+ + = + + =
b b a X b X X b X a Y X
b b a X X b X b X a Y X
b b a X b X b na Y
Tabla: Gastos indirectos de produccin
Mes X
1
X
2
Y X
1
Y X
2
Y X
1
X
2
X
1
2
X
2
2
Y
2
Enero 45 16 29 1305 464 720 2025 256 841
Febrero 42 14 24 1008 336 588 1764 196 576
Marzo 44 15 27 1188 405 660 1936 225 729
Abril 45 13 25 1125 325 585 2025 169 625
Mayo 43 13 26 1118 338 559 1849 169 676
Junio 46 14 28 1288 392 644 2116 196 784
TOTAL 265 85 159 7032 2260 3756 11715 1211 4231
Se resuelve el sistema de ecuaciones:
Ecuacin (1) multiplicada por 85/6 y restada por la ecuacin (3):
Se despeja la variable b
1
de la ecuacin (4):
83 . 1
83 . 6 5 . 7
2
1
b
b
=
Ecuacin (1) multiplicada por 265/6 y restada por ecuacin (2):
) 5 ( 83 . 1 83 . 10 5 . 9
3756 11715 265 7032
17 . 3754 17 . 11704 265 5 . 7022
2 1
2 1
2 1
b b
b b a
b b a
=
=
+ + =
Variable b
1
reemplazada en la ecuacin (5):
91 . 0
97 . 73
19 . 67
83 . 1
83 . 1
83 . 6 5 . 7
83 . 10 5 . 9
2 2
2
= = + |
.
|
\
|
= b b
b
b
2
reemplazada en la ecuacin (4): 7 . 0
83 . 1
83 . 6 5 . 7
2
1
=
=
b
b
b
1
y b
2
reemplazada en la ecuacin (1): 31 . 17
6
85 265 159
2 1
=
=
b b
a
Pgina 91 de 177
Se obtiene as la ecuacin de regresin mltiple:
2 1 2 2 1 1
91 . 0 7 . 0 31 . 17 X X Y X b X b a Y + + = + + =
Ejercicios:
1. Explique claramente en qu consiste el proceso de regresin.
2. Cul es la utilidad del coeficiente de regresin y de determinacin.
3. La Compaa LISTO, ha obtenido los siguientes resultados con respecto al costo de la mano de obra directa
y la cantidad de unidades producidas (en miles), de la siguiente manera:
Mano de Obra 18 23 15 21 30 26 28 27 29 19 22 24
Produccin 44 60 40 56 80 70 74 71 78 48 64 69
Con la informacin anterior se requiere lo siguiente:
a-) Estimar el valor mnimo de la mano de obra directa que debe obtenerse para una produccin de 72.870
unidades.
b-) Determinar que tanto estn relacionadas las variables en estudio.
c-) Explicar que tan confiable es la bondad de ajuste del modelo: mano de obra directa en funcin de la
produccin.
4. Una oficina de finca raz est interesada en analizar si la renta de los apartamentos que arrienda son
tpicas, por tanto, a escogido una muestra aleatoria de 11 alquileres y del tamao de los apartamentos de
edificios similares. Los datos se transcriben enseguida.
Renta 230 190 450 310 218 185 340 245 125 350 280
No habitaciones 2 1 3 2 2 2 1 1 2 1 1
a-) Desarrolle el modelo de regresin lineal simple que mejor describa el fenmeno
b-) Hacer el diagrama de dispersin de los datos
c-) Calcular el coeficiente de regresin y determinacin
d-) Hacer el grafico ajustado segn el modelo obtenido.
e-) Realizar los anlisis correspondientes del caso en estudio.
5. Una compaa de ahorro y crdito, desea saber cmo son afectadas las ventas de viviendas por diferentes
tasas de inters. Durante ocho meses se recopil la informacin y se obtuvo el siguiente resultado:
Tasa de inters (%) 7 6.5 5.5 6 8 8.5 6 6.5
Ventas de viviendas 23 38 45 36 16 18 39 41
a. Estimar las ventas en funcin de la tasa de inters.
b. Cuntas viviendas se pueden vender si el inters es del 7.5%?
c. Determinar el error estndar del estimado.
d. Es confiable el modelo?
e. Calcule el tipo de asociacin entre las variables.
Pgina 92 de 177
UNIDAD DOS
PRINCIPIOS DE PROBABILIDAD
Pgina 93 de 177
CAPTULO 4: FUNDAMENTACIN EN PROBABILIDAD
Leccin 13: Historia de la Probabilidad
Para hablar del origen de la probabilidad, se presentan discrepancias, ya que algunos lo reconocen como una
ciencia relativamente reciente, edad media e inicios de la edad moderna. Pero es pertinente hacer un recorrido
a travs de la historia, para conocer cmo ha evolucionado tan interesante ciencia estadstica, lo cual se
estudiar en tres fases.
ANTECEDENTES. JUGOS DE AZAR: Se tienen evidencias arqueolgicas del antiguo Egipto, Pompeya, Irak y
otros, sobre Dados elaborados en hueso, cristal piedra, marfil, madera y arcilla, que estaban tallados, dando
la percepcin de que eran Dados Perfectos. Algunos estudiosos consideran que en la sitiada Troya, se origino
los juegos de azar, pretexto de las largas jornadas de espera (10 aos) que los soldados deban soportar en
dicho asedio.
Los primeros juegos de azar de que se tenga evidencia, adems de los dados son las cartas, los cuales se
utilizaban con propsitos adivinatorios. En el Imperio Romano, se tena la ley de prohibicin de ste tipo de
juego y, solo se poda practicar en ciertas pocas del ao. Este tipo de eventos se hicieron tan populares que
hasta el Cesar lo practicaba en cualquier momento, segn historiadores de esta civilizacin.
En la Europa se presentaban leyes de prohibicin de juegos de este tipo, auspiciado por la Iglesia Cristiana,
quienes consideraban que este tipo de prcticas eran artificios del demonio, para desviar sus principios
cristianos. En Francia Luis IX prohibi los juegos de azar y la elaboracin de dados. En Inglaterra, Eduardo III
y Enrique VIII, incluyeron los dados y cartas en una lista de juegos prohibidos, estimulando otro tipo de juegos,
como el tiro con el arco.
Sin embargo, a pesar de la prohibicin este tipo de juegos se hizo cada vez ms popular, lo que motivo a
algunos pensadores a darles algn tipo de explicacin desde el punto de vista matemtico. Lo anterior con el
fin de conocer las ventajas o desventajas de apostar.
El tema motivo a los cientficos del Renacimiento a realizar estudios, con la inquietud del porque no se haba
analizado con anterioridad, a lo cual Kendall sugiere varios motivos que impidieron la evolucin del Clculo de
Probabilidades, antes del siglo XVI.
1. Desconocimiento del lgebra Combinatoria que resolviera situaciones de juegos.
2. Ausencia de la nocin de suceso aleatorio
3. Barreras morales y religiosas impuestas en contra de los fenmenos de azar y aleatoriedad.
4. Supersticin de los jugadores.
Otros pensaban que la falta de simetra y de equiprobabilidad en el lanzamiento de los dados, eran obstculos
al desarrollo del clculo de probabilidad, pero se pudo saber que algunos de los dados diseados presentaban
simetra perfecta. Sin embargo quedaron muchos interrogantes sin respuesta.
EL CLCULO ARITMTICO: En el renacimiento, el espritu inquieto, ansioso, rebelde y renovador de los
cientficos, motivo darle importancia al estudio de fenmenos de azar, as es pertinente nombrar los que se
consideran que dieron aportes relevantes al estudio de la probabilidad.
Lucas Paccioli, (1.445 1.514) Gemetra y Matemtico Italiano, aunque sus aportes son ms conocidos en el
rea de la Contabilidad, por su formulacin del Mtodo Anfisogrfico o de partida doble contable. Pero tambin
fue precursor el Clculo de Probabilidades, planteando los juegos de azar, donde su objetivo era hallar la
solucin a problemas especficos ms que una teora sobre probabilidad.
Pgina 94 de 177
Gerolamo Cardano, (1.501 1.576) Clebre matemtico, mdico y
astrnomo Italiano, pero tambin tenia la fama de Jugador, por lo cual se
motivo a estudiar sobre teora acerca de juegos de azar. En sus libro; el
primero escrito, sobre juegos de azar escrito en 1.560, pero publicado slo
hasta 1.663. La idea central de la obra era la idealizacin explcita del nmero
de alternativas iguales basadas en un dado ideal. Para Cardano cuando el
nmero de observaciones es pequeo, la frecuencia puede desviarse
sustancialmente de la probabilidad de ocurrencia. Pero si el nmero de
repeticiones es grande, la desviacin es despreciable, as aparece
rudimentariamente la conocida Ley de los Grandes Nmeros.
Sus aportes ms significativos fue en al solucin de ecuaciones de tercer y
cuarto grado, donde ofrece una metodologa de solucin general a este tipo
de ecuaciones. Tambin propone la solucin de un caso particular de la
ecuacin de tercer grado.
Nicollo Tartaglia, (1.499 1.557) Nicolo Fontana; su verdadero nombre, gran
matemtico y Geometra Italiano, autodidacta. Sus esfuerzos se centraron en buscar una
tcnica de solucin de ecuaciones de tercer grado. Respecto a la Probabilidad, sus
aportes fueron a la bsqueda de solucin para problemas de combinatorias que estaban
relacionadas con juegos, disertando la solucin dada por Paccioli al problema del reparto
de la apuesta en el caso del juego interrumpido. Diseo el llamado Tringulo de
Tartaglia, que determina los nmeros combinatorios.
Tringulo de Tartaglia
Galileo Galilei, (1.564 1.642) Matemtico, Fsico, Astrnomo y Filsofo, nacido en Pisa (Italia). Considerado
el gestor de la revolucin cientfica y de la ciencia moderna. Sus aportes a las ciencias son innumerables, no
dejando de aportar a la Probabilidad. En este campo se dedico a analizar problemas sobre juegos de azar, por
ejemplo hace el anlisis de los posibles sucesos que se pueden obtener, cuando se lanzan tres dados. Su
ingenio lo llevo a intuir sobre la Teora del error. Exista un problemas son la estimacin de errores en
mediciones astronmicas, a lo cual galileo comenta que ..Los errores en las mediciones son inevitables, los
cuales estn simtricamente distribuidos.
Blaise Pascal, (1.623 1.662) Matemtico, Fsico, Filsofo y Telogo, nacido
en Clermont (Francia), se le considera el padre de la computadora junto con
Babbage, contribuy de manera efectiva en la teora matemtica de la
probabilidad. En intercambio con Fermat, desarrollo fuertemente la teora de
probabilidad. La motivacin de los estudios de Pascal fue los problemas con
apuestas que tena el llamado Caballero de Mer (1.607 1.684) de la corte de
Luis XIV, quien le plante a Pascal el conocido problema de los puntos, lo que
Pgina 95 de 177
se asume motivo la Correspondencia entre Pascal y Fermat. Pascal le enva a Fermat una carta el 29 de julio
de 1.654 en donde le expone el problema de los puntos: Dos jugadores han pactado el juego a tres rondas y
cada uno apuesta 32 pistolas; el primero ha ganado dos veces y el segundo solamente una vez. Pascal
argumenta que para encontrar la distribucin justa en la apuesta realizada es * ... si ellos juegan otra ronda y
el primero gana, este se lleva toda la apuesta, esto es, las 64 pistolas; si el otro gana, entonces cada uno tiene
dos rondas a su favor, en cuyo caso, si desean parar el juego, cada uno deber tomar su propia apuesta, esto
decir, 32 pistolas, Entonces, si el primer jugador gana, este se queda con las 64 pistolas, si pierde se queda
con 32, solamente. Luego, si ellos no desean correr el riesgo de una ltima ronda y desean separarse del
juego, el primer jugador argumentara lo siguiente: Estoy convencido que me corresponden 32 pistolas, an
cuando pierda la ronda, ellas me pertenecen; con relacin a las otras 32, existen las mismas posibilidades de
que sean para usted como para m. Entonces dividamos estas 32 pistolas en partes iguales y dme una de
ellas, as como las 32 que de seguro son mas. En resumen, al primer jugador le corresponden 48 pistolas y al
segundo 16; en otras palabras, Pascal propone que la apuesta se divida de acuerdo a las probabilidades que
tendran los jugadores de ganar en caso de que el juego continuara.
* APUNTES DE HISTORIA DE LAS MATEMTICAS VOL.1, NO.1, ENERO 2002/ 61
En la misma carta, Pascal encuentra la distribucin justa de la apuesta para otros casos usando el mismo tipo
de situaciones, con argumentos relativamente simples, pero se consideraron inadecuados en situaciones ms
complicadas. En los intercambios con Fermat, Pascal propone una solucin general al Problema de los
Puntos para juegos en los que participan dos personas, apoyndose en resultados sobre el tringulo aritmtico,
que haba obtenido en 1653. As pues, Pascal dio dos soluciones al Problema de los Puntos: Una para casos
particulares y Otra de manera general, que en su opinin diferan de la solucin de Fermat.
Dentro de sus grandes aportes a la probabilidad y en el anlisis de las apuestas, surge el concepto de
Esperanza Matemtica, a partir de argumentar que el clculo de probabilidades es funcin de la esperanza
matemtica que cada jugador tiene de ganar. Pero tambin dio los principios sobre la Teora de la Decisin.
Pierre de Fermat, (1.601 1.665) Matemtico y Jurista, nacido en Beaumont
de Lomagne (Francia), junto con Descartes, fue un de los principales
Matemticos de la primera mitad del siglo XVII, descubri el clculo diferencial
antes que Newton y Leibniz, gestor de la teora de probabilidad junto con
Pascal, pero es conocido tambin por sus aportes a la Teora de Nmeros,
especialmente el famoso Ultimo Teorema de Fermat, el cual fue resuelto en
1.995.
La correspondencia con Pascal sobre el problema planteado por el Caballero de
Mer. La carta original de Fermat, en la que se supone describe su mtodo de
solucin, se extravi; sin embargo, sus argumentos se han podido reconstruir de
una carta que Pascal envi a Fermat el 24 de agosto de 1654. El problema que
Fermat se plantea es el siguiente: * Dos individuos, A y B, que participan en una
serie de juegos se encuentran en la situacin de que el primero necesita ganar dos juegos y el segundo tres
para ganar la apuesta; cmo podemos encontrar la distribucin justa de la apuesta?, en su planteamiento,
Fermat ya no hace referencia a los juegos ganados que tiene cada individuo sino a la cantidad de juegos que le
falta a cada uno para llevarse la apuesta completa. La solucin de Fermat es la siguiente: El juego puede
continuarse a lo ms en cuatro rondas. Cules son los resultados posibles para estas cuatro rondas?
Indiquemos con el smbolo +las victorias de A y con el smbolo - las victorias de B. Existen 16 resultados
posibles, los cuales se describen en siguiente tabla.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
+ + + + - + + - + - - - - - + -
+ + + - + + - + - + - - - + - -
+ + - + + - + + - - + - + - - -
+ - + + + - - - + + + + - - - -
Pgina 96 de 177
De los 16 resultados posibles, las primeros 11 favorecen a A y los restantes a B. En consecuencia, al jugador A
le corresponden 11/16 de la apuesta y a B le corresponden 5/16. Es decir, la distribucin justa de la apuesta es
11::5.
* APUNTES DE HISTORIA DE LAS MATEMTICAS VOL.1, NO.1, ENERO 2002 62
Los mtodos de solucin para el problema del Caballero de Mer, dados por Pascal y Fermat, eran similares,
por tal razn de les da el calificativo de gestores del clculo de probabilidades.
Christiaan Huygens, (1.629 1.695) Matemtico, Fsico y Astrnomo, nacido
en La Haya (Holanda), en su libro De ratiociniis in ludo aleae publicado en
1.656, deja ver lo relacionado al clculo de juegos de azar, considerado el
primer manual sobre Clculo de Probabilidades. En ste deja ver la solucin del
Problema de los Puntos de forma general con un mtodo diferente a los
empleados por Pascal y Fermat, introduciendo formalmente el concepto de
Esperanza Matemtica, como una generalizacin de la media aritmtica.
Tambin resolvi algunos problemas planteados por Pascal y Fermat.
Trabaj sobre problemas Demogrfico Actuariales, construyendo una curva
de mortalidad y definiendo claramente la nocin de Vida Media y Esperanza de
Vida.
La obra de Huygens se considero la ms importante aportacin terica de
probabilidad de dicho siglo, esto hizo ejercer gran influencia en los trabajos de
Bernoulli y De Moivre.
LA PROBABILIDAD MODERNA: El desarrollo de la probabilidad actual, fue dinamizada desde finales del siglo
XVII, al igual que en las pocas anteriores hubo varios investigadores que aportaron a tal fin. Veamos los ms
representativos.
Jacob Bernoulli, (1.654 1.705) Matemtico y Cientfico Suizo, hermano mayor
de Johann Bernoulli, de la dinasta Bernoulli. Su aporte fundamental se dio por
medio de su obra: Ars Conjectandi, el Arte de la conjetura, un trabajo relevante en
la Teora de Probabilidad. La obra fue publicada por su sobrino Nicholas Bernoulli
en el ao 1.713, ocho aos despus de su muerte. Por medio de este trabajo la
Probabilidad adquiere la categora de Ciencia.
La obra esta compuesta de cuatro partes:
Primera Parte: Explicacin crtica de la obra expresada por Huygens, usado por
Bernoulli para dar a conocer su punto de vista sobre los problemas de azar, as logr obtener la frmula de la
Funcin de Probabilidad para esquemas dicotmicos con n repeticiones, conocida actualmente como la
Distribucin de Bernoulli.
Segunda Parte: En esta parte Bernoulli, hace un completo manual sobre el tema de combinatoria, necesario
para resolver problemas de probabilidad, complementado los estudios realizados por Pascal y Leibniz.
Tercera Parte: Plantea 24 problemas diferentes de probabilidad con su respectiva solucin.
Cuarta Parte: En esta parte estn los aportes ms relevantes para la
probabilidad. Por un lado explica la concepcin subjetiva de Probabilidad,
por otro lado la demostracin detallada del que se denomino Teorema
Aureo,, conocido actualmente como Ley de los Grandes Nmeros.
Abraham De Moivre, (1.667 1.754) Matemtico nacido en Champagne
(Francia) un Autodidacta, ley y analiz el trabajo de Huygens. En 1.711
Pgina 97 de 177
public sus memorias De mensura sortis en latn en la revista Philosophical Transactions of the Royal
Society. En 1718, public su libro The Doctrine of Chance: A method of calculating the probabilities of events
in play. En dicha obra explicita el principio de la Independencia Estadstica. Adems, problemas de dados y
juegos. En la segunda edicin de la obra publicada en 1.738 presenta el Teorema Lmite para fenmenos
dicotmicos. Otro trabajo interesante de este matemtico fue el que denomin Miscellanea Analytica donde
aparece la frmula de Stirling que utiliz para derivar la curva normal como una aproximacin a la distribucin
Binomial. Tambin logr obtener una aproximacin para n!, equivalente a la obtenida por Stirling. Es
pertinente comentar que resultados tradicionalmente atribuidos a Laplace y Poisson, se encontraron en la obra
de De Moivre.
Daniel Bernoulli, (1.700 1.782) Matemtico Suizo, hijo de John Bernouulli.
Daniel fue un de los ms destacados matemticos y cientficos de la ltima
dcada del siglo XVIII. Una de sus principales trabajos fue la famosa paradoja
de San Petersburgo, relacionada con la teora de probabilidad y de Decisin,
especficamente sobre la teora para medir el Riesgo. Uno de los primeros
intentos para analizar estadsticamente problemas relacionados con data censal
fue el anlisis que hizo Bernoulli en 1766 sobre la mortandad de la viruela y la
eficacia de la vacunacin.
Pero la ms importante aportacin fue la famosa distribucin llamada con su
nombre: Distribucin de Bernoulli, es una distribucin discreta de probabilidad,
para valores dicotmicos: p como xito y q como fracaso.
Jean DAlembert, (1.717 1.783) Matemtico y fsico Francs, plante que en probabilidades muy pequeas,
se podra considerar equivalente a cero, por lo cual, se podra asumir que dichos sucesos no ocurriran. Su
teora sobre Ley de Equilibrio supone un equilibrio de xitos y fracasos de ciertos eventos, para una serie
larga de dichos eventos.
Thomas Bayes, (1.702 1.761) Matemtico y Telogo Britnico, su obra no
reconocida en ese entonces, inicia con el planteamiento del siguiente
problema: Dado el nmero de veces en el cual un suceso desconocido tiene
lugar y ha fallado; se requiere la probabilidad de que la posibilidad de
ocurrencia en un nico ensayo, este comprendida entre dos valores que
pueden ser dados. Otro aporte de su obra es la definicin sobre relaciones
entre sucesos. Seguido enuncia y prueba siete teoremas. Pero el trabajo ms
reconocido de Bayes es el reconocido y famoso Teorema de Bayes, que en
sntesis hace referencia a la probabilidad de un suceso condicionado por la
ocurrencia de otro. El teorema resuelve el problema conocido como De la
probabilidad inversa; es decir, valorar desde el punto de vista probabilistico,
las posibles condiciones que rigen el supuesto de haber observado cierto
suceso, situacin denominada de probabilidad inversa". Con este aporte se
da origen a la llamada Inferencia Bayesiana, cuyo principio es tomar la
probabilidad (Probabilidad Inductiva) como una creencia ms que una
frecuencia, ya que se procura sacar conclusiones generales (enunciar leyes) a partir de lo objetivamente
observado, y no viceversa.
Adrien Marie Legendre, (1.752 1.833) Matemtico Francs, fue uno de los primeros que aporto al desarrollo
de la probabilidad en los inicios del siglos XIX, inicialmente sobre los aportes al modelo lineal, por medio del
desarrollo del Mtodo de Mnimos Cuadrados, que posteriormente fue perfeccionado por Gauss. El mtodo es
muy utilizado para hacer estimacin de parmetros.
Pgina 98 de 177
Carl Friedrich Gauss, (1.777 1.855) Matemtico, Astrnomo y Fsico,
nacido en Brunswick (Alemania), considerado el Matemtico ms grande de la
Historia, ya que sus aportes han influenciado significativamente las Matemticas
y las Ciencias en general. Entre los aportes a la probabilidad, est el
perfeccionamiento de mtodo de Mnimos Cuadrados, considero que en la
teora de probabilidad, se incluyera el anlisis de los errores en las
observaciones, desarrollo la muy conocida Ley Normal o Ley de Gauss,
desarrollo la distribucin muestral de medias en muestreo donde loa datos
provienen de distribuciones normales. Gauss es el padre de la moderna teora
de errores.
Descubri que la funcin de distribucin de los errores es
2
2
( )
x
h
e
x
h
Conjunto Vacio: Cuando un conjunto no tiene elementos, se dice que es vacio. S = {}. Para todo conjunto
universal. El conjunto vacio es subconjunto de todos los conjuntos y en particular de si mismo.
Operaciones entre Conjuntos: Para los intereses de la teora de probabilidad, analizaremos las operaciones
de unin, interseccin y complemento.
UNION: Sean S
1
, S
2
,, S
n
, una serie de conjuntos, entonces la unin de stos es otro conjunto compuesto por
los elementos comunes y no comunes de todos.
(
) Para i = 1, 2, 3,..., n
E es un conjunto cuando aparece S
1
, S
2
,, S
n
.
Consecuencia de esto:
1.
2. Cuando
3.
INTERSECCIN: Sean S
1
, S
2
,, S
n
, una serie de conjuntos, entonces la interseccin de stos es otro conjunto
compuesto por los elementos comunes de todos los conjuntos.
(
) Para i = 1, 2, 3,..., n
I es un conjunto cuando aparece simultneamente S
1
, y S
2
,, y S
n
.
Consecuencia de lo anterior:
1.
2. Cuando
3.
DIFERENCIA: Dados los conjuntos A y B, entonces
Esto significa la diferencia son los elementos que estn en A y no estn en B.
COMPLEMENTO: Sean S y U dos conjuntos tales que Entonces S es el complemento de S, si y solo
si, Se debe aclarar que Siendo U el conjunto universal. Consecuencia de esto:
1.
2.
Propiedades de las Operaciones: Veamos las siguientes propiedades cuando se operan conjuntos.
Conmutativa:
Pgina 103 de 177
Asociativa:
) (
Distributiva:
) (
) (
) (
) (
)
Complemento: (
y (
Propiedades aplicadas a la teora de probabilidad.
(
) [() () ( )]
(
) () ( )
(
) () ( )
(
) () ( )
(
) (
) (
)
Leccin 16: Definicin de probabilidad: Clsica, frecuentista y
Axiomtica.
La probabilidad se ha definido desde tres enfoques: El csico, el frecuentista y el axiomtico.
Enfoque Clsicas de Probabilidad: En la segunda mitad del siglo XVII se hacen los primeros intentos para
medir la probabilidad de un evento, entre los pioneros se tienen a Pascal, Fermat, Huygens, Bernoulli, Leibniz
entre otros. Pero la definicin formal se le debe al gran matemtico Laplace.
Definicin: Pierre Simon Laplace, en 1.812 define la probabilidad como el cociente entre el nmero de eventos
favorables y el nmero de eventos totales, siempre que todos aquellos tangan la misma probabilidad de
ocurrencia.
()
Definicin No 2: La probabilidad desde le punto de vista frecuentista, esta definida como el lmite; cuando el
nmero de repeticiones se hace infinita, del cociente entre la frecuencia absoluta y el nmero de ensayos.
()
)
Limitaciones: La teora frecuentista tambin tiene ciertas limitaciones. En primera instancia, el concepto de
lmite utilizado en la definicin, supone que el nmero total de eventos del experimento denotado con N alcance
el infinito, caso que en la realidad no ocurre, con esto la estabilidad de las frecuencias es un enunciado
imposible, desde la demostracin matemtica. Por otro lado, el uso de sucesin infinita en eventos aleatorios
no es suficiente, ya que matemticamente los trminos de las sucesiones siguen una ley inexorable; es decir, a
partir del trmino general todos los trminos quedan definidos claramente.
Enfoque Axiomtico de Probabilidad: Las limitaciones de los enfoques clsicos y frecuentista, condujeron a
buscar una teora de probabilidad ms amplia y soportada en principios matemticos slidos y verificables
lgicamente. Fue as como en 1.933 Kolmogorov plante su teora de probabilidad desde la axiomtica.
Para analizar el enfoque axiomtico de Kolmogorov, se debe analizar dos situaciones previas, que permitir
comprender mejor dicho enfoque.
1. Limitaciones del Enfoque Axiomtico: El planteamiento axiomtico de Kolmogorov presenta la limitacin
de no ofrecer un mtodo prctico de obtencin de probabilidad de eventos aleatorios en el mundo real, para
eliminar dicha limitacin Kolmogorov estableci una conexin del modelo matemtico con el mundo real, para
lo cual utiliz la base emprica de la teora frecuentista. l considero que si un experimento aleatorio se repite
gran cantidad de veces, la frecuencia relativa de un evento difiera ligeramente de la probabilidad del evento.
En trminos de FISZ: La axiomtica del clculo de probabilidades formaliza ciertas regularidades de las
frecuencias relativas del ocurrimiento de un evento aleatorio, regularidad que se observa a travs de una larga
serie de ensayos, realizados bajo condiciones constantes.
2. Algebra de Sucesos: Existen muchos experimentos cuyos nmeros de eventos planteados es superior a
los eventos elementales que se definen en el espacio muestral. Los eventos compuestos se definen a partir de
los eventos elementales, por medio de operaciones entre conjuntos como la unin, interseccin y
Pgina 105 de 177
complemento. El conjunto obtenido presenta una estructura de lgebra. El lgebra incluye el evento
imposible y el evento cierto.
Ejemplo No 4:
Sea el espacio muestral definido como: E = {a, b, n}. Hallar el lgebra generada.
Solucin:
lgebra: = {{}, {a}, {b}, {n}, {a, b}, {a, n}, {b, n}, {a, b, n}}
En la solucin obtenida se observa el evento imposible y el evento cierto.
DEFINICIN:
Sea E el espacio muestral integrado por los eventos elementales, sea A una coleccin de subconjuntos de E;
llamados eventos aleatorios, entonces:
1. El espacio muestral E debe pertenecer a A:
2. Si un suceso B pertenece a A, entonces su complemento tambin pertenece a A. Consecuencia de esto E
tambin cumple la condicin; es decir, el conjunto vacio.
Entonces B Entonces
3. Sean S
1
y S
2
, subconjuntos de A, entonces la unin pertenece a A y por las leyes de De Morgan, la
interseccin tambin pertenece a A.
lgebra de Boole: Toda coleccin que cumpla las tres condiciones anteriores (1, 2, 3) se le llama lgebra de
Boole, dado para un nmero finito de eventos.
lgebra: Si se tiene una serie de Eventos Infinitos, pero numerables, S
1
, S
2
, , S
n
que pertenecen a E,
entonces:
A la coleccin se le conoce como sigma algebra (-lgebra) representada por , la cual rene todos los
posibles eventos del experimento aleatorio.
Al par (S, ) se le conoce como Espacio Probabilizable o medible.
Ejemplo No 5:
Sea E = {1, 2, 3}. Hallar el -lgebra completa generada.
Solucin:
= ({}, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}).
En la solucin se observa los eventos elementales y los compuestos.
Con los precedentes, ya se puede plantear el enfoque axiomtico.
Teora Axiomtica de Kolmogorov:
Esta teora se soporta en tres axiomas.
Axioma No 1: Si E es un elemento de una -lgebra (), existe un nmero P(E) 0. Llamado probabilidad del
evento E.
Pgina 106 de 177
Axioma No 2: Si E es el espacio muestral de un experimento aleatorio, entonces P(E) = 1.
Axioma No 3: Sean los eventos numerables S
1
, S
2
,, S
n
los cuales son disyuntos dos a dos.
Entonces:
(
) (
()
Ejemplo No 45:
Las placas de los carros constan de tres letras y tres nmeros, de tal manera que no se puede repetir nmero
tampoco letra. Cuantas placas diferentes se pueden disear?
Pgina 112 de 177
Solucin:
LETRA 1 LETRA 2 LETRA 3 NMERO 1 NMERO 2 NMERO 3
26 25 24 10 9 8
26*25*24*10*9*8 = 11232.000
Utilizando la ecuacin:
()
( )
Cantidad de placas = 15.600*720 = 11232.000
Ejemplo No 46:
De un conjunto de 7 elementos, se desea organizar subconjuntos de 4 elementos. Cuantos grupos se pueden
obtener?
Solucin:
PRIMER ELEMENTO SEGUNDO ELEMENTO TERCER ELEMENTO CUARTO ELEMENTO
7 6 5 4
Cantidad de grupos a organizar: 7*6*5*4 = 840
Utilizando la ecuacin:
()
Ejemplo No 47:
Si en un Club hay 20 personas y se desea escoger 4 de ellos para el comit directivo De cuantas formas se
puede conformar el comit?
Solucin:
En el problema n = 20 y r = 4 entonces:
()
Formas diferentes para conformar el comit.
Ejemplo No 48:
Con los nmeros dgitos, utilizndolos una sola vez Cuantas cifras de cuatro nmeros se pueden formar?
Solucin:
()
Cifras diferentes
Permutaciones Con elementos Que Se Repiten: Cuando en el conjunto de elementos hay algunos que se
repiten, entonces se presentan permutaciones con elementos que se repiten.
Definicin: El nmero de observaciones de n objetos, de los cuales n
1
se repite a veces, n
2
se repite b veces
y as sucesivamente, por lo cual el nmero de arreglos posibles se puede determinar con la siguiente ecuacin:
Ejemplo No 49:
Pgina 113 de 177
De cuantas formas diferentes se puede ordenar la palabra MISSISSIPI?
Solucin:
En el conjunto: n = 11, n
i
= 4, n
s
= 4, n
p
= 2 Luego:
Ejemplo No 50:
Un coleccionista tiene tres pinturas de Picasso, cuatro pinturas de Botero y tres pinturas de Rembranth. De
cuantas formas se pueden organizar juntos, las pinturas?
Solucin:
En el conjunto: n = 10, n
Picasso
= 3, n
Botero
= 4, n
Rembranth
= 3 Luego:
Con base en lo anterior, podemos resumir:
Las permutaciones se aplican cuando:
- Se tiene en cuenta el orden
- No se admiten repeticiones.
Leccin 20: Combinaciones
Si el inters es determinar la cantidad de formas en que r observaciones son seleccionadas de un conjunto de
n observaciones diferentes. Sin tener en cuenta el Orden de Seleccin, se est hablando de Combinaciones.
Hablar de combinaciones es hacer referencia a subconjuntos.
Si se tiene r! permutaciones de un conjunto de n observaciones, entonces las
n
P
r
permutaciones contiene cada
subconjunto r! veces, al dividir
n
P
r
entre r! se obtiene la cantidad de formas sin tener en cuenta el orden.
Definicin: Sea n el nmero de objetos de un conjunto dado, si se toman r objetos a la vez, el nmero de
combinaciones obtenidas est dada por la siguiente expresin:
n
C
r
= (
()
Para r = 0, 1 2, 3, , n
Ejemplo No 51:
Al lanzar una moneda 6 veces, De cuantas formas se puede obtener:
a) 2 caras
b) 3 sellos
Solucin:
a) n = 6 y r = 2, entonces:
6
C
2
=(
()
b) n = 6 y r = 3, entonces:
6
C
3
=(
()
Ejemplo No 52:
Si hay 10 hombres y 8 mujeres para conformar un comit que debe estar conformado por 4 hombres y 3
mujeres De cuantas formas se puede conformar dicho comit?
Pgina 114 de 177
Solucin:
Para los hombres:
10
C
4
=(
()
Para las mujeres:
8
C
3
=(
()
Nmero de comits posibles: 210*56 = 11.760
Las combinaciones se aplican cuando:
- No se tiene en cuenta el orden
- No se admiten repeticiones
Pgina 115 de 177
CAPITULO 6: PROPIEDADES BSICAS DE LA
PROBABILIDAD
Leccin 21: Interpretaciones de la probabilidad
Con el fin de comprender la teora de probabilidad, es pertinente estudiar algunos teoremas, que soportan el
desarrollo probabilstico.
Teorema No 1: (Evento Imposible) Dado como conjunto vacio, entonces P () = 0. La probabilidad de un
evento imposible es cero.
Demostracin: Sea un evento A, luego Dado que A y son mutuamente excluyentes, entonces
() ( ) () () Luego () () () Para que se cumpla la igualdad (() debe ser
cero.
NOTA: En la prctica la probabilidad que un evento sea cero, no implica que sea imposible, sino ms bien raro,
por el principio de la frecuencia observada, as el recproco del teorema no siempre se cumple.
Teorema No 2: (Evento Cierto) Dado E el espacio muestral, entonces P (E) = 1. La probabilidad del espacio
muestral es la unidad.
Demostracin: Dado E el conjunto total, la ocurrencia es altamente probable, el axioma No 2 del enfoque
axiomtico lo hace evidente.
Teorema No 4 (Sucesos Disyuntos) Sean los eventos S
1
y S
2
, entonces: S
1
y S
2
son disyuntos si se cumple:
Cuando dos eventos son tal que su interseccin es vacio, se dice que son Mutuamente
Excluyentes.
Demostracin: Sean los conjuntos S
1
y S
2
, donde S
1
son elementos exclusivos de S
1
y S
2
Elementos que
ninguno es de S
1
, entonces la interseccin ser vacio.
Teorema No 6: (Probabilidad Acotada) A partir del teorema 1 y 2, se puede inferir que la mnima
probabilidad es cero y la mxima uno, entonces: ()
Teorema No 7: (Probabilidad del Complemento) Sea S un evento y E el espacio muestral, dado que y
Entonces: P(S) + P(S) = 1.
Ejemplo No 9:
Si A y B, son eventos mutuamente excluyentes, adems P(X = A) = 0,37 y P(X = B) = 0,44, Encontrar:
a) P( A)
Pgina 116 de 177
b) P( B)
c) ( )
d) ( )
Solucin:
a-) Como P ( A) + P(A) = 1, entonces: P ( A) = 1 - P(A) = 1 0,37 = 0,63
b-) Como P (B) + P(B) = 1, entonces: P ( B) = 1 - P(B) = 1 0,44 = 0,56
c-) Por la regla general de adicin: ( ) ( ) ( ) ( ) Como los eventos son
mutuamente excluyentes: ( ) Entonces: ( ) ( ) ( )= 0,37 + 0,44 = 0,81.
d-) Se debe calcular: ( ) ( ) ( ) ( ) Reemplazando:
0,81 = 0,37 + 0,44 0, como se cumple la igualdad, entonces ( )
Ejemplo No 10:
A partir del ejemplo No 9, hallar ( )
Solucin:
Utilizando la propiedad: ( ) () ( )
Como ( ) () Entonces:
(
) ( ) ()
Leccin 22: Axiomas de probabilidad: regla de la adicin
Teorema No 3: (Regla General de Adicin) Dados los eventos cualesquiera S
1
y S
2
, entonces:
(
) (
) (
) (
)
La probabilidad de la unin de dos eventos cualquiera, es igual a la suma de probabilidades de los dos
eventos, menos la probabilidad de su interseccin.
Demostracin: El siguiente grfico nos ayuda a hacer la demostracin.
Entonces:
) Donde:
) (
) Por lo tanto:
(
) (
) (
) As: (
) (
) (
)
(
) (
) (
)
Finalmente: (
) (
) (
) (
)
El teorema tres, prolongado a tres eventos: Dados los eventos cualquiera A, B y C, entonces (
) () () () ( ) ( ) ( ) ( ) La probabilidad de la unin de tres
eventos, es igual a la suma de las probabilidades de cada uno, menos la interseccin de los pares, ms la
probabilidad de la interseccin de todos.
Demostracin: Partimos de ( ) aplicamos el mismo principio del teorema No 3.
Pgina 117 de 177
Teorema No 5: (Regla Especial de Adicin) Sean los eventos S
1
y S
2
, los cuales son disyuntos, entonces
(
) (
) (
)
En general: (
) (
Demostracin: Buscar los argumentos para realizar la demostracin.
Ejemplo No 7:
Una Empresa realiza un estudio sobre sus ejecutivos, el uso de corbata y determin que su uso es del 42%, el
uso de vestido del 70% y del uso de los dos es del 35%. Al seleccionar aleatoriamente un ejecutivo de la
empresa Cul es la probabilidad de que ste use vestido, corbata o los dos?
Solucin:
Segn los datos: P(X = C) = 0,42; P(X = B) = 0,70 y P(X = C y X = B) = 0,35. Por la forma del problema se
puede aplicar la regla general de adicin.
P(C o B) = 0,42 + 0,70 0,35 = 0,77
Ejemplo No 8:
Un dado es tal que: P(X = 1) = 0,1; P(X = 2) = 0,2; P(X = 3) = 0,3; P(X = 4) = 0,01; P(X = 5) = 0,02; P(X = 6)
= 0,37. Al lanzar el dado una vez Cul es la probabilidad de obtener par?
Solucin:
La pregunta es hallar P(X = Par); adems, se trata de eventos donde se puede aplicar la regla especial de
adicin. Luego: P(X = 2 o X = 4 o X = 6) = P(X = 2) + P(X = 4) + P(X = 6) Por consiguiente: P(X = Par) = 0,2 +
0,01 + 0,37 = 0,48
Ejemplo No 11:
En una caja se encuentran 20 papeletas blancas enumeradas del 1 al 20, 10 papeletas rojas enumeradas del 1
al 10, 40 papeletas amarillas enumeradas del 1 al 40 y 10 papeletas azules enumeradas del 1 al 10. Las
Pgina 118 de 177
papeletas se mezclas de tal manera que cada una tiene la misma probabilidad de ser elegida. Al sacar una
papeleta, hallar:
a-) Que sea azul o blanca.
b-) Que este enumerada de 1 al 5.
c-) Que sea roja o amarilla y enumerada con 1, 2, 3, 4.
d-) Que este enumerada con los nmeros 5, 15, 25, 35.
Solucin:
a-) Como se tienen 10 papeletas azules y 20 papeletas blancas. Siendo el total de 80 papeletas, entonces se
puede aplicar la regla especial de adicin:
( ) ( ) () ()
b-) Se tienen 4 tipos de papeletas y cada una tiene los nmeros 1, 2, 3, 4, 5. Tambin corresponde a la regla
especial de adicin.
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
c-) Se tienen 10 papeletas rojas y 40 papeletas amarillas; adems, estn enumeradas con 1, 2, 3, 4. Al igual
que los casos anteriores, se trata de regla especial de adicin.
( ) ( ) () ()
d-) De las papeletas se tienen enumeradas: 5, 15, 25, 35 tenemos: De 20 blancas hay 5 y 15. De 10 rojas hay
5. De 40 amarillas hay 5, 15, 25, 35. De 10 azules hay 5. As se tienen 4 papeletas del nmero 5, 2 papeletas
del nmero 15, una con el nmero 25 y una con le nmero 35. Las posibilidades son: 4 +2 +1+ 1 = 8.
( )
Ejemplo No 12:
El manejo de una mquina nueva para empaque de producto lquido, tiene las siguientes probabilidades.
Muy difcil: 0,12 Difcil: 0,17 Promedio: 0,43 Fcil: 0,29 Muy fcil: 0,08
Encontrar las siguientes probabilidades:
a-) Difcil o muy difcil.
b-) Ni muy difcil ni muy fcil.
c-) Promedio o mejor.
Solucin:
a-) ( ) ( ) ( )
b -) ( ) ( )
( ) ( )
c- ) ( ) ( )
( )
Leccin 23: Independencia de Sucesos, regla de multiplicacin
A partir de la independencia de eventos y la probabilidad condicional, surge una regla muy importante de
probabilidad, conocida como la Regla de la Multiplicacin para eventos dependientes.
Pgina 119 de 177
DEFINICIN:
Sean A y B dos eventos cualquiera de un espacio muestral E y sea P(A) > 0, entonces:
( ) () ( )
La ecuacin expresa que la probabilidad de que ocurra A y B simultneamente, siendo P(A) > 0, es igual al
producto de la probabilidad de que ocurra A y la probabilidad de que ocurra B dado que ha ocurrido A; es decir,
la probabilidad condicional.
DEFINICIN:
Sean A y B dos eventos cualquieras de un espacio muestral E y sea P(A) > 0, entonces:
( ) () ( )
La ecuacin expresa que la probabilidad de que ocurra A y B simultneamente, siendo P(B) > 0, es igual al
producto de la probabilidad de que ocurra B y la probabilidad de que ocurra A dado que ha ocurrido B; es decir,
la probabilidad condicional.
Generalizando:
DEFINICIN:
Sean S
1
, S
2
,, S
n
eventos cualquieras de un espacio muestral E, entonces:
(
) (
) (
) (
) (
)
Ejemplo No 17:
En una caja hay 30 artculos, de los cuales 8 son defectuosos. Si se extraen 4 artculos aleatoriamente y en
forma sucesiva y sin reemplazamiento. Cul es la probabilidad de que los 4 artculos son defectuosos?
Solucin:
P(S
1
) = 4/30. Sacar defectuosos el primer artculo.
P(S
2
S
1
) = 3/29. Sacar defectuosos el segundo artculo.
P(S
3
S
1
S
2
)=2/28. Sacar defectuosos el tercer artculo.
P(S
4
S
1
S
2
Ejemplo No 20:
La probabilidad de comprar Taxi es del 25% y la probabilidad de comprar colectivo es del 65%, si se compra un
transporte para trabajar Cul es la probabilidad de comprar Taxi y Colectivo?
Solucin:
Sea P(X = T) = 0,25 y Sea P(X = C) = 0,65, entonces:
( ) () ()
Leccin 24: Probabilidad condicional
En fenmenos donde se hacer extracciones sin reemplazamiento, se presenta dependencia de eventos a partir
del segundo en adelante. La siguiente situacin nos ilustra el principio de probabilidad condicional.
Sea A evento que una persona gane el mnimo. Sea B una persona que sea bachiller. Sea N una persona que
no es bachiller. Sea T una persona que sea tcnico profesional. Entonces interpretemos las siguientes
situaciones.
P(AB) = La probabilidad de que una persona gane el mnimo, dado que es bachiller.
P(AN) = La probabilidad de que una persona gane el mnimo dado que no sea bachiller.
P(AT) = La probabilidad de que una persona gane el mnimo dado que es tcnico profesional.
P(NA) = La probabilidad de que una persona no sea bachiller, dado que gana el mnimo.
Para estos casos los primeros trminos se les llama Condicionantes tales como A y N, mientras que a los
segundos se les llama condicionados, tales como B, N, T y A.
Pgina 121 de 177
DEFINICIN:
Sean los eventos A y B, de tal manera que A est condicionado por el evento B, si la probabilidad de que
suceda A depende de que haya ocurrido B, entonces:
( )
()
()
Siempre que P(B) > 0.
Anlogamente: Sean los eventos A y B, de tal manera que B est condicionado por el evento A, si la
probabilidad de que suceda B depende de que haya ocurrido A, entonces:
( )
()
()
Siempre que P(A) > 0.
Ejemplo No 14:
Al lanzar un dado, cual es la probabilidad de que caiga dos, dado que ha cado par.
Solucin:
La probabilidad de que caiga par es P(X=Par) = 3/6
La probabilidad de que caiga dos es P(X=Dos) = 1/6
( )
Ejemplo No 15:
En un estudio sobre consumidores de servicios que brindan cierta compaa, los resultados se presentan en el
siguiente cuadro.
A = Compaas con buen servicio
B = Compaas con mal servicio.
1 = Compaas con 10 aos o ms
2 = Compaas con menos de 10 aos
A B
1 18 6 24
2 12 16 28
30 22 52
a-) Cual es la probabilidad de seleccionar una compaa que proporcione buen servicio.
b-) Cual es la probabilidad de seleccionar una compaa con ms de 10 aos de experiencia que proporcione
buen servicio.
c-) Cual es la probabilidad de seleccionar una compaa con menos de 10 aos, que proporcione mal servicio.
Solucin:
a-) Compaa con buen servicio: 30
( )
b-) Compaa con ms de 10 aos: 24
Compaas que proporcionan buen servicio y con ms de 10 aos: 18
( )
()
()
c-) Compaa que con menos de 10 aos y que proporcione mal servicio: 16
Compaa que proporciona mal servicio: 22.
( )
()
()
Pgina 122 de 177
Pgina 123 de 177
Ejemplo No 16:
En un saln de apuestas hay un Dado arreglado de tal forma que el nmero Impar tiene el doble de posibilidad
de salir que el nmero Par. Si se lanza el dado:
a-) Cual es la probabilidad de caiga un nmero mayor a tres.
b-) Cual es la probabilidad de el nmero de puntos tirados sean un cuadrado perfecto.
c-) Cual es la probabilidad de que se obtenga un cuadrado perfecto, dado que es mayor a tres.
Solucin:
Espacio muestral: = {1, 2, 3, 4, 5, 6}
a-) Si a es probabilidad de par entonces 2a probabilidad de impar, entonces: 2a+a+2a+a+2a+a=1
as: 9a = 1, a = 1/9, por consiguiente:
P(X > 3) = P(X=4) + P(X=5) + P(X=6) = 1/9 + 2/9 + 1/9 = 4/9
b-) Los nmeros que son cuadrados perfectos son 1 y 4, entonces: B {1, 4}
P(B) = P(1) + P(4) = 2/9 + 1/9 = 3/9 = 1/3.
c-) P(BA). Donde B = Cuadrado perfecto y A = Nmero mayor a tres.
( )
Leccin 25: Probabilidad total y teorema de Bayes
Ley de Probabilidad Total: Sean A
1
, A
2
, ,A
k
eventos mutuamente excluyentes, (
)
y exhaustivos
(deben ocurrir uno de ellos) entonces para cualquier otro evento B:
P(B) = P(BA
1
)*P(A
1
)+ P(BA
2
)*P(A
2
)++ P(BA
k
)*P(A
k
)
Generalizando: () (
) (
Ejemplo No 21:
Se desea rentar Autos de tres agencias de la siguiente manera: El 60% de la agencia Velox, el 30% de la
agencia Rap y el 10% de la agencia Service. Los autos de la agencia Velox requieren revisin en un 9%, los de
la agencia Rap en un 20% y los de la agencia Service en un 6%. Cul es la probabilidad de que un auto
rentado requiera revisin?
Solucin:
Sea A el evento que un auto requiera revisin, sean V, R y S los eventos que los autos provengan de las
agencias Velox, Rap y Service respectivamente.
Entonces: P(V) = 0,60; P(R) = 0,30; P(S) = 0,10
Por otro lado: P(AV) = 0,09; P(AR) = 0,20; P(AS) = 0,06
La probabilidad total se obtiene as: P(A) = P(AV)*P(V)+ P(AR)*P(R)+ P(AS)*P(S)
Reemplazando: P(A) = 0,60*0,09 + 0,30*0,20 + 0,10*0,06 = 0,054 + 0,06 + 0,006 = 0,116
Entonces el 11,6% de los autos requieren revisin.
Ejemplo No 22:
En un estudio sobre cierta enfermedad, se ha determinado que la probabilidad de que una persona tenga la
enfermedad es del 3%. Se ha diseado una prueba diagnstico para determinar si una persona sometida a la
misma tiene la enfermedad. La probabilidad de que la prueba diagnstica de resultado positivo; sabiendo que
la enfermedad est presente es de 0,90. La probabilidad de que la prueba diagnstica de resultado positivo;
sabiendo que la enfermedad no est presente es de 0,02. Si se le aplica la prueba a una persona, cual es la
probabilidad de que la prueba sea positiva?
Pgina 124 de 177
Solucin:
Sea E el evento prueba positiva, sean T y N los eventos tiene la enfermedad y no tiene la enfermedad
respectivamente.
Entonces: P (T) = 0,03; P (N) = 0,97
Por otro lado: P(ET) = 0,90; P(EN) = 0,02
La probabilidad total se obtiene as: P(E) = P(ET)*P(T)+ P(EN)*P(N)
Reemplazando: P(E) = 0,90*0,03 + 0,02*0,97 =0,0464
Entonces la probabilidad de que una persona sometida a la prueba de diagnstico positivo es del 4,64%.
Ejemplo No 23:
Una compaa de seguros clasifica a sus clientes en dos grupos: Los que son propensos a accidentes (P) y lo
que no son propensos a accidentes (N). Segn las estadsticas de la compaa, la probabilidad de que un
cliente propenso a accidentes tenga uno en un ao es de 40% y la probabilidad de que un cliente no propenso
a accidentes tenga uno en un ao es del 20%. Sabiendo que el 30% de la poblacin es propensa a accidentes,
Cul es la probabilidad de que una persona que compra una pliza sufra un accidente en un ao?
Solucin:
Sea A el evento sufrir un accidente, sean P y N los eventos propensos a accidentes y no propensos
respectivamente.
Entonces: P(P) = 0,4 y P(N) = 0,2
Por otro lado: P(AP) = 0,30; P(AN) = 0,70. As: P(A) = P(AP)*P(P) + P(AN)*P(N)
Reemplazando: P(A) = 0,30*0,4 + 0,70*0,2 = 0,26
Entonces la probabilidad de que una persona que compra la pliza sufra un accidente es del 26%.
Teorema de Bayes: Analizada a ley de probabilidad total, ya se puede definir la muy conocida teorema de
bayes:
Ejemplo No 24:
Utilizando los datos del ejemplo 21, si un auto es rentado y requiere revisin, Cul es la probabilidad de que
sea de la agencia Rap?
Solucin:
Se debe hallar P(RA). Entonces P(AR)*P(R) = 0,30*0,20 = 0,06
Como P(A) = 0,60*0,09 + 0,30*0,20 + 0,10*0,06 = 0,054 + 0,06 + 0,006 = 0,116
(|)
()(|)
(
)(|
As el 51,72% de los autos que requieren revisin, provienen de la agencia Rap.
Sean B
1
, B
2
, , B
k
. una particin del espacio muestral E, dado que
P(B
i
) 0, para i = 1, 2, , k; entonces para cualquier evento A en el
espacio muestral E; tal que P(A) 0, se tiene:
(
)
(
)(
)
(
)(|
Para j = 1, 2, .., k
Pgina 125 de 177
Ejemplo No 25:
Utilizando los datos del ejemplo 22, si la prueba diagnstica dio resultado positivo Cul es la probabilidad de
que la enfermedad este en realidad?
Solucin:
Se debe hallar P(TE). Entonces P(ET)*P(T) = 0,90*0,03 = 0,027
Como P(E) = 0,90*0,03 + 0,02*0,97 =0,0464
(|)
()(|)
(
)(|
Entonces la probabilidad de que la enfermedad est en realidad es del 58,19%, dado que ha ocurrido resultado
positivo.
Ejemplo No 26:
Un investigador esta 60% de seguro que la persona detenida es culpable, ste tiene cierta caracterstica que la
posee el 20% de la poblacin. En estas condiciones Qu tan seguro est el investigador sobre la culpabilidad
de la persona detenida?
Solucin:
Sea C el evento que la persona es culpable. Sea M el evento que la persona tiene la caracterstica.
P (C) = Probabilidad de que la persona sea culpable. 60%
P (M) = Probabilidad de que la persona tenga la caracterstica.
P (C) = Probabilidad de que la persona no sea culpable. 40%
P (M) = Probabilidad de que la persona no tenga la caracterstica
P (MC) = Probabilidad de que la persona tenga la caracterstica dado que es culpable. 100%
P (MC) = Probabilidad de que la persona tenga la caracterstica dado que no es culpable. 20%
Se debe hallar: P (CM)
P (MC)*P(C) = 1*0,6 = 0,6
P (M) = P (MC)*P(C) + P (MC)*P(C) = 1*0,6 + 0,2*0,4 = 0,68
Entonces:
(|)
()(|)
()(|)()(|)
Entonces el investigador esta en un 88,24% seguro de la culpabilidad de la persona detenida.
Pgina 126 de 177
UNIDAD TRES
VARIABLES ALEATORIAS
Y DISTRIBUCIONES DE
PROBABILIDAD
Pgina 127 de 177
CAPITULO 7: VARIABLES ALEATORIAS
Leccin 26: Concepto intuitivo y matemtico de variable
aleatoria
VARIABLE ALEATORIA
Concepto Intuitivo: Una variable aleatoria X es aleatoria si el valor que asume de acuerdo al resultado de un
experimento, es una probabilidad de un evento aleatorio, es decir; transforma eventos aleatorios en nmeros
reales.
Las variables aleatorias se clasificar en dos grandes grupos:
Variables Cualitativas: Son aquellos que generan datos cualitativos, como es el caso de las variables
dicotmicas, tales como Blanco-Negro, Masculino-Femenino, Cara-Sello. Las variables nominales, tales como
Raza, Genero, Programa Acadmico, Canal Favorito, Color. Las variables ordinales, tales como Estrato, Talla,
Sabor, cuerpo de una sustancia, Nivel Acadmico.
Variables Cuantitativas: Son las que generan datos cuantitativos, las cuales se subdividen en discretas y
continuas.
-Variable Aleatoria Discreta: Son las que se pueden contar y organizar en una secuencia utilizando los
nmeros enteros positivos, slo se sume un nmero finito de valores.
Ejemplos: Nmero de personas que visitan un almacn en un da, nmero de llamadas telefnicas recibidas en
un call center por hora, cantidad de carros vendidos por mes, edad aos cumplidos,
-Variable Aleatoria Continua: Son las que toman valores dentro de un intervalo, se dice que estn dentro de
los nmeros reales.
Ejemplos: El ancho de un edificio, el tiempo transcurrido en un desplazamiento, el peso medido a una persona,
el salario de una poblacin, la duracin de un bombilla, la estatura de una persona, la temperatura.
Concepto Matemtico: Sea S un espacio muestral sobre el cual se encuentra definida una probabilidad, sea X
una funcin de valor real definida sobre S. Entonces X es una variable aleatoria debido a que transforma los
resultados de S en puntos sobre la recta real.
Se dice que X es aleatorio ya que involucra la probabilidad de los resultados del espacio muestral.
Ejemplo No 53:
Pgina 128 de 177
Experimento: Lanzar una moneda.
Solucin:
S = {C, S}
P(X = C) = 1 y P(X=S) = 0
Ejemplo No 54:
Experimento: Lanzar un dado.
Solucin:
S = {1, 2, 3, 4, 5, 6}
P(X = 1) = 1/6, P(X = 2) = 1/6, P(X = 5) = 1/6 P(X = 7) = 0
Una variable aleatoria queda definida en un experimento aleatorio, cuando se conoce su campo de variacin y
el conjunto de probabilidades en donde toma valores dicho campo.
Leccin 27: Distribucin discreta de probabilidad.
VARIABLE ALEATORIA DISCRETA:
Funcin de Probabilidad o Distribucin de Probabilidad: Una variable aleatoria X representa los resultados de
un espacio muestral de tal forma que P(X =x), esto significa que debe existir una funcin matemtica que
asigna una probabilidad a cada realizacin x de la variable aleatoria, a esta funcin se le llama Funcin de
Probabilidad o Distribucin de Probabilidad.
DEFINICIN: Sea X una variable aleatoria discreta, entonces f(x) = P(X = x) se le conoce como funcin de
probabilidad de la variable aleatoria X. El par ordenado obtenido se de la forma [x, f(x)]. La funcin debe
satisfacer las siguientes condiciones:
1. P(x) 0 Para todo x que pertenece a X
2. ()
3. P(X = x) = f(x)
Funcin de Distribucin Acumulada: La funcin de distribucin acumulada F(x) representa la suma de
probabilidades puntuales hasta el valor x inclusive.
DEFINICIN: La funcin de distribucin acumulada de una variable aleatoria X, es la probabilidad de que X sea
menor o igual a un valor especfico x; segn:
() ( ) (
Caractersticas de F(x):
a-) La funcin F(x) de una variable aleatoria discreta, es una funcin no negativa, por ser una probabilidad.
b-) La funcin F(x) es no decreciente, por ser acumulativa.
c-) La funcin F(x) es acotada; es decir, 0 F(x) 1. Para todo x.
d-) (
) (
) Para
e-) ( ) ( ) ()
f-) ( ) () ( ) ( ) ( )
g-) (
) (
) (
) (
) (
)
Ejemplo No 55:
Sea el experimento: Lanzar dos dados simultneamente, identificar el espacio muestral, los valores de x y la
probabilidad asociada a cada valor de x. La premisa es la suma de las caras obtenidas.
Solucin:
Espacio muestral: S = 6
2
= 36 resultados posibles. Utilizando la regla de exponente.
Pgina 129 de 177
RESULTADOS X = x P( X = x )
(1, 1) 2 1/36
(1, 2); (2, 1) 3 2/36
(1, 3); (3, 1); (2, 2) 4 3/36
(1, 4); (4, 1); (2, 3); (3, 2) 5 4/36
(1, 5); (5, 1); (3, 3); (4, 2); (2, 4) 6 5/36
(1, 6); (6, 1); (4,3); (3, 4); (5, 2); (2, 5) 7 6/36
(2, 6); (6, 2); (3, 5); (5, 3); (4, 4) 8 5/36
(3, 6); (6, 3); (4, 5); (5, 4) 9 4/36
(4, 6); (6,4); (5, 5) 10 3/36
(5, 6); (6,5) 11 2/36
(6, 6) 12 1/36
Ejemplo No 56:
A partir del ejemplo 55, referente al lanzamiento de los dos dados. Hallar F(x=4).
Solucin:
Por la funcin de distribucin acumulada
( ) ( ) (
( ) ( ) ( ) ( ) ( )
( )
Ejemplo No 57:
A partir del ejemplo 55, referente al lanzamiento de los dos dados. Cul ser el valor de probabilidad para
P(X > 4)
Solucin:
Por la funcin de distribucin acumulada.
( ) ( ) ()
Ejemplo No 58:
A partir del ejemplo 55, referente al lanzamiento de los dos dados. Cul ser el valor de probabilidad para
P(X =3) y ( )
Solucin:
Por la funcin de distribucin acumulada.
( ) ( ) ( ) () ()
( ) ( ) ( ) () ()
Ejemplo No 59:
Un dado est arreglado de tal forma que cada nmero impar tiene el doble de probabilidad de ocurrencia que el
nmero par. Sea G el evento que el nmero que cae es mayor a tres.
Hallar P(X =G )?
Solucin:
El espacio muestral: S = {1, 2, 3, 4, 5, 6}. Sea u = Nmero par, entonces 2u = Nmero impar. Entonces segn
los valores del espacio muestral: 2u + u +2u + u + 2u + u = 1. 9u = 1, as u = 1/9
Como G = 4, 5, 6 entonces: u + 2u + u = 1/9 + 2/9 + 1/9 = 4/9, por consiguiente: P(X =G ) = 4/9
Pgina 130 de 177
Ejemplo No 60:
Cul ser la expresin que describe la distribucin de probabilidad para la variable aleatoria X = Nmero
total de caras al lanzar una moneda 4 veces?
Solucin:
El espacio muestral = 2
4
= 16. Segn la regla del exponente.
P(X = 0) =1/16, P(X = 1) = 4/16, P(X = 2) = 6/16, P(X = 3) =4/16, P(X = 4) = 1/16.
Haciendo el anlisis:
Para X = 0. Tenemos: (
)
Para X = 1. Tenemos: (
)
Generalizando:
Para X = x = (
) ()
(
Para x = 0, 1, 2, 3, 4.
Ejemplo No 61:
Mostrar que ()
. Entonces:
()
() () () () ()
Como se puede ver f(x) cumple las dos condiciones, as queda mostrado que f(x) es funcin de distribucin de
probabilidad.
Ejemplo No 62:
En un casino se tiene un dado cargado para jugar, segn la siguiente tabla.
1 2 3 4 5 6
(
1 2 3 4 5 6
(
3. ( ) ()
La grfica que representa la funcin de densidad de probabilidad, es el rea bajo la curva, cuyo valor total es
uno. La probabilidad en un intervalo a X b ser el rea acotada por la funcin de densidad y las rectas x = a
y x = b.
La curva normal se desarrolla alrededor de la media, donde con una desviacin estndar se abarca el 68,3%
de la informacin, con dos desviaciones estndar se abarca el 95,5% de la informacin y con tres desviaciones
estndar se abarca el 99,7% de la informacin.
Pgina 132 de 177
Funcin de Distribucin Acumulada: La funcin de distribucin acumulada F(x) es el rea acotada por la
funcin de densidad que va desde - < x < , la curva de F(x) es lisa y no decreciente.
DEFINICIN: La funcin F(x) se considera funcin de distribucin acumulada para la variable aleatoria X si
cumple:
( ) () ()
()
Ejemplo No 63:
El estudio de intervalo de llegada a un Banco es una variable aleatoria, cuya funcin de densidad es:
() *
Determinar:
a-) El valor de k
b-) La funcin de distribucin acumulada
c-) La probabilidad de que x 8
d-) La probabilidad de que 2 < X < 6
Solucin:
a-) Por definicin:
Entonces:
Evaluando (
)|
k = 1/2
b-) Como () ()
()
Donde: ()
Para x > 0
c-) ( ) ()
Entonces el 98,17% es la probabilidad de que transcurra 8 minutos entre dos visitas
consecutivas en el Banco.
d-) ( ) () () (
) (
) (
) (
)
As: ( )
Pgina 133 de 177
Ejemplo No 64:
Dada la funcin de distribucin acumulada ()
As: ()
b-) ( ) ()
()
c-) ( ) ( ) () (
As: ( )
Leccin 29: Esperanza matemtica y varianza de variables
aleatorias
ESPERANZA MATEMTICA
El concepto de Esperanza Matemtica o Valor Esperado fue motivado por los juegos de azar, siendo J acob
Bernoulli en 1.713 utilizo la esperanza para indicar cual sera la situacin de un jugador que deseaba ganar
en un juego. Bernoulli, analiz la siguiente situacin: Si la ganancia por juego (g) se multiplica por el
porcentaje de veces que se gana P(g) y se le resta la prdida(p) multiplicada por el porcentaje de veces que
ocurre prdida P(p), se obtiene el valor esperado del juego:
E(Juego) = g*P(g) + p*P(p)
Posteriormente Von Mises le dio carcter estadstico al concepto de esperanza, aplicada a variables
aleatorias que dieron alternativas de ganar o perder, llegando a la expresin:
()
Donde: x
i
son los valores de las alternativas y p (x
i
) la probabilidad de las alternativas.
-) Por la regularidad estadstica, el valor lmite de la frecuencia relativa de cada posibilidad se da como:
)
-) La media se define como:
Por lo anterior, la esperanza matemtica E(X) se considera como el valor medio de la distribucin terica de
probabilidad del fenmeno estudiado. Dicho de otra manera, es el valor hacia donde tiende la media aritmtica,
cuando el nmero de observaciones es muy grande; es decir, es el lugar hacia donde se centra la distribucin
de probabilidad.
Pgina 134 de 177
Caso Discreto: (Una Variable)
DEFINICIN: Sea X una variable aleatoria discreta y sea f(x) el valor de la distribucin de probabilidad en
X, entonces el valor esperado de la variable aleatoria est dada por la siguiente expresin:
() ()
Ejemplo No 78:
Una variable aleatoria X puede tomar los valores: 1, 2, 3, 4. Las probabilidades de cada caso
son: 0.20, 0.25, 0.30, 0.25 respectivamente. Hallar la esperanza matemtica.
Solucin:
Por definicin ()
)
Caso Continuo: (Una Variable)
DEFINICIN: Sea X una variable aleatoria continua y sea f(x) el valor de la densidad de probabilidad en
X, entonces el valor esperado de la variable aleatoria est dada por la siguiente expresin:
() ()
Ejemplo No 79:
Sea la variable aleatoria continua X, cuya funcin de densidad f(x) = 5x
4
para 0 X 1. Hallar E(X)
Solucin:
Por definicin () (
( )
E(X) = 5/6
Ejemplo No 80:
Sea la variable aleatoria continua X, cuya funcin de densidad f(x) = 4x
3
para 0 X 1. Hallar E(X)
Solucin:
Por definicin () (
( )
E(X) = 4/5
La esperanza matemtica no siempre existe, para el caso discreto, E(X) existe si la serie infinita que tenga, sea
convergente. Para el caso continuo, cuando la integral es impropia, la esperanza existe si la integral es
convergente.
Propiedades del Valor Esperado:
1.) La esperanza matemtica de una constante, es igual a la constante: E(k) = k
2.) La esperanza matemtica de la suma de algebraica de variables aleatorias, es igual a la suma algebraica
de las esperanzas matemticas de cada una de las variables aleatorias.
E(X
1
X
2
X
n
) = E(X
1
) E(X
2
) E(X
n
)
Pgina 135 de 177
3.) La esperanza matemtica del producto algebraico de variables aleatorias, es igual al producto
algebraico de las esperanzas matemticas de cada una de las variables aleatorias, si y solo si, son
estadsticamente independientes. E(X
1
* X
2
**X
n
) = E(X
1
) * E(X
2
) * * E(X
n
)
4.) La esperanza matemtica de las desviaciones de los valores de la variable aleatoria, respecto a la media
es cero. E(X ) = 0 Luego: E(X) =
Lo anterior deja ver que la esperanza matemtica es un parmetro o caracterstica de la tendencia central de
la distribucin.
5.) Si la variable aleatoria X se le suma una constante, la esperanza matemtica de la variable queda
modificada en la constante; es decir; un cambio del origen en la variable aleatoria, afecta su esperanza
matemtica. E(X + k) = E(X) + K
6.) Si una variable aleatoria X se le multiplica por una constante, su esperanza matemtica tambin queda
multiplicada por la constante. Un cambio en la escala de la variable aleatoria, afecta su esperanza
matemtica. E(k*X) = kE(X) Para k = Constante
7.) La esperanza matemtica de una transformacin lineal de una variable aleatoria, ser la transformacin
lineal de la esperanza matemtica de la variable aleatoria. E(a + bX) = a + bE(X).
Ejemplo No 81:
En un pedido de 12 computadores se incluyen 2 de marca DELL, si se seleccionan 3 aparatos aleatoriamente
para hacer un despacho. Cuntos aparatos de marca DELL pueden ser despachados?
Solucin:
El planteamiento: x computadores de marca DELL y 3 x computadores de otras marcas. El total de aparatos
a seleccionar es: (
)
La funcin de probabilidad cuya variable aleatoria X son los computadores de marca DELL despachados ser:
()
(
)(
)
(
)
Para x = 0, 1, 2
Entonces:
X 0 1 2
f(x) 6/11 9/22 1/22
Con estos datos se calcula E(X). Como la variable aleatoria es discreta, entonces:
E(X) = 0*6/11 + 1*9/22 + 2*1/22 = 1/2. El promedio de envos repetidos es 1/2.
Ejemplo No 82:
Sea la variable aleatoria X con funcin de densidad f(x) = 1/3 x
2
Para -1 < X < 2
Solucin:
A partir de la definicin y por las propiedades de la esperanza matemtica.
E(g(X)) = E(4X + 3) = 4E(X) + 3
(())
))
(())
( )
Pgina 136 de 177
VARIANZA DE UNA VARIABLE ALEATORIA
Se sabe que la media o valor esperado describe el lugar donde se centra la distribucin de probabilidad, pero
no ofrece una descripcin adecuada de la forma de la distribucin. Es pertinente y necesario caracterizar la
variabilidad de dicha distribucin. La medida de variabilidad ms importante en estadstica es la varianza de la
variable aleatoria o de la distribucin de probabilidad.
Caso Discreto:
DEFINICIN: Sea X una variable aleatoria discreta, con distribucin de probabilidad f(x) y media , entonces la
varianza de X est dada por la siguiente expresin:
()
[( )
] ( )
()
Donde (x - ) se conoce como la desviacin de las observaciones respecto a la media. Esta al ser evaluada al
cuadrado y luego promediadas, sern menores para valores de x muy cercanas a .
Una forma alternativa para la varianza es:
()
Ejemplo No 86:
Sea la variable aleatoria X que representa las funciones de distribucin A y B.
x 0 1 2 3 4
A f(x) 0.3 0.4 0.3
B f(x) 0.2 0.1 0.3 0.3 0.1
a-) Hallar la varianza de X en el caso A
b-) Hallar la varianza de X en el caso B
c-) Cual de las dos distribuciones tiene menor varianza
Solucin:
a-) Primero se calcula E(X) = = 1*0.3 + 2*0.4 + 3*0.3 = 2.0
()
( )
() ( )
() ( )
() ( )
()
()
b-) E(X) = = 0*0.2 + 1*0.1 + 2*0.3+3*0.3+4*0.1 = 0+0.1+0.6+0.9+0.40 = 2.0
() ( )
() ( )
() ( )
() ( )
() ( )
()
()
c-) La varianza del caso B es mayor que la varianza del caso A, as la varianza del caso A es menor, lo que
indica que la funcin de distribucin de la variable A es ms estable que la B.
Caso Continuo:
DEFINICIN: Sea X una variable aleatoria continua, con funcin de densidad de de probabilidad f(x) y media ,
entonces la varianza de X est definida como sigue a continuacin:
()
[( )
] ( )
()
Ejemplo No 87:
La demanda mensual de un producto est dada por la variable aleatoria X, cuya funcin de densidad se define
como:
Pgina 137 de 177
( ) {
( )
Hallar la varianza de X.
Solucin:
Por de definicin ()
[( )
] ( )
()
) (
()
( ) ( )
( )
( ) (
()
Desarrollando el mismo ejercicio, utilizando la forma alternativa de la varianza.
()
Primero: (
()
( ) (
) [
( )
( )
Segundo: ()
Propiedades de la Varianza:
1. La varianza es siempre no negativa, Como ( )
()
6. El error cuadrado medio (ECM) es la dispersin de la variable aleatoria entorno a un origen K, dicho error
se hace mnimo cuando coinciden con la varianza. ( )
( )
( )
Pgina 138 de 177
Leccin 30: Teorema de Chbyshev
La varianza de una variable aleatoria nos muestra el grado de agrupamiento que tienen los datos alrededor de
la media, as la probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo alrededor de
la media, ser mayor si tiene una varianza menor que otra variable aleatoria que tenga mayor varianza.
En trminos de rea, una variable aleatoria con V(X) =
2
grande, presentar mayor rea y muy lejana de la
media . Por el contrario una variable aleatoria con V(X) =
2
pequea, nos dir que la mayor parte del rea
est alrededor de la media .
El matemtico ruso P L Chebyshev (1.821 1.894) descubri descubri que la fraccin de rea entre dos
valores simtricos cualquiera alrededor de , est relacionado con la desviacin estndar. EL siguiente
teorema nos da una estimacin de la probabilidad de que una variable aleatoria tome un valor entre K
desviaciones estndar de la media , para cualquier valor de K.
TEOREMA: Sean y la media y desviacin estndar de una variable aleatoria X, entonces para cualquier
constante K, la probabilidad de que X asuma al menos un valor dentro de K desviaciones estndar de la
media, est dado por 1 1/K
2
. Entonces:
( )
El teorema de Chebyshev nos ofrece un lmite inferior de probabilidad, pero no se puede saber el valor real de
probabilidad. Como se ver en el siguiente ejemplo, la probabilidad de que la variable aleatoria est entre dos
desviaciones estndar, no puede ser menor a 3/4
Ejemplo No 88:
Cul ser la probabilidad de que la variable aleatoria X, asuma al menos un valor dentro de 2 desviaciones
estndar?
Solucin:
Como K = 2, Luego: ( )
Entonces: ( )
Pgina 139 de 177
Ejemplo No 89:
Una variable aleatoria X tiene una media de 12 y varianza 16, la distribucin de probabilidad es desconocida,
hallar P (4 < X < 20)
Solucin:
Por el teorema de Chebyshev: ( )
Como 12 4K = 4, entonces: K = 2, de igual manera: 12 + 4K = 20, K = 2. Por consiguiente:
( () ())
Como: 8 3K = 2 y 8 + 3K = 14, entonces: K = 2.
Luego: P (2 < X < 14) 3/4. Entonces: 1 - P (X - 8 < 6) = 1 3/4 = 1/4.
Finalmente: P (X - 8 6) 1/4
Ejemplo No 91:
Una variable aleatoria Y tiene una media = 10 y varianza
2
= 4, hallar P (Y - 10 < 3)
Solucin:
P (Y - 10 < 3) = P (-3 < Y - 10 < 3) = P (-3 + 10 < Y < 3 + 10) = P (7 < Y < 13) .
Por Chebyshev: ( )
Para x = x
1
, x
2
, ... , x
K
y x
i
x
j
para i j.
Segn la expresin, los valores de x
1
, x
2
, ... , x
K
toman la misma probabilidad.
Propiedades:
Media:
De otra manera:
Varianza:
De otra manera:
Ejemplo No 92:
En el lanzamiento de un Dado normal, cual es la probabilidad de ocurrencia de los eventos, corresponde a
una distribucin uniforme?
Solucin:
Espacio muestral: S = {1, 2, 3, 4, 5, 6}
P(X = x
K
) = 1/6. f(x, 6) = 1/6 Para x = 1, 2, 3, 4, 5, 6
Como la probabilidad es constante en todo el espacio muestral, evidentemente la distribucin es uniforme
discreta.
Pgina 141 de 177
Ejemplo No 93:
En una caja hay USB de 1, 2, 3, 4, 6 GB,
a-) Cul es la distribucin de probabilidad?
b-) Cual es la probabilidad de seleccionar una USB de 3GB?
Solucin:
Espacio muestral: S = {1, 2, 3, 4, 6}
P(X = x
K
) = 1/5. f(x,5) = 1/5 Para x = 1, 2, 3, 4, 6.
Como la probabilidad es constante en todo el espacio muestral, evidentemente la distribucin es uniforme
discreta.
Leccin 32: Distribucin Binomial y Poisson
DISTRIBUCIN BINOMIAL.
La distribucin Binomial es una de las distribuciones ms utilizadas, dentro de las distribuciones discretas. Se
dice que la Binomial, es una generalizacin de la distribucin Bernoulli, ya que la Bernoulli ocurre para un
ensayo y la Binomial ocurre para n ensayos. La distribucin Binomial se caracteriza porque tiene dos posibles
resultados: xito y Fracaso. Si p(x) es la probabilidad de xito, q(x) = 1 p(x) es la probabilidad de fracaso.
DEFINICIN: Sea X una variable aleatoria que representa el nmero de xitos en n ensayos y sea P la
probabilidad de xito en cualquiera de los ensayos, entonces X tiene distribucin de probabilidad Binomial,
cuya funcin de probabilidad se define de la siguiente manera:
( ) (
Pgina 142 de 177
Asimetra:
Curtosis:
Veamos algunas distribuciones binomiales , para un X dado y una probabilidad definida.
X = 20 y P(X=x) = 0,2 X = 20 y P(X=x) = 0,5
X = 20 y P(X=x) = 0,75 X = 20 y P(X=x) = 0,95
Ejemplo No 94:
En un experimento se realizan 10 ensayos, la probabilidad de xito es 0,1 Hallar P(X = 2)
Solucin:
Segn el problema: n = 10, p = 0.1, q = 0.9
( ) (
) ()
()
() ()
( )
Ejemplo No 95:
En una industria farmacutica se quiere determinar la efectividad de un medicamento, en ensayos preliminares
se ha establecido que de cada 50 pacientes, 40 responden bien al producto. Si se toman 4 pacientes Cul es
la probabilidad de que dos de ellos respondan positivamente al medicamento?
Solucin:
Segn los datos del problema: n = 4, x = 2, p = 4/5 = 0,8
Pgina 143 de 177
Entonces: ( ) (
) ()
()
() ()
La probabilidad de que dos de los pacientes tomados como muestra respondan positivamente al medicamente
es del 15,36%
Ejemplo No 96:
La compaa Q.ac fabrica Benzoato de Sodio como preservante contra hongos. La experiencia muestra que el
producto tiene problemas de efectividad en un 5%. Se realiz un experimento con 25 productos idnticos.
a-) Cul es la probabilidad de que por lo menos 2 de ellos presente problemas de efectividad?
b-) Cul es la cantidad esperada del producto con problemas de efectividad?
Solucin:
a-) Se debe hallar: P(X 2) = 1 P(x 1) Donde: P(X 1) = P(X = 0) + P(X = 1)
( ) (
) ()
()
() ()
( ) (
) ()
()
() ()
( ) As: ( )
b-) Se debe hallar E(X) =
E(X) = = n*p = 25 * 0,05 = 1,25
Ejemplo No 97:
En un estudio sobre la Vitamina C para resfriado, se prob que de cada 10 personas que la consumen, 8
personas no presentan resfriado durante un ao. Si la probabilidad de no presentar resfriado es del 50%
cuando no se consume la vitamina Cul es la probabilidad de observar 8 o ms personas sin resfriado? .Se
asume que la vitamina es ineficaz para aumentar la resistencia al resfriado.
Solucin:
Segn los datos: p = 0.5, q = 0.5, n = 10, x 8.
P(X 8) = P(X = 8) + P(X = 9) + P(X = 10)
( ) (
) ()
()
() ()
( ) (
) ()
()
() ()
( ) (
) ()
()
() ()
( )
Ejemplo No 98:
En un estudio sobre la Vitamina C para resfriado, (ejemplo 97) hallar: ,
2
, A, K
Solucin:
()
La distribucin de la efectividad para la vitamina C es simtrica.
Tabla de la Distribucin Binomial:
Para simplificar los clculos, casos donde x toma muchos valores, se ha diseado la tabla de distribucin.
Pgina 144 de 177
Ejemplo No 99:
Hallar, utilizando la tabla:
a-) P(X = 2) Para n = 10 y p = 0,5
b-) P(X = 3) Para n = 10 y p = 0,3
c-) P(X = 2) Para n = 6 y p = 0,4
Solucin:
a-) En la tabla se busca para n = 10 y p = 0,5. Entonces: P(X = 2) = 0,0439
b-) En la tabla se busca para n = 10 y p = 0,3. Entonces: P(X = 3) = 0,2668
c-) En la tabla se busca para n = 6 y p = 0,4. Entonces: P(X = 2) = 0, 3110
Ejemplo No 100:
Hallar, utilizando la tabla
a-) P(X 2) Para n = 6 y p = 0,15
b-) P(X 3) Para n = 8 y p = 0,25
Solucin:
a-) En la tabla se busca para n = 6 y p = 0,15, el valor para x = 0 y para x = 1.
Para P(X 2) = 1 P(X 1) = 1 (0,3771 + 0,3993) = 0,2236
b-) En la tabla se busca para n = 8 y p = 0,25, el valor para x = 0, para x = 1, para x = 2 y para x = 3.
Para P(X 3)=P(X = 0)+ P(X = 1) + P(X = 2) + P(X = 3)=0,1001 + 0,2670 +0,3115 + 0,2076 = 0,8862
La tabla de distribucin Binomial, por lo general va hasta n = 20, as x = 0, 1, 2, 3, , 20
Pgina 145 de 177
DISTRIBUCIN POISSON.
Cuando n es muy grande, el clculo de probabilidades binomiales es muy complicado, casi imposible. Para
superar dicha limitacin, el estadstico francs Simeon Denis Poisson (1.781 1.840), quien en 1.838
desarroll una distribucin de probabilidad discreta, bajo los siguientes argumentos:
Qu forma tiene el lmite de la distribucin Binomial cuando n , p 0, mientras n*p permanece constante.
A n*p lo llam .
La distribucin de probabilidad Poisson de variable discreta, aplica a eventos independientes ocurridos
medidos en el tiempo o espacio, a velocidad constante. Casos como:
-) Nmero de bacterias en un volumen de lquido
-) Nmero de defectos de una mquina en unidad de tiempo.
Las probabilidades individuales son cada vez ms pequeas conforme la variable aleatoria toma valores cada
vez ms grande.
DEFINICIN: Sea X una variable aleatoria, que representa el nmero de eventos aleatorios independientes
que ocurren a rapidez constante sobre el tiempo o espacio, entonces se dice que X tiene distribucin Poisson
con funcin de probabilidad, dada por la siguiente expresin:
( )
Asimetra:
Curtosis:
Ejemplo No 105:
Sea = 2, Hallar P(X=0)
Solucin:
( )
Ejemplo No 106:
Un fabricante de envases plsticos compra a un proveedor el polipropileno, el cual garantiza que de cada 100
Kg, slo 1 Kg, es defectuoso. En un pedido de 1.000 Kg, Cul es la probabilidad de que todo el pedido trabaje
bien?
Solucin:
A partir de los datos del problema: n = 1.000 Kg, p = 1/100 = 0,01
x = 0 Nmero de defectuosos
= n*p = 1.000*0,01 = 10
Entonces: ( )
La probabilidad de que todo el pedido trabaje bien es del 0,004%
Ejemplo No 107:
A partir del ejemplo sobre el fabricante de envases plsticos, ejemplo 106. Cul es la probabilidad que a lo
ms 3 Kg sean defectuosos?
Solucin:
El planteamiento es: ( ) ( ) ( ) ( ) ( )
( )
Ya calculado
( )
( )
( )
Entonces: ( )
Ejemplo No 108:
A partir del ejemplo sobre el fabricante de envases plsticos, ejemplo 106. Hallar la media, varianza, asimetra
y curtosis.
Solucin:
Media: Varianza:
Asimetra:
Curtosis:
Pgina 147 de 177
Tabla de la Distribucin Poisson:
Al igual que la distribucin Binomial, la distribucin Poisson tiene una tabla que simplifica los clculos.
Ejemplo No 109:
Para = 2, Hallar P(X = 0) y P(X = 2)
Solucin:
a-) Para P(X = 0) = 0,1353
b-) Para P(X = 2) = 0,2707
Ejemplo No 109:
Para = 1,5 Hallar P(X = 2) y P(X = 5)
Solucin:
a-) Para P(X = 2) = 0,2510
b-) Para P(X = 5) = 0,0141
Pgina 148 de 177
Pgina 149 de 177
Leccin 33: Distribucin Binomial Negativa.
DISTRIBUCIN BINOMIAL NEGATIVA.
Con los principios de distribucin Binomial y sus propiedades, excepto que los ensayos se repiten hasta
obtener un nmero fijo de xitos. Para el caso de la Binomial Negativa el inters est en hallar la probabilidad
de que ocurra el k-eximo xito en el x-eximo ensayo. Experimentos de est tipo se conoce como experimento
Binomial negativo o distribucin de tiempo de espera Binomial o distribuciones de pascal.
Casos de Este Tipo:
-)La probabilidad de que el sexto paciente expuesto a una enfermedad, sea el segundo en adquirirla.
-) La probabilidad de identificar el tercer retraso de llegada al trabajo de los ltimos 30 das.
-) La probabilidad de que el sptimo paciente presente alivio, sea el doceavo paciente que recibe el
medicamento.
As que el k-eximo xito va a ocurrir en el x-eximo ensayo.
DEFINICIN: Sea X una variable aleatoria, se considera Binomial Negativa, si y solo si, su distribucin de
probabilidad esta dada por la siguiente expresin:
( ) (
)
Para x = K, K + 1, K + 2,
En este tipo de distribucin, los ensayos son independientes y repetidos, las repeticiones se hacen hasta
obtener xito.
Propiedades:
Media:
De otra forma:
Varianza:
) De otra manera:
Ejemplo No 101:
Al lanzar 3 monedas Cul es la probabilidad de obtener slo caras o slo sellos por segunda vez en el quinto
lanzamiento?
Solucin:
Segn los datos del problema: x = 5, K = 2, p = 1/4 (En el primer lanzamiento hay 2 posibilidades y en el
segundo lanzamiento otras dos posibilidades). Entonces:
( ) (
) (
) (
) (
La probabilidad de obtener solo caras o solo sellos por segunda vez en el quinto lanzamiento, es del 10,55%
Ejemplo No 102:
La probabilidad de que un nio expuesto a una enfermedad, la contenga es del 0,4 Cul es la probabilidad de
que el decimo nio expuesto, sea el tercero en contraerla?
Pgina 150 de 177
Solucin:
Segn los datos del problema: x = 10, K = 3, p = 0,4. Entonces:
( ) (
) ()
()
()()
La probabilidad de que el decimo nio expuesto, sea el tercero en contraerla es del 6,43%
Ejemplo No 103:
En el cobro de penaltis un jugador falla en el 5% de veces. Cual es la probabilidad de que falle por segunda
vez al cobrar 15 penaltis?
Solucin:
Segn los datos del problema: x = 15, K = 2, p = 0,05. Entonces:
( ) (
) ()
()
()()
La probabilidad de que el jugador falle por segunda vez al cobrar 15 penaltis es del 1,796%
Ejemplo No 104:
Para los ejemplos del nio expuesto a la enfermedad (ejemplo No 102 y No 103) Hallar la media y la varianza.
Solucin:
a-) Media:
Varianza:
)
b-) Media:
Varianza:
)
Leccin 34: Distribucin Geomtrica e Hipergeomtrica.
DISTRIBUCIN GEOMTRICA.
Cuando se analiza la distribucin Binomial Negativa, se observa que K toma valores positivos mayores que uno
(K > 1), pero existen fenmenos donde la Binomial Negativa tiene K = 1; es decir, son casos donde se tienen
una distribucin de probabilidad para el cual nmero de eventos requeridos donde se obtiene Un Solo xito,
como es el caso de lanzar una moneda hasta obtener cara.
DEFINICIN: Sea X una variable aleatoria discreta, se considera variable aleatoria geomtrica, si y solo si, su
distribucin de probabilidad est dada por la siguiente expresin.
( )
Para x = 1, 2, 3, Donde q = 1 p
En esta distribucin de probabilidad, se caracteriza por las siguientes razones:
-El proceso consta de un nmero no definido de pruebas o experimentos separados o separables. El proceso
concluir cuando se obtenga por primera vez el resultado deseado (xito).
-Cada prueba puede dar dos resultados mutuamente excluyentes: A y no A
Pgina 151 de 177
-La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no A es q, siendo
(p + q = 1).
-Las probabilidades p y q son constantes en todas las pruebas, por tanto, las pruebas, son independientes.
Este es un proceso tpico con reemplazamiento.
Propiedades:
Media:
Varianza:
Ejemplo No 110:
En una ciudad capitalina la probabilidad de que un ciudadano adquiera su licencia de conduccin en un solo
ensayo es del 75% Cul es la probabilidad de que un solicitante obtenga su licencia de conduccin en el
cuarto ensayo?
Solucin:
Los datos: x = 4, p = 0,75 Entonces:
( ) ( ) ()(
) ()(
)
La probabilidad de que el solicitante obtenga su licencia de conduccin en el cuarto ensayo es del 1,171%
Ejemplo No 111:
En un proceso de fabricacin se ha establecido que de cada 200 artculos, 3 son defectuosos. Cul es la
probabilidad de que el sexto artculo de los inspeccionados sea el primero defectuoso?
Solucin:
Segn el planteamiento: x =6, p = 3/200 = 0,015 Entonces:
( ) ( ) ()(
)
La probabilidad de que el sexto artculo de los inspeccionados sea el primero defectuoso es del 1,39%
Ejemplo No 112:
La probabilidad de que un estudiante apruebe un examen escrito para obtener una certificacin de
competencias es de 0,70. Cul es la probabilidad de que un estudiante apruebe el examen:
a-) En el tercer intento
b-) Antes del cuarto intento
Solucin:
a-) Segn el planteamiento: x =3, p = 0,70 Entonces:
( ) ( ) ()(
)
La probabilidad de que un estudiante apruebe el examen en el tercer intento es de 6,3%
b-) P(X < 4) Entonces: P(X < 4) = P(X = 1) + P(X = 2) + P(X = 3)
() ()(
)
() ()(
)
() ()(
)
( )
La probabilidad de que un estudiante apruebe el examen antes del cuarto intento es de 97,30%
Pgina 152 de 177
DISTRIBUCIN HIPERGEOMTRICA.
En los principios de probabilidad de analiz el muestreo con reemplazamiento y sin reemplazamiento, que
ilustran la regla dela multiplicacin para eventos independientes y dependientes respectivamente. Ahora nos
ocuparemos en buscar una ecuacin anloga a la Distribucin Binomial, pero que sea vlida para el muestreo
sin reemplazamiento, donde los ensayos no son independientes.
Considerando un conjunto de N elementos de los cuales M son considerados como xitos y N M como
fracasos, el inters es hallar la probabilidad de obtener x xitos en n ensayos, de los N elementos del conjunto.
La distribucin hipergeomtrica es til en fenmenos donde el nmero de elementos de la poblacin es
pequeo respecto al tamao de la muestra (n/N 0,05). Entonces la probabilidad de un xito en un ensayo
dado, depende de los resultados de los ensayos anteriores, as la distribucin de x xitos sigue una distribucin
hipergeomtrica.
DEFINICIN: Sea N el nmero total de observaciones de una poblacin finita, de tal manera que K de las
observaciones son de un tipo y N K de las observaciones de otro tipo. Si elegimos una muestra aleatoria de
tamao n, la probabilidad de que la variable aleatoria X sea de un tipo y n K sea de otro tipo, est dada por
la funcin de probabilidad segn la siguiente expresin:
( )
(
)(
)
(
)
Para x = 0, 1, 2, , n. x K; (n x) (N K) y N, n, K Z
+
Los parmetros de esta distribucin son: N, n, K. La hipergeomtrica es my utilizada en Control de Calidad y
aceptacin de muestreo. El tamao de la poblacin es pequea, respecto al tamao de la muestra. La
probabilidad en cada evento cambia.
Propiedades:
Media: (
) Varianza:
()()
()
()
()
()
Asimetra:
()()()
()()()
Curtosis: K
()()
()()()()
Ejemplo No 113:
Un producto industrial es envasado en lotes de 20 unidades, el plan de muestreo consiste en tomar 5 unidades
de cada lote y rechazar si se observa ms de una unidad defectuosa. Si en un lote hay 4 unidades
defectuosas Cul es la probabilidad de que el lote sea aceptado?
Solucin:
Para que el lote sea aceptado se debe cumplir: P(X 1). Donde: N = 20, n = 5, K = 4. Entonces:
( ) ( ) ( )
( )
(
) (
)
(
) (
)
(
( )
(
) (
)
(
) (
)
(
Pgina 153 de 177
( ) ( ) ( )
La probabilidad de que el lote sea aceptado, en las condiciones dadas es del 75,12%
Ejemplo No 114:
Hallar las propiedades del producto industrial envasado en lotes de 20 unidades (Ejemplo No 113)
Solucin:
Media: (
) (
)
Varianza:
()()
()
Asimetra:
()()()
()()()
Curtosis: K
()()
()()()()
Ejemplo No 115:
Una poblacin consta de 12 unidades, sea X el nmero de xitos en una muestra de 4 unidades, si de un lote 8
son xitos Cul es la probabilidad de no obtener xito en la muestra?
Solucin:
Del problema: N = 12, n = 4, K = 8. Entonces: P(X = 0)
( )
(
) (
)
(
) (
)
(
La probabilidad de no obtener xito en la muestra es del 0,202%
Ejemplo No 116:
Del ejercicio sobre la poblacin que consta de 12 unidades, (Ejemplo No 115).
a-) Cual es la probabilidad de obtener exactamente 2 xitos.
b-) Cual es la probabilidad de que por lo menos 2 sean xito.
Solucin:
Del problema: N = 12, n = 4, K = 8. Entonces:
a-)
( )
(
) (
)
(
) (
)
(
La probabilidad de obtener exactamente dos xitos es del 33,94%
b-) P(X 2) = 1 P(X < 2) = 1 {P(X =0) + P(X =1)}
( )
(
) (
)
(
) (
)
(
( )
(
) (
)
(
) (
)
(
( ) ( )
Pgina 154 de 177
La probabilidad de que por lo menos 2 sean xito, es del 93,334%
CAPTULO 9: DISTRIBUCIONES DE PROBABILIDAD
CONTINUA
Leccin 35: Distribucin uniforme continua
La distribucin uniforme continua es la ms sencilla de estas distribuciones, la variable aleatoria toma el mismo
valor en un intervalo finito. LA Funcin de densidad de probabilidad de la variable aleatoria es uniforme sobre el
intervalo de definicin.
DEFINICIN: Una variable aleatoria X tiene una distribucin uniforme continua en el intervalo [ ], se conoce
como variable aleatoria uniforme continua, si y solo si, su funcin de densidad est dada por la siguiente
expresin:
Donde
Esta distribucin se simboliza:
Funcin de distribucin: La funcin de distribucin acumulada esta dada por:
Propiedades:
Media: []
Veamos la demostracin:
[] ()
( )
( )
[]
( )
( )( )
( )
Varianza: []
()
Pgina 155 de 177
Veamos la demostracin:
Primero hallamos: [
()
[
()
[] [
] ([])
( )
(
( )
[]
( )
( )
( )
Leccin 36: Distribucin normal y sus aplicaciones.
Es una de las distribuciones de probabilidad ms importantes en todo el campo de la estadstica ya que gran
parte de la teora estadstica y de probabilidad que se ha construido y de las distintas tcnicas estadsticas para
el anlisis de datos que se aplica en la actualidad se fundamenta en esta distribucin; en especial, juega un
papel clave en el desarrollo de la inferencia estadstica, pues muchas de las herramientas usadas en la toma
de decisiones o en las pruebas de hiptesis, tienen su fundamento en la distribucin normal.
Un gran nmero de estudios pueden ser aproximados usando una distribucin normal:
Algunas variables fsicas datos meteorolgicos (temperatura, precipitaciones, presin atmosfrica, etc.).
Caracteres morfolgicos de individuos (personas, animales o plantas) o mediciones en organismos vivos.
Caracteres sociolgicos, por ejemplo, consumo de ciertos productos por individuos de un mismo grupo.
Notas o puntajes en pruebas de admisin o de aptitud.
Errores en instrumentacin.
Proporciones de errores en diversos procesos, etc.
2
(o desviacin
in de densidad viene dada por la siguiente expresin matemtica:
Pgina 156 de 177
< < =
|
.
|
\
|
x - ,
. 2
1
) , f(x,
2
x
2
1
2
e
o
( )
2
, N X~
Donde,
e = base de los logaritmos naturales = 2,71828
Su grfica, denominada curva normal, tiene forma de campana, tal como se muestra a continuacin.
Al dar a la funcin los valores de , o
2
y valores a x, obtendremos la distribucin en cuestin, la que tiene
forma de campana, por lo que tambin se le conoce como campana de Gauss. Hay un nmero infinito de
funciones de densidad Normal, una para cada combinacin de y o. La media mide la ubicacin de la
distribucin y la desviacin estndar o mide su dispersin. De esta manera, podemos tener distribuciones con
distintas medias pero con la misma medida de variacin, o distribuciones con la misma media pero con
distintas variaciones o, simplemente distribuciones con distintas medias y distintas variaciones, tal como se
observa en los siguientes grficos:
Algunas caractersticas especiales de la distribucin normal se enumeran a continuacin:
Pgina 157 de 177
a)
b) Es asinttica con respecto a su eje horizontal; esto quiere decir que jams va a tocar el eje de las equis.
c) El rea total bajo la curva es 1, esto es,
1 dx e
2
1
2
- X
2
1
-
=
|
.
|
\
|
}
f) S sumamos a o, se observar que aproximadamente el 68,26% de los datos se encuentran bajo la
curva, si sumamos a 2o, el 95,44% de los datos estar entre esos lmites y si sumamos a 3o,
entonces el 99,74% de los datos caer dentro de esos lmites. Esta caracterstica es a la vez una forma
emprica y rpida de demostrar si los datos que se analizan tienen una distribucin Normal; ya que para
trabajar los datos con esta distribucin, debe verificarse que efectivamente as se distribuyen, ya que de no
hacerlo, las decisiones que en un momento dado se tomarn de un anlisis de los datos con la distribucin
Normal, seran errneas.
Cmo se determinan probabilidades con la distribucin Normal?
Acuerdo a como se trataron las distribuciones de probabilidad continuas, lo ms lgico es que la funcin f(x,,
o
2
), se integre entre los lmites de la variable x; esto es,
( ) ( )
}
= < < = s s
b
a
2
)dx ; f(x; b X a P b X a P
La integral anterior nos dara el rea bajo la curva de la funcin, desde a hasta b, que corresponde o es igual a
la probabilidad buscada.
Debido a la dificultad que se presenta para integrar esta funcin cada vez que sea necesario, lo que se hace es
tipificar el valor de la variable x, esto es, x se transforma en un valor de z, de la siguiente manera:
Este valor de z es buscado en una tabla donde vienen reas asociadas a este valor, y haciendo uso de los
valores tabulados, se determina la probabilidad requerida. La tabla que es usada para calcular las
probabilidades es la que nos da el rea que se muestra a continuacin:
valor
x
z =
=
o
0
Z
Pgina 158 de 177
Ejemplo 1:
El acero que se utiliza para tuberas de agua a menudo se recubre internamente con un mortero de cemento
para evitar la corrosin. En un estudio de los recubrimientos de mortero de una tubera empleada en un
proyecto de transmisin de agua en California (Transportation Engineering Journal, Noviembre de 1979) se
especific un espesor de 7/16 pulgadas para el mortero. Un gran nmero de mediciones de espesor dieron una
media de 0,635 pulgadas y una desviacin estndar de 0,082 pulgadas. S las mediciones de espesor, tenan
una distribucin Normal, qu porcentaje aproximado fue inferior a 7/16 de pulgada?
Solucin:
x = variable que nos define el espesor del mortero en pulgadas
= 0,635 pulgadas
o = 0,082 pulgadas
p(z = -2.41) = 0.492
p(x < 7/16 pulgadas) = 0.5- p(z = -2.41) = 0.5-0.492 = 0.008
Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor menor de 7/16 pulgadas.
Ejemplo 2:
Un tubo fluorescente estndar tiene una duracin distribuida Normalmente, con una media de 7.000 horas y
una desviacin estndar de 1.000 horas. Un competidor ha inventado un sistema de iluminacin fluorescente
compacto que se puede insertar en los receptculos de lmparas incandescentes. El competidor asegura que
el nuevo tubo compacto tiene una duracin distribuida Normalmente con una media de 7.500 horas y una
desviacin estndar de 1.200 horas.
a. Cul tubo fluorescente tiene mayor probabilidad de tener una duracin mayor de 9.000 horas?
b. Cul tubo tiene mayor probabilidad de tener una duracin de menos de 5.000 horas?
Solucin:
a) Tubo 1
41 2 4085 2
082 0
635 0 4375 0
082 0
635 0 16 7
. .
.
. .
.
. /
Z ~ =
=
X = 7/16
=0.635
Z=
Pgina 159 de 177
X
1
= variable que nos define la duracin en horas de un tubo fluorescente
= 7.000 horas
o = 1.000 horas
Tubo 2
X
2
= variable que nos define la duracin del tubo fluorescente del competidor
= 7.500 horas
o = 1.200 horas
p(z
1
= 2,00) = 0,4772
p(x
1
> 9.000 horas) = 0,5 p(z
1
= 2,00) = 0.5 0.4772 = 0.0228
p(z
2
= 1.25) = 0.3944
p(x
2
> 9,000 horas) = 0.5 p(z
2
= 1.25) = 0.5 0.3944 = 0.1056
Por tanto el tubo fluorescente del competidor tiene una probabilidad mayor de durar ms de 9,000 horas.
b)
00 2
000 1
000 7 000 9
1
.
,
, ,
z =
=
25 1
200 1
500 7 000 9
2
.
,
, ,
z =
=
X= 9000
=7.000
X = 9.000
=7.500
X = 5000
=7000
Pgina 160 de 177
p(z
1
= -2.00) = 0.4772
p(x
1
< 5,000 horas) = 0.5 p(z
1
= -2.00) = 0.5 0.4772 = 0.0228
p(z
2
= -2.08) = 0.4812
p(x
2
< 5,000 horas) = 0.5 p(z
2
= - 2.08) = 0.5 0.4812 = 0.0188
Por tanto, el tubo fluorescente que tiene una mayor probabilidad de durar menos de 5,000 horas es el del
primer fabricante.
Ejemplo
La distribucin de la demanda (en nmero de unidades por unidad de tiempo) de un producto a menudo puede
aproximarse con una distribucin de probabilidad Normal. Por ejemplo, una compaa de comunicacin por
cable ha determinado que el nmero de interruptores terminales de botn solicitados diariamente tiene una
distribucin Normal, con una media de 200 y una desviacin estndar de 50.
a) En qu porcentaje de los das la demanda ser de menos de 90 interruptores?
b) En qu porcentaje de los das la demanda estar entre 225 y 275 interruptores?
c) Con base en consideraciones de costos, la compaa ha determinado que su mejor estrategia consiste en
producir una cantidad de interruptores suficiente para atender plenamente la demanda en 94% de todos los
das. Cuantos interruptores terminales deber producir la compaa cada da?
Solucin:
a) X = variable que nos indica el nmero de interruptores demandados por da a una compaa de cable
= 200 interruptores por da
o = 50 interruptores por da
00 2
000 1
000 7 000 5
1
.
,
, ,
z =
=
08 2
200 1
500 7 000 5
2
.
,
, ,
z =
=
X = 5000
= 7500
X = 90 = 200
Pgina 161 de 177
p(z
= - 2.20) = 0.4861
p(x < 90) = 0.5 p(z = -2.20) = 0.5 0.4861 = 0.0139
Por tanto, 0.0139 x 100% = 1.39% de los das se tendr una demanda menor de 90 interruptores.
b)
p(z
1
= 0.50) = 0.1915
p(z
2
= 1.50) = 0.4332
p(225s x > 275) = p(z
2
) p(z
1
) = 0.4332 0.1915 = 0.2417
Por tanto, 0.2417 x 100% = 24.17% de los das se tendr una demanda entre 225 y 275 interruptores.
d) c) En este caso se trata de determinar que valor toma x cuando se pretende cumplir con el 94% de
la demanda de todos los das.
Por tanto despejaremos de la frmula de z;
20 2
50
200 90
. z =
=
50 0
50
200 225
1
. z =
=
50 1
50
200 275
2
. z =
=
= 200
X
1
= 225
X
2
= 275
= 200
X =
Z
94%
Pgina 162 de 177
; x = + zo
x = + z(p = 0.44)o = 200 + z(p = 0.44)(50) =
= 200 + (1.55)(50) = 277.5 ~ 278 interruptores terminales por da
cmo se obtiene el valor de z?
En la tabla buscamos la z que corresponde a una probabilidad de 0.44 y nos damos cuenta de que no existe un
valor exacto de 0.44 por lo que tomamos los valores de rea ms cercanos; luego,
z(p = 0.4394) = 1.50; z(p = 0.4406) = 1.60
Por tanto si interpolamos, encontramos que el valor de z para una probabilidad de 0.44 es de 1.55, y es el
valor que se sustituye en la ecuacin.
Cul es la razn de usar un rea de 0.44 en lugar de una de 0.94 para buscar en la tabla el valor de z?
Es muy simple, la tabla que estamos usando es una tabla que solo trabaja con reas que son definidas de la
media hasta el valor de x y x puede estar tanto del lado derecho de la media, como del lado izquierdo de la
media, es por esto que el rea a utilizar es de 0.44 que se encuentra al lado derecho de la media.
o
=
x
Z
Pgina 163 de 177
En un examen de matemticas, en el que se ha evaluado de 0 a 20 puntos, el 67% de los alumnos ha obtenido
una puntuacin igual o menor que 12,2 y el 9% ha obtenido puntuacin superior a 16,7. Suponiendo que la
distribucin de las puntuaciones sea normal, calcule su media y su desviacin tpica.
Solucin
Pgina 164 de 177
Los paquetes recibidos en un almacn tienen un peso medio de 300 Kg. y una desviacin tpica de 50 Kg.
Cul es la probabilidad de que 25 de esos paquetes, elegidos al azar, excedan el lmite de carga del
montacargas donde se van a meter, que es de 8200 Kg.?
Solucin
Leccin 37: Distribucin Exponencial.
La distribucin exponencial, como funcin de distribucin de variable continua, tiene una gran utilidad prctica
ya que podemos considerarla como un modelo adecuado para la distribucin de probabilidad del tiempo de
espera entre dos hechos que sigan un proceso de Poisson. De hecho la distribucin exponencial puede
derivarse de un proceso experimental de Poisson con las mismas caractersticas que las que enuncibamos al
estudiar la distribucin de Poisson, pero tomando como variable aleatoria, en este caso, el tiempo que tarda en
producirse un hecho
Obviamente, entonces , la variable aleatoria ser continua. Por otro lado existe una relacin entre el parmetro
a de la distribucin exponencial , que ms tarde aparecer , y el parmetro de intensidad del proceso l , esta
relacin es a = l
Al ser un modelo adecuado para estas situaciones tiene una gran utilidad en los siguientes casos:
Distribucin del tiempo de espera entre sucesos de un proceso de Poisson
Distribucin del tiempo que transcurre hasta que se produce un fallo, si se cumple la condicin que la
probabilidad de producirse un fallo en un instante no depende del tiempo transcurrido .Aplicaciones en
fiabilidad y teora de la supervivencia.
Pgina 165 de 177
Funcin de densidad.
A pesar de lo dicho sobre que la distribucin exponencial puede derivarse de un proceso de Poisson , vamos a
definirla a partir de la especificacin de su funcin de densidad:
DEFINICIN: Dada una variable aleatoria X que tome valores reales no negativos {x > 0} diremos que tiene
una distribucin exponencial de parmetro a con a > 0, si y slo si su funcin de densidad tiene la expresin:
()
Varianza: ()
La distribucin exponencial es un caso particular de distribucin gamma con k = 1. Adems la suma de
variables aleatorias que siguen una misma distribucin exponencial es una variable aleatoria expresable en
trminos de la distribucin gamma.
Ejemplo: El tiempo durante el cual cierta marca de batera trabaja en forma efectiva hasta que falle (tiempo de
falla) se distribuye segn el modelo exponencial con un tiempo promedio de fallas igual a 360 das.
- a) qu probabilidad hay que el tiempo de falla sea mayor que 400 das?.
- b) Si una de estas bateras ha trabajado ya 400 das, qu probabilidad hay que trabaja ms de 200 das
ms?
- c) Si se estn usando 5 de tales bateras calcular la probabilidad de que ms de dos de ellas continen
trabajando despus de 360 das.
Solucin
Sea X=el tiempo que trabaja la batera hasta que falle. El tiempo promedio de falla es de 360 das. Entonces, X
~Exp (=1/360) y su funcin de densidad es:
Pgina 167 de 177
EJEMPLO: Suponga que la vida de cierto tipo de tubos electrnicos tiene una distribucin exponencial con vida
media de 500 horas. Si X representa la vida del tubo (tiempo q dura el tubo).
- a) Hallar la probabilidad que se queme antes de las 300 horas.
- b) Cul es la probabilidad que dure por lo menos 300 horas?
- c) Si un tubo particular ha durado 300 horas. cal es la probabilidad de que dure otras 400 horas?
Solucin
Los dos ejemplos fueron tomados de:http://www.monografias.com/trabajos84/distribucion-exponencial/distribucion-
exponencial.shtml. Tomado 19 Julio 2012
Pgina 168 de 177
Leccin 38: Distribucin Weibull.
La tecnologa actual nos permite disear muchos sistemas complicados cuya operacin, o quiz seguridad,
depende de le confiabilidad de los diversos componentes que conforman los sistemas. Por ejemplo, un fusible
puede quemarse, una columna de acero puede torcerse. Componentes idnticos sujetos a idnticas
condiciones ambientales fallaran en momentos diferentes.
Se tiene un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un mecanismo
falla, etc. La funcin de densidad de este modelo viene dada por:
Los parmetros de la funcin son: > 0 y > 0, donde es un parmetro de escala y es un parmetro de
forma.
La funcin de distribucin acumulada se obtiene por la integracin de la funcin de densidad y se define de la
siguiente manera:
Grafica de la Funcin de Densidad Grafica de la Funcin acumulada
Propiedades:
Media: () (
)
Pgina 169 de 177
Varianza: ()
* (
)+
Asimetra:
Curtosis:
Donde: .
Al igual que la distribucin gamma y la exponencial, la distribucin de weibull tambin se aplica a problemas de
confiabilidad y de vida como los de tiempo de antes del fallo o la vida de un componente que se mide desde
algn tiempo especifico hasta que falla .
Ejemplo
El tiempo de vida x, en horas , de un artculo en el taller mecnico tiene una distribucin de Weibull con
=0.01 y =2 cul es la probabilidad de que falle antes de ocho horas de uso.
Solucin:
P(x<8)=f(8)=1- e(0.01 )8 =1-0.527=0.473
Leccin 39: Distribucin Jicuadrado
La (distribucin ji) o tambin llamada distribucin chi - cuadrada es un caso especial de la distribucin gamma
esta tiene muchas aplicaciones como los temas que se tratan de muestreo, anlisis de varianza y estadstica
no paramtrica
La familia de distribuciones Chi-cuadrado (_
2
) es una distribucin unimodal con asimetra positiva.
Esta caracterizada por un parmetro llamado grados de libertad (gl).
La media en esta familia es igual a gl.
La varianza es igual a 2 veces la media.
Representa la distribucin de la suma de los cuadrados de n variables aleatorias independientes
normalmente distribuidas.
La variable aleatoria continua x tiene una distribucin j-i cuadrada, con v grados de libertad, si su funcin de
densidad est dada por :
para x >0
n 0, en cualquier otro caso
Pgina 170 de 177
Donde v es un entero positivo.
Grafica de la Funcin Chi Cuadrado:
Funcin de densidad de Probabilidad Funcin de distribucin Acumulada
Se puede ver una Ji Cuadrado con 5 grados de libertad.
Propiedades:
La media: =
La Varianza:
2
= 2
Donde son los grados de libertad.
Chi-cuadrado(gl=5)
0,00
0,05
0,10
0,15
0,20
0 5 10 15 20
Pgina 171 de 177
Ejemplo:
Encontrar la P(c
2
>4.11 ; gl=3)=0.25
Encontrar c
2
* tal que P(c
2
> c
2
* ; gl=5)=0.05
c
2
*=11.07
Ejemplo:
Cul es la distribucin de probabilidad de chi cuadrado de 4 grados de libertad de que x<1.2
Solucin:
Segn la tabla en la columna 4y la fila de 1.2 tenemos
P(x/<1.2)=0.121901
Leccin 40: Distribucin t-student.
En Estadstica y Probabilidad, existe una distribucin creada por William Gosset, estadstico Britnico, quien en
sus investigaciones, desarroll la distribucin llamada con el seudnimo t Student, la cual surge del problema
de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.
Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos
medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos
poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de
los datos de una muestra.
Entre sus caractersticas se tiene:
Es una familia de distribuciones con forma de campana, Simtrica y Unimodal.
En esta familia de distribuciones la media es 0.
Se obtiene por el cociente entre la normal y la raz cuadrada de una
Pgina 172 de 177
La desviacin estndar depende de un parmetro denominado grados de libertad.
Ejemplo:
Cul es la probabilidad acumulada de que una distribucin t student con 9 grados de libertad, de que x < 0,25.
Solucin:
Segn el planteamiento: P (t
9
< 0,25). Entonces buscando en la tabla: Columna 9 y fila con 0,25, se obtiene:
P (t
9
< 0,25) = 0,596
t de Student (g.l.= 10)
0,00
0,15
0,30
0,45
-3,50 -1,75 0,00 1,75 3,50
Pgina 173 de 177
Ejemplo:
Encontrar la P (t > 0,82; gl=2)
Solucin:
En la tabla se observa que: P (t > 0,82; gl=2)=0.25
Ejemplo:
Encontrar t* tal que P(t >t* ; gl=8)=0.05
Solucin:
Encontrar t* tal que P (t > 1,86; gl = 8) = 0.05, as que t = 1,86
Leccin 41: Distribucin de F-Fisher
Existen ciertas situaciones donde se requiere comparar el comportamiento de dos poblaciones, por medio de la
varianza, casos como identificar la precisin de un instrumento de medicin con la de otro, la estabilidad de un
proceso de manufactura contra otro, la calificacin de docente contra otro y muchas situaciones ms.
Pgina 174 de 177
La comparacin de varianzas son un tema importante en la inferencia estadstica y en estudios de muestreo,
de esto surge una distribucin fundamental en estadstica: Distribucin de Fisher o Distribucin de Fisher
Snedecor.
Intuitivamente, cuando el cociente entre las dos varianzas
+(
)
(
)(
)(
)
(
)
Propiedades:
La media:
Para
2
> 2
La Varianza:
)
Para
2
> 4
Donde son los grados de libertad.
Grafica de la Distribucin Fisher:
Tabla de la Distribucin Fisher:
Para cada nivel de significancia (), se da los grados de libertad del numerador en la primera fila y los grados
de libertad del denominador en la primera columna, la interseccin es el valor de la distribucin.
Pgina 175 de 177
Ejemplo:
Hallar el valor de la distribucin F para los siguientes casos:
a-) El rea a la derecha de F para = 0,25 si
1
= 4 y
2
= 9.
Solucin: Como el rea que da la tabla es desde cero a un valor dado de Fisher, se tiene que localizar primero
los grados de libertad del denominador que son 9, luego un rea de 0.75 con 4 grados de libertad del
numerador.
b-) El rea a la izquierda de F para = 0,95 si
1
= 15 y
2
= 10.
Solucin: En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos grados de
libertad. 15 y 10, para = 0,95
c-) El rea a la derecha de F para = 0,95 si
1
= 6 y
2
= 8.
Pgina 176 de 177
Solucin: Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F de
0.95.
d-) El rea a la izquierda de F para = 0,10 si
1
= 24 y
2
= 24.
Solucin: Se busca directamente el rea de 0.10, con sus respectivos grados de libertad, 24 y 24 para
numerador y denominador.
Pgina 177 de 177
BIBLIOGRAFA
BEJARANO BARRERA, Hernn (1995). Estadstica Descriptiva. Santa fe de Bogot: UNISUR.
CHRISTENSEN, Howard B. (1999). Estadstica Paso a Paso. Mxico: Editorial Trillas.
MARTNEZ BENCARDINO, Ciro (2004). Estadstica Bsica Aplicada. Santa fe de Bogot: ECOE Ediciones.
MARTNEZ BENCARDINO, Ciro (2003). Estadstica y Muestreo. Santa fe de Bogot: ECOE Ediciones.
MILTON, J. Susan (1999). Estadstica para biologa y ciencias de la salud. Madrid: McGraw Hill
Interamericana.
PORTUS GOVINDEN, Lincoyn (2001). Introduccin a la Estadstica. Segunda edicin. Santa fe de Bogot.
McGraw Hill.
PORTILLA CHIMAL, Enrique (1980). Estadstica, Primer Curso. Bogot: Nueva Editorial Interamericana.
SPIEGEL, Murria R. (1991). Estadstica. Serie de compendios Schaum. Mxico: McGraw Hill.
SMITH, A. Stanley. (1992). Curso de Estadstica Elemental para las ciencias aplicadas. Primera edicin. Santa
fe de Bogot. Editorial Addison Wesley Iberoamericana.
CIBERGRAFIA
http://www.liccom.edu.uy/bedelia/cursos/metodos/material/estadistica/med_disp.html
http://www.tuveras.com/estadistica/estadistica02.htm
http://www.universidadabierta.edu.mx/SerEst/MAP/METODOS%20CUANTITATIVOS/Pye/tema_12.htm
http://www.uv.es/ceaces/base/modelos%20de%20probabilidad/exponencial.htm. Tomado Julio 19 2012
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03c.html. Tomado Julio 23 de 2012
http://html.rincondelvago.com/distribuciones-de-probabilidad_1.html. Tomado Julio 23 de 2012
http://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci%C3%B3n_t_de_Student
Tomado Julio 25 de 2012