Académique Documents
Professionnel Documents
Culture Documents
PROGRAMA MIAGE
SEMESTRE: 2007
2007-I
CICLO: IV
IV
ESTADÍSTICAS Y
PROBABILIDADES I - MIAGE
MIAGE
RECTOR:
Ing. Raúl Bao García
VICERRECTOR:
Ing. Raúl Bao García
OFICINA DE PLANIFICACIÓN
Ing. Oscar Becerra Tresiera
CONSORCIO E-MIAGE:
PRÉSIDENT:
Gérald Guillaumet
Impreso en Lima
MARZO 2007
ÍNDICE DE CONTENIDO:
VI – ENUMERACIONES: ................................................... 46
Sección I: Conocimientos previos .................................... 46
Sección II: p-listas ................................................ 47
Sección III: Ordenamientos y permutaciones .......................... 48
Sección IV: Combinaciones ........................................... 50
Sección V: Criterios y principios a conocer ......................... 52
Sección VI: Coeficientes binomiales ................................. 53
BIBLIOGRAFÍA: ......................................................... 76
Los principales términos del vocabulario estadístico son fijados en Francia por la norma NF X05-
001. Revisemos los principales elementos de la terminología estadística:
1.1- POPULACIÓN: conjunto sobre el cual se hace el estudio estadístico y que contiene un gran
número de elementos. En general, el estudio es efectuado sobre un extracto de la populación
llamada MUESTRA.
Ejemplo: se desea medir el diámetro de los granos de arena de una playa. Como el número de
granos de arena es muy elevado y medir el diámetro de todos los granos es imposible, se toma
una muestra de 1000 granos de arena sobre los cuales se efectuará las medidas de diámetro.
1.3.2- los caracteres CUALITATIVOS: naturalmente no son expresados por números. Para
poder utilizar estos caracteres, hay que atribuir valores (numéricos o no) con la ayuda de un
código.
Ejemplo: situación familiar (soltero = 1, casado = 2, viudo = 3, divorciado = 4); profesión (código
INSEE)
1.5- SERIE ESTADÍSTICA: conjunto de pares (x, n) donde x representa un valor fijo del carácter y
n el correspondiente efectivo.
Ejemplo: de 100 familias, se observa 12 familias con 0 hijos, 26 familias con 1 hijo, 20 familias con
2 hijos, 15 familias con 3 hijos, 14 familias con 4 hijos, 9 familias con 5 hijos y 4 familias con 6
hijos. La serie estadística correspondiente a esta situación es: (12, 0) (26, 1) (20, 2) (15, 3) (14, 4)
(9, 5) (4, 6).
2.1- Ejemplo 1:
CANDIDATOS xi 1 2 3 4 5 6
Número de votos ni 33 521 21 775 19 496 15 752 2 812 1 285
Ya que el carácter es discreto, se puede designar sus valores por xi donde i varía del 1 al 6. De
la misma forma designaremos los valores del efectivo por ni . Aquí el índice i enumera las
casillas de la precedente tabla y se utiliza fácilmente: para x3 = 3 , tenemos n3 = 19 496 .
Cuando se desea hacer estudios comparativos, se utiliza, en lugar del efectivo, la FRECUENCIA
que es definida por:
ni
fi =
N
CANDIDATOS xi 1 2 3 4 5 6
Frecuencias f i 0,354 0,230 0,206 0,166 0,030 0,014
Como se puede verificar en la precedente tabla, la suma de todas las frecuencias es igual a 1; así
tenemos:
6
n1 n2 n3 n4 n5 n6 N
∑f
i =1
i = f1 + f 2 + f 3 + f 4 + f5 + f 6 = + + + + + = =1
N N N N N N N
luego:
6
∑f
i =1
i =1
Nota: Las frecuencias permiten obtener porcentajes: Así, con una simple lectura de la tabla
precedente, vemos que el candidato número 4 ha obtenido 16,6% de los votos.
2.2- Ejemplo 2:
Notas del oral en geometría analítica de 280 candidatos admisibles en la Escuela Central en 1950.
Aquí el carácter es la nota obtenida (entre 0 y 20): por lo tanto sus valores son cualquier número
comprendido entre 0 y 20 (por ejemplo 14,8745632). Se trata de un carácter continuo. Para
comodidad del estudio, se dividirá entonces el intervalo de variación del carácter en CLASES:
a ≤ x ≺ b donde x ∈ [ a; b[
Nota 2: cuando las clases tienen una misma amplitud – que es nuestro caso – se puede convenir
de designar cada una de ellas por su CENTRO:
clase [ a; b[ centro = ( a + b ) 2
NOTAS SOBRE 20 ( xi ) 7 9 11 13 15 17 19
Esta convención permite reemplazar una serie estadística de carácter continuo por una serie
estadística de carácter discreto.
Clases de amplitud 6:
xi 5 11 17
ni 1 100 179
Procediendo así, evidentemente se pierde en precisión mientras que se gana en simplificación.
2.3- Ejemplo 3:
Superficie de [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha.( xi ) más
Número de 149 229 411 470 530 373 74 747 16 702 3 523
explotaciones ( ni ) 723 574 265 736 048 810
Frecuencias ( fi ) 0,066 0,102 0,182 0,208 0,235 0,165 0,033 0,007 0,002
Nota 1: Por razones de presentación, las clases no tienen la misma amplitud. Se evitará, en la
medida de lo posible, presentar directamente una clase por su centro, sin dar indicaciones
complementarias.
Posiblemente se deba buscar, por ejemplo, el número y porcentaje de las explotaciones que
tengan una superficie inferior a 50 ha. Por lo tanto, se tiene interés por utilizar la noción de
EFECTIVO ACUMULADO ó FRECUENCIA ACUMULADA.
∑n
i =1
i ∑f
i =1
i
Efectivo acumulado ( ni ) 149 379 790 1 261 1 791 2 165 2 239 2 256 2 260
723 297 562 325 373 183 930 632 155
Frecuencia acumulada ( fi ) 0,066 0,168 0,350 0,558 0,793 0,958 0,991 0,998 1
La precedente tabla permite responde a la pregunta formulada: 2 165 183 explotaciones (o sea
95,8%) tienen menos de 50 ha.
Nota 2: Al extremo final de la tabla (última clase), el efectivo acumulado corresponde al efectivo
total y la frecuencia acumulada corresponde a 1 (o sea 100%).
Nota 3: Sin precisión suplementaria, efectivo y frecuencia acumulados son considerados como
CRECIENTES. También se puede utilizar efectivos y frecuencias acumulados DECRECIENTES:
Superficie de las [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha. ( xi ) más
Efectivo acumulado 2 260 2 110 1 880 1 469 998 468 94 972 20 225 3 523
decreciente ( ni ) 155 432 858 593 830 782
Frecuencia acumulada 1 0,934 0,832 0,650 0,442 0,207 0,042 0,009 0,002
decreciente ( f i )
Esta disposición permite ver, por ejemplo, que 1 880 058 explotaciones (o sea 83,20%) tienen 2
ha. y más.
2.4- Ejemplo 4:
Populación de 142 niños del sexo masculino de un jardín, en el cual se ha tomado el peso y la
edad de los niños:
[15,20[ 32 21 12 65
[20,25[ 3 18 28 49
[25,30[ 0 0 1 1
frecuencia
representa cada par ( xi , ni ) – donde xi es un valor del
Efectivo
carácter y ni el correspondiente efectivo – por un punto de
abscisa xi y de ordenada ni .
ó ni fi Punto
En lugar del efectivo, evidentemente se puede tomar la
frecuencia.
Así se obtiene un diagrama cartesiano. Barra
CANDIDATOS ( xi ) 1 2 3 4 5 6
Número de votos ( ni ) 33 521 21 775 19 496 15 752 2 812 1 285
40000
35000
30000
Número de votos
25000
20000
15000
10000
5000
0
1 2 3 4 5 6
Candidatos
Prof. Philippe Gollotte Página 10 de 76 Estadísticas y Probabilidades I - Miage
1.2- Ejemplo 2:
Obtenemos el siguiente diagrama de barras. La línea cortada que une todos los vértices de las
barras se llama POLÍGONO DE LOS EFECTIVOS, si las alturas de las barras corresponden a los
efectivos; o al POLIGONO DE FRECUENCIAS, si las alturas de las barras corresponden a las
frecuencias.
120
100
Polígono de
los efectivos
80
Efectivo
60
40
20
0
7 9 11 13 15 17 19
Notas de oral
Cuando el carácter es continuo, en realidad hay una infinidad de pares (x, f) y el polígono de las
frecuencias se vuelve una curva continua llamada CURVA DE LAS FRECUENCIAS, cuya forma
general es la siguiente:
Frecuencia
Curva de
frecuencia
Carácter
Prof. Philippe Gollotte Página 11 de 76 Estadísticas y Probabilidades I - Miage
Sección II: Histogramas
Los histogramas son utilizados en el caso de caracteres continuos: sobre el eje de las abscisas,
las clases reemplazan valores aislados del carácter y, por ello, las barras son reemplazas por
rectángulos.
120
100
80
Efectivo
60
40
20
0
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Notas de oral
Ya que la altura de los rectángulos es proporcional al correspondiente efectivo, y ya que las
amplitudes de las clases son iguales, el área total del histograma es proporcional al efectivo total.
El polígono de los efectivos (o de las frecuencias) se obtiene uniendo los puntos medios del lado
superior de cada rectángulo. Por convención, se comienza en cero y se termina en cero como se
indica en la precedente figura. Con esta convención esta claro que:
Ahora examinemos el siguiente caso importante, donde las amplitudes de las clases son
desiguales. Entonces, habrá que seguir la siguiente regla:
0,7
0,6
0,5 0,5 A
0,4 0,4
Frecuencias
Frecuencias
0,3 0,3
A1
0,2 0,2
A2
0,1 0,1
A3
0 0
6 8 10 12 14 16 18 20 6 8 10 14 20
Notas sobre 20 Notas sobre 20
En la gráfica anterior (gráfica de la derecha), aunque las clases sean de amplitud diferente, los
rectángulos que las representan tienen mismo ancho. El objetivo de tal representación es
asegurar que las áreas de los rectángulos sean proporcionales a las frecuencias que representan.
Para ilustrarlo, veamos el siguiente ejemplo:
0,5
Área rectángulo blanco:
1cm × 3 cm = 3 cm 2
0,4
CARÁCTER ( xi ) [1;2[ [2;4[
Frecuencias
xi 0 1 2 3 4 5 6 7
ni 4 3 8 7 4 3 0 1
Efectivo acumulado 4 7 15 22 26 29 29 30
Si se traza la curva del efectivo acumulado en función del carácter, se obtiene la siguiente curva
“en escalera”:
30
Efectivo acumulado
25
20
15
10
5
0 1 2 3 4 5 6 7
La forma de esta curva se debe al hecho de que cuando el carácter pasa por uno de sus valores
discretos, el efectivo acumulado pasa bruscamente de un valor al siguiente, luego se queda fijo
hasta su próximo salto.
El efectivo acumulado al inicio de una clase, por lo general no es el mismo al final. Se considera
que al interior de una misma clase, el efectivo acumulado es una función lineal del carácter. Así se
obtiene un POLÍGONO ACUMULATIVO compuesto por segmentos de recta.
300
280
250
Polígono
acumulativo
efectivo acumulado
200
150
100
50
0 6 8 10 12 14 16 18 20
carácter
1ó
efectivo total
Curva
acumulativa
Carácter
1982
1983
MARZO ABRIL
1984
MAYO
FEBRERO
ENERO
JUNIO
Declaraciones
mensuales
5 10 15 20 25 30 (en miles)
DICIEMBRE
JULIO
NOVIEMBRE
AGOSTO
OCTUBRE
SEPTIEMBRE
Los diagramas de sectores son utilizados para poner en evidencia la importancia relativa de los
efectivos. El diagrama se parece a una torta cuyas partes son tales que el ángulo en el centro es
proporcional al valor del efectivo.
Ejemplo: repartición geográfica de las actividades de una sociedad multinacional:
Gran Bretaña
20%
Rodesia Australia
1% 32%
Europa Continental
2%
África del Sur
4%
Zambia
6%
Un pictograma consiste en representar los efectivos por dibujos más o menos pintorescos, que
dan cualitativamente la importancia relativa de los fenómenos. Evidentemente, en el plano
cuantitativo, son poco precisos.
Ejemplo: Ganado ovino de lana en 1960
AUSTRALIA
153
Ex URSS
133
CHINA 59
NUEVA ZELANDA 49
ARGENTINA 45
INDIA 40
USA 33
= 10 millones de cabezas
TURQUÍA 34
GRAN BRETAÑA 29
En el caso de una doble serie, se puede representar cada par ( x1 , y1 ) por un punto, que dará
como resultado una “nube” de puntos. En general, no se dispone de todos los pares cuando se
trata de un carácter continuo, pero sí de una repartición en clases. En ese caso, se traza para
cada par de clases (en un rectángulo) un número de puntos de forma homogénea igual al efectivo.
[15,20[ 32 21 12 65
[20,25[ 3 18 28 49
[25,30[ 0 0 1 1
35
30
25
20
15
3 4 5 6 x
Sección I: Moda
Llamamos MODA o DOMINANTE al valor x0 del carácter que corresponde al efectivo mayor.
CANDIDATOS ( xi ) 1 2 3 4 5 6
Número de votos ( ni ) 33 521 21 775 19 496 15 752 2 812 1 285
El mayor efectivo es 100, por lo tanto la CLASE MODAL es la clase [14,16[. Se convendrá en
tomar por moda el centro de esta clase: x0 = 15 .
Nota 1: El efectivo de una serie puede presentar varios máximos, relativos o no:
n n n
x x x
serie unimodal serie bimodal serie multimodal
Es evidente que el uso de la moda solo tiene interés para el caso de series unimodales.
Para tomar en cuenta la desigualdad de las amplitudes de las clases, los efectivos a considerar
son: 1;8; 92 = 46;179 =59,67 . Se deduce que la moda es xo = 17 .
2 3
Se llama mediana al valor del carácter que divide la serie estadística, en dos series de efectivos
iguales. Así, la mediana corresponde al valor xm para el cual la frecuencia acumulada vale 1/2.
f f acumulada
A1 = A2
1
½
A1 A2
xm x
xm x
Indiquemos cómo en la práctica se determina la mediana.
12 12
la mediana es xm = 4
7+1
14 14
Superficie de [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha. más
( xi )
Número de 149 229 411 470 530 373 74 747 16 702 3 523
explotaciones ( ni ) 723 574 265 736 048 810
Efectivo acumulado 149 379 790 1 261 1 791 2 165 2 239 930 2 239 930 2 260
723 297 562 325 373 183 155
El efectivo mitad es 2 260 155/2 = 1 130 077,5 lo que demuestra que la CLASE MEDIANA (o
INTERVALO MEDIANO) es la clase [5,10[. Queda por determinar en esta clase la mediana que
es del tipo:
xm = 5 + ∆x ( con 0 ≺ ∆x ≺ 5 )
En consecuencia, la mediana es xm 8, 61
EDAD EN AÑOS ( xi ) [20,25[ [25,30[ [30,35[ [35,40[ [40,45[ [45,50[ [50,55[ [55,60[
Efectivo ( ni ) 9 27 36 45 48 9 3 3
Efectivo acumulado 9 36 72 117 135 144 147 150
creciente
Efectivo acumulado 150 141 114 78 33 15 6 3
decreciente
50
45
A2
40 A1
35
Efectivo
30
25
20
15
10
5
0
20 25 30 35 40 45 50 55 60
xm
Edad
Para obtener la mediana, se puede:
• ya sea trazar el polígono acumulativo creciente: la mediana corresponde a una frecuencia
acumulada creciente de ½
• o trazar el polígono acumulativo decreciente: la mediana corresponde a una frecuencia
acumulada decreciente de ½
• o trazar los dos polígonos acumulativos crecientes y decrecientes: la mediana es la abscisa
de su punto de intersección.
0,9
0,8
0,7
Frecuencias acumuladas
0,6
0,5
0,4
0,3
0,2
0,1
35,3
0
20 25 30 35 40 45 50 55 60
Prof. Philippe Gollotte Página 23 de 76 Estadísticas y Probabilidades I - Miage
Edad
Se puede generalizar la noción de mediana: la mediana permite dividir el efectivo total en dos
efectivos iguales: si a su vez se separa estos efectivos en dos efectivos iguales (conteniendo cada
uno 25% del efectivo total), se obtiene los valores del carácter: Q1, Q2 = xm , Q3. Estos valores
son llamados CUARTILES.
Frecuencia
Frecuencia acumulada
1
0,75
A2 A3
25% 25% 0,5
0,25
A1 A4
25% 25%
0
Q1 xm Q3 carácter Q1 xm Q3 carácter
Igualmente se puede proyectar una división del efectivo en 10 (100) efectivos iguales, cada uno
representando 10% (1%) del efectivo total; los valores correspondientes del carácter son los
DECILES (CENTILES).
Existen diferentes tipos de media. Aquí nos limitaremos a las principales definiciones.
La media aritmética ponderada m de una serie estadística con carácter discreto esta definido por
la relación:
Reemplazando, obtenemos:
n
∑ ni xi n
ni n
m= i =1
=∑ xi = ∑ fi xi
N i =1 n i =1
n
Donde f i es la frecuencia correspondiente al valor del carácter.
m = ∑ fi xi
i =1
NÚMERO DE HIJOS ( xi ) 0 1 2 3 4 5 6 7
Número de mujeres ( ni ) 4 3 8 7 4 3 0 1
Frecuencia ( f i ) 0,13 0,10 0,27 0,23 0,13 0,10 0,00 0,03
A menudo se utilizada otra forma de cálculo que permite simplificaciones. Consiste en emplear
una MEDIA PROVISORIA µ . Se escoge µ , a menudo muy próximo de la media m, por ejemplo
se puede tomar la moda: µ = x0 .
∑ ni xi ∑ ni [µ + ( xi − µ )]
i =1 i =1
∑ ni ( xi − µ )
i =1
m= n
= n
=µ+ n
∑ ni
i =1
∑ ni
i =1
∑ ni
i =1
∑ n ( xi − µ )
i =1
i
m=µ+ n
∑n
i =1
i
xi 0 1 2 3 4 5 6 7
xi − µ −2 −1 0 1 2 3 4 5
ni ( xi − µ ) −8 −3 0 7 8 9 0 5
xi − µ −3 −2 0 4 11,5 31,5
n n
∑ ni xi 4 240 n ∑ n ( xi −µ )
i
740
m= i =1
n
= = 4, 24 m = ∑ fi xi = 4, 24 m=µ+ i =1
n
= 3,5 + = 4, 24
1000 1000
∑ ni
i =1
i =1
∑n
i =1
i
Sin insistir mucho, demos las siguientes definiciones de otros tipos de medias:
∑ ni xi2
MEDIA CUADRÁTICA: q = i =1
n
, raíz cuadrada de la media de los cuadrados
∑n
i =1
i
n
MEDIA GEOMÉTRICA: g = n
∏x
i =1
i = n x1.x2 .x3 ...xn
n
ni
1
∑x
i =1
MEDIA HARMÓNICA: h con = n
i
h
∑n
i =1
i
Se demuestra que h ≤ g ≤ m ≤ q.
m xm x0 carácter
Cuando la curva de las frecuencias es simétrica (y unimodal), los tres parámetros de posición
están confundidos:
Frecuencia
m carácter
xm
x0
Llamamos AMPLITUD de una serie estadística a la diferencia entre los valores extremos del
carácter. Se llama DESVIACIÓN INTERCUARTIL a la diferencia entre el 1er y 3er cuartil.
Amplitud: b – a
Desviación intercuartil: Q3 – Q1
50%
a Q1 Q3 b x
Desviación interdecil: D9 – D1
80%
a D1 xm D9 x
Llamamos DESVIACIÓN MEDIA a la media aritmética de las desviaciones (en valor absoluto) con
relación a la media aritmética.
n
∑n
i =1
i xi − m
e= n
∑n
i =1
i
Tenemos, sucesivamente:
- Amplitud: 50
∑ ni ( xi − m)2
σ2 = i =1
n
∑n
i =1
i
∑ ni ( xi − m)2
i =1
σ= n
∑n
i =1
i
Podemos expresar la varianza (así como la desviación estándar) bajo una forma diferente, pero
equivalente, a través de la utilización de una media provisoria µ .
De esta manera,
xi − m = ( xi − µ ) − ( m − µ )
2 2 2
( xi − m ) = ( xi − µ ) − 2 ( m − µ )( xi − µ ) + ( m − µ )
n n n n
∑ ni ( xi − m ) = ∑ ni ( xi − m ) − 2 ( m − µ ) ∑ ni ( xi − µ ) +∑ ni ( m − µ )
2 2 2
i =1 i =1 i =1 i =1
n n
Ya que m ∑ ni = ∑ ni xi , el último término se escribe:
i =1 i =1
n
n n
n n
n
−2 ( m − µ ) ∑ ni ( xi − µ ) = −2 ( m − µ ) ∑ ni xi − µ ∑ ni = −2 ( m − µ ) m∑ ni −µ ∑ ni = − 2 ( m − µ ) ∑ ni
2
i =1 i =1 i =1 i =1 i =1 i =1
Finalmente:
n n n n n n
∑ ni ( xi − m ) = ∑ ni ( xi − µ ) + ( m − µ ) ∑ ni − 2 ( m − µ ) ∑ ni =∑ ni ( xi − µ ) − ( m − µ ) ∑n
2 2 2 2 2 2
i
i =1 i =1 i =1 i =1 i =1 i =1
∑ ni ( xi − µ )2 2
σ2 = i =1
n
− (m − µ )
∑ ni
i =1
σ 2 = q 2 − m2
∑ ni xi2
con q 2 = i =1
n
que representa el cuadrado de la media cuadrática
∑ ni
i =1
Distancia Centros ni 2 2 2 2
xi2 ni xi2
en Km.
( xi − m ) ni ( xi − m ) ( xi − µ ) ni ( xi − µ )
( xi )
[0,1[ 0,5 353 13,99 4 937,62 20,25 7 148,25 0,25 88,25
[1,2[ 1,5 159 7,51 1 193,71 12,25 1 947,75 2,25 357,75
[2,5[ 3,5 255 0,55 139,64 2,25 573,75 12,25 3 123,75
[5,10[ 7,5 147 10,63 1 562,26 6,25 918,75 56,25 8 268,75
[10,20[ 15 59 115,78 6 830,88 100,00 5 900,00 225,00 13 275,00
[20,50[ 35 27 946,18 25 546,80 900,00 24 300,00 1 225,00 33 075,00
SUMA 1000 40 210,90 40 788,50 58 188,50
Cuando se dilata o contracta la escala de los caracteres, la dispersión de una serie estadística es
modificada. Así, en tal operación xi , σ, m se convierten en x´i , σ´, m´ con x´i = kxi , σ´=kσ,
m´= km .
Vemos que si la desviación típica y la media son modificadas, la relación de estas dos cantidades
queda invariable.
Esta relación es llamada COEFICIENTE DE VARIACIÓN:
σ
Coeficiente de variación =
m
Esta cantidad, cuyo valor queda invariable por cambio homotético de la escala, permite la
comparación de dos series estadísticas cuya escala de caracteres no es la misma.
Ejemplo:
100
80
Recta de equirepartición
% de n ixi acumulados
60
A
40
a
20
Curva de Lorentz
0
0 20 40 60 80 100
% de efectivo acumulado
a
Índice de Gini =
A
Se observa que el índice de Gini esta comprendido entre 0 y 1; el valor 0 corresponde a una
concentración nula y el valor 1 a la máxima concentración.
6.1- Asimetría
N ∑
× ni(xi − x )
i =1
Variable Efectivos
(Estatura) ( x − x)
i (
ni xi − x ) (
ni xi − x
2
) (
ni xi − x
3
) (
ni xi − x
4
)
120 1 -5.3 -5.3 28.09 -148.877 789.0481
121 4 -4.3 -17.2 73.96 -318.028 1367.5204
122 4 -3.3 -13.2 43.56 -143.748 474.3684
123 2 -2.3 -4.6 10.58 -24.334 55.9682
124 1 -1.3 -1.3 1.69 -2.197 2.8561
125 2 -0.3 -0.6 0.18 -0.054 0.0162
126 3 0.7 2.1 1.47 1.029 0.7203
127 3 1.7 5.1 8.67 14.739 25.0563
128 4 2.7 10.8 29.16 78.732 212.5764
129 3 3.7 11.1 41.07 151.959 562.2483
130 3 4.7 14.1 66.27 311.469 1463.9043
304.7 -79.31 4954.283
1
× −79.31
F= 30 −0.08
3
1 2
× 304.7
30
El Coeficiente de Simetría de Fisher de esta muestra es -0,08, lo cual significa que presenta una
distribución asimétrica negativa (se concentran más valores a la izquierda de la media que a su
derecha). Sin embargo, pudiéramos debatir de la relevancia de dicha asimetría.
6.2- Curtosis
1 n 4
∑ × n i xi − x ( )
C = i =1
N
2
−3
1 n 2
N × ∑ ni xi − x
( )
i =1
1
× 4954.28
C= 30 − 3 −1.40
2
1
× 304.7
30
El Coeficiente de Curtosis de esta muestra es -1,40, lo cual significa que se trata de una
distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores
centrales de la distribución.
Para sintetizar la información de una serie estadística, podemos usar un diagrama de cajas.
Presentaremos el método de construcción de dicho diagrama y reflexionaremos sobre formas de
mejorarlo.
Es una representación grafica que permite representar varias medidas de tendencia central así
como el intervalo intercuartil. Comúnmente, la mayoría de las representaciones cuentan con los
siguientes datos:
No nos interesaremos en los datos discordantes en este curso de estadística descriptiva. Sin
embargo, podemos considerar mejorar la información representada aquí. En efecto, realizar un
diagrama de caja puede provocar para ciertas series que los límites internos de la caja se
encuentren fuera de la amplitud de la serie estadística. Por esta razón preferimos representar el
mínimo y el máximo de la serie como límites internos. También podemos considerar representar
los tres parámetros de posición que conocemos.
Ejemplo: Una empresa que explota una flota de taxis consigno para 100 taxis, las distancias que
habían recorrido antes de ponerlos de baja.
Distancia recorrida [80,85[ [85,90[ [90,95[ [95,100[ [100,105[ [105,110[ [110,115[ [115,120[
(miles de km)
Número de taxis 5 9 14 18 25 16 7 6
Frecuencia 5% 9% 14% 18% 25% 16% 7% 6%
115
110
105
Distancia
moda
mediana
100 media aritmética
95
90
85
80
Las siguientes líneas son pretensión alguna. Ellas no buscan constituir un curso de probabilidad
exhaustivo y riguroso (sobretodo en el plano matemático). Nuestro objetivo es esencialmente
utilitario. Es por esta razón que se evoca a menudo la intuición con un “enmascarado” más o
menos exitoso de las nociones matemáticas complejas, que solo harían más pesada la exposición
sin dar verdaderas herramientas para el cálculo efectivo y concreto de las probabilidades.
Siguiendo la formula conocida, el lector esta invitado a leer textos básicos para profundizar más
sus conocimientos.
Al hombre siempre le gustó el juego. Dicho gusto lo llevo a conducir experiencias aleatorias, por
ejemplo, sacar una carta al azar de un juego de 32 cartas.
En el vocabulario de las probabilidades, esta experiencia se llama PRUEBA.
Una experiencia puede llevarnos a diferentes resultados por ejemplo, sacar la reina de corazones
o el as de espadas. Cada vez, se trata de un evento diferente.
Para que se realice el evento, una sola carta debe de ser sacada: la reina
de diamantes.
El evento “sacar una reina” está compuesta por cuatro eventos elementales:
- Sacar la reina de corazones.
- Sacar la reina de diamantes.
- Sacar la reina de espadas.
- Sacar la reina de tréboles.
Decimos que el evento “sacar una reina” es la reunión de los cuatro eventos elementales
precedentemente evocados.
Nota : Para que se realice la intersección de estos dos eventos, necesitamos sacar una carta que
sea a la vez una reina y una carta de espadas. Necesitamos sacar a la reina de espadas.
Dos eventos disjuntos o incompatibles no pueden realizarse al mismo tiempo ya que no tienen
ningún resultado en común. Así, si uno está realizado, el otro no puede serlo.
Estos dos eventos son disjuntos o incompatibles. En efecto, cuando sacamos una jota, no
sacamos una reina.
Ejemplo: el evento contrario al evento “sacar una reina” es el evento “sacar cualquier carta menos
una reina”.
Nota:
- La reunión de un evento y de su evento contrario siempre se realiza. En efecto, cualquier
carta puede ser sacada.
- La intersección de un evento y de su evento contrario nunca se realiza. En efecto, si una
carta forma parte del evento A, no puede formar parte de su contrario A .
Nota:
- El evento “contrario de una reunión” es el evento “intersección de los eventos contrarios”.
A ∪ B = A ∩ B o sea No(A o B) = No(A) y No(B)
- El evento “contrario de una intersección” es el evento”reunión de los eventos contrarios”.
A ∩ B = A ∪ B o sea No(A y B) = No(A) o No(B)
Consideramos un conjunto no vacío E, cuyos elementos son cualesquiera. Las PARTES de E son
los conjuntos que se pueden formar a partir de los elementos de E.
Ejemplo: E = {a, b, c, d}
a, b, c, d son ELEMENTOS de E
Llamamos
Parte conAMPLITUD
0 elementos: ∅ ={ }
Noción
Partes con 1 elemento: {a}, {b}, {c}, {d} de Probabilidades
Partes con 2 elementos: {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}
Partes con 3 elementos: {a, b, c}, {a, b, d}, {a, c, d}, {b, c, d}
Acontecimientos
Partes con 4 elementos: E = {a, b, c, d} y probabilidades
Propiedades de las probabilidades
Por lo tanto hay 16 partes para E. Casos
El conjunto de las partes de un conjunto E es denotado por P(E). Veremos que el número de
elementos de P(E) es 2n si E posee n elementos.
P(E) = { ∅, {a}, {b}, {c}, {d}, {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}, {a, b, c}, {a, b, d}, {a, c, d},
{b, c, d}, E}
De ahora en adelante, llamaremos eventos a los elementos de P(E) y definiremos una aplicación
p de P(E) en (conjunto de números reales) que satisface los siguientes axiomas:
- Axioma 1: ∀A ∈ P ( E ) , p ( A ) ≥ 0
- Axioma 2: p ( E ) = 1
- Axioma 3: si A ∩ B = ∅ , entonces p ( A ∪ B ) = p ( A ) + p ( B )
Esta aplicación p se llama LEY DE PROBABILIDAD en P(E). Es una función que a un evento
hace corresponder un número real comprendido entre 0 y 1.
Nota: E es el EVENTO SEGURO. ∅ es el EVENTO IMPOSIBLE. {a}, {b}, {c}, {d} son EVENTOS
ELEMENTALES (no podemos fabricarlos a partir de elementos más simples). Si A∩B=∅, A y B
son EVENTOS INCOMPATIBLES O DISJUNTOS. Si A es el complementario de A, entonces A y
A son EVENTOS CONTRARIOS.
{a} y {b, c, d} son eventos contrarios, así como E y ∅ ó aún {a, b} y {c, d}. {a} y {b, c} son
incompatibles, así como {a} y {c} ó aún {a, b} y {c, d}
Por otro lado, veremos que los sucesos contrarios son incompatibles, pero lo inverso no es
verdad: {a} y {b, c, d} son contrarios, por lo tanto incompatibles, pero {a} y {b, c} son
incompatibles pero no son contrarios.
8.1 - Probabilidad :
Sacamos al azar una carta de un juego de 32 cartas. Cada carta tiene la misma probabilidad de
ser sacada.
Como tenemos 32 cartas, que cada carta tiene la misma probabilidad de ser sacada y que el
juego tiene una solo reina de tréboles, la probabilidad de sacar la reina de tréboles es:
Número de casos favorables = 1 1
p (" Sacar la reina detréboles ") = =
Número de casos posibles = 32 32
El juego cuenta con 8 cartas de espadas. Por lo tanto, tenemos 8 casos favorables entre 32. El
evento “no sacar una carta de espadas” es el evento contrario al evento “sacar una carta de
espadas”. En consecuencia:
8 1 3
p (" No sacar una carta de espadas ") = 1 − p (" Sacar una carta de espadas ") = 1 − = 1 − = = 75%
32 4 4
Ejemplo: Sea un dado truqueado. La prueba aleatoria consiste en lanzar el dado una vez. La ley
de probabilidad de la prueba es la siguiente:
Cara 1 2 3 4 5 6
Probabilidad 0,2 0,1 0,3 0,1 0,2 0,1
Los números pares que podemos obtener con el dado son 2, 4 y 6. El evento “obtener un número
par” se realiza cuando obtenemos un 2, un 4 o un 6.
El evento “número par” es la reunión de los tres eventos elementales “2”, “4”, “6”.
En consecuencia:
p (" Número par ") = p ("2") + p ("4") + p ("6")
= 0.1 + 0.1 + 0.1
= 0.3
Nota: p({10}) = p({10 de corazones} ∪ {10 de tréboles} ∪ {10 de diamantes} ∪ {10 de espadas}) =
p({10 de corazones}) + p({10 de tréboles}) + p({10 de diamantes}) + p({10 de espadas}).
Antes de proponerse estimar probabilidades, algunas nociones elementales deben ser dominadas.
Se trata del cardinal de un conjunto y la factorial de un número entero.
Ejemplo: Sea E, el conjunto de las vocales del alfabeto. E = {a; e; i; o; u} . El conjunto E tiene 5
elementos. Por lo tanto Card ( E ) = 5 .
n ! = 1 × 2 × 3 × 4 × ... × (n − 1) × n
Ejemplo:
1! = 1 =1 4! = × 2
1 × 3 × 4 = 24
producto del primer producto de los cuatro
entero no nulo primeros enteros no nulos
También se define la factorial de 0. Como sería vano hablar del producto de los 0 primeros
enteros, admitiremos por razones de compatibilidad que 0! = 1 .
n!
Consideremos el ratio , donde suponemos que n es mayor que p.
p!
Esta fracción se puede escribir:
n ! 1 × 2 × 3 × 4 × ... × ( p − 1) × p × ( p + 1) × ... × (n − 1) × n
= = ( p + 1) × ... × (n − 1) × n
p! 1 × 2 × 3 × 4 × ... × ( p − 1) × p
Ejemplo:
131!
= 129 × 130 × 131 , un simplificación que será muy útil a continuación.
128!
Una p-lista de elementos de un conjunto E es una lista ordenada de p elementos del conjunto E.
Sin embargo, las p-listas se usan mucho. Imaginemos una urna E conteniendo las 5 vocales del
alfabeto. Sacamos sucesivamente siete veces seguidas una vocal que volvemos a colocar
inmediatamente a la urna. Estamos entonces constituyendo 7-listas.
Nos preguntamos cuantas 7-listas se pueden constituir con las 5 vocales del alfabeto.
Una vocal que Una vocal que Una vocal que Una vocal que Una vocal que Una vocal que Una vocal que
escoger entre: escoger entre: escoger entre: escoger entre: escoger entre: escoger entre: escoger entre:
¿Porqué multiplicar? Simplemente porque para cada primera vocal posible, tenemos cinco formas
de escoger la segunda vocal y para cada segunda vocal posible, tenemos cinco formas de
escoger la tercera vocal…
En efecto, si la primera vocal sacada es la a, entonces tengo cinco posibilidades para la segunda
vocal. Sin embargo, lo que es cierto para a también lo es para las posibles primera vocal e, i, o y
u.
Para esta pareja de vocales, tengo 5 × 5 = 52 = 25 posibilidades. Ahora, para cada duo posible de
primeras letras, tengo 5 formas de escoger la tercera letra o sea 5 × 5 × 5 = 53 = 125 posibilidades.
Vemos que las posibilidades de formar listas diferentes van multiplicándose por 5 para cada vocal
suplementaria. Si hiciéramos un árbol, tendríamos cinco ramas más a cada extremidad.
Porque en cada una de las p posiciones, podemos escoger una vocal entre n.
Un ordenamiento es una p-lista particular en la cual un mismo elemento puede aparecer una sola
vez.
El resultado de un ordenamiento pudiera ser comparado con lo siguiente: imaginemos una urna E
conteniendo las 5 vocales del alfabeto. Un ordenamiento de p elementos consistiría en sacar de la
urna p veces seguidas una vocal que no volveríamos a colocar a la urna.
...
n-1 n-2 n-p+1
n posibilidades posibilidades posibilidades posibilidades
p n!
A = n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1) =
n
( n − p )!
2.3 - Permutaciones:
P n
= n!
El resultado de una combinación pudiera ser comparado con sacar simultáneamente de una urna
E conteniendo las 5 vocales del alfabeto, p vocales.
¿Con la combinación aei, cuántos 3-ordenamientos podemos formar? En otras palabras, cuantas
permutaciones existen de la 3-combinación aei.
La respuesta es: 3! = 6 . Las podemos enumerar: aei, aie, eai, eia, iae, iea.
Esto aplica para todas las 3-combinaciones de E. Con cada 3-combinación, podemos formar 6 3-
ordenamientos.
3
Sabemos que existen A 5
ordenamientos de 3 elementos en el conjunto E.
En consecuencia, existen A 5
combinaciones de 3 elementos.
3!
Por lo tanto:
3
C = A3!
3 5 60
5
= = 10
6
Tenemos:
p
n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1) 60
C = Ap!
p n n!
= =
n
p! p !( n − p )!
Las p-listas, los ordenamientos y las combinaciones son nociones de enumeración. Lo importante
es definir en qué situación, cada una de estas nociones debe ser utilizada.
Cada situación de enumeración se puede asimilar a “sacar elementos de una urna” Dos criterios
permiten caracterizar esta prueba: si se vuelve o no a colocar el elemento sacado y si el orden en
el cual se sacan los elementos importa o no.
- Si sacamos los elementos uno a uno en orden y que los volvemos a colocar a la urna
después de sacarlos y antes de volver a sacar un nuevo elemento, estamos constituyendo
p-listas.
- Si sacamos los elementos uno a uno en orden y que no los volvemos a colocar a la urna
después de sacarlos y antes de volver a sacar un nuevo elemento, estamos constituyendo
ordenamientos.
- Si sacamos los p elementos requeridos simultáneamente y que no importa el orden,
estamos constituyendo combinaciones.
Ejemplo: En el jockey Plaza, se presentan 20 caballos para una carrera. Dos modalidades de
apuestas son posibles. Uno puede apostar sobre los tres primeros caballos en orden o apostar
sobre los tres primeros caballos en desorden.
p
Los C n
también aparecen en la literatura como COEFICIENTES BINOMIALES porque
intervienen en la fórmula del binomio de Newton. Para apreciarlo, revisaremos primero algunas
propiedades de los coeficientes binomiales.
Siendo un conjunto E de n elementos. ¿Cuántas partes se pueden hacer con este conjunto?
Como lo hemos visto anteriormente, tenemos:
0
- Número de partes de 0 elementos: C =1. n
1
- Número de partes de 1 elemento: C = n . n
n
- Número de partes de n elementos: C = 1 . n
Consideremos también:
2 n ( n − 1)
- Número de partes de 2 elementos: C n
= .
2
p
- Número de partes de p elementos: C n
.
Respuesta: N = 1 + 4 + 6 + 4 + 1 = 16
y en particular:
0 n
C =C n n
=1
p
La siguiente propiedad nos permitirá calcular sucesivamente las C n
:
p p +1 p +1
C +C n n
= C n +1
Todas contienen a y p otros elementos que escoger entre los n+1 elementos de E. Esto nos
p
da un total de C n
combinaciones.
- Las que no contienen a están compuestas p+1 elementos que escoger entre los n+1
elementos de E a excepción de a. Finalmente solo se podrá escoger entre n de los n+1
elementos de E
p +1
Tendremos C n
combinaciones posibles.
- En conclusión, tenemos :
p p +1 p +1
C +C n n
= C n +1
Gracias a esta relación, podemos construir una tabla de número llamada triángulo de Pascal.
… … … … … …
p −1 p
n = n-1 C n −1 Cn −1
p
n=n … … … … … … C n
Concretamente:
p=0 p=1 p=2 p=3 p=4 p=5 p=6 …
n=0 1
n=1 1 1
n=2 1 2 1
n=3 1 3 3 1
n=4 1 4 6 4 1
n=5 1 5 10 10 5 1
n=6 1 6 15 20 15 6 1
… … … … … … … … …
n
= C nanb0 + C nan −1b1 + ... + C n an − p b p + ... + C n a1bn −1 + C na0bn = ∑ C n an − p b p
n 0 1 p n −1 n p
(a + b)
p =0
Regresemos al conteo del número de partes de un conjunto E de n elementos; hemos visto que:
0 1 2 p −1 n −1 n
N = C n + C n + C n + ... + C n + ... + C n + C n
Simétricamente, tendremos p ( A ∩ B ) = p ( B ) × pB ( A )
Ejemplo: Una urna contiene 5 bolillas idénticas, con excepción del color: 3 son rojas y 2 son
verdes.
Supongamos que se saca una bolilla (que no se vuelve a colocar a la urna), luego una segunda.
¿Cuál es la probabilidad de sacar dos bolillas rojas? Apliquemos la relación anterior:
3 2
p ( R ∩ R ) = p ( R ) × pR ( R ) = × = 0.3
5 4
Ahora, supongamos que se efectúa el mismo tipo de extracción, pero a cada etapa regresando
la bolilla a la urna:
3 3 9
p ( R ∩ R ) = p ( R ) × pR ( R ) = × =
5 5 25
A partir de los resultados sobre las hojas del precedente árbol, se puede construir un segundo
árbol de raíz “frecuencia de accidente”:
p ( ebrio ∩ accidente ) p ( sobrio ∩ accidente) p ( ebrio ∩ no accidente) p ( sobrio ∩ no accidente)
= 0.0002 = 0.00099 = 0.0098 = 0.98901
Accidente No accidente
p ( accidente ) p ( no accidente )
= 0.00119 = 0.99881
Frecuencia de accidente
Consideramos que dos eventos son INDEPENDIENTES cuando la realización de uno no afecta a
la probabilidad de realización del otro. Por ejemplo, los resultados sucesivamente obtenidos al
lanzar un dado. En efecto cada vez que lanzamos el dado, los resultados obtenidos anteriormente
no afectan al resultado presente.
Generalizando:
Los eventos A,A
1 2
,…
A son GLOBALMENTE INDEPENDIENTES para la probabilidad p si
k
p ( A ∩ A ∩ ... ∩ A ) = p ( A ) × p ( A ) × ... × p ( A )
1 2 k 1 2 k
A1 ∩ A 2 ∩ A 3 = ∅
p(A1). p(A2). p(A3) = 1 8 pero p(A1 ∩ A2 ∩ A3) = p(∅) = 0 por lo tanto, A1, A2, A3, no son
globalmente independientes.
Para que este teorema se pueda aplicar, necesitamos que los eventos A1 y A2 formen un sistema
completo.
Un sistema de eventos Ai forma un SISTEMA COMPLETO cuando contempla todas las
posibilidades (la suma de sus probabilidades debe ser el 100%).
Sea un evento A el cual puede depender de N causas Ci diferentes e incompatibles (no podemos
tener dos causas realizadas al mismo tiempo). Sabiendo que se realizó el evento A, ¿cuál es la
probabilidad de que Ci sea la causa de la realización de A?
N
Podemos escribir que A = ∪A∩C i dado que {Ci } constituye un sistema completo (las causas de
i =1
A son incompatibles entre si y suponemos que todas las causas posibles de A están conocidas)
∑ p (C ) × p ( A C )
i =1
i i
El evento constatado A es la presencia de una pieza defectuosa. Las causas posibles son las
máquinas M1 y M 2 . Forman un sistema completo dado que son las únicas dos causas
posibles de producción de una pieza defectuosa.
Deducimos de la información del ejercicio que la probabilidad de que una pieza haya sido
producida por M1 es de 1 y que la probabilidad de que una pieza haya sido producida por
3
M 2 es de 2 .
3
También las probabilidades condicionadas del evento A nos permiten decir que
p ( A M1 ) = 5% y p ( A M2 ) = 6% .
Ejemplo: Averigüemos los resultados obtenidos anteriormente con el ejemplo de los accidente
de tránsito.
Sea A el evento “accidente”. Sean B1 = ebrio y B2 = sobrio las dos causas posibles del
accidente. ¿Forman un sistema completo?
En una experiencia aleatoria, podemos hacer el inventario de los resultados posibles, es decir de
los posibles eventos: A, B, C,…….K.
Para el evento A, X = 1
Para el evento B, X = 2
Para el evento C, X = 3
------------------------------------------
Para el evento K, X = n
No son los valores posibles de la variable, ni el valor que toma una vez conocido el resultado de la
experiencia que son aleatorios sino, el valor que tomará antes de efectuar la experiencia aleatoria.
Originalmente, una variable aleatoria era una función de ganancia representando la ganancia
obtenida luego del resultado de un juego. Por ejemplo, supongamos que un jugador tire un dado y
que gane un sol si sale un 6 pero pierde 10 soles si sale otro resultado. Entonces es posible definir
la variable aleatoria de ganancia que asocia “1” al resultado “6” y “-10” a cualquier otro resultado.
La probabilidad para que la variable aleatoria tome el valor “1” es exactamente la probabilidad de
que el jugador gane 1 sol.
La suma de las probabilidades de todos los valores posibles de una variable aleatoria vale 1.
Podemos decir que las probabilidades se reparten entre estos valores posibles de la variable
aleatoria X. Podemos representar esta repartición por un diagrama de barras.
Por supuesto tenemos, p(X =1) + p(X =2) + p(X =3) = 1. La ley de probabilidad p(X) ha sido
definida precedentemente. Ella puede ser expresada por el siguiente grafo:
p(X)
0,5
0,3 ∑ p( X = X ) =1
i =1
i
0,2
X
1 2 3
La elección de un punto puede ser caracterizada por la abscisa del punto en un eje del
segmento. Así, se define una variable aleatoria continúa X = x.
Sin embargo, tenemos un problema serio: el número de casos favorables es 1, pero el número
de casos posibles es infinito, esto quiere decir que la probabilidad buscada es siempre nula.
Es evidente que p(x) debe ser proporcional a dx, ya que más grande es dx y más grande será la
probabilidad de encontrar M en ese intervalo. Esto significa que p(x) es de la forma:
p(x) = f(x)dx
∫ f ( x ) dx = 1
a
a b x
0
f(x)
1/(b-a)
a b x
0
Una función de repartición es creciente (largo sensu) sobre el intervalo ]−∞; +∞[ y continua a la
derecha en todo punto. Tiende hacia 0 en −∞ y 1 en +∞ . Recíprocamente, cualquier función
verificando las propiedades características enunciadas precedentemente puede ser considerada
como la función de repartición de una variable aleatoria.
El interés de la función de repartición reside en el hecho que es valida tanto para variables
continuas como para variables discretas definidas sobre un conjunto enumerable (en la mayoría
de los casos prácticos, se reduce a un conjunto de valores equidistantes que pueden ser
asimilados a números enteros).
F ( x ) = p ( X ≺ x ) = p ( x1 ) + p ( x2 ) + p ( x3 ) + ... + p ( xk )
k
F ( x ) = ∑ p ( xi ) dado que xk ≺ x ≺ xk +1
i =1
F(x)
x<1 F(x) = 0
1
1≤x<2 F(x) = 0,2
0,7
2≤x<3 F(x) = 0,2 + 0,5 = 0,7
3≤x F(x) = 1
0,2
0 1 2 3 x
f(x) ≠ 0 entre a y b
b
F ( x ) = ∫ f ( t ) dt
a
f(x) F(x)
1
F(α)
F(α)
a α b x a α b
0 0
x
x−a
F ( x ) = ∫ Cdt = C ( x − a ) =
a
b−a
F(x)
a b x
0
A: x1 < X < x2
B: X < x1
C: X < x2
x2 x1 x2
∫
a
f ( t ) dt − ∫ f ( t ) dt =
a
∫ f ( t ) dt = F ( x ) − F ( x )
x1
2 1
f(x)
p(A)
a x1 x2 b x
0
Se definen dos tipos de momentos: los MOMENTOS de orden k y los MOMENTOS CENTRADOS
de orden k:
Momentos de orden k Momentos centrados de orden
n k
M K ( x) = ∑ p ( xi ) X K n
i =1 ρ K ( x) = ∑ p( xi )( xi − X ) K
+∞ i =1
M K ( x) = ∫ f ( x) x K dx +∞
−∞ ρ K ( x) = ∫ f ( x)( xi − X ) k dx
M K ( x ) = Ε( x K ) −∞
ρ K ( x) = Ε(( xi − X ) K )
ρ 2 ( x) =∨ ( x) = ∑ p( xi )( xi − X ) 2
i
de donde:
V ( x) = X 2 − X 2
σ ( x) = V ( x)
Ejemplo: Una urna contiene 10 bolillas rojas, 25 bolillas verdes y 15 bolillas azules; estas
bolillas son idénticas a excepción del color. La experiencia consiste en extraer una bollilla. Hay
tres resultados posibles:
• extraer una bolilla roja: X = 1, p(X = 1) = 10/50 = 0,2
• extraer una bolilla verde: X = 2, p(X = 2) = 25/50 = 0,5
• extraer una bolilla azul: X = 3, p(X = 3) = 15/50 = 0,3
X = 2.1
X 2 = 4.9
V ( x ) = 4.9 − 2.12 = 0.49
σ ( x ) = 0.7
a+b
X =
2
a − ab + b 2
2
X2 =
3
( a − b) 2
V ( x) =
12
b−a
σ ( x) =
2 3
Ε( X n )
p( X ≥ k
n n
)≤ kn
2
(
Si ponemos g(X)= X - Ε ( X ) ) y k = t2 σ 2 obtenemos la desigualdad de BIENAYMÉ-
TCHEBYSHEV:
1
(
p ( X - Ε ( X ) ) ≥ tσ ≤) t2
Esta última desigualdad es la más conocida de las tres y es válida cualquier sea la variable
aleatoria X. Sin embargo en la práctica, la mayoración que provee es excesiva.
La distribución uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos
ellos con la misma probabilidad.
Es una distribución continua porque puede tomar cualquier valor y no únicamente un número
determinado (como ocurre en las distribuciones discretas).
1 a+b ( a − b) 2 b−a
a< x<b f ( x) = X= V ( x) = σ ( x) =
b−a 2 12 2 3
Ejemplo: El precio promedio del hectolitro de gasolina durante el próximo año se estima que
puede oscilar entre 140 y 160 soles. Podría ser, por tanto, de 143, o de 143.4, o de 143.45, o de
143.455, etc... Hay infinitas posibilidades, todas ellas con la misma probabilidad.
Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto
del intervalo, viene definida por:
1
f ( x) =
b−a
Donde:
b: es el extremo superior (en el ejemplo, 160 soles)
a: es el extremo inferior (en el ejemplo, 140 soles)
Una prueba de Bernoulli es una experiencia que solo tiene dos resultados posibles.
Un esquema de Bernoulli es una repetición incondicional de una misma prueba de Bernoulli.
Por ejemplo, lanzar una monedad es una prueba de Bernoulli. Solo hay dos resultados posibles,
cara o sello. Lanzar varias veces una monedad define un esquema de Bernoulli.
En general notamos E (éxito) y F (fracaso) los dos resultados posibles a una prueba de Bernoulli.
Así, cualquier prueba de Bernoulli puede ser representada por el siguiente árbol:
Nota: aquí las probabilidades de E y F están consideradas como iguales, lo cual significa que la
monedad está bien equilibrada, estamos en una situación de equiprobabilidad:
Imaginémonos ahora que vamos a lanzar dos veces la monedad. Obtenemos el siguiente
esquema de Bernoulli:
0.5 E o cara
E o cara
0.5
0.5 F o sello
0.5 E o cara
0.5
F o sello
0.5 F o sello
Si hiciéramos el árbol correspondiente a este esquema, obtendríamos varias ramas del árbol con
exactamente p letras “E”. Estas ramas tendrían entonces exactamente n - p letras F o E .
Por lo tanto, la probabilidad total de obtener p caras será igual al número total de ramas contando
exactamente p letras “E” multiplicada por la probabilidad de obtener p letras “E”. Solo nos falta
encontrar el número de ramas con p letras “E”.
Llamemos N la variable aleatoria que cuenta el número de éxitos (o caras) obtenidos después de
4 pruebas con una monedad desequilibrada. La ley de probabilidad de N es la siguiente:
Es tal que:
n− p
p ( X = p ) = Cnp × a p × (1 − a )
i =1
σ ( N ) = V ( N ) 0.97
Cuando trabajamos con la ley binomial de parámetros n y a, los indicadores que son la esperanza
matemática, la varianza y la desviación estándar tienen expresiones particulares que trataremos
de descubrir.
Teorema: La esperanza matemática de una variable aleatoria N siguiendo una ley binomial
N Β ( n; a ) es igual a n × a .
= 0 × p ( X = 0 ) + 1 × p ( X = 1) + ... + k × p ( X = k ) + ... + n × p ( X = n )
n
= ∑ k × Cnk × ak × (1 − a )
n−k
i =1
exactamente k éxitos
n
n!
= ∑k ×
n−k
× ak × (1 − a )
i =1 k !× ( n − k )!
sacamos un factor ...
n
n × ( n − 1)!
=∑
n−k
× −1
× a
k
a
× (1 − a )
i =1 ( k − 1)!× ( n − k )! sacamos un factor ...
= n×a×∑
n
( n − 1)! × ak −1 × (1 − a )
n−k
i =1 ( k − 1)!×
( n − 1) − ( k − 1) !
astucia ...
n
= n × a × ∑ Cnk−−11 × ak −1 × (1 − a )
( n −1) − ( k −1)
i =1
Para finalizar esta demostración, procederemos a un cambio de índice. Sea i = k - 1. Como k varia
de 1 a n, i variará de 0 a n - 1, así:
n
Ε ( X ) = n × a × ∑ Cni −1 × ai × (1 − a )
( n −1) − i
i =1
término que ya hemos visto
Teorema:
- La varianza de una variable aleatoria N siguiendo una ley binomial N Β ( n; a ) es igual a
n × a × (1 − a ) .
- La desviación estándar de una variable aleatoria N siguiendo una ley binomial N Β ( n; a ) es
igual a n × a × (1 − a ) .
Sí n=2, tenemos:
4
• p(X=0) = C20 p0 q2 = 0.16
25
12
• p(X=1) = C21 p1q1 = 0.48
25
9
• p(X=2) = C22 p2 q0 = 0.36
25
BIBLIOGRAFÍA:
Además de estos libros, una abundante literatura en inglés y en castellano puede ser encontrada
en internet. Aparecen a continuación algunas páginas en castellano de interés:
• http://www.ucv.cl/web/estadistica/index.htm
• http://148.216.10.83/estadistica/descriptiva.htm
• http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-indice.html
• http://www1.universia.net/CatalogaXXI/C10010PPESII1/S164409/P12311NN1/INDEX.HTM
L