Estadísticas y Probabilidades I - Miage, Teoría

UNIVERSIDAD DE SAN MARTÍN DE PORRES
PROGRAMA MIAGE
SEMESTRE: 2007
2007-I
CICLO: IV
IV
ESTADÍSTICAS Y
PROBABILIDADES I - MIAGE
MIAGE
Prof. Philippe Gollotte Página 1 de 76 Estadísticas y Probabilidades I - Miage

DIRECTORIO
UNIVERSIDAD DE SAN MARTIN DE PORRES:
RECTOR:
Ing. Raúl Bao García
VICERRECTOR:
Ing. Raúl Bao García
FACULTAD DE CIENCIAS ADMINISTRATIVAS Y RELACIONES INDUSTRIALES

DECANO:
Mg. Daniel Valera Loza
FACULTAD DE CIENCIAS CONTABLES, ECONÓMICAS Y FINANCIERAS

DECANO:
Dr. Domingo Sáenz Yaya
OFICINA DE PLANIFICACIÓN
Ing. Oscar Becerra Tresiera
COORDINACIÓN MIAGE USMP

Philippe Gollotte
CONSORCIO E-MIAGE:
PRÉSIDENT:
Gérald Guillaumet
DIRECTRICE IUP MIAGE:

Catherine Julie
CHARGÉ DE MISSION À LÍNTERNATIONAL:

DIRECTEUR SERVICE DES RELATIONS INTERNATIONAL, UNIVERSITÉ DÓRLÉANS:
Gilles Desrocques
Impreso en Lima
MARZO 2007

PROFESORA:
Blanca Laines Lozano
ÍNDICE DE CONTENIDO:
I – SERIES ESTADÍSTICAS: ............................................... 5

Sección I: Un poco de vocabulario .................................... 5
Sección II: Presentación de los resultados estadísticos en forma de
tablas ............................................................... 6
II - REPRESENTACIONES GRÁFICAS: ....................................... 10

Sección I: Diagrama de barras ....................................... 10
Sección II: Histogramas ............................................. 12
Sección III: Diagramas acumulativos ................................. 15
Sección IV: Diagramas polares ....................................... 17
Sección V: Diagrama de sectores ..................................... 18
Sección VI: Pictogramas (diagramas figurativos) ..................... 18
Sección VII: Diagrama de dispersión (nube de puntos) ................ 19
III – PARAMETROS DE POSICIÓN: ......................................... 20

Sección I: Moda ..................................................... 20
Sección II: Mediana ................................................. 21
Sección III: Media .................................................. 24
Sección IV: Comparación de los parámetros de posición ............... 27
IV – PARAMETROS DE DISPERSIÓN: ........................................ 28

Sección I: Amplitud, desviación intercuartil ........................ 28
Sección II: Desviación media ........................................ 28
Sección III: Varianza ............................................... 29
Sección IV: Coeficiente de variación ................................ 31
Sección V: Índice de concentración .................................. 32
Sección VI: Asimetría y curtosis .................................... 33
Sección VII: Diagrama de cajas ...................................... 35
V – NOCIÓN DE PROBABILIDADES: ......................................... 38

Sección I: Prueba y eventos ......................................... 38
Sección II: Evento elemental ........................................ 39
Sección III: Reunión de eventos ..................................... 39
Sección IV: Intersección de eventos ................................. 40
Sección V: Eventos disjuntos o incompatibles ........................ 40
Sección VI: Evento contrario ........................................ 41
Sección VII: Partes de un conjunto, evento y ley probabilidad ....... 42
Sección VIII: Cálculos básicos de probabilidades .................... 43
Sección IX: Propiedades de las probabilidades ....................... 45
VI – ENUMERACIONES: ................................................... 46
Sección I: Conocimientos previos .................................... 46
Sección II: p-listas ................................................ 47
Sección III: Ordenamientos y permutaciones .......................... 48
Sección IV: Combinaciones ........................................... 50
Sección V: Criterios y principios a conocer ......................... 52
Sección VI: Coeficientes binomiales ................................. 53

VII – PROBABILIDADES COMPUESTAS: ...................................... 56
Sección I: Probabilidad condicionada ................................ 56
Sección II: Eventos independientes .................................. 58
Sección III: Teorema de las probabilidades totales: ................. 59
Sección IV: Teorema de Bayes – Probabilidades de las causas ......... 59
VIII – VARIABLES ALEATORIAS: .......................................... 61

Sección I: Noción de variable aleatoria ............................. 61
Sección II: Función de repartición .................................. 64
Sección III: Momentos ............................................... 67
Sección IV: Desigualdad de Bienaymé-Tchebyshev-Markov ............... 68
VIII – MODELOS PROBABILÍSTICOS: ....................................... 70

Sección I: Distribución uniforme .................................... 70
Sección II: Ley binomial ............................................ 71
FUENTES DE INFORMACIÓN PARA LA ELABORACIÓN DEL PRESENTE DOCUMENTO: .... 76
BIBLIOGRAFÍA: ......................................................... 76

I – SERIES ESTADÍSTICAS:
Sección I: Un poco de vocabulario
Los principales términos del vocabulario estadístico son fijados en Francia por la norma NF X05-
001. Revisemos los principales elementos de la terminología estadística:
1.1- POPULACIÓN: conjunto sobre el cual se hace el estudio estadístico y que contiene un gran
número de elementos. En general, el estudio es efectuado sobre un extracto de la populación
llamada MUESTRA.
Ejemplo: se desea medir el diámetro de los granos de arena de una playa. Como el número de
granos de arena es muy elevado y medir el diámetro de todos los granos es imposible, se toma
una muestra de 1000 granos de arena sobre los cuales se efectuará las medidas de diámetro.
1.2- INDIVIDUO ó UNIDAD ESTADÍSTICA: cualquier elemento de una populación o de una

muestra.
Ejemplo: retomando el anterior ejemplo, un grano de arena es un individuo.
1.3- CARÁCTER ó VARIABLE ESTADÍSTICA: propiedad o aspecto estudiado en una

populación. Hay que distinguir:
1.3.1- los caracteres CUANTITATIVOS: representados por los números;
Ejemplo: edad de una persona, número de asalariados de una empresa, salario de un empleado
Se dividen en dos categorías:

- los caracteres MEDIBLES: sus valores representan las medidas del carácter en una unidad
escogida (recuerde: que una magnitud es medible cuando se puede definir la igualdad y la
suma).
Ejemplo: tamaño de una persona en cm., salario de un empleado en €.
- los caracteres LOCALIZABLES: sus valores son expresados con relación a una escala de
medida.
Ejemplo: temperatura en °C (la temperatura no es un magnitud medible, porque la suma de
dos temperaturas no tiene sentido: una cantidad de agua a 20°C agregada a una cantidad
de agua a 100°C no hace una cantidad de agua a 120°C)
1.3.2- los caracteres CUALITATIVOS: naturalmente no son expresados por números. Para
poder utilizar estos caracteres, hay que atribuir valores (numéricos o no) con la ayuda de un
código.
Ejemplo: situación familiar (soltero = 1, casado = 2, viudo = 3, divorciado = 4); profesión (código
INSEE)
Según los valores numéricos tomados por un carácter, se distingue:

- los caracteres DISCRETOS o DISCONTINUOS: sus valores son “asilados” los unos con
los otros.
Ejemplo: número de hijos de una familia (0, 1, 2,…)
- los caracteres CONTINUOS: en un intervalo de variación dada, sus valores son
cualesquiera.
Ejemplo: tamaños de una persona.

1.4- EFECTIVO: número de elementos correspondientes a un valor dado del carácter.
Ejemplo: en un conjunto de 100 familias, se encuentra 4 familias con 6 hijos: 4 es el efectivo que
corresponde al valor 6 del carácter “número de hijos”.
1.5- SERIE ESTADÍSTICA: conjunto de pares (x, n) donde x representa un valor fijo del carácter y
n el correspondiente efectivo.
Ejemplo: de 100 familias, se observa 12 familias con 0 hijos, 26 familias con 1 hijo, 20 familias con
2 hijos, 15 familias con 3 hijos, 14 familias con 4 hijos, 9 familias con 5 hijos y 4 familias con 6
hijos. La serie estadística correspondiente a esta situación es: (12, 0) (26, 1) (20, 2) (15, 3) (14, 4)
(9, 5) (4, 6).
Sección II: Presentación de los resultados estadísticos en forma

de tablas
2.1- Ejemplo 1:
Consideramos la clasificación de 94641 votantes efectivos de una circunscripción electoral,

siguiendo al candidato por el cual ellos han votado (no se considerará en ese ejemplo el caso de
las abstenciones, votos blancos o nulos). Los candidatos son designados por los números 1, 2, 3,
4, 5, 6 (el carácter es cualitativo y discreto) y la serie estadística es:
(1, 33 521) (2, 21 775) (3, 19 496) (4, 15 752) (5, 2 812) (6, 1 285).
CANDIDATOS xi 1 2 3 4 5 6
Número de votos ni 33 521 21 775 19 496 15 752 2 812 1 285
El efectivo corresponde al número de votos obtenidos por cada candidato.
Ya que el carácter es discreto, se puede designar sus valores por xi donde i varía del 1 al 6. De
la misma forma designaremos los valores del efectivo por ni . Aquí el índice i enumera las
casillas de la precedente tabla y se utiliza fácilmente: para x3 = 3 , tenemos n3 = 19 496 .
El efectivo total es la suma de todos los ni : N = n1 + n2 + n3 + n4 + n5 + n6 = 94 641 .
Acostumbramos escribir esta expresión de la siguiente forma simplificada:

6
N = ∑ ni
i =1
que se lee “suma de las cantidades ni para i variando del 1 al 6”.
Cuando se desea hacer estudios comparativos, se utiliza, en lugar del efectivo, la FRECUENCIA
que es definida por:
ni
fi =
N

Nota: consideremos un ejemplo simplificador. Sea el Perú un país de 24 millones de habitantes y
240 millones de dólares de PBI. Pongamos que China tiene 1 600 millones de habitantes y 400
millones de dólares de PBI. En absoluto, China es más rica (400 millones contra 200). En lo
relativo, Perú tiene un ingreso de 10 dólares por habitante contra 0.25 dólares por habitante para
China. Este último criterio de comparación es más objetivo.
La siguiente tabla proporciona las frecuencias en reemplazo de los efectivos.
CANDIDATOS xi 1 2 3 4 5 6
Frecuencias f i 0,354 0,230 0,206 0,166 0,030 0,014
Como se puede verificar en la precedente tabla, la suma de todas las frecuencias es igual a 1; así
tenemos:
6
n1 n2 n3 n4 n5 n6 N
∑f
i =1
i = f1 + f 2 + f 3 + f 4 + f5 + f 6 = + + + + + = =1
N N N N N N N
luego:
6
∑f
i =1
i =1
Nota: Las frecuencias permiten obtener porcentajes: Así, con una simple lectura de la tabla
precedente, vemos que el candidato número 4 ha obtenido 16,6% de los votos.
2.2- Ejemplo 2:
Notas del oral en geometría analítica de 280 candidatos admisibles en la Escuela Central en 1950.
Aquí el carácter es la nota obtenida (entre 0 y 20): por lo tanto sus valores son cualquier número
comprendido entre 0 y 20 (por ejemplo 14,8745632). Se trata de un carácter continuo. Para
comodidad del estudio, se dividirá entonces el intervalo de variación del carácter en CLASES:
a ≤ x ≺ b donde x ∈ [ a; b[
La diferencia b − a se llama AMPLITUD de la clase [ a; b[ .
En forma de tabla, el estudio estadístico se describirá así:
NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[

Efectivo ( ni ) 1 8 29 63 100 70 9
Frecuencia ( f i ) 0,004 0,029 0,104 0,225 0,357 0,250 0,032
Nota 1: la enumeración de los efectivos y las frecuencias debe corresponder a la enumeración de

las clases:
Ejemplo: 4ta clase: [12,14[ n4 = 63 ; f 4 = 0.225
Nota 2: cuando las clases tienen una misma amplitud – que es nuestro caso – se puede convenir
de designar cada una de ellas por su CENTRO:
clase [ a; b[ centro = ( a + b ) 2

Entonces podemos reemplazar la primera línea de la precedente tabla, por la siguiente línea:
NOTAS SOBRE 20 ( xi ) 7 9 11 13 15 17 19
Esta convención permite reemplazar una serie estadística de carácter continuo por una serie
estadística de carácter discreto.
Nota 3: también se puede efectuar reagrupamientos de clases:

Clases de amplitud 4:
xi 6 10 14 18
ni 1 37 163 79
Clases de amplitud 6:
xi 5 11 17
ni 1 100 179
Procediendo así, evidentemente se pierde en precisión mientras que se gana en simplificación.
2.3- Ejemplo 3:
Del empadronamiento general de la agricultura en 1955, se ha extraído las siguientes

informaciones: repartición de las explotaciones en Francia (no comprenden los bosques) según la
superficie total:
Superficie de [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha.( xi ) más
Número de 149 229 411 470 530 373 74 747 16 702 3 523
explotaciones ( ni ) 723 574 265 736 048 810
Frecuencias ( fi ) 0,066 0,102 0,182 0,208 0,235 0,165 0,033 0,007 0,002
Nota 1: Por razones de presentación, las clases no tienen la misma amplitud. Se evitará, en la
medida de lo posible, presentar directamente una clase por su centro, sin dar indicaciones
complementarias.
Posiblemente se deba buscar, por ejemplo, el número y porcentaje de las explotaciones que
tengan una superficie inferior a 50 ha. Por lo tanto, se tiene interés por utilizar la noción de
EFECTIVO ACUMULADO ó FRECUENCIA ACUMULADA.
Efectivo acumulado Frecuencia acumulada

p p
∑n
i =1
i ∑f
i =1
i
donde p es el número de la clase, donde se desea detener el conteo

(para la pregunta anterior, p = 6 lo que corresponde a: x ≺ 50 ).

Superficie de las [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha. ( xi ) más
Efectivo acumulado ( ni ) 149 379 790 1 261 1 791 2 165 2 239 2 256 2 260
723 297 562 325 373 183 930 632 155
Frecuencia acumulada ( fi ) 0,066 0,168 0,350 0,558 0,793 0,958 0,991 0,998 1
La precedente tabla permite responde a la pregunta formulada: 2 165 183 explotaciones (o sea
95,8%) tienen menos de 50 ha.
Nota 2: Al extremo final de la tabla (última clase), el efectivo acumulado corresponde al efectivo
total y la frecuencia acumulada corresponde a 1 (o sea 100%).
Nota 3: Sin precisión suplementaria, efectivo y frecuencia acumulados son considerados como
CRECIENTES. También se puede utilizar efectivos y frecuencias acumulados DECRECIENTES:
Superficie de las [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha. ( xi ) más
Efectivo acumulado 2 260 2 110 1 880 1 469 998 468 94 972 20 225 3 523
decreciente ( ni ) 155 432 858 593 830 782
Frecuencia acumulada 1 0,934 0,832 0,650 0,442 0,207 0,042 0,009 0,002
decreciente ( f i )
Esta disposición permite ver, por ejemplo, que 1 880 058 explotaciones (o sea 83,20%) tienen 2
ha. y más.
2.4- Ejemplo 4:
Los precedentes ejemplos se trataron en relación a series estadísticas SIMPLES: porque su

populación ha sido estudiada siguiendo un solo criterio. Una serie estadística DOBLE es una serie
estadística establecida siguiendo los valores de DOS características. Demos un ejemplo:
Populación de 142 niños del sexo masculino de un jardín, en el cual se ha tomado el peso y la
edad de los niños:
Edad en años ( x ) [3,4[ [4,5[ [5,6[ Distribución

Peso en Marginal
kg. ( y )
Inferior a 15 19 7 1 27
[15,20[ 32 21 12 65
[20,25[ 3 18 28 49
[25,30[ 0 0 1 1
Distribución marginal 54 46 42 142
La utilización de distribuciones marginales permite descomponer una serie estadística doble en

dos series estadísticas simples.

II - REPRESENTACIONES GRÁFICAS:
Existen varios tipos de representación gráfica de una serie estadística:

• Diagramas cartesianos que conducen a los diagramas de barras y a los histogramas
• Diagramas polares
• Diagramas de sectores o gráficos de sectores
• Pictogramas o diagramas figurativos
• Diagramas de dispersión o nube de puntos
• Etc.
En esta sesión vamos ha estudiar las principales representaciones gráficas:
Sección I: Diagrama de barras
En un sistema de ejes (aquí escogidos perpendiculares), se
frecuencia
representa cada par ( xi , ni ) – donde xi es un valor del
Efectivo
carácter y ni el correspondiente efectivo – por un punto de
abscisa xi y de ordenada ni .
ó ni fi Punto
En lugar del efectivo, evidentemente se puede tomar la
frecuencia.
Así se obtiene un diagrama cartesiano. Barra
En el caso de un carácter discreto, los estadísticos tienen

por costumbre reemplazar los puntos por barras verticales. xi carácter
1.1- Ejemplo 1: resultado del voto de los electores en relación a 6 candidatos:
CANDIDATOS ( xi ) 1 2 3 4 5 6
Número de votos ( ni ) 33 521 21 775 19 496 15 752 2 812 1 285
40000
35000
30000
Número de votos
25000
20000
15000
10000
5000
0
1 2 3 4 5 6
Candidatos
1.2- Ejemplo 2:
En el caso de un carácter continuo, repartido en clases de igual amplitud, podemos tomar el

precedente caso, utilizando el centro de cada clase; así tenemos para la siguiente distribución
relativa a las notas de oral obtenidas por candidatos de un concurso:
NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[
Efectivo ( ni ) 1 8 29 63 100 70 9
Frecuencia ( f i ) 0,004 0,029 0,104 0,225 0,357 0,250 0,032
Obtenemos el siguiente diagrama de barras. La línea cortada que une todos los vértices de las
barras se llama POLÍGONO DE LOS EFECTIVOS, si las alturas de las barras corresponden a los
efectivos; o al POLIGONO DE FRECUENCIAS, si las alturas de las barras corresponden a las
frecuencias.
120
100
Polígono de
los efectivos
80
Efectivo
60
40
20
0
7 9 11 13 15 17 19
Notas de oral
Cuando el carácter es continuo, en realidad hay una infinidad de pares (x, f) y el polígono de las
frecuencias se vuelve una curva continua llamada CURVA DE LAS FRECUENCIAS, cuya forma
general es la siguiente:
Frecuencia
Curva de
frecuencia
Carácter
Sección II: Histogramas
Los histogramas son utilizados en el caso de caracteres continuos: sobre el eje de las abscisas,
las clases reemplazan valores aislados del carácter y, por ello, las barras son reemplazas por
rectángulos.
2.1- Ejemplo 1: el histograma correspondiente es el siguiente:
120
100
80
Efectivo
60
40
20
0
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Notas de oral
Ya que la altura de los rectángulos es proporcional al correspondiente efectivo, y ya que las
amplitudes de las clases son iguales, el área total del histograma es proporcional al efectivo total.
El polígono de los efectivos (o de las frecuencias) se obtiene uniendo los puntos medios del lado
superior de cada rectángulo. Por convención, se comienza en cero y se termina en cero como se
indica en la precedente figura. Con esta convención esta claro que:
área total del histograma = área de la superficie delimitada por el polígono

de los efectivos
ambos son proporcionales al efectivo total
Ahora examinemos el siguiente caso importante, donde las amplitudes de las clases son
desiguales. Entonces, habrá que seguir la siguiente regla:
El área de cada rectángulo debe ser proporcional al

correspondiente efectivo

Retomemos el ejemplo anterior, considerando por un lado una repartición en clases de amplitudes
iguales, y por otro lado una repartición en clases de amplitudes desiguales:
2.1.1- Amplitudes iguales:
NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[

Frecuencia ( f i ) 0,004 0,029 0,104 0,225 0,357 0,250 0,032
2.1.2- Amplitudes desiguales:
NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,14[ [14,20[

Frecuencia ( f i ) 0,004 0,029 0,329 0,639
Los histogramas correspondientes son los siguientes:
0,7
0,6
0,5 0,5 A
0,4 0,4
Frecuencias
Frecuencias
0,3 0,3
A1
0,2 0,2
A2
0,1 0,1
A3
0 0
6 8 10 12 14 16 18 20 6 8 10 14 20
Notas sobre 20 Notas sobre 20
Para respetar la regla precedentemente evocada, necesitamos tener:

A = A1 + A2 + A3

2.2- Clases de amplitud diferente: complementos
En la gráfica anterior (gráfica de la derecha), aunque las clases sean de amplitud diferente, los
rectángulos que las representan tienen mismo ancho. El objetivo de tal representación es
asegurar que las áreas de los rectángulos sean proporcionales a las frecuencias que representan.
Para ilustrarlo, veamos el siguiente ejemplo:
Clases de amplitud diferente representadas por segmentos de misma longitud:
Área rectángulo blanco:

0,5
1cm × 3 cm = 3 cm 2
0,4
CARÁCTER ( xi ) [1;2[ [2;4[ Frecuencias
0,3 Área rectángulo amarillo:
Frecuencia ( f i ) 0,3 0,5
0,2
1cm × 5 cm = 5 cm 2
0,1 Las áreas de los rectángulos son

1 cm
0 proporcionales a las frecuencias que
1
1 cm
2 4 8 representan.
Clases de amplitud diferente representadas por segmentos de longitud proporcional a la amplitud

de clase:
0,5
Área rectángulo blanco:
1cm × 3 cm = 3 cm 2
0,4
CARÁCTER ( xi ) [1;2[ [2;4[
Frecuencias
0,3 Área rectángulo amarillo:

Frecuencia ( f i ) 0,3 0,5
0,2
2 cm × 5 cm = 10 cm 2
0,1
1 cm
Las áreas de los rectángulos no son
0 proporcionales a las frecuencias que
1
1 cm
2 3 4 representan.
2.3- Representación gráfica preferida:
El siguiente espacio está reservado para toma de notas sobre el tema:

Sección III: Diagramas acumulativos
En un plano cartesiano, igualmente se puede representar los efectivos o las frecuencias

acumuladas. Sin embargo, hay que distinguir tres casos:
3.1- Carácter discreto:
Razonemos a partir del siguiente ejemplo:

Ejemplo: número de niños por mujer sobre una populación de 30 mujeres:
xi 0 1 2 3 4 5 6 7
ni 4 3 8 7 4 3 0 1
Efectivo acumulado 4 7 15 22 26 29 29 30
Si se traza la curva del efectivo acumulado en función del carácter, se obtiene la siguiente curva
“en escalera”:
30
Efectivo acumulado
25
20
15
10
5
0 1 2 3 4 5 6 7
La forma de esta curva se debe al hecho de que cuando el carácter pasa por uno de sus valores
discretos, el efectivo acumulado pasa bruscamente de un valor al siguiente, luego se queda fijo
hasta su próximo salto.
3.2- El carácter es continuo y repartido en clases
El efectivo acumulado al inicio de una clase, por lo general no es el mismo al final. Se considera
que al interior de una misma clase, el efectivo acumulado es una función lineal del carácter. Así se
obtiene un POLÍGONO ACUMULATIVO compuesto por segmentos de recta.

Ejemplo:
300
280
250
Polígono
acumulativo
efectivo acumulado
200
150
100
50
0 6 8 10 12 14 16 18 20
carácter
3.3- El carácter es continuo, las clases tienen una amplitud nula
Extendiendo hacia el cero la amplitud de las clases, el polígono acumulativo en el caso de un

carácter continuo, tiende hacia una CURVA ACUMULATIVA cuya forma general es representada
a continuación:
Frecuencia ó efectivo acumulado
1ó
efectivo total
Curva
acumulativa
Carácter

Sección IV: Diagramas polares
Su principio es esquematizado a continuación (lado derecho):
• el ángulo θ es proporcional al carácter ρ

• el radio vector ρ es proporcional al efectivo correspondiente
En general, los diagramas polares son utilizados en el caso de θ

caracteres periódicos. 0 Eje polar
Ejemplo: estadísticas mensuales de los siniestros automovilísticos.
1982
1983
MARZO ABRIL
1984
MAYO
FEBRERO
ENERO
JUNIO
Declaraciones
mensuales
5 10 15 20 25 30 (en miles)
DICIEMBRE
JULIO
NOVIEMBRE
AGOSTO
OCTUBRE
SEPTIEMBRE

Sección V: Diagrama de sectores
Los diagramas de sectores son utilizados para poner en evidencia la importancia relativa de los
efectivos. El diagrama se parece a una torta cuyas partes son tales que el ángulo en el centro es
proporcional al valor del efectivo.
Ejemplo: repartición geográfica de las actividades de una sociedad multinacional:
Gran Bretaña
20%
Rodesia Australia
1% 32%
Europa Continental
2%
África del Sur
4%
Zambia
6%
América del Sur

35%
Sección VI: Pictogramas (diagramas figurativos)
Un pictograma consiste en representar los efectivos por dibujos más o menos pintorescos, que
dan cualitativamente la importancia relativa de los fenómenos. Evidentemente, en el plano
cuantitativo, son poco precisos.
Ejemplo: Ganado ovino de lana en 1960
AUSTRALIA
153
Ex URSS
133
CHINA 59
NUEVA ZELANDA 49
ARGENTINA 45
INDIA 40
USA 33
AFRICA DEL SUR 34
= 10 millones de cabezas
TURQUÍA 34
GRAN BRETAÑA 29

Sección VII: Diagrama de dispersión (nube de puntos)
En el caso de una doble serie, se puede representar cada par ( x1 , y1 ) por un punto, que dará
como resultado una “nube” de puntos. En general, no se dispone de todos los pares cuando se
trata de un carácter continuo, pero sí de una repartición en clases. En ese caso, se traza para
cada par de clases (en un rectángulo) un número de puntos de forma homogénea igual al efectivo.
Edad en años ( x ) [3,4[ [4,5[ [5,6[ Distribución

Peso en Marginal
kg. ( y )
Inferior a 15 19 7 1 27
[15,20[ 32 21 12 65
[20,25[ 3 18 28 49
[25,30[ 0 0 1 1
Distribución marginal 54 46 42 142
35
30
25
20
15
3 4 5 6 x

III – PARAMETROS DE POSICIÓN:
Para comparar dos series estadísticas, se emplea dos tipos de parámetros:

• Los parámetros de posición: moda, mediada, medias.
• Los parámetros de dispersión: amplitud, desviación media, varianza, desviación estándar,
coeficiente de variación, índice de dispersión.
En esta sesión, nos interesaremos en los parámetros de posición.
Sección I: Moda
Llamamos MODA o DOMINANTE al valor x0 del carácter que corresponde al efectivo mayor.
1.1- Carácter discreto:
CANDIDATOS ( xi ) 1 2 3 4 5 6
Número de votos ( ni ) 33 521 21 775 19 496 15 752 2 812 1 285
Siendo el mayor efectivo 33 521, la moda es x0 = 1 .
1.2- Carácter continúo:
NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[

Efectivos ( ni ) 1 8 29 63 100 70 9
El mayor efectivo es 100, por lo tanto la CLASE MODAL es la clase [14,16[. Se convendrá en
tomar por moda el centro de esta clase: x0 = 15 .
Nota 1: El efectivo de una serie puede presentar varios máximos, relativos o no:
n n n
x x x
serie unimodal serie bimodal serie multimodal
Es evidente que el uso de la moda solo tiene interés para el caso de series unimodales.

Nota 2: En el caso de un carácter continuo, dos reparticiones diferentes de las clases, pueden
conducir a dos valores diferentes de la moda. Consideremos, dentro del marco del ejemplo 2, la
siguiente repartición:
NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,14[ [14,20[

Efectivos ( ni ) 1 8 92 179
Para tomar en cuenta la desigualdad de las amplitudes de las clases, los efectivos a considerar
son: 1;8; 92 = 46;179 =59,67 . Se deduce que la moda es xo = 17 .
2 3
Sección II: Mediana
Se llama mediana al valor del carácter que divide la serie estadística, en dos series de efectivos
iguales. Así, la mediana corresponde al valor xm para el cual la frecuencia acumulada vale 1/2.
f f acumulada
A1 = A2
1
½
A1 A2
xm x
xm x
Indiquemos cómo en la práctica se determina la mediana.
2.1- Determinación por cálculo:
Se considerarán dos casos:

2.1.1- El carácter es discreto
Ejemplo 1:
xi 1 2 3 4 5 6
ni 2 7 3 1 7 5
12 12
la mediana es xm = 4

Ejemplo 2:
xi 1 2 3 4 5 6
ni 2 5 8 7 5 2
7+1
14 14
Aquí no hay mediana. En realidad, para xi ≺ 3 , n1 + n2 = 7 mientras que para xi 3 ,

n4 + n5 + n6 = 14 . A causa de la discontinuidad del carácter, se puede decir que la mediana es 3…
La conclusión es que por lo general, en el caso de un carácter discreto, la mediana no existe.
2.1.2- El carácter es continuo

Regresemos al siguiente ejemplo:
Superficie de [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ [50,100[ [100,200[ 200 y
explotaciones en ha. más
( xi )
Número de 149 229 411 470 530 373 74 747 16 702 3 523
explotaciones ( ni ) 723 574 265 736 048 810
Efectivo acumulado 149 379 790 1 261 1 791 2 165 2 239 930 2 239 930 2 260
723 297 562 325 373 183 155
El efectivo mitad es 2 260 155/2 = 1 130 077,5 lo que demuestra que la CLASE MEDIANA (o
INTERVALO MEDIANO) es la clase [5,10[. Queda por determinar en esta clase la mediana que
es del tipo:
xm = 5 + ∆x ( con 0 ≺ ∆x ≺ 5 )
Para obtener la cantidad ∆x , se procede por interpolación lineal. El número de explotaciones de

la clase [5,10[ correspondiente a ∆x es 1 130 077,5 - 790 562 = 339 515,5.
- Para un acrecentamiento del carácter de 10 - 5 = 5, el efectivo acumulado crece en 470 763.

- Para un acrecentamiento del carácter de ∆x, el efectivo acumulado crece en 339 515,5.
de donde ∆x = ( 5 × 339515,5 ) 470 763 3,61 = (5 x 339 515,5) / 470 763 ≅ 3,61 (regla de tres).
En consecuencia, la mediana es xm 8, 61
2.2- Determinación gráfica:
Ejemplo 9: Clasificación según la edad de 150 obreros de una empresa:
EDAD EN AÑOS ( xi ) [20,25[ [25,30[ [30,35[ [35,40[ [40,45[ [45,50[ [50,55[ [55,60[
Efectivo ( ni ) 9 27 36 45 48 9 3 3
creciente
decreciente

El histograma de esta serie estadística es representado a continuación:
50
45
A2
40 A1
35
Efectivo
30
25
20
15
10
5
0
20 25 30 35 40 45 50 55 60
xm
Edad
Para obtener la mediana, se puede:
• ya sea trazar el polígono acumulativo creciente: la mediana corresponde a una frecuencia
acumulada creciente de ½
• o trazar el polígono acumulativo decreciente: la mediana corresponde a una frecuencia
acumulada decreciente de ½
• o trazar los dos polígonos acumulativos crecientes y decrecientes: la mediana es la abscisa
de su punto de intersección.
0,9
0,8
0,7
Frecuencias acumuladas
0,6
0,5
0,4
0,3
0,2
0,1
35,3
0
20 25 30 35 40 45 50 55 60
Edad
Se puede generalizar la noción de mediana: la mediana permite dividir el efectivo total en dos
efectivos iguales: si a su vez se separa estos efectivos en dos efectivos iguales (conteniendo cada
uno 25% del efectivo total), se obtiene los valores del carácter: Q1, Q2 = xm , Q3. Estos valores
son llamados CUARTILES.
Frecuencia
Frecuencia acumulada
1
0,75
A2 A3
25% 25% 0,5
0,25
A1 A4
25% 25%
0
Q1 xm Q3 carácter Q1 xm Q3 carácter
Igualmente se puede proyectar una división del efectivo en 10 (100) efectivos iguales, cada uno
representando 10% (1%) del efectivo total; los valores correspondientes del carácter son los
DECILES (CENTILES).
Sección III: Media
Existen diferentes tipos de media. Aquí nos limitaremos a las principales definiciones.
3.1- Media aritmética ponderada
La media aritmética ponderada m de una serie estadística con carácter discreto esta definido por
la relación:
n xi : valores del carácter

∑n x
i =1
i i
ni : efectivo correspondiente
m= n n
∑n
i =1
i ∑ n : representa el efectivo total N.
i
i =1
Reemplazando, obtenemos:
n
∑ ni xi n
ni n
m= i =1
=∑ xi = ∑ fi xi
N i =1 n i =1

En conclusión:
n
Donde f i es la frecuencia correspondiente al valor del carácter.
m = ∑ fi xi
i =1
Ejemplo: número de hijos por mujer en una populación de 30 mujeres:
NÚMERO DE HIJOS ( xi ) 0 1 2 3 4 5 6 7
Número de mujeres ( ni ) 4 3 8 7 4 3 0 1
Frecuencia ( f i ) 0,13 0,10 0,27 0,23 0,13 0,10 0,00 0,03
A partir de la primera relación:

m = [4x0 + 3x1 + 8x2 + 7x3 + 4x4 + 3x5 + 0x6 + 1x7] / 30 = 2,6 ≅ 3
A partir de la segunda relación:

m = 0,13x0 + 0,10x1 + 0,27x2 + 0,23x3 + 0,13x4 + 0,10x5 + 0x6 + 0,03x7 = 2,6 ≅ 3
Para profundizar: observemos la siguiente demostración:
A menudo se utilizada otra forma de cálculo que permite simplificaciones. Consiste en emplear
una MEDIA PROVISORIA µ . Se escoge µ , a menudo muy próximo de la media m, por ejemplo
se puede tomar la moda: µ = x0 .
Cada xi puede ser escrita: xi = µ + ( xi − µ ) de donde:

n n n
∑ ni xi ∑ ni [µ + ( xi − µ )]
i =1 i =1
∑ ni ( xi − µ )
i =1
m= n
= n
=µ+ n
∑ ni
i =1
∑ ni
i =1
∑ ni
i =1
∑ n ( xi − µ )
i =1
i
m=µ+ n
∑n
i =1
i
Ejemplo: Apliquemos esta relación al ejemplo anterior, tomando µ = 2 :
xi 0 1 2 3 4 5 6 7
xi − µ −2 −1 0 1 2 3 4 5
ni ( xi − µ ) −8 −3 0 7 8 9 0 5
Los valores de la última línea suman 18. m = 2 + 18 2, 6

30

Ejemplo: Apliquemos los tres modos del cálculo de la media aritmética en el siguiente ejemplo,
donde el carácter es continuo y repartido en clases. Entonces, se representa cada clase por su
centro xi :
DISTANCIA EN KM. [0,1[ [1,2[ [2,5[ [5,10[ [10,20[ [20,50[ TOTALES

Centros ( xi ) 0,5 1,5 3,5 7,5 15 35
Número de personas ( ni ) 353 159 255 147 59 27 1000

ni xi 176,50 238,50 892,50 1 102,50 885 945 4240
fi 0,353 0,159 0,255 0,147 0,059 0,027
f i xi 0,18 0,24 0,89 1,10 0,89 0,95 4,24
xi − µ −3 −2 0 4 11,5 31,5
ni ( xi − µ ) −1 059 −318 0 588 678,5 850,5 740
n n
∑ ni xi 4 240 n ∑ n ( xi −µ )
i
740
m= i =1
n
= = 4, 24 m = ∑ fi xi = 4, 24 m=µ+ i =1
n
= 3,5 + = 4, 24
1000 1000
∑ ni
i =1
i =1
∑n
i =1
i
en el último caso, se ha tomado µ = 3,5
Regresemos al tema principal:
3.2- Otras medias
Sin insistir mucho, demos las siguientes definiciones de otros tipos de medias:
∑ ni xi2
MEDIA CUADRÁTICA: q = i =1
n
, raíz cuadrada de la media de los cuadrados
∑n
i =1
i
n
MEDIA GEOMÉTRICA: g = n
∏x
i =1
i = n x1.x2 .x3 ...xn
n
ni
1
∑x
i =1
MEDIA HARMÓNICA: h con = n
i
h
∑n
i =1
i
Se demuestra que h ≤ g ≤ m ≤ q.

Sección IV: Comparación de los parámetros de posición
En general, la curva de las frecuencias (supuestamente unimodal) es disimétrica y la moda, la

mediana y la media aritmética son números diferentes que se reparten como lo indica la figura, en
el siguiente ejemplo:
Frecuencia
m xm x0 carácter
Media Mediana Moda
Cuando la curva de las frecuencias es simétrica (y unimodal), los tres parámetros de posición
están confundidos:
Frecuencia
m carácter
xm
x0

IV – PARAMETROS DE DISPERSIÓN:
Sección I: Amplitud, desviación intercuartil
Llamamos AMPLITUD de una serie estadística a la diferencia entre los valores extremos del
carácter. Se llama DESVIACIÓN INTERCUARTIL a la diferencia entre el 1er y 3er cuartil.
Amplitud: b – a
Desviación intercuartil: Q3 – Q1
50%
a Q1 Q3 b x
Se define de manera análoga la DESVIACIÓN INTERDECIL ó la DESVIACIÓN INTERCENTIL:
Desviación interdecil: D9 – D1
80%
a D1 xm D9 x
Sección II: Desviación media
Llamamos DESVIACIÓN MEDIA a la media aritmética de las desviaciones (en valor absoluto) con
relación a la media aritmética.
n
∑n
i =1
i xi − m
e= n
∑n
i =1
i

Ejemplo: Calculemos la desviación media para el siguiente ejemplo; la media es m = 4,24
Distancia en Centros ( xi ) ni Efectivo xi − m ni xi − m

km acumulado
[0,1[ 0,5 353 353 3,74 1320,22
[1,2[ 1,5 159 512 2,74 435,66
[2,5[ 3,5 255 767 0,74 188,7
[5,10[ 7,5 147 914 3,26 479,22
[10,20[ 15 59 973 10,76 634,84
[20,50[ 35 27 1000 30,76 830,52
SUMA 1000 3889,16
Tenemos, sucesivamente:
- Amplitud: 50
- Q1 = 0 + 1*(250 – 0)/353 =0,71

- Q3 = 2 + 3*(750 - 512)/255 = 4,80
- Desviación intercuartil: Q3 – Q1 = 4,09
- Desviación media: e = 3889,16/1000 = 3,89
Sección III: Varianza
La VARIANZA (también llamada FLUCTUACIÓN) es la media de los cuadrados de las

desviaciones con relación a la media:
∑ ni ( xi − m)2
σ2 = i =1
n
∑n
i =1
i
La DESVIACIÓN ESTÁNDAR ó DESVIACIÓN CUADRÁTICA MEDIA (en inglés STANDARD

DEVIATION) es la raíz cuadrada de la varianza:
∑ ni ( xi − m)2
i =1
σ= n
∑n
i =1
i

Podemos expresar la varianza (así como la desviación estándar) bajo una forma diferente, pero
equivalente, a través de la utilización de una media provisoria µ .
De esta manera,
xi − m = ( xi − µ ) − ( m − µ )
2 2 2
( xi − m ) = ( xi − µ ) − 2 ( m − µ )( xi − µ ) + ( m − µ )
n n n n
∑ ni ( xi − m ) = ∑ ni ( xi − m ) − 2 ( m − µ ) ∑ ni ( xi − µ ) +∑ ni ( m − µ )
2 2 2
i =1 i =1 i =1 i =1
n n
Ya que m ∑ ni = ∑ ni xi , el último término se escribe:
i =1 i =1
n
 n n
  n n
 n
−2 ( m − µ ) ∑ ni ( xi − µ ) = −2 ( m − µ )  ∑ ni xi − µ ∑ ni  = −2 ( m − µ )  m∑ ni −µ ∑ ni  = − 2 ( m − µ ) ∑ ni
2
i =1  i =1 i =1   i =1 i =1  i =1
Finalmente:
n n n n n n
∑ ni ( xi − m ) = ∑ ni ( xi − µ ) + ( m − µ ) ∑ ni − 2 ( m − µ ) ∑ ni =∑ ni ( xi − µ ) − ( m − µ ) ∑n
2 2 2 2 2 2
i
i =1 i =1 i =1 i =1 i =1 i =1
de donde se deduce el teorema de Koenig:

n
∑ ni ( xi − µ )2 2
σ2 = i =1
n
− (m − µ )
∑ ni
i =1
Cómo la media provisoria µ es totalmente arbitraria, se puede tomar µ = 0 , lo que conduce a la

siguiente relación:
σ 2 = q 2 − m2
∑ ni xi2
con q 2 = i =1
n
que representa el cuadrado de la media cuadrática
∑ ni
i =1
En la jerga estadística, la precedente relación se lee “media de los cuadrados – cuadrado de la

media”.

Ejemplo: m = 4.24 y µ = 5
Distancia Centros ni 2 2 2 2
xi2 ni xi2
en Km.
( xi − m ) ni ( xi − m ) ( xi − µ ) ni ( xi − µ )
( xi )
[0,1[ 0,5 353 13,99 4 937,62 20,25 7 148,25 0,25 88,25
[1,2[ 1,5 159 7,51 1 193,71 12,25 1 947,75 2,25 357,75
[2,5[ 3,5 255 0,55 139,64 2,25 573,75 12,25 3 123,75
[5,10[ 7,5 147 10,63 1 562,26 6,25 918,75 56,25 8 268,75
[10,20[ 15 59 115,78 6 830,88 100,00 5 900,00 225,00 13 275,00
[20,50[ 35 27 946,18 25 546,80 900,00 24 300,00 1 225,00 33 075,00
SUMA 1000 40 210,90 40 788,50 58 188,50
La tabla permite calcular la varianza de diferentes formas:
• con la definición: σ 2 = 40 213,30/1000 = 40,21 de donde σ = 6.34

• con la media provisoria 5: σ 2 = 40 788,50/1000 -(4,24 - 5)2 = 40,21 de donde σ = 6,34
• con la media provisoria 0: σ 2 = 58 188,50/1000 - (4,24)2 = 40,21 de donde σ = 6,34
Sección IV: Coeficiente de variación
Cuando se dilata o contracta la escala de los caracteres, la dispersión de una serie estadística es
modificada. Así, en tal operación xi , σ, m se convierten en xí , σ´, m´ con xí = kxi , σ´=kσ,
m´= km .
Vemos que si la desviación típica y la media son modificadas, la relación de estas dos cantidades
queda invariable.
Esta relación es llamada COEFICIENTE DE VARIACIÓN:
σ
Coeficiente de variación =
m
Esta cantidad, cuyo valor queda invariable por cambio homotético de la escala, permite la
comparación de dos series estadísticas cuya escala de caracteres no es la misma.

Sección V: Índice de concentración
Ejemplo:
Distancia Centros ni Efectivo % de ni xi ni xi % de ni xi

en Km. ( xi ) acumulado efectivo acumulado acumulado
acumulado
[0,1[ 0,5 353 353 35,30 176,50 176,50 4,16
[1,2[ 1,5 159 512 51,20 238,50 415,00 9,79
[2,5[ 3,5 255 767 76,70 892,50 1 307,50 30,84
[5,10[ 7,5 147 914 91,40 1 102,50 2 410,00 56,84
[10,20[ 15 59 973 97,30 885,00 3 295,00 77,71
[20,50[ 35 27 1000 100,00 945,00 4 240,00 100,00
SUMA 1000 4 240,00
Representemos gráficamente el porcentaje de ni xi acumulados en función del porcentaje de

efectivos acumulado. Se obtiene una curva, llamada CURVA DE LORENTZ ó CURVA DE
CONCENTRACIÓN que se inscribe en un cuadrado.
Si la populación estuviera uniformemente repartida, las dos columnas (% de efectivo acumulado y

% de ni xi acumulado) serían idénticas. Este caso correspondería a una concentración nula y la
curva de concentración estaría confundida con la diagonal del cuadrado (recta de equirepartición).
100
80
Recta de equirepartición
% de n ixi acumulados
60
A
40
a
20
Curva de Lorentz
0
0 20 40 60 80 100
% de efectivo acumulado

Mientras más se aleje la curva de Lorentz, de la recta de equirepartición, la concentración será
más fuerte. Conviene medir la concentración a través de un ÍNDICE DE CONCENTRACIÓN
llamado ÍNDICE DE GINI:
a
Índice de Gini =
A
Donde a es el área de la superficie delimitada por la curva de Lorentz y la recta de equirepartición

y Α es el área de la mitad del cuadrado, o sea 5000. Para nuestro ejemplo, el índice de Gini vale
0,68. ¡Calcúlenlo!
Se observa que el índice de Gini esta comprendido entre 0 y 1; el valor 0 corresponde a una
concentración nula y el valor 1 a la máxima concentración.
Sección VI: Asimetría y curtosis
6.1- Asimetría
Hemos evocado la repartición de los diferentes parámetros de posición en la sección IV del

capítulo anterior. El concepto de asimetría se refiere a si la curva que forman los valores de la
serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética).
Para medir el nivel de asimetría se utiliza el COEFICIENTE DE ASIMETRÍA DE FISHER:

1 n 3
  × ∑ ni xi − x
( )
F=  N  i =1
3
 1  n 2 2
 N  ∑
× ni(xi − x  )
   i =1 
- Si F = 0; la distribución es simétrica; existe la misma concentración de valores a la derecha y a la

izquierda de la media.
- Si F > 0; la distribución es asimétrica positiva; existe mayor concentración de valores a la
izquierda de la media que a su derecha.
- Si F < 0; la distribución es asimétrica negativa; existe mayor concentración de valores a la
derecha de la media que a su izquierda.

Ejemplo: Calculemos el Coefiente de Asimetría de Fisher de la siguiente serie:
Variable Efectivos
(Estatura) ( x − x)
i (
ni xi − x ) (
ni xi − x
2
) (
ni xi − x
3
) (
ni xi − x
4
)
120 1 -5.3 -5.3 28.09 -148.877 789.0481
121 4 -4.3 -17.2 73.96 -318.028 1367.5204
122 4 -3.3 -13.2 43.56 -143.748 474.3684
123 2 -2.3 -4.6 10.58 -24.334 55.9682
124 1 -1.3 -1.3 1.69 -2.197 2.8561
125 2 -0.3 -0.6 0.18 -0.054 0.0162
126 3 0.7 2.1 1.47 1.029 0.7203
127 3 1.7 5.1 8.67 14.739 25.0563
128 4 2.7 10.8 29.16 78.732 212.5764
129 3 3.7 11.1 41.07 151.959 562.2483
130 3 4.7 14.1 66.27 311.469 1463.9043
304.7 -79.31 4954.283
Media aritmética de la muestra: x = 1.253

n 3
∑ ni xi − x = −79.31
i =1
( )
n 2
∑ n ( x − x)
i =1
i i = 304.7
1
× −79.31
F= 30 −0.08
3
 1 2
 × 304.7 
 30 
El Coeficiente de Simetría de Fisher de esta muestra es -0,08, lo cual significa que presenta una
distribución asimétrica negativa (se concentran más valores a la izquierda de la media que a su
derecha). Sin embargo, pudiéramos debatir de la relevancia de dicha asimetría.
6.2- Curtosis
El COEFICIENTE DE CURTOSIS analiza el grado de concentración que presentan los valores

alrededor de la zona central de la distribución.
1 n 4
  ∑ × n i xi − x ( )
C =   i =1
N
2
−3
 1  n 2
  N  × ∑ ni xi − x 
( )
   i =1 

Se definen 3 tipos de distribuciones según su grado de curtosis:
- Si C = 0; tenemos una DISTRIBUCIÓN MESOCÚRTICA: presenta un grado de concentración

medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución
normal).
- Si C > 0; tenemos una DISTRIBUCIÓN LEPTOCÚRTICA: presenta un elevado grado de

concentración alrededor de los valores centrales de la variable.
- Si C < 0; tenemos una DISTRIBUCIÓN PLATICÚRTICA: presenta un reducido grado de

concentración alrededor de los valores centrales de la variable.
Ejemplo: Calculemos el Coefiente de Curtosis de la serie de datos anterior:

Media aritmética de la muestra: x = 1.253
n 4
∑ n ( x − x)
i =1
i i = 0.00004967
n 2
∑ n ( x − x)
i =1
i i = 0.03046667
1
× 4954.28
C= 30 − 3 −1.40
2
 1 
 × 304.7 
 30 
El Coeficiente de Curtosis de esta muestra es -1,40, lo cual significa que se trata de una
distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores
centrales de la distribución.
Sección VII: Diagrama de cajas
Para sintetizar la información de una serie estadística, podemos usar un diagrama de cajas.
Presentaremos el método de construcción de dicho diagrama y reflexionaremos sobre formas de
mejorarlo.
Es una representación grafica que permite representar varias medidas de tendencia central así
como el intervalo intercuartil. Comúnmente, la mayoría de las representaciones cuentan con los
siguientes datos:

- Línea central: Mediana
- Lados de las cajas: Q1 y Q3, de donde sacamos el intervalo intercuartil II = Q3-Q1.
- Límites internos:
• A = Q1 − 1.5 × II
• B = Q3 + 1.5 × II
- Datos discordantes se representan mediante asteriscos*.
No nos interesaremos en los datos discordantes en este curso de estadística descriptiva. Sin
embargo, podemos considerar mejorar la información representada aquí. En efecto, realizar un
diagrama de caja puede provocar para ciertas series que los límites internos de la caja se
encuentren fuera de la amplitud de la serie estadística. Por esta razón preferimos representar el
mínimo y el máximo de la serie como límites internos. También podemos considerar representar
los tres parámetros de posición que conocemos.
Ejemplo: Una empresa que explota una flota de taxis consigno para 100 taxis, las distancias que
habían recorrido antes de ponerlos de baja.
Distancia recorrida [80,85[ [85,90[ [90,95[ [95,100[ [100,105[ [105,110[ [110,115[ [115,120[
(miles de km)
Número de taxis 5 9 14 18 25 16 7 6
Frecuencia 5% 9% 14% 18% 25% 16% 7% 6%
- Calcular la moda, la mediana y la media aritmética.

• clase modal: [100;105[, moda x0 = 102.5
4×5
• mediana: xm = 100 + = 100,8
25
• media aritmética: x = 100.25

- Calcular el primer y el tercer cuartil.
5 × 11
• Q1 = 90 + 93.93
14
5× 4
• Q3 = 105 + = 106.25
16
- Representar la información de este ejercicio mediante un diagrama de cajas.
120
115
110
105
Distancia
moda
mediana
100 media aritmética
95
90
85
80
Este diagrama de cajas pudiera ser mejorado representando los intervalos  x − σ ; x + σ  y

 
 x − 1.96σ ; x + 1.96σ  .
 

V – NOCIÓN DE PROBABILIDADES:
Las siguientes líneas son pretensión alguna. Ellas no buscan constituir un curso de probabilidad
exhaustivo y riguroso (sobretodo en el plano matemático). Nuestro objetivo es esencialmente
utilitario. Es por esta razón que se evoca a menudo la intuición con un “enmascarado” más o
menos exitoso de las nociones matemáticas complejas, que solo harían más pesada la exposición
sin dar verdaderas herramientas para el cálculo efectivo y concreto de las probabilidades.
Siguiendo la formula conocida, el lector esta invitado a leer textos básicos para profundizar más
sus conocimientos.
Sección I: Prueba y eventos
Al hombre siempre le gustó el juego. Dicho gusto lo llevo a conducir experiencias aleatorias, por
ejemplo, sacar una carta al azar de un juego de 32 cartas.
En el vocabulario de las probabilidades, esta experiencia se llama PRUEBA.
Una experiencia puede llevarnos a diferentes resultados por ejemplo, sacar la reina de corazones
o el as de espadas. Cada vez, se trata de un evento diferente.
Un EVENTO es la realización de uno o varios resultados procedentes de la prueba efectuada.
Ejemplo: Sacamos una carta al azar de un juego de 32 cartas.
Sacar una reina es un evento.
Si se saca la reina de corazones, la reina de diamantes, la reina de espadas o la reina de

tréboles, entonces el evento “sacar una reina” se realizó. Sin embargo, se saca una sola carta.

Sección II: Evento elemental
Un EVENTO ELEMENTAL es un evento que tiene un solo resultado.
Ejemplo: Sacar la reina de diamantes es un evento elemental.
Para que se realice el evento, una sola carta debe de ser sacada: la reina
de diamantes.
El evento “sacar una reina” está compuesta por cuatro eventos elementales:
- Sacar la reina de corazones.
- Sacar la reina de diamantes.
- Sacar la reina de espadas.
- Sacar la reina de tréboles.
Decimos que el evento “sacar una reina” es la reunión de los cuatro eventos elementales
precedentemente evocados.
Sección III: Reunión de eventos
Consideramos dos eventos A y B. La reunión de los eventos A y B es

A B
un evento notado A ∪ B . Para que se realice el evento A ∪ B , es
necesario que se realice el evento A O que se realice el evento B. LA
REUNIÓN DE LOS EVENTOS A y B es el evento A o B.
Ejemplo: Consideramos los dos eventos:
A: “Sacar una reina” B: “Sacar una carta de espadas”
La reunión de estos dos eventos es el evento:

A ∪ B : “Sacar una reina o una carta de espadas”

Nota: Para que se realice la reunión de estos dos eventos, necesitamos que cualquiera de estas
once cartas sea sacada; una de las cuatro reina o una de las ocho cartas de espadas. La reina de
espadas siendo una reina y una carta de espadas, ha sido contada dos veces.
Sección IV: Intersección de eventos
Consideramos dos eventos A y B. La intersección de los eventos A y B

A B
es un evento notado A ∩ B . Para que se realice el evento A ∩ B , es
necesario que se realice el evento A Y que se realice el evento B. LA
INTERSECCIÓN DE LOS EVENTOS A y B es el evento A y B.
A: “Sacar una reina” B: “Sacar una carta de espadas”
La intersección de estos dos eventos es el evento:

A ∩ B : “Sacar una reina y una carta de espadas”
Nota : Para que se realice la intersección de estos dos eventos, necesitamos sacar una carta que
sea a la vez una reina y una carta de espadas. Necesitamos sacar a la reina de espadas.
Sección V: Eventos disjuntos o incompatibles
Consideramos dos eventos A y B. Los eventos A y B son

A B
DISJUNTOS o INCOMPATIBLES si no tienen ningún resultado
en común (en otras palabras su intersección debe de ser vacía).
Dos eventos disjuntos o incompatibles no pueden realizarse al mismo tiempo ya que no tienen
ningún resultado en común. Así, si uno está realizado, el otro no puede serlo.

A: “Sacar una reina” B: “Sacar una jota”
Estos dos eventos son disjuntos o incompatibles. En efecto, cuando sacamos una jota, no
sacamos una reina.
Sección VI: Evento contrario
El EVENTO CONTRARIO del evento A está realizado cuando el evento A no lo es.

El EVENTO CONTRARIO del evento A se nota A .
El EVENTO CONTRARIO del evento A es el evento NO(A)
Ejemplo: el evento contrario al evento “sacar una reina” es el evento “sacar cualquier carta menos
una reina”.
Nota:
- La reunión de un evento y de su evento contrario siempre se realiza. En efecto, cualquier
carta puede ser sacada.
- La intersección de un evento y de su evento contrario nunca se realiza. En efecto, si una
carta forma parte del evento A, no puede formar parte de su contrario A .
Nota:
- El evento “contrario de una reunión” es el evento “intersección de los eventos contrarios”.
A ∪ B = A ∩ B o sea No(A o B) = No(A) y No(B)
- El evento “contrario de una intersección” es el evento”reunión de los eventos contrarios”.
A ∩ B = A ∪ B o sea No(A y B) = No(A) o No(B)

Sección VII: Partes de un conjunto, evento y ley probabilidad
Consideramos un conjunto no vacío E, cuyos elementos son cualesquiera. Las PARTES de E son
los conjuntos que se pueden formar a partir de los elementos de E.
Ejemplo: E = {a, b, c, d}
a, b, c, d son ELEMENTOS de E
{a, b}, {c, d}, {a, b, c}, {b}, E, F = {} son partes de E
Todas las partes de E son:
Llamamos
Parte conAMPLITUD
0 elementos: ∅ ={ }
Noción
Partes con 1 elemento: {a}, {b}, {c}, {d} de Probabilidades
Partes con 2 elementos: {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}
Partes con 3 elementos: {a, b, c}, {a, b, d}, {a, c, d}, {b, c, d}
Acontecimientos
Partes con 4 elementos: E = {a, b, c, d} y probabilidades
Propiedades de las probabilidades
Por lo tanto hay 16 partes para E. Casos
El conjunto de las partes de un conjunto E es denotado por P(E). Veremos que el número de
elementos de P(E) es 2n si E posee n elementos.
Ejemplo: retomando el anterior ejemplo, vemos claramente:
P(E) = { ∅, {a}, {b}, {c}, {d}, {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}, {a, b, c}, {a, b, d}, {a, c, d},
{b, c, d}, E}
y se constata que 16 = 24.
De ahora en adelante, llamaremos eventos a los elementos de P(E) y definiremos una aplicación
p de P(E) en (conjunto de números reales) que satisface los siguientes axiomas:
- Axioma 1: ∀A ∈ P ( E ) , p ( A ) ≥ 0
- Axioma 2: p ( E ) = 1
- Axioma 3: si A ∩ B = ∅ , entonces p ( A ∪ B ) = p ( A ) + p ( B )
Esta aplicación p se llama LEY DE PROBABILIDAD en P(E). Es una función que a un evento
hace corresponder un número real comprendido entre 0 y 1.
Nota: E es el EVENTO SEGURO. ∅ es el EVENTO IMPOSIBLE. {a}, {b}, {c}, {d} son EVENTOS
ELEMENTALES (no podemos fabricarlos a partir de elementos más simples). Si A∩B=∅, A y B
son EVENTOS INCOMPATIBLES O DISJUNTOS. Si A es el complementario de A, entonces A y
A son EVENTOS CONTRARIOS.

Ejemplo: E = {a, b, c, d}
{a} y {b, c, d} son eventos contrarios, así como E y ∅ ó aún {a, b} y {c, d}. {a} y {b, c} son
incompatibles, así como {a} y {c} ó aún {a, b} y {c, d}
Por otro lado, veremos que los sucesos contrarios son incompatibles, pero lo inverso no es
verdad: {a} y {b, c, d} son contrarios, por lo tanto incompatibles, pero {a} y {b, c} son
incompatibles pero no son contrarios.
Sección VIII: Cálculos básicos de probabilidades
8.1 - Probabilidad :
La probabilidad de ocurrencia de un evento A, notada p(A) se define en forma general como:
Número de casos favorables

p ( A) =
Número de casos posibles
8.2 - Caso de equiprobabilidad:
Sacamos al azar una carta de un juego de 32 cartas. Cada carta tiene la misma probabilidad de
ser sacada.
- ¿Cuál es la probabilidad de sacar la reina de tréboles?
Como tenemos 32 cartas, que cada carta tiene la misma probabilidad de ser sacada y que el
juego tiene una solo reina de tréboles, la probabilidad de sacar la reina de tréboles es:
Número de casos favorables = 1 1
p (" Sacar la reina detréboles ") = =
Número de casos posibles = 32 32
- ¿Cuál es la probabilidad de sacar una reina?
El juego cuenta con 4 reinas. Por lo tanto:

Número de casos favorables = 4 4 1
p (" Sacar una reina ") = = =
Número de casos posibles = 32 32 8
Nota: acostumbraremos expresar las probabilidades bajo forma de quebrados irreductibles.
- ¿Cuál es la probabilidad de sacar una carta de espadas?
El juego cuenta con 8 cartas de espadas. Por lo tanto, tenemos 8 casos favorables entre 32. El
evento “no sacar una carta de espadas” es el evento contrario al evento “sacar una carta de
espadas”. En consecuencia:
8 1 3
p (" No sacar una carta de espadas ") = 1 − p (" Sacar una carta de espadas ") = 1 − = 1 − = = 75%
32 4 4

Nota: Una consecuencia importante del esquema equiprobabilístico, es que la suma de las
probabilidades relativas a una experiencia es igual a 1. Efectivamente, sean A, B,… los eventos
incompatibles, resultados de la experiencia y sean n(A), n(B),…su número de casos favorables
(no hay un doble conteo).
Entonces:
n ( A ) + n ( B ) ... = n
Dividiendo por n, obtenemos:
n ( A) n(B) n
+ ... =
n n n
⇔ p ( A ) + p ( B ) ... = 1
8.3 - Caso de no-equiprobabilidad:
Idealmente, cuando lanzamos un dado bien equilibrado, tenemos un caso de equiprobabilidad, es

decir cuando tenemos la misma probabilidad de obtener un dos que un cuatro. Las cosas son
diferentes cuando el dado está desequilibrado o truqueado.
Ejemplo: Sea un dado truqueado. La prueba aleatoria consiste en lanzar el dado una vez. La ley
de probabilidad de la prueba es la siguiente:
Cara 1 2 3 4 5 6
Probabilidad 0,2 0,1 0,3 0,1 0,2 0,1
La probabilidad de obtener un cinco es de 0.2 o sea de 2 entre 10.
- ¿Cuál es la probabilidad de obtener un 3?

La probabilidad de obtener un 3 es de 0.3 o sea de 3 entre 10.
- ¿Cuál es la probabilidad de obtener un número par?
Los números pares que podemos obtener con el dado son 2, 4 y 6. El evento “obtener un número
par” se realiza cuando obtenemos un 2, un 4 o un 6.
El evento “número par” es la reunión de los tres eventos elementales “2”, “4”, “6”.
En consecuencia:
p (" Número par ") = p ("2") + p ("4") + p ("6")
= 0.1 + 0.1 + 0.1
= 0.3
Tenemos la misma probabilidad de obtener un tres que un número par.

Sección IX: Propiedades de las probabilidades
De los axiomas de definición, se pueden deducir las siguientes consecuencias:

- Propiedad 1: si A ⊂ B entonces p ( A ) ≺ p ( B )
- Propiedad 2: p ( A ) ≤ 1, ∀A ∈ p ( E )
- ( )
Propiedad 3: p A = 1 − p ( A ) , ∀A ∈ p ( E )
- Propiedad 4: p ( ∅ ) = 0
- Propiedad 5: p ( A ∪ B ) = p ( A ) + p ( B ) − p ( A ∩ B )
Ejemplo: Sea un juego de 52 cartas.
a) Los eventos {corazón}, {trébol}, {diamante} y {espada} son disjuntos. Tendremos:

p(“sacar un corazón”) = p({corazón}) = 1 - p({trébol} ∪ {diamante} ∪ {espada}) = 1 - p({trébol}) -
p({diamante}) - p({espada})
b) p(“sacar una carta cualquiera”) = 1
c) p(“sacar un corazón ó un 10”) = p({corazón})+p({10})-p({10} ∩ {corazón})
Nota: p({corazón}) = p({as de corazones} ∪ {2 de corazones} ∪ {3 de corazones} ∪ …… ∪ {10 de

corazones} ∪ {jota de corazones} ∪ {reina de corazones} ∪ {rey de corazones}) = p({as de
corazones}) + p({2 de corazones}) + p({3 de corazones}) + …… + p({10 de corazones}) + p({jota
de corazones}) + p({reina de corazones}) + p({rey de corazones}).
Nota: p({10}) = p({10 de corazones} ∪ {10 de tréboles} ∪ {10 de diamantes} ∪ {10 de espadas}) =
p({10 de corazones}) + p({10 de tréboles}) + p({10 de diamantes}) + p({10 de espadas}).
Así: p(“sacar un corazón ó un 10”) = p({as de corazones}) + p({2 de corazones}) + p({3 de

corazones}) + …… + p({sota de corazones}) + p({reina de corazones}) + p({rey de corazones}) +
p({10 de corazones}) + p({10 de tréboles}) + p({10 de diamantes}) + p({10 de espadas}).

VI – ENUMERACIONES:
Sección I: Conocimientos previos
Antes de proponerse estimar probabilidades, algunas nociones elementales deben ser dominadas.
Se trata del cardinal de un conjunto y la factorial de un número entero.
1.1 - Definición del cardinal de un conjunto:
El CARDINAL DE UN CONJUNTO E es el número de elementos que contiene. Se nota

Card ( E ) .
Ejemplo: Sea E, el conjunto de las vocales del alfabeto. E = {a; e; i; o; u} . El conjunto E tiene 5
elementos. Por lo tanto Card ( E ) = 5 .
1.2 - Definición de la factorial de un número entero:
Sea n un número entero no nulo. El número FACTORIAL n es el entero notado n! igual al

producto de los n primeros enteros no nulos.
n ! = 1 × 2 × 3 × 4 × ... × (n − 1) × n
Ejemplo:
1! = 1 =1 4! = × 2
1 × 3 × 4 = 24
producto del primer producto de los cuatro
entero no nulo primeros enteros no nulos
También se define la factorial de 0. Como sería vano hablar del producto de los 0 primeros
enteros, admitiremos por razones de compatibilidad que 0! = 1 .
1.3 - Una aplicación importante:
n!
Consideremos el ratio , donde suponemos que n es mayor que p.
p!
Esta fracción se puede escribir:
n ! 1 × 2 × 3 × 4 × ... × ( p − 1) × p × ( p + 1) × ... × (n − 1) × n
= = ( p + 1) × ... × (n − 1) × n
p! 1 × 2 × 3 × 4 × ... × ( p − 1) × p
Ejemplo:
131!
= 129 × 130 × 131 , un simplificación que será muy útil a continuación.
128!

Sección II: p-listas
Una p-lista de elementos de un conjunto E es una lista ordenada de p elementos del conjunto E.
Ejemplo: Sea E, el conjunto de las vocales del alfabeto. E = {a; e; i; o; u} .

- En una p-lista, un elemento puede aparecer varias veces. También puede no aparecer. Por
ejemplo, aei y auu son dos 3-listas de este conjunto E.
- En una p-lista, tomamos en cuenta el orden. Así, aei, eai, iae y aie son cuatro 3-listas
diferentes del conjunto E.
- Una p-lista puede tener tantos elementos como querremos. Con nuestro conjunto E,
podemos formar 7-listas como aeiiouu, también pudiéramos formar 5656-listas, aunque
esto sea de poco interés.
Sin embargo, las p-listas se usan mucho. Imaginemos una urna E conteniendo las 5 vocales del
alfabeto. Sacamos sucesivamente siete veces seguidas una vocal que volvemos a colocar
inmediatamente a la urna. Estamos entonces constituyendo 7-listas.
Nos preguntamos cuantas 7-listas se pueden constituir con las 5 vocales del alfabeto.
En una 7-lista, tenemos 7 posiciones que ocupar. Veamos como:
POSICIÓN 1: POSICIÓN 2: POSICIÓN 3: POSICIÓN 4: POSICIÓN 5: POSICIÓN 6: POSICIÓN 7:
Una vocal que Una vocal que Una vocal que Una vocal que Una vocal que Una vocal que Una vocal que
escoger entre: escoger entre: escoger entre: escoger entre: escoger entre: escoger entre: escoger entre:
aeiou aeiou ae iou a eiou a eiou aeiou aeiou
5 posibilidades 5 posibilidades 5 posibilidades 5 posibilidades 5 posibilidades 5 posibilidades 5 posibilidades
En total, tenemos 5 5 × 5 × 5 × 5 = 57 posibilidades.

× 5 × 5 ×
5 vocales posibles por posición
¿Porqué multiplicar? Simplemente porque para cada primera vocal posible, tenemos cinco formas
de escoger la segunda vocal y para cada segunda vocal posible, tenemos cinco formas de
escoger la tercera vocal…
En efecto, si la primera vocal sacada es la a, entonces tengo cinco posibilidades para la segunda
vocal. Sin embargo, lo que es cierto para a también lo es para las posibles primera vocal e, i, o y
u.
Para esta pareja de vocales, tengo 5 × 5 = 52 = 25 posibilidades. Ahora, para cada duo posible de
primeras letras, tengo 5 formas de escoger la tercera letra o sea 5 × 5 × 5 = 53 = 125 posibilidades.
Vemos que las posibilidades de formar listas diferentes van multiplicándose por 5 para cada vocal
suplementaria. Si hiciéramos un árbol, tendríamos cinco ramas más a cada extremidad.
En conclusión, tendremos 57 7-listas posibles en un conjunto de 5 elementos.
En un conjunto E a n elementos, se pueden formar n p p-listas.
Porque en cada una de las p posiciones, podemos escoger una vocal entre n.

Sección III: Ordenamientos y permutaciones
Un ordenamiento es una p-lista particular en la cual un mismo elemento puede aparecer una sola
vez.
2.1 - Definición de un ordenamiento:
Un ORDENAMIENTO a p elementos de E es una p-lista de elementos distintos.
Esta definición nos conduce a las siguientes consecuencias:

- Un ordenamiento es una p-lista en la cual un mismo elemento de E aparece una sola vez
como máximo. Por ejemplo, en el conjunto E = {a; e; i; o; u} de las vocales del alfabeto, aei
es un ordenamiento de 3 elementos o sea un 3-ordenamiento. Al contrario, aea no es un
ordenamiento ya que el elemento a aparece dos veces. Es una 3-lista.
- Un ordenamiento es un caso particular de p-lista. En consecuencia el orden de los
elementos importa. Por lo tanto, aei y iea son dos 3-ordenamientos diferentes.
- Como en un ordenamiento un elemento puede aparecer una sola vez como máximo, un
ordenamiento de elementos de E cuenta como máximo con el mismo número de
elementos que E. Por ejemplo, en el conjunto E = {a; e; i; o; u} , aeiou es un ordenamiento
de 5 elementos. Vemos que no pudiera haber ordenamiento de 6 elementos.
El resultado de un ordenamiento pudiera ser comparado con lo siguiente: imaginemos una urna E
conteniendo las 5 vocales del alfabeto. Un ordenamiento de p elementos consistiría en sacar de la
urna p veces seguidas una vocal que no volveríamos a colocar a la urna.
2.2 - Conteo de p-ordenamientos:
La pregunta que nos hacemos aquí es la siguiente: ¿Cuánto p-ordenamientos existen en un

conjunto de n elementos?
Ejemplo: Contemos el número de 3-ordenamiento posibles en nuestro conjunto E = {a; e; i; o; u} .

Tenemos que formar grupos de 3 elementos o sea que tenemos 3 vocales que asignar en tres
posiciones distintas. ¡Sin embargo no olvidemos que a diferencia de las p-listas, una misma vocal
no puede aparecer dos veces!
POSICIÓN 1: POSICIÓN 2: POSICIÓN 3:
Una vocal que Una vocal que Una vocal que

escoger entre: escoger entre escoger entre
las cuatro las tres
a eiou restantes: restantes:
5 posibilidades 4 posibilidades 3 posibilidades
En total, tenemos 5 × 4 × 3 = 60 posibilidades.
El número de 3-ordenamientos posibles en un conjunto de 5 elementos se nota:

3
A 5
= 5× 4×3

Ejemplo: Contemos ahora el número de p-ordenamientos en un conjunto de n elementos.
POSICIÓN 1: POSICIÓN 2: POSICIÓN 3: ... POSICIÓN p:
Un elementos UUn elementos Un elementos ... Un elementos

que escoger que escoger que escoger que escoger
entre n : entre n - 1 : entre n - 2 : ... entre n - p + 1 :
...
n-1 n-2 n-p+1
n posibilidades posibilidades posibilidades posibilidades
En total, tenemos n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1) posibilidades.

Este número de p-ordenamientos en un conjunto de n elementos se nota:
p
A n
Interesémonos un poco más a este último término. Sabemos que:

p
A n
= n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1)
Introduciendo la noción de factorial, podemos escribir que:

p
A n
= n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1)
n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1) × ( n − p ) × ... × 3 × 2 × 1 n!
= =
( n − p ) × ... × 3 × 2 × 1 ( n − p )!
Esto aplica perfectamente a nuestro primer ejemplo:
3
A 5
= 5× 4×3
5 × 4 × 3 × 2 ×1 5! 5!
= = =
2 ×1 ( 5 − 3)! 2!
Tenemos entonces una nueva expresión del número de p-ordenamientos en un conjunto de n
elementos:
p n!
A = n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1) =
n
( n − p )!
2.3 - Permutaciones:
Una PERMUTACIÓN o VARIACIÓN es un ordenamiento particular a n elementos. En otras

palabras, se trata de un n-ordenamiento en un conjunto de n elementos.
Para contar el número de permutaciones posibles en un conjunto de n elementos, estamos

buscando:
n n! n! n!
A = ( n − n )! = 0! = 1
n
= n!

Sin embargo, ningún cálculo era necesario. Lógicamente, pudiéramos interrogarnos sobre el
número de formar de ocupar n posiciones con n elementos. En la literatura, podemos encontrar:
P n
= n!
Sección IV: Combinaciones
En matemáticas, una combinación refiere a un sub-conjunto de un conjunto E más grande.
Una COMBINACIÓN a p elementos sobre un conjunto E de n elementos es una parte de E que

contiene p elementos (lo cual supone que p < n).
Esto implica diferencias con las p-listas y los ordenamientos.

- Al contrario de una p-lista o de un ordenamiento, el orden en una combinación no importa
dado que las combinaciones son sub-conjuntos. Por ejemplo, en el conjunto
E = {a; e; i; o; u} de las vocales del alfabeto, hablamos de la combinación aei o de la
combinación eai. Se trata de la misma combinación, de la misma parte de E.
- Toda parte de un conjunto E necesariamente cuenta con menos elementos que E. Por
ejemplo, en el conjunto E = {a; e; i; o; u} de las vocales del alfabeto, una combinación
tendrá un máximo de 5 elementos.
El resultado de una combinación pudiera ser comparado con sacar simultáneamente de una urna
E conteniendo las 5 vocales del alfabeto, p vocales.
La pregunta que nos hacemos es la siguiente: ¿Cuántos combinaciones a p elementos pueden

existir en un conjunto de n elementos? Este número se nota:
p
C n
Ejemplo: ¿Cuántas combinaciones de 3 elementos existen en el conjunto E = {a; e; i; o; u} ?

Para saberlo, utilizaremos la dualidad ordenamiento – combinación. En efecto lo que separa estas
dos nociones es el orden que solo aparece en la noción de ordenamiento.
¿Con la combinación aei, cuántos 3-ordenamientos podemos formar? En otras palabras, cuantas
permutaciones existen de la 3-combinación aei.
La respuesta es: 3! = 6 . Las podemos enumerar: aei, aie, eai, eia, iae, iea.
Esto aplica para todas las 3-combinaciones de E. Con cada 3-combinación, podemos formar 6 3-
ordenamientos.
3
Sabemos que existen A 5
ordenamientos de 3 elementos en el conjunto E.
En consecuencia, existen A 5
combinaciones de 3 elementos.
3!
Por lo tanto:
3
C = A3!
3 5 60
5
= = 10
6

Apliquemos este razonamiento en el caso general:
Ejemplo: ¿Con una combinación de p elementos, cuántos p-ordenamientos podemos formar?

En otras palabras, buscamos el número de permutaciones posibles en un conjunto de p
elementos. La respuesta es p ! .
Así, para cada combinación de p elementos, tenemos p ! ordenamientos de p elementos.
Sabemos que existen A

p
ordenamientos de p elementos. Consecuentemente, existen A n
n
p!
combinaciones de p elementos.
Tenemos:
p
n × ( n − 1) × ( n − 2 ) × ... × ( n − p + 1) 60
C = Ap!
p n n!
= =
n
p! p !( n − p )!
Interesémonos en algunas combinaciones particulares:

0
- ¿Cuánto vale C n
? Se trata del número de partes de 0 elementos en un conjunto E de n
elementos. La parte a 0 elementos es el conjunto vacío notado ∅ . Consecuentemente:
0
C n
=1.
1
? Se trata del número de partes de 1 elemento en un conjunto E de n
elementos. Encontraremos tantos sub-conjuntos como tenemos de elementos.
1
Consecuentemente: C n
= n.
n
? Se trata del número de partes de n elementos en un conjunto E de n
n
elementos. Solo hay uno, E mismo. Consecuentemente: C n
=1.

Sección V: Criterios y principios a conocer
Las p-listas, los ordenamientos y las combinaciones son nociones de enumeración. Lo importante
es definir en qué situación, cada una de estas nociones debe ser utilizada.
Cada situación de enumeración se puede asimilar a “sacar elementos de una urna” Dos criterios
permiten caracterizar esta prueba: si se vuelve o no a colocar el elemento sacado y si el orden en
el cual se sacan los elementos importa o no.
- Si sacamos los elementos uno a uno en orden y que los volvemos a colocar a la urna
después de sacarlos y antes de volver a sacar un nuevo elemento, estamos constituyendo
p-listas.
- Si sacamos los elementos uno a uno en orden y que no los volvemos a colocar a la urna
después de sacarlos y antes de volver a sacar un nuevo elemento, estamos constituyendo
ordenamientos.
- Si sacamos los p elementos requeridos simultáneamente y que no importa el orden,
estamos constituyendo combinaciones.
Ejemplo: En el jockey Plaza, se presentan 20 caballos para una carrera. Dos modalidades de
apuestas son posibles. Uno puede apostar sobre los tres primeros caballos en orden o apostar
sobre los tres primeros caballos en desorden.
- ¿Cuántos resultados diferentes en orden son posibles?

Querremos saber cuántas llegadas diferentes de 3 caballos en orden se pueden formar con
los 20 caballos presentes.
3 20! 20!
Se trata de un ordenamiento, tenemos A = = = 20 × 19 × 18 = 6840
20
( 20 − 3)! 17!
- ¿Si apostamos a tres caballos en orden al azar, qué probabilidad de ganar tenemos?
Para ganar, existe un solo caso favorable, tener los tres caballos en orden. Sin embargo
existen 6840 casos posibles. La probabilidad de ganar será:
1
p ( ganar ) = 0.000146 0.0146%
6840
- ¿Cuántos resultados diferentes en desorden son posibles?

Querremos cuántos tríos de caballos ganadores se puede formar con los 20 caballos
presentes.
3 20! 20! 20 × 19 × 18
Se trata de una combinación, tenemos C = = = = 1140
20
3!( 20 − 3)! 17!3! 6
- ¿Si apostamos a tres caballos en desorden al azar, qué probabilidad de ganar
tenemos?
Para ganar, existe un solo caso favorable, tener los tres caballos que ganaron sin importar su
orden de llegada. Sin embargo existen 1140 casos posibles. La probabilidad de ganar será:
1
p ( ganar ) = 0.000877 0.0887%
1140

Sección VI: Coeficientes binomiales
p
Los C n
también aparecen en la literatura como COEFICIENTES BINOMIALES porque
intervienen en la fórmula del binomio de Newton. Para apreciarlo, revisaremos primero algunas
propiedades de los coeficientes binomiales.
6.1 - Número de partes de un conjunto:
Siendo un conjunto E de n elementos. ¿Cuántas partes se pueden hacer con este conjunto?
Como lo hemos visto anteriormente, tenemos:
0
- Número de partes de 0 elementos: C =1. n
1
- Número de partes de 1 elemento: C = n . n
n
- Número de partes de n elementos: C = 1 . n
Consideremos también:
2 n ( n − 1)
- Número de partes de 2 elementos: C n
= .
2
p
- Número de partes de p elementos: C n
.
Por lo tanto, el número de partes del conjunto E es:

0 1 2 p −1 n −1 n
N = C n + C n + C n + ... + C n + ... + C n + C n (regresaremos sobre este tema a continuación)
Ejemplo: ¿Cuántas partes se pueden hacer con un conjunto de 4 elementos?
Respuesta: N = 1 + 4 + 6 + 4 + 1 = 16
6.2 - Relaciones entre coeficientes binomiales:
Según las fórmulas de combinaciones, tenemos:

p n! n− p n! n!
C = y C = =
n
p !( n − p )! n
( n − p )!( n − ( n − p ) )! ( n − p )! p !
Por lo tanto:
p n− p
C n
=Cn
y en particular:
0 n
C =C n n
=1
p
La siguiente propiedad nos permitirá calcular sucesivamente las C n
:
p p +1 p +1
C +C n n
= C n +1

En efecto:
Sea E un conjunto de n+1 elementos y consideremos un elemento particular a de este conjunto.
p +1
El número de combinaciones de p+1 elementos de este conjunto es C n +1
Dentro de estas (p+1)-combinaciones, tenemos las combinaciones que contienen a y las que no lo
contienen.
- Las combinaciones que contienen a tienen la forma:
a p otros elementos de E
Todas contienen a y p otros elementos que escoger entre los n+1 elementos de E. Esto nos
p
da un total de C n
combinaciones.
- Las que no contienen a están compuestas p+1 elementos que escoger entre los n+1
elementos de E a excepción de a. Finalmente solo se podrá escoger entre n de los n+1
elementos de E
p +1
Tendremos C n
combinaciones posibles.
- En conclusión, tenemos :
p p +1 p +1
C +C n n
= C n +1
Gracias a esta relación, podemos construir una tabla de número llamada triángulo de Pascal.
6.3 - Triángulo de Pascal:
p=0 p=1 p=2 … … p = p-1 p=p …

0
n=0 C 0
=1
0 1
n=1 C 1
=1 C 1
=1
0 1 2
n=2 C 2
=1 C
2
=2 C 2
=1
… … … … … …
… … … … … …
p −1 p
n = n-1 C n −1 Cn −1
p
n=n … … … … … … C n
Concretamente:
p=0 p=1 p=2 p=3 p=4 p=5 p=6 …
n=0 1
n=1 1 1
n=2 1 2 1
n=3 1 3 3 1
n=4 1 4 6 4 1
n=5 1 5 10 10 5 1
n=6 1 6 15 20 15 6 1
… … … … … … … … …

6.4 - Binomio de Newton:
La fórmula del BINOMIO DE NEWTON permite expresar cualquier producto especial.
n
= C nanb0 + C nan −1b1 + ... + C n an − p b p + ... + C n a1bn −1 + C na0bn = ∑ C n an − p b p
n 0 1 p n −1 n p
(a + b)
p =0
Regresemos al conteo del número de partes de un conjunto E de n elementos; hemos visto que:
0 1 2 p −1 n −1 n
N = C n + C n + C n + ... + C n + ... + C n + C n
Interesémonos ahora a la fórmula del binomio de Newton para 2n :

n 0 1 p n −1 n
2n = (1 + 1) = C n + C n + ... + C n + ... + C n + C n
En conclusión, el número total de partes de un conjunto E de n elementos es 2n

VII – PROBABILIDADES COMPUESTAS:
Las PROBABILIDADES COMPUESTAS permiten evaluar la probabilidad de una combinación de

eventos de los cuales se conoce la probabilidad individual de realización.
Sección I: Probabilidad condicionada
Sea E un conjunto. Sea P(E) el conjunto de los eventos posibles en E. Sean A, B ∈ P ( E ) y

suponemos que p ( A ) ≠ 0 . Llamamos PROBABILIDAD DE B CONDICIONADA POR A a la
siguiente probabilidad:
p ( A ∩ B)
pA ( B ) =
p ( A)
Esta probabilidad se lee “probabilidad de B sabiendo A” y expresa la probabilidad de que se
realice B sabiendo que A ya se realizó. También se puede encontrar la notación: p ( B A )
De la fórmula anterior, podemos deducir:

p ( A ∩ B ) = p ( A) × pA ( B )
Esta relación expresa lo siguiente: para tener simultáneamente A y B (evento A ∩ B ), primero

necesitamos que A sea realizada (probabilidad p ( A ) ) y luego que se realice B sabiendo que A se
realizó (probabilidad pA ( B ) ).
Simétricamente, tendremos p ( A ∩ B ) = p ( B ) × pB ( A )
Ejemplo: Una urna contiene 5 bolillas idénticas, con excepción del color: 3 son rojas y 2 son
verdes.
Supongamos que se saca una bolilla (que no se vuelve a colocar a la urna), luego una segunda.
¿Cuál es la probabilidad de sacar dos bolillas rojas? Apliquemos la relación anterior:
3 2
p ( R ∩ R ) = p ( R ) × pR ( R ) = × = 0.3
5 4
Ahora, supongamos que se efectúa el mismo tipo de extracción, pero a cada etapa regresando
la bolilla a la urna:
3 3 9
p ( R ∩ R ) = p ( R ) × pR ( R ) = × =
5 5 25

Ejemplo: De estudios realizados sobre los accidentes, extraemos los siguientes resultados:
- La probabilidad de tener un accidente si el conductor esta sobrio es de 0,001; o sea

psobrio ( accidente ) = 0.001
- La probabilidad de tener un accidente si el conductor esta ebrio es de 0,02; o sea
pebrio ( accidente ) = 0.02
- La probabilidad de tener un conductor ebrio es de 0,01; o sea p ( ebrio ) = 0.01
¿Cuál es la probabilidad de tener un accidente con un conductor ebrio, o sea:

p ( accidente ∩ ebrio ) ?
p ( accidente ∩ ebrio ) = p ( ebrio ) × pebrio ( accidente ) = 0.01 × 0.02 = 0.0002
¿Cuál es la probabilidad de tener un conductor ebrio si hay un accidente, o sea:

paccidente ( ebrio ) ?
p ( accidente ∩ ebrio )
paccidente ( ebrio ) =
p ( accidente )
Para encontrar la probabilidad p ( accidente ) , primero sintetizaremos la información que
tenemos en un árbol:
Conductor De donde:
p = 0,01 1 - p = 0,99
p ( ebrio ∩ accidente ) = 0.0002
Ebrio Sobrio
p ( ebrio ∩ no accidente ) = 0.0098
q = 0,02 1 - q = 0,98 r = 0,001 1 - r = 0,999 p ( sobrio ∩ accidente ) = 0.00099
p ( sobrio ∩ no accidente ) = 0.98901
Accidente No Accidente Accidente No Accidente
A partir de los resultados sobre las hojas del precedente árbol, se puede construir un segundo
árbol de raíz “frecuencia de accidente”:
p ( ebrio ∩ accidente ) p ( sobrio ∩ accidente) p ( ebrio ∩ no accidente) p ( sobrio ∩ no accidente)
= 0.0002 = 0.00099 = 0.0098 = 0.98901
paccidente ( sobrio) pno accidente ( ebrio) pnoaccidente ( sobrio)
Accidente No accidente
p ( accidente ) p ( no accidente )
= 0.00119 = 0.99881
Frecuencia de accidente
Por deducción obtenemos la probabilidad buscada

Sección II: Eventos independientes
Consideramos que dos eventos son INDEPENDIENTES cuando la realización de uno no afecta a
la probabilidad de realización del otro. Por ejemplo, los resultados sucesivamente obtenidos al
lanzar un dado. En efecto cada vez que lanzamos el dado, los resultados obtenidos anteriormente
no afectan al resultado presente.
Al contrario, existen eventos cuya realización afecta la probabilidad de realización de otros

eventos. ¿Por ejemplo, si sacamos cartas de un juego de 32 cartas sin reponer las cartas al juego,
cuál sería la probabilidad de sacar el rey de corazones? Cuando sacamos la primera carta, sería
1/32. Si este rey no fue sacado, entonces la probabilidad de sacarlo sacando una segunda carta
será de 1/31…
Los eventos A y B serán independientes si pA ( B ) = p ( B ) .
También en este caso, tenemos: p ( A ∩ B ) = p ( B ) × p ( A ) .
Generalizando:
Los eventos A,A
1 2
,…
A son GLOBALMENTE INDEPENDIENTES para la probabilidad p si
k
p ( A ∩ A ∩ ... ∩ A ) = p ( A ) × p ( A ) × ... × p ( A )
1 2 k 1 2 k
Ejemplo: E = {a, b, c, d} p({a}) = p({b}) = p({c}) = p({d}) = 1 4
Sea A1 = {b, c}; A2 = {a, c}; A3 = {a, b}
p(A1) = p({b}) + p({c}) = 1 2 ; así mismo p(A2) = 1 2 y p(A3) = 1 2
A1 ∩ A2 = {c} A2 ∩ A3 = {a} A3 ∩ A1 = {b}
• p(A1 ∩ A2) = 1 4 p(A1).p(A2) = 1 4 luego A1 y A2 son independientes

A1 ∩ A 2 ∩ A 3 = ∅
p(A1). p(A2). p(A3) = 1 8 pero p(A1 ∩ A2 ∩ A3) = p(∅) = 0 por lo tanto, A1, A2, A3, no son
globalmente independientes.

Sección III: Teorema de las probabilidades totales:
El TEOREMA DE LAS PROBABILIDADES TOTALES nos permite calcular la probabilidad de un

suceso a partir de probabilidades condicionadas:
Ejemplo: Supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y si hace

buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cuál es la probabilidad
de que ocurra un accidente si conocemos la probabilidad de que llueva y la probabilidad de que
haga buen tiempo.
Es decir, la probabilidad de que ocurra un accidente (evento B) es igual a la probabilidad de que

ocurra un accidente cuando llueve multiplicada por la probabilidad de que llueva (evento A1) más
la probabilidad de que ocurra un accidente cuando no llueve multiplicada por la probabilidad de
que no llueva (evento A2).
Para que este teorema se pueda aplicar, necesitamos que los eventos A1 y A2 formen un sistema
completo.
Un sistema de eventos Ai forma un SISTEMA COMPLETO cuando contempla todas las
posibilidades (la suma de sus probabilidades debe ser el 100%).
La fórmula de las probabilidades totales se expresa:

N N
p ( B ) = ∑ p ( B ∩ Ai ) = ∑ p ( Ai ) × p ( B Ai )
i =1 i =1
Sección IV: Teorema de Bayes – Probabilidades de las causas
Sea un evento A el cual puede depender de N causas Ci diferentes e incompatibles (no podemos
tener dos causas realizadas al mismo tiempo). Sabiendo que se realizó el evento A, ¿cuál es la
probabilidad de que Ci sea la causa de la realización de A?
N
Podemos escribir que A = ∪A∩C i dado que {Ci } constituye un sistema completo (las causas de
i =1
A son incompatibles entre si y suponemos que todas las causas posibles de A están conocidas)
Según el teorema de las probabilidades completas, tenemos:

N
p ( A ) = ∑ p ( A ∩ Ci )
i =1
Si aplicamos el teorema de las probabilidades condicionadas, obtenemos:

p ( A ∩ Ci ) = p ( A ) × p ( Ci A ) = p ( Ci ) × p ( A Ci )

Deducimos la FÓRMULA DE BAYES:
p ( Ci ) × p ( A Ci )
p ( Ci A ) = N
∑ p (C ) × p ( A C )
i =1
i i
Ejemplo: Parte de la actividad de la empresa Miyasato consiste en fabricar lunas de coches.

Esta división cuenta con dos máquinas M1 y M 2 que producen respectivamente 100 y 200
lunas por día. M1 produce un 5% de piezas defectuosas mientras M 2 produce un 6% de
piezas defectuosas. ¿Cuál es la probabilidad de que una pieza defectuosa haya sido
producida por M1 ?
El evento constatado A es la presencia de una pieza defectuosa. Las causas posibles son las
máquinas M1 y M 2 . Forman un sistema completo dado que son las únicas dos causas
posibles de producción de una pieza defectuosa.
Deducimos de la información del ejercicio que la probabilidad de que una pieza haya sido
producida por M1 es de 1 y que la probabilidad de que una pieza haya sido producida por
3
M 2 es de 2 .
3
También las probabilidades condicionadas del evento A nos permiten decir que
p ( A M1 ) = 5% y p ( A M2 ) = 6% .
Utilizando la fórmula de Bayes, tenemos:

1
p ( M1 ) × p ( A M1 ) × 5%
3 5
p ( M1 A ) = = = 0.29
p ( M1 ) × p ( A M1 ) + p ( M 2 ) × p ( A M 2 ) 1 2
× 5% + × 6% 17
3 3
Ejemplo: Averigüemos los resultados obtenidos anteriormente con el ejemplo de los accidente
de tránsito.
Sea A el evento “accidente”. Sean B1 = ebrio y B2 = sobrio las dos causas posibles del
accidente. ¿Forman un sistema completo?
Al tener un accidente, la probabilidad de que el conductor sea ebrio es de:

p ( B1 ) × p ( A B1 ) 0.01 × 0.02
p ( B1 A ) = = 0.168067
p ( B1 ) × p ( A B1 ) + p ( B2 ) × p ( A B2 ) 0.01 × 0.02 + 0.99 × 0.001
Este resultado confirma el resultado anterior.

VIII – VARIABLES ALEATORIAS:
Sección I: Noción de variable aleatoria
En una experiencia aleatoria, podemos hacer el inventario de los resultados posibles, es decir de
los posibles eventos: A, B, C,…….K.
A estos eventos, se podemos hacer corresponder los valores de una variable X:
Para el evento A, X = 1
Para el evento B, X = 2
Para el evento C, X = 3
------------------------------------------
Para el evento K, X = n
Tal variable, asociada a un conjunto de posibles eventos, se llama VARIABLE ALEATORIA. En

otras palabras, una variable aleatoria es una aplicación que, a un resultado posible de la
experiencia aleatoria asocia un número. Una variable aleatoria tomará tal o tal valor en función del
resultado obtenido.
No son los valores posibles de la variable, ni el valor que toma una vez conocido el resultado de la
experiencia que son aleatorios sino, el valor que tomará antes de efectuar la experiencia aleatoria.
Originalmente, una variable aleatoria era una función de ganancia representando la ganancia
obtenida luego del resultado de un juego. Por ejemplo, supongamos que un jugador tire un dado y
que gane un sol si sale un 6 pero pierde 10 soles si sale otro resultado. Entonces es posible definir
la variable aleatoria de ganancia que asocia “1” al resultado “6” y “-10” a cualquier otro resultado.
La probabilidad para que la variable aleatoria tome el valor “1” es exactamente la probabilidad de
que el jugador gane 1 sol.
La asociación de una probabilidad de ocurrencia a cada valor posible de la variable aleatoria X, es

una LEY DE PROBABILIDAD. Llamamos ley (o distribución) de probabilidad toda relación que
establece la correspondencia entre los valores tomados por una variable aleatoria y su
probabilidad.
La suma de las probabilidades de todos los valores posibles de una variable aleatoria vale 1.
Podemos decir que las probabilidades se reparten entre estos valores posibles de la variable
aleatoria X. Podemos representar esta repartición por un diagrama de barras.

Ejemplo: Una urna contiene 10 bolillas rojas, 25 bolillas verdes y 15 bolillas azules; estas
bolillas son idénticas a excepción del color. La experiencia consiste en extraer una bollilla. Hay
tres resultados posibles:
• extraer una bolilla roja: X = 1, p(X = 1) = 10/50 = 0,2
• extraer una bolilla verde: X = 2, p(X = 2) = 25/50 = 0,5
• extraer una bolilla azul: X = 3, p(X = 3) = 15/50 = 0,3
Por supuesto tenemos, p(X =1) + p(X =2) + p(X =3) = 1. La ley de probabilidad p(X) ha sido
definida precedentemente. Ella puede ser expresada por el siguiente grafo:
p(X)
0,5
0,3 ∑ p( X = X ) =1
i =1
i
0,2
X
1 2 3
Para profundizar: observemos el siguiente ejemplo:
Ejemplo: Elección de un punto al azar, sobre un segmento de recta AB

A M B
0 (a) (x) (b) X
La elección de un punto puede ser caracterizada por la abscisa del punto en un eje del
segmento. Así, se define una variable aleatoria continúa X = x.
Sin embargo, tenemos un problema serio: el número de casos favorables es 1, pero el número
de casos posibles es infinito, esto quiere decir que la probabilidad buscada es siempre nula.

Para salir del problema, se debe reemplazar la noción de probabilidad en un punto por la noción
de probabilidad en un intervalo:
p(x): probabilidad de escoger el punto M entre x y x+dx
Es evidente que p(x) debe ser proporcional a dx, ya que más grande es dx y más grande será la
probabilidad de encontrar M en ese intervalo. Esto significa que p(x) es de la forma:
p(x) = f(x)dx
Donde la función f(x) se llama DENSIDAD DE PROBABILIDAD; las restricciones en esta

función son las siguientes:
• p ( x ) ≥ 0 luego f ( x ) ≥ 0
• f es continua en el intervalo [ a; b[
b
∫ f ( x ) dx = 1
a
• la suma de todas las probabilidades es igual a 1:

f(x)
a b x
0
Apliquemos al ejemplo tratado, las precedentes consideraciones. Es evidente que f(x) = C

(donde C es una constante) porque la elección de M no depende de su posición. En ese caso:
b
1
∫ Cdx =C ( b − a ) = 1 de donde f ( x ) = b − a
a
f(x)
1/(b-a)
a b x
0

Sección II: Función de repartición
Sea p(x) una ley de probabilidad, llamamos FUNCIÓN DE REPARTICIÓN a la función F:

F ( x) = p ( X ≺ x)
Una función de repartición es creciente (largo sensu) sobre el intervalo ]−∞; +∞[ y continua a la
derecha en todo punto. Tiende hacia 0 en −∞ y 1 en +∞ . Recíprocamente, cualquier función
verificando las propiedades características enunciadas precedentemente puede ser considerada
como la función de repartición de una variable aleatoria.
El interés de la función de repartición reside en el hecho que es valida tanto para variables
continuas como para variables discretas definidas sobre un conjunto enumerable (en la mayoría
de los casos prácticos, se reduce a un conjunto de valores equidistantes que pueden ser
asimilados a números enteros).
2.1 - Caso discreto:
Ordenemos los valores de X por orden creciente:
x1 x2 x3 …….. xk xk+1 ………. xn
F ( x ) = p ( X ≺ x ) = p ( x1 ) + p ( x2 ) + p ( x3 ) + ... + p ( xk )
k
F ( x ) = ∑ p ( xi ) dado que xk ≺ x ≺ xk +1
i =1

F(x)
x<1 F(x) = 0
1
1≤x<2 F(x) = 0,2
0,7
2≤x<3 F(x) = 0,2 + 0,5 = 0,7
3≤x F(x) = 1
0,2
0 1 2 3 x
2.2 - Caso continuo:
f(x) ≠ 0 entre a y b
b
F ( x ) = ∫ f ( t ) dt
a
f(x) F(x)
1
F(α)
F(α)
a α b x a α b
0 0

A M B
0 (a) (x) (b) X
x
x−a
F ( x ) = ∫ Cdt = C ( x − a ) =
a
b−a
F(x)
a b x
0
Nota: Designemos por A, B, C los siguientes eventos:
A: x1 < X < x2
B: X < x1
C: X < x2
A ∩ B = ∅ ; p(C) = p(A) + p(B) de donde: p(A) = p(C) - p(B) o sea:
x2 x1 x2
∫
a
f ( t ) dt − ∫ f ( t ) dt =
a
∫ f ( t ) dt = F ( x ) − F ( x )
x1
2 1
f(x)
p(A)
a x1 x2 b x
0

Sección III: Momentos
Se definen dos tipos de momentos: los MOMENTOS de orden k y los MOMENTOS CENTRADOS
de orden k:
Momentos de orden k Momentos centrados de orden
n k
M K ( x) = ∑ p ( xi ) X K n
i =1 ρ K ( x) = ∑ p( xi )( xi − X ) K
+∞ i =1
M K ( x) = ∫ f ( x) x K dx +∞
−∞ ρ K ( x) = ∫ f ( x)( xi − X ) k dx
M K ( x ) = Ε( x K ) −∞
ρ K ( x) = Ε(( xi − X ) K )
La primera línea expresa la definición en el caso discreto y la segunda en el caso continuo. La

tercera línea representa la notación general donde Ε ( ) significa “promedio de” (o esperanza
matemática). X significa Ε ( X ) , o sea M1(X).
Los momentos comunes son los momentos de orden 1 y 2:
- Momento de orden 1: corresponde al PROMEDIO o ESPERANZA MATEMÁTICA:

X = M 1 ( x) = E ( x)
n
X = ∑ p ( xi ) x
i =1
+∞
X= ∫ xf ( x)dx
−∞
- Momento centrado de orden 1: es nulo, por lo tanto no tiene importancia:

n n n
ρ1 ( x) = ∑ p( xi )( xi − X )∑ p ( xi ) xi − X ∑ p( xi ) = X − X = 0
i =1 i =1 i =1
- Momento de Orden 2: se le llama MOMENTO CUADRÁTICO:

M2(X ) = X 2
- Momento centrado de orden 2: se le llama VARIANZA:
ρ 2 ( x) =∨ ( x) = ∑ p( xi )( xi − X ) 2
i
El teorema de Koenig-Huygens permite expresar la varianza en una forma bastante simple:

n n
V ( x) = ∑ p ( xi )( xi − X ) 2 =∑ p ( xi )( xi2 − 2 xi X + X 2 ) = X 2 − 2 X 2 + X 2 = X 2 − X 2
i =1 i =1
de donde:
V ( x) = X 2 − X 2

Se define la DESVIACIÓN CUADRÁTICA MEDIA ó DESVIACIÓN ESTÁNDAR (en inglés
standard deviation) por:
σ ( x) = V ( x)
X = 2.1
X 2 = 4.9
V ( x ) = 4.9 − 2.12 = 0.49
σ ( x ) = 0.7

A M B
0 (a) (x) (b) X
a+b
X =
2
a − ab + b 2
2
X2 =
3
( a − b) 2
V ( x) =
12
b−a
σ ( x) =
2 3
Sección IV: Desigualdad de Bienaymé-Tchebyshev-Markov
La DESIGUALDAD DE TCHEBYSHEV para una ley de probabilidad g(X) es la siguiente:

Ε ( g ( X ))
p( g ( X ) ≥ k ) ≤
k
donde k es un real positivo y g una función positiva.

Poniendo g ( X ) = Xn , obtenemos la DESIGUALDAD DE MARKOV
Ε( X n )
p( X ≥ k
n n
)≤ kn
2
(
Si ponemos g(X)= X - Ε ( X ) ) y k = t2 σ 2 obtenemos la desigualdad de BIENAYMÉ-
TCHEBYSHEV:
1
(
p ( X - Ε ( X ) ) ≥ tσ ≤) t2
Esta última desigualdad es la más conocida de las tres y es válida cualquier sea la variable
aleatoria X. Sin embargo en la práctica, la mayoración que provee es excesiva.

VIII – MODELOS PROBABILÍSTICOS:
El estudio de diversos fenómenos ha permitido modelos probabilistas, es decir dar leyes de

probabilidad. Demos algunos ejemplos.
Sección I: Distribución uniforme
La distribución uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos
ellos con la misma probabilidad.
Es una distribución continua porque puede tomar cualquier valor y no únicamente un número
determinado (como ocurre en las distribuciones discretas).
Tenemos las siguientes propiedades:
1 a+b ( a − b) 2 b−a
a< x<b f ( x) = X= V ( x) = σ ( x) =
b−a 2 12 2 3
Ejemplo: El precio promedio del hectolitro de gasolina durante el próximo año se estima que
puede oscilar entre 140 y 160 soles. Podría ser, por tanto, de 143, o de 143.4, o de 143.45, o de
143.455, etc... Hay infinitas posibilidades, todas ellas con la misma probabilidad.
Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto
del intervalo, viene definida por:
1
f ( x) =
b−a
Donde:
b: es el extremo superior (en el ejemplo, 160 soles)
a: es el extremo inferior (en el ejemplo, 140 soles)
Por lo tanto, la distribución de probabilidad del ejemplo sería:

1
f ( x) = = 0.05
160 − 140
Es decir, que el valor final esté entre 140 soles y 141 soles tiene un 5% de probabilidad, que
esté entre 141 y 142, otro 5%, etc…
El valor medio y la desviación estándar de esta distribución se calculan:

a+b b−a
Ε( x) = y σ ( x) =
2 2 3
En el ejemplo:
140 + 160 160 − 140 10
Ε( x) = = 150 y σ ( X ) = = 5.77
2 2 3 3
Por lo tanto, el precio medio esperado de la gasolina para el próximo año es de 150 soles con
una desviación estándar de 5.77 soles.

Sección II: Ley binomial
La ley binomial se apoya en un ESQUEMA DE BERNOULLI.
2.1- Esquema de Bernoulli:
Una prueba de Bernoulli es una experiencia que solo tiene dos resultados posibles.
Un esquema de Bernoulli es una repetición incondicional de una misma prueba de Bernoulli.
Por ejemplo, lanzar una monedad es una prueba de Bernoulli. Solo hay dos resultados posibles,
cara o sello. Lanzar varias veces una monedad define un esquema de Bernoulli.
Nota: En la definición, hemos empleado el calificativo “incondicional”. Esto significa que el

resultado de una prueba no influenza el resultado de otra prueba.
En general notamos E (éxito) y F (fracaso) los dos resultados posibles a una prueba de Bernoulli.
Así, cualquier prueba de Bernoulli puede ser representada por el siguiente árbol:
Nota: aquí las probabilidades de E y F están consideradas como iguales, lo cual significa que la
monedad está bien equilibrada, estamos en una situación de equiprobabilidad:
E o cara El fracaso F es el evento contrario del éxito E, a veces lo

0.5 encontramos notado: E (no lo confundan con el promedio).
Si la probabilidad del evento E es a, entonces la probabilidad

del evento contrario F será de 1-a ya que son eventos
0.5 incompatibles y que la suma de las probabilidades vale 1.
F o sello
Imaginémonos ahora que vamos a lanzar dos veces la monedad. Obtenemos el siguiente
esquema de Bernoulli:
0.5 E o cara
E o cara
0.5
0.5 F o sello
0.5 E o cara
0.5
F o sello
0.5 F o sello

- ¿Cuál es la probabilidad de obtener dos caras sucesivas?
Leyendo el árbol, vemos que la probabilidad de obtener dos caras es la probabilidad de obtener
una cara en el primer intento multiplicada por la probabilidad de obtener una cara en el segundo
intento. p (" EE ") = 0.5 × 0.5 = 0.25
- ¿Cuál es la probabilidad de obtener una cara?
p ("una cara ") = p(" ES ") + p(" SE ") = 0.5 × 0.5 + 0.5 × 0.5 = 0.5
- ¿Cuál es la probabilidad de obtener ninguna cara?
p (" FF ") = 0.5 × 0.5 = 0.25
Ejemplo: Lanzamos una monedad desequilibrada dos veces seguidas. La probabilidad de

obtener una cara es de 0.6 y la probabilidad de obtener sello es de 0.4.
- ¿Cuál es la probabilidad de obtener dos caras sucesivas?

Sería la probabilidad de obtener una cara en el primer intento y luego de esto una cara en el
segundo intento.
p ("CC ") = 0.6 × 0.6 = 0.36
- ¿Cuál es la probabilidad de obtener una cara?
Sería la probabilidad de obtener una cara en el primer intento y un sello en el segundo intento
más la probabilidad de obtener un sello en el primer intento y una cara en el segundo intento.
p ("una cara ") = p(" ES ") + p(" SE ") = 0.6 × 0.4 + 0.4 × 0.6 = 0.48
- ¿Cuál es la probabilidad de obtener ninguna cara?
Sería la probabilidad de obtener una cara en el primer intento y un sello en el segundo intento
más la probabilidad de obtener un sello en el primer intento y una cara en el segundo intento.
p (" FF ") = 0.4 × 0.4 = 0.16
2.2- Esquema de Bernoulli de n pruebas:
Imaginémonos ahora que lanzamos la monedad n veces. Llamaremos “a” la probabilidad de

obtener cara, o sea p(“E”) = a.
¿Luego de n pruebas, cuál es la probabilidad de obtener p caras? (p y n son enteros naturales y
p < n).
Si hiciéramos el árbol correspondiente a este esquema, obtendríamos varias ramas del árbol con
exactamente p letras “E”. Estas ramas tendrían entonces exactamente n - p letras F o E .
Consideremos la probabilidad correspondiente a una de estas ramas, es igual a:

p (" E ") × p (" E ") × p (" E ") × ... × p (" F ") × p (" F ") × p (" F ") = a p × (1 − a )n − p

p factores correspondientes a p éxitos n − p factores correspondientes a n − p fracasos
Por lo tanto, la probabilidad total de obtener p caras será igual al número total de ramas contando
exactamente p letras “E” multiplicada por la probabilidad de obtener p letras “E”. Solo nos falta
encontrar el número de ramas con p letras “E”.
En un árbol representando un esquema de Bernoulli a n pruebas, tenemos exactamente Cnp

ramas con p éxitos.

En efecto, lo que diferencia dos ramas con p letras “E” es la posición de las letras. El número total
de formas de organizar p letras “E” entre n posiciones es una p-combinación.
En un esquema de Bernoulli de n pruebas, la probabilidad de obtener exactamente p éxitos es de:

n− p
Cnp × a p × (1 − a )
Ejemplo: Lanzamos una monedad equilibrada cuatro veces seguidas. La probabilidad de

Gracias a la fórmula enunciada, no necesitamos un árbol para encontrar las diferentes

probabilidades:
Probabilidad 0 caras 1 cara 2 caras 3 caras 4 caras

de obtener
0.0625 0.25 0.375 0.25 0.0625
La distribución de probabilidades es simétrica dada la equiprobabilidad de obtener cara o sello y

la simetría de los Cnp .
Ejemplo: Lanzamos una monedad desequilibrada cuatro veces seguidas. La probabilidad de


de obtener
0.0256 0.1536 0.3456 0.3456 0.1296
La distribución de probabilidades ya no es simétrica ya que las probabilidades de obtener cara o

sello son diferentes.
2.3- Ley binomial:
Llamemos N la variable aleatoria que cuenta el número de éxitos (o caras) obtenidos después de
4 pruebas con una monedad desequilibrada. La ley de probabilidad de N es la siguiente:

de obtener
0.0256 0.1536 0.3456 0.3456 0.1296
La ley de probabilidad de nuestra variable aleatoria también se llama LEY BINOMIAL de

parámetros n = 4 y a = 0.6. Se nota:
N Β ( 4;0.5 )
Es tal que:
n− p
p ( X = p ) = Cnp × a p × (1 − a )

Los indicadores estadísticos de esta variable aleatoria son los siguientes:
n
Ε ( N ) = ∑ p ( X = k ) × k = 2.4
i =1
n
V ( N ) = ∑ p ( X = k ) × k 2 − Ε ( N ) = 0.96
2
i =1
σ ( N ) = V ( N ) 0.97
Cuando trabajamos con la ley binomial de parámetros n y a, los indicadores que son la esperanza
matemática, la varianza y la desviación estándar tienen expresiones particulares que trataremos
de descubrir.
2.4- Indicadores de una ley binomial:
Teorema: La esperanza matemática de una variable aleatoria N siguiendo una ley binomial
N Β ( n; a ) es igual a n × a .
La esperanza matemática de una variable aleatoria N siguiendo una ley binomial N Β ( n; a ) se

puede expresar:
n
Ε( X ) = ∑ k × p ( X = k )
i =1
= 0 × p ( X = 0 ) + 1 × p ( X = 1) + ... + k × p ( X = k ) + ... + n × p ( X = n )
n
= ∑ k × Cnk × ak × (1 − a )
n−k
i =1
exactamente k éxitos
n
n!
= ∑k ×
n−k
× ak × (1 − a )
i =1 k !× ( n − k )!

sacamos un factor ...
n
n × ( n − 1)!
=∑
n−k
× −1
× a k
a × (1 − a )
i =1 ( k − 1)!× ( n − k )! sacamos un factor ...
= n×a×∑
n
( n − 1)! × ak −1 × (1 − a )
n−k
i =1 ( k − 1)!× 
( n − 1) − ( k − 1)  !

astucia ...
n
= n × a × ∑ Cnk−−11 × ak −1 × (1 − a )
( n −1) − ( k −1)
i =1
Para finalizar esta demostración, procederemos a un cambio de índice. Sea i = k - 1. Como k varia
de 1 a n, i variará de 0 a n - 1, así:
n
Ε ( X ) = n × a × ∑ Cni −1 × ai × (1 − a )
( n −1) − i
i =1

término que ya hemos visto

Reconocemos la fórmula del binomio de Newton, por lo tanto:
n −1
Ε ( X ) = n × a ×  a × (1 − a )  = n × a × 1n −1 = n × a
Teorema:
- La varianza de una variable aleatoria N siguiendo una ley binomial N Β ( n; a ) es igual a
n × a × (1 − a ) .
- La desviación estándar de una variable aleatoria N siguiendo una ley binomial N Β ( n; a ) es
igual a n × a × (1 − a ) .
Ejemplo: Determinamos que la probabilidad de llegar a un cruce dado, con el semáforo en

verde es p = 3/5 (y p = q = 2/5). Se efectúa n pases sucesivos en esa intersección y se designa
por X el número de acontecimientos “semáforo en verde”.
Sí n=2, tenemos:
4
• p(X=0) = C20 p0 q2 = 0.16
25
12
• p(X=1) = C21 p1q1 = 0.48
25
9
• p(X=2) = C22 p2 q0 = 0.36
25

FUENTES DE INFORMACIÓN PARA LA ELABORACIÓN DEL PRESENTE
DOCUMENTO:
• Internacional e-Miage: curso de Statistiques et Probabilités.

• http://nutriserver.com/
• http://tanopah.jo.free.fr/
• http://www.fisterra.com/index.asp
• http://rfv.insa-lyon.fr/
• Maths, Première ES, Enseignement obligatoire et option, Hachette Education
BIBLIOGRAFÍA:
Además de estos libros, una abundante literatura en inglés y en castellano puede ser encontrada
en internet. Aparecen a continuación algunas páginas en castellano de interés:
• http://www.ucv.cl/web/estadistica/index.htm
• http://148.216.10.83/estadistica/descriptiva.htm
• http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-indice.html
La siguiente página contiene enlaces hacia páginas de estadísticas:
• http://www1.universia.net/CatalogaXXI/C10010PPESII1/S164409/P12311NN1/INDEX.HTM
L

Estadísticas y Probabilidades I - Miage, Teoría

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estadísticas y Probabilidades I - Miage, Teoría

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSIDAD DE SAN MARTÍN DE PORRES

Prof. Philippe Gollotte Página 1 de 76 Estadísticas y Probabilidades I - Miage

UNIVERSIDAD DE SAN MARTIN DE PORRES:

FACULTAD DE CIENCIAS ADMINISTRATIVAS Y RELACIONES INDUSTRIALES

FACULTAD DE CIENCIAS CONTABLES, ECONÓMICAS Y FINANCIERAS

COORDINACIÓN MIAGE USMP

DIRECTRICE IUP MIAGE:

CHARGÉ DE MISSION À L´INTERNATIONAL:

Prof. Philippe Gollotte Página 2 de 76 Estadísticas y Probabilidades I - Miage

I – SERIES ESTADÍSTICAS: ............................................... 5

II - REPRESENTACIONES GRÁFICAS: ....................................... 10

III – PARAMETROS DE POSICIÓN: ......................................... 20

IV – PARAMETROS DE DISPERSIÓN: ........................................ 28

V – NOCIÓN DE PROBABILIDADES: ......................................... 38

Prof. Philippe Gollotte Página 3 de 76 Estadísticas y Probabilidades I - Miage

VIII – VARIABLES ALEATORIAS: .......................................... 61

VIII – MODELOS PROBABILÍSTICOS: ....................................... 70

FUENTES DE INFORMACIÓN PARA LA ELABORACIÓN DEL PRESENTE DOCUMENTO: .... 76

Prof. Philippe Gollotte Página 4 de 76 Estadísticas y Probabilidades I - Miage

Sección I: Un poco de vocabulario

1.2- INDIVIDUO ó UNIDAD ESTADÍSTICA: cualquier elemento de una populación o de una

1.3- CARÁCTER ó VARIABLE ESTADÍSTICA: propiedad o aspecto estudiado en una

Se dividen en dos categorías:

Según los valores numéricos tomados por un carácter, se distingue:

Prof. Philippe Gollotte Página 5 de 76 Estadísticas y Probabilidades I - Miage

Sección II: Presentación de los resultados estadísticos en forma

Consideramos la clasificación de 94641 votantes efectivos de una circunscripción electoral,

El efectivo corresponde al número de votos obtenidos por cada candidato.

El efectivo total es la suma de todos los ni : N = n1 + n2 + n3 + n4 + n5 + n6 = 94 641 .

Acostumbramos escribir esta expresión de la siguiente forma simplificada:

que se lee “suma de las cantidades ni para i variando del 1 al 6”.

Prof. Philippe Gollotte Página 6 de 76 Estadísticas y Probabilidades I - Miage

La siguiente tabla proporciona las frecuencias en reemplazo de los efectivos.

La diferencia b − a se llama AMPLITUD de la clase [ a; b[ .

En forma de tabla, el estudio estadístico se describirá así:

NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[

Nota 1: la enumeración de los efectivos y las frecuencias debe corresponder a la enumeración de

Prof. Philippe Gollotte Página 7 de 76 Estadísticas y Probabilidades I - Miage

Nota 3: también se puede efectuar reagrupamientos de clases:

Del empadronamiento general de la agricultura en 1955, se ha extraído las siguientes

Efectivo acumulado Frecuencia acumulada

donde p es el número de la clase, donde se desea detener el conteo

Prof. Philippe Gollotte Página 8 de 76 Estadísticas y Probabilidades I - Miage

Los precedentes ejemplos se trataron en relación a series estadísticas SIMPLES: porque su

Edad en años ( x ) [3,4[ [4,5[ [5,6[ Distribución

Distribución marginal 54 46 42 142

La utilización de distribuciones marginales permite descomponer una serie estadística doble en

Prof. Philippe Gollotte Página 9 de 76 Estadísticas y Probabilidades I - Miage

Existen varios tipos de representación gráfica de una serie estadística:

Sección I: Diagrama de barras

En un sistema de ejes (aquí escogidos perpendiculares), se

En el caso de un carácter discreto, los estadísticos tienen

1.1- Ejemplo 1: resultado del voto de los electores en relación a 6 candidatos:

En el caso de un carácter continuo, repartido en clases de igual amplitud, podemos tomar el

2.1- Ejemplo 1: el histograma correspondiente es el siguiente:

área total del histograma = área de la superficie delimitada por el polígono

ambos son proporcionales al efectivo total

El área de cada rectángulo debe ser proporcional al

Prof. Philippe Gollotte Página 12 de 76 Estadísticas y Probabilidades I - Miage

NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,12[ [12,14[ [14,16[ [16,18[ [18,20[

2.1.2- Amplitudes desiguales:

NOTAS SOBRE 20 ( xi ) [6,8[ [8,10[ [10,14[ [14,20[

Los histogramas correspondientes son los siguientes:

Para respetar la regla precedentemente evocada, necesitamos tener: