Vous êtes sur la page 1sur 207

Estadı́stica Aplicada

Ricardo Cao

Departamento de Matemáticas
Universidad de A Coruña

Ciencias da la Salud Curso 2007-08


Estadı́stica
Aplicada Índice
Ricardo Cao
Tema 1: Descripción estadı́stica de una variable
Índices
Tema 1: Tema 2: Descripción estadı́stica de dos variables
Descripción
estadı́stica de
una variable Tema 3: Probabilidad
Tema 2:
Descripción
estadı́stica de
dos variables
Tema 4: Variables aleatorias unidimensionales
Tema 3:
Probabilidad Tema 5: Variables aleatorias bidimensionales
Tema 4:
Variables
aleatorias unidi-
mensionales
Tema 6: Distribuciones notables
Tema 5:
Variables
aleatorias
Tema 7: Estimación puntual
bidimensionales
Tema 6:
Distribuciones
Tema 8: Estimación por intervalos de confianza
notables
Tema 7:
Estimación
Tema 9: Contrastes de hipótesis
puntual
Tema 8:
Estimación por
Tema 10: Inferencia no paramétrica
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 1

Estadı́stica
Aplicada

Ricardo Cao

Índices 1 Conceptos generales


Tema 1:
Descripción
estadı́stica de
una variable
Tema 2:
Descripción
estadı́stica de
2 Distribuciones de frecuencias
dos variables
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi- 3 Representaciones gráficas
mensionales
Tema 5:
Variables
aleatorias
bidimensionales
Tema 6:
Distribuciones
4 Medidas caracterı́sticas
notables
Tema 7:
Estimación
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 2

Estadı́stica
Aplicada

Ricardo Cao
5 Variable estadı́stica bidimensional
Índices
Tema 1:
Descripción
estadı́stica de
una variable 6 Distribuciones de frecuencias
Tema 2:
Descripción
estadı́stica de
dos variables
Tema 3:
Probabilidad 7 Representaciones gráficas
Tema 4:
Variables
aleatorias unidi-
mensionales
Tema 5:
Variables
8 Medidas caracterı́sticas
aleatorias
bidimensionales
Tema 6:
Distribuciones
notables 9 Regresión lineal. Correlación
Tema 7:
Estimación
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 3

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 4

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 5

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 6

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 7

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 8

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 9

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Índice del Tema 10

Estadı́stica
Aplicada

Ricardo Cao
10 Introducción
Índices
Tema 1:
Descripción
estadı́stica de
11 Experimentos y sucesos
una variable
Tema 2:
Descripción
estadı́stica de
dos variables
12 Definición de probabilidad
Tema 3:
Probabilidad
Tema 4:
Variables
aleatorias unidi-
13 Probabilidad condicionada e independencia de sucesos
mensionales
Tema 5:
Variables
aleatorias
bidimensionales 14 Teorema de Bayes
Tema 6:
Distribuciones
notables
Tema 7:
Estimación 15 Análisis combinatorio
puntual
Tema 8:
Estimación por
intervalos de
confianza
Tema 9:
Contrastes de
hipótesis Ricardo Cao Estadı́stica Aplicada
Estadı́stica
Aplicada

Ricardo Cao

Conceptos
generales

Distribuciones
de frecuencias Part I
Representaciones
gráficas

Medidas Descripción estadı́stica de una variable


caracterı́sticas

Ricardo Cao Estadı́stica Aplicada


Conceptos generales

Estadı́stica
Aplicada

Ricardo Cao
El objeto de cualquier investigación estadı́stica es la toma
Conceptos de información acerca de los individuos de cierto colectivo
generales
llamado población estadı́stica.
Distribuciones
de frecuencias
Cada elemento de una población se denomina individuo o
Representaciones
gráficas unidad estadı́stica.
Medidas Las poblaciones estadı́sticas se clasifican en poblaciones
caracterı́sticas
finitas e infinitas, de acuerdo con el número de individuos
incluidos en las mismas.
El proceso de toma de información acerca de los individuos
de una población puede realizarse mediante la elaboración
de un censo o mediante la extracción de una muestra.

Ricardo Cao Estadı́stica Aplicada


Conceptos generales

Estadı́stica
Aplicada

Ricardo Cao
Si una muestra es representativa de una población, se
Conceptos
generales pueden deducir importantes conclusiones acerca de ésta a
Distribuciones partir del análisis de la información muestral. La parte de
de frecuencias

Representaciones
la Estadı́stica que trata de las condiciones bajo las cuales
gráficas tales inferencias son válidas se llama Estadı́stica Inductiva
Medidas
caracterı́sticas
o Inferencial.
La parte de la Estadı́stica que trata solamente de describir
y analizar un grupo dado de datos sin sacar conclusiones o
inferencias acerca de la población que los ha generado se
llama Estadı́stica Descriptiva o Deductiva.

Ricardo Cao Estadı́stica Aplicada


Conceptos generales

Estadı́stica
Aplicada Variables estadı́sticas
Ricardo Cao Llamaremos variable estadı́stica a cada una de las
Conceptos caracterı́sticas consideradas con el propósito de describir a
generales
cada individuo de la muestra.
Distribuciones
de frecuencias Cada una de las variables estadı́sticas consideradas para la
Representaciones
gráficas
descripción de los individuos de la muestra puede
Medidas
presentar distintas modalidades o estados.
caracterı́sticas
Atendiendo a la naturaleza de las modalidades de las
variables, éstas pueden clasificarse en variables cualitativas
y variables cuantitativas. Estas últimas se clasifican en
variables discretas, que son aquellas que toman un número
finito o infinito numerable de valores distintos, y variables
continuas, que son aquellas que pueden tomar cualquier
valor en un intervalo de valores dado.
Ricardo Cao Estadı́stica Aplicada
Distribuciones de frecuencias

Estadı́stica
Aplicada Sean x1 , . . . , xn una muestra de una variable X que
Ricardo Cao presenta las modalidades c1 , . . . , ck , y sea ni el número de
individuos de la muestra con la modalidad ci , i = 1, . . . , k.
Conceptos
generales El número ni se conoce como frecuencia absoluta de la
Distribuciones modalidad ci .
de frecuencias

Representaciones
La frecuencia relativa de ci es fi = ni /n (i = 1, 2, . . . , k).
gráficas La frecuencia absoluta acumulada se define como
Medidas i
caracterı́sticas X
Ni = n1 + n2 + · · · + ni = nj (i = 1, 2, . . . , k)
j=1

La frecuencia relativa acumulada se define como


i
X Ni
Fi = f1 + f2 + · · · + fi = fj = (i = 1, 2, . . . , k).
n
j=1

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao

Conceptos
generales

Distribuciones
de frecuencias Propiedades
Representaciones
gráficas 1 0 ≤ ni ≤ n; 0 ≤ fi ≤ 1 (i = 1, 2, . . . , k).
Medidas
caracterı́sticas
2 Nk = n1 + n2 + · · · + nk = n; Fk = f1 + f2 + · · · + fk = 1.

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada
Modalidad Frecuencia Frecuencia Fr. absoluta Fr. relativa
Ricardo Cao
absoluta relativa acumulada acumulada
Conceptos
generales
c1 n1 f1 N1 F1
Distribuciones
c2 n2 f2 N2 F2
de frecuencias

Representaciones .. .. .. .. ..
gráficas . . . . .
Medidas
caracterı́sticas
ci ni fi Ni Fi
.. .. .. .. ..
. . . . .

ck nk fk Nk Fk
Total n 1

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao Construcción de las modalidades


Conceptos Si la variable es cualitativa, se tomarán como modalidades
generales
las distintas respuestas observadas en la muestra.
Distribuciones
de frecuencias
Si la variable es discreta (que tome pocos valores
Representaciones
gráficas distintos), las modalidades coincidirán con los distintos
Medidas valores medidos en la muestra
caracterı́sticas
Si la variable es continua (o bien discreta, pero que toma
muchos valores distintos), se tomarán como modalidades
los intervalos de clase, tomándose como frecuencia
absoluta de cada modalidad el número de observaciones
agrupadas en el intervalo correspondiente.

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada
Intervalos de clase
Ricardo Cao
Si e0 < e1 < · · · < ei−1 < ei < . . . < ek son los extremos
Conceptos de los k intervalos de clase construidos, la frecuencia
generales

Distribuciones
absoluta del i-ésimo intervalo es ni = número de
de frecuencias observaciones xi tales que ei−1 < xi ≤ ei , siendo su
Representaciones
gráficas
amplitud ai = ei − ei−1 , para i = 1, 2, . . . , k.
Medidas Una vez construidos los intervalos de clase se elige un
caracterı́sticas
representante en cada uno de ellos, llamado marca de
clase, que usualmente es tomado como el punto medio del
intervalo
ei−1 + ei
ci = (i = 1, 2, . . . , k).
2

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao
Intervalos de clase
Conceptos
generales ¿Cuántos intervalos construir? Se recomienda construir
Distribuciones tantos intervalos como el número entero (entre 5 y 20)
de frecuencias √
más próximo a n.
Representaciones
gráficas ¿Intervalos de la misma amplitud o de amplitudes
Medidas
caracterı́sticas
distintas? En general construiremos intervalos de la misma
amplitud.
¿Qué valor elegir como extremo inferior del primer
intervalo (e0 )? Se toma como e0 un valor “un poco
menor” que el mı́nimo de la muestra.

Ricardo Cao Estadı́stica Aplicada


Representaciones gráficas

Estadı́stica
Aplicada

Ricardo Cao
Representación gráfica de variables cualitativas
Conceptos
generales
Diagrama de barras. En un sistema de ejes de
Distribuciones
coordenadas se representa en el eje de abscisas las
de frecuencias modalidades de la variable y en el eje de ordenadas las
Representaciones
gráficas
frecuencias (ni o fi ). A continuación, sobre cada
Medidas modalidad se levanta un rectángulo o barra de altura igual
caracterı́sticas
a la frecuencia (absoluta o relativa) representada, siendo
todos los rectángulos de igual base.
Diagrama de sectores. Se trata de repartir un cı́rculo de
radio arbitrario en sectores proporcionales a la frecuencia
de cada modalidad.

Ricardo Cao Estadı́stica Aplicada


Representaciones gráficas

Estadı́stica
Aplicada

Ricardo Cao
Representación gráfica de variables cuantitativas discretas
Conceptos
generales Diagrama de barras. Se construye de la forma
Distribuciones anteriormente descrita para variables cualitativas,
de frecuencias

Representaciones
pudiendo sustituirse las barras por segmentos de recta.
gráficas
Diagrama acumulativo de frecuencias. Su construcción se
Medidas
caracterı́sticas realiza representando en un sistema de ejes de
coordenadas los puntos (ci , Ni ) o (ci , Fi ), según se
representen frecuencias absolutas o relativas acumuladas,
uniéndose a continuación de forma escalonada los puntos
representados.

Ricardo Cao Estadı́stica Aplicada


Representaciones gráficas

Estadı́stica
Aplicada
Representación gráfica de variables cuantitativas continuas
Ricardo Cao
Histograma. Es el equivalente continuo del diagrama de
Conceptos
generales barras. Partiendo de un sistema de ejes de coordenadas, se
Distribuciones representan en el eje de abscisas los extremos ei de los
de frecuencias
intervalos de clase y a continuación, tomando como base
Representaciones
gráficas de cada rectángulo la amplitud ai del intervalo de clase
Medidas correspondiente, se levanta sobre cada uno de los
caracterı́sticas
intervalos un rectángulo de altura hi = ni /ai o hi = fi /ai ,
según se representen frecuencias absolutas o relativas.
Uniendo, mediante segmentos de recta, los puntos medios
de las bases superiores de cada rectángulo del histograma
se obtiene la representación gráfica llamada polı́gono de
frecuencias.

Ricardo Cao Estadı́stica Aplicada


Representaciones gráficas

Estadı́stica
Aplicada Representación gráfica de variables cuantitativas continuas
Ricardo Cao
histograma móvil. Para cada punto x se define
Conceptos
generales no de observaciones xi en [x − a/2, x + a/2]
h(x) =
Distribuciones
de frecuencias
a·n
Representaciones
gráficas

Medidas
se representan gráficamente los pares (x, h(x)) para un
caracterı́sticas número grande de valores x seleccionados, el gráfico
resultante corresponde a una curva más “suave”.
Polı́gono acumulativo de frecuencias. Es el resultado que
se obtiene al unir mediante segmentos de recta los puntos
(ei , Ni ) o (ei , Fi ), según se trate de frecuencias absolutas o
relativas acumuladas, representados en un sistema de ejes
de coordenadas.
Ricardo Cao Estadı́stica Aplicada
Representaciones gráficas

Estadı́stica
Aplicada Diagrama de tallo y hojas
Ricardo Cao Se utiliza a menudo para la descripción de variables
Conceptos cuantitativas (discretas o continuas), presenta la
generales
particularidad de permitir visualizar globalmente la
Distribuciones
de frecuencias distribución de frecuencias manteniendo la individualidad
Representaciones de los datos.
gráficas

Medidas
Se redondean los datos a dos o tres cifras significativas,
caracterı́sticas tomándose como tallos la primera o las dos primeras cifras
de cada dato y como hojas las últimas cifras de cada dato.
A continuación, separados por una lı́nea vertical, se
dispondrán los tallos a la izquierda y las hojas a la derecha
del tallo correspondiente. De esta manera cada tallo, que
se representa una sola vez, define una clase y el número de
hojas representa la frecuencia de dicha clase.
Ricardo Cao Estadı́stica Aplicada
Medidas caracterı́sticas. Medidas de posición

Estadı́stica
Aplicada

Ricardo Cao
Medidas de posición central

Conceptos
Media aritmética. Se define la media aritmética (x) de
generales una variable cuantitativa X como el valor numérico
Distribuciones
de frecuencias n
x1 + x2 + · · · + x n 1X
Representaciones x= = xi
gráficas n n
i=1
Medidas
caracterı́sticas

Propiedades:
1 min(xi ) ≤ x ≤ max(xi ).
2 SiPyi = a + bxi (i = 1, 2, . . . , n), entonces y = a + bx.
1 n
i=1 (xi − x) = 0
3
n Pn 2
4 x̄ = arg min i=1 (xi − a)

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de posición

Estadı́stica
Aplicada Medidas de posición central
Ricardo Cao
Media truncada. Un inconveniente que presenta la media
Conceptos aritmética es su sensibilidad a la presencia de
generales
observaciones atı́picas (outliers) en la muestra. Para evitar
Distribuciones
de frecuencias este tipo de problema se utilizan las medias truncadas, que
Representaciones consisten en medias aritméticas calculadas con un
gráficas
porcentaje central de los datos.
Medidas
caracterı́sticas
Media recortada. Consiste en la media aritmética de una
modificación de los datos originales: un porcentaje central
permanece sin modificar, cada uno de los datos de los
menores excluidos se sustituye por el menor de los datos
del porcentaje central no modificado y cada uno de los
datos de los mayores excluidos se reemplaza por el mayor
de los datos del porcentaje central no modificado.
Ricardo Cao Estadı́stica Aplicada
Medidas caracterı́sticas. Medidas de posición

Estadı́stica
Aplicada

Ricardo Cao
Medidas de posición central
Conceptos
Media cuadrática (Q).
generales
v
Distribuciones
r u n
de frecuencias x12 + x22 + ... + xn2 u1 X
Q= =t xi2
Representaciones n n
gráficas i=1
Medidas
caracterı́sticas
.
Media geométrica (G). Supuesto que xi > 0, 1 ≤ i ≤ n, se
√ 1/n
define como G = n x1 · x2 · · · xn = ni=1 xi .
Q

Media armónica (H). Si xi > 0, 1 ≤ i ≤ n, es


n  P −1
H= = n1 ni=1 x1i .
1/x1 + · · · + 1/xn

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de posición

Estadı́stica
Aplicada Medidas de posición central
Ricardo Cao Mediana (Me ). Es la medida de posición central que,
Conceptos supuestos los datos ordenados de menor a mayor, deja
generales
igual número de valores a su izquierda que a su derecha.
Distribuciones
de frecuencias Si el número de datos es par, se toma como mediana la
Representaciones
gráficas
media aritmética de los dos valores centrales. Si el número
Medidas
de datos es impar, se toma como mediana el valor central.
caracterı́sticas
En el supuesto de que los datos hayan sido agrupados en
intervalos de clase, se calcula el intervalo mediano (el
intervalo de clase que contiene a la mediana), eligiéndose
como mediana un representante de dicho intervalo (por
ejemplo, la marca de clase).
La mediana es una medida robusta, esto es, poco sensible
a la presencia de observaciones atı́picas en la muestra.
Ricardo Cao Estadı́stica Aplicada
Medidas caracterı́sticas. Medidas de posición

Estadı́stica
Aplicada
Medidas de posición central
Ricardo Cao
Moda (M0 ). Si X es una variable discreta, se define como
Conceptos
generales
el valor más frecuente de la variable.
Distribuciones Si X es una variable continua, no tiene sentido hablar del
de frecuencias
valor más frecuente, por lo que se introduce el concepto
Representaciones
gráficas de intervalo modal, que se define como aquel intervalo de
Medidas
caracterı́sticas
clase al que le corresponde mayor altura en el histograma
de frecuencias. Finalmente, se toma como moda un
representante del intervalo modal (por ejemplo, la marca
de clase).
Debe observarse que, de acuerdo con la definición, la
moda puede no ser única, en cuyo caso tendremos
distribuciones multimodales (con 2 o más modas).

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de posición

Estadı́stica
Aplicada Otras medidas de posición
Ricardo Cao Cuantiles. Supuestas ordenadas las observaciones de
Conceptos
menor a mayor, se define el cuantil de orden p (0 < p < 1)
generales
como el valor qp que deja a lo sumo np observaciones a su
Distribuciones
de frecuencias izquierda y a lo sumo n(1 − p) observaciones a su derecha.
Representaciones Cuartiles. Son los cuantiles de órdenes 1/4 (cuartil de
gráficas

Medidas
primer orden o primer cuartil Q1 ), 1/2 (cuartil de segundo
caracterı́sticas orden o mediana) y 3/4 (cuartil de tercer orden o tercer
cuartil Q3 ).
Deciles. Son los cuantiles de órdenes r /10 (r = 1, . . . , 9),
y dividen el conjunto de observaciones en diez partes de
igual frecuencia.
Percentiles. Son los cuantiles de órdenes r /100
(r = 1, . . . , 99).
Ricardo Cao Estadı́stica Aplicada
Medidas caracterı́sticas

Estadı́stica
Aplicada

Ricardo Cao
Diagramas de caja
Conceptos
generales
Para la construcción de esta representación, se calculan
Distribuciones previamente la mediana, los cuartiles Q1 y Q3 y los valores
de frecuencias
extremos LI y LS, donde
Representaciones
gráficas
LI = min xi xi ≥ Q1 − 10 5(Q3 − Q1 )
 
Medidas

LS = max xi xi ≤ Q3 + 10 5(Q3 − Q1 )
caracterı́sticas  

Las observaciones que caen fuera del intervalo (LI , LS) se


consideran datos atı́picos (outliers).

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas

Estadı́stica
Aplicada
Diagramas de caja. Las observaciones representadas con + son
Ricardo Cao
outliers.
Conceptos
generales

Distribuciones
de frecuencias

Representaciones
gráficas

Medidas
caracterı́sticas ++
LI LS

Q 1 Me Q3

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de dispersión

Estadı́stica
Aplicada

Ricardo Cao
Medidas de dispersión absoluta
Conceptos
Varianza. s 2 = n1 ni=1 (xi − x)2 .
generales
P
Distribuciones q P
Desviación tı́pica. s = n1 ni=1 (xi − x)2
de frecuencias

Representaciones
gráficas
Propiedades:
Medidas
caracterı́sticas 1 La varianza y la desviación tı́pica toman siempre valores no
negativos.
2 Si yi = a + bxi (i = 1, 2, . . . , n), se tiene que sy2 = b 2 sx2 y
sy = |b|sx .
Pn
3 s 2 = n1 i=1 xi2 − x 2 = x 2 − x 2 .

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas

Estadı́stica
Aplicada Desigualdad de Tchebychev
Ricardo Cao En el intervalo de centro la media aritmética y radio k veces la
Conceptos desviación tı́pica están comprendidas como mı́nimo el
generales
100(1 − 1/k 2 )% de las observaciones.
Distribuciones
de frecuencias

Representaciones Variables tipificadas


gráficas

Medidas
Se define la variable tipificada de una variable estadı́stica X
caracterı́sticas como la variable (Z ) que resulta de restarle su media aritmética
y dividir por su desviación tı́pica:
X −x
Z=
s
obteniéndose de esta manera una variable adimensional de
media cero y desviación tı́pica unidad (z = 0, sz = 1).
Ricardo Cao Estadı́stica Aplicada
Medidas caracterı́sticas. Medidas de dispersión

Estadı́stica
Aplicada

Ricardo Cao
Medidas de dispersión absoluta
Conceptos
generales
Recorrido o rango. Es la diferencia entre los valores
Distribuciones
extremos:
de frecuencias R = max(xi ) − min(xi )
Representaciones
gráficas

Medidas
caracterı́sticas Recorrido intercuartı́lico. Es la diferencia entre los
cuartiles de tercer y primer órdenes:

RI = Q3 − Q1

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de dispersión

Estadı́stica
Aplicada
Medidas de dispersión relativas
Ricardo Cao
Recorrido relativo. Supuesto que x > 0, se define como el
Conceptos cociente entre el recorrido y la media
generales

Distribuciones
de frecuencias
R
RR =
Representaciones x
gráficas

Medidas
caracterı́sticas
Coeficiente de variación. Es la medida de dispersión
relativa más popular y, supuesto que x > 0, se define
como el cociente entre la desviación tı́pica y la media
s
CV =
x

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de forma

Estadı́stica
Aplicada
Medidas de asimetrı́a
Ricardo Cao
Coeficiente de asimterı́a de Pearson. Para distribuciones
Conceptos
generales
unimodales, mide si las observaciones están dispuestas
Distribuciones
simétricamente con respecto a la moda. v = x−M s
0

de frecuencias
Coeficiente de asimterı́a de Fisher. Mide si las
Representaciones
gráficas observaciones están dispuestas simétricamente con
Medidas respecto a la media y es obtenible aunque la distribución
caracterı́sticas
no sea unimodal. g1 = ms 33
Si una distribución es simétrica o insesgada v ' 0
(x ' M0 ) y g1 ' 0. Si v > 0 (x > M0 ) o g1 > 0, diremos
que la distribución es sesgada a la derecha; diremos que la
distribución es sesgada a la izquierda si v < 0 (x < M0 ) o
g1 < 0.

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas. Medidas de apuntamiento
o curtosis
Estadı́stica
Aplicada

Ricardo Cao Coeficiente de apuntamiento de Fisher


Conceptos Mide el grado de apuntamiento de una distribución con
generales
respecto al modelo normal de referencia. Es una medida
Distribuciones
de frecuencias adimensional definida según la expresión:
Representaciones
gráficas m4
g2 = −3
Medidas s4
caracterı́sticas

Diremos que una distribución es platicúrtica (más


aplastada que el modelo normal) si g2 < 0, mesocúrtica si
g2 ' 0 y leptocúrtica (más apuntada que el modelo
normal) si g2 > 0.

Ricardo Cao Estadı́stica Aplicada


Estadı́stica
Aplicada

Ricardo Cao

Variable
estadı́stica
bidimensional

Distribuciones Part II
de frecuencias

Representaciones
gráficas Descripción estadı́stica de dos variables
Medidas
caracterı́sticas

Regresión
lineal.
Correlación

Ricardo Cao Estadı́stica Aplicada


Variable estadı́stica bidimensional

Estadı́stica
Aplicada Introducción
Ricardo Cao Si para un mismo individuo observamos simultáneamente
Variable
k caracterı́sticas obtendremos como resultado una variable
estadı́stica
bidimensional
estadı́stica k-dimensional.
Distribuciones Nos ocuparemos del estudio de las variables estadı́sticas
de frecuencias
bidimensionales (k = 2).
Representaciones
gráficas
Representaremos por (X , Y ) la variable bidimensional
Medidas
caracterı́sticas estudiada, donde X e Y son las variables unidimensionales
Regresión correspondientes a las primera y segunda caracterı́sticas,
lineal.
Correlación respectivamente.
El estudio de cada variable bidimensional particular (X , Y )
variará según las variables unidimensionales X e Y sean
cuantitativas o cualitativas y, de ser cuantitativas, según
sean continuas o discretas.
Ricardo Cao Estadı́stica Aplicada
Distribuciones de frecuencias

Estadı́stica
Aplicada
Distribución de frecuencias conjunta
Ricardo Cao
Sea (x1 , y1 ), . . . , (xn , yn ) una muestra de n observaciones
Variable
estadı́stica
de una variable estadı́stica bidimensional (X , Y ), tal que
bidimensional que X presenta k modalidades c1 , c2 , . . . , ck e Y presenta
Distribuciones
de frecuencias
l modalidades c10 , c20 , . . . , cl0 , y sea nij el número de
Representaciones individuos de la muestra que presentan la modalidad ci de
gráficas
X y la modalidad cj0 de Y (i = 1, 2, . . . , k; j = 1, 2, . . . , l).
Medidas
caracterı́sticas El número nij se conoce como la frecuencia absoluta del
Regresión
lineal.
par (ci , cj0 ).
Correlación
La frecuencia relativa de (ci , cj0 ) es el número fij = nij /n,
que representa la proporción de individuos de la muestra
que presentan el par (ci , cj0 )
(i = 1, 2, . . . , k; j = 1, 2, . . . , l).

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao

Variable
Propiedades
estadı́stica
bidimensional 0 ≤ nij ≤ n (i = 1, 2, . . . , k; j = 1, 2, . . . , l).
Distribuciones
de frecuencias
0 ≤ fij ≤ 1 (i = 1, 2, . . . , k; j = 1, 2, . . . , l).
Representaciones
k X
X l
gráficas
nij = n11 + n12 + · · · + nkl = n.
Medidas
caracterı́sticas i=1 j=1
Regresión k X
X l
lineal.
Correlación fij = f11 + f12 + · · · + fkl = 1.
i=1 j=1

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao

Variable
Distribución de frecuencias conjunta
estadı́stica
bidimensional X \Y c10 c20 ... cj0 ... cl0
Distribuciones
de frecuencias
c1 n11 (f11 ) n12 (f12 ) ... n1j (f1j ) ... n1l (f1l )
Representaciones
c2 n21 (f21 ) n22 (f22 ) ... n2j (f2j ) ... n2l (f2l )
gráficas .. .. .. .. ..
Medidas
. . . ··· . ··· .
caracterı́sticas ci ni1 (fi1 ) ni2 (fi2 ) ... nij (fij ) ... nil (fil )
Regresión .. .. .. .. ..
lineal.
Correlación
. . . ··· . ··· .
ck nk1 (fk1 ) nk2 (fk2 ) ... nkj (fkj ) ... nkl (fkl )

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada Distribuciones marginales
Ricardo Cao Llamaremos distribuciones marginales a las distribuciones
Variable
de frecuencias unidimensionales de las variables X e Y .
estadı́stica
bidimensional Para la variable X , las frecuencias absoluta y relativa de la
Distribuciones modalidad ci (i = 1, 2, . . . , k) son, respectivamente,
de frecuencias

Representaciones ni·
gráficas ni· = ni1 + ni2 + · · · + nil y fi· = = fi1 + fi2 + · · · + fil
Medidas
n
caracterı́sticas

Regresión
lineal.
Correlación
Para la variable Y , las frecuencias absoluta y relativa de la
modalidad cj0 (j = 1, 2, . . . , l) son, respectivamente,
n·j
n·j = n1j + n2j + · · · + nkj y f·j = = f1j + f2j + · · · + fkj
n

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao

Variable
estadı́stica
Tabla de frecuencias marginales absolutas (relativas) para X
bidimensional

Distribuciones
X c1 c2 ··· ci ··· ck
de frecuencias n1· (f1· ) n2· (f2· ) ··· ni· (fi· ) ··· nk· (fk· )
Representaciones
gráficas

Medidas Tabla de frecuencias marginales absolutas (relativas) para Y


caracterı́sticas

Regresión Y c10 c20 ··· cj0 ··· cl0


lineal.
Correlación n·1 (f·1 ) n·2 (f·2 ) ··· n·j (f·j ) ··· n·l (f·l )

Ricardo Cao Estadı́stica Aplicada


Distribuciones de frecuencias

Estadı́stica
Aplicada Distribuciones condicionadas
Ricardo Cao Para cada modalidad cj0 de Y , la frecuencia absoluta de la
Variable
modalidad ci de X condicionada a Y = cj0 es
estadı́stica
bidimensional

Distribuciones
ni/j = n(X = ci /Y = cj0 ) = nij (i = 1, 2, . . . , k)
de frecuencias

Representaciones
gráficas

Medidas La frecuencia relativa de ci de X condicionada a Y = cj0 es


caracterı́sticas

Regresión nij fij


lineal. fi/j = f (X = ci /Y = cj0 ) = = (i = 1, 2, . . . , k)
Correlación n·j f·j

Análogamente, se obtienen las frecuencias, absolutas y


relativas, de cada modalidad de Y condicionada por cada
modalidad de X .
Ricardo Cao Estadı́stica Aplicada
Distribuciones de frecuencias

Estadı́stica
Aplicada

Ricardo Cao

Variable
estadı́stica
Tabla de distribuciones de X condicionada por Y = cj0
bidimensional

Distribuciones
X /Y = cj0 c1 ··· ci ··· ck
de frecuencias
n1/j (f1/j ) ··· ni/j (fi/j ) ··· nk/j (fk/j )
Representaciones
gráficas

Medidas
caracterı́sticas
Tabla de distribuciones de Y condicionada por X = ci
Regresión X /Y = cj0 c1 ··· ci ··· ck
lineal.
Correlación n1/j (f1/j ) ··· ni/j (fi/j ) ··· nk/j (fk/j )

Ricardo Cao Estadı́stica Aplicada


Representaciones gráficas

Estadı́stica
Aplicada Diagrama de dispersión. Es la construcción gráfica que
Ricardo Cao resulta de representar en un sistema de ejes de
coordenadas los pares de observaciones (xi , yi )
Variable
estadı́stica (i = 1, 2, . . . , n) de la variable bidimensional (X , Y ).
bidimensional
Histograma. En un sistema de ejes tridimensional, se
Distribuciones
de frecuencias construye una cuadrı́cula en el plano (X,Y) y sobre estas
Representaciones
gráficas
prismas rectangulares cuyos volúmenes deberán ser
Medidas
proporcionales a las frecuencias absolutas (relativas) de las
caracterı́sticas modalidades (ci , cj0 ) definidas por cada rectángulo.
Regresión
lineal.
Representación gráfica de distribuciones condicionadas.
Correlación Las distribuciones (unidimensionales) condicionadas
pueden representarse en gráficos conjuntos, donde se
incluyen los diagramas de barras, histogramas o diagramas
de caja relativos a una variable condicionada a los valores
particulares de otra.
Ricardo Cao Estadı́stica Aplicada
Medidas caracterı́sticas

Estadı́stica
Aplicada

Ricardo Cao
Momentos
Variable
estadı́stica Sea {(xi , yi )}ni=1 una muestra de una variable cuantitativa
bidimensional
(X , Y ). El momento con respecto al origen de orden (r , s)
Distribuciones
de frecuencias (r ≥ 0, sP≥ 0) de la variable (X , Y ) es el número
Representaciones ars = n1 ni=1 xir yis
gráficas

Medidas El momento con respecto aPlas medias de orden (r , s)


caracterı́sticas
(r ≥ 0, s ≥ 0) es mrs = n1 ni=1 (xi − x)r (yi − y )s
Regresión
lineal. Las medias marginales de X e Y son, respectivamente,
Correlación
a10 = x y a01 = y ; siendo m20 = sx2 y m02 = sy2 las
varianzas marginales de X e Y , respectivamente.

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas

Estadı́stica
Aplicada

Ricardo Cao

Variable Covarianza
estadı́stica
bidimensional En el caso particular r = 1, s = 1 se obtiene el momento m11 ,
Distribuciones conocido como la covarianza de (X , Y )
de frecuencias

Representaciones n
gráficas 1X
Cov (X , Y ) = sxy = m11 = (xi − x)(yi − y )
Medidas
caracterı́sticas
n
i=1
Regresión
lineal.
Correlación
que puede interpretarse como una medida de la relación lineal
entre las variables X e Y .

Ricardo Cao Estadı́stica Aplicada


Medidas caracterı́sticas

Estadı́stica
Aplicada
Covarianza. Propiedades
Ricardo Cao
La covarianza de (X , Y ) es igual a la de (Y , X ): sxy = syx .
Variable
estadı́stica
bidimensional
La covarianza de (X , X ) es igual a la varianza marginal de
Distribuciones
X : sxx = sx2 .
de frecuencias
Si a, b, c, d son constantes cualesquiera, la covarianza de
Representaciones
gráficas (U, V ), con U = a + bX y V = c + dY , es suv = bdsxy .
Medidas
caracterı́sticas Para el cálculo en la práctica de la covarianza de (X , Y )
Regresión puede utilizarse la relación
lineal.
Correlación
n
1X
sxy = a11 − a10 a01 = xi yi − x y
n
i=1

Ricardo Cao Estadı́stica Aplicada


Regresión lineal. Correlación

Estadı́stica
Aplicada Es interesante investigar la posible existencia de alguna
Ricardo Cao relación de dependencia entre las variables y la
construcción de algún modelo matemático que permita
Variable
estadı́stica describir dicha relación.
bidimensional
Entre las variables X e Y existe una relación de
Distribuciones
de frecuencias dependencia exacta si conociendo el valor de una se
Representaciones
gráficas
conoce exactamente el valor de la otra.
Medidas
X e Y son variables independientes si una variable no
caracterı́sticas contiene información sobre la otra.
Regresión
lineal.
La variable X contiene cierta información (incompleta)
Correlación acerca de la variable Y , pudiéndose predecir
aproximadamente el valor de Y a partir del conocimiento
del valor que ha tomado X mediante la construcción de lo
que llamaremos modelos de regresión; en estas situaciones
diremos que X e Y son variables dependientes.
Ricardo Cao Estadı́stica Aplicada
Regresión lineal. Correlación

Estadı́stica
Aplicada
El coeficiente de correlación lineal
Ricardo Cao
El propósito del estudio de la correlación es la
Variable
estadı́stica construcción de medidas del grado de dependencia o
bidimensional
asociación entre variables estadı́sticas, siendo la más
Distribuciones
de frecuencias popular de éstas el coeficiente de correlación lineal.
Representaciones
gráficas
Dadas observaciones {(xi , yi )}ni=1 de una variable
Medidas
bidimensional (X , Y ) se define el coeficiente de correlación
caracterı́sticas lineal de X e Y como el número
Regresión
lineal. sxy
Correlación rxy =
s x sy

que es una medida del grado de dependencia lineal entre


las variables X e Y .

Ricardo Cao Estadı́stica Aplicada


Regresión lineal. Correlación

Estadı́stica
Aplicada El coeficiente de correlación lineal. Propiedades
Ricardo Cao
El coeficiente de correlación lineal es una medida
Variable adimensional.
estadı́stica
bidimensional −1 ≤ rxy ≤ 1.
Distribuciones
de frecuencias Si rxy = ±1 significa que existe dependencia lineal exacta
Representaciones entre X e Y . Si rxy = 0 significa que no existe
gráficas
dependencia lineal entre X e Y (incorreladas). l
Medidas
caracterı́sticas
rxy = ryx . Si rxy > 0 la recta de regresión es creciente y si
Regresión
lineal. rxy < 0 ldecreciente.
Correlación
rxx = 1.
Si a, b, c, d son constantes, dadas nuevas variables
U = a + bX y V = c + dY se verifica que ruv = rxy , si
bd > 0, y ruv = −rxy , si bd < 0.

Ricardo Cao Estadı́stica Aplicada


Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos
y sucesos
Part III
Definición de
probabilidad

Probabilidad
condicionada Probabilidad
e
independencia
de sucesos

Teorema de
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Introducción

Estadı́stica
Aplicada El concepto de probabilidad está asociado a experimentos
Ricardo Cao (procesos de observación) donde existe incertidumbre
Introducción sobre el resultado final, que desde un punto de vista
Experimentos práctico son la mayorı́a de los experimentos reales.
y sucesos

Definición de
La Teorı́a de la Probabilidad es importante como soporte
probabilidad teórico de la Estadı́stica (Inferencia Estadı́stica) y como
Probabilidad
condicionada
herramienta en el estudio de la mayorı́a de las áreas de
e
independencia
conocimiento: Ingenierı́a, Economı́a, Sociologı́a, Medicina,
de sucesos Biologı́a, etc.
Teorema de
Bayes El origen de la Teorı́a de la Probabilidad está ligado al
Análisis estudio de los juegos de azar, siendo pioneros los trabajos
combinatorio
realizados por G. Cardano y G. Galilei en el siglo XVI.
Actualmente constituye un área cientı́fica de intensa
investigación.
Ricardo Cao Estadı́stica Aplicada
Experimentos y sucesos

Estadı́stica
Aplicada Experimentos
Ricardo Cao Un experimento es “un proceso por medio del cual se
Introducción
obtiene una observación”.
Experimentos Un experimento determinista es el que al realizarse
y sucesos
repetidas veces, en idénticas condiciones, proporciona
Definición de
probabilidad siempre el mismo resultado y, por tanto, puede predecirse
Probabilidad
condicionada
de antemano.
e
independencia Un experimento aleatorio es el que puede dar lugar a
de sucesos
diferentes resultados, conocidos previamente, sin que sea
Teorema de
Bayes posible predecir cuál va a ser el resultado que va a ocurrir
Análisis en una determinada realización del experimento.
combinatorio
La Teorı́a de la Probabilidad y la Estadı́stica estudian los
experimentos aleatorios que, en mayor o menor medida,
son todos los experimentos reales.
Ricardo Cao Estadı́stica Aplicada
Experimentos y sucesos

Estadı́stica
Aplicada Álgebra de sucesos
Ricardo Cao
Suceso elemental o simple: es cada uno de los posibles
Introducción resultados del experimento aleatorio.
Experimentos
y sucesos
Espacio muestral: es el conjunto formado por todos los
Definición de sucesos elementales. Lo denotaremos por Ω = {ω/ω es un
probabilidad
suceso elemental}. Se clasifica en: discreto (si es finito o
Probabilidad
condicionada infinito numerable) y continuo.
e
independencia Suceso: es un subconjunto del espacio muestral. Son
de sucesos
sucesos de interés: Ω, el suceso seguro, formado por todos
Teorema de
Bayes los sucesos elementales y ∅, el suceso imposible, que no
Análisis
combinatorio
contiene elementos.
Álgebra de sucesos: es el conjunto formado por todos los
sucesos asociados a un experimento aleatorio. Lo
denotaremos por A = {A/A es un suceso}.
Ricardo Cao Estadı́stica Aplicada
Experimentos y sucesos

Estadı́stica
Aplicada Ejemplo 1
Ricardo Cao Considérese el experimento aleatorio “lanzar un dado y
Introducción observar el número de puntos obtenido”. Los sucesos
Experimentos elementales son ωi = “se obtienen i puntos”, donde
y sucesos
i = 1, 2, . . . , 6. Son sucesos A = “se obtiene un número par” =
Definición de
probabilidad “el resultado es 2, 4 o 6” y B = “se obtiene un número mayor
Probabilidad que 2” = “el resultado es 3, 4, 5 o 6”.
condicionada
e
independencia
de sucesos Ejemplo 2
Teorema de
Bayes Considérese el experimento aleatorio “tiempo de ejecución de
Análisis un programa”. Los sucesos elementales son ωt = “la ejecución
combinatorio
ha durado t segundos”, con t ∈ R, t ≥ 0. Son sucesos C =
“el tiempo de ejecución es superior a 10 segundos” y D = “el
tiempo de ejecución está entre 5 y 15 segundos”.
Ricardo Cao Estadı́stica Aplicada
Experimentos y sucesos

Estadı́stica
Aplicada

Ricardo Cao
Álgebra de sucesos. Operaciones
Introducción Unión de sucesos: si A, B ∈ A, se define el suceso unión,
Experimentos
y sucesos
A ∪ B, como el que ocurre si sucede A o sucede B.
Definición de Intersección de sucesos: si A, B ∈ A, se define el suceso
probabilidad
intersección, A ∩ B, como el que ocurre si sucede A y
Probabilidad
condicionada sucede B. Por sencillez, A ∩ B también se escribe AB.
e
independencia
de sucesos
Suceso complementario o contrario: si A ∈ A, se define el
Teorema de
suceso contrario, Ā, como el que ocurre si no sucede A.
Bayes
Inclusión de sucesos: si A, B ∈ A, se dice que A está
Análisis
combinatorio contenido en B o que A implica B, A ⊂ B, si siempre que
sucede A ocurre B.

Ricardo Cao Estadı́stica Aplicada


Experimentos y sucesos

Estadı́stica
Aplicada

Ricardo Cao
Álgebra de sucesos. Operaciones
Introducción Diferencia de sucesos: si A, B ∈ A, se define el suceso
Experimentos
y sucesos
diferencia,
Definición de
A\B, como el que ocurre si sucede A y no sucede B, esto es,
probabilidad
A\B = A ∩ B̄
Probabilidad
condicionada Diferencia simétrica de sucesos: si A, B ∈ A, se define el
e
independencia suceso diferencia simétrica, A∇B, como el que ocurre si
de sucesos
sucede sólo A o sólo B, esto es,
Teorema de
Bayes A∇B = (A ∪ B)\(A ∩ B) = (A ∩ B̄) ∪ (B ∩ Ā)
Análisis
combinatorio Sucesos incompatibles: dos sucesos A, B ∈ A son
incompatibles si A ∩ B = ∅.

Ricardo Cao Estadı́stica Aplicada


Experimentos y sucesos

Estadı́stica
Aplicada Álgebra de sucesos. Operaciones
Ricardo Cao
Conjunto exhaustivo de sucesos: {A1 , A2 ,S
. . . , An / Ai ∈ A}
n
Introducción es un conjunto exhaustivo de sucesos si i=1 Ai = Ω
Experimentos
y sucesos
Conjunto completo de sucesos: {A1 , A2 , . . . , An / Ai ∈ A}
Definición de es un conjunto completo de sucesos si es exhaustivo y los
probabilidad
sucesos
Sn son incompatibles dos a dos:
Probabilidad
condicionada i=1 i = Ω y Ai ∩ Aj = ∅ si i 6= j
A
e
independencia A un “conjunto completo de sucesos” también se le
de sucesos
denomina partición del espacio muestral. El conjunto de
Teorema de
Bayes los sucesos elementales es una clase completa de sucesos y
Análisis la partición más fina del espacio muestral.
combinatorio
El álgebra de sucesos, A, asociada a un experimento
aleatorio tiene estructura de álgebra de Boole respecto a
las operaciones unión e intersección
Ricardo Cao Estadı́stica Aplicada
Experimentos y sucesos

Estadı́stica
Aplicada

Ricardo Cao
Álgebra de sucesos. Propiedades
Introducción
Conmutativa. A ∪ B = B ∪ A, A∩B =B ∩A
Experimentos
y sucesos
Asociativa.] A ∪ (B ∪ C ) = (A ∪ B) ∪ C ,
Definición de
probabilidad A ∩ (B ∩ C ) = (A ∩ B) ∩ C
Probabilidad Elemento neutro. El suceso imposible (∅) para la unión
condicionada
e A(∪∅) = A y el suceso seguro (Ω) para la intersección
independencia
de sucesos (A ∩ Ω = A).
Teorema de
Bayes Complementario. Dado A ∈ A existe Ā, que llamaremos
Análisis suceso complementario o contrario de A, tal que
combinatorio
A ∪ Ā = Ω y A ∩ Ā = ∅.

Ricardo Cao Estadı́stica Aplicada


Experimentos y sucesos

Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos
y sucesos Álgebra de sucesos. Propiedades
Definición de Idempotente. A ∪ A = A, A∩A=A
probabilidad

Probabilidad Simplificativa. A ∪ (A ∩ B) = A, A ∩ (A ∪ B) = A
condicionada
e Relativas al elemento neutro. A ∪ Ω = Ω, A∩∅=∅
independencia
de sucesos
Leyes de De Morgan. A ∪ B = Ā ∩ B̄, A ∩ B = Ā ∪ B̄
Teorema de
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Experimentos y sucesos

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 3
Introducción

Experimentos
Respecto al experimento del ejemplo 1 se obtienen los
y sucesos siguientes sucesos:
Definición de
probabilidad
A ∪ B= “obtener 2, 3, 4, 5 o 6”.
Probabilidad A ∩ B= “obtener 4 o 6”.
condicionada
e Ā= “obtener un número impar”.
independencia
de sucesos
B̄= “obtener 1 o 2”.
Teorema de A\B=“obtener el 2”.
Bayes
B\A= “obtener 3 o 5”.
Análisis
combinatorio A∇B= “obtener 2, 3 o 5”.

Ricardo Cao Estadı́stica Aplicada


Experimentos y sucesos

Estadı́stica
Aplicada
Ejemplo 4
Ricardo Cao
Respecto al experimento del ejemplo 2 se obtienen los
Introducción
siguientes sucesos:
Experimentos
y sucesos C ∪ D= “el tiempo de ejecución es superior a 5 segundos”.
Definición de C ∩ D= “el tiempo de ejecución está entre 10 y 15 segundos”.
probabilidad
C̄ = “el tiempo de ejecución es inferior o igual a 10 segundos”.
Probabilidad
condicionada D̄= “el tiempo de ejecución es menor o igual que 5 segundos o
e
independencia mayor o igual que 15 segundos”.
de sucesos
C \D= “el tiempo de ejecución es mayor o igual que 15
Teorema de
Bayes segundos”.
Análisis
combinatorio
D\C = “el tiempo de ejecución es superior a 5 segundos y
menor o igual que 10 segundos”.
C ∇D= “el tiempo de ejecución está en (5, 10] ∪ [15, ∞)”.

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada Definición axiomática de Kolmogorov
Ricardo Cao La probabilidad (P) asociada a un experimento aleatorio es una
Introducción aplicación del álgebra de sucesos (A) en R
Experimentos
y sucesos P : A −→ R
Definición de
probabilidad
verificando los siguientes axiomas:
Probabilidad
condicionada
e
1 Para todo suceso A, P(A) ≥ 0
independencia
de sucesos 2 P(Ω) = 1
Teorema de
Bayes
3 (σ−aditividad) Si {An }∞
n=1 es una sucesión de sucesos
Análisis incompatibles dos a dos, entonces:
combinatorio
∞ ∞
!
[ X
P An = P(An )
n=1 n=1

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos
y sucesos
Definición
Definición de
probabilidad Llamaremos espacio de probabilidad a la terna, (Ω, A, P)
Probabilidad
condicionada
formada por el espacio muestral (Ω), el álgebra de sucesos (A)
e
independencia
y la aplicación (P) verificando los anteriores axiomas.
de sucesos

Teorema de
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada

Ricardo Cao Ejemplo 5


Introducción En relación con el experimento del ejemplo 1, puede definirse la
Experimentos función de probabilidad a partir de la probabilidad de los
y sucesos
sucesos elementales, Ai = “obtener el número i”, de la
Definición de 1
probabilidad siguiente forma: P (Ai ) = , i = 1, 2, . . . , 6
Probabilidad 6
condicionada
e
independencia
de sucesos
Ejemplo 6
Teorema de En relación con el experimento del ejemplo 2, puede definirse la
Bayes
función de probabilidad a partir de la probabilidad de sucesos
Análisis
combinatorio de la forma At = “la duración de la ejecución del programa es
inferior a t segundos”, como P(At ) = 1 − e −t (t > 0).

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada

Ricardo Cao
Propiedades
1 P(∅) = 0.
Introducción

Experimentos
2 Si {Ai }ni=1 es un conjunto
! de sucesos incompatibles dos a
y sucesos
Sn Pn
Definición de
probabilidad
dos entonces, P Aj = P(Aj )
j=1 j=1
Probabilidad
condicionada
e
3 P(Ā) = 1 − P(A).
independencia
de sucesos
4 Para cualquier suceso A, 0 ≤ P(A) ≤ 1.
Teorema de
Bayes
5 Si A ⊂ B entonces P(A) ≤ P(B) y
Análisis
P(B\A) = P(B) − P(A).
combinatorio
6 Para dos sucesos cualesquiera A y B se verifica que,
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada
Ejemplo 7
Ricardo Cao
La probabilidad de que el estudiante A apruebe un examen es
Introducción
00 5, la probabilidad de que apruebe B es 00 3 y la probabilidad
Experimentos
y sucesos de que aprueben los dos es 00 2.
Definición de
probabilidad
La probabilidad de que al menos uno de los dos apruebe es
Probabilidad P(A ∪ B) = 00 5 + 00 3 − 00 2 = 00 6.
condicionada
e La probabilidad de que exactamente uno de los dos
independencia
de sucesos apruebe es P(A∇B) = P(A) + P(B) − 2P(A ∩ B) = 00 4.
Teorema de
Bayes
La probabilidad de que no apruebe ni A ni B es
Análisis P(Ā ∩ B̄) = 1 − P(A ∪ B) = 1 − 00 6 = 00 4.
combinatorio
La probabilidad de que apruebe A pero no B es
P(A ∩ B̄) = P(A\B) = P(A) − P(A ∩ B) = 00 5 − 00 2 = 00 3.

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada
Ejemplo 8
Ricardo Cao
Supóngase que la probabilidad de obtener el número i al lanzar
Introducción
un dado es inversamente proporcional a dicho número. Calcular
Experimentos
y sucesos la probabilidad de obtener un número par en una tirada.
Definición de Llamamos pi = P(“obtener el número i ”) = k/i,
probabilidad

Probabilidad
i = 1, 2, . . . , 6, con k una constante por determinar, que
condicionada obtenemos de la siguiente igualdad
e
independencia
de sucesos 6 6
X X 1 60
Teorema de pi = k = P(Ω) = 1 =⇒ k =
Bayes i 147
i=1 i=1
Análisis
combinatorio
55
Por tanto, P(“obtener un número par”) = .
147

Ricardo Cao Estadı́stica Aplicada


Definición de probabilidad

Estadı́stica
Aplicada
Asignación de probabilidades
Ricardo Cao
Método de las frecuencias: Definir la probabilidad del
Introducción
suceso como el lı́mite de las frecuencias realtivas.
Experimentos
y sucesos Método clásico: En los espacios muestrales finitos
Definición de
probabilidad
equiprobables, podemos calcular la probabilidad del suceso
Probabilidad
A como el cociente entre el número de “casos favorables”
condicionada
e
en que sucede A y el número de “casos posibles” que se
independencia
de sucesos
pueden dar. Esta regla se conoce como definición clásica o
Teorema de
Ley de Laplace.
Bayes
Método subjetivo: en el que una determinada persona
Análisis
combinatorio asigna de forma subjetiva probabilidades a cada uno de los
posibles resultados de un proceso según su propio juicio
sobre la verosimilitud de cada resultado.

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada
Ejemplo 9
Ricardo Cao
En un curso de Estadı́stica de 80 estudiantes aprobaron 50, de
Introducción
los que 35 eran chicas. La probabilidad de que haya aprobado
Experimentos 0
y sucesos un alumno elegido al azar es: P(aprobar) = 50 80 = 0 625
Definición de Pero si el número de chicas que participaron en el curso fue de
probabilidad
45, entonces la probabilidad de que haya aprobado un alumno
Probabilidad
condicionada elegido al azar sabiendo que es una chica, es:
e
independencia
de sucesos P(aprobar y ser chica)
Teorema de
P(aprobar/ser chica) =
Bayes P(ser chica)
Análisis 35/80
combinatorio = = 00 777
45/80

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao

Introducción
Definición
Experimentos
y sucesos Sean A y B dos sucesos cualesquiera con P(B) > 0. Se define
Definición de la probabilidad del suceso A condicionada al suceso B y se
probabilidad

Probabilidad
representa por P(A/B) como:
condicionada
e
independencia
P(A ∩ B)
de sucesos P(A/B) =
P(B)
Teorema de
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada Probabilidad condicionada. Comentarios
Ricardo Cao 1 La probabilidad condicionada es muy importante en la

Introducción
práctica, ya que, en muchas situaciones, pequeñas
Experimentos modificaciones en la información básica producen cambios
y sucesos
sustanciales en las probabilidades condicionadas.
Definición de
probabilidad 2 Con la definición anterior, es fácil probar que la
Probabilidad
condicionada
probabilidad condicionada a un suceso B verifica la
e
independencia
axiomática de la probabilidad dada en la definición.
de sucesos 3 Es importante diferenciar entre P(AB) y P(A/B): la
Teorema de
Bayes primera indica la probabilidad de ocurrencia de A y B
Análisis conjuntamente, por tanto siempre es menor o igual que
combinatorio
P(A); y la segunda indica la probabilidad de ocurrencia de
A cuando es conocido que ha ocurrido el suceso B y puede
ser menor, igual o mayor que P(A).
Ricardo Cao Estadı́stica Aplicada
Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao Ejemplo 10


Introducción En un almacén se dispone de diez motores de los cuales tres
Experimentos
y sucesos
son defectuosos. Si se eligen dos motores al azar y
Definición de
Denominando por Di al suceso “el motor elegido en lugar
probabilidad i-ésimo es defectuoso” y Ni al suceso “el motor elegido en
Probabilidad
condicionada
lugar i-ésimo es no defectuoso”, se pueden calcular las
e
independencia
siguientes probabilidades condicionadas
de sucesos P(N1 ∩D2 ) 7/10· 3/9 3
1 P(D2 /N1 ) = P(N1 ) = 7/10 = 9
Teorema de
Bayes P(D1 ∩D2 ) 3/10· 2/9 2
Análisis
2 P(D2 /D1 ) = P(D1 ) = 3/10 = 9
combinatorio 3
3 P(D2 ) = 10

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao Ejemplo 11


Introducción En una encuesta realizada en La Coruña se ha determinado que
Experimentos el 40% de los encuestados lee el periódico La Voz de Galicia, el
y sucesos
15% lee El Ideal Gallego y el 3% lee ambos periódicos.
Definición de
probabilidad 1 Seleccionado al azar un lector de El Ideal Gallego, calcular
Probabilidad
condicionada
la probabilidad de que lea La Voz de Galicia.
e
independencia
Sea V el suceso “lee La Voz de Galicia”, e I el suceso “lee
∩I )
de sucesos
El Ideal Gallego”, entonces P(V /I ) = P(V 3
P(I ) = 15 = 0 2
0
Teorema de
Bayes 2 Si se ha elegido un lector de La Voz de Galicia, calcular la
Análisis
combinatorio
probabilidad de que no lea El Ideal Gallego.
∩V )
P(Ī /V ) = 1 − P(I 3 0
P(V ) = 1 − 40 = 0 925

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada Ejemplo 12
Ricardo Cao En un centro de secundaria el 50% de los alumnos aprueba el
Introducción Bachillerato. Se estima que si se presentasen todos los alumnos
Experimentos a las pruebas de Selectivo sólo suspenderı́an el 40% y que un
y sucesos
30% de los alumnos que aprobarı́an el Selectivo suspenden el
Definición de
probabilidad Bachillerato. Con estos datos calcular la probabilidad de que
Probabilidad un alumno que apruebe el Bachillerato apruebe el Selectivo.
condicionada
e Sea C el suceso “aprueba el Bachillerato” y S el suceso
independencia
de sucesos “aprueba el Selectivo”, por tanto, P(C ) = 00 50, P(S̄) = 00 40
Teorema de P(C̄ /S) = 00 30.
Bayes
La probabilidad pedida es
Análisis
combinatorio
P(S ∩ C ) P(C /S)P(S) 00 70 00 60
P(S/C ) = = = = 00 84
P(C ) P(C ) 00 50

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao
Regla del producto
Introducción
n−1
!
\
Experimentos
y sucesos Sean A1 , A2 , . . . , An sucesos tales que P Ai > 0.
Definición de i=1
probabilidad Entonces:
n
!
Probabilidad \
condicionada P Ai =
e
independencia i=1
de sucesos
n−1
, !!
Teorema de \
Bayes = P(A1 )P(A2 /A1 )P(A3 /A1 ∩ A2 ) · · · P An Ai
Análisis
combinatorio
i=1

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 13
Introducción
En relación con el ejemplo 10, si se eligen cuatro motores al
Experimentos
y sucesos azar, sin reemplazamiento, calcular la probabilidad de que el
Definición de primer y el tercer motores elegidos sean defectuosos y los otros
probabilidad
dos no.
Probabilidad
condicionada P(D1 N2 D3 N4 ) =
e
independencia
de sucesos = P(D1 )P(N2 /D1 )P(D3 /D1 N2 )P(N4 /D1 N2 D3 ) =
Teorema de
3 7 2 6 1
Bayes
= = = 00 05
Análisis 10 9 8 7 20
combinatorio

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos Definición
y sucesos
Dos sucesos A y B se dicen independientes si
Definición de
probabilidad

Probabilidad P(A ∩ B) = P(A)P(B)


condicionada
e
independencia
de sucesos
o, equivalentemente, P(A/B) = P(A), si P(B) > 0, o bien
Teorema de
P(B/A) = P(B), si P(A) > 0.
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Probabilidad condicionada e independencia de
sucesos
Estadı́stica
Aplicada

Ricardo Cao Independencia de sucesos. Comentarios


Introducción
1 La independencia de sucesos puede suponerse en algunas
Experimentos situaciones y deducirse del contexto del problema pero, en
y sucesos
general, debe comprobarse experimentalmente.
Definición de
probabilidad 2 No debe confundirse sucesos independientes con sucesos
Probabilidad
condicionada
incompatibles.
e
independencia
3 Si A y B son sucesos independientes también lo son A y
de sucesos
B̄, Ā y B y Ā y B̄.
Teorema de
Bayes 4 Los sucesos A1 , A2 , . 
. . , An son mutuamente
 Q
Análisis
Tk k 
combinatorio independientes si P h=1 j(h) =
A h=1 P Aj(h) para
cualesquiera ı́ndices 1 ≤ j(1) < j(2) < · · · < j(k) ≤ n.

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos
Teorema de las probabilidades totales
y sucesos
Sea A1 , A2 , . . . , An un sistema completo de sucesos, con
Definición de
probabilidad P(Ai ) > 0 (i = 1, . . . , n), y sea B un suceso cualquiera.
Probabilidad Entonces
condicionada n
X
e
independencia P(B) = P(B/Ai )P(Ai )
de sucesos
i=1
Teorema de
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao

Introducción Ejemplo 15
Experimentos
y sucesos En una escuela técnica el 50% de los alumnos es de primer
Definición de curso, el 30% es de segundo y el 20% de tercero. De la
probabilidad

Probabilidad
encuesta de evaluación de profesorado se sabe que el 60% de
condicionada los alumnos de primero tiene buena opinión del profesorado, al
e
independencia igual que el 70% de los de segundo y el 75% de los de tercero.
de sucesos

Teorema de
Elegido un alumno al azar ¿cuál es la probabilidad de que tenga
Bayes una buena opinión del profesorado?
Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao Ejemplo 15


Introducción
Si consideramos el suceso B = “tener buena opinión del
Experimentos profesorado” y el sistema completo de sucesos formado por I =
y sucesos
“ser de primero”, S = “ser de segundo” y T = “ser de
Definición de
probabilidad tercero”, la probabilidad pedida es:
Probabilidad
condicionada
e
P(B) = P (B ∩ Ω) = P (B ∩ (I ∪ S ∪ T ))
independencia
de sucesos = P (B ∩ I ) + P (B ∩ S) + P (B ∩ T )
Teorema de
Bayes
= P(B/I )P(I ) + P(B/S)P(S) + P(B/T )P(T )
Análisis = 00 6 · 00 5 + 00 7 · 00 3 + 00 75 · 00 2 = 00 66
combinatorio

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos
Ejemplo 16
y sucesos
En una estación de ITV (Inspección Técnica de Vehı́culos) hay
Definición de
probabilidad dos equipos de inspección, el equipo A rechaza el 30% de los
Probabilidad coches inspeccionados y el equipo B no rechaza ningún coche.
condicionada
e Si llegan tres coches a la estación y cada uno elige al azar uno
independencia
de sucesos de los dos equipos de inspección, ¿cuál es la probabilidad de
Teorema de que los tres coches superen la inspección?
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada Ejemplo 16
Ricardo Cao
Sean los sucesos A = “elegir equipo A”, B =“elegir equipo B”
Introducción y S = “superar la inspección”, por el teorema de las
Experimentos probabilidades totales se obtiene
y sucesos

P(S) = P(S/A)P(A) + P(S/B)P(B) = 00 7 · 00 5 + 1 · 00 5 = 00 85


Definición de
probabilidad

Probabilidad
condicionada
e
independencia
de sucesos
Denominemos Si al suceso “el coche i supera la inspección”,
Teorema de con i = 1, 2, 3. Por la independencia de estos sucesos, la
Bayes
probabilidad pedida es
Análisis
combinatorio
P (S1 ∩ S2 ∩ S3 ) = 00 853 = 00 6141

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao

Introducción
Teorema de Bayes
Experimentos Sea A1 , A2 , . . . , An un sistema completo de sucesos, con
y sucesos
P(Ai ) > 0 para i = 1, . . . , n, (probabilidades a priori) y sea B
Definición de
probabilidad un suceso cualquiera, con P(B) > 0. Entonces, para
Probabilidad j = 1, 2, . . . , n,
condicionada
e
independencia P(Aj B) P(B/Aj )P(Aj )
de sucesos P(Aj /B) = = Pn ,
Teorema de
P(B) i=1 P(B/Ai )P(Ai )
Bayes

Análisis llamadas probabilidades a posteriori.


combinatorio

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos
Ejemplo 18
y sucesos
En un examen tipo test con cinco posibles respuestas, la
Definición de
probabilidad probabilidad de que Juan sepa la respuesta es 00 6, la
Probabilidad probabilidad de que responda al azar es 00 2 y la probabilidad de
condicionada
e que no responda es 00 2. Si el estudiante respondió
independencia
de sucesos correctamente ¿cuál es la probabilidad de que realmente sepa la
Teorema de respuesta?
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Teorema de Bayes

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 18
Sean los sucesos S = “Juan sabe la respuesta”, A = “Juan
Introducción

Experimentos
responde al azar” y N = “Juan no responde”, con
y sucesos probabilidades: P(S) = 00 6, P(A) = 00 2 y P(N) = 00 2. Sea C
Definición de
probabilidad
el suceso “Juan respondió correctamente”, se verifica que
Probabilidad
P(C /S) = 1, P(C /A) = 1/5 = 00 2 y P(C /N) = 0. Por el
condicionada
e
teorema de Bayes se obtiene:
independencia
de sucesos
00 6 · 1 00 6
Teorema de P(S/C ) = = = 00 9375
Bayes 00 6 · 1 + 0 0 2 · 00 2 + 0 0 2 · 0 00 64
Análisis
00 04
combinatorio
análogamente, P(A/C ) = 00 64 = 00 0625 y,
P(N/C ) = 00064 = 0

Ricardo Cao Estadı́stica Aplicada


Análisis combinatorio

Estadı́stica
Aplicada Definición
Ricardo Cao Sean n y k dos númerosnaturales tales que k ≤ n, se define el
Introducción
número combinatorio kn como,
Experimentos
n(k)
 
y sucesos n n! n(n − 1)(n − 2) · · · (n − k + 1)
Definición de = = =
probabilidad k k! (n − k)! k! k(k − 1)(k − 2) · · · 1
Probabilidad
condicionada
e
independencia
El número combinatorio kn también se notará Cn,k .

de sucesos

Teorema de Este número se conoce como coeficiente binomial, por


Bayes
aparecer en el teorema binomial o binomio de Newton,
Análisis
combinatorio n  
n
X n j n−j
(a + b) = ab
j
j=0

Ricardo Cao Estadı́stica Aplicada


Análisis combinatorio

Estadı́stica
Aplicada

Ricardo Cao

Introducción

Experimentos Propiedades
y sucesos
n n
 
Definición de 1
n = 0 = 1.
probabilidad
n
1  = n.
2
Probabilidad
condicionada n n

k = n−k .
e 3
independencia
n n n n
= (1 + 1)n = 2n .
   
0 + 1 + 2 + ··· +
de sucesos 4
n
Teorema de
Bayes

Análisis
combinatorio

Ricardo Cao Estadı́stica Aplicada


Estadı́stica
Aplicada

Ricardo Cao

Definición de
variable
aleatoria

Variables Part IV
aleatorias
discretas

Variables
aleatorias Variables aleatorias unidimensionales
continuas

Transformación
de variables
aleatorias

Caracterı́sticas
de una
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Definición de variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao
Definición
Definición de
variable
Dado un experimento aleatorio, con espacio muestral asociado
aleatoria Ω, una variable aleatoria es cualquier función, X ,
Variables
aleatorias
discretas X : Ω −→ R
Variables
aleatorias
continuas que asocia a cada suceso elemental un número real, verificando
Transformación que, para cualquier número real r , es un suceso el conjunto
de variables
aleatorias

Caracterı́sticas
{w ∈ Ω tales que X (w ) ≤ r } = X −1 ((−∞, r ])
de una
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Definición de variable aleatoria

Estadı́stica
Aplicada Ejemplo 1
Ricardo Cao
Se examinan las piezas producidas por una máquina.
Definición de Representando por D el resultado “la pieza 
producida
es
variable
aleatoria defectuosa”, sobre el espacio muestral Ω = D, D puede
Variables definirse la variable aleatoria X :
aleatorias
discretas 
1 si w = D
Variables X (w ) =
aleatorias
continuas
0 si w = D
Transformación
de variables X es una variable aleatoria ya que X −1 ((−∞, r ]) es un suceso:
aleatorias

Caracterı́sticas 
de una  φ r <0
X −1 ((−∞, r ]) =
variable
aleatoria D 0≤r <1
Ω r ≥1

Ricardo Cao Estadı́stica Aplicada


Definición de variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao Función de distribución de una variable aleatoria


Definición de
La función de distribución de una variable aleatoria X es una
variable
aleatoria
función real que a cada número real x le asocia la probabilidad
Variables
de que la variable tome valores menores o iguales que dicho
aleatorias
discretas
número, esto es:
Variables
aleatorias F (x) = P(X ≤ x) = P ({w ∈ Ω tales que X (w ) ≤ x})
continuas

= P(X −1 ((−∞, x]))


Transformación
de variables
aleatorias

Caracterı́sticas
de una
variable La definición de F está garantizada porque el conjunto
aleatoria
X −1 ((−∞, x]) es un suceso.

Ricardo Cao Estadı́stica Aplicada


Definición de variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao
Propiedades de la función de distribución
Definición de
variable 1 0 ≤ F (x) ≤ 1.
aleatoria

Variables
2 F es no decreciente (x1 < x2 ⇒ F (x1 ) ≤ F (x2 )).
aleatorias
 
discretas 3 F (+∞) = 1 lim F (x) = 1 .
Variables
x→∞
aleatorias
 
continuas 4 F (−∞) = 0 lim F (x) = 0 .
Transformación x→−∞
de variables
aleatorias 5 F
 es continua por la derecha 
Caracterı́sticas +
F (x ) = lim+ F (x + h) = F (x) .
de una
variable h→0
aleatoria

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias discretas

Estadı́stica
Aplicada Definición
Ricardo Cao Una variable aleatoria discreta es aquella que sólo puede tomar
Definición de
valores dentro de un conjunto finito o infinito numerable.
variable
aleatoria

Variables
Ejemplos
aleatorias
discretas En un proceso de control de calidad se analiza el
Variables porcentaje de piezas defectuosas fabricadas, asociando
aleatorias
continuas “pieza defectuosa” con 1 y “pieza no defectuosa” con 0.
Transformación
de variables
Lanzar dos dados de seis caras equiprobables, se considera
aleatorias como variable la correspondencia que asocia a cada
Caracterı́sticas
de una
resultado la “suma de los valores aparecidos”.
variable
aleatoria “el número de conexiones a Internet a lo largo de un
mes”, “el número de piezas producidas antes de la primera
defectuosa”, etc.
Ricardo Cao Estadı́stica Aplicada
Variables aleatorias discretas

Estadı́stica
Aplicada

Ricardo Cao Función de masa de probabilidad de una variable aleatoria disc-


Definición de reta
variable
aleatoria Sea X una v.a. discreta
P que toma los valores xi con
Variables pi = P(X = xi ), con i pi = 1. Se denomina función de
aleatorias
discretas masa de probabilidad o función de probabilidad de X a la
Variables función que asigna a cada xi su probabilidad pi .
aleatorias
continuas
La función de distribución
P de una variable discreta es:
Transformación
de variables F (x) = P(X ≤ x) = xi ≤x pi
aleatorias

Caracterı́sticas
La función F es escalonada, no decreciente, con saltos de
de una discontinuidad en los puntos xi . El valor del salto en xi
variable
aleatoria coincide con la probabilidad, pi , de dicho valor.

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias discretas

Estadı́stica
Aplicada Ejemplo 1
Ricardo Cao
Sea X = “suma de los puntos obtenidos al lanzar dos dados”,
Definición de la función de masa de probabilidad es:
variable
aleatoria
1
Variables p1 = P(X = 2) = P({(1, 1)}) =
aleatorias
discretas
36
2
Variables p2 = P(X = 3) = P({(1, 2), (2, 1)}) =
aleatorias
continuas
36
3
Transformación p3 = P(X = 4) = P({(2, 2), (1, 3), (3, 1)}) =
de variables
aleatorias
36
.. ..
Caracterı́sticas . .
de una
variable 1
aleatoria p11 = P(X = 12) = P({(6, 6)}) =
36

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias discretas

Estadı́stica
Aplicada Ejemplo 1
Ricardo Cao Su función de distribución es:
Definición de

variable 
 0 si x <2
aleatoria
si 2 ≤ x < 3



 1/36
Variables
si 3 ≤ x < 4

aleatorias


 3/36
discretas 


 6/36 si 4 ≤ x < 5
Variables 
aleatorias


 10/36 si 5 ≤ x < 6
continuas

15/36 si 6 ≤ x < 7

Transformación F (x) = P(X ≤ x) =
de variables  21/36 si 7 ≤ x < 8
aleatorias

26/36 si 8 ≤ x < 9



Caracterı́sticas

si 9 ≤ x < 10

de una


 30/36
variable
si 10 ≤ x < 11

aleatoria


 33/36




 35/36 si 11 ≤ x < 12
 1 si x ≥ 12
Ricardo Cao Estadı́stica Aplicada
Variables aleatorias continuas

Estadı́stica
Aplicada

Ricardo Cao Definición


Definición de Una variable aleatoria continua es aquella que toma valores en
variable
aleatoria uno o varios intervalos de la recta real.
Variables
aleatorias
discretas Ejemplos
Variables
aleatorias
“la hora de llegada de un profesor a su despacho”.
continuas
“la duración de una llamada telefónica”.
Transformación
de variables “la cantidad de lluvia caı́da por metro cuadrado en una
aleatorias

Caracterı́sticas
determinada zona”.
de una
variable “la superficie de planchas metálicas producidas en una
aleatoria
factorı́a”.

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias continuas

Estadı́stica
Aplicada

Ricardo Cao
Función de densidad de una variable aleatoria continua
Dada una variable aleatoria continua X su función de
Definición de
variable densidad es la función real de variable real:
aleatoria

Variables P(x − h ≤ X ≤ x + h)
aleatorias f (x) = lim+
discretas h→0 2h
Variables
aleatorias
continuas

Transformación
De la definición anterior, se deduce que
de variables
aleatorias
f (x) = F 0 (x) = dFdx(x)
Caracterı́sticas Dada una variable continua X , con función de densidad f ,
de una
variable su función de distribución
R x es
aleatoria
F (x) = P(X ≤ x) = −∞ f (t)dt

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias continuas

Estadı́stica
Aplicada

Ricardo Cao Propiedades de la función de densidad


Definición de
1 f (x) ≥ 0, −∞ < x < ∞. El conjunto de valores donde
variable
aleatoria
f (x) > 0 se llama soporte de X .
R∞
−∞ f (x)dx = F (+∞) = 1
Variables 2
aleatorias
discretas Rb
3 P(a ≤ X ≤ b) = a f (t)dt = F (b) − F (a)
Variables
aleatorias
continuas
4 F (x0 ) = P(X ≤ x0 ) mide el área de la región limitada por
Transformación la función de densidad, el eje de abscisas y la recta x = x0 .
de variables Rx
aleatorias 5 P(X = x0 ) = x00 f (t)dt = 0
Caracterı́sticas
de una
6 En general, cualquier función real que verifica las
variable
aleatoria
propiedades 1 y 2 es la función de densidad de alguna
variable aleatoria continua X .

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias continuas

Estadı́stica
Aplicada Ejemplo 2
Ricardo Cao Un profesor llega cada dı́a a su despacho con igual probabilidad
Definición de
entre las 8 y las 9 horas. ¿Cuál es la función de densidad de la
variable
aleatoria
variable X = “hora de llegada al despacho”? ¿Cuál es la
Variables probabilidad de que llegue antes de las ocho y media?
aleatorias
discretas
Se trata de una variable continua con función de densidad de X
Variables es: 
aleatorias 1 si 8 < x < 9
continuas f (x) =
Transformación
0 si x ∈ / (8, 9)
de variables
aleatorias

Caracterı́sticas
La probabilidad de que llegue antes de las ocho y media es:
de una
variable Z 80 5
aleatoria 0
P(X ≤ 8 5) = 1dx = 00 5
8

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias continuas

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 3
Dada una variable aleatoria continua con función de densidad
Definición de
variable
3x 2 /8 si 0 ≤ x ≤ 2

aleatoria
f (x) =
Variables 0 si x ∈
/ (0, 2)
aleatorias
discretas

Variables su función de distribución es:


aleatorias
continuas 
 0 si x < 0
Transformación
de variables F (x) = x 3 /8 si 0 ≤ x ≤ 2
aleatorias
1 si x > 2

Caracterı́sticas
de una
variable
aleatoria La probabilidad deRque la variable tome valores entre 10 5 y 2:
2 2
P(10 5 < X < 2) = 10 5 3t8 dt = 00 578

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias continuas

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 4
Definición de
variable
En el caso de la variable “duración de una llamada de
aleatoria teléfono”, se puede proponer como función de densidad:
Variables
aleatorias
 −x
discretas e si x ≥ 0
f (x) =
Variables 0 si x < 0
aleatorias
continuas

Transformación
Su función de distribución es:
de variables
1 − e −x

aleatorias
si x ≥ 0
Caracterı́sticas F (x) =
de una 0 si x < 0
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias mixtas

Estadı́stica
Aplicada
Definición
Ricardo Cao
Una variable que tome unos valores puntuales con probabilidad
Definición de
variable
dada, y el resto de los valores los tome dentro de uno o varios
aleatoria
intervalos siguiendo una determinada función de densidad, se
Variables
aleatorias dirá que es una variable aleatoria con distribución mixta.
discretas

Variables
aleatorias Comentario
continuas

Transformación
Por simplicidad, en la definición anterior se está usando el
de variables concepto de función de densidad en un sentido amplio, pues, si
aleatorias

Caracterı́sticas
una variable sigue un modelo mixto de distribución, es evidente
de una
variable
que la probabilidad acumulada en los intervalos en que ésta se
aleatoria comporta de modo continuo (igual al valor de la integral de la
función de densidad en dichos intervalos) es inferior a la unidad.

Ricardo Cao Estadı́stica Aplicada


Variables aleatorias mixtas

Estadı́stica
Aplicada Ejemplo 5
Ricardo Cao Se define la variable mixta X que toma los valores −1 y 0, con
Definición de
probabilidades respectivas 00 1 y 00 2, y que toma valores en el
variable
aleatoria
intervalo (1, 2) de acuerdo con la función de densidad
Variables 
aleatorias k(2x − 1) si x ∈ (1, 2)
discretas f (x) =
Variables
0 en otro caso
aleatorias
continuas

Transformación El valor de k = 00 35 verifica que la suma de todas las


de variables
aleatorias probabilidades es 1, obtenido resolviendo:
Caracterı́sticas
de una
variable 1 = P(X = −1) + P(X = 0) + P (X ∈ (1, 2))
aleatoria Z 2
0 0
= 01+02+ k(2x − 1)dx
1

Ricardo Cao Estadı́stica Aplicada


Razón de fallo de una variable continua

Estadı́stica
Aplicada Definición
Ricardo Cao
Sea T la variable aleatoria “tiempo de vida de una componente
Definición de o sistema”, y sea F (t) su función de distribución. La función
variable
aleatoria de fiabilidad o de supervivencia de la variable aleatoria T es:
Variables R(t) = P(T > t) = 1 − F (t), t>0
aleatorias
discretas

Variables
aleatorias
Definición
continuas
La razón de fallo de una componente o sistema es la proporción
Transformación
de variables de unidades que fallan en un intervalo de tiempo (t, t + dt),
aleatorias
con respecto a las que siguen funcionando en t. Esto es:
Caracterı́sticas
de una
variable f (t) R 0 (t)
aleatoria h(t) = =−
R(t) R(t)

Ricardo Cao Estadı́stica Aplicada


Razón de fallo de una variable continua

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 6
Dada la variable aleatoria con función de densidad
Definición de
variable
24t 2 exp(−(2t)3 ) si t > 0

aleatoria
f (t) =
Variables
aleatorias
0 en otro caso
discretas

Variables sus funciones de fiabilidad y razón de fallo son:


aleatorias
continuas
exp(−(2t)3 ) si t > 0

Transformación R(t) = 1 − F (t) =
de variables
aleatorias
0 en otro caso
Caracterı́sticas
24t 2 si t > 0

de una f (t)
variable h(t) = =
aleatoria R(t) 0 en otro caso

Ricardo Cao Estadı́stica Aplicada


Razón de fallo de una variable continua

Estadı́stica
Aplicada Ejemplo 7
Ricardo Cao
Si la duración de una componente electrónica es una variable
Definición de aleatoria T , con función de densidad
variable
aleatoria
αe −αt si t > 0

Variables
aleatorias
f (t) =
discretas
0 en el resto
Variables
aleatorias sus funciones de fiabilidad y razón de fallo son:
continuas

R(t) = 1 − F (t) = e −αt


Transformación
de variables
aleatorias

Caracterı́sticas f (t)
de una h(t) = =α
variable
aleatoria
R(t)

La razón de fallo es constante y la variable no tiene memoria.

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao Definición


Definición de Sea X una variable aleatoria discreta P
que toma los valores xi
variable
aleatoria con probabilidades pi . Supuesto que i |xi | pi < ∞, se define
Variables la media, valor esperado o esperanza matemática de la variable
aleatorias P
discretas X como el número real: µ = E (X ) = i xi pi
Variables
aleatorias
continuas Definición
Transformación
de variables Sea X una variable
R ∞aleatoria continua con función de densidad
aleatorias
f . Supuesto que −∞ |x| f (x)dx < ∞, se define la media, valor
Caracterı́sticas
de una esperado o esperanza matemática
R ∞ de la variable X como el
variable
aleatoria número real: µ = E (X ) = −∞ xf (x)dx

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao

Definición de
Propiedades de la esperanza
variable
aleatoria
1 E (aX + b) = aE (X ) + b
Variables
aleatorias
2 E (X + Y ) = E (X ) + E (Y )
discretas 3 Si X es discreta con valores xi , y probabilidadesX
pi , la
Variables
aleatorias media de Y = g (X ) es: E (Y ) = E (g (X )) = g (xi )pi
continuas
i
Transformación
de variables 4 Si X es una variable continua con densidad
Z ∞ f , la media de
aleatorias

Caracterı́sticas Y = g (X ) es: E (Y ) = E (g (X )) = g (x)f (x)dx


de una −∞
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo 9
Definición de
variable
aleatoria
Valor esperado de la variable X = “suma de los resultados
Variables
obtenidos al lanzar dos dados”:
aleatorias 
discretas
(6 − |6 − i|)/36 si i = 1, 2, . . . , 11
Variables pi =
aleatorias 0 en otro caso
continuas

Transformación 11
de variables X 1 2 1
aleatorias E (X ) = xi · pi = 2 + 3 + · · · + 12 = 7
Caracterı́sticas
36 36 36
i=1
de una
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada Ejemplo 10
Ricardo Cao Media de la variable aleatoria continua cuya función de
Definición de
densidad está dada por:
variable
aleatoria 
1 si 8 ≤ x ≤ 9
Variables f (x) =
aleatorias 0 si x ∈/ [8, 9]
discretas

Variables Z ∞ Z 9
aleatorias
continuas E (X ) = xf (x)dx = xdx = 80 5
Transformación
−∞ 8
de variables
aleatorias
La media de Y = g (X ) = X 3 es
Caracterı́sticas
de una
variable
Z 9
aleatoria
E (Y ) = E (g (X )) = x 3 dx = 6160 25
8

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada
Definición
Ricardo Cao
Sea X una variable aleatoria con media µ = E (X ). Se define la
Definición de
variable varianza de X como el valor esperado de los cuadrados de las
aleatoria
diferencias con la media: σ 2 = Var (X ) = E [(X − E (X ))2 ]
Variables
aleatorias
discretas
Definición
Variables
aleatorias
continuas
Se define la desviación tı́pica dep
la variable X como la raı́z
Transformación
positiva de la varianza: σ = + E [(X − E (X ))2 ]
de variables
aleatorias

Caracterı́sticas Propiedades
de una
variable
aleatoria
1 Var (aX + b) = a2 Var (X ).
Var (X ) = E X 2 − [E (X )]2 .

2

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao

Definición de
variable
Tipificacı́ón de una variable aleatoria
aleatoria
Una variable aleatoria se dirá que está estandarizada o
Variables
aleatorias tipificada, si su media es 0 y su varianza es 1.
discretas

Variables
Para transformar una variable X con media µ y desviación
aleatorias
continuas
tı́pica σ en otra tipificada, basta con aplicar la
X −µ
Transformación transformación lineal, Y = .
de variables
aleatorias
σ
La nueva variable, Y , tiene media 0 y varianza 1.
Caracterı́sticas
de una
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada Otras medidas caracterı́sticas de una variable aleatoria
Ricardo Cao
Se define el coeficiente de variación de una variable X , con
Definición de media µ > 0 y desviación tı́pica σ, como : CV (X ) = σµ
variable
aleatoria Se define el momento con respecto al origen de orden r ,
Variables
aleatorias
αr , de una variable aleatoria X como αr = E (X r )
discretas
Se define el momento central o con respecto a la media de
Variables
aleatorias orden r , µr , de X como µr = E ((X − E (X ))r )
continuas

Transformación
α1 = E (X ) y µ2 = Var (X ).
de variables
aleatorias Haciendo uso del binomio de Newton, se tiene que:
Caracterı́sticas
de una r  
X
kr
variable
aleatoria µr = (−1) αr −k α1k
k
k=0

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao Otras medidas caracterı́sticas de una variable aleatoria


Definición de
La mediana de una variable aleatoria es la medida de
variable
aleatoria
centralización que divide la distribución en dos partes de
Variables
igual probabilidad. Es el valor Me que, para una variable
aleatorias
discretas
con distribución F , verifica: Me = inf{x/F (x) ≥ 1/2}
Variables Cuantiles de orden p, siendo 0 < p < 1, son los valores
aleatorias
continuas Qp , que dejan un 100p% de la distribución de probabilidad
Transformación a su izquierda. Esto es: Qp = inf{x/F (x) ≥ p}
de variables
aleatorias
Los cuantiles más usados son Q 1 , Q 1 y Q 3 que se
Caracterı́sticas 4 2 4
de una denominan también primer, segundo y tercer cuartil.
variable
aleatoria Recorrido intercuartı́lico RI = Q 3 − Q 1
4 4

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao
Otras medidas caracterı́sticas de una variable aleatoria
La moda de una variable es el valor M0 que maximiza la
Definición de
variable función de probabilidad o la función de densidad, según se
aleatoria
trate de una variable discreta o continua, respectivamente.
Variables
µ3
aleatorias
discretas
El coeficiente de asimetrı́a es el cociente γ1 = σ3
Variables Si γ1 es 0 la distribución es simétrica. En otro caso
aleatorias
continuas presentará asimetrı́a positiva o negativa de acuerdo con el
Transformación signo de γ1 .
de variables
aleatorias
El coeficiente de apuntamiento o curtosis es el número
Caracterı́sticas
de una γ2 = σµ44 − 3
variable
aleatoria Si γ2 es 0 la distribución presenta una forma similar a la
distribución normal.

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada Ejemplo 13
Ricardo Cao Vamos a calcular algunas de las medidas caracterı́sticas de la
Definición de
distribución continua que tiene por función de densidad
variable
aleatoria  0
0 1 si 0 ≤ x ≤ 10
Variables f (x) =
aleatorias 0 en otro caso
discretas

Variables
aleatorias
continuas Media y varianza:
Transformación
de variables Z ∞ Z 10
aleatorias 1
µ = E (X ) = xf (x)dx = xdx = 5
Caracterı́sticas −∞ 0 10
de una
variable
aleatoria
Z 10
1
σ 2 = E (x − 5)2 = (x − 5)2 dx = 80 3333

0 10

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada Ejemplo 13
Ricardo Cao
Coeficiente de variación: CV = σ
µ = 00 57735
Definición de
variable Momentos con respecto al origen:
aleatoria

10 10
x k+1 10k
Variables
Z 
aleatorias
1 k
discretas αk = x dx = =
0 10 (k + 1) 10 0 k +1
Variables
aleatorias
continuas

Transformación Momentos centrales o respecto a la media:


de variables
aleatorias " #10
10
(x − 5)k+1
Z
Caracterı́sticas 1 k
de una µk = (x − 5) dx =
variable
0 10 10(k + 1)
aleatoria 0

en particular, µ3 = 0 y µ4 = 125.

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada Ejemplo 13
Ricardo Cao Al tratarse de una variable continua, el cuartil Qp es el
Definición de valor de la variable que verifica que F (Qp ) = p, siendo F
variable
aleatoria la función de distribución de la variable:
Variables 
aleatorias
discretas  x0 si x < 0

Variables F (x) = si 0 ≤ x ≤ 10
aleatorias  10

continuas 1 si x > 10
Transformación
de variables
aleatorias
La mediana es el valor Me que verifica que F (Me ) = 1/2 :
Caracterı́sticas
de una
variable 1 Me 1
aleatoria F (Me ) = ⇒ = ⇒ Me = 5
2 10 2

Ricardo Cao Estadı́stica Aplicada


Caracterı́sticas de una variable aleatoria

Estadı́stica
Aplicada

Ricardo Cao

Definición de
Ejemplo 13
variable
aleatoria Los cuantiles de orden p serán aquellos valores Qp tales
Variables que
aleatorias Qp
discretas F (Qp ) = p ⇒ = p ⇒ Qp = 10p
Variables 10
aleatorias
continuas

Transformación Recorrido intercuartı́lico: RI = Q 3 − Q 1 = 5


de variables 4 4
aleatorias
Como γ1 = 0 y γ2 = −10 2, la distribución es simétrica y
Caracterı́sticas
de una platicúrtica (más aplastada que la normal).
variable
aleatoria

Ricardo Cao Estadı́stica Aplicada


Estadı́stica
Aplicada

Ricardo Cao

Principales
distribuciones
unidimension-
ales
discretas
Part VI
Principales
distribuciones
unidimension-
ales
Distribuciones notables
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada
El proceso de Bernoulli
Ricardo Cao
En cada observación se clasifica el elemento de la
Principales
distribuciones
población en una de las dos posibles categorı́as,
unidimension-
ales
correspondientes a la ocurrencia o no de un suceso.
discretas Llamaremos éxito (E ) a la ocurrencia y fracaso (F ) a la no
Principales
distribuciones
ocurrencia.
unidimension-
ales La proporción de éxitos en la población es constante y no
continuas
depende del número de elementos de ésta.
Relaciones
entre Representaremos por p (0 < p < 1) a la probabilidad de
distribuciones
éxito y por q (q = 1 − p) a la probabilidad de fracaso.
Distribuciones
multidimen-
sionales
Las observaciones son independientes. Es decir, la
Distribuciones
probabilidad de éxito es siempre la misma y no se modifica
asociadas a la
normal
dependiendo de los elementos observados.

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Distribución de Bernoulli
Ricardo Cao
La variable con distribución de Bernoulli se define como:
Principales 
distribuciones 0 si ocurre F
unidimension- X =
ales 1 si ocurre E
discretas

Principales
distribuciones
unidimension- Función de probabilidad:
ales
continuas

Relaciones P(X = 1) = p y P(X = 0) = q


entre
distribuciones

Distribuciones
Caracterı́sticas
multidimen-
sionales
E (X ) = p, Var (X ) = pq
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Distribución binomial
Ricardo Cao En un proceso de Bernoulli la variable aleatoria
Principales
distribuciones X = “número de éxitos en n realizaciones del experimento”
unidimension-
ales
discretas
sigue una distribución binomial de parámetros n y p. La
Principales
distribuciones denotaremos X ∈ B(n, p).
unidimension-
ales Función de probabilidad:
continuas

Relaciones n
p x q n−x

entre P(X = x) = x si x = 0, 1, 2, . . . , n
distribuciones

Distribuciones Caracterı́sticas:
multidimen-
sionales

Distribuciones E (X ) = np, Var (X ) = npq


asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Función de probabilidad de una variable B(10, 00 1)
Ricardo Cao

Principales
distribuciones
unidimension-
ales
discretas

Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Distribución Binomial. Comentarios
Ricardo Cao 1 La distribución de Bernoulli es la distribución binomial con

Principales n = 1.
distribuciones
unidimension-
ales
2 Los valores de esta distribución están tabulados.
discretas 3 La distribución binomial se utiliza en los procesos de
Principales
distribuciones control de calidad y en el muestreo con reemplazamiento.
unidimension-
ales 4 El número de fracasos en n pruebas tiene distribución
continuas

Relaciones
binomial de parámetros n y q.
entre
distribuciones
5 Reproductividad de la distribución binomial: Si
Distribuciones X ∈ B(n1 , p) e Y ∈ B(n2 , p), entonces
multidimen-
sionales X + Y ∈ B(n1 + n2 , p).
Si X ∈ B(n, p) entonces X = ni=1 Xi , donde
P
Distribuciones 6
asociadas a la
normal Xi ∈ B(1, p) independientes.

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo
Principales
distribuciones
Todos los dı́as se seleccionan, de manera aleatoria, 15 unidades
unidimension-
ales
de un proceso de manufactura con el propósito de verificar el
discretas porcentaje de unidades defectuosas en la producción. Con base
Principales
distribuciones
en información pasada, la probabilidad de tener una unidad
unidimension-
ales
defectuosa es p = 00 05. La gerencia ha decidido detener la
continuas producción cada vez que una muestra de 15 unidades tenga dos
Relaciones
entre
o más defectuosas. ¿Cuál es la probabilidad de que, un dı́a
distribuciones determinado, el proceso se detenga, supuesto que funciona
Distribuciones
multidimen-
correctamente? ¿Cuál es la probabilidad de que no se detenga
sionales
si p = 00 1?
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada El proceso de Poisson
Ricardo Cao Llamaremos proceso de Poisson a aquel experimento
Principales
aleatorio que consiste en observar la aparición de sucesos
distribuciones puntuales sobre un soporte continuo (generalmente el
unidimension-
ales tiempo), de manera que:
discretas
El proceso sea estable. Es decir, a largo plazo el número
Principales
distribuciones medio de sucesos por unidad de medida, λ (λ > 0), es
unidimension-
ales
constante.
continuas Los sucesos ocurren aleatoriamente de forma
Relaciones independiente.
entre
distribuciones Es la generalización a un soporte continuo del proceso de
Distribuciones
multidimen-
Bernoulli.
sionales
Ejemplos: presencia de glóbulos rojos en una gota de
Distribuciones
asociadas a la sangre, usuarios de Internet que acceden a un servidor,
normal
espectadores que llegan a la cola de un cine, etc.
Ricardo Cao Estadı́stica Aplicada
Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Distribución de Poisson
Ricardo Cao En un proceso de Poisson, la variable
Principales
distribuciones X = “número de sucesos ocurridos en un intervalo”
unidimension-
ales
discretas
es una variable aleatoria con distribución de Poisson de
Principales
distribuciones parámetro λ. La denotaremos por X ∈ P(λ).
unidimension-
ales Función de probabilidad:
continuas

Relaciones λx
entre P(X = x) = e −λ si x = 0, 1, 2, . . .
distribuciones
x!
Distribuciones
multidimen-
sionales

Distribuciones Caracterı́sticas:
asociadas a la
normal
E (X ) = Var (X ) = λ
Ricardo Cao Estadı́stica Aplicada
Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Función de probabilidad de una variable P(10)
Ricardo Cao

Principales
distribuciones
unidimension-
ales
discretas

Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada

Ricardo Cao Distribución de Poisson. Comentarios


Principales En la práctica se va a tomar como intervalo (de definición)
distribuciones
unidimension- el conjunto donde se observe la variable. Tendremos que
ales
discretas corregir el valor del parámetro λ si variamos el intervalo
Principales inicial.
distribuciones
unidimension-
ales
Reproductividad de la distribución de Poisson: Sean
continuas X ∈ P(λ1 ) e Y ∈ P(λ2 ) dos variables aleatorias
Relaciones
entre
independientes, entonces X + Y ∈ P(λ1 + λ2 ).
distribuciones
La distribución de Poisson está tabulada.
Distribuciones
multidimen-
sionales
La distribución de Poisson se obtiene como lı́mite de la
Distribuciones
distribución binomial cuando n → ∞ y p → 0.
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo
En un comercio se registra una media de 25 clientes cada hora.
Principales
distribuciones ¿Cuál es la probabilidad de que no haya ningún cliente en los
unidimension-
ales próximos 12 minutos? ¿Y de que haya más de 10?
discretas
Supuesto que la variable X = “número de clientes que hay en
Principales
distribuciones el comercio en 12 minutos” tiene distribución de Poisson de
unidimension-
ales parámetro λ = 5 (el intervalo considerado es la quinta parte de
continuas
la hora).
Relaciones
entre e −5 50
distribuciones P(X = 0) = = 00 0067
Distribuciones
0!
multidimen-
sionales P(X > 10) = 1 − P(X ≤ 10) = 1 − 00 983 = 00 0137
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada Distribución uniforme discreta
Ricardo Cao Una variable aleatoria X se dice que tiene una distribución
Principales uniforme discreta sobre n valores {x1 , x2 , . . . , xn } si todos
distribuciones
unidimension-
ocurren con la misma probabilidad.
ales
discretas Función de probabilidad:
Principales
distribuciones 1
unidimension- P(X = x) = si x = x1 , x2 , . . . , xn
ales
continuas
n
Relaciones
entre
distribuciones Caracterı́sticas:
Distribuciones
multidimen- n n
sionales 1X 1X
µ = E (X ) = xi , Var (X ) = (xi − µ)2
Distribuciones n n
asociadas a la i=1 i=1
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales discretas

Estadı́stica
Aplicada

Ricardo Cao Ejemplo


Principales Calcular la probabilidad de que el resultado obtenido al lanzar
distribuciones
unidimension- un dado sea mayor o igual que tres. La variable que a cada
ales
discretas
resultado del lanzamiento le asigna la puntuación obtenida
Principales tiene una distribución uniforme discreta sobre el conjunto
distribuciones
unidimension- {1, 2, . . . , 6}:
ales
continuas
1
Relaciones P(X = i) = , i = 1, 2, . . . , 6
entre 6
distribuciones

Distribuciones 4
multidimen- P(X ≥ 3) = P(X = 3)+P(X = 4)+P(X = 5)+P(X = 6) =
sionales 6
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Distribución uniforme
Ricardo Cao
X tiene distribución uniforme en (a, b), X ∈ U(a, b), si su
Principales función de densidad es:
distribuciones
unidimension- 
ales  1
discretas si x ∈ (a, b)
f (x) = b−a
Principales  0
distribuciones en otro caso
unidimension-
ales
continuas

Relaciones Función de distribución:


entre
distribuciones 

 x− 0 si x < a
Distribuciones
a
multidimen-
sionales
F (x) = si a ≤ x ≤ b

 b − a
Distribuciones
asociadas a la
1 si x > b
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada
Distribución uniforme
Ricardo Cao
Caracterı́sticas:
Principales a+b
distribuciones E (X ) =
unidimension- 2
ales
discretas
(b − a)2
Principales Var (X ) =
distribuciones 12
unidimension-
ales
continuas
El nombre de esta distribución se deriva del hecho de que
Relaciones
entre la probabilidad se reparte de modo uniforme sobre el
distribuciones

Distribuciones
intervalo (a, b) (densidad constante en dicho intervalo),
multidimen-
sionales
siendo el modelo de distribución uniforme el utilizado para
Distribuciones
describir el resultado del experimento consistente en elegir
asociadas a la
normal
un valor al azar en un intervalo.

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao

Principales
distribuciones
unidimension-
Función de densidad de una Función de distribución de una
ales
discretas
U(−2, 2) U(−2, 2)
Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Ejemplo
Ricardo Cao
Un estudiante acude todos los dı́as a clase andando.
Principales Suponiendo que tarda en llegar 15 minutos, que sale de casa,
distribuciones
unidimension- en un instante aleatorio, entre las ocho cuarenta y las ocho
ales
discretas cincuenta y que la clase comienza a las nueve, calcular la
Principales probabilidad de que un dı́a determinado llegue tarde.
distribuciones
unidimension- Sea X =“hora a la que sale de casa”, X sigue una distribución
ales
continuas U(40, 50).
Relaciones Llega tarde cuando la hora a la que sale de casa está en el
entre
distribuciones intervalo (45,50]:
Distribuciones
multidimen- 50
50 − 45
Z
sionales 1 1
P(45 < X < 50) = dx = =
Distribuciones 45 50 − 40 50 − 40 2
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Distribución normal
Ricardo Cao La distribución normal fue considerada por primera vez por
Principales
De Moivre en 1733 como lı́mite de la distribución
distribuciones
unidimension-
binomial, B(n, p), cuando n → ∞.
ales
discretas Este descubrimiento quedó en el olvido y fue redescubierta
Principales en el siglo XIX por Gauss y Laplace al estudiar la
distribuciones
unidimension- distribución de los errores accidentales en astronomı́a y
ales
continuas geodesia.
Relaciones
entre
La distribución normal o gaussiana es la más importante y
distribuciones de mayor uso de todas las distribuciones continuas de
Distribuciones
multidimen-
probabilidad. Existen multitud de experimentos cuyo
sionales
resultado se ajusta a esta distribución: el peso de un
Distribuciones
asociadas a la individuo y su talla, datos meteorológicos, errores de
normal
medición, calificaciones de pruebas de aptitud, etc.
Ricardo Cao Estadı́stica Aplicada
Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Distribución normal
Ricardo Cao Diremos que una variable aleatoria tiene distribución
Principales
normal de parámetros µ, σ (−∞ < µ < ∞, σ > 0), que
distribuciones
unidimension-
denotaremos por X ∈ N(µ, σ), si su función de densidad
ales
discretas
es:
Principales
distribuciones
(x − µ)2
unidimension- 1 −
ales f (x) = √ e 2σ 2 si −∞ < x < ∞
continuas σ 2π
Relaciones
entre
distribuciones
Caracterı́sticas:
Distribuciones
multidimen- E (X ) = µ
sionales

Distribuciones Var (X ) = σ 2
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Distribución normal. Comentarios
Ricardo Cao
La variable aleatoria N(0, 1) se denomina normal estándar,
Principales tipificada o estandarizada; la representaremos usualmente
distribuciones
unidimension- por la letra Z y a su función de distribución, que está
ales
discretas tabulada, por Φ (Φ(z) = P(Z ≤ z)). Su función de
Principales densidad viene dada por:
distribuciones
unidimension-
ales 1 2
continuas f (z) = √ e −z /2 si −∞ < z < ∞
Relaciones 2π
entre
distribuciones

Distribuciones
multidimen-
Para calcular las probabilidades relativas a una variable
sionales X ∈ N(µ, σ) se tipifica la variable. La nueva variable
Distribuciones X −µ
asociadas a la Z= tendrá distribución N(0, 1).
normal σ
Ricardo Cao Estadı́stica Aplicada
Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao
Distribución normal. Comentarios
Principales
distribuciones
Los valores del coeficiente de asimetrı́a y la curtosis de una
unidimension-
ales
variable normal son 0.
discretas
Sean X ∈ N(µ1 , σ1 ) e Y ∈ N(µ
2 , σ2 ). Si dichas variables

Principales q
distribuciones 2
son independientes X + Y ∈ N µ1 + µ2 , σ1 + σ2 . 2
unidimension-
ales
continuas
Dadas variables normales independientes Xi ∈ N(µi , σi ) y
Relaciones
entre constantes
Pcualesquiera ai (i = 1, 2, . . . , n), la variable
distribuciones
aleatoria ni=1q ai Xi tiene distribución
Distribuciones P 
multidimen- n Pn 2 2
sionales N i=1 ai µi , i=1 ai σi .
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao

Principales
distribuciones Trazo fino densidad de N(0, 1) Trazo fino densidad de N(0, 1)
unidimension-
ales y trazo grueso densidad de y trazo grueso densidad de
discretas
N(0, 2) N(1, 1)
Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao

Principales Ejemplo
distribuciones
unidimension- Una universidad espera recibir, para el siguiente año escolar,
ales
discretas 16.000 solicitudes de ingreso para el primer año de licenciatura.
Principales Se supone que las calificaciones obtenidas por los aspirantes en
distribuciones
unidimension- la prueba selectiva siguen una distribución N(950,100). Si la
ales
continuas universidad decide admitir al 25% de todos los aspirantes que
Relaciones obtengan las calificaciones más altas en la prueba selectiva,
entre
distribuciones ¿cuál es la mı́nima calificación que es necesario obtener en esa
Distribuciones prueba para ser admitido por la universidad?
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Ejemplo
Ricardo Cao
Sea X = “calificación obtenida”, X ∈ N(950, 100). Nos
Principales interesa calcular a tal que:
distribuciones
unidimension-  
ales a − 950
discretas
P(X > a) = P Z > = 00 25
Principales 100
distribuciones
unidimension-
ales
con Z ∈ N(0, 1).
continuas En las tablas puede comprobarse que el valor de Z que deja a
Relaciones
entre
su derecha probabilidad 00 25 es aproximadamente 00 675,
distribuciones obteniéndose por tanto:
Distribuciones
multidimen-
a − 950
sionales
= 00 675 ⇒ a = 950 + 670 5 = 1.0170 5
Distribuciones 100
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo
Principales
Sea X ∈ N(µ, σ), ¿cuáles son las probabilidades de que el valor
distribuciones
unidimension-
de X se encuentre a una, dos y tres veces la desviación tı́pica
ales
discretas
de la media?
Principales
Usando las tablas de la distribución normal estándar, las
distribuciones
unidimension-
probabilidades pedidas son:
ales

P(µ − σ ≤ X ≤ µ + σ) = P(−1 ≤ Z ≤ 1) = 00 6826


continuas

Relaciones
entre
distribuciones
P(µ − 2σ ≤ X ≤ µ + 2σ) = P(−2 ≤ Z ≤ 2) = 00 9544
Distribuciones
multidimen-
sionales P(µ − 3σ ≤ X ≤ µ + 3σ) = P(−3 ≤ Z ≤ 3) = 00 9974
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao
Distribución exponencial
Principales
distribuciones
En un proceso de Poisson, consideremos la variable X =
unidimension-
ales
“tiempo entre dos sucesos consecutivos”. Diremos que X
discretas tiene distribución exponencial de parámetro λ, que
Principales
distribuciones
denotaremos por X ∈ Exp(λ) siendo λ > 0 el número
unidimension-
ales
medio de sucesos que ocurren por unidad de tiempo.
continuas
Función de densidad:
Relaciones
entre
λe −λx

distribuciones si x > 0
f (x) =
Distribuciones 0 en otro caso
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao Distribución exponencial


Principales Función de distribución:
distribuciones
unidimension-
1 − e −λx

ales si x > 0
discretas F (x) =
0 en otro caso
Principales
distribuciones
unidimension-
ales
continuas Caracterı́sticas:
1
Relaciones E (X ) =
entre
distribuciones
λ
Distribuciones 1
multidimen- Var (X ) = 2
sionales λ
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao
Distribución exponencial. Comentarios
Principales
distribuciones
La distribución exponencial “carece de memoria”, es decir,
unidimension-
ales
discretas P(X > x + t /X > x ) = P(X > t)
Principales
distribuciones
unidimension-
ales
continuas La distribución exponencial es la generalización al caso
Relaciones continuo de la distribución geométrica.
entre
distribuciones La distribución exponencial aparece, en ocasiones,
Distribuciones
multidimen-
caracterizada utilizando como parámetro la media,
sionales
µ = 1/λ.
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao

Principales
distribuciones Trazo fino densidad de Exp(1) y Trazo fino distribución de
unidimension-
ales trazo grueso densidad de Exp(2) Exp(1) y trazo grueso dis-
discretas
tribución de Exp(2)
Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada

Ricardo Cao Ejemplo


Principales Un Departamento de la Universidad decide adquirir una
distribuciones
unidimension-
estación de trabajo. Se sabe que los avances tecnológicos se
ales
discretas
producen de forma aleatoria de tal manera que, por término
Principales medio, surge un nuevo modelo que deja anticuados a los ya
distribuciones
unidimension- existentes cada 7 meses.
ales
continuas
¿Cuál es la probabilidad de que la nueva máquina no se quede
Relaciones anticuada durante un perı́odo de tiempo comprendido entre 6
entre
distribuciones meses y 1 año?
Distribuciones Calcular la probabilidad de que la máquina se quede anticuada
multidimen-
sionales después de un año, sabiendo que no se ha quedado anticuada
Distribuciones durante los primeros 7 meses.
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones unidimensionales continuas

Estadı́stica
Aplicada Ejemplo
Ricardo Cao Supuesto que la variable X = “tiempo, en meses, hasta que la
Principales
máquina queda anticuada” sigue una distribución Exp(1/7)
distribuciones
unidimension- 1
ales
discretas Z 12
1 −x/7
Principales 1 − P(6 < X < 12) = 1 − e dx
distribuciones
unidimension- 6 7
ales
continuas = 1 − e −6/7 + e −12/7 = 00 7557
Relaciones
entre
distribuciones

Distribuciones 2
multidimen-
sionales
P(X > 12)
Distribuciones P(X > 12 /X > 7 ) = = e −(12−7)/7
asociadas a la P(X > 7)
normal
= e −5/7 = P(X > 5)
Ricardo Cao Estadı́stica Aplicada
Relaciones entre distribuciones

Estadı́stica
Aplicada
Relación entre las distribuciones hipergeométrica, binomial y de
Ricardo Cao
Poisson
Principales
distribuciones
Si X ∈ H(N, n, k) y el tamaño, n, de la muestra es muy
unidimension-
ales
pequeño comparado con el tamaño de la población, N,
discretas podremos aproximar la distribución de X por la
Principales
distribuciones
distribución B(n, p).
unidimension-
ales
En la práctica, convendremos en utilizar esta aproximación
n
continuas
si < 00 1.
Relaciones N
entre
distribuciones Sea X ∈ B(n, p). Si np = λ es constante, n → ∞ y
Distribuciones p → 0, entonces la distribución de X se puede aproximar
multidimen-
sionales por la distribución P(λ).
Distribuciones En la práctica, utilizaremos esta aproximación si p < 00 1 y
asociadas a la
normal n > 30.

Ricardo Cao Estadı́stica Aplicada


Relaciones entre distribuciones

Estadı́stica
Aplicada Comparación de las funciones de probabilidad de una variable
Ricardo Cao B(36, 00 05) (+) y su aproximación por la variable P(10 8) ()
Principales
distribuciones
unidimension-
ales
discretas

Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Relaciones entre distribuciones

Estadı́stica
Aplicada El teorema central del lı́mite
Ricardo Cao
Sean X1 , X2 , . . . , Xn variables aleatorias independientes e
Principales idénticamente distribuidas con media µ y desviación tı́pica σ.
distribuciones
unidimension-
ales
Para n grande, Sn = X1 + X √2 + · · · + Xn tiene distribución
discretas aproximadamente N nµ, σ n .
Principales Sn − nµ
distribuciones Equivalentemente, para n grande, la distribución de √ se
unidimension- σ n
ales
continuas
puede aproximar por la distribución N(0, 1).
Relaciones
entre
distribuciones Comentario
Distribuciones
multidimen-
Este teorema establece que cuando los resultados de un
sionales experimento son debidos a un conjunto muy grande de causas
Distribuciones
asociadas a la
independientes que actúan sumando sus efectos, dichos
normal resultados siguen una distribución normal.
Ricardo Cao Estadı́stica Aplicada
Relaciones entre distribuciones

Estadı́stica
Aplicada

Ricardo Cao

Principales
distribuciones
unidimension-
ales
discretas
Ejemplo
Principales ¿Qué probabilidad de ganar tiene un individuo que apuesta a
distribuciones
unidimension- que el número de caras en cien tiradas de una moneda no
ales
continuas sesgada difiere de cincuenta en menos de cuatro?
Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Relaciones entre distribuciones

Estadı́stica
Aplicada Ejemplo
Ricardo Cao Sea Xi la variable que toma el valor 1 si se obtiene cara en el
Principales
lanzamiento
P i y 0 si se obtiene una cruz en dicho lanzamiento y
distribuciones
unidimension-
sea X = 100 i=1 Xi la variable “número de caras en los 100
ales
discretas
lanzamientos de la moneda”.
Principales
Las variables X1 , X2 , . . . , X100 son variables independientes con
distribuciones
unidimension-
distribución de Bernoulli de parámetro p = 1/2; todas con
ales
continuas
µ = 1/2 y σ = 1/2. Aplicando el Teorema Central del Lı́mite,
X − 50
Relaciones con n = 100, la distribución de Z = se puede
entre
distribuciones
5
aproximar por la distribución N(0, 1).
Distribuciones
multidimen- Utilizando la aproximación anterior, la probabilidad pedida es
sionales

Distribuciones
asociadas a la
P (|X − 50| < 4) ' P(|Z | < 4/5) = 00 5762
normal

Ricardo Cao Estadı́stica Aplicada


Relaciones entre distribuciones

Estadı́stica
Aplicada Relación entre la distribución normal y las distribuciones bino-
Ricardo Cao mial, de Poisson y gamma
Si X ∈ B(n, p) entonces X = ni=1 Xi , donde cada
P
Principales
distribuciones
Xi ∈ B(1, p). Por el Teorema Central del Lı́mite X se
unidimension-
ales

discretas
puede aproximar por una N(np, npq). Esta aproximación
Principales es válida si n > 30 y 00 1 < p < 00 9.
distribuciones
unidimension- Por el Teorema Central del Lı́mite (y la reproductividad) la
ales
continuas Poisson de parámetro
√ λ se puede aproximar mediante la
Relaciones distribución N(λ, λ), para valores grandes de λ (λ > 5).
entre
distribuciones
La propiedad de reproductividad de la distribución gamma,
Distribuciones
multidimen- conjuntamente con el Teorema Central del Lı́mite,
sionales
permiten aproximar, para p grande (p > 100), la
Distribuciones
asociadas a la distribución Γ(λ, p) mediante la distribución
normal √
N(p/λ, p/λ).
Ricardo Cao Estadı́stica Aplicada
Relaciones entre distribuciones

Estadı́stica
Aplicada

Ricardo Cao
Comentario
Principales
distribuciones
Con el fin de mejorar la calidad de las aproximaciones
unidimension-
ales
obtenidas al aproximar una distribución discreta mediante una
discretas distribución continua, se recomienda utilizar lo que se conoce
Principales
distribuciones
como corrección por continuidad.
unidimension-
ales
Ası́, si se trata de aproximar una distribución discreta, que
continuas toma sólo valores enteros, por una continua, cometeremos un
Relaciones
entre
menor error en la aproximación si al calcular la P(a ≤ X ≤ b),
distribuciones
con X distribución discreta y a, b dos valores enteros de la
Distribuciones
multidimen- variable, la aproximamos por la P(a − 00 5 ≤ X ≤ b + 00 5), con
sionales
X distribución continua.
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada Distribución χ2 de Pearson
Ricardo Cao Sean Z1 , Z2 , . . . , Zn variables aleatorias independientes con
Principales distribución normal estándar. La variable aleatoria
distribuciones
unidimension- χ2n = Z12 + Z22 + · · · + Zn2 tiene distribución χ2 de Pearson
ales
discretas con n grados de libertad.
Principales Función de densidad:
distribuciones
unidimension-  n n x
ales
continuas  12 2 x 2 −1 e − 2

f (x) = si x > 0
Γ n2

Relaciones
entre 
0 en otro caso
distribuciones

Distribuciones
multidimen-
sionales
Caracterı́sticas:
Distribuciones
asociadas a la
normal
E (χ2n ) = n, Var (χ2n ) = 2n
Ricardo Cao Estadı́stica Aplicada
Distribuciones asociadas a la normal

Estadı́stica
Aplicada

Ricardo Cao

Principales
distribuciones Distribución χ2 de Pearson. Comentarios
unidimension-
ales La distribución χ2 está tabulada.
discretas

Principales La distribución χ2n coincide con la distribución Γ(1/2, n/2).


distribuciones p √
unidimension- La 2χ2n se aproxima a la N( 2n − 1, 1), cuando n es
ales
continuas grande (n > 100).
Relaciones
entre Reproductividad de la distribución χ2 : Si X ∈ χ2n e
distribuciones
Y ∈ χ2m son independientes, X + Y ∈ χ2n+m .
Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada Función de densidad de la distribución χ2 . Trazo fino χ21 , trazo
Ricardo Cao grueso χ25
Principales
distribuciones
unidimension-
ales
discretas

Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada Distribución t de Student
Ricardo Cao Sean Z ∈ N(0, 1) e Y ∈ χ2n variables aleatorias
Principales independientes. La distribución t de Student con n grados
distribuciones Z
unidimension-
ales
de libertad es la distribución de la variable tn = p .
discretas
Y /n
Principales Función de densidad:
distribuciones
unidimension- − n+1
Γ( n+1 ) x2
ales
 2
continuas
f (x) = √ 2 n  1+ , x ∈R
Relaciones nπ Γ 2 n
entre
distribuciones

Distribuciones
multidimen- Caracterı́sticas:
sionales

Distribuciones
n
asociadas a la
E (tn ) = 0 si n > 1, Var (tn ) = si n > 2
normal n−2

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada Función de densidad de la distribución t. Trazo fino t2 , trazo
Ricardo Cao grueso t10 .
Principales
distribuciones
unidimension-
ales
discretas

Principales
distribuciones
unidimension-
ales
continuas

Relaciones
entre
distribuciones

Distribuciones
multidimen-
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada

Ricardo Cao

Distribución t de Student. Comentarios


Principales
distribuciones
unidimension-
Para n grande (n > 30), la distribución t de Student se
ales
discretas
aproxima por la distribución normal estándar.
Principales La distribución t de Student presenta mayor dispersión
distribuciones
unidimension- que la N(0, 1) y menor curtosis.
ales
continuas La distribución de t1 se conoce con el nombre de
Relaciones
entre
distribución de Cauchy y presenta la caracterı́stica de no
distribuciones tener media.
Distribuciones
multidimen- La distribución de tn está tabulada.
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada

Ricardo Cao
Distribución F de Fisher-Snedecor
Principales
distribuciones
Sea X ∈ χ2m e Y ∈ χ2n , independientes. La distribución F
unidimension-
ales
de Fisher-Snedecor con m y n grados de libertad es la
discretas X /m
distribución de la variable Fm,n = .
Principales
distribuciones
Y /n
unidimension-
ales
Función de densidad:
continuas
n m

m+n

Relaciones  Γ  2  n 2 (mx) 2

entre si x > 0
Γ m2 Γ n2 x(mx + n) 2
m+n
distribuciones f (x) =

Distribuciones
multidimen-
 0 en otro caso
sionales

Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Distribuciones asociadas a la normal

Estadı́stica
Aplicada

Ricardo Cao
Distribución F de Fisher-Snedecor
Principales Caracterı́sticas:
distribuciones
unidimension-
ales n
discretas E (Fm,n ) = si n > 2
n−2
Principales
distribuciones
unidimension- 2n2 (n + m − 2)
ales Var (Fm,n ) = si n > 4
continuas m(n − 2)2 (n − 4)
Relaciones
entre
distribuciones
La distribución de Fm,n está tabulada.
Distribuciones
multidimen- 1
sionales Si X ∈ Fm,n entonces ∈ Fn,m .
X
Distribuciones
asociadas a la
normal

Ricardo Cao Estadı́stica Aplicada


Estadı́stica
Aplicada

Ricardo Cao

Introducción
a la inferencia
estadı́stica

Estimación Part VII


puntual

Propiedades
deseables de
los
Estimación puntual
estimadores

Estimación de
la media de
una población

Estimación de
la varianza de
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Introducción a la inferencia estadı́stica

Estadı́stica
Aplicada

Ricardo Cao Introducción


Introducción La inferencia estadı́stica puede definirse como el conjunto
a la inferencia
estadı́stica de métodos mediante los cuales podemos extraer
Estimación información sobre distintas caracterı́sticas de interés de
puntual

Propiedades
cierta distribución de probabilidad de la cual se ha
deseables de observado una serie de datos.
los
estimadores
La inferencia estadı́stica comprende las fases de recogida y
Estimación de
la media de depuración de los datos, estimación, contrastes de
una población
simplificación, diagnosis y validación del modelo.
Estimación de
la varianza de Según el objeto de estudio, la inferencia estadı́stica se
una población

Estimación de
clasifica en inferencia paramétrica y no paramétrica.
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Introducción a la inferencia estadı́stica

Estadı́stica
Aplicada

Ricardo Cao Introducción


Introducción
La inferencia paramétrica se ocupa de aquellos casos en
a la inferencia
estadı́stica
los que la distribución de probabilidad de la población
Estimación
objeto de estudio se supone conocida salvo los valores que
puntual toman ciertos coeficientes, llamados parámetros. El
Propiedades
deseables de
objetivo es estimar, dar intervalos de confianza o
los
estimadores
contrastar hipótesis sobre dichos parámetros
Estimación de La inferencia no paramétrica trata problemas similares
la media de
una población cuando se tiene una distribución poblacional totalmente
Estimación de desconocida, sobre la cual tan sólo se realizan suposiciones
la varianza de
una población muy generales (como, por ejemplo, que es una distribución
Estimación de continua, que tiene una única moda, etc.).
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Introducción a la inferencia estadı́stica

Estadı́stica
Aplicada

Ricardo Cao
Introducción
Introducción
a la inferencia El enfoque clásico trata los parámetros poblacionales
estadı́stica
desconocidos como valores fijos o constantes.
Estimación
puntual
El enfoque bayesiano considera que los parámetros
Propiedades
deseables de desconocidos del modelo son variables aleatorias, para las
los
estimadores
cuales debe fijarse una distribución inicial, llamada
Estimación de distribución a priori. Utilizando la información muestral
la media de
una población junto con la mencionada distribución a priori, los métodos
Estimación de bayesianos hacen uso de la regla de Bayes para ofrecer una
la varianza de
una población distribución a posteriori sobre los parámetros.
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Introducción a la inferencia estadı́stica

Estadı́stica
Aplicada

Ricardo Cao
Conceptos generales
Introducción
a la inferencia Se denomina población a un conjunto homogéneo de
estadı́stica
individuos sobre los que se estudian una o varias
Estimación
puntual caracterı́sticas que son, de alguna forma, observables.
Propiedades
deseables de
Una muestra es un subconjunto de la población. El
los tamaño muestral es el número de elementos de la muestra.
estimadores

Estimación de Un método de muestreo no es más que el procedimiento


la media de
una población empleado para la obtención de la muestra.
Estimación de
la varianza de
Un parámetro es cualquier caracterı́stica medible
una población (normalmente numérica) de la población.
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Introducción a la inferencia estadı́stica

Estadı́stica
Aplicada Muestreo en poblaciones finitas
Ricardo Cao Muestreo aleatorio simple: Cada muestra posible tiene la
Introducción
misma probabilidad de ser elegida.
a la inferencia
estadı́stica Muestreo sistemático: Se usa muy frecuentemente cuando
Estimación los individuos de la población están ordenados en listas.
puntual

Propiedades Muestreo estratificado: Si somos capaces de dividir la


deseables de
los
población en estratos, se actua dentro de cada estrato
estimadores
según un muestreo aleatorio simple.
Estimación de
la media de Muestreo por conglomerados: Si la población puede
una población
dividirse en conglomerados, que son homogéneos entre sı́,
Estimación de
la varianza de se eligen aleatoriamente algunos conglomerados y, en cada
una población

Estimación de
uno de ellos, una muestra representativa.
una
proporción Muestreo polietápico: Utilizar distintos tipos de muestreo
Procedimientos en sucesivas etapas.
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación puntual

Estadı́stica
Aplicada

Ricardo Cao
Introducción
Introducción
a la inferencia Matemáticamente, podemos pensar que estamos
estadı́stica
interesados en el estudio de una variable aleatoria X , cuya
Estimación
puntual distribución, F , es en mayor o menor grado desconocida.
Propiedades
deseables de
Supondremos que la familia F de distribuciones a la que
los
estimadores
pertence F es de la forma: F = {Fθ | θ ∈ Θ}, siendo
Estimación de Θ ⊂ Rk .
la media de
una población Para tratar de disminuir el desconocimiento de la
Estimación de distribución teórica F de la variable aleatoria X en estudio,
la varianza de
una población tomamos una muestra.
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación puntual

Estadı́stica
Aplicada
Muestra aleatoria simple
Ricardo Cao
Una muestra aleatoria simple, de tamaño n, de una
Introducción
a la inferencia variable aleatoria X , con distribución teórica F , son n
estadı́stica
variables aleatorias, X1 , X2 , . . . , Xn , independientes e
Estimación
puntual igualmente distribuidas, con distribución común F .
Propiedades
deseables de
Una realización de la muestra son los valores particulares,
los
estimadores
x1 , x2 , . . . , xn , observados para las variables X1 , X2 , . . . , Xn .
Estimación de Como consecuencia, la función de distribución conjunta de
la media de
una población X1 , X2 , . . . , Xn es:
Estimación de
la varianza de
una población F (x1 , x2 , . . . , xn ) = F (x1 ) · F (x2 ) · · · F (xn )
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación puntual

Estadı́stica
Aplicada
Otros conceptos
Ricardo Cao
Llamaremos espacio muestral al conjunto de muestras
Introducción
a la inferencia
posibles, de tamaño determinado, que pueden obtenerse al
estadı́stica seleccionar una muestra aleatoria de una población.
Estimación
puntual Llamaremos estadı́stico a cualquier función T de la
Propiedades muestra.
deseables de
los
estimadores
Un estadı́stico T (X1 , X2 , . . . , Xn ), como función de
Estimación de
variables aleatorias, es también una variable aleatoria.
la media de
una población
Tiene, por tanto, una distribución de probabilidad, llamada
Estimación de
distribución en el muestreo de T .
la varianza de
una población Los estadı́sticos independientes del parámetro (que son
Estimación de función únicamente de la muestra) se denominan
una
proporción estimadores (θb = T (X1 , X2 , . . . , Xn )).
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación puntual

Estadı́stica
Aplicada

Ricardo Cao
Ejemplos de estadı́sticos
Introducción
a la inferencia n
1 P
estadı́stica T (X1 , X2 , . . . , Xn ) = n Xi .
Estimación i=1
puntual n
1 P 2
Propiedades T (X1 , X2 , . . . , Xn ) = n Xi − X .
deseables de i=1
los
estimadores n 2
1 P
Estimación de
T (X1 , X2 , . . . , Xn ) = n−1 Xi − X .
la media de i=1
una población
T (X1 , X2 , . . . , Xn ) = min (X1 , X2 , . . . , Xn ).
Estimación de
la varianza de
una población
T (X1 , X2 , . . . , Xn ) = max (X1 , X2 , . . . , Xn ).
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación puntual

Estadı́stica
Aplicada Ejemplo
Ricardo Cao Supongamos que pretendemos “estimar” la altura media de los
Introducción
alumnos de la Facultad de Informática de La Coruña. Para ello
a la inferencia
estadı́stica
seleccionamos una muestra de 20 alumnos, los medimos y
Estimación tomamos la media muestral como “estimador” de la media
puntual
desconocida (más adelante veremos que la elección de la media
Propiedades
deseables de muestral es razonable).
los
estimadores Si este trabajo lo realizan 4 personas diferentes, los resultados
Estimación de obtenidos podrı́an ser los siguientes (en centı́metros):
la media de
una población
Persona Muestra Media muestral
Estimación de
la varianza de 1 170, 175, 166, . . ., 180 176
una población

Estimación de
2 166, 172, 180, . . ., 177 174
una
proporción
3 190, 165, 185, . . . ,175 178
Procedimientos 4 175, 156, 178, . . ., 177 175
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación puntual

Estadı́stica
Aplicada Ejemplo
Ricardo Cao
Cada una de las muestras obtenidas es una realización de un
Introducción vector aleatorio (en este caso de dimensión 20). Al estudiar los
a la inferencia
estadı́stica problemas de inferencia, consideraremos la muestra como el
Estimación vector aleatorio en sı́ (con cierta distribución de probabilidad
puntual
que dependerá de la distribución de la población y del tamaño
Propiedades
deseables de de la muestra).
los
estimadores En cuanto a la media muestral, al ser una función de variables
Estimación de aleatorias, también es una variable aleatoria. En la tabla
la media de
una población anterior disponemos de cuatro valores de dicha variable. Si
Estimación de
la varianza de
dispusiésemos de un gran número de ellos, podrı́amos
una población aproximar con precisón su distribución en el muestreo (que
Estimación de
una
dependerá de nuevo de la distribución de la población y del
proporción tamaño de la muestra).
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada
Insesgadez
Ricardo Cao
Se denomina sesgo del estimador θb como estimador de θ a
Introducción
a la inferencia    
estadı́stica
Sesgo θb = E θb − θ
Estimación
puntual

Propiedades  
deseables de
los Si E θb = θ, para cada θ ∈ Θ, el estimador θb se dice
estimadores

Estimación de
centrado o insesgado para θ.
la media de
una población Pueden existir muchos estimadores centrados para un
Estimación de parámetro. Por ejemplo, para estimar la media µ de una
la varianza de
una población distribución cualquiera, todos los estimadores del tipo
b = a1 X1 + a2 X2 + · · · + an Xn con ni=1 ai = 1 son
P
Estimación de µ
una
proporción centrados.
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada
Ejemplo
Ricardo Cao
Obtener un estimador centrado para el parámetro p de una
Introducción
a la inferencia distribución binomial.
estadı́stica
Sea X ∈ B(m, p) y sea X1 , X2 , . . . , Xn una muestra aleatoria
Estimación
puntual simple de X . Un estimador insesgado para p es
Propiedades
deseables de X X1 + X2 + · · · + Xn
los p=
b =
estimadores
m nm
Estimación de
la media de
una población
ya que su media coincide con p:
Estimación de  
la varianza de 1 X1 + X2 + · · · + Xn 1 (mp)n
una población E (b
p) = E = =p
Estimación de
m n m n
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada

Ricardo Cao

Introducción
a la inferencia
estadı́stica

Estimación
Insesgadez asintótica
puntual
Un estimador, θbn , se dice asintóticamente insesgado para θ si:
Propiedades
deseables de  
los
estimadores lim E θbn = θ, para cada θ ∈ Θ
n→∞
Estimación de
la media de
una población

Estimación de
la varianza de
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo
Introducción
a la inferencia Sea X1 , X2 , . . . , Xn , una muestra aleatoria simple de una
estadı́stica
variable aleatoria X con E (X ) = µ.
Estimación 2X1 + X2 + · · · + Xn
puntual
El estimador µ bn = es asintóticamente
Propiedades n
deseables de insesgado para µ:
los
estimadores Teniendo en cuenta las propiedades de la esperanza,
Estimación de
la media de n+1
una población lim E (b
µn ) = lim µ=µ
Estimación de
n→∞ n→∞ n
la varianza de
una población y, por tanto, µ
bn es asintóticamente insesgado para µ.
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada

Ricardo Cao Error cuadrático medio


Introducción Se define el error cuadrático medio de un estimador θb de
a la inferencia
estadı́stica un parámetro θ como el número
Estimación 
puntual
  2 
Propiedades
ECM θb = E θ − θb
deseables de
los
estimadores

Estimación de
la media de
De la definición anterior, se deduce fácilmente que
una población
  h  i2  
Estimación de
la varianza de ECM θb = Sesgo θb + Var θb
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada

Ricardo Cao Ejemplo


Introducción Obtener el error cuadrático medio del estimador b
p de la
a la inferencia
estadı́stica binomial del ejemplo anterior.
Estimación Puesto que ya conocemos que p b es insesgado, su error
puntual

Propiedades
cuadrático medio coincide con su varianza:
deseables de
los n
estimadores 1  1 1 X
ECM (b
p ) = Var (b
p ) = 2 Var X = 2 2 Var (Xi )
Estimación de m m n
la media de i=1
una población
1 1 pq p(1 − p)
Estimación de = 2 2
nmpq = =
la varianza de m n mn mn
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada Eficiencia
Ricardo Cao
Llamaremos precisión o eficiencia de θ,b como estimador de
Introducción θ, al inverso de su error cuadrático medio:
a la inferencia
estadı́stica   1
Estimación
puntual
efic θb =  
ECM θb
Propiedades
deseables de
los
estimadores

Estimación de
Diremos que θb2 es más eficaz o más preciso que θb1 si para
la media de
una población
cualquier tamaño muestral:
Estimación de
   
la varianza de
una población
efic θb2 ≥ efic θb1
Estimación de    
una
proporción Es decir, si ECM θ2 ≤ ECM θb1 .
b
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo
Introducción
a la inferencia Calcular la eficiencia del estimador insesgado de p de la
estadı́stica

Estimación
binomial del ejemplo anterior.
puntual Teniendo en cuenta el ejemplo anterior, la eficiencia es
Propiedades
deseables de
los
1 mn
estimadores efic (b
p) = =
Var (b
p) p(1 − p)
Estimación de
la media de
una población

Estimación de
Obsérvese cómo ganamos eficiencia al aumentar el tamaño
la varianza de
una población
muestral (a mayor información, mayor precisión).
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada Consistencia
Ricardo Cao
Un estimador θbn se dice consistente en media cuadrática
Introducción
a la inferencia
para estimar un parámetro θ si
estadı́stica
 
Estimación
puntual
lim ECM θbn = 0
n→∞
Propiedades
deseables de
los
estimadores
En adelante, cuando hablemos de consistencia de un
Estimación de
la media de estimador nos referiremos a la consistencia en media
una población
cuadrática.
Estimación de
la varianza de Una condición necesaria y suficiente para que θbn sea
una población

Estimación de
consistente es
 que
 sea asintóticamente insesgado y que
una
proporción
limn→∞ Var θn = 0.
b
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Propiedades deseables de los estimadores

Estadı́stica
Aplicada

Ricardo Cao

Introducción Ejemplo
a la inferencia
estadı́stica Estudiar la consistencia del estimador insesgado de p de la
Estimación binomial del ejemplo anterior.
puntual

Propiedades
Por tratarse de un estimador insesgado, será consistente
deseables de
los
siempre que su varianza tienda a cero:
estimadores

Estimación de p(1 − p)
la media de lim Var (b
p ) = lim =0
una población n→∞ n→∞ mn
Estimación de
la varianza de
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la media de una población

Estadı́stica
Aplicada
Media muestral
Ricardo Cao
Es un estimador consistente de µ. Sólo hay que probar
Introducción
a la inferencia
que su varianza tiende a cero.
estadı́stica
n n
!
Estimación  1X 1 X σ2
puntual Var X = Var Xi = 2 Var (Xi ) =
Propiedades
n n n
i=1 i=1
deseables de
los
estimadores

Estimación de La distribución exacta de X depende de la distribución


 de

la media de σ
una población
la población. Si X ∈ N(µ, σ), entonces X ∈ N µ, √ .
Estimación de n
la varianza de
una población Por el TCL, para n grande(n ≥ 30),
 la distribución de X
Estimación de σ
una puede aproximarse por N µ, √ .
proporción n
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la varianza de una población

Estadı́stica
Aplicada

Ricardo Cao

Introducción
a la inferencia
Varianza muestral
estadı́stica
Sea X1 , X2 , . . . , Xn una muestra aleatoria simple de una
Estimación
puntual variable aleatoria X con E (X ) = µ y Var (X ) = σ 2 . Se define
Propiedades la varianza muestral como:
deseables de
los n
estimadores
2 1X 2
Estimación de
S = Xi − X
la media de
n
i=1
una población

Estimación de
la varianza de
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la varianza de una población

Estadı́stica
Aplicada Varianza muestral
Ricardo Cao Es un estimador asintóticamente insesgado de σ 2 . Teniendo en
Introducción cuenta que
a la inferencia
estadı́stica n n
X X 2 2
Estimación
puntual
(Xi − µ)2 = Xi − X +n µ−X
Propiedades i=1 i=1
deseables de
los
estimadores obtenemos que
Estimación de
la media de σ2 n−1
E S 2 = σ2 − = σ2

una población

Estimación de
n n
la varianza de
una población y, por tanto,
lim E S 2 = σ 2

Estimación de
una n→∞
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la varianza de una población

Estadı́stica
Aplicada

Ricardo Cao Varianza muestral


Introducción La varianza de S 2 puede calcularse también, pero es
a la inferencia
estadı́stica bastante complicada (depende de los coeficientes de
Estimación
puntual
asimetrı́a y de curtosis de la población).
Propiedades Es un estimador consistente de σ 2 .
deseables de
los La distribución de S 2 es, en general, asimétrica y su forma
estimadores

Estimación de
depende del tamaño muestral y de la población base.
la media de
una población
Usando el TCL, puede aproximarse la distribución de S 2
Estimación de
por la distribución normal, pero la aproximación es muy
la varianza de
una población
lenta y sólo se manifiesta en tamaños muestrales muy
Estimación de
grandes.
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la varianza de una población

Estadı́stica
Aplicada
Varianza muestral
Ricardo Cao 2
Si X ∈ N(µ, σ), se puede probar que nS
σ2
∈ χ2n−1 .
Introducción
nS 2
 
a la inferencia
2

estadı́stica Dado que E χn = n, se tiene que E = n − 1 y,
Estimación
σ2
puntual por tanto,
 n−1 2
Propiedades
deseables de E S2 = σ
los n
estimadores

Estimación de
nS 2
 
la media de
χ2n

una población Como Var = 2n, se tiene que Var = 2(n − 1)
σ2
Estimación de
la varianza de
y, por tanto,
una población  2(n − 1) 4
Var S 2 = σ
Estimación de
una
n2
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la varianza de una población

Estadı́stica
Aplicada Varianza muestral corregida o cuasivarianza
Ricardo Cao Con el objeto de corregir el sesgo de la varianza muestral,
Introducción
se define la varianza muestral corregida o cuasivarianza
a la inferencia
estadı́stica
como
n
b2 = 1 n
X 2
Estimación
S Xi − X = S2
puntual
n−1 n−1
Propiedades
i=1
deseables de
los
estimadores Es un estimador insesgado de σ 2 .
Estimación de
la media de Es un estimador consistente de σ 2 .
una población
b 2 son
Si X ∈ N(µ, σ), las variables aleatorias X y S
Estimación de
la varianza de (n − 1)Sb2
una población independientes y 2
∈ χ2n−1 . Entonces
Estimación de σ 
b2 = 2 σ4.
 
una
proporción E S b 2 = σ 2 y Var S
n−1
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de la varianza de una población

Estadı́stica
Aplicada

Ricardo Cao

Introducción
a la inferencia
Comentarios
estadı́stica
Si se conoce la media poblacional, µ, utilizaremos el
Estimación
puntual estimador que resulta de reemplazar X por µ en la
Propiedades expresión de S 2 . El estimador resultante es insesgado y
deseables de
los tiene menor varianza que S 2 y S b2.
estimadores

Estimación de
En los programas informáticos de estadı́stica suele
la media de
una población
utilizarse la cuasivarianza muestral, debido a su carácter
Estimación de
insesgado.
la varianza de
una población

Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de una proporción

Estadı́stica
Aplicada Proporción muestral
Ricardo Cao Se desea estimar la proporción, p, de individuos de una
Introducción
población que poseen determinada caracterı́stica.
a la inferencia
estadı́stica
Tomamos una m.a.s. de n elementos anotando un 1 si el
Estimación individuo elegido posee la caracterı́stica y un 0 si carece de
puntual
ella. Un estimador razonable de p es:
Propiedades
deseables de
los X1 + X2 + · · · + Xn
estimadores p=
b
n
Estimación de
la media de
una población

Estimación de p es la media muestral de n variables i.i.d. B(p).


b
la varianza de
una población p(1 − p)
Estimación de
E (b
p ) = p, Var (b
p) = y su distribución en el
una n  p 
proporción
muestreo, para (n > 30) es aprox. N p, (p(1 − p))/n .
Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada
Estimación de una proporción

Estadı́stica
Aplicada

Ricardo Cao
Ejemplo. Método de captura-recaptura
Introducción
a la inferencia Estimar el número, N, de peces que hay en un embalse
estadı́stica

Estimación
Se capturan n de ellos, se marcan con una pequeña placa y se
puntual devuelven al embalse. A continuación se recapturan r peces,
Propiedades
deseables de
contando cuántos de ellos están marcados (supongamos que x
los
estimadores
lo están).
Estimación de
Utilizando la proporción muestral (x/r ) como estimador de la
la media de
una población
proporción poblacional (n/N) de peces marcados, podemos
Estimación de
estimar N por rn/x, sin más que igualar ambas proporciones y
la varianza de
una población
despejar N.
Estimación de
una
proporción

Procedimientos
para la
construcción Ricardo Cao Estadı́stica Aplicada

Vous aimerez peut-être aussi