Vous êtes sur la page 1sur 166

1

APUNTES DE PROBABILIDADES Y ESTADISTICA














TRABAJO REALIZADO POR: ING. FERNANDO GONZALEZ
CATEDRA DE MATEMATICAS Y ESTADISTICA
PUERTO CABELLO SEPTIEMBRE 2005

UNIVERSIDAD NACIONAL EXPERIMENTAL
POLITECNICA DE LA FUERZA ARMADA
NUCLEO PUERTO CABELLO
2
ESTADISTICA
Evento real Datos numricos

Recopilar
ClasiIicar CONCLUSIONES
ESTADISTICA Presentar
(Metodo cientiIico). Analizar LOGICAS
Interpretar

Descriptiva (describe caracteristicas)
ESTADISTICA
(ClasiIicacion) Inductiva (inIiere dentro de limites probables)

InIinitas Probabilisticas
POBLACION MUESTRA
(El todo) Finitas (La parte) No probabilisticas

PARAMETROS ESTADISTICOS
(Medidas de la poblacion) (Medidas de la muestra)

Media Aritmetica Media Aritmetica
Desviacion Standard S Desviacion Standard
X
d
Mediana

DATO Caracterstica Medible

Cualitativas. Indican alguna propiedad
(Atributos) de los hechos observados
MEDIDAS

Cuantitativas. Las cualidades toman
(Variables) distintos valores

Continuas (sin interrupciones)
VARIABLES
(Valores que puede tomar) Discretas (con interrupciones)
3
La Estadstica es la disciplina de las matematicas que se reIiere a los metodos de recoleccion,
presentacion y caracterizacion de
InIormacion para el analisis de un conjunto de datos y para la toma de decisiones. Se divide en:

Estadistica Descriptiva
InIerencia Estadistica

Estadstica Descriptiva Aquellos metodos que incluyen la recoleccion, presentacion y
caracterizacion de un conjunto de datos con el Iin de describir apropiadamente las diversas
caracteristicas de ese conjunto.

Inferencia Estadstica Aquellos metodos que hacen posible la estimacion de una caracteristica
de una poblacion o la toma de una decision con respecto a una poblacion, basandose solo en los
resultados de una
Muestra.

DEFINICIONES DE TERMINOS BASICOS

Dato:
Numeros o medidas que han sido recopiladas como resultado de observaciones
Ejemplo:
Numero de personas que son Ianaticos de determinado equipo de Iutbol.

Caso:
Individuos sobre los cuales se va a tomar observaciones o variables.

Medicin:
Consiste en asignar numeros a los objetos de acuerdo a determinadas reglas.

Poblacin:
Conjunto completo de individuos, objetos o medidas que poseen una caracteristica comun
observable.
Ejemplo: la poblacion estudiantil de la UNEFA.

Muestra:
Es una parte o un subconjunto de una poblacion.
Ejemplo: los estudiantes de Ingenieria naval de un termino cualquiera.
4
Parmetro:
Es una medida obtenida a partir de las observaciones de una poblacion.

Estadstico:
Es una medida obtenida a partir de las observaciones de una muestra.

Atributo:
Es una caracteristica discontinua, es decir, solo puede maniIestarse bajo una sola modalidad en
una variable cualitativa.
Ejemplo:
El estado civil, el sexo, la nacionalidad y la proIesion.

Variable.
Es una caracteristica que puede maniIestarse segun dos o mas modalidades.
Ejemplo:
El peso, la estatura y la edad.

Variable cualitativa.
Cuando se describen cualidades o categorias de las mediciones realizadas.
Ejemplo: el color de los carros vendidos.

Variable cuantitativa.
Cuando se suelen asignar cantidades a la representacion de la variable.
Ejemplo: El numero de carros vendidos.

Tipos de variables Cuantitativas

Variables cuantitativas discretas.
Son aquellas que representan mediciones dentro del conjunto de numeros enteros, es decir, son
valores puntuales y que entre ellos no pueden existir otros valores en la escala.
Ejemplo: el numero de automoviles vendidos en un ao.

Variables cuantitativas Continuas.
Son aquellas que expresan continuidad en dos valores puntuales.
Ejemplo: La longitud, la Iuerza y la edad.


5
Tipos de muestras

Muestras aleatorias simple.
Son aquellas que se obtienen de tal manera que cada individuo, objeto o medida de una poblacion
tenga igual oportunidad de ser seleccionada.

Muestra estratificada.
Son aquella que se obtienen estratiIicando los elementos de la poblacion en Iuncion de los
objetivos mismos del muestreo, para luego de cada estrato tomar muestras al azar simple, cuya
magnitud sera proporcional a la parte que el estrato representa en toda la poblacion. La
integracion de todas estas muestras genera la muestra estratiIicada.

Mediciones cualitativas
Son aquellas que expresan dimension o capacidad.

Mediciones Cuantitativas.
Son aquellas que expresan caracteristicas, atributos, actitudes, etc. y no estan representadas
numericamente.

Unidad de observacin.
Es un solo miembro de la poblacion que se estudia.

El diseo de experimentos es util para la toma de 'buenas decisiones, la utilizacion de un
modelo. Ayuda a:
- Obtener conclusiones de la Investigacion Empirica usando Modelos Matematicos
- Evaluar y juzgar discrepancia entre la observacion y la teoria
- Tomar decisiones en condiciones de incertidumbre.

En un estudio estadstico hay que tener en cuenta:
- Objetivo: Que queremos hacer?
- Diseo: Cual es la Iorma apropiada?
- Recogida de datos: Conseguir inIormacion
- Analisis: Que dice la inIormacion?
- Descriptivo: Sobre la muestra
- InIerencial: Sobre la poblacion
- Presentacion de resultados: Como se transmiten?

6
Utilidad de la Estadstica, la estadistica Ensea a:
- Evitar sesgos
- Aprovechar mejor la inIormacion
- Ahorrar material y dinero
- Proporciona Metodos:
- De recogida de datos
- De codiIicacion
- De control de errores
- De Analisis:
Descriptivo: Resumen de datos mediante tablas y graIicos.
Probabilistico: Estimacion, contrastes y modelos para la toma de decisiones


























7
El Smbolo de Sumatoria ( )
Sea un conjunto de n valores para una variable x. Entonces, el simbolo

=
n
i
i
x
1
, signiIica que los n
valores se tienen que sumar juntos. O sea,

=
+ + + + =
n
i
n i
x x x x x
1
3 2 1
....
Ejemplo 1. Supongase que se tienen las seis observaciones siguientes para la variable x :
x
1


2 , x
2
5 , x
3


0 , x
4
- 1 , x
5
6 , x
6


4 , entonces;

=
+ + + + + =
6
1
6 5 4 3 2 1
i
i
x x x x x x x 2 5 0 (-1) 6 4 16
Nota: No es lo mismo la suma de los valores cuadrados de x, que la suma de los valores de x al
cuadrado. O sea,

= =

n
i
n
i
i i
x x
1
2
1
2

En el caso del ejemplo 1, la suma de los valores cuadrados de x seria,

=
+ + + =
6
1
2
6
2
2
2
1
2
......
i
i
x x x x
82 16 36 1 0 25 4 ) 4 ( ) 6 ( ) 1 ( ) 0 ( ) 5 ( ) 2 (
2 2 2
6
1
2 2 2
2
= + + + + + = + + + + + =

= i
i
x
Por otro lado, el cuadrado de la suma de x seria,
82 256 tan ; 256 ) 16 (
2
2
6
1
= =

=
to lo Por x
i
i

En muchas ocasiones estamos interesados en la suma del producto de dos variables.
Sean x & y dos variables que poseen n observaciones respectivamente. Entonces,

=
+ + + =
n
i
n n i
v x v x v x v x
1
2 2 1 1 1
......
8
Ejemplo 2. Sea y una variable con los valores siguientes: y
1
1, y
2
3, y
3
2
y
4
-2 , y
5
5 , y
6
10. Entonces, utilizando los valores del ejemplo 1 para la variable x
obtendremos,

=
+ + + =
6
1
6 6 2 2 1 1 1
......
i
i
v x v x v x v x

=
+ + + + + =
6
1
) 10 ( 4 ) 5 ( 6 ) 2 )( 1 ( ) 2 ( 0 ) 3 ( 5 ) 1 ( 2
i
i i
v x 2 15 0 2 30 40 89
Nota:

= = =

n
i
n
i
i
n
i
i i i
v x v x
1 1 1

Del Ejemplo 1, x 16 mientras que y 19, por lo tanto: (x) (y) (16)(19) 304, Donde
89 304.
Reglas Bsicas para las Operaciones con Sumatoria
Regla 1: la sumatoria de la suma de los valores de las variables x & y es igual a la suma de las
sumatorias de los valores de las variables individuales.

= = =
+ = +
n
i
N
I
N
I
I I I I
Y X Y X
1 1 1
) (
Ejemplo 3:
Sean x
1
2, x
2
5 , x
3
1, x
4
2 & y
1
0, y
2
3, y
3
1, y
4
5

=
= + + + = + + + + + + + = +
4
1
)
19 7 2 8 2 ) 5 2 ( ) 1 1 ( ) 3 5 ( ) 0 2 ( (
i
I I
v x

= =
= + = +
4
1
4
1
19 9 10
I I
i I
v x
Regla 2: La sumatoria de la diIerencia de los valores de las variables x & y es igual a la
diIerencia de las sumatorias de los valores de las variables individuales.

= = =
=
n
i
n
i
n
i
i i i
v x v x
1 1 1
1
) (
9
Utilizando los datos del ejemplo 3, tendremos:

=
= + + + =
4
1
1 ) 5 2 ( ) 1 1 ( ) 3 5 ( ) 0 2 ( ) (
i
i i
v x

= =
= =
4
1
4
1
1 9 10
I I
i I
v x
Regla 3: La suma del producto de una constante k multiplicada por una variable x, es igual a la
constante multiplicada por la sumatoria de la variable.

= =
=
n
I
n
I
i I
x k x k
1 1
) ( ) (
Ejemplo 4: Sea k 2 y sean x
1
3, x
2
6, x
3
10
[ ] [ ] 38 19 2 10 6 3 2 ) ( 2 ) ( 2 ) (
3
1
3
1
3
1
= = + + = = =

= = = I I
i
i
i I
x x x k
Regla 4: la suma de una constante tomada la constante n veces, sera igual al producto de n veces
el valor de la constante.

=
=
n
i
k n k
1

Ejemplo 5: sea k 5 sumado 6 veces, entonces:

=
= + + + + + =
6
1
30 5 5 5 5 5 5
i
k
n k 6 5 30





10
ORDENACION U ORGANIZACIN DE LOS DATOS

En estadistica es de suma importancia que los datos recogidos de la Iuente de inIormacion esten
ordenados, ya que la posicion que cada uno de ellos ocupa en la serie de datos, nos permiten
analizar ciertas medidas cualitativas de la muestra.
Los metodos que se conocen para la ordenacion de los datos que mas se utilizan son ordenacion
de Iorma creciente o decreciente.
Ejemplo.
Orden Creciente:
1.37 - 1.38 1.40 1.42 1.49 150 - 1.51 1.54 1.58 1.62
Orden Decreciente:
1.62 1.58 - 1.54 - 1.51 1.50 1.49 1.42 1.4 1.38 1.37.

REDONDEO DE LOS DATOS

Los Datos en ocasiones, cuando el estudio lo permite deben ser redondeados, es mas sencillo
trabajar con numeros enteros.

Redondeo de cantidades.

a. Cuando el digito que se desea redondear es 5.
Ejemplo: 125,211 125
12,42 12
460,33 1460

b. Cuando el digito que se desea redondear esta seguido
De otro ~ 5.
Ejemplo: 68,65 69
155,70 156
1460,85 1461

c. Cuando el digito que se desea redondear esta seguido del
Digito 5.
Ejemplo: 0,5 0 (deIecto) ; 2,5 2 (deIecto)
0,5 1 (exceso) ; 2,5 3 (exceso)
Estos criterios son validos para redondear decenas y centenas.
11
DISTRIBUCION DE DATOS

Distribucin de frecuencias por datos directos
Este metodo se debe aplicar para un numero de datos que no exceda los 30

X: Es la letra que identiIica a la variable (puntuaciones, edades, tallas, salarios, etc.). Y representa
a cada uno de los valores que esta toma.

f
o
: Son las Irecuencias ordinarias absolutas y representa el numero de veces que un dato se
repite.

F
A
: Son las Irecuencias acumuladas absolutas y representa el numero de datos comprendidos
entre dos valores dados, uno de los cuales es el inIerior real (L
i
) de toda la distribucion.

f
ro
: Son las Irecuencias ordinarias relativas e indican la proporcion que representan los datos de
una casilla determinada con relacion al total de datos (n). La suma de las h debe ser igual a la
unidad.

F
rA
: son las Irecuencias acumuladas relativas y representan la proporcion de casos ubicados entre
el extremo inIerior (L
i
minimo) de la distribucion y un valor superior.

P: Son los porcentajes acumulados o Rangos percentiles. Representa el porcentaje de datos
acumulados desde el extremo inIerior (L
i
) hasta un valor dado de la distribucion.

Distribucin de Frecuencias por Datos agrupados en Intervalos de Clase

Este metodo se emplea cuando el numero de datos por lo general exceden de 30 y los valores de
una serie se encuentran muy distanciados entre si. Entonces es conveniente agruparlos en
intervalos de clase. Permitiendo esto simpliIicar el manejo de los datos.

Los datos se ordenan en clases o categorias, estas clases o categorias estan Iormadas por dos
limites, uno inIerior y uno superior, en cada una de las clases se ubican los valores o datos de la
serie comprendidos entre sus respectivos limites. Finalmente, se determinan todos los elementos
de una distribucion, iniciandolos en una tabla de Irecuencias, la cual debe comprender: las clases,
las Irecuencias ordinarias, las Irecuencias acumuladas, las Irecuencias relativas ordinarias, las
Irecuencias relativas acumuladas.
Para organizar los datos en una distribucion, se puede utilizar indistintamente: los limites
12
aparentes, los limites reales, los limites completos o abiertos.
En este curso elaboraremos las tablas haciendo uso de los limites completos o abiertos.

Intervalo de Clase, se deIine como el conjunto de datos que se encuentran ubicados entre dos
limites establecidos.

Elementos de un intervalo de clase


Lli
Xi Xs
X
m


X
i
, X
s
, son los limites aparentes del intervalo (inIerior y superior), respectivamente.

Valor real de un nmero

VR VA P VA Valor Aparente; P Porcion

La media unidad por debajo es el Limite InIerior (Li).
La media unidad por encima es el Limite Superior (Ls).
La porcion es igual a 0,5 para cantidades exactas.
La porcion es igual a 0,05 para cantidades de un decimal.
La porcion es igual a 0,005 para cantidades de dos decimales.

L
i
, L
s
, son los limites reales del intervalo (inIerior y superior), respectivamente.

I
c
, es la Amplitud del intervalo (cantidad de valores cubiertos por el intervalo).

At o R, Amplitud Total o recorrido, es la amplitud de la distribucin (cantidad de valores
cubiertos por la distribucion), y se obtiene, si se conocen los Valores tanto inicial como Iinal o
Superior de la distribucion, mediante la ecuacion

At o R V
s
- V
i


V
i
Valor InIerior de la muestra.
V
s
Valor Superior de la Muestra.
Li

Ls
13
X
)
o X
m
, Marca de clase o punto medio, es el punto medio del intervalo (valor que esta situado a
igual distancia de los extremos del intervalo). Para calcular el punto medio de un intervalo de
clase, se utiliza la Iormula siguiente:

2 2
,
Ls Li Xi Xs
Xm X
+
=
+
=
)

Ejemplo
Si tenemos una serie de datos que corresponden a las notas Iinales de 50 alumnos de una
asignatura en cuestion:

58-37-51-21-48-29-51-39-60-59-48-70-59-32-43-31-57-40-51-40-18-31-92-15-69-46-60-65-10-
43-41-44-56-67-49-19-43-30-63-18-59-64-52-61-10-51-73-16-74-71.

Ordenando en Iorma Creciente tenemos:

10-10-15-16-18-18-19-21-29-30-31-31-32-37-39-40-40-41-43-43-43-44-46-48-48-49-51-51-51-
51-51-52-56-57-58-59-59-60-60-61-63-64-65-67-69-70-71-73-74-92

Si tomamos un intervalo de clase (Ic) de 10 y hacemos uso de los limites aparentes de clase,
calcularemos los Ls como el Li Ic tenemos:

Ni Li Ls Xm Fo FA fro FrA Hi
1 10 20 15 7 7 0,14 0,14 14
2 20 30 25 2 9 0,04 0.18 18
3 30 40 35 6 15 0,12 0,3 30
4 40 50 45 11 26 0,22 0,52 52
5 50 60 55 11 37 0,22 0,74 74
6 60 70 65 8 45 0,16 0,9 90
7 70 80 75 4 49 0,08 0,98 98
8 80 90 85 0 49 0 0,98 98
9 90 100 95 1 50 0,02 1,0 100
50
Cuando trabajamos con esta clase de limites, debemos ser muy cuidadosos al incorporar cada
dato dentro de su clase respectiva, por ejemplo al incorporar los valores 40-60-70 de la serie,
surge una pregunta debemos hacerlo para el 40 en la 3 o en la 4, bueno como estamos trabajando
con limites abiertos los valores de los Ls no pertenecen al intervalo y por consiguiente el
respectivo valor sera tomado en cuenta en el intervalo siguiente.
14
Lo mismo sucede con los restantes valores. De existir un valor con el numero 100, este debera ser
tomado en cuenta en un intervalo superior, y al no existir otro intervalo lo debemos crear, para
que dicho numero sea contenido en el.

METODOS A SER EMPLEADOS PARA ELABORAR LA TABLA

METODO EMPIRICO

Ni Cualquier valor comprendido entre 6 y 15

Ic
R o A
Ni
t
=
FORMULA DE STURGES o METODO CIENTIFICO


Logn
A
Ic
t
322 , 3 1+
= ;
Ic
A
Ni
t
= Donde:

N
i
Numero de intervalos de clase
A
t
Amplitud total o Recorrido X mayor X menor
n Numero de datos de la serie
Ic Amplitud del intervalo

REPRESENTACION GRAFICA

DIAGRAMA DE BARRAS O POLIGONO DE FRECUENCIAS
Se construye en un plano cartesiano, colocando en el eje de las ordenadas (Y) las Irecuencias
ordinarias absolutas (I), y en las abscisas (X) los datos X, si la distribucion es por datos directos,
si es por datos agrupados se toman los puntos medios (X
m
).
Se recomienda usarlo para datos que provengan de una variable discreta.








15
HISTOGRAMA DE FRECUENCIAS
Seala la Irecuencia ordinaria absoluta correspondiente a cada intervalo de clase por medio de
rectangulos cuya altura es la Irecuencia del intervalo (I) en el eje de las ordenadas (Y), y la base,
esta representada por el intervalo completo (L
i
L
s
), en el eje de las abscisas (X). Se debe usar
para datos que provengan de una variable continua.

O1IVA DE GALTON O CURVA ACUMULATIVA
Esta curva seala la Irecuencia acumulada correspondiente a cada uno de los intervalos de clase,
en el eje de las ordenadas se coloca las F o las H, en las abscisas los limites reales superiores
(Ls).

DIAGRAMA CIRCULAR O EN PASTEL
Se emplea normalmente para representar distribuciones de razones. La circunIerencia representa
la suma del conjunto de la distribucion de razones (100). Para construirla se multiplica cada
porcion por 360 (grados de una circunIerencia), obteniendose el numero de grados
correspondiente a cada componente. Los grados para cada porcion se cuentan en el sentido de las
agujas del reloj en Iorma sucesiva.
[150,160)
[160-170)
[170-180)
[180,190)
[150,160)
[160-170)
[170-180)
[180,190)


16
Escala de Medida.
Los datos estadisticos por lo general provienen de la medida de una o mas variables.
Dependiendo de la medicion y de la esencia de la variable, se obtienen diversas clases de datos
que originan diIerentes escalas de medidas. Resulta sumamente importante conocer el tipo de
escala que representan los datos, debido a que, de su esencia depende la tecnica estadistica que
mas se adapta para su analisis.
Escala Nominal.( altos, bajos normales anormales)
Representa el nivel mas bajo de medida. Se utiliza cuando un objeto o evento se diIerencia de
otro solamente por la nominacion que se conoce. Los procedimientos estadisticos que mas se
adaptan, son: Chi cuadrado, coeIiciente phi, coeIiciente de contingencia, prueba del signo, prueba
binomial.
Escala Ordinal. (Estudiantes rendimiento)
Estas escalas distinguen los diIerentes valores de la variable, ubicando a los eventos en orden
desde lo mas alto a lo mas bajo. Los procedimientos estadisticos que mas se adaptan son:
coeIiciente de correlacion de Spearman, coeIiciente tau de Kendall, prueba de la mediana.
Escala de Intervalos. (a-b,b-c, Comparaciones)
En esta escala se puede indicar la cantidad en la que un evento se diIerencia de otro. Esta escala
posee todas las caracteristicas de una escala nominal y una ordinal y ademas esta basada en
intervalos iguales.
Escala de Razn. (Contiene todas las escalas)
Es la mas potente o soIisticada de las cuatro escalas de medida. Su empleo permite sealar en
cuantas veces es mas grande un objeto que otro y ademas indica la cantidad en que se
diIerencian. Esta contiene las caracteristicas de las otras escalas y dispone de un cero absoluto, lo
cual posibilita las operaciones aritmeticas. Para la escala de intervalos y razon
Se recomienda los procedimientos estadisticos: Correlacion de pearson, t de student, analisis de
regresion, analisis Iactorial, analisis discriminante.











17
E1ERCICIO RESUELTO

En un estudio realizado en varias empresas del sector aduanero se determinaron los salarios
promedio diarios que devengan los trabajadores en diIerentes departamentos para tal Iin se
estudiaron 30 empresas y se obtuvieron los siguientes datos:
5000 5050 5100 5125 5150 5200 5223 5270 5300 5315 5325 5390 5400
5415 5425 5450 5475 5480 5500 5515 5520 5525 5550 5575 5580 5595
5892 5910 6050 6065 6100 6125 6130 6150 6175 6200 6225 6250 6265
6270 6275 6300 6320 6345 6350 6375 6390 6400 6430 6435 6450 6465
6475 6500 6520 6525 6540 6550 6575 6600 6620 6635 6640 6645 6650
6690 6700 6750 6784 6820 6825 6850 6875 6900 6925 6950 6975 6980
6985 7000
Elabore la tabla de distribucin de frecuencias en funcin al nmero de intervalos
establecidos por los criterios vistos en clase.
Vamos a elaborar la tabla de distribucion en 10 intervalos de clase(metodo empirico), para ello
tenemos como Valor Mayor 7000, y Valor Menor 5000
La Amplitud total o recorrido (At) 7000 - 5000 200
La Amplitud del intervalo (Ic) 2000/10 200, Procedemos a llenar la tabla.

Ni Li Ls Xm fo Fa fro FrA
1 5000 5200 5100 5 5 6.25 6.25
2 5200 5400 5300 7 12 8.75 15
3 5400 5600 5500 14 26 17.5 32.5
4 5600 5800 5700 0 26 0 32.5
5 5800 6000 5900 2 28 2.5 35
6 6000 6200 6100 7 35 8.75 43.75
7 6200 6400 6300 12 47 15 58.75
8 6400 6600 6500 12 59 15 73.75
9 6600 6800 6700 10 69 15.5 86.25
10 6800 7000 6900 10 79 12.5 98.75
11 7000 7200 7100 1 80 1.25 100
80
Recuerde que los datos deben estar ordenados y de ser posible redondeados.
Es de hacer notar que se agrego un intervalo, ya que el ultimo valor coincidia con el limite
superior de la tabla de distribucion, tambien es importante resaltar que los valores que coinciden
con los limites superiores son tomados en el intervalo siguiente, las graIicas se haran tomando en
cuenta la recomendacion dada en clase.
18
PROBLEMA DE ESTADISTICA
Dada la siguiente serie de datos, representativa de un proceso estadstico cualquiera.
5094-5326-5382-5456-5491-5112-5192-5219-5248-5277-5292-5527-5546-5585-5739-5692-
5719-5824-5865-5897-5924-4950-4987-5024-5094-5935-5962-5989-6012-6045-5135-5165-
6086-6114-5406-5426-6120-6250-5785-5819-5616-5645 5692-5049-5086
Ordenar
4950-4987-5024-5049-5086-5094-5094- 5112- 5135 -5165- 5192-5219-5248-5277-5292-5326-
5382-5406-5426-5456-5491-5527-5546-5585-5616-5645-5692-5692-5719-5739-5785-5819-
5824-5865-5897-5924-5935-5962-5989-6012-6045-6086-6114-6120-6250
N 45 datos
R Vmayor-Vmenor 6250 - 4950 1300
Mtodo emprico: metodo que depende del estado de animo de la persona que esta realizando el
proceso estadistico, en este metodo nos dan como dato el numero de Iilas, para luego calcular el
intervalo de clase (Este se redondea siempre al inmediato entero superior).
Numero de filas 9
Ic R / # de filas 1300 / 9

Elaboracin de la tabla

Li Ls X fo Fa fro FrA











Mtodo de Sturges: Metodo matematico por excelencia, en el que mediante la aplicacion de una
Iormula podemos calcular el Ic (Este se redondea en condiciones normales), para luego calcular
el numero de Iilas (Se lleva siempre al inmediato entero superior)
Formula de Sturges ---- Ic R / (1 + 3,322xlogN)
Para calcular l numero de filas # Filas R / Ic.

19
Li Ls X fo FA Fro FrA









Representacin grafica
Esta se realiza de dos maneras:
1.- Polgono de Frecuencias: Tambien denominado diagrama de lineas, para realizar este
colocamos en el denominado eje de las X a las marcas de clase y en el eje de las Y a las
Irecuencias ordinarias.





















Frecuencias
Ordinarias
Marcas de clase
20
2.- Histograma de Frecuencias: Tambien denominada diagrama de barras, para realizar esta
colocamos en el denominado eje de las X a los limites de clases y en el denominado eje de las Y
a las Irecuencias ordinarias.




















Graficas comparativas de muestra













Simtrica
Asimetra
Positiva
Asimetra
Negativa
Frecuencias
Ordinarias
Limites de clase
21
PROBLEMAS PROPUESTOS

1.- Los datos siguientes corresponden a la medida en CMS. De una muestra de productos
tomados en la compaia 'X. Realice una distribucion de Irecuencias sabiendo que Ni 10

1.50 - 1.51 - 1.12 - 2.14 - 2.50 - 3.42 - 3.00 - 9.16 - 5.50 - 10.50 - 13.20 26.76 - 20.65 - 20.27 -
20.62 - 23.42 - 18.62 - 28.45 - 29.15 - 29.36.

2.- Los siguientes datos corresponden a los pesos de los estudiantes de una Universidad, los pesos
estan dados en libras. Construya una tabla de distribucion de Irecuencias, con I 5.

110.12 - 114.78 - 118.16 - 119.23 - 120.05 - 124.35 - 126.77 - 128.36 - 130.50 - 134.32 - 137.16 -
143.18 - 135.50 - 140.50 - 145.17 - 149.77 - 150.50 - 153.62 - 154.61 - 156.38 - 158.15 - 159.45 -
160.50 - 159.66 - 115.25 - 128.30 - 135.50 - 148.65 - 160.25 - 155.70 - 118.60 -123.10 -

3.-Dada la siguiente serie de datos, representativa de un proceso estadistico cualquiera. Elabore la
tabla de Irecuencia haciendo uso del metodo cientiIico, asi como un poligono de Irecuencias.
4950-4987-5024-5049-5086-5094-5094-5112-5135-5165-5192-5219-5248-5277-5292-5326-
5382-5406-5426-5456-5491-5527-5546-5585-5616-5645-5692-5692-5719-5739-5785-5819-
5824-5865-5897-5924-5935-5962-5989-6012-6045-6086-6114-6120-6250
4.- Los siguientes son salarios de los empleados de ciertas compaias del estado Carabobo,
elabore una tabla de distribucion de Irecuencias, asi como un histograma, tomando en cuenta los
criterios vistos en clase.
8200-7500-7800-6900-7350-9260-9500-8700-8150-9620-10150-9400-9700-8625-7950-
8125-11000-10360-9650-9000-7800-8100-7350-9780-10750-11100-8525-9900-10780-
10150-11100-10365-8325-10200-10000









22
MEDIDAS DE TENDENCIA CENTRAL


El hecho de tener los datos de una muestra, clasiIicados y presentados en una tabla de
distribucion de Irecuencias, haciendo uso de los metodos anteriormente vistos como son el
metodo empirico o el de Sturges, no me da garantia alguna que me permita asegurar, que un valor
cualquiera de esa muestra sea el mas representativo. Para ello es recomendado calcular unos
indicadores que nos expresen las caracteristicas particulares de la muestra, uno de esos
indicadores son las llamadas medidas de tendencia central, tambien conocidas como valores
medios o medidas representativas, estas nos permiten apreciar de que manera los datos de una
muestra se agrupan o tienden a estar ubicados en el centro de la distribucion ordenada.
Las medidas de tendencia central estan relacionadas con el VALOR de la tendencia central de
una serie de datos ORDENADOS, denominadas tambien como promedios, y se deIine como un
valor representativo y predominante dentro de un conjunto de datos. Un promedio es
generalmente un valor ubicado en el centro de la distribucion y no en el extremo.
Las medidas de tendencia central se clasiIican en dos tipos:

Promedios Matemticos: son aquellos que necesitan de una Iormulacion matematica inmediata
para poder calcularlos, dentro de estos tenemos:

La Media o Promedio Aritmetico Simple ( X ).
La Media o Promedio Aritmetico Ponderado (
p
X ).
La Media o Promedio Geometrico (G)
La Media o Promedio Armonico (H).
La tasa de Crecimiento Geometrico o Formula de Interes Compuesto (r), (i).

Promedios no Matemticos: son aquellos que necesitan de una Iormulacion inicial para despues
aplicar la Iormulacion matematica, dentro de estos tenemos:

La Mediana (X
d
o M
d
)
La Moda (X
o
o M
o
).
Con cada una de ellas se estudian caracteristicos particulares de la muestra, las medidas de
tendencia central se calculan para datos directos (datos ordenados) y para datos agrupados
(colocados en tabla de distribucion de Irecuencias).



23
CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS
DIRECTOS


LA MEDIA O PROMEDIO ARITMETICO ). ( X

De las medidas de tendencia central la media aritmetica es la que con mayor Irecuencia se usa, y
sirve para calcular otros estadisticos. Su deIinicion es clara no se necesita hacer demasiado
esIuerzo para entender su Iinalidad, no es aIectada por las Iluctuaciones de los datos de la
muestra, depende de los valores de los datos, se utilizan calculos algebraicos con Iacilidad y
permite realizar comparaciones.
No debe ser utilizada cuando los datos extremos diIieren notoriamente del resto, es decir cuando
los datos no son homogeneos, o cuando se presenten como una progresion aritmetica,
La media aritmetica se calcula sumando todos los datos de una serie o distribucion y
dividiendolos entre el numero de ellos.
n
foxXi
X

= ;
n
xX f xX f xX f xX f
X
n n
.......
3 3 2 2 1 1
+ + +
=

MEDIANA (X
d
).
Se deIine como el dato, o punto que divide a una distribucion o serie de datos en dos partes
exactamente iguales. Es decir que a ambos lados de la serie existe el mismo numero de elementos
o datos.
- Se ordena
- Se calcula el lugar que ocupa,
2
1 +
=
n
Lugar

MODA, MODO O PROMEDIO TIPICO (X
o
).
Se deIine como el valor mas comun, es decir el valor alrededor del cual se concentran la mayor
cantidad de datos (punto de concentracion maxima).
La moda no es mas que el valor que mas se repite.

PARA DATOS AGRUPADOS EN INTERVALOS DE CLASE

LA MEDIA ARITMETICA O PROMEDIO ARITMETICO ) ( X


n
foxXm
X

=
24
Construya la tabla de distribucion de Irecuencias hasta las
(F). Frecuencias absolutas acumuladas.
a. Calcule los puntos medios Xm.
b. EIectue el producto de I por Xm y sumelos.
c. Use la Iormula inicialmente mostrada.

LA MEDIANA (Xd)


Ic
fo
F
n
Li Xd
Ai
*
2

+ =


a. Ubique el cociente
2
n
, en la columna F, si no coincide ninguno, use el inmediato superior
al buscado.
b. Despues de ubicado
2
n
, extraemos de la tabla los demas terminos:
L
i
Es el limite inIerior del intervalo donde se ubica la mediana.
F
Ai
Es la Irecuencia acumulada absoluta inIerior a la ubicacion de la mediana.
I
o
Es la Irecuencia ordinaria absoluta del intervalo donde se halla la ubicacion de la mediana.

LA MODA (Xo)
Ic
ds di
di
Li Xo *
+
+ =

a. Se ubica la Irecuencia ordinaria modal (I
om
), si existen dos se selecciona lo que concentre
mayor numero de datos a su alrededor.
b. Se calculan las diIerencias entre la Irecuencia ordinaria modal (I
om
) y las que estan
alrededor (inIerior y superior).
c. Se toma el limite inIerior real del intervalo donde se tomo la Irecuencia ordinaria modal, y
se usa la Iormula antes mostrada.
I
om
Es la mayor Irecuencia ordinaria absoluta.
Li Es el limite real inIerior del intervalo que posea la Irecuencia ordinaria absoluta
mayor.
ds I
om
I
os
DiIerencia entre Irecuencia ordinaria modal (I
mo
) y la Irecuencia ordinaria
absoluta(I
os
)que esta por encima de la Irecuencia modal.
di I
om
I
oi
DiIerencia entre Irecuencia ordinaria modal (I
mo
) y la Irecuencia ordinaria
absoluta(I
oi
)que esta por debajo de la Irecuencia modal.
Ic Es la amplitud del intervalo de clase.
25

APLICACIONES DE LAS MEDIDAS DE TENDENCIA CENTRAL.
Cuando hacemos uso de metodos estadisticos, surge la duda sobre la utilizacion de cualquiera de
ellas es decir, cual de las tres medidas de tendencia utilizar, cuando y porque. Existen reglas
generales para ello que a continuacion conoceremos:

LA MEDIA ) ( X
Por ser una medida aIectada por todos los valores de la serie su uso se recomienda:
a. Cuando los datos se distribuyen simetricamente.
b. Cuando la serie es de crecimiento aritmetico.
c. Cuando se desee obtener otras medidas (estadisticos), como la desviacion tipica, la
varianza, desviacion media.

LA MEDIANA (X
d
)
a. Cuando se necesite el valor central exacto de la serie.
b. Cuando existen datos extremos que aIecten severamente a la media aritmetica

LA MODA O MODO (X
o
)
a. Cuando se desee una medida de tendencia central rapida y aproximada.
b. Cuando sea interesante conocer el valor que mas se repite en una serie

RELACIONES ENTRE LAS MEDIDAS DE TENDENCIA CENTRAL.

En toda distribucion o serie simetrica, la media aritmetica, la mediana y la moda, coinciden sin
embargo, cuando el grado de asimetria es moderado, la mediana se encuentra ubicada entre la
media aritmetica y la moda a una distancia igual a 1/3 de la que separa a estas dos, partiendo de la
media. Si la asimetria es acentuada esta relacion no tiene validez. Matematicamente, la relacion
se puede expresar de la siguiente manera:
X X X to por X X X X X X X X
d o d o o d
2 3 : tan ) ( 3 ) (
3
1
= = + =
O lo que signiIica que: MODA 3 veces la MEDIANA 2 veces la MEDIA

Para una distribucin unimodal se cumplen lo siguiente:
1. Cuando , , ,
o d
X X X son iguales, la distribucion de datos es simetrica, es decir la
concentracion de valores es igual a ambos valores de la media aritmetica.

26
2. Cuando X ~ X
d
~X
o
, la distribucion de los datos es asimetrica o sesgada hacia la derecha
(asimetria positiva), lo que nos indica que mas del 50 de los datos estan situados por debajo
de la media aritmetica.

1. Cuando X X
d
X
o
, la distribucion de los datos es asimetrica o sesgada hacia la
izquierda (asimetria negativa), Lo que nos indica que mas del 50 de los datos son
superiores al valor de la media aritmetica.


MEDIDAS DE TENDENCIA CENTRAL SECUNDARIAS
.
MEDIA O PROMEDIO GEOMETRICO (G).
Se deIine como la raiz enesima (raiz del numero de datos), del producto de la serie de valores.

PARA DATOS NO AGRUPADOS

n
n
X X x X x X G ) .( )......... ( ) ( ) (
3 2 1
=
Tomando log a ambos miembros de la ecuacion.

n
LogX LogX LogX LogX
LogG
n
+ + + +
=
.........
3 2 1

Anti-log G G

PARA DATOS AGRUPADOS

i
n o o o o
f
xLogXm f xLogXm f xLogXm f xLogXm f
LogG
+ + + +
=
.........
3 2 1

Anti-log G G
27
USOS DE LA MEDIA GEOMETRICA
La media geometrica se usa en datos que tiendan a una progresion geometrica, entendiendose por
ello, aquella donde las razones o cocientes entre un termino y el anterior sean constantes o
aproximadamente constantes; Existen variables tipicamente con esa tendencia geometrica o
exponencial, como son . la poblacion, intereses, indices, etc.

EL PROMEDIO ARMONICO O MEDIA ARMONICA (H)
Se describe como el reciproco de la media aritmetica del reciproco o inverso de los datos de una
serie.
PARA DATOS DIRECTOS ; PARA DATOS AGRUPADOS

=
i
X
N
H
1

=
i
i
i
X
f
f
H

USOS DE LA MEDIA ARMONICA
Se usa generalmente en aquellos problemas cuando se traten de promediar razones o cocientes,
tales como: Km/Hr, Bs/Doc, Bs/Hr, etc.

RELACION QUE EXISTE ENTRE LOS PROMEDIOS SECUNDARIOS.
La media aritmetica es siempre mayor que la media geometrica y esta a su vez es mayor que la
media armonica, con excepcion del caso en que los datos sean iguales, ya que tales promedios
coincidiran.

H G X (Datos diIerentes)

H G X (Datos iguales)

De acuerdo a la siguiente Iormula, conociendo dos de los tres promedios, podemos calcular el
tercero.
G H * X ; H G / X ; X G / H

PASOS A SEGUIR PARA CALCULAR MEDIDAS DE TENDENCIA CENTRAL PRINCIPALES


PARA DATOS AGRUPADOS

MEDIA O PROMEDIO ARITMETICO.

a. CONSTRUYA LA TABLA DE DISTRIBUCION DE FRECUENCIAS HASTA LA COLUMNA DE LAS
FRECUENCIAS
ABSOLUTAS ACUMULADAS.
b. CALCULE LOS PUNTOS MEDIOS Xm.
28
c. CONSTRUYA LA COLUMNA Fo*Xm (COLUMNA Fo MULTIPLICADA POR LA COLUMNA Xm).

d. USE LA FORMULA DE LA MEDIA ARITMETICA.


n
foxXm
X

=
LA MEDIANA. ,
a. UBIQUE EL COCIENTE n / 2, EN LA COLUMNA DE LA FRECUENCIA ACUMULADA, SI NO
COINCIDE CON NINGUNO
USE EL INMEDIATO SUPERIOR AL BUSCADO.
b. RECUERDE LA FORMULA DE LA MEDIANA.
Ic
fo
FAi
n
Li Xd *
2

+ =

c. DESPUES DE UBICAR n / 2 , EXTRAEMOS DE LA TABLA LOS DEMAS TERMINOS.

Li = ES EL LIMITE INFERIOR DEL INTERVALO DONDE SE UBICA LA MEDIANA.

Fi = ES LA FRECUENCIA ACUMULADA ABSOLUTA INFERIOR A LA UBICACIN DE LA MEDIANA.

Fo = ES LA FRECUENCIA ORDINARIA ABSOLUTA DEL INTERVALO DONDE SE HALLA LA
UBICACIN DE LA MEDIANA.

LA MODA.

a. SE UBICA LA FRECUENCIA MODAL (fom), SI EXISTEN DOS SE SELECCIONA LA QUE
CONCENTRE MAYOR
NUMERO DE DATOS A SU ALREDEDOR.
b. SE CALCULAN LAS DIFERENCIAS ENTRE LA FRECUENCIA MODAL (Fom) Y LAS QUE ESTN
ALREDEDOR
(INFERIOR Y SUPERIOR).
c. SE TOMA EL LIMITE INFERIOR REAL DEL INTERVALO DONDE SE UBICO LA FRECUENCIA
MODAL, Y SE USA
LA FORMULA SIGUIENTE:
Ic
ds di
di
Li Xo *
+
+ =

Li = ES EL LIMITE REAL INFERIOR DEL INTERVALO QUE POSEEA LA FRECUENCIA ORDINARIA
ABSOLUTA MAYOR.
di = Fom - Foi ; DIFERENCIQA ENTRE FRECUENCIA MODAL (Fom) Y LA FRECUENCIA
ORDINARIA ABSOLUTA QUE
ESTA POR DEBAJO DE LA FRECUENCIA MODAL.
ds = Fom - Fos ; DIFERENCIQA ENTRE FRECUENCIA MODAL (Fom) Y LA FRECUENCIA
ORDINARIA ABSOLUTA QUE ESTA POR ENCIMA DE ELLA.










29
EjempIo

DADA LA SIGUIENTE SERIE DE DATOS CALCULE TODAS LAS MEDIDAS DE TENDENCIA
CENTRAL PARA DATOS DIRECTOS Y AGRUPADOS

1265 1272 1360 1385 1420 1525 1530 1600 1650 1800 1820 1860 1910
1950 2000 2100 2150 2200 2265 3500 3720 3850 3920 4000 4500 5250
5320 6210 6280 6500 6660 6720 7960 8100 8100 8565 8860 9220 9520
9520 9863 10275 10350 11200 11485 11520 11792 12350 12380 12500 13670
13865 13900 13952
n = 54
Datos Directos
Media: 85 . 6186
54
334090
= = =

n
foxXi
X

Mediana: Se ubica el lugar que ocupa la mediana, Lugar = (54+1)/2 = 27.5, la mediana
se encuentra entre el valor que ocupa el lugar 27 y el28. Por lo tanto la misma es:
(5320+6210)/2 = 5765 = Xd.

Moda: Es el o los valores que ms se repiten: 8100 y 9520.

Datos Agrupados
ELABORACON DE LA TABLA DE DSTRBUCON DE FRECUENCAS (Ni = 9)

CALCULO DEL RECORRDO: 13952-1265 = 12687

CALCULO DE LA AMPLTUD DEL NTERVALO: Use Ni = 9, 12687/9 = 1409.66=1410


LI LS Xm fo FA fo.Xm
1265 2675 1970 19 19 37430
2675 4085 3380 5 24 16900
4085 5495 4790 3 27 14370
5495 6905 6200 5 32 31000
6905 8315 7610 3 35 22830
8315 9725 9020 5 40 45100
9725 11135 10430 3 43 31290
11135 12545 11840 7 50 82880
12545 13955 13250 4 54 53000
54 334800

Media: X
n
foxXi
X = = = =

6200
54
334800

30
Mediana: Xd Ic
fo
FAi
n
Li Xd = =

+ =

+ = 5495 1410
3
24 27
4085 *
2

Moda:
14 5 19 ; 19 0 19 ; 5 ; 0 ; 19
81 , 2076 1410
14 19
19
1265 *
= = = = = = =
=
+
+ =
+
+ =
ds di fos foi fom
Ic
ds di
di
Li Xo































31
MEDIDAS DE POSICION U ORDEN

Se llaman asi a todas aquellas que al igual a la mediana localizan la posicion de algun caso con
relacion a otros, y estas son:
Percentiles
Deciles
Cuartiles
Rangos Percentiles
Percentiles (Xp). Cuando una serie o distribucion de datos es dividida en 100 partes iguales y
obtenemos percentiles del 1 al 99, y es un punto por debajo del cual se encuentra un determinado
porcentaje de casos, por ejemplo 85, es el punto o puntos, por debajo del cual se encuentra el
85 de los casos de la distribucion.

Deciles (Dx). Cuando una serie o distribucion es dividida en 10 partes iguales y obtenemos
deciles del 1 al 9.

Cuartiles (Qx). Cuando una serie o distribucion es dividida en 4 partes iguales y obtenemos
cuartiles del 1 al 3.

RELACION ENTRE ESTAS MEDIDAS

X
d

Percentiles
X10 X20 X30 X40 X50 X60 X70 X80 X90
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9
Cuartiles
Q1 Q2 Q3


Observando el graIico nos damos cuenta la relacion que existe entre los deciles y los cuartiles con
los percentiles.
D1 P10, D2 P20, Q1 P25, Q2 P50, Q2 D5.
Es de notar la coincidencia que existe entre ellos.
Q2 D5 P50 Xd; Es decir el segundo cuartil (Q2), el quinto decil (D5), el percentil 50 (P50)
y la mediana son iguales entre si en cualquier distribucion.

32
PERCENTILES PARA DATOS DIRECTOS.

Xp Xi (Xs - Xi) * R

Xp Percentil buscado.
Xi Es el dato inIerior al percentil buscado.
XS Es el dato superior al percentil buscado.
R diIerencia entre el lugar del percentil buscado y el lugar del dato inIerior.

Procedimiento
1. Se ordenan los datos de menor a mayor
2. Se calcula el lugar del percentil buscado (Xp).
3. Se determina el valor de R.
4. Se aplica la Iormula antes descrita.
5. Se interpreta.

PERCENTILES PARA DATOS AGRUPADOS EN I.C.

Ic
fo
FAi
pxn
Li Xp *
100

+ =


Procedimiento
1. Se calcula el lugar de ubicacion del percentil pedido.
2. Se procede igual que el calculo de la mediana respecto a los valores de Li, F
Ai
, Io.
3. Se interpreta.

RANGO PERCENTIL (Px).

Es un estadistico que nos indica el porcentaje de casos que Esta ubicado por debajo de un valor
conocido.

Observacion:
1. En los percentiles, deciles y cuartiles se da un porcentaje para luego determinar el
dato por debajo del cual se halla el porcentaje dado.
2. En el caso del rango percentil, se da el dato para conseguir el porcentaje de datos que
se halla por debajo del dato conocido.
33
RANGO PERCENTIL PARA DATOS DIRECTOS

Conociendo la Iormula para el calculo de percentiles por datos directos y sustituyendo en ella el
valor de R, por la diIerencia entre el lugar del percentil buscado y el lugar del dato inIerior al
percentil buscado, obtenemos:

xR Xi Xs Xi Xp ) ( + =

+ = Ixi
pxn
x Xi Xs Xi
100
) (

Despejando P tenemos:

Donde:

=
Xi
i s
i p
I
X X
X X
n
P
100

P Es el rango percentil buscado.
X
p
Es el dato conocido.
X
i
Es el dato inIerior inmediato a X
p
.
Xs Es el dato superior inmediato a X
p
.
I
xi
Es el lugar que ocupa Xi.
n Es el numero de casos o datos de la serie.

RANGO PERCENTIL PARA DATOS AGRUPADOS.

Cuando queremos calcular el rango percentil de un dato en una distribucion de datos agrupados,
se despeja de la Iormula de percentiles para datos agrupados el valor de P (rango percentil) y
obtenemos la siguiente ecuacion:

Donde:

= FAi
Ic
xfo Li Xp
n
Px
) ( 100

Px Es el rango percentil buscado.
n Es el numero de datos de la distribucion.
Xp Representa el dato conocido.
Li Es el limite inIerior real del intervalo de clase que contiene al dato conocido (Xp).
Io Frecuencia ordinaria absoluta del intervalo que contiene al dato conocido (Xp).
FAi Frecuencia acumulada absoluta inIerior al intervalo donde esta ubicado Xp.
Ic Amplitud de los intervalos de clase.


34
DESVIACION CUARTIL.

La desviacion cuartil de un grupo de datos esta basada en dos valores de la distribucion y no
tienen nada que ver con los valores extremos de la serie, sino que se reIieren a la tercera y la
primera cuartilla del grupo. Para encontrar las cuartillas, dividimos el numero de elementos del
grupo en cuatro partes de acuerdo a sus valores. La primera cuartilla (Q1), es el punto sobre la
escala de valores por debajo del cual, hay un cuarto de los elementos. La segunda cuartilla (Q2),
es el punto por debajo del cual hay la mitad de los datos, por lo que Q2 se corresponde con la
mediana. La tercera cuartilla (Q3), es el punto por debajo del cual hay las tres cuartas partes de
los elementos, la diIerencia entre la tercera y la primera cuartilla, es el llamado recorrido
intercuartilitico.
Cuando esa diIerencia es dividida por 2, el cociente es la desviacion cuartilitica o semirecorrido
intercuartilitico.

2
1 3
Q Q
Dq

=
Uno de los elementos de mayor importancia en el calculo de las cuartillas es conocer primero que
lugar ocupa cada cuartilla, para ello debemos tener en cuenta la siguiente relacion:

Q1 n/4 ; Q2 n/2 ; Q3 3n/4.

CUARTILLAS PARA DATOS DIRECTOS
Para calcular cuartiles para datos directos, nos basamos en la relacion que existe entre las
medidas de posicion, para ello calculamos el percentil setenta y cinco y el veinticinco para datos
directos, los restamos y los dividimos entre dos.

CUARTILLAS PARA DATOS AGRUPADOS
Las cuartillas para datos agrupados, se pueden obtener de la misma Iorma como se obtiene la
mediana, primero se ubica el lugar que ocupa la cuartilla, y luego aplicando la Iormula
respectiva, se interpreta de la misma Iorma que la mediana.
Recordando que el lugar que ocupa cada uno de los cuarteles corresponde a:

Q1 25 ; Q2 50 ; Q3 75

Ic
fo
F
n
Li Q
Ai
*
4
1

+ =

Ic
fo
F
n
Li Q
Ai
*
2
2

+ =

Ic
fo
F
n
Li Q
Ai
*
4
3
2

+ =


35
PRINCIPALES CARACTERISTICAS DE LA DESVIACION CUARTILITICA.

La desviacion cuartilitica, esta basada en dos valores Q1 y Q3, no es aIectada por los valores
extremos, los cuales son menores que Q1 y mayores que Q3, existen un 50 de los elementos
entre Q1 y Q3, una desviacion baja, indica una pequea variacion entre el 50 de los elementos
centrales, por otra parte una desviacion alta signiIica que la variacion entre los elementos
centrales es alta.
La desviacion cuartilitica es la mitad de la distancia entre Q1 y Q3, sin embargo si la distribucion
no es simetrica, la distancia de mediana, no coincidira con el recorrido (de Q1 a Q3).

METODOLOGIA PARA CALCULAR MEDIDAS DE POSICION

EN 100 PARTES PERCENTILES
X10 X20 X30 X40 X50 X60 X70 X80 X90
EN 10 PARTES DECILES
D1 D2 D3 D4 D5 D6 D7 D8 D9
EN 4 PARTES CUARTILES
Q1 Q2 Q3


P RANGOS PERCENTILES ( de Valores)
Xp PERCENTIL

PERCENTILES PARA DATOS DIRECTOS.

Xp Xi ( Xs Xi ) * R
Xp Percentil buscado ; Xi Dato inIerior al percentil buscado
Xs Dato superior al percentil buscado ; R DiIerencia entre el lugar del percentil
Buscado y el lugar del dato inIerior.
Procedimiento.
a. Se ordenan los datos de menor a mayor. b. Se calcula el lugar del percentil buscado.
c. Se determina el valor de R. d. Se aplica la Iormula de percentiles. e. Se interpreta.

PERCENTILES PARA DATOS AGRUPADOS.

Ic
fo
FAi
pxn
Li Xp *
100

+ =

36
Procedimiento
a. Se elabora la tabla de distribucion de Irecuencias b. Se calcula el lugar del percentil buscado.
c. Se procede de la misma Iorma como se hizo para el calculo de la mediana. d. Se interpreta.

RANGO PERCENTIL (Px). PARA DATOS DIRECTOS.

=
i
i s
i p
IX
X X
X X
n
P
100


P Es el rango percentil buscado; Xp Es el dato conocido
Xi Es el dato inIerior inmediato a Xp ; Xs Es el dato superior inmediato a Xp
Ixi Es el lugar que ocupa Xi ; n Es el numero de casos o datos de la serie.

RANGO PERCENTIL PARA DATOS AGRUPADOS.

= FAi
Ic
xfo Li Xp
n
Px
) ( 100


Li Es el limite inIerior real del intervalo que contiene el dato conocido Xp
FAi Es la Irecuencia acumulada absoluta inIerior al intervalo donde esta Xp.
Io Es la Irecuencia ordinaria absoluta del intervalo que contiene el dato Xp.

DESVIACIN CUARTILITICA.

2
1 3
Q Q
Dq

=











37
E1EMPLO
En el estudio realizado en las empresas del sector aduanero del ejercicio de elaboracion de tablas
de distribucion de Irecuencias se obtuvieron los siguientes datos:

5000 5050 5100 5125 5150 5200 5223 5270 5300 5315 5325 5390 5400 5415 5425 5450
5475 5480 5500 5515 5520 5525 5550 5575 5580 5595 5892 5910 6050 6065 6100 6125
6130 6150 6175 6200 6225 6250 6265 6270 6275 6300 6320 6345 6350 6375 6390 6400
6430 6435 6450 6465 6475 6500 6520 6525 6540 6550 6575 6600 6620 6635 6640 6645
6650 6690 6700 6750 6784 6820 6825 6850 6875 6900 6925 6950 6975 6980 6985 7000
n 80
Determine: para datos Directos y Agrupados lo siguiente:
1. Cual es el salario mas alto que ganan el 40 de los trabajadores que ganan los
salarios mas altos que la media.

2. Cual es el salario mas alto que ganan el 30 de los trabajadores que ganan los
salarios mas bajos.

3. Calcular el y numero de trabajadores se encuentra por debajo del Salario 5347.5.

4. Calcular el y numero de trabajadores se encuentra por encima del salario 6545.25.

5. Calcular el y numero de trabajadores se encuentra entre el salario 6315 y el salario
6825.
6. Calcular la Desviacion Cuartilitica.

Datos Directos
1. Para calcular ese salario debemos primero calcular la madia de la muestra, una vez calculado,
procedemos a calcular el rango percentil para ese valor, conocido este porcentaje, le sumamos el
40 que se encuentra por encima y haciendo uso de la Iormula para el calculo de percentiles, lo
realizamos para el porcentaje en cuestion.
Media
n
foxXm
X

= 490279/80 6128.48 Media
Calculo del rango percentil para Xp 6128.48; Haciendo uso de la Formula:

=
i
i s
i p
IX
X X
X X
n
P
100
; P 87 . 40 32
6125 6130
6125 48 . 6128
80
100
=


A este porcentaje le sumamos 40 y llegamos a 80.87, Calculamos el percentil para el 80.87
38
Calculamos el lugar que ocupa el percentil buscado 696 . 61
100
80 87 . 80
100
=

=
n p
y usamos
Xp Xi (Xs Xi) * R 6620 (6635-6620) x 0.696 6630.44

2. El 30 de los que ganan los salarios mas bajos, son aquellos que se encuentran 30 encima
del salario 5000 o lo que es lo mismo vamos a calcular el percentil 30, usamos la Iormula:
Xp Xi (Xs Xi) * R; Lugar que ocupa el percentil 24, entonces el salario sera: 5575.

3. Calculo del rango percentil para Xp 5347.5; Haciendo uso de la Formula:

=
i
i s
i p
IX
X X
X X
n
P
100
; P 183 . 14 11
5325 5390
5325 5 . 5347
80
100
=

, Calculo del
numero de trabajadores 35 . 11
100
80 183 . 14
100
=

=
n p
- 11 trabajadores.

4. Nosotros no podemos calcular porcentajes que estan por encima de valores de Iorma directa,
ya que se contradisela deIinicion de rango percentil, para ello nos situamos en un valor que se
encuentre un diIerencial por encimadle valor conocido y para ese valor si calculamos el rango
percentil. Nos situaremos en el valor 6545.5, calculamos el rango percentil y el porcentaje
obtenido se lo restamos del 100 y de esta manera damos repuesta al interrogante.
Calculo del rango percentil para Xp 6545.5; Haciendo uso de la Formula:

=
i
i s
i p
IX
X X
X X
n
P
100
; P 93 . 71 57
6540 6550
6540 5 . 6545
80
100
=

,
100 - 71.93 28.07 porcentaje por encima
Calculo del numero de trabajadores 456 . 22
100
80 07 . 28
100
=

=
n p
- 22 trabajadores.

5. Para realizar este calculo, primero lo haremos para el valor superior, luego para el valor
inIerior y los porcentajes los restamos y obtenemos el porcentaje que esta entre esos dos valores
Calculo del rango percentil para Xp 6825; Haciendo uso de la Formula:

=
i
i s
i p
IX
X X
X X
n
P
100
; P 96 . 88 71
6820 6850
6820 6825
80
100
=

,
Calculo del rango percentil para Xp 6315; Haciendo uso de la Formula:

39

=
i
i s
i p
IX
X X
X X
n
P
100
; P 69 . 54 43
6300 6320
6300 6315
80
100
=

,
88.96 - 54.69 34.27
Calculo del numero de trabajadores 42 . 27
100
80 27 . 34
100
=

=
n p
- 27 trabajadores.
6. Procedemos a calcular el percentil 75, luego calculamos el percentil 25, estos valores los
restamos y los dividimos entre 2, o lo que es lo mismo el cuartel 3 y el cuartel 1, estos valores los
restamos y los dividimos entre 2.
Calculamos el lugar que ocupa el percentil Setenta y cinco 60
100
80 75
100
=

=
n p
y usamos
Xp Xi (Xs Xi) * R al contar los valores nos damos cuenta que el lugar 60 lo ocupa el
valor 6600.
Calculamos el lugar que ocupa el percentil Veinticinco 20
100
80 25
100
=

=
n p
y usamos
Xp Xi (Xs Xi) * R al contar los valores nos damos cuenta que el lugar 20 lo ocupa el
valor 5515.
La desviacion cuartilitica es 5 . 542
2
5515 6600
2
1 3
=

=
Q Q
Dq
Datos agrupados

1. Elabore la tabla de distribucion de Irecuencias en Iuncion al numero de intervalos que se le
indica, Ni 10
Calculo del rango Vmayor Vmenor 5000 7000 2000

Ni Li Ls Xm fo Fa fo x Xm
1 5000 5200 5100 5 5 25500
2 5200 5400 5300 7 12 37100
3 5400 5600 5500 14 26 77000
4 5600 5800 5700 0 26 0
5 5800 6000 5900 2 28 11800
6 6000 6200 6100 7 35 12200
7 6200 6400 6300 12 47 75600
8 6400 6600 6500 12 59 78000
9 6600 6800 6700 10 69 67000
10 6800 7000 6900 10 79 69000
11 7000 7200 7100 1 80 71000
490800

40
1. La media de la distribucion es: 4908000/80 6135 Realizamos el mismo procedimiento
desarrollado para datos directos. Calculando el rango percentil con la Iormula siguiente:

= FAi
Ic
xfo Li Xp
n
Px
) ( 100
Buscamos en la tabla, dentro de que limites se encuentra
el valor y procedemos a tomar los demas valores 84 . 35 28
200
) 6000 6135 (
80
100
=

=
El porcentaje conseguido lo sumamos a 40 y calculamos el percentil para ese valor con
la Iormula siguiente:
Ic
fo
FAi
pxn
Li Xp *
100

+ =
Hallamos el lugar que ocupa el percentil
3 . 60
100
80 38 . 75
=


y este valor lo ubicamos en la tabla de distribucion, tal como lo haciamos con el calculo
de la mediana para la extraccion d los valores.

6626 200 *
10
59 3 . 60
6600 =

+ = Xp
Salario mas alto
2. Calculamos el percentil 30
Ic
fo
FAi
pxn
Li Xp *
100

+ =
Hallamos el lugar que ocupa el percentil 24
100
80 30
=


6626 200 *
10
59 3 . 60
6600 =

+ = Xp


3. Procedemos como lo hicimos para datos directos.

Calculando el rango percentil para el salario 5347.5 con la Iormula siguiente:

= FAi
Ic
xfo Li Xp
n
Px
) ( 100
Buscamos en la tabla, donde dentro de que limites se
encuentra el valor y seleccionamos los demas
valores 45 . 21 12
200
7 ) 5200 5 . 5347 (
80
100
=

=
x

Calculo del numero de trabajadores 16 . 17
100
80 45 . 21
100
=

=
n p
- 17 trabajadores.

41
4. Al igual que en datos directos nos situamos en un valor superior al pedido, el cual sera
6545.5 y procedemos teoricamente de la misma manera.
Calculando el rango percentil para el salario 6545.5 con la Iormula siguiente:

= FAi
Ic
xfo Li Xp
n
Px
) ( 100
Buscamos en la tabla, donde dentro de que limites se
encuentra el valor y seleccionamos los demas
valores 66 . 84 59
200
12 ) 6400 5 . 6545 (
80
100
=

=
x
100 - 84.66 15.34
Calculo del numero de trabajadores 27 . 12
100
80 34 . 15
100
=

=
n p
- 12 trabajadores
.
5. Calculando el rango percentil para el salario 6825 con la Iormula siguiente

= FAi
Ic
xfo Li Xp
n
Px
) ( 100
Buscamos en la tabla, donde dentro de que limites se encuentra el
valor y seleccionamos los demas terminos 25 . 80 79
200
10 ) 6800 6825 (
80
100
=

=
x

Calculando el rango percentil para el salario 6315 con la Iormula siguiente

= FAi
Ic
xfo Li Xp
n
Px
) ( 100
Buscamos en la tabla, donde dentro de que limites se encuentra el
valor y seleccionamos los demas terminos 375 . 67 47
200
12 ) 6200 6315 (
80
100
=

=
x

80.25 - 67.375 12.875
Calculo del numero de trabajadores 3 . 10
100
80 875 . 12
100
=

=
n p
- 10 trabajadores
6. Calculando el percentil 75 y el percentil 25 damos repuesta a la interrogante

Ic
fo
FAi
pxn
Li Xp *
100

+ =
Lugar que ocupa el percentil 75 60
100
80 75
=


6620 200 *
10
59 60
6600 =

+ = Xp
; Lugar que ocupa el percentil 25 20
100
80 25
=


28 . 5514 200 *
14
12 20
5400 =

+ = Xp

La desviacion cuartilitica es 86 . 552
2
28 . 5514 6620
2
1 3
=

=
Q Q
Dq



42
Medidas de Dispersin

Las medidas de dispersion o de variabilidad nos dan a conocer el grado de homogeneidad o
heterogeneidad de los datos de una distribucin. En la generalidad indican de que manera se
agrupan o concentran los datos alrededor de alguna de las medidas de tendencia central.
Estas medidas explican algunas caracteristicas de la serie de la cual proceden. La variabilidad nos
permite conocer la variacion o dispersion promedio que presentan los datos con relacion a la
media elegida.
Cuanto menor sea esta variabilidad, mucho mas concentrados estaran los datos alrededor de la
media o promedio seleccionado y mas representativo sera este. Cuan mayor sea la variacion o
dispersion menor representatividad tendra dentro de conjunto de datos. Si todos los datos de una
distribucion son iguales no existira dispersion o lo que es lo mismo decir que la variabilidad seria
igual a cero y de hecho no habra variabilidad de los mismos con respecto a su media.
Existen diversas medidas de dispersin, entre las mas utilizadas podemos destacar las
siguientes:

1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diIerencia entre el valor
mas elevado y el valor mas bajo. R Xmayor Xmenor

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatoria de las diIerencias al cuadrado entre cada valor y la media, multiplicadas por el numero
de veces que se ha repetido cada valor. El sumatoria obtenido se divide por el tamao de la
muestra.

tos DatosDirec
n
X X
S
2
2
) (


= ados DatosAgrup
n
X X f
S
m o
2
2
) (


=


La varianza siempre sera mayor que cero. Mientras mas se aproxima a cero, mas concentrados
estan los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la
varianza, mas dispersos estan.

3.- Desviacin tpica: Se calcula como raiz cuadrada de la varianza.

tos DatosDirec
n
X X
S
i


=
2
) (
ados DatosAgrup
n
X Xm f
S
o

=
2
) (




43
4.- Desviacin Media: Se deIine como la sumatoria de las desviaciones de los datos respecto a la
media aritmetica de una distribucion.
tos DatosDirec
n
X X
MD
i


= ados DatosAgrup
n
X Xm f
MD
o

=


5.- Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacion tipica y la
media. C
v

X
S


Ejemplo:

Los datos siguientes corresponden a la estatura de un grupo de alumnos de la seccion 'E del
segundo termino de Ingenieria. De la Universidad Nacional Politecnica Experimental de la
Fuerza Armada Nacional.

1.66-1.67-1.67-1.67-1.67-1.72-1.72-1.72-1.72-1.73-1.73-1.74-1.75-1.75-1.76-1.76-1.76-1.87-
1.87-1.87-1.88-1.88-1.88-1.88-1.89-1.89-1.89-1.90-1.90-1.90.
Los datos estan previamente Ordenados

Calcular para datos Directos y Agrupados las medidas de Dispersion.

Datos Directos:


Variable(X) Io
X X
i
) ( X X fo
i

2
) ( X X
i
Fo
2
) ( X X
i

1,66 1 -0.13 -0.13 0.0169 0.0169
1,67 4 -0.12 -0.48 0.0144 0.0576
1,72 4 -0.07 -0.28 0.0049 0.0196
1,73 2 -0.06 -0.12 0.0036 0.0072
1,74 1 -0.05 -0.05 0.0025 0.0025
1,75 2 -0.04 -0.08 0.0016 0.0032
1,76 3 -0.03 -0.09 0.0009 0.0027
1,87 3 0.08 0.24 0.0064 0.0192
1,88 4 0.09 0.36 0.0081 0.0324
1,89 3 0.1 0.3 0.01 0.03
1,90 3 0.11 0.33 0.0121 0.0363
0.2276
Previamente calculamos la media para datos directos ( X ) 1.79
44
Rango:
Es la diIerencia entre el mayor y el menor valor: 1.90 - 1.66 0.24 mts.

Varianza:
Para calcular la varianza es necesario conocer la Media de la muestra, siendo la misma 1.79.
S
2
007586 . 0
30
2276 . 0
=
Desviacin Estndar o Tpica: es la raiz cuadrada de la varianza.
08709 . 0 007586 . 0 = = S
Desviacin Media respecto a la Media:
02933 . 0
30
88 . 0
= =
D
M
Datos Agrupados

Vamos a elaborar la Tabla de distribucion de Irecuencia usando un numero de intervalos (Ni) de
10.
Calculo del recorrido de la distribucion: V mayor V menor 1.9 1.66 0.24

Calculo de la Amplitud del Intervalo (Ic): 0.24/10 0.024, no redondeamos por ser un valor muy
pequeo.

Ni Li Ls Xm fo FA foxXm
) ( X X
m


2
) ( X X
m
fo
2
) ( X X
m

1 1.66 1.684 1.672 5 5 8.36 -0.12 0.014 0.072
2 1.684 1.708 1.696 0 5 0 -0.96 0.009216 0
3 1.708 1.732 1.72 6 11 10.32 -0.072 0.005184 0.031104
4 1.732 1.756 1.744 3 14 5.232 -0.048 0.002304 0.006912
5 1.756 1.780 1.768 3 17 5.304 -0.024 0.0000576 0.001728
6 1.780 1.804 1.792 0 17 0 0 0 0
7 1.804 1.828 1.816 0 17 0 0.024 0.000576 0
8 1.828 1.852 1.84 0 17 0 0.048 0.002304 0
9 1.852 1.876 1.864 3 20 5.592 0.072 0.005184 0.015552
10 1.876 1.900 1.888 7 27 13.216 0.096 0.009216 0.064512
11 1.900 1.924 1.9125 3 30 5.736 0.12 0.0144 0.0432
30 53.76 0.235008
La media de la distribucion es: 1.792
Desviacin Estndar o Tpica: 08850 . 0
30
235008 . 0
= = S
45
Desviacin Media respecto a la Media:

Varianza: 0078336 . 0
30
235008 . 0
2
= = S
Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacion tipica y la
media de la muestra. . C
v
04938 . 0
792 . 1
08850 . 0
= =
X
S

El interes del coeIiciente de variacion es que al ser un porcentaje permite comparar el nivel de
dispersion de dos muestras. Esto no ocurre con la desviacion tipica, ya que viene expresada en las
mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersion de una serie de datos de la altura
de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede
utilizar las desviaciones tipicas (una viene expresada en cm. y la otra en Kg.). En
cambio, sus coeIicientes de variacion son ambos porcentajes, por lo que si se
pueden comparar.




















46

Medidas de Forma

Las medidas de forma permiten conocer que Iorma tiene la curva que representa la serie de
datos de la muestra. En concreto, podemos estudiar las siguientes caracteristicas de la curva:

a) Asimetra: mide si la curva tiene una Iorma simetrica, es decir, si respecto al centro de la
misma (centro de simetria) los segmentos de curva que quedan a derecha e izquierda son
similares.

b) Curtosis: mide si los valores de la distribucion estan mas o menos concentrados alrededor de
los valores medios de la muestra.
a) Asimetra
Hemos comentado que el concepto de asimetria se reIiere a si la curva que Iorman los valores de
la serie presenta la misma Iorma a izquierda y derecha de un valor central (media aritmetica)

Para medir el nivel de asimetria se utiliza el llamado Coeficiente de Asimetra de Fisher, que
viene deIinido por la relacion entre momentos:
2
3
2
3
3
2
2
3
) (
) (
m
m
m
m
A
s
= =
Recordando la Iormula de los momentos tenemos:
Datos directos Datos agrupados
n
X X
m
i
i


=
) (

n
X X f
m
i
m o
i


=
) (

Los resultados pueden ser los siguientes:
47
A
s
0 (distribucion simetrica; existe la misma concentracion de valores a la derecha y a la
izquierda de la media)
A
s
~ 0 (distribucion asimetrica positiva; existe mayor concentracion de valores a la derecha de la
media que a su izquierda)
A
s
0 (distribucion asimetrica negativa; existe mayor concentracion de valores a la izquierda de
la media que a su derecha)
Ejemplo: Vamos a calcular el CoeIiciente de Asimetria de Fisher de la serie de datos reIeridos a
la estatura de un grupo de alumnos Recordemos que la media de esta muestra es 1,253
b) Curtosis
El Coeficiente de Curtosis analiza el grado de concentracion que presentan los valores alrededor
de la zona central de la distribucion.
Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracion medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribucion normal).
Distribucin leptocrtica: presenta un elevado grado de concentracion alrededor de los valores
centrales de la variable.
Distribucin platicrtica: presenta un reducido grado de concentracion alrededor de los valores
centrales de la variable.

El Coeficiente de Curtosis viene deIinido por la siguiente Iormula:
2
2
4
4
4
) (m
m
S
m
C
u
= =
Los resultados pueden ser los siguientes:
48
C
u
0 (distribucin mesocrtica).
C
u
~ 0 (distribucin leptocrtica).
C
u
0 (distribucin platicrtica).
Ejemplo: Vamos a calcular el Coeficiente de Asimetra de Fisher y el Coeficiente de Curtosis
de la serie de datos reIeridos a la estatura del grupo de alumnos del problema de dispersion:
Variab
(X)
Fo m i
X X
2
) ( X X
i

2
) ( X X fo
i


3
) (
m i
X X
Io
3
) (
m i
X X

4
) (
m i
X X
Io
4
) (
m i
X X
1,66 1 -0.12 0.0144 0.072 -0.001728 -0.00864 0.0002073 0.0010368
1,67 4 -0.096 0.009216 0 -0.0008847 0 0.00008493 0
1,72 4 -0.072 0.005184 0.031104 -0.0003732 -0.00223949 0.00002687 0.00016124
1,73 2 -0.048 0.002304 0.006912 -0.0001106 -0.00033178 0.0000053 0.000015925
1,74 1 -0.024 0.000576 0.001728 -0.00001382 -0.00004147 0.00000033 0.000000995
1,75 2 0 0 0 0 0 0 0
1,76 3 0.024 0.000576 0 0.00001382 0 0.00000033 0
1,87 3 0.048 0.002304 0 0.00011059 0 0.0000053 0
1,88 4 0.072 0.005184 0.015552 0.0003732 0.0011197 0.00002687 0.00008062
1,89 3 0.096 0.009216 0.064512 0.0008847 0.0061931 0.00008493 0.0005945
1,90 3 0.12 0.0144 0.0432 0.001728 0.005184 0.0002073 0.00062208
0.235008 0.00124416 0.0000837
Por lo tanto el Coeficiente de Fisher de Simetra de esta muestra es 0.00105143, lo que quiere
decir que presenta una distribucion asimetrica positiva (se concentran mas valores a la derecha de
la media que a su izquierda).
00105143 . 0
0394433 . 0
000041472 . 0
) 0078336 . 0 (
000041472 . 0
) (
) (
3
2
2
3
2
3
3
2
2
3
= = = = =
m
m
m
m
A
s

Por lo tanto, el Coeficiente de Curtosis de esta muestra es 0.04546544, lo que quiere decir que
se trata de una distribucion leptocurtica, es decir, con una elevada concentracion alrededor de los
valores centrales de la distribucion.
04546544 . 0
0000613652 . 0
00000279 . 0
) (
2
2
4
4
4
= = = =
m
m
S
m
C
u


49
Introduccin a la probabilidad

Estadstica: Ciencia del estado. Descripcion y recogida de grandes conjuntos de datos y su
presentacion en tablas y graIicos.
Actualmente es el resultado de la union de:
- Calculo de Probabilidades (siglo XVII)
- Estadistica
Que evolucionan conjuntamente desde el siglo XIX.

Probabilidad: da una medida de la incertidumbre que puede ser debida a la aleatoriedad o al
desconocimiento del estado del sistema.

Estadistica Teorica: Desarrolla modelos Matematicos.
Estadistica Metodologica o Practica.
Estadistica Descriptiva: Resumen y descripcion de datos.
Estadistica InIerencial: Toma decisiones a partir de los datos tomados en el contexto general del
que provienen.

Fenmeno Natural: Es cualquier cosa que ocurre, existen 2 tipos de Ienomenos:

Deterministico y Probabilistico

- Fenmeno Deterministico o no Aleatorio: Bajo las mismas condiciones iniciales, el resultado
es el mismo. Leyes Iisicas y quimicas clasicas.

- Fenmeno aleatorio: Dadas unas condiciones iniciales el resultado no es el mismo.
N de particulas emitidas por una Iuente radioactiva, Tiempo de vida de una lampara, Resultado
del lanzamiento de una moneda.

Un experimento es un proceso mediante el cual se obtiene un resultado.

Aleatorio
istico Deter
o Experiment
min


En la Estadistica se estudian los experimentos aleatorios, en los cuales, no se puede anticipar el
resultado.

50
Experimento no aleatorio o Deterministico: Observacion de un Ienomeno No aleatorio.

Experimento Aleatorio (E): Observacion de un Ienomeno aleatorio. Son rasgos esenciales:
Los posibles resultados son conocidos antes de su realizacion (Espacio Muestral), No se puede
predecir con exactitud el resultado del experimento, Se puede repetir indeIinidamente en las
mismas condiciones. Ejemplo el lanzar una moneda al aire.

Caractersticas de un Experimento Aleatorio
- Que pueda repetirse n veces.
- Conduce a diIerentes resultados, pero se pueden conocer estos.
- Posee regularidad Estadistica(de tanto que se repite tiende a un mismo resultado)

Espacio Muestral de un Experimento Aleatorio(S): El conjunto de todos los posibles
resultados de un experimento aleatorio.
E Lanzar una moneda 2 veces
S (c, s) (s, c) (s, s) (c, c)}

Tipos de espacios Muestrales, de acuerdo al numero de elementos, el espacio muestral se
clasiIica en:
Espacio Muestral finito: El numero de resultados posibles es un numero entero determinado

Espacio Muestral infinito: El numero de resultados posibles es un numero entero no
determinado, y el mismo puede ser contable (numerable), o no contable (no numerable).
- InIinito Contable o Numerable: el numero de resultados posibles no puede ser determinado pero
puede ser numerado.
- InIinito no Contable o Numerable: el numero de resultados posibles no puede ser determinado
ni numerado.
Ejemplos:

1. E: Lanzar un dado 2 veces
S: (1,1).... (6,6)}; S es Finito.

2. E: Observar los Alumnos del Nucleo
S: 1, 2, 3, 4...n} ; S es Finito.

3. E: Observar los Vehiculos que pasan Irente a la Universidad
S: 1, 2, 3, 4,.....n....} ; S es InIinito Contable.
51
4. E: Observar la duracion de un bombillo.
S: t / t_0} t es la duracion del bombillo ; S es InIinito no contable.

Suceso o Evento: Es una coleccion de posibles resultados.
Los sucesos aleatorios son subconjuntos del espacio muestral y se pueden utilizar entre ellos las
operaciones habituales entre conjuntos. Se denota con una letra mayuscula a partir de la A; A S.

Ejemplos:
1.- El espacio muestral asociado al experimento: lanzar una moneda es:
E C, X}
A Que aparezca cara.}
A c}

2.- El espacio muestral asociado al lanzamiento de dos monedas es:
E CC, CX, XC, XX}
A Que aparezca cara}
A (c,c) (c,x) (x,c)}

C
X
C
X
C
X
CC
CX
XC
XX


3.-Espacio muestral asociado al experimento: Lanzar un dado.

E 1, 2, 3, 4, 5, 6}
A Que aparezca Par}
A 2, 4, 6}
4.- Espacio muestral asociado a al experimento. : Lanzar dos dados:

E (1,1,),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6)
(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),(4,6)
(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}
52
A Que aparezca Uno}
A 1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1 (3,1) (4,1) (5,1) (6,1)}

Tipos de Eventos.

Compuesto
Simple
EJENTO
-Eventos simples:
Es un subconjunto que contiene un solo espacio muestral.

-Eventos compuestos:
Es una combinacion de eventos simples.

Relacin entre eventos

Eventos Solapados
AB, son Eventos solapados, si tienen elementos comunes, estos elementos comunes a AB,
Iorman un subconjunto llamado interseccion (A B) de AB.

Eventos Mutuamente Excluyentes
AB, son Eventos excluyentes A B (la ocurrencia de uno impide la ocurrencia del
otro, no pueden darse o no pueden ocurrir simultaneamente) P(A B) P (A) P (B).

Eventos Dependientes: Dos o mas eventos son dependientes cuando el conocimiento de la
veriIicacion de uno de ellos altera la probabilidad de veriIicacion del o de los otros. Si los eventos
AB, son dependientes A, si la Probabilidad de que 'B suceda, esta inIluenciada por A
P (B) P (B/A) P (AB) P (A) x P (B/A).

Eventos Independientes: un evento B es independiente de un evento A, si la Probabilidad de que
'B suceda, no esta inIluenciada por A P (B/A) P (B) P(AB) P (A) x P (B)

Eventos complementarios: AB, son Eventos complementarios, si el segundo es un subconjunto
que contiene todos los elementos que no estan en el primero. Los eventos complementarios son a
su vez mutuamente excluyentes: AB S y A B .


Operaciones con Eventos.
53

1. Unin de sucesos: AB: Sean A y B eventos, AB es otro evento, el cual ocurre cuando A
ocurre, ocurre B o cuando ocurren ambos.
Dados dos sucesos A y B de un mismo experimento aleatorio, llamaremos suceso union de
A y B al suceso que se realiza cuando se realiza A o B.
Por tanto E A A =

Ejemplo
Sea el Experimento "Lanzar un dado" E 1, 2, 3, 4, 5,6}

A "Salir un numero par" 2, 4,6,}; B "Salir un numero primo 1, 2, 3,5}

A B
1, 2, 3, 4, 5,6}

2. Interseccin de sucesos. AB: Sean A y B eventos, AB es otro evento, cuando ocurre A y
B simultaneamente.

Llamaremos suceso interseccion de A y B al suceso que se realiza si se realizan A y B
(En el ejemplo anterior. B A 2})

Si B A

, entonces se dice que A y B son incompatibles.


Si B A

, entonces se dice que A y B son compatibles.

3.- A: Se lee complemento de A y es el evento que ocurre cuando no ocurre A.
n
4. - A1 A2 A3 .... A Ai
i 1

n
5. - A1 A2 A3 .... A Ai
i 1
6.- un evento que no ocurre.

7.- S Espacio Muestral.

8.- A S S.

9.- A S A.
54

10.- A

11.- A A

Ejemplos

1. Escribimos cada una de las palabras JUEGO en una Iicha y las ponemos en una bolsa.
Extraemos una letra al azar.

a) escriba los sucesos elementales de este experimento aleatorio. tienen todos la misma
probabilidad?
b) Escriba el suceso obtener una vocal.
Solucion
a) Los sucesos elementales son: (J), (U), (E), (G), (O)
Todos tienen la misma probabilidad ya que las letras aparecen cada una, 'una sola vez.
b) A Obtener vocal.
A U, E, O}

2. En un sorteo de loteria observamos la ciIra en que termina el premio

a) Cual es el espacio Muestral?
b) Escriba los sucesos A Menor que 5 ; B Par
c) Hallar los sucesos A B ; A B ; A` ; B` ; A` B`
Solucion
a) E espacio muestral es E: { } 9 , 8 , 7 , 6 , 5 , 4 , 3 , 2 , 1 , 0
b) A: { } 4 , 3 , 2 , 1 , 0 B: { } 8 , 6 , 4 , 2 , 0
c) A B { } 8 , 6 , 4 , 3 , 2 , 1 , 0 A B { } 4 , 2 , 0 A` { } 9 , 8 , 7 , 6 , 5
B`{ } 9 , 7 , 5 , 3 , 1 A` B` { } 9 , 7 , 5
3. Lanzamos tres veces una moneda y anotamos si sale cara o sello.
a) Escribir el espacio muestral.
b) Escribir el suceso A Salio cara la primera vez.
c) Cual es el suceso contrario de A, Escriba los puntos maestrales.
d) Escriba el suceso B obtener el mismo valor tres veces.
e) Escribir los sucesos B`, . B A v B A
Solucin
55
a) { } sss ssc scs scc css ccs ccc E , , , , csc, , , =
b) { } css ccs ccc A csc, , , =
c) { } sss ssc scs scc sello salio ve: primera la A , , , ' = =
d) { } sss ccc B , =
e) { } ssc scs scc css ccs B , , , csc, csc, , =
{ } sss css ccs ccc B A , csc, , , =
{ }. ccc B A =
4. En una caja hay una bola blanca y una bola negra, en otra caja hay una bola negra, una bola
blanca y una bola roja: se extrae una bola de cada una de las cajas y se anota su color:
a) Cual es el espacio muestral.
b) Escriba los sucesos: A la segunda bola es roja, B alguna de las bolas es blanca.
c) Escriba los sucesos: A`, B`, . B A v B A
d) Cual es el suceso contrario de { } NR BR BN C , , =
Solucin:
a) S (B, N) (B, B) (B, R) (N, N) (N, B) (N, R)}.
b) A (B, R) (N, R)}.
c) A` (B, B) (BN) (N, B) (N, N)}; B` (N, N) (N, R)}.
. B A (B, R) (N, R) (B, B) (B, N) (N, B)}
AB (B, R)}.
d) C` (B, B) (N, B) (N, N)}







56
Problemas Propuestos de Experimentos y Espacios Muestrales
1. Determine el espacio muestral del siguiente Experimento, lanzar un dado dos veces, estudiar el
Evento: que aparezca el numero uno.

2. Determine el espacio muestral del siguiente experimento, lanzar una moneda tres veces,
estudiar los eventos: que aparezca un sello, que aparezca al menos una cara, que aparezca cara.

3. Determine el espacio muestral del siguiente experimento, se lanzan juntos una moneda y un
dado una sola vez.

4. Considerese el experimento lanzar dos dados una sola vez y observar la suma de sus caras.
Se pide:
a.-El espacio muestral.
b.-Los eventos:
A: se observa 2
B: se observa 7
C: se observa una suma menor a 7
D: se observan ambos A y C
c.-Que relacion existe entre los eventos.

4. Los articulos provenientes de una linea de produccion se clasiIican como deIectuosos (D), o no
deIectuosos(N). Se observan los articulos y se anota su condicion. Este proceso se continua hasta
que se produzca dos (2) articulos deIectuosos consecutivos o se veriIiquen cuatro (04) articulos,
cualesquiera que ocurran primero. Describir un espacio muestral para este experimento.
Determinar el experimento.

5. Considerese cuatro (4) objetos, con a, b, c, d, supongase que el orden que se anotan esos
objetos representa el resultado de un experimento, sea A el evento 'a esta en el primer lugar y B
el evento 'b esta en el segundo lugar. Determinar todos los elementos del espacio muestral y
sus tipos.

6. Un lote Iormado por 15 unidades de las cuales se sabe que contiene tres unidades deIectuosas,
es inspeccionado por el consumidor tomando una a una hasta tres unidades. El lote se acepta al
aparecer una unidad buena.


57
Probabilidad




- El Calculo de probabilidades tiene por objeto la construccion y estudio de modelos estadisticos.
- La probabilidad es una medida de la posibilidad o certidumbre de la ocurrencia de un suceso
Probabilidad
- Definicin de Probabilidad como Frecuencia
Supongamos una poblacion homogenea y Iinita con N elementos, de los que k presentan la
caracteristica A.
P(A)k/N o Si la poblacion no es Iinita, repetimos el experimento una 'cantidad grande de
veces.

Frecuencia relativa: fA mA/m
mA n de veces que aparecio la caracteristica A
m n de veces que se realizo el experimento.
La IA tiende a estabilizarse segun crece m. Esta deIinicion presenta problemas:

- Cuantas veces ha de repetirse el experimento?
- La inIormacion es limitada
- El sistema observado puede cambiar en el tiempo de observacion.
Por estas razones la probabilidad se introdujo axiomaticamente utilizando las propiedades de la
Irecuencia relativa. Este enIoque ayuda a simpliIicar los modelos teoricos, pero no oIrece una
guia para calcular la probabilidad.

- Idea Intuitiva de Probabilidad.
Supongamos que lanzamos una moneda y anotamos las veces que sale cara. Despues de 10,
20,30,......,200 lanzamientos obtenemos los resultados:

N de lanza. 10 20 30 40 50 60 70 80.................200
N de caras 6 11 16 20 27 31 37 43.................101
Ire.relativa 0,6 0,55 0,53 0,5 0,54 0,51 0,52 0,53..............0,50
58

Si repitieramos el experimento obtendriamos resultados muy parecidos.

Podemos sacar en conclusion que las Irecuencias relativas del suceso cara tienden a
estabilizarse hacia el valor 0,5.
Este numero al que la Irecuencia relativa se acerca mas cuanto mayor es el numero de
pruebas realizadas, lo llamaremos probabilidad del suceso. La probabilidad de un suceso A, se
representara p (A).
Por tanto se puede interpretar la probabilidad de un suceso como limite de Irecuencias
relativas.

Regla de LAPLACE.
"La probabilidad de un suceso A es el cociente entre el numero de casos Iavorables y el
numero de casos posibles."
posibles casos de n
Iavorables casos de
) (
n
A p =
Hay que tener en cuenta que los sucesos elementales tienen que ser igualmente probables
(equiprobables).

Ejemplos:

1. Si realizamos el siguiente experimento 'Lanzar un Dado
Calcular la probabilidad de los eventos:

a) A numero par} 2, 4, 6} p (A) 3/6 1/2
b) B Obtener primo} 2, 3, 5} p (B) 3/6 1/2
c) C Obtener multiplos de 3} 3, 6} p (C) 2/6 1/3
d) D Obtener multiplo de 5} 5} p (D) 1/6

2. Realizar el experimento siguiente y Calcular la probabilidad de los eventos:

'Lanzar dos monedas E CC, CS, SS, SC}
a) A Obtener dos caras} p(A) 1/4
b) B Obtener dos Sellos} p (B) 1/4
c) C Obtener una cara y un sello} p(C) 2/4
d) D Obtener al menos un sello} p (D) 3/4

59
3. Sea el siguiente Experimento

E "Extraccion de una carta de una baraja espaola"}
Calcular la probabilidad de los eventos:

a) A Obtener un oro} p(A) 10/40 1/4

b) B Obtener un as} p (B) 4/40 1/10

c) C Obtener una sota de espadas} p(C) 1/40

d) D Obtener un as o una sota} p (D) 8/40 1/5

e) E Obtener bastos o espadas} p(E) 20/40 1/2

I) F Obtener una Iigura} p (F) 12/40 3/10


- Definicin axiomtica de probabilidad
Se llama probabilidad a una ley que asocia a cada suceso A un numero real entre 0 y 1, que
llamaremos probabilidad de A y representaremos p(A). La probabilidad debe cumplir los
siguientes axiomas:

( )
( )
( ) ( ) ( )

B p + A p = B A p = B A Si - 3.
1 = E p - 2.
A 0 A p - 1.



Propiedades:

( ) ( )
( )
( ) ( )
( )
( ) ( ) ( ) ( ) B A p B p A p B A p v)
A 1 A p iv)
B p A p B A Si iii)
0 p ii)
A A p 1 A p i)
+ =


=
=



60
Ejemplos:

1. Sea el siguiente experimento:
E "Extraer una carta de una baraja"
Y los sucesos siguientes:
A "Obtener un oro" , B "Obtener un rey"
C "Obtener un as de espadas" , D "Obtener Iiguras"

i) A y B son compatibles, pues B A "Obtener rey de oros"
40
13
40
1
40
4
40
10
) ( ) ( ) ( ) ( = + = + = B A p B p A p B A p

ii) A y C son incompatibles, pues no se puede obtener un oro y el as de espadas a la vez.
( ) ( ) ( )
40
11
40
1
40
10
= + = + = C p A p C A p

iii) A B

P (B) 4/40 1/10 p (A) 12/40 3/10
iv) D A "obtener Iigura de oros"

40
19
40
3
40
12
40
10
) ( ) ( ) ( ) ( = + = + = D A p D p A p D A p
2. Sea el experimento siguiente:
Lanzamos dos monedas y anotamos el numero de caras que obtenemos. El Espacio muestral
es { } 2 , 1 , 0 = E .
a) Tienen los tres sucesos elementales la misma probabilidad.
b) Calcular la probabilidad de: 0 caras, 1 cara, 2 caras.
Compruebe que su suma es igual a uno.
c) Cual es el suceso contrario de 0 caras.
d) Cual es la probabilidad del suceso Alguna Cara.
Solucin
a) No el suceso una cara tiene mas probabilidad que los sucesos o caras y dos caras.
b) ( )
4
1
) 0 ( 0 = = P Caras P ; ( )
2
1
4
2
) 1 ( 1 = = = P Caras P ; ( )
4
1
) 2 ( 2 = = P Caras P
61
1
4
1
2
1
4
1
) 2 ( ) 1 ( ) 0 ( = + + = + + P P P
c) S 0 Caras; S` Al menos una Cara.
( )
4
3
4
1
1 ) ( 1 = = = Cara Ninguna P Cara una menos Al P

PROBABILIDAD CONDICIONADA

Cada suceso aleatorio esta asociado con un espacio muestral, su probabilidad depende de la
inIormacion de que dispongamos.
Si sabemos que ha ocurrido un suceso B, esta inIormacion modiIica la probabilidad de los demas
sucesos

Vamos a estudiar como queda modiIicada la probabilidad de un suceso cuando
disponemos de inIormacion adicional de que se ha presentado otro.

Ejemplo.
"Lanzar dos monedas", cuyo espacio muestral es:

E CC, SS, CS, SC}

La probabilidad de CC} es 1/4.

Supongamos que salio una cara, entonces la p (CC)1/2 puesto que el nuevo espacio
muestral queda reducido a E CC, CS}.

Cuando el experimento se considera resultado de varios experimentos (como en el caso
anterior), se habla de experimentos compuestos.

Se llama probabilidad condicionada del suceso B respecto del suceso A, y lo denotaremos
por p (B/A), a la probabilidad de que ocurra B, habiendo ocurrido A. Se calcula segun la Iormula:

( ) 0 ) (
) (
) (

= A p si
A p
B A p
A
B
p
Se llama probabilidad condicionada del suceso A respecto del suceso B, y lo denotaremos
por p (A/B), a la probabilidad de que ocurra A, habiendo ocurrido B. Se calcula segun la Iormula:
62
( ) 0 ) (
) (
) (

= B p si
B p
B A p
B
A
p

Usando la Iormula de la probabilidad condicionada, obtenemos:
( ) ( )
( ) ( )
p(B/A) p(A) = p(A/B) p(B) = B) p(A
p(A/B) B p B A p
p(B/A) A p B A p

=
=
REGLA

DEL PRODUCTO
Si A y B son Eventos Independientes P(A/B) P(A) y P (B/A) P (B) entonces:
P (AB) P(A) x P (B)

Ejemplo:
"Lanzar un dado al aire". Calcula la probabilidad de obtener un multiplo de 3, sabiendo
que ha salido puntuacion par.
Sea A "Salir n par" 2, 4,6} p (A) 3/6 1/2
B "Salir multiplo de 3" 3,6} p (B) 2/6 1/3

( )
3
1
6
2
2
1
6
1
) (
) (
= = =

=
A p
B A p
A
B
p
Pues B A "Salir un N par multiplo de 3" 6}
Sucesos independientes

Diremos que dos sucesos son independientes si la realizacion de uno no modiIica la
probabilidad de realizacion del otro. Por tanto A y B son independientes si:
P (A/B) p (A)
P (B/A) p (B)

Y entonces, por la regla del producto: p ( B A ) p(A) p (B)

En caso contrario se dira que los Sucesos son Dependientes.
Tablas de contingencia y diagramas de rbol
En los problemas de probabilidad y en especial en los de probabilidad condicionada, resulta
interesante y practico organizar la inIormacion en una tabla de contingencia o en un diagrama de
arbol.
Las tablas de contingencia y los diagramas de arbol estan intimamente relacionados, dado uno de
ellos podemos construir el otro. Unas veces, los datos del problema permiten construir Iacilmente
63
uno de ellos y a partir de el podemos construir el otro, que nos ayudara en la resolucion del
problema.
Conversin de una tabla en diagrama de rbol
Las tablas de contingencia estan reIeridas a dos caracteristicas que presentan cada una dos o mas
sucesos.






En el caso de los sucesos A, A - B y B , expresados en Irecuencias absolutas, relativas o
probabilidades la tabla, adopta la Iorma adjunta.
Dicha tabla adopta la Iorma del diagrama de arbol del dibujo. En este, a cada uno de los sucesos
A y Ase les ha asociado los sucesos B y B .

Sobre las ramas del diagrama de arbol se han anotado las probabilidades condicionadas
correspondientes, deducidas de las relaciones analogas a:
( )
) (
) (
A P
A B P
A
B
P

=
Conversin de un diagrama en tabla de contingencia
De manera reciproca, dado el diagrama de arbol podemos construir la tabla de
contingencia equivalente si mas que utilizar la expresion
A
A
TOTAL
B P( A B )
P( A B )
P( B )
B P( A B )
P( B A )
P( B )
TOTAL P( A )
P( A )
1
64
( ) ) ( ) ( A P
A
B
P A B P =
Para calcular las probabilidades de las intersecciones de sucesos que Iorman la tabla.
Ejemplo:
Un taller sabe que por termino medio acuden: por la maana 3 automoviles con problemas
electricos, 8 con problemas mecanicos y 3 con problemas de latoneria, y por la tarde 2 con
problemas electricos, 3 con problemas mecanicos y 1 con problemas de latoneria.
a. Calcula el porcentaje de los que acuden por la tarde.
b. Calcula el porcentaje de los que acuden por problemas mecanicos.
c. Calcula la probabilidad de que un automovil con problemas electricos acuda por la
maana
Solucin:
En las tablas de contingencia, con las Irecuencias absolutas y los porcentajes,
respectivamente, pueden verse recogidos los datos del enunciado.






Las respuestas a las interrogantes planteadas basta leerlas en las tabla. Asi:
a. El 30 de los automoviles acude al taller por la tarde.
b. El porcentaje de vehiculos ingresados con problemas mecanicos es el 55.
c. La probabilidad buscada es:
P (acuda por la maana/tiene problemas electricos) 3/5 0.6
ELCTRICOS MECNICOS LATONERIA TOTAL
MAANA 3 8 3 14
TARDE 2 3 1 6
TOTAL 5 11 4 20
ELCTRICOS MECNICOS LATONERIA TOTAL
MAANA 0.15 0.40 0.15 0.70
TARDE 0.10 0.15 0.05 0.30
TOTAL 0.25 0.55 0.20 1.00
65
Ejemplos:
1. Consideremos el experimento de "lanzar un dado al aire". Calculemos, por ejemplo, la
probabilidad de obtener un 3 sabiendo que ha salido un numero impar:
DeIinimos los sucesos A "sacar 3" y B 1, 3, 5}; entonces, P(A/B) 1/3 puesto que si
sabemos que ha salido un numero impar, los casos posibles ahora son 3 y los casos Iavorables al
suceso A solo 1.
2. Se lanzan dos dados:
a. Cual es la probabilidad de obtener una suma de puntos igual a 7?
b. Si la suma de puntos ha sido 7, cual es la probabilidad de que en alguno de los dados
haya salido un tres?
Solucin:
Sean los sucesos A "la suma de los puntos es 7" y B "en alguno de los dados ha salido un tres".
Los casos posibles al lanzar dos dados son 36 y los casos Iavorables al suceso A son los seis
siguientes: (1,6); (2,5); (3,4);
a. (4,3); (5,2) y (6,1). Por tanto, P( A ) 6/36 1/6
En este caso, el suceso B/A es salir en algun dado 3, si la suma ha sido 7.
b. Observamos que esta situacion ocurre en las parejas (3,4) y (4,3). Por tanto, P(B/A) 2/6
1/3
Particin de un Espacio Muestral S
Para que los eventos A1, A2, A3,..An, Sean una particion deben cumplir con:
a) A1, A2, A3,..An...Ai = 0.
b) A1 A2 A3..An = 0.
c) A1 A2 A3..An = S.

-Formula o Teorema de las probabilidades Totales:

S

=
=
+ + + =
=
n
i
i
n
n
B A P B P
B A P B A P B A P B
B A B A B A B
1
3 2
3 2
) ( ) (
) ( ... .......... ) ( ) ( )
) ( ... .......... ) ( ) ( )
1
1
(A P P(B)
(A B
.
66
) / ( ) ( ........ .......... ) / ( ) ( ) / ( ) ( ) (
2 2 1 1 n n
A B p A p A B p A p A B p A p B p + + + =

Ejemplos
1. En un curso de Matematicas el 30 son Varones, el 45 de los varones y el 20 de las
hembras son de Carabobo.
a) Cual es la probabilidad de que un estudiante seleccionado al azar sea de Carabobo?

Solucin:
Sea: los eventos siguientes:
A
1
El estudiante seleccionado es Varon}
A
2
El estudiante seleccionado es hembra}
B El estudiante seleccionado es de Carabobo}
P (A
1
) 0, 3 P (A
2
) 0.7 P (B/A
1
) 0, 45 P (B/A
2
) 0, 2

P (B) P (B/A
1
) P (A
1
) P (B/A
2
) P (A
2
) 0, 45.0, 3 0, 2.0, 7 0,275

2 Candidatos a la presidencia de de un club social, compiten por el control del club, la
probabilidad de ganar estos candidatos es 0,7 y 0,3 respectivamente, si el primer candidato gana,
la probabilidad de introducir cambios en los estatutos es de0, 8, si gana el segundo candidato esta
probabilidad es de 0,4determine la probabilidad de que se introduzca cambios en los estatutos?
Solucin:
Sea: los eventos siguientes:
A
1
El Primer candidato gana las elecciones}
A
2
El segundo candidato gana las elecciones}
B El introducen cambios en los estatutos}
P (A
1
) 0, 7 P (A
2
) 0.3 P (B/A
1
) 0, 8 P (B/A
2
) 0, 4

P (B) P (B/A
1
) P (A
1
) P (B/A
2
) P (A
2
) 0, 8 x 0, 7 0, 4 x 0, 3 0, 68

3. En cierta Iabrica un articulo es producido por tres maquinas, una semiautomatica y dos
manuales, se sabe que la automatica produce el doble de articulos que las otras dos, y que estas
producen la misma cantidad de articulos (en un periodo de produccion dado). Ademas se sabe
que el 3 de los articulos producidos por la maquina semiautomatica es deIectuoso y el 4 de lo
producido por las otras 2 maquinas tambien lo son.
Si se selecciona al azar un articulo producido en la Iabrica calcular:
a) la probabilidad de que el articulo seleccionado sea deIectuoso.
Solucin.
67
A1 El articulo seleccionado es producido en la maquina semiautomatica}
A2 El articulo seleccionado es producido en la 1ra maquina manual}
A3 El articulo seleccionado es producido en la 2da maquina manual}
B El articulo es deIectuoso}

P(A1) 2|P(A2) P(A3)| ; P(A2) P(A3) P(A1) P(A2) P(A3) 1
2|P(A2) P(A3)| P(A2) P(A3) 1 6P(A3) 1 P(A3) 1/6
P(A2) 1/6 ; P(A1) 4/6 ; P(B/A1) 0,03 ; P(B/A2) 0,04 ; P(B/A3) 0,04
P(B) 0,03 x 0,66 0,04 x 0,16 0,04 x 0,16 0,0326

- Frmula o Teorema de Bayes

P (Aj/B) P (Aj) P (B/Aj) / P (B)
P (Aj/B) P (Aj) P (B/Aj) / L P (Ai) P (B/Ai)
P (Ai) probabilidades a priori
P (Aj/B) probabilidades a posteriori
Las dos ultimas Iormulas son especialmente utiles cuando se dan las circunstancias
- El experimento aleatorio se produce en dos etapas.
- Es sencillo encontrar una particion en el espacio muestral correspondiente a los resultados del
primer experimento.
- Son conocidas o se calculan Iacilmente P (Ai)
- Son conocidas o se calculan Iacilmente P (B/Ai)

Ejemplos:
1. En el ejemplo anterior # 1 de probabilidad Total
Si el estudiante seleccionado es de Carabobo Cual es la Probabilidad de que sea hembra?
P (A
2
/B) = 509 , 0
275 , 0
7 , 0 27 , 0
) (
) ( ) / (
2 2
=

B P
A P A B P

2. En el ejemplo # 3 de probabilidad total
Si el articulo seleccionado es deIectuoso, cual es la probabilidad de que halla sido producido por
la maquina semiautomatica




68
VARIABLE ALEATORIA

DeIinicion de Variable Aleatoria (V.A.): Se dice que hemos deIinido una variable aleatoria para
un experimento aleatorio cuando hemos asociado un valor numerico a cada resultado del
experimento.
Sea E el espacio muestral asociado a un experimento. Se llama variable aleatoria a toda
aplicacion del espacio muestral E en el conjunto de los numeros reales (es decir, asocia a cada
elemento de E un numero real).
Se utilizan letras mayusculas X, Y,... para designar variables aleatorias, y las respectivas
minusculas (x, y,...) para designar valores concretos de las mismas.
Si un experimento con espacio muestral E, tiene asociada la variable aleatoria X, es natural que
se planteen preguntas como: Cual es la probabilidad de que X tome un determinado valor?, esto
nos lleva a establecer, por convenio, la siguiente notacion:
(X x) representa el suceso "la variable aleatoria X toma el valor x", y
p (X x) representa la probabilidad de dicho suceso.
(X x) representa el suceso "la variable aleatoria X toma un valor menor a x", y
p (X x) representa la probabilidad de que la v.a. X tome un valor menor a x.
(X x) representa el suceso "la variable aleatoria X toma un valor menor o igual a x", y
p (X x) representa la probabilidad de que la v.a. X tome un valor menor o igual a x.

Ejemplos

1. Consideremos el experimento aleatorio que consiste en lanzar tres monedas, supongamos que a
cada elemento de su espacio Muestral E ccc, ccs, csc, scc, css, scs, ssc, sss} le asignamos un
numero real, el correspondiente al numero de caras (discreta).
Esta correspondencia que acabamos de construir es una Iuncion del espacio muestral E en el
conjunto de los numeros reales R. A esta Iuncion la llamaremos variable aleatoria y la
denotaremos por X.









69
Supongamos el experimento aleatorio que consiste en lanzar dos dados, podemos asignar a cada
resultado la suma de los puntos aparecidos en cada dado (discreta).
Consideremos el experimento que consiste en elegir al azar 500 personas y medir su estatura. La
ley que asocia a cada persona con su talla es una variable aleatoria (continua).
Consideremos el experimento que consiste en elegir al azar 100 Tomates de una plantacion y
pesarlas. La ley que asocia a cada sandia su peso es una variable aleatoria (continua).
Ejemplos

1. Sea X, la variable aleatoria que representa el numero de puntos obtenidos al lanzar un dado dos
veces.
E Lanzar un dado dos veces ; X El numero de puntos obtenidos al lanzar un dado dos
veces.
S (1,1)(2,1)(3,1)(4,1).......(1,2)(2,1)......(1,3)(2,3).....(1,4)(2,4)....(1,5).......(6,6)}
(1,1) 2 ; (1,2) 3; (6,6) 12

2. Sea el experimento lanzar una moneda 3 veces, sea X la variable que representa el numero de
caras obtenidas en el experimento.
E lanzar una moneda 3 veces.
X N de caras obtenidas al lanzar una moneda 3 veces.
(C,C,C) 3 ; (C,C,S) 2 ; (C,S,S) 1 ; (S,S,S) 0

Rango de una Variable Aleatoria (Rx).
Es el conjunto de numeros reales que puede tomar la Variable, en el caso de los ejemplos N 1 y
2 anteriores, Tenemos:
Rx de 1 2, 3, 4,5,..........12}
Rx de 2 0, 1, 2,3}

VARIABLES ALEATORIAS DISCRETAS

Si una variable aleatoria solo toma valores enteros, es decir, un numero Iinito de valores o
inIinito numerable diremos que es discreta (los dos primeros ejemplos). Si teoricamente, puede
tomar todos los valores de un intervalo de R, diremos que es continua (los dos ultimos ejemplos).

Funcin de Probabilidad f(x)
Consideremos una V.A. discreta X, que toma los valores x
1
, x
2
,..., x
n
. Supongamos que
conocemos la probabilidad de que la variable X tome dichos valores, es decir, se conoce que:
p(X x
1
) p
1
, p(X x
2
) p
2
, p(X x
3
) p
3
,..., p(X x
1
) p
n
,
70
en general p(X x
i
) p
i

La Iuncion de probabilidad f(x) de la v.a. X es la Iuncion que asigna a cada valor x
i
de la
variable su correspondiente probabilidad p
i
.
1 . ) ( ) (
,...., 2 , 1 , 0 . :
1
= = =
=

=
n
i
i
i
P II x X P x f x
n i P I R R f

La representacion graIica mas usual de la Iuncion de probabilidad es un diagrama de barras no
acumulativo.


Funcin de Distribucin F(x)
En muchas ocasiones no nos interesa tanto conocer la probabilidad de que la v.a. X tome
exactamente un determinado valor x
i
, cuanto la probabilidad de que tome valores menores o
iguales que un cierto valor x
i
. En tales casos es necesario acumular los distintos valores de la
Iuncion de probabilidad hasta el valor deseado. Se trata de una nueva aplicacion llamada funcin
de distribucin.
Sea X una variable aleatoria discreta, cuyos valores se suponen ordenados de menor a mayor. Se
llama Iuncion de distribucion de la variable X, y se simboliza por F(x), a la Iuncion
) ( ) (
:
x X P x F x
R R F
=


Es decir, asocia a cada valor de la v.a. discreta la probabilidad acumulada hasta ese valor (la
probabilidad de que la v.a. tome valores menores o iguales a x
i
).

Propiedades:
F(x) es una probabilidad: 0 _ F(x) _1
F(x) 0 para todo X Xi
71
F(x) 1 para todo X _ Xn
Es constante en cada intervalo |Xi, X
i1
)
Es continua por la derecha de cada punto
Es creciente
P(a X _ b) F (b) F (a)
Podemos expresar la Iuncion de distribucion de la siguiente Iorma:

+ +
+

=
= =

n
n n n
i
n
n
x x si
x x x si P P P
x x x si P P
x x x si P
x x si
X F
es on distribuci de funcion su
P P P x X P x f
X X X X
ad probabilid de funcion como tiene X va una Si
1
.........
0
) (
:
........ .......... ) ( ) (

........ ..........
.
1 1 2 1
3 2 1
2 1 1
2 1
2 1


Su representacion graIica tiene Iorma escalonada, siendo los saltos coincidentes con las
probabilidades p
i,
correspondientes a los valores x
i
de la variable X.



72
Ejercicios.

1. Sea X la Variable Aleatoria que representa el numero de caras obtenidas al lanzar una moneda
tres veces. Determinar:
a) Funcion de Probabilidad y su graIica.
b) Probabilidad de obtener a lo maximo 2 caras.
c) Probabilidad de obtener entre 1 y 3 caras.
d) Si se obtiene como minimo 1 cara, cual es la probabilidad de obtener como maximo 3
caras?.
Solucin

E lanzar una moneda 3 veces. ; X N de caras obtenidas

Rx 0,1,2,3} ; S (c,c,c)(c,s,s)(s,c,s)(c,c,s)(s,s,c)(s,c,c)}

a) P(x)
X 0 1 2 3
P(x) 1/8 1/8 3/8 1/8

GraIica:











b) P(X2)

=
=
= + + = + + =
2
0
8
7
8
3
8
3
8
1
) 2 ( ) 1 ( ) 0 ( ) (
X
X
P P P x P

c) P(1X3)

=
=
= + + = + + =
3
1
8
7
8
1
8
3
8
3
) 3 ( ) 2 ( ) 1 ( ) (
X
X
P P P x P

73
d) [ ] 1
8
7
8
7
) 1 (
) 1 3 (
1
3
= =

X P
X X P
X
X
P



2. La venta de cierto articulo (en miles de unidades) es una variable aleatoria con la siguiente
Iuncion de probabilidad, P(X) ax a ; x 1, 2,3. Determinar:

a) La probabilidad de que se vendan mas de mil articulos y no mas de tres mil.
b) Probabilidad de que se vendan a lo sumo mil articulos.
c) GraIique P(x).

Solucin.

P (0) a ; P(1) 2a ; P(2) 3a ; P(3) 4a

=
= = = + + + =
3
0
10
1
1 10 1 4 3 2 1 ) (
X
a a a a a a x P


X 0 1 2 3
P(x) 1/10 1/5 3/10 2/5

a) P(1<X3) P(2X3)

=
=
= + = + =
3
2
10
7
5
2
10
3
) 3 ( ) 2 ( ) (
X
X
P P x P
b) P(X1)

=
=
= + = + =
1
0
10
3
5
1
10
1
) 1 ( ) 0 ( ) (
X
X
P P x P
c) GraIica.












74
3. Se lanza un dado 2 veces, Determinar:
a) Funcion de probabilidad del numero de puntos obtenidos.
b) La probabilidad de obtener no mas de 5 puntos.
c) Probabilidad de obtener mas de 7 puntos pero no mas de 11

Solucin.

a)
X 2 3 4 5 6 7 8 9 10 11 12
P(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

b) P(X5)

=
=
= + + + = + + + =
5
2
36
10
36
4
36
3
36
2
36
1
) 5 ( ) 4 ( ) 3 ( ) 2 ( ) (
X
X
P P P P x P

P (7<X11)

=
=
= + + + = + + + =
11
8
36
14
36
2
36
3
36
4
36
5
) 11 ( ) 10 ( ) 9 ( ) 8 ( ) (
X
X
P P P P x P

Parmetros de una Variable Aleatoria Discreta.

Esperanza matematica

=
=
n
i
i i
Media p x
1
) (
Varianza

= =
= =
n
i
n
i
i i i i
p x p x
1 1
2 2
2
2
) (
Desviacion Tipica

=
+ =
n
i
i i
p x
1
2
2


Tanto la varianza como la desviacion tipica son medidas de dispersion, de tal manera que cuanto
menores son estos dos parametros mas agrupados se encuentran los valores de la distribucion
entorno a los valores centrales. Por contra, para valores grandes de la varianza o la desviacion
tipica los datos de la distribucion se encuentran muy dispersos.

Ejemplos:

1 Un juego consiste en tirar dos dados. Si la suma de sus caras es mayor o igual a 10 se ganan
300 Dolares, si esta comprendida entre 7 y 9 se ganan 100 Dolares. y para cualquier otro
resultado no se gana nada. Cual deberia ser el precio de la apuesta para que la ganancia esperada
de la banca sea de 50 Dolares?
75
Solucin
El espacio muestral para el problema es E (1,1), (1,2), (1,3),..., (6,6)} con 36 puntos
muestrales. Todos los sucesos elementales tiene la misma probabilidad 1/36.
Se deIine la v.a. X: suma de las dos caras.
Esta variable puede tomar los valores 2, 3, 4,....,12. La tabla con la fdp inducida es:

X Sucesos I(x)
2 (1,1)} 1/36
3 (1,2), (2,1)} 2/36
4 (1,3), (2,2), (3,1)} 3/36
5 (1,4), (2,3), (3,2), (4,1)} 4/36
6 (1,5), (2,4), (3,3), (4,2), (5,1)} 5/36
7 (1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} 6/36
8 (2,6), (3,5), (4,4), (5,3), (6,2)} 5/36
9 (3,6), (4,5), (5,4), (6,3)} 4/36
10 (4,6), (5,5), (6,4)} 3/36
11 (5,6), (6,5)} 2/36
12 (6,6)} 1/36

La tabla de la Iuncion premio es

X 2 3 4 5 6 7 8 9 10 11 12
H(x) 0 0 0 0 0 100 100 100 300 300 300

Por lo tanto el valor esperado del premio es

=
= + + + + + = =
12
2
7 , 91
36
1
300
36
2
300
36
3
300
36
4
100
36
5
100
36
6
100 ) ( ) (
x
h
x f x h
En consecuencia, la apuesta deberia costar 91,7 50 141,7 para que la ganancia esperada de la
banca sea 50 Dolares.


76
2 La siguiente tabla muestra la fdp para la variable X: numero de personas por dia que solicitan
un tratamiento innecesario en el servicio de urgencias de un pequeo hospital.

X 0 1 2 3 4 5
F(x) 0,01 0,1 0,3 0,4 0,1 ?
a. Encontrar I (5)
b. Construir F(x)
c. Encontrar p(X 2)
d. Encontrar p(X 2)
e. Encontrar p(X ~ 3)
I. Calcular la media y la varianza
Solucion
a. Por la construccion de las fdps es obvio que

=
x
x f 1 ) ( .
Para que se cumpla esta condicion es necesario que I (5)0,09
b.
X 0 1 2 3 4 5
F(x) 0,01 0,1 0,3 0,4 0,1 0,09
F(x) 0,01 0,11 0,41 0,81 0,91 1

c. p(X 2) F(2) 0,41
d. p(X2) p(X 1) F(1)0,11
e. p(X~3) 1 - p( 3) 1- F(3) 1 - 0,81 0,19
I.
2
2
2
5
0
) (
75 , 2 09 . 0 5 1 . 0 4 4 . 0 3 3 . 0 2 1 . 0 1 01 . 0 0 ) (
x x
x
h
X E
x x x x x x x xf

=
= + + + + + = =

=
1875 . 1 ) 75 . 2 ( 75 . 8
75 . 8 09 . 0 5 1 . 0 4 4 . 0 3 3 . 0 2 1 . 0 1 01 . 0 0 ) ( ) (
2
2
5
0
2 2 2 2 2 2 2 2
= =
= + + + + + = =

=
x
x
x x x x x x x f X X E





77
3 Se desarrolla un compuesto para aliviar las migraas. El Iabricante aIirma que es eIectivo en
un 90 de los casos. Se prueba sobre 4 pacientes. Sea X el numero de pacientes que obtiene
alivio.
a. Encontrar la fdp para X, suponiendo que la aIirmacion del Iabricante sea correcta.
b. Encontrar p(X 1)
c. Si el compuesto no alivia a ninguno de los pacientes es esa una razon para poner en duda la
eIicacia aIirmada por el Iabricante? Razonar sobre la base de la probabilidad implicada.
d. Calcular la media. Que signiIica en este ejemplo?

Solucin
a. Representando por a que un paciente tenga alivio y por n que no lo tenga, el espacio muestral
para el problema es E aaaa, naaa, anaa, aana, aaan,..., nnnn}, Si es cierta la aIirmacion del
Iabricante p(a) 0,9 y p(n) 0,1
La v.a. X: numero de pacientes que tienen alivio puede tomar los valores 0, 1, 2, 3, 4. La tabla
con la fdp inducida es
X Sucesos I(x)
0 nnnn} 0,1
4

1 annn, nann, nnan, nnna} 4 x 0,9 x 0,1
3

2 aann, anan, anna, naan, nana, nnaa } 6 x 0,9
2
x 0,1
2

3 aaan, aana, anaa, naaa} 4 x 0,9
3
x 0,1
4 aaaa} 0,9
4


p(X1) I (0) I (1) 0,1
4
4 x 0, 9 x 0, 13 0,0037
La probabilidad de que no alivie a ningun paciente es I (0)0,0001. Es una probabilidad tan baja
que, eIectivamente, si ese Iuera el resultado hay suIicientes razones para poner en duda la
aIirmacion de que alivia al 90 de los pacientes.

6 . 3 ) 9 . 0 ( 4 ) 9 . 0 ( 1 . 0 4 3 ) 9 . 0 ( ) 1 . 0 ( 6 2 9 . 0 ) 1 . 0 ( 4 1 ) 1 . 0 ( 0 ) (
4 3 2 2 3 4

= + + + + = =
x
x
x x x x x x x x x x x x xf
Si se repitiera un numero suIicientemente grande de veces la experiencia de administrar el
Iarmaco a 4 pacientes, el numero promedio de pacientes que experimentarian alivio seria 3,6.



78
4. El beneIicio obtenido en un negocio es una variable aleatoria X (en millones de bolivares) con
la siguiente Iuncion de probabilidad.

X -1 0 1 2
P(x) 0.2 0.15 0.5 0.15
Determine:
a) El BeneIicio Promedio.
b) El Valor mas Probable.
c) La Mediana del BeneIicio.
d) Si la inversion en el negocio es la mitad del beneIicio, cual es la inversion promedio del
negocio?
e) Fractil punto 85.

Solucin.

X beneIicio obtenido en el negocio.

a) E(x)

=
= + + + =
2
1
6 . 0 ) 15 . 0 )( 2 ( ) 50 . 0 )( 1 ( ) 15 . 0 )( 0 ( ) 20 . 0 )( 1 ( ) (
X
Bs de Millones x P X .

b) Moda: como P (1) es maxima, la moda es X 1Millon de Bs. El beneIicio mas
probable es de X 1 millon.

c) Mediana: P(X me) 0.50 P (-1) 0.20 < 0.50; P (-1) P (0) 0.20 0.15 0.35
<0.50 ; P (-1) P (0) P (1) 0.35 0.5 0.85 > 0.50, por tanto la mediana se
encuentra ubicada entre X 0 Millones y X 1 millon de Bs.


d) Y Inversion Promedio E (y) Desconocida; Y X/2 E(X/2) E(x)/2 0.6/2
0.3 millones de Bs. la cual es la inversion promedio del negocio.

X (0.85) P (XX (0.85)) 0.85) P (-1)P (0)P (1) 0.85, El Iractil (0.85) es X 1 millon
de Bs.


79

VARIABLES ALEATORIAS CONTINUAS

Si en un experimento aleatorio a cada suceso aleatorio elemental le asignamos un valor numerico
obtenemos una variable aleatoria. Es decir, una variable que lleva asociada una probabilidad. La
probabilidad de un valor concreto de la variable es la probabilidad que corresponde a los sucesos
aleatorios elementales a los que hemos asignado ese valor numerico.
Por ejemplo: En el experimento aleatorio "lanzar un dado" asignamos a cada cara del dado su
valor numerico (esta asignacion aparece de Iorma natural). Asi generamos una variable aleatoria
que toma seis valores, del 1 al 6 con igual probabilidad (1/6) cada uno de ellos. Pero, con este
mismo experimento, podemos generar otras variables aleatorias (no tan naturales) como puede
ser: asignar el valor 1 a las caras que son multiplos de tres y el valor 0 a las que no lo son,
apareciendo una variable aleatoria que tiene dos valores, el 1 con probabilidad 1/3 y el 0 con
probabilidad 2/3.
Crear una variable aleatoria no tiene mucho sentido sino la vamos a utilizar en un determinado
contexto, por ejemplo, podemos utilizar la segunda variable aleatoria que hemos creado para
apostar si sale o no multiplo de tres.
Resumiendo, una variable aleatoria se construye al atribuir un numero (positivo, negativo o cero)
a cada uno de los sucesos aleatorios que Iorman el espacio Muestral de un experimento aleatorio.
La probabilidad de cada valor de la variable es la probabilidad conjunta de los sucesos que dan
lugar a ese valor. Es decir, deIinimos una variable aleatoria como una aplicacion del espacio
Muestral sobre el conjunto de los numeros reales R.

Segun la amplitud del campo de variacion de la Iuncion podemos distinguir: variables aleatorias
discretas y variables aleatorias continuas. De la misma Iorma que en estadistica descriptiva, una
variable aleatoria es discreta si toma valores en un conjunto Iinito o inIinito numerable. Y una
variable aleatoria es continua si puede tomar valores en un conjunto inIinito no numerable. Como
ejemplo tipico de variable aleatoria discreta tenemos la distribucion binomial, y como ejemplo
tipico de variable aleatoria continua vamos a ver ahora la distribucion normal.
Como hemos visto hay variables aleatorias que pueden tomar cualquier valor de un intervalo real
de la Iorma (a, b), (a, ), (-, b), (-, ) o uniones de ellos. A las variables de este tipo se las
denomina variables aleatorias continuas.

Por ejemplo: Supongamos que vamos a realizar un experimento aleatorio que consiste en
seleccionar una persona y apuntar su peso. Podemos crear una variable aleatoria cuyos valores
sean el numero de kilogramos que pesa la persona observada. En este caso, el rango de valores
posibles se extiende entre los limites naturales, pero la continuidad de esta variable aleatoria
80
radica en el caracter continuo de lo que medimos, el peso, es decir, en el hecho de que entre dos
valores posibles se podrian obtener inIinitos valores intermedios, tambien posibles si utilizaramos
aparatos con suIiciente precision. Estos "inIinitos" en el interior del rango de la variable es lo que
diIerencia a las variables continuas de las discretas.

Sin entrar en proIundidades, consideramos que una distribucion de probabilidad es cualquier
mecanismo que nos ayuda a obtener las probabilidades de los valores de una variable si es
discreta, o las probabilidades de intervalos de la variable si es continua. Si la variable aleatoria es
discreta es posible asignar probabilidades a cada uno de los valores puntuales de la variable. En
contra, cuando es continua cada uno de los inIinitos valores posibles tendra probabilidad cero y
solo podremos hablar de probabilidad dentro de intervalos.

Distribuciones de probabilidad con variable aleatoria contina

Funcin de Distribucin y Funcin de Densidad.

Si la variable aleatoria es continua hay inIinitos valores posibles de la variable y entre cada dos
de ellos se podrian deIinir inIinitos valores mas. En estas condiciones, y como ya hemos dicho,
no es posible deducir la probabilidad de un valor puntual de la variable, como se puede hacer en
el caso de variables aleatorias discretas. Pero si es posible calcular la probabilidad acumulada
hasta un cierto valor (Iuncion de distribucion), mas tarde podremos analizar como cambia la
probabilidad acumulada en cada punto (estos cambios no son probabilidades sino otro concepto
que denominamos densidad de probabilidad).
Como queremos deIinir los conceptos de Iuncion de densidad y de distribucion para variables
aleatorias continuas, vamos a partir de la idea intuitiva de que tales Iunciones son "modelos" de
las distribuciones de Irecuencias de la variable aleatoria considerada.

Ejemplos
1. Pretendemos observar la altura de un grupo de personas y vamos a seleccionar a una persona
de Iorma totalmente aleatoria. La probabilidad de que la altura de esa persona sea exactamente
1,62894635... m es cero. Pero la probabilidad de que la altura de esa persona este entre 1,62 m y
1,63 m tendra un valor concreto y casi con certeza que sera mayor que la probabilidad de que este
entre 2,10 m y 2,11 m. Por tanto, la densidad de probabilidad en el entorno de 1,625 m es mayor
que la densidad de probabilidad en el entorno de 2,105 m. Sin embargo, que el valor exacto
1,62894635 tenga probabilidad cero de ocurrir no implica que sea imposible que ocurra. De
hecho, cualquier persona que seleccionemos tendra una altura concreta y exacta que tenia
probabilidad cero de suceder.
81
2. Sea X la v.a. que describe la duracion de los neumaticos de una determinada marca y modelo.
Los valores de una variable estadistica continua siempre se consideran agrupados en intervalos de
clase, luego no tiene sentido plantearse la probabilidad de resultados "aislados" (como, por
ejemplo, la probabilidad de que un neumatico dure, exactamente, 56.000 km, 235 m, 47 cm y 6
mm). En todo caso, esas probabilidades deben valer cero. Pero si podemos preguntarnos, por
ejemplo, cual es la probabilidad de que un neumatico dure menos de 50.000 km? o cual es la
probabilidad de que un neumatico dure entre 60.000 y 70.000 km?

Tanto en el ejemplo 1 como en el 2 si queremos hallar esas probabilidades tendremos que recurrir
a metodos empiricos y usar tecnicas estadisticas: tomar una muestra, examinar y anotar las
Irecuencias observadas. Entonces tomaremos como valor de la probabilidad de un suceso s
1
la
Irecuencia observada de este: p (s
1
) Ir (s
1
).

Y asi podemos construir un histograma de Irecuencias relativas y un histograma de Irecuencias
relativas acumuladas. En el primero, la Ir (X _ x) sera la suma de las Irecuencias de todas las
clases anteriores a x; lo que, geometricamente, es el area bajo la curva de Irecuencias entre el
inicio de la graIica y el valor x. La obtencion de Ir(X _ x) en la segunda graIica es mas rapido
pues, Ir (X _ x) es la Irecuencia acumulada del valor x y se lee directamente de la graIica.
A partir de una situacion real con densidades de Irecuencias se crea un modelo teorico con
asignacion de probabilidades.

Sea X una variable aleatoria continua que toma valores en un intervalo |a, b|. Si procedemos a
dividir el intervalo cada vez en mas partes el poligono de Irecuencias relativas (densidades de
Irecuencias) se va aproximando a una curva con un determinado aspecto.
Una vez realizado este proceso de dividir sucesivamente el intervalo, las densidades de
Irecuencias pasan a ser, en el limite, densidades de probabilidad.
La probabilidad de que la variable X tome los valores entre x
0
y x
0
h es P(x
0
_ X _x
0
h) y
corresponde al area bajo la curva en el intervalo |x
0
, x
0
h|. La Iuncion correspondiente a esta
curva, y I(x), la denominamos Funcion de densidad.

FUNCIN DE DENSIDAD

Una Iuncion y I(x) es una Iuncion de densidad de una variable aleatoria continua si cumple las
siguientes condiciones:
Es positiva en todo su dominio: 0 I(x) 1
Permite obtener p(a X b) como area bajo la graIica entre X a y X b. VeriIica la Iormula
P(a X b)

b
a
dt t f ) ( .
82
El area total entre la graIica de I y el eje x vale 1 1 ) ( =

+

dt t f .
Permite obtener F(x) como area bajo la graIica hasta el valor de x

FUNCIN DE DISTRIBUCIN

En general, la Iuncion de distribucion de una variable aleatoria continua X es el modelo teorico
de la curva de Irecuencias acumuladas que se espera obtener para X, y debe cumplir,
evidentemente, estas propiedades:
Ser creciente
Tomar valores de 0 a 1
Si X es una variable aleatoria continua con valores en un intervalo |a, b|, entonces F(x) sera la
probabilidad de que la variable X tome valores entre a y x. F(x) P(a _X _ x).

>

<
=

b x si
b x a si dt t f
a x si
x F
x
a
1
) (
0
) (


= =
x
dt t f x X p x F ) ( ) ( ) (
[ ] b a de cualquira valor un x siendo x X P ad probabilid la x F
dx
x dF
t f , , 0 ) ( ) (
) (
) (
0 0
= = = =
Es decir, la Iuncion de distribucion F(x) es una primitiva de la Iuncion de densidad I(x), o dicho
de otra Iorma, la Iuncion de densidad es la derivada de la Iuncion de distribucion.
Indica la probabilidad de que la variable aleatoria continua X sea menor o igual que un valor
dado, es decir, proporciona la probabilidad acumulada hasta un determinado valor de la variable.

Ejemplos

1. La longitud de una pieza (en metros) es una variable aleatoria X con la siguiente Iuncion de
Densidad I(x) 2(1-X), 0<X<1 y 0; para otro valor. Determinar:

a) La probabilidad de que la pieza mida entre metro y un metro.
b) Probabilidad de que la pieza mida mas de / de metro.
c) GraIica de la Iuncion densidad.

Solucin

X longitud de una pieza
83
a) P(1/2X1)
4
1
) 2 ( ) 1 ( 2
1
2
1
1
2
1
2
= =

x x dx X
b) P(X>3/4)
16
1
) 2 ( ) ( ) 1 ( 2 ) (
1
4
3
4
3
1
4
3 1
2
= = + =


x x dx x f dx X dx x f
c) GraIica.









2. El peso de una caja (Kg.) es una variable aleatoria con la siguiente Iuncion de densidad:

<
< <
=
. . ; 0
5 4 ; 4
4 3 ;
2
1
) (
J O
x x
X
x f Determinar:
a) GraIica de la Funcion de Densidad.
b) Probabilidad de que el peso de la caja este entre 3,5 y 4,5 Kg.
c) Probabilidad de que el peso supere los 4 Kg.

Solucin.

a) GraIica.






b) P(3,5X4,5)

=

= +
4
5 , 3
5 , 4
4
5 , 4
4
2
4
5 , 3
8
3
4
2 2
1
) 4 (
2
1
x
x
x dx x dx
84
c) P(X>4)


=

= + =
5 , 4
5
4 5
5
4
2
2
1
4
2
) ( ) 4 ( ) ( x
x
dx x f dx x dx x f

3. La temperatura promedio (C) de cierta region es una variable aleatoria con la siguiente
Iuncion de densidad:

< <
=
. . ; 0
4 2 ; ) 2 (
8
3
) (
2
C O
x X
x f Calcular:

a) Probabilidad de que la temperatura promedio sea menor de 3 C.
b) Probabilidad de que la temperatura promedio este entre 2,5 y 3,5 C.
c) GraIica de la Iuncion densidad.

Solucin.

X Temperatura promedio de cierta region.
a) P(x3)


= + =
3 2 3
2
2
8
1
) 2 (
8
3
) ( ) ( dx x dx x f dx x f

b) P(2,5X3,5)

= =
5 , 3
5 , 2
2
5 , 3
5 , 2
41 . 0 ) 2 (
8
3
) ( dx x dx x f

c) GraIica.











85

PARMETROS DE UNA VARIABLE ALEATORIA CONTINUA

Por analogia con las deIiniciones de estos conceptos para variables aleatorias discretas, se deIinen
la esperanza matematica o media , la varianza o
2
y la desviacion tipica o de una variable
aleatoria continua de la siguiente Iorma:
Si toma valores en toda la recta real

+

+

+ = = = =
2 2 2
; ) ( ) ( ; ) ( ) ( dx x f x dx x f x x E
Si toma valores en (a, b)

+ = = = =
b
a
b
a
dx x f x dx x f x x E
2 2 2
; ) ( ) ( ; ) ( ) (
Ejemplo

El peso de una caja (Kg.) es una variable aleatoria X con la siguiente Iuncion de Densidad,

< <
=
. . 0
1 0 2
) (
c o
x x
x f Calcular:
a) Peso promedio de la caja.
b) Peso mas Probable.
c) Mediana del peso de la caja.
d) Varianza o Dispersion del peso.

Solucin.
X Peso de la caja.
a) E(x) cafa la de omedio peso Kg
x
xdx x dx x f x Pr ,
3
2
)
3
2 2 . ) (
1
0
1
0
3
= = =

+


b) Moda.
GraIica de I(x)









86
Como F (2) es maximo Moda es X 1 Kg., entonces el peso de la caja mas probable es
X 1 Kg.
c) Mediana P(X me) 0.5

= = = = =
me
me
Mediana la es X me x xdx
0
2
0
2
7 . 0 7 . 0 5 . 0 5 . 0 ) 5 . 0 2
d) V(x) [ ]
2 2
) ( ) ( x E x E ;
2
1
)
2 4
2
2 ) (
1
0
1
0
4 4
2 2
= = = =

x x
xdx x x E
peso del dispersion de grado al e correspond x J
18
1
9
4
2
1
3
2
2
1
) (
2
= =

=

TIPIFICACIN DE UNA VARIABLE ALEATORIA

Si X es una variable aleatoria de media y desviacion tipica o , la variable Y (X- )/ o
tiene de media 0 y de desviacion tipica 1, y se llama tipiIicada de X. Podemos decir que mide la
desviacion de X respecto de su media, tomando como unidad la desviacion tipica de X.

Ejemplo.
Sea X el tiempo de supervivencia en aos despues de un diagnostico de leucemia aguda. La fdp
para X es I(x) -X/2 1, para 0 X 2
.
a. Comprobar que es una fdp.
b. Hallar p(X~1)
c. Hallar p(X 1)
d. Hallar p(X 1)
Ayuda: hacerlo todo graIicamente
e. Calcular la media y la varianza.

Solucin
a) La graIica de la fdp es
La condicion equivalente a:

=
x
x f 1 ) (
para variables continuas es que el area bajo la fdp sea 1. De modo general ese area se calcula
mediante calculo integral, pero en este caso se puede calcular por la conocida Iormula del area de
un triangulo A (b x h)/2, es decir A (2 x 1)/2 1

87

GraIicamente, la probabilidad pedida es el area coloreada de verde, por lo tanto se puede calcular
tambien con la Iormula del area del triangulo. Ahora b 1 y para calcular h hay que ver que valor
toma la fdp cuando x 1, y -1/2 1 1/2. Por lo tanto, la probabilidad es (1x1/2)/2 /


d) Como en toda variable continua la probabilidad de que tome un valor concreto es 0, por lo
tanto p(X 1) 0
d) Obviamente p(X 1) p(X ~1) 1/4
e) Media

+

= + = + =

+ =

+ = = =
2
0
2
0
2 3 2 2
0
3
2
2
4
5
8
)
2 6 2
1
2
) ( ) (
x x
dx x
x
dx
x
x dx x f x x E
x

Varianza
V(x) [ ]
2 2
) ( ) ( x E x E o
2 2 2
) ( x x E =

3
2
3
8
8
16
)
3 8 2
1
2
) ( ) (
2
0
2
0
2
0
3 4
2
3
2 2
= + = + =

+ =

+ = =

+

x x
dx x
x
dx
x
x dx x f x x E
9
2
3
2
3
2
2
2
=

=




88
DISTRIBUCIONES DE PROBABILIDADES DISCRETAS

Distribucion Binomial
Distribucion Poisson
Distribucion Geometrica
Distribucion Hipergeometrica

La Distribucin Binomial o de Bernoulli
En estadistica la distribucion binomial o de bernoulli es una distribucion probabilidad discreta
describiendo el numero de exitos de n experimentos independientes con probabilidad P de un
exito.
Una variable aleatoria se dice que es una distribucion binomial o de Bernoulli si se cumple:
En cada realizacion del experimento solo son posibles dos resultados A y B (experimento
dicotomico).
El resultado obtenido en cada realizacion es independiente de los obtenidos en las anteriores.
La probabilidad del resultado A, y por tanto la de B, no varia a lo largo del experimento.
Si llamamos p a la probabilidad de que se veriIique A y q a la de que se veriIique B, entonces
pq1 (A y B son sucesos contrarios).

Vamos a obtener la Iuncion de probabilidad de una variable aleatoria de tipo binomial, es decir,
vamos a calcular la probabilidad de obtener r resultados A si se realizan n pruebas:

Uno de los posibles resultados es:
A, A,A,A,...A,B,B,...B (A repetida r veces y B repetida n-r veces).
La probabilidad de este suceso es:
P(A).P(A)....P(A).P(B).P(B)...P(B) p
r
q
n-r
Siendo p la probabilidad de que aparezca A y q 1-p la de que aparezca B.
Pero la aparicion de r valores de A pude producirse de C
n
r
maneras. Por tanto, la probabilidad de
que la variable aleatoria que asigna el numero de apariciones de A tome el valor r es:
r n r
q p
r
n
r x P

= = ) (

Ejemplos.
1. Se extraen cinco bolas con devolucion de una caja que contiene 6 blancas y 8 negras. Hallar la
probabilidad de obtener 3 bolas blancas.

Solucin.
89
La probabilidad de extraer una blanca es p 6/143/7 y la de obtener una negra es q 8/14 4/7
(se cumple pq1), entonces:

257 , 0
49
16
343
27
2
4 5
49
16
343
27
)! 3 5 ( ! 3
! 5
7
4
7
3
3
5
) 3 (
2 3
= =

= =

x p

La Iuncion de distribucion de la distribucion binomial sera:
r n r n n
i i
q p
r
n
q P
n
q P
n
x X P x F

= = ....
1 0
) ( ) (
1 1 0

Su Iuncion de densidad es
x n x
q p
x
n
x X P

= = ) (
Eso es por que en n experimentos hay n sobre x (el coeIiciente binomial) posibilidades para un
numero de x exitos (probabilidad
k
p ) y n-x no exitos (
x n
p

) 1 ( ).
En nuestro ejemplo, la probabilidad de obtener 2 bolar blancas o menos en la urna es:
632 , 0 343 , 0 228 , 0 061 , 0
343
64
49
9
10
2401
256
7
3
5
16807
1024
7
4
7
3
2
5
7
4
7
3
1
5
7
4
0
5
) 2 ( ) 2 (
3 2 4 5
= + + = + +
=

= = x P F


2. Una Iamilia tiene seis hijos, hallar la probabilidad que sean:

a) Tres varones y tres hembras.
b) Menos varones que hembras.

Solucin.

X Numero de hijos varones de la Iamilia
X B (n,p) ; X B(6,1/2)

a) P (tres varones) P(X 3) 0,3125.
b) P(menos varones que hembras) P(X 2) 0,34375

3. El 70 de los trabajadores de una empresa tienen mas de 25 aos de edad, si se seleccionan
una muestra de 5 trabajadores,Cual es la probabilidad de que existan?:
a) Tres trabajadores con mas de 25 aos.
90
b) A lo sumo dos trabajadores con mas de 25 aos.
Solucin.
X Numero de trabajadores con mas de 25 aos.
X B (n, p) ; X B (5, 0,7)

a) P(X 3) 0, 3087.
b) P(X 2) 0,03078

En cuanto a la media y la desviacion tipica de la distribucion binomial se tiene:
La media estadistica de una variable aleatoria de probabilidad binominal es np x E = ) ( y su
varianza npq np o p np x J = = = ; ). 1 ( ) (

Ejemplos:

a. Si analizamos productos que vayan saliendo de una linea de produccion, usualmente
seleccionamos algunos cuantos, por ejemplo 20, para ver si tienen algun deIecto. Si, por ejemplo,
el porcentaje de deIectuosos en la produccion es de 20, podemos preguntarnos cual es la
probabilidad de que al revisar los 20, nos encontremos 4 deIectuosos?

b. Si tenemos una gran cantidad de Iacturas expedidas, podemos seleccionar algunas, por ejemplo
14, y analizarlas para ver si los clientes quedaron satisIechos con la venta que les hicimos. Si, por
ejemplo, el 3 de nuestros clientes no quedan satisIechos, podemos preguntar cual es la
probabilidad de que tengamos mas de 3 clientes insatisIechos entre los 14?

c. Si la probabilidad de que un movimiento Iinanciero nos de ganancia es de 78, por ejemplo,
podemos preguntarnos por la probabilidad de que de 12 movimientos 8 resulten buenos.

d. Si la probabilidad de que un empleado llegue tarde un dia es de 0.02, que probabilidad hay de
que llegue tarde mas de 3 veces en 28 dias seleccionados.
Condiciones del modelo binomial
En los ejemplos anteriores se usa el modelo binomial. Lo que tienen de comun es lo siguiente:
Hay una situacion basica que se repite un numero especiIico de veces:
En a, revisamos un articulo. Esto lo repetimos 20 veces.
En b, analizamos la venta asentada en una Iactura. Repetimos 14 veces.
En c, un movimiento puede resultar malo. Repetimos 12 veces.
En d,. . . (Hagalo Ud.!).
En cada ocasion, el resultado solo puede ser uno de dos: exito o Iracaso.
91
En a, exito es un articulo deIectuoso.
En b, exito es un cliente insatisIecho.
En c, exito es que un movimiento resulte Iavorable.
En d,. . . (Hagalo Ud.!).

Cada nueva repeticion se hace de manera independiente de las otras. La probabilidad de un exito
en una repeticion siempre es la misma, sin verse inIluida por los resultados de las otras. Esta
condicion es mas o menos Ialsa en algunos de nuestros ejemplos, pero es parte esencial del
modelo binomial. Si creemos que esta condicion no se satisIace, debemos usar algun otro
modelo, no el binomial.

En a, puede pasar que los articulos deIectuosos vengan en lotes. Es posible que los articulos del
mismo lote hayan sido elaborados en condiciones semejantes y entonces los deIectos de
Iabricacion harian que no haya independencia entre articulos sucesivos. Sin embargo, si se
selecciona al azar productos de varios lotes, la independencia se mantiene.

En b, puede ser que el malestar sea a causa de un empleado y los clientes atendidos por ese
empleado tenderan a estar insatisIechos. Si escogemos al azar a las personas a las que les vamos a
pedir su opinion, se recupera la independencia.

En c, podria pasar que el estado general de la economia inIluya en que los movimientos buenos
se presenten por rachas. Si es asi, no se ocurre como mantener la independencia.

En d,. . . (Imaginese Ud. que puede aIectar la independencia).

Parmetros del Modelo Binomial.

En todos los casos hay un numero de repeticiones que denotamos por n.
Tambien hay una probabilidad de exito en cada intento a la que denotamos por p.
n y p son los parametros del modelo.
En a, n 20, p 0.20
En b, n 14, p 0.03
En c, n 12, p 0.78
En d,. . . (Ponga Ud. la n y la p).



92
Frmulas del Modelo Binomial.

Los valores de n y p en cada situacion especiIica cambian. A estas cantidades les llamamos
parametros.

a. VALOR ESPERADO.
El valor esperado es el producto de n y p:
Esperanza n p

b. DESVIACIN ESTNDAR.
La calculamos asi:
Varianza n p (1-p)
La desviacion estandar es la raiz cuadrada de la varianza.

c. PROBABILIDAD.
La variable aleatoria en el modelo binomial es el numero de exitos en las n repeticiones. La
denotamos con X. El simbolo
P(X k)
Se usa para denotar la probabilidad de que el numero de exitos sea igual a k.
Como en todos los problemas de probabilidad que hemos visto hasta ahora,
Hay un espacio muestral. Para la variable aleatoria binomial este es:
S 0, 1, 2, 3, . . . ,n}
.
Hay una asignacion de probabilidad basica. En el modelo binomial las probabilidades basicas se
calculan con una Iormula que veremos en un momento mas.
Hay problemas muy sencillos, o problemas compuestos, incluso hay problemas complicados. (Un
problema con el modelo binomial podria involucrar probabilidades condicionales!).
La probabilidad la calculamos con una Iormula que debe Ud. consultar en un libro.
En el pizarron explicamos como se hace esta cuenta. Tenga en consideracion que hay
calculadoras que Iacilitan el calculo de esta probabilidad. Si la suya hace esto, aprenda como lo
hace!
Como un ejemplo de la cuenta involucrada, vamos a calcular la probabilidad que se pide en el
Ejemplo A.
En ese ejemplo n 20, p 0.20. Se nos pide calcular P (X 4).
Haciendo las cuentas debe obtener: 0.2182.
En ese mismo ejemplo:
El valor esperado es 4.0
93
La desviacion estandar es 1.79.

Otro ejemplo de mas cuidado es el B.
En este ejemplo n 14, p 0.03 y se nos pide P(X ~ 3). Para calcularla es mejor hacer: P (X_ 3)
y restarla de 1.
P(X _ 3) P(X 0) P(X 1) P(X 2) P(X 3)
VeriIique que las cuentas dan P(X _ 3) 0.9628. Y la respuesta a la pregunta es P(X ~ 3)
0.0372
En nuestro ejemplo:
1 22 . 1
49
60
7
4
.
7
3
. 5
14 , 2
7
15
7
3
. 5
= = = =
= = =


Ejercicios:

1. Un equipo A tiene 1/3 de probabilidad de ganar cuando juega. Si A juega 4 partidos,
Determine:
a) Probabilidad de que gane 2 partidos.
b) Probabilidad de que gane por lo menos 1 partido.
c) Numero mas probable de partidos que puede ganar A.

Solucin.

X numero de partidos ganados
X B (n, p) ; X B (4, 1/3).

a) P(X 2) 0, 2963.
b) P(X 1) 1 P(X 1) 1 P (0) 1 0, 1975.
c) Moda P(x) es Maximo ; como P (1) es Mediana Moda es 1 juego, que es el
numero mas probable de juegos ganados.
d) E(x) n. p 4 x 1/3 4/3.
e) V(x) n.p.q 4 x 1/3 x 2/3 8/9.





94

Distribucin de Poisson.
La distribucion de Poisson es otra Iuncion de distribucion de probabilidad que tiene muchas
aplicaciones practicas importantes. Un proceso Poisson no solo representa numerosos Ienomenos
discretos, sino que el modelo Poisson tambien se usa para proporcionar aproximaciones a la
distribucion binomial.
Se dice que un proceso de Poisson existe si podemos observar eventos discretos en un area de
oportunidad, un intervalo continuo, de tal manera que si acotamos el area de oportunidad o
intervalo de manera suIiciente:
La probabilidad de observar exactamente un exito en el intervalo es estable.
La probabilidad de observar exactamente mas de un exito en el intervalo es cero.
La ocurrencia de un exito en cualquier intervalo es estadisticamente independiente de aquella en
cualquier otro intervalo.

Caractersticas
Forma. Cada vez que se especiIica el parametro , puede generarse una distribucion de
probabilidad de Poisson especiIica. Una distribucion de Poisson estara sesgada a la derecha
cuando es pequea, y se aproximara a la simetria al crecer.
La media y la desviacion estandar. Una propiedad de esta distribucion es que la media y la
varianza son iguales al parametro .
Uso de la distribucion de Poisson para aproximar la distribucion binomial
Para aquellas situaciones en las que n es grande (mayor o igual a 20) y p es muy pequea (menor
a 0.05, la distribucion de Poisson puede usarse para aproximar la distribucion binomial.
La variable aleatoria de Poisson puede variar teoricamente de 0 a . Sin embargo, cuando se usa
como una aproximacion a la distribucion binomial, la variable aleatoria de Poisson, el numero de
exitos de n observaciones, claramente no puede exceder el tamao de la muestra n.
Caracteristicas
n * p

Ejercicio:
Supongase que 220 errores estan distribuidos al azar a lo largo de 200 paginas, hallar la
probabilidad de que una pagina dada contenga:
a) Ningun error.
b) Mas de 2 errores.
c) Cual es la probabilidad de hallar un error en dos paginas

Solucin
95

X Numero de errores por pagina

X. Poisson con
pag
err
paginas
errores
1 , 1
200
220
=
a) P(X 0) 0.3329.
b) P(X ~ 2)

=
= + + + + =
3
0995 , 0 ........ ) 6 ( ) 5 ( ) 4 ( ) 3 ( ) (
x
P P P P x p
c) Y Numero de errores en 2 paginas ; Y. Poisson con 2 x 1,1 2,2 P(Y 1)
0,2438.

DISTRIBUCION GEOMETRICA
En estadistica la distribucin geomtrica es una distribucion de probabilidad cuya Iuncion de
densidad para valores discretos x 1,2,.. es
1
) 1 ( ) (

= =
X
p p x X P
Su Iuncion de distribucion es

X
p x X P = ) (
El parametro p (la probabilidad de exito de un experimento) Iija la media estadistica
p
X E
1
) ( = y la varianza
2
) 1 (
) (
p
p
X J

= .
Ejemplo
El numero de tirar una ciIra determinada con un dado X veces seguidas es una distribucion
geometrica con el parametro.
6
1
= p













96

DISTRIBUCIONES DE PROBABILIDADES CONTINUAS

Distribucion Normal (gaussiana)
Distribucion Gamma
Distribucion Exponencial
Distribucion Chi-cuadrada
Distribucion T de Student
Distribucion Beta
Distribucion Weibull
Distribucion F de Snedecor

DISTRIBUCIN NORMAL

Esta distribucion es Irecuentemente utilizada en las aplicaciones estadisticas. Su propio nombre
indica su extendida utilizacion, justiIicada por la Irecuencia o normalidad con la que ciertos
Ienomenos tienden a parecerse en su comportamiento a esta distribucion.
Muchas variables aleatorias continuas presentan una Iuncion de densidad cuya graIica tiene
Iorma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n, p), para un mismo valor de
p y valores de n cada vez mayores, se ve que sus poligonos de Irecuencias se aproximan a una
curva en "Iorma de campana".
En resumen, la importancia de la distribucion normal se debe principalmente a que hay muchas
variables asociadas a Ienomenos naturales que siguen el modelo de la normal
Caracteres morIologicos de individuos (personas, animales, plantas,...) de una especie, p.ejm.
Tallas, pesos, envergaduras, diametros, perimetros,...
Caracteres Iisiologicos, por ejemplo: eIecto de una misma dosis de un Iarmaco, o de una misma
cantidad de abono.
Caracteres sociologicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.
Caracteres psicologicos, por ejemplo: cociente intelectual, grado de adaptacion a un medio,...
Errores cometidos al medir ciertas magnitudes.
Valores estadisticos muestrales, por ejemplo: la media.
Otras distribuciones como la binomial o la de Poisson son aproximaciones normales,...
Y en general cualquier caracteristica que se obtenga como suma de muchos Iactores.
97

FUNCIN DE DENSIDAD
Empleando calculos bastante laboriosos, puede demostrarse que el modelo de la Iuncion de
densidad que corresponde a tales distribuciones viene dado por la Iormula


Representacion graIica de esta Iuncion de densidad


La distribucion normal queda deIinida por dos parametros, su media y su desviacion tipica y la
representamos asi:

normales ones distribuci de familia una representa N resion la to
por a dist densidad de funcion una tendremos v de valor cada Para N
) , ( exp tan
, int ), , (



FUNCIN DE DISTRIBUCIN o FUNCION DENSIDAD

Puede tomar cualquier valor (- , )
Son mas probables los valores cercanos a uno central que llamamos media
ConIorme nos separamos de ese valor , la probabilidad va decreciendo de igual Iorma a
derecha e izquierda (es simetrica).
98
ConIorme nos separamos de ese valor , la probabilidad va decreciendo de Iorma mas o menos
rapida dependiendo de un parametro , que es la desviacion tipica.



F(x) es el area sombreada de esta graIica


TIPIFICACIN

Para simpliIicar los calculos se sigue un proceso que consiste en obtener a partir de una N (,)
una N (0,1) (Normal estandar o TipiIicada) de media 0 y desviacion tipica 1. De ese modo la
probabilidad desde - hasta 0 es de 0,5.

La Iorma de hacerlo es la siguiente:

Si tenemos una v.a X, N (,), la variable

Z =
X

sera una N (0,1). Y asi:


) ( ) ( ) (

=
K
Z P
K X
P k X P , siendo Z una N (0,1).

Por tanto el proceso que se sigue en un problema con una N (,), es primero tipiIicar la
variable

Z =
X

sera una N (0,1), es decir 0 y o 1, para luego calcular el valor con la


ayuda de la tabla:
Por tanto su Iuncion de densidad es

y su Iuncion de distribucion es

Siendo la representacion graIica de esta Iuncion
99


a la variable Z se la denomina variable tipiIicada de X, y a la curva de su Iuncion de densidad
curva normal tipiIicada.

Ejemplo:
X, N (3,5) 7881 , 0 ) 8 , 0 ( )
5
3 7
( )
5
3 7
5
3
( ) 7 ( = =

= Z P Z P
X
P X P

Caracterstica de la distribucin normal tipificada (reducida, estndar)
No depende de ningun parametro
Su media es 0, su varianza es 1 y su desviacion tipica es 1.
La curva f(x) es simetrica respecto del eje OY
Tiene un maximo en este eje
Tiene dos puntos de inIlexion en z 1 y z -1
Uso de las tablas de una N (0,1).
Existen varios tipos de tablas, pero en todas, como la normal es simetrica respecto al 0:

< =
= =
=
) ( ) ( ) (
) ( 1 ) ( ) (
) ( 1 ) (
k Z P q Z P q Z k P
k Z P k Z P k Z P
k Z P k Z P


Las dos tablas Iundamentales de una N (0,1) se diIerencian en que mientras que una nos
da la P (Z k), la otra nos da solo la P (0 Z k) (por tanto habra que aadir a la probabilidad
observada en la tabla 0,5: P (Z k) 0,5resultado de la tabla).
En ambos casos, la tabla representa las unidades y decimas del valor en la columna
vertical, y las centesimas en la Iila horizontal.
100

Aproximacin de la Binomial por la Normal (Teorema de De Moivre):
Demostro que bajo determinadas condiciones (para n grande y tanto p como q no esten proximos
a cero) la distribucion Binomial B(n, p) se puede aproximar mediante una distribucion normal
) 01 ( tan , ( N es
npq
np X
Z to por npq np N

=
Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto mas proximo sea p a 0.5,
tanto mejor sera la aproximacion realizada. Es decir, basta con que se veriIique
np _5 y nq _5
Gracias a esta aproximacion es Iacil hallar probabilidades binomiales, que para valores grandes
de n resulten muy laboriosos de calcular.
Hay que tener en cuenta que para realizar correctamente esta transIormacion de una variable
discreta (binomial) en una variable continua (normal) es necesario hacer una correccion de
continuidad.





101



MANE1O DE TABLAS. CASOS MS FRECUENTES.
La distribucion de la variable Z se encuentra tabulada



102





DISTRIBUCION PROBABILIDAD GAMA.
Los tiempos que tardan en revisar un motor de un automovil o avion tienen una distribucion de
Irecuencias sesgadas. Las poblaciones asociadas a estas variables aleatorias Irecuentemente
tienen distribuciones que se pueden modelar adecuadamente por la Iuncion de densidad tipo
gamma.
Funcion de densidad de probabilidad para una variable aleatoria tipo gamma:
> v 0 ; 0 ,
0
) (
) (
/ 1

v
e v
v f

=

103
En donde:


0
1
) ( dv e v
v

La cantidad de la de la Iuncion alIa se conoce como la Iuncion gamma. La integracion directa nos
da que la Iuncion uno igual a uno. La integracion por partes nos da que la Iuncion de alIa menos
uno alIa menos uno por la Iuncion alIa menos uno para cualquier intervalo de alIa mayor o igual
a uno y que la Iuncion de n sea igual a n menos uno Iactorial, para un numero entero n.
En el caso especial cuando alIa es un numero entero, se puede expresar la Iuncion de distribucion
de una variable aleatoria tipo gamma como una suma de ciertas variables aleatorias de Poisson.
Si alIa no es un numero entero, es imposible encontrar la antiderivada del integrando de la
expresion:
< < < d c 0
Donde:
dv
e v d
c
v


) (
/ 1




Y por lo tanto es importante obtener las areas bajo la Iuncion de densidad tipo gamma mediante
integracion directa.
Hay dos casos especiales de las variables aleatorias tipo gamma que merece consideracion
particular:
Una variable aleatoria tipo gamma que tiene una Iuncion de densidad con parametros alIa igual a
v entre dos y beta igual a dos se denomina variable aleatoria ji - cuadrada.
Ji - cuadrada se presenta con Irecuencia en la teoria de la estadistica. El parametro v se denomina
numero de grados de libertad asociado a la variable aleatoria ji - cuadrada.
La Iuncion de densidad gamma para el caso especial v 1 se denomina Iuncion de densidad
exponencial.

< > v 0 ; 0
0
1
) (
/

v
e v f

=

En cualquier punto.
La Iuncion de densidad exponencial muchas veces es util en los modelos de duracion de
componentes electricos.
Un Iusible es un ejemplo de un componente para el cual este supuesto suele cumplirse.

104
DISTRIBUCIN EXPONENCIAL
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribucion
exponencial. Se usa para la planeacion del tiempo entre dos sucesos.
Esta distribucion se puede usar en diversos casos tales como:, el tiempo que tardara una maquina
de cajero automatico en entregar eIectivo. Esta Iuncion puede usarse para determinar la
probabilidad de que el proceso tarde como maximo un minuto.
La ecuacion de la distribucion exponencial es:

( )
x
e x f



= ;
Distribucion acumulada:
( )
x
e x F


=1 ; .
Siendo el valor del parametro y x el valor de la Iuncion.

DISTRIBUCION DE PROBABILIDAD CUADRADA I
Considerando nuevamente las muestras aleatorias independientes de distribuciones normales,
sabemos que : ( ) ( )
2
2
2
2 2
2
2
2
1
2
1 1
2
1
/ 1 / 1 S n v S n = =
Tienen distribuciones
2
independientes con
( ) ( ) 1 1
2 2 1 1
= = n vv n v
Grados de libertad, respectivamente.
Asi la deIinicion 7.3 implica que

( ) ( )
( ) ( )
2
2
2
2
2
1
2
1
2
2
2
2
2 2
1
2
1
2
1 1
2
2
2
1
2
1
/
/
1 / 1
1 / 1
/
/

S
S
n S n
n S n
v
v
F =


= =
Tiene una distribucion F con ( ) 1
1
n grados de libertad del numerador y ( ) 1
2
n grados de
libertad del denominador.
En al Iigura Siguiente se muestra la graIica de una tipica Iuncion de densidad F . Los valores de

F tales que ( )

= > F F P se dan en las tablas de la distribucion F, para los valores de


, 100 , 0 = 0,050, 0,025, 0,010 y 0,005. En esas tablas, los encabezados de las columnas
corresponden a los grados de libertad del numerador, en tanto que los grados de libertad del
denominador se encuentran como los encabezados principales de los renglones.
Frente a los grados de libertad del denominador (los encabezados de los renglones), se encuentran
los valores de = 0,100, 0,050, 0,025, 0,010 y 0,005. Por ejemplo, si la variable F estudiada
tiene 5 grados de libertad del numerador y 7 grados de libertad del denominador, F
0.100
2.88,
F
0.050
3.97, F
0.025
5.29, F
0.010
7,46 y F
0.005
9.52. Luego la probabilidad de que una
variable aleatoria con una distribucion F con 5 grados de libertad del numerador y 7 grados de
libertad del denominador exceda de 7.46 es 0,01. Lo correspondiente se aIirma para los demas
casos.

105
( ) u f
Una tipica Iuncion de densidad
De probabilidad F

F
u
DISTRIBUCION "t DE STUDENT"

Supongase que se toma una muestra de una poblacion normal con media y varianza
2
Si x es
el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribucion
n
x
:


= es una distribucion normal estandar. Supongase que la varianza de la poblacion o es
desconocida. Que sucede con la distribucion de esta estadistica si se reemplaza o por s? La
distribucion t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucion t son 0 y para ~2, respectivamente.
La siguiente Iigura presenta la graIica de varias distribuciones t. La apariencia general de la
distribucion t es similar a la de la distribucion normal estandar: ambas son simetricas y
unimodales, y el valor maximo de la ordenada se alcanza en la media 0 Sin embargo, la
distribucion t tiene colas mas amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribucion normal. A medida que el numero de grados de libertad tiende a
inIinito, la Iorma limite de la distribucion t es la distribucion normal estandar.

Propiedades de las distribuciones t
Cada curva t tiene Iorma de campana con centro en 0.
Cada curva t, esta mas dispersa que la curva normal estandar z.
A medida que aumenta, la dispersion de la curva t correspondiente disminuye.
A medida que , la secuencia de curvas t se aproxima a la curva normal estandar, por lo
que la curva z recibe a veces el nombre de curva t con gl
La distribucion de la variable aleatoria t esta dada por:
106

Esta se conoce como la distribucion t con grados de libertad.
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes que son todas normales con media y
desviacion estandar o. Entonces la variable aleatoria
n
s
x
t

= tiene una distribucion t
con n-1 grados de libertad.
La distribucion de probabilidad de t se publico por primera vez en 1908 en un articulo de W. S.
Gosset. En esa epoca, Gosset era empleado de una cerveceria irlandesa que desaprobaba la
publicacion de investigaciones de sus empleados. Para evadir esta prohibicion, publico su trabajo
en secreto bajo el nombre de "Student". En consecuencia, la distribucion t normalmente se llama
distribucion t de Student, o simplemente distribucion t. Para derivar la ecuacion de esta
distribucion, Gosset supone que las muestras se seleccionan de una poblacion normal. Aunque
esto pareceria una suposicion muy restrictiva, se puede mostrar que las poblaciones no normales
que poseen distribuciones en Iorma casi de campana aun proporcionan valores de t que se
aproximan muy de cerca a la distribucion t.
La distribucion t diIiere de la de Z en que la varianza de t depende del tamao de la muestra y
siempre es mayor a uno. Unicamente cuando el tamao de la muestra tiende a inIinito las dos
distribuciones seran las mismas.
Se acostumbra representar con

t el valor t por arriba del cual se encuentra un area igual a u.


Como la distribucion t es simetrica alrededor de una media de cero, tenemos

t t =
1
; es decir,
el valor t que deja un area de 1-u a la derecha y por tanto un area de u a la izquierda, es igual al
valor t negativo que deja un area de u en la cola derecha de la distribucion. Esto es, t
0.95
-t
0.05
,
t
0.99
-t
0.01
, etc.
Ejemplo:
El valor t con 14 grados de libertad que deja un area de 0.025 a la izquierda, y por tanto un
area de 0.975 a la derecha, es
t
0.975
-t
0.025
-2.145

Si se observa la tabla, el area sombreada de la curva es de la cola derecha, es por esto que se tiene
que hacer la resta de 1-u. La manera de encontrar el valor de t es buscar el valor de u en el primer
renglon de la tabla y luego buscar los grados de libertad en la primer columna y donde se
107
intercepten u y se obtendra el valor de t.
Ejemplo:
Encuentre la probabilidad de t
0.025
t t
0.05.
Solucin:

Como t
0.05
deja un area de 0.05 a la derecha, y t
0.025
deja un area de 0.025 a la izquierda,
encontramos un area total de 1-0.05-0.025 0.925.
P (t
0.025
t t
0.05
) 0.925
Ejemplo:
Encuentre k tal que P (k t -1.761) 0.045, para una muestra aleatoria de tamao 15 que se
selecciona de una distribucion normal.
Solucin:

Si se busca en la tabla el valor de t 1.761 con 14 grados de libertad nos damos cuenta que a este
valor le corresponde un area de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta
0.05 y 0.045 se tiene un valor de 0.005, que equivale a u Luego se busca el valor de 0.005 en el
primer renglon con 14 grados de libertad y se obtiene un valor de t 2.977, pero como el valor de
u esta en el extremo izquierdo de la curva entonces la respuesta es t -2.977 por lo tanto:
P (-2.977 t -1.761) 0.045

Ejemplo:

Un ingeniero quimico aIirma que el rendimiento medio de la poblacion de cierto proceso en lotes
es 500 gramos por milimetro de materia prima. Para veriIicar esta aIirmacion toma una muestra
de 25 lotes cada mes. Si el valor de t calculado cae entre t
0.05
y t
0.05
, queda satisIecho con su
aIirmacion. Que conclusion extraeria de una muestra que tiene una media de 518 gramos por
milimetro y una desviacion estandar de 40 gramos? Suponga que la distribucion de rendimientos
es aproximadamente normal.
108
Solucin.

De la tabla encontramos que t
0.05
para 24 grados de libertad es de 1.711. Por tanto, el Iabricante
queda satisIecho con esta aIirmacion si una muestra de 25 lotes rinde un valor t entre 1.711 y
1.711.
Se procede a calcular el valor de t:
25 , 2
25
40
500 518
=

=
n
s
x
t


Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor
de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de
0.02. De aqui que es probable que el Iabricante concluya que el proceso produce un mejor
producto del que piensa.


LA DISTRIBUCION DE PROBABILIDAD BETA.

La distribucion de probabilidad beta es una Iuncion de densidad con dos parametros deIinida en
el intervalo cerrado 0 y 1. Se utiliza Irecuentemente como modelo para Iracciones, tal
como la proporcion de impurezas en un producto quimico o la Iraccion de tiempo que una
maquina esta en reparacion.
Funcion de densidad probabilidad:
1 0 ; 0 , > v
) , (
) 1 (
) (
1 1


B
v v
v f

=
En cualquier otro punto donde

+
= =

) (
) ( ) (
) 1 ( ) , (
1 1




dv v v B
Notese que la deIinicion de (y) sobre el intervalo 0_ y _ 1 restringe su aplicacion. Si c_ y _ d, y
(y- c) / (d- c) deIinira una nueva variable en el intervalo 0_ y _ 1. Asi la Iuncion de densidad beta
se puede aplicar a una variable aleatoria deIinida en el intervalo c_ y _ d mediante una traslacion
y una medicion en la escala.
La Iuncion de distribucion acumulativa para la variable aleatoria beta se llama comunmente
Iuncion beta y esta dada por:
) , (
) , (
) 1 (
) (
0
1 1



v
v
I dt
B
t t
v F =



Para valores enteros de alIa y beta, Iy (alIa, beta) esta relacionada con la Iuncion de probabilidad
109
binomial. Cuando y p, se puede demostrar que:

=
n
v
v n v
p p dv
B
v v
p F



) 1 (
) , (
) 1 (
) (
1 1

En donde 0 p 1 y n igual a alIa mas beta menos uno.

DISTRIBUCIN WEIBULL

Devuelve la probabilidad de una variable aleatoria siguiendo una distribucion de Weibull.
Esta distribucion se aplica en los analisis de Iiabilidad, para establecer, por ejemplo, el periodo de
vida de un componente hasta que presenta una Ialla.
La ecuacion para la Iuncion de distribucion acumulada de Weibull es:

( )
( )


x
e x F

=1 , ,
La Iuncion de densidad de probabilidad es:
( )
( )


x
e x x f

=
1
, , .
Cuando 1 la distribucion de Weibull devuelve la distribucion exponencial con:

1
= .
DISTRIBUCION DE PROBABILIDAD F

Supongase que deseamos comparar las varianzas de dos poblaciones normales basados en la
inIormacion contenida en muestras aleatorias independiente de las dos poblaciones. Supongase
que una muestra aleatoria contiene n
1
variables aleatorias distribuidas normalmente con una
varianza comun
2
1
y que la otra muestra aleatoria contiene
2
n variables aleatorias distribuidas
normalmente con una varianza comun
2
1
y que la otra muestra aleatoria contiene
2
n variables
aleatorias distribuidas normalmente con una varianza comun
2
1
. Si calculamos
2
1
S de las
observaciones en la muestra 1, entonces
2
1
S es una estimacion de
2
1
. De manera similar,
2
2
S
calculada a partir de las observaciones de la segunda muestra es una estimacion para
2
2
. Asi
intuitivamente podriamos pensar en utilizar
2
1
S /
2
2
S para hacer inIerencias con respecto a las
magnitudes relativas de
2
1
y
2
2
. Si dividimos cada
2
i
S por
2
i
, entonces la razon siguiente

=
2
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1
/
/
S
S
S
S


Tiene una distribucion F con ( )( ) 1 1
2 1
n n grados de libertad. La deIinicion general de una
110
distribucion F es como sigue:

DEFINICION Sean
2
1
y
2
2
variables aleatorias ji - cuadrada con
1
v y
2
v grados de
libertad. Respectivamente. Entonces si
2
1
y
2
2
son independientes,

2
2
2
1
2
1
/
/
v
v
F

=
Se dice que tiene una distribucion F con
1
v grados de libertad del numerador y
2
v grados de
libertad del denominador.
La Iuncion de densidad para variables aleatorias con la distribucion F es un miembro de la
Iamilia de las distribuciones beta. Omitimos la Iormula para la densidad de una variable aleatoria
con la distribucion F , pero el metodo para obtenerla se indica en los ejercicios al Iinal del
capitulo.

























111
TEORIA DEL MUESTREO

Uno de los propositos de la estadistica inIerencial es estimar las caracteristicas poblacionales
desconocidas, examinando la inIormacion obtenida de una muestra, de una poblacion. El punto
de interes es la muestra, la cual debe ser representativa de la poblacion objeto de estudio.
Se seguiran ciertos procedimientos de seleccion para asegurar de que las muestras reIlejen
observaciones a la poblacion de la que proceden, ya que solo se pueden hacer observaciones
probabilisticas sobre una poblacion cuando se usan muestras representativas de la misma.
Una poblacion esta Iormada por la totalidad de las observaciones en las cuales se tiene cierto
observa.
Una muestra es un subconjunto de observaciones seleccionadas de una poblacion.
Muestras Aleatorias
Cuando nos interesa estudiar las caracteristicas de poblaciones grandes, se utilizan muestras por
muchas razones; una enumeracion completa de la poblacion, llamada censo, puede ser
economicamente imposible, o no se cuenta con el tiempo suIiciente.
A continuacion se vera algunos usos del muestreo en diversos campos:
Politica. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la
opinion publica y el apoyo en las elecciones.
Educacion. Las muestras de las caliIicaciones de los examenes de estudiantes se usan para
determinar la eIiciencia de una tecnica o programa de enseanza.
Industria. Muestras de los productos de una linea de ensamble sirve para controlar la calidad.
Medicina. Muestras de medidas de azucar en la sangre de pacientes diabeticos prueban la eIicacia
de una tecnica o de un Iarmaco nuevo.
Agricultura. Las muestras del maiz cosechado en una parcela proyectan en la produccion los
eIectos de un Iertilizante nuevo.
Gobierno. Una muestra de opiniones de los votantes se usaria para determinar los criterios del
publico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadisticos para estimar valores poblacionales, o
parametros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral.
El error muestral se reIiere a la variacion natural existente entre muestras tomadas de la misma
poblacion.
Cuando una muestra no es una copia exacta de la poblacion; aun si se ha tenido gran cuidado para
asegurar que dos muestras del mismo tamao sean representativas de una cierta poblacion, no
esperariamos que las dos sean identicas en todos sus detalles. El error muestral es un concepto
importante que ayudara a entender mejor la naturaleza de la estadistica inIerencial.
Los errores que surgen al tomar las muestras no pueden clasiIicarse como errores muestrales y se
112
denominan errores no muestrales.
El Sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se reIiere a una
tendencia sistematica inherente a un metodo de muestreo que da estimaciones de un parametro
que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parametro
real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacion.
La aleatorizacion se reIiere a cualquier proceso de seleccion de una muestra de la poblacion en el
que la seleccion es imparcial o no esta sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.
Los tipos mas comunes de tecnicas de muestreo aleatorios son el muestreo aleatorio simple, el
muestreo estratiIicado, el muestreo por conglomerados y el muestreo sistematico.
Si una muestra aleatoria se elige de tal Iorma que todos los elementos de la poblacion tengan la
misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Ejemplos
1. Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadistica de 20 alumnos.
20
C
5
da el numero total de Iormas de elegir una muestra no ordenada y
este resultado es 15,504 maneras diIerentes de tomar la muestra. Si listamos las 15,504 en trozos
separados de papel, una tarea tremenda, luego los colocamos en un recipiente y despues los
revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de
papel con cinco nombres. Un procedimiento mas simple para elegir una muestra aleatoria seria
escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y despues extraer cinco papeles al mismo tiempo.
Otro metodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una
tabla de numeros aleatorios. Se puede construir la tabla usando una calculadora o una
computadora. Tambien se puede prescindir de estas y hacer la tabla escribiendo diez digitos del 0
al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ahi, la primera tira
seleccionada determina el primer numero de la tabla, se regresa al recipiente y despues de
revolver otra vez se selecciona la seguida tira que determina el segundo numero de la tabla; el
proceso continua hasta obtener una tabla de digitos aleatorios con tantos numeros como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco practico, imposible o
no deseado; aunque seria deseable usar muestras aleatorias simples para las encuestas nacionales
de opinion sobre productos o sobre elecciones presidenciales, seria muy costoso o tardado.
El muestreo estratiIicado requiere de separar a la poblacion segun grupos que no se traslapen
llamados estratos, y de elegir despues una muestra aleatoria simple en cada estrato. La
inIormacion de las muestras aleatorias simples de cada estrato constituiria entonces una muestra
global.
113

2. Suponga que nos interesa obtener una muestra de las opiniones de los proIesores de una gran
universidad. Puede ser diIicil obtener una muestra con todos los proIesores, asi que supongamos
que elegimos una muestra aleatoria de cada colegio, o departamento academico; los estratos
vendrian a ser los colegios, o departamentos academicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades
heterogeneas entre si de la poblacion llamadas conglomerados. Cada elemento de la poblacion
pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son
usualmente heterogeneos o disimiles.

3. Suponga que una compaia de servicio de television por cable esta pensando en abrir una
sucursal en una ciudad grande; la compaia planea realizar un estudio para determinar el
porcentaje de Iamilias que utilizarian sus servicios, como no es practico preguntar en cada casa,
la empresa decide seleccionar una parte de la ciudad al azar, la cual Iorma un conglomerado.
En el muestreo por conglomerados, estos se Iorman para representar, tan Iielmente como sea
posible, a toda la poblacion; entonces se usa una muestra aleatoria simple de conglomerados para
estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se
realizan, generalmente, con base en el muestreo por conglomerados.
El muestreo sistematico es una tecnica de muestreo que requiere de una seleccion aleatoria inicial
de observaciones seguida de otra seleccion de observaciones obtenida usando algun sistema o
regla.

4. Para obtener una muestra de suscriptores teleIonicos en una ciudad grande, puede obtenerse
primero una muestra aleatoria de los numeros de las paginas del directorio teleIonico; al elegir el
vigesimo nombre de cada pagina obtendriamos un muestreo sistematico, tambien podemos
escoger un nombre de la primera pagina del directorio y despues seleccionar cada nombre del
lugar numero cien a partir del ya seleccionado. Por ejemplo, podriamos seleccionar un numero al
azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los
nombres del directorio que corresponden a los numeros 40, 140, 240, 340 y asi sucesivamente.
Error Muestral
Cualquier medida conlleva algun error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algun error. Por ejemplo,
supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una poblacion con media
15: si la media de la muestra es x 12, entonces a la diIerencia observada x - -3 se le
denomina el error muestral. Una media muestral x puede pensarse como la suma de dos
cantidades, la media poblacional y el error muestral; si e denota el error muestral, entonces:
e X + =
114

5. Se toman muestras de tamao 2 de una poblacion consistente en tres valores, 2, 4 y 6, para
simular una poblacion "grande" de manera que el muestreo pueda realizarse un gran numero de
veces, supondremos que este se hace con reemplazo, es decir, el numero elegido se reemplaza
antes de seleccionar el siguiente, ademas, se seleccionan muestras ordenadas. En una muestra
ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra
ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se selecciono primero
4 y despues 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamao 2
que es posible seleccionar con reemplazo y tambien contiene las medias muestrales y los
correspondientes errores muestrales. La media poblacional es igual a: (246)/3 4. Ver la
tabla en la siguiente pagina.
Notese las interesantes relaciones siguientes contenidas en la tabla:
La media de la coleccion de medias muestrales es 4, la media de la poblacion de la que se extraen
las muestras. Si
X
denota la media de todas las medias muestrales entonces tenemos:
X
(343455246)/9 4
La suma de los errores muestrales es cero.
e
1
e
2
e
3
. . . e
9
(-2) (-1) 0 (-1) 0 1 0 1 2 0
Muestras ordenadas X Error muestral e x -
(2,2) 2 2 4 -2
(2,4) 3 3 4 -1
(2,6) 4 4 4 0
(4,2) 3 3 4 -1
(4,4) 4 4 4 0
(4,6) 5 5 4 1
(6,2) 4 4 4 0
(6,4) 5 5 4 1
(6,6) 6 6 4 2
En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de todos
los errores muestrales es cero.

115
Distribuciones Muestrales
Las muestras aleatorias obtenidas de una poblacion son, por naturaleza propia, impredecibles. No
se esperaria que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacion
tenga la misma media muestral o que sean completamente parecidas; puede esperarse que
cualquier estadistico, como la media muestral, calculado a partir de las medias en una muestra
aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucion de
todos los valores posibles de un estadistico. Tales distribuciones seran muy importantes en el
estudio de la estadistica inIerencial, porque las inIerencias sobre las poblaciones se haran usando
estadisticas muestrales. Como el analisis de las distribuciones asociadas con los estadisticos
muestrales, podremos juzgar la conIiabilidad de un estadistico muestral como un instrumento
para hacer inIerencias sobre un parametro poblacional desconocido.
Como los valores de un estadistico, tal como x, varian de una muestra aleatoria a otra, se le puede
considerar como una variable aleatoria con su correspondiente distribucion de Irecuencias.
La distribucion de Irecuencia de un estadistico muestral se denomina distribucion muestral. En
general, la distribucion muestral de un estadistico es la de todos sus valores posibles calculados a
partir de muestras del mismo tamao.
Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacion grande. Se
calcula la madia muestral x para cada muestra; la coleccion de todas estas medias muestrales
recibe el nombre de distribucion muestral de medias, lo que se puede ilustrar en la siguiente
Iigura:

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacion grande, y se calcula la
desviacion estandar de cada una. La coleccion de todas estas desviaciones estandar muestrales se
llama distribucion muestral de la desviacion estandar, y lo podemos ver en la siguiente Iigura:
116



Ejemplo
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacion de valores 0, 2, 4 y 6.
Encuentre:
, la media poblacional.
o, la desviacion estandar poblacional.
X
,

la media de la distribucion muestral de medias.
, X

la desviacion estandar de la distribucion muestral de medias.
Ademas, graIique las Irecuencias para la poblacion y para la distribucion muestral de medias.

Solucin:
La media poblacional es:
3
4
6 4 2 0
=
+ + +
=

La desviacion estandar de la poblacion es:
2236
4
) 3 6 ( ) 3 4 ( ) 3 2 ( ) 3 0 (
2 2 2 2
=
+ + +
=
A continuacion se listan los elementos de la distribucion muestral de la media y la
correspondiente distribucion de Irecuencias.
117

La media de la distribucion muestral de medias es:
3
3
48
16
1 6 2 5 3 4 4 3 3 2 2 1 1 0
) (
= =
+ + + + + +
= =

f
fx
X

d) La desviacion estandar de la distribucion muestral de medias es:


=
f
f x
X
X
2
) (

58 . 1
16
1 ) 3 6 ( 2 ) 3 5 ( 3 ) 3 4 ( 4 ) 3 3 ( 3 ) 3 2 ( 2 ) 3 1 ( 1 ) 3 0 (
2 2 2 2 2 2 2
=
+ + + + + +
=
X

De aqui que podamos deducir que: 58 . 1


2
2236
= = =
n
X


Como para cualquier variable aleatoria, la distribucion Muestral de medias tiene una media o
valor esperado, una varianza y una desviacion estandar, se puede demostrar que la distribucion
muestral de medias tiene una media igual a la media poblacional. Esto es:
3 ) ( = = = x E
X


Distribuciones muestrales
Despues de haber realizado el ejercicio anterior se puede ver que una distribucion muestral se
genera extrayendo todas las posibles muestras del mismo tamao de la poblacion y calculandoles
a estas su estadistico.
Si la poblacion de la que se extraen las muestras es normal, la distribucion muestral de medias
sera normal sin importar el tamao de la muestra.
118

Si la poblacion de donde se extraen las muestras no es normal, entonces el tamao de la muestra
debe ser mayor o igual a 30, para que la distribucion muestral tenga una Iorma acampanada.
Mientras mayor sea el tamao de la muestra, mas cerca estara la distribucion muestral de ser
normal.
Para muchos propositos, la aproximacion normal se considera buena si se cumple n 30. La
Iorma de la distribucion Muestral de medias sea aproximadamente normal, aun en casos donde la
poblacion original es bimodal, es realmente notable.

Teorema del limite central
Si se seleccionan muestras aleatorias de n observaciones de una poblacion con media y
desviacion estandar o, entonces, cuando n es grande, la distribucion muestral de medias tendra
aproximadamente una distribucion normal con una media igual a y una desviacion estandar de
n

. La aproximacion sera cada vez mas exacta a medida de que n sea cada vez mayor.

Ejemplo
Para la distribucion Muestral de medias del ejercicio pasado, encuentre:
119
El error muestral de cada media
La media de los errores muestrales
La desviacion estandar de los errores muestrales.
Solucin:
En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:

Muestra X Error muestral, e x-
(0,0) 0 0 - 3 -3
(0,2) 1 1 - 3 -2
(0,4) 2 2 - 3 -1
(0,6) 3 3 3 0
(2,0) 1 1 3 -2
(2,2) 2 2 3 -1
(2,4) 3 3 3 0
(2,6) 4 4 3 1
(4,0) 2 2 3 -1
(4,2) 3 3 3 0
(4,4) 4 4 3 1
(4,6) 5 5 3 2
(6,0) 3 3 3 0
(6,2) 4 4 3 1
(6,4) 5 5 3 2
(6,6) 6 6 3 3
La media de los errores muestrales es
e
, es:
120
0
16
3 2 ..... 0 ) 1 ( ) 2 ( ) 3 (
=
+ + + + + +
=
e

La desviacion estandar de la distribucion de los errores muestrales o
e,
es entonces:
[ ]
58 . 1
16
1 ) 0 3 ( 2 ) 0 2 ( 3 ) 0 1 ( 4 ) 0 0 ( 3 ) 0 1 ( 2 ) 0 2 ( 1 ) 0 3 (
) (
2 2 2 2 2 2 2
2
=
+ + + + + +
=

=

N
f e
e
e



La desviacion estandar de la distribucion muestral de un estadistico se conoce como error
estandar del estadistico. Para el ejercicio anterior el error estandar de la media denotado por o
x
, es
1.58. Con esto se puede demostrar que si de una poblacion se eligen muestras de tamao n con
reemplazo, entonces el error estandar de la media es igual a la desviacion estandar de la
distribucion de los errores muestrales.
En general se tiene:
e x
=
Cuando las muestras se toman de una poblacion pequea y sin reemplazo, se puede usar la
Iormula siguiente para encontrar o
x
.

1

=
N
n N
n
x



Donde o es la desviacion estandar de la poblacion de donde se toman las muestras, n es el tamao
de la muestra y N el de la poblacion.
Como regla de calculo, si el muestreo se hace sin reemplazo y el tamao de la poblacion es al
menos 20 veces el tamao de la muestra (N 20), entonces se puede usar la Iormula.
El Iactor
1

N
n N
se denomina Iactor de correccion para una poblacion Iinita.
Ejemplo:
Suponga que la tabla siguiente muestra la antigedad en aos en el trabajo de tres maestros
universitarios de matematicas:
Maestro de matematicas Antigedad
A 6
B 4
C 2
Suponga ademas que se seleccionan muestras aleatorias de tamao 2 sin reemplazo. Calcule la
121
antigedad media para cada muestra, la media de la distribucion muestral y el error estandar, o la
desviacion estandar de la distribucion muestral.

Solucin.
Se pueden tener
3
C
2
3 muestras posibles. La tabla lista todas las muestras posibles de tamao 2,
con sus respectivas medias muestrales.
Muestras Antigedad Media Muestral
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
La media poblacional es: 4
3
6 4 2
=
+ +
=
La media de la distribucion muestral es: 4
3
3 4 5
=
+ +
=
x

La desviacion estandar de la poblacion es:

63 . 1
3
) 4 2 ( ) 4 4 ( ) 4 6 (
2 2 2
=
+ +
=
El error estandar o la desviacion estandar de la distribucion muestral es:

816 . 0
3
) 4 3 ( ) 4 4 ( ) 4 5 (
2 2 2
=
+ +
=
Si utilizamos la Iormula del error estandar sin el Iactor de correccion tendriamos que:
152 . 1
2
63 . 1
= = =
n
x


Por lo que observamos que este valor no es el verdadero. Agregando el Iactor de correccion
obtendremos el valor correcto:
816 . 0
1 3
2 3
2
63 . 1
1
=

=
N
n N
n
x



El diagrama de Ilujo resume las decisiones que deben tomarse cuando se calcula el valor del error
estandar:
122





















123
Distribucin Muestral de Medias

Si recordamos a la distribucion normal, esta es una distribucion continua, en Iorma de campana
en donde la media, la mediana y la moda tienen un mismo valor y es simetrica.
Con esta distribucion podiamos calcular la probabilidad de algun evento relacionado con la
variable aleatoria, mediante la siguiente Iormula:


=
x
:
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta
Iormula se pueden a hacer los calculos de probabilidad para cualquier ejercicio, utilizando la
tabla de la distribucion z.
Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de
una poblacion normal, la distribucion muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la Iormula de la distribucion normal con
x
= y
x
= , entonces la Iormula para calcular la probabilidad del comportamiento del
estadistico, en este caso la media de la muestra, quedaria de la siguiente manera:
n
x
:


=
y para poblaciones Iinitas y muestro con reemplazo:
1

=
N
n N
n
x
:


Ejemplo:
Una empresa electrica Iabrica Iocos que tienen una duracion que se distribuye aproximadamente
en Iorma normal, con media de 800 horas y desviacion estandar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 Iocos tenga una vida promedio de menos de 775
horas.
Solucin
. 5 . 2
16
40
800 775
=

= :
Este valor se busca en la tabla de :
124
0062 . 0 ) 5 . 2 ( ) 775 ( = = : P x P
La interpretacion seria que la probabilidad de que la media de la muestra de 16 Iocos sea menor a
775 horas es de 0.0062.

Ejemplo:
Las estaturas de 1000 estudiantes estan distribuidas aproximadamente en Iorma normal con una
media de 174.5 centimetros y una desviacion estandar de 6.9 centimetros. Si se extraen 200
muestras aleatorias de tamao 25 sin reemplazo de esta poblacion, determine:
El numero de las medias muestrales que caen entre 172.5 y 175.8 centimetros.
El numero de medias muestrales que caen por debajo de 172 centimetros.
Solucin.
Como se puede observar en este ejercicio se cuenta con una poblacion Iinita y un muestreo sin
reemplazo, por lo que se tendra que agregar el Iactor de correccion. Se procedera a calcular el
denominador de Z para solo sustituirlo en cada inciso.

36 . 1
1 1000
25 1000
25
9 . 6
1
=

N
n N
n



47 . 1
36 . 1
5 . 174 5 . 172
1
=

=
N
n N
n
x
:



96 . 0
36 . 1
5 . 174 8 . 175
=

= :
P (172.5_ x _ 175.8) 0.7607

(0.7607)(200)152 medias muestrales
83 . 1
36 . 1
5 . 174 1752
=

= :
P(x _ 172) 0.00336
125

(0.0336)(200) 7 medias muestrales

Distribucin Muestral de Proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcion de articulos deIectuosos o la proporcion de alumnos
reprobados en la muestra. La distribucion muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucion se genera de igual manera que la distribucion
muestral de medias, a excepcion de que al extraer las muestras de la poblacion se calcula el
estadistico proporcion (p x/n en donde "x" es el numero de exitos u observaciones de interes y
"n" el tamao de la muestra) en lugar del estadistico media.


Una poblacion binomial esta estrechamente relacionada con la distribucion muestral de
proporciones; una poblacion binomial es una coleccion de exitos y Iracasos, mientras que una
distribucion muestral de proporciones contiene las posibilidades o proporciones de todos los
numeros posibles de exitos en un experimento binomial, y como consecuencia de esta relacion,
las aIirmaciones probabilisticas reIerentes a la proporcion muestral pueden evaluarse usando la
aproximacion normal a la binomial, siempre que np _5 y n(1-p) _ 5. Cualquier evento se puede
convertir en una proporcion si se divide el numero obtenido entre el numero de intentos.
Generacion de la Distribucion Muestral de Proporciones

Ejemplo
1. Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 articulos deIectuosos. Se van a
126
seleccionar 5 articulos al azar de ese lote sin reemplazo. Genere la distribucion muestral de
proporciones para el numero de piezas deIectuosas.
Como se puede observar en este ejercicio la Proporcion de articulos deIectuosos de esta
poblacion es 4/121/3. Por lo que podemos decir que el 33 de las piezas de este lote estan
deIectuosas.
El numero posible de muestras de tamao 5 a extraer de una poblacion de 12 elementos es
12
C
5
792, las cuales se pueden desglosar de la siguiente manera:
Articulos
Buenos
Articulos Malos
Proporcion de
articulos
deIectuoso
Numero de
maneras en las que
se puede obtener
la muestra
1 4 4/50.8
8
C
1
*
4
C
4
8
2 3 3/50.6
8
C
2
*
4
C
3
112
3 2 2/50.4
8
C
3
*
4
C
2
336
4 1 1/50.2
8
C
4
*
4
C
1
280
5 0 0/50 8C5*4C056
Total 792
Para calcular la media de la distribucion muestral de proporciones se tendria que hacer la
sumatoria de la Irecuencia por el valor de la proporcion muestral y dividirla entre el numero total
de muestras. Esto es:
3333 . 0
3
1
792
) 56 0 ( ) 280 2 . 0 ( ) 336 4 . 0 ( ) 112 6 . 0 ( ) 8 8 . 0 (
= =
+ + + +
=
p

Como podemos observar la media de la distribucion muestral de proporciones es igual a la
Proporcion de la poblacion.

p
P
Tambien se puede calcular la desviacion estandar de la distribucion muestral de proporciones:
1681 . 0
792
56 )
3
1
0 ( 280 )
3
1
2 . 0 ( 336 )
3
1
4 . 0 ( 112 )
3
1
6 . 0 ( 8 )
3
1
8 . 0 (
2 2 2 2 2
=
+ + + +
=
p

La varianza de la distribucion binomial es o


2
npq, por lo que la varianza de la distribucion
muestral de proporciones es o
2
p
(pq)/n. Si se sustituyen los valores en esta Iormula tenemos
que:
127
2108 . 0
5
)
3
2
)(
3
1
(
= =
p
, este valor no coincide con el de 0.1681, ya que nos Ialta agregar el
Iactor de correccion para una poblacion Iinita y un muestreo sin reemplazo:
1681 . 0
1 12
5 12
5
)
3
2
)(
3
1
(
=

=
p

1

=
N
n N
n
Pq
p


La Iormula que se utilizara para el calculo de probabilidad en una distribucion muestral de
proporciones esta basada en la aproximacion de la distribucion normal a la binomial. Esta
Iormula nos servira para calcular la probabilidad del comportamiento de la proporcion en la
muestra.
n
Pq
P p
:

=
A esta Iormula se le puede agregar el Iactor de correccion de
1

N
n N
si se cumple con las
condiciones necesarias.
Ejercicios:

1. Se ha determinado que 60 de los estudiantes de una universidad grande Iuman cigarrillos. Se
toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporcion de la
muestra de la gente que Iuma cigarrillos sea menor que 0.55.
Solucin.
Este ejercicio se puede solucionar por dos metodos. El primero puede ser con la aproximacion de
la distribucion normal a la binomial y el segundo utilizando la Iormula de la distribucion muestral
de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n 800 estudiantes p 0.60 x (.55) (800) 440 estudiantes p (x_ 440) ?
Media np (800)(0.60) 480
128
92 . 2
) 4 . 0 )( 6 . 0 ( 800
480 5 . 439
=

=
npq
np x
:

p (x_ 440) 0.0017. Este valor signiIica que existe una probabilidad del 0.17 de que al extraer
una muestra de 800 estudiantes, menos de 440 Iuman cigarrillos.



Distribucion Muestral de Proporciones
Datos:
n 800 estudiantes P 0.60 p 0.55 p (p_ 0.55) ?


92 . 2
800
) 4 . 0 )( 6 . 0 (
60 . 0 549375 . 0
=

=
n
Pq
P p
:

Observe que este valor es igual al obtenido en el metodo de la aproximacion de la distribucion
normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad
de 0.0017. Tambien se debe de tomar en cuenta que el Iactor de correccion de 0.5 se esta
dividiendo entre el tamao de la muestra, ya que estamos hablando de una proporcion.
La interpretacion en esta solucion, estaria enIocada a la proporcion de la muestra, por lo que
diriamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad,
la proporcion de estudiantes que Iuman cigarrillos sea menor al 55 es del 0.17.


2. Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden
129
presentar una reaccion adversa a el, mas aun, se piensa que alrededor del 3 de los usuarios
tienen tal reaccion. Si una muestra aleatoria de 150 personas con malestar estomacal usa el
medicamento, encuentre la probabilidad de que la proporcion de la muestra de los usuarios que
realmente presentan una reaccion adversa, exceda el 4.
a. Resolverlo mediante la aproximacion de la normal a la binomial
b. Resolverlo con la distribucion muestral de proporciones
Aproximacion de la distribucion normal a la binomial:
Datos:
n 150 personas p 0.03 x (0.04) (150) 6 personas p(x~6) ?
Media np (150) (0.03) 4.5

96 . 0
) 97 . 0 )( 03 . 0 ( 150
5 . 4 5 . 6
=

=
npq
np x
:


p(x~6) 0.1685. Este valor signiIica que existe una probabilidad del 17 de que al extraer una
muestra de 150 personas, mas de 6 presentaran una reaccion adversa.

Distribucion Muestral de Proporciones
Datos:
n 150 personas P 0.03 P 0.04 P (p~0.04) ?


96 . 0
150
) 97 . 0 )( 03 . 0 (
03 . 0 0433 . 0
=

=
n
Pq
P p
:
130
Observe que este valor es igual al obtenido y la interpretacion es: existe una probabilidad del
17 de que al tomar una muestra de 150 personas se tenga una proporcion mayor de 0.04
presentando una reaccion adversa.
3. Se sabe que la verdadera proporcion de los componentes deIectuosos Iabricados por una Iirma
es de 4, y encuentre la probabilidad de que una muestra aleatoria de tamao 60 tenga:
Menos del 3 de los componentes deIectuosos.
Mas del 1 pero menos del 5 de partes deIectuosas.
Solucin.
Datos:
n 60 articulos P 0.04 p 0.03 p (p0.03) ?



073
60
) 96 . 0 )( 04 . 0 (
04 . 0 0216 . 0
=

=
n
Pq
P p
:

4. La probabilidad de que en una muestra de 60 articulos exista una proporcion menor de 0.03
articulos deIectuosos es de 0.2327.
Datos:
n 60 articulos P 0.04 P 0.01 y 0.05 P (0.01p0.05) ?


131
86 . 0
60
) 96 . 0 )( 04 . 0 (
04 . 0 0183 . 0
=

=
n
Pq
P p
: 06 . 0
60
) 96 . 0 )( 04 . 0 (
04 . 0 0416 . 0
=

=
n
Pq
P p
:

Problemas propuestos

1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente con
media de 2000 libras y una varianza de 25,000 lbs
2
. Si se selecciona una muestra aleatoria de 100
cuerdas; determine la probabilidad de que en esa muestra:
La resistencia media encontrada sea de por lo menos 1958 libras.
La resistencia media se mayor de 2080 libras.


2. Como parte de un proyecto general de mejoramiento de la calidad, un Iabricante textil decide
controlar el numero de imperIecciones encontradas en cada pieza de tela. Se estima que el
numero promedio de imperIecciones por cada pieza de tela es de 12, determine la probabilidad de
que en la proxima pieza de tela Iabricada se encuentren:
Entre 10 y 12 imperIecciones.
Menos de 9 y mas de 15 imperIecciones.

3. En una prueba de aptitud la puntuacion media de los estudiantes es de 72 puntos y la
desviacion estandar es de 8 puntos. Cual es la probabilidad de que dos grupos de estudiantes,
Iormados de 28 y 36 estudiantes, respectivamente, diIieran en su puntuacion media en:
3 o mas puntos.
6 o mas puntos.
Entre 2 y 5 puntos.

4. Un especialista en genetica ha detectado que el 26 de los hombres y el 24 de las mujeres de
cierta region del pais tiene un leve desorden sanguineo; si se toman muestras de 150 hombres y
150 mujeres, determine la probabilidad de que la diIerencia muestral de proporciones que tienen
ese leve desorden sanguineo sea de:
Menos de 0.035 a Iavor de los hombres.
Entre 0.01 y 0.04 a Iavor de los hombres.

5. Una urna contiene 80 bolas de las que 60 son rojas y 40 blancas. De un total de 50
muestras de 20 bolas cada una, sacadas de la urna con remplazamiento, en cuantas cabe esperar
Igual numero de bolas rojas y blancas?
12 bolas rojas y 8 blancas?
132
8 bolas rojas y 12 blancas?
10 o mas bolas blancas?

6. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media de 2.40 onzas y
desviacion estandar de 0.048 onzas. Si se extraen 300 muestras de tamao 36 de esta poblacion,
determinar la media esperada y la desviacion estandar de la distribucion muestral de medias si el
muestreo se hace:
Con remplazamiento
Sin remplazamiento

7. La vida media de una maquina para hacer pasta es de siete aos, con una desviacion estandar
de un ao. Suponga que las vidas de estas maquinas siguen aproximadamente una distribucion
normal, encuentre:
La probabilidad de que la vida media de una muestra aleatoria de 9 de estas maquinas caiga entre
6.4 y 7.2 aos.
El valor de la x
a la derecha del cual caeria el 15 de las medias calculadas de muestras aleatorias de tamao
nueve.

8. Se llevan a cabo dos experimentos independientes en lo que se comparan dos tipos diIerentes
de pintura. Se pintan 18 especimenes con el tipo A y en cada uno se registra el tiempo de secado
en horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estandar de la poblacion
son ambas 1.0. Suponga que el tiempo medio de secado es igual para los dos tipos de pintura.
Encuentre la probabilidad de que la diIerencia de medias en el tiempo de secado sea mayor a uno
a Iavor de la pintura A.

Respuestas a los problemas propuestos:

1. a) 0.9960 b) 0 2. a) 0.3221 b) 0.3122 3. a) 0.2150 b) 0.0064 c) 0.4504
4. a) 0.2227 b) 0.2848 5. a) 6 b) 9 c) 2 d) 12
6.a) 008 , 0 ; 4 , 22 = =
x x
6.b) 008 , 0 ; 4 , 22 que menor e ligerament
x x
= =
7. a) 0.6898 b) 7.35 8. 0.0013





133
ESTIMACION

El objetivo principal de la estadistica inIerencial es la estimacion, esto es que mediante el estudio
de una muestra de una poblacion se quiere generalizar las conclusiones al total de la misma.
Como vimos en la seccion anterior, los estadisticos varian mucho dentro de sus distribuciones
muestrales, y mientras menor sea el error estandar de un estadistico, mas cercanos seran unos de
otros sus valores.
Existen dos tipos de estimaciones para parametros; puntuales y por intervalo. Una estimacion
puntual es un unico valor estadistico y se usa para estimar un parametro. El estadistico usado se
denomina estimador.
Una estimacion por intervalo es un rango, generalmente de ancho Iinito, que se espera que
contenga el parametro.
Estimacin Puntual

La inIerencia estadistica esta casi siempre concentrada en obtener algun tipo de conclusion acerca
de uno o mas parametros (caracteristicas poblacionales). Para hacerlo, se requiere que un
investigador obtenga datos muestrales de cada una de las poblaciones en estudio. Entonces, las
conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales. Por
ejemplo, representamos con (parametro) el verdadero promedio de resistencia a la ruptura de
conexiones de alambres utilizados para unir obleas de semiconductores. Podria tomarse una
muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la
media muestral de la resistencia a la ruptura x se podia emplear para sacar una conclusion acerca
del valor de . De Iorma similar, si
2
es la varianza de la distribucion de resistencia a la ruptura,
el valor de la varianza muestral s
2
se podria utilizar para inIerir algo acerca de
2
.
Cuando se analizan conceptos generales y metodos de inIerencia es conveniente tener un simbolo
generico para el parametro de interes. Se utilizara la letra griega para este proposito. El objetivo
de la estimacion puntual es seleccionar solo un numero, basados en datos de la muestra, que
represente el valor mas razonable de .
Una muestra aleatoria de 3 baterias para calculadora podria presentar duraciones observadas en
horas de x
1
5.0, x
2
6.4 y x
3
5.9. El valor calculado de la duracion media muestral es x 5.77, y
es razonable considerar 5.77 como el valor mas adecuado de .
Una estimacion puntual de un parametro es un solo numero que se puede considerar como el
valor mas razonable de . La estimacion puntual se obtiene al seleccionar una estadistica
apropiada y calcular su valor a partir de datos de la muestra dada. La estadistica seleccionada se
llama estimador puntual de .
El simbolo
)
(theta sombrero) suele utilizarse para representar el estimador de y la estimacion
puntual resultante de una muestra dada. Entonces x =
)
se lee como "el estimador puntual de
134
es la media muestral x ". El enunciado "la estimacion puntual de es 5.77" se puede escribir en
Iorma abreviada 77 . 5 =
)
.

Ejemplo:
En el Iuturo habra cada vez mas interes en desarrollar aleaciones de Mg de bajo costo, para varios
procesos de Iundicion. En consecuencia, es importante contar con metodos practicos para
determinar varias propiedades mecanicas de esas aleaciones. Examine la siguiente muestra de
mediciones del modulo de elasticidad obtenidos de un proceso de Iundicion a presion:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la
varianza poblacional
2
. Un estimador natural es la varianza muestral:
251 . 0
1 8
) 0625 . 44 1 . 43 ( ..... ) 0625 . 44 9 . 43 ( ) 0625 . 44 2 . 44 (
1
) (
2 2 2
2
2 2
=

+ + +
=

= =

n
x x
S
i

)

En el mejor de los casos, se encontrara un estimador
)
para el cual
)
siempre. Sin embargo,

)
es una Iuncion de las X
i
muestrales, por lo que en si misma una variable aleatoria.

)
error de estimacion
Entonces el estimador preciso seria uno que produzca solo pequeas diIerencias de estimacion,
de modo que los valores estimados se acerquen al valor verdadero.

Propiedades de un Buen Estimador

Insesgado.- Se dice que un estimador puntual
)
es un estimador insesgado de si = ) (
)
E ,
para todo valor posible de . En otras palabras, un estimador insesgado es aquel para el cual la
media de la distribucion muestral es el parametro estimado. Si se usa la media muestral x para
estimar la media poblacional , se sabe que la =
x
, por lo tanto la media es un estimador
insesgado.

Eficiente o con varianza mnima.- Suponga que
)
1
y
)
2
son dos estimadores insesgados de .
Entonces, aun cuando la distribucion de cada estimador este centrada en el valor verdadero de ,
las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diIerentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza minima. El

)
resultante recibe el nombre de estimador insesgado con varianza minima (MVUE, minimum
variance unbiased estimator) de .
En otras palabras, la eIiciencia se reIiere al tamao de error estandar de la estadistica. Si
comparamos dos estadisticas de una muestra del mismo tamao y tratamos de decidir cual de
ellas es un estimador mas eIiciente, escogeriamos la estadistica que tuviera el menor error
135
estandar, o la menor desviacion estandar de la distribucion de muestreo.
Tiene sentido pensar que un estimador con un error estandar menor tendra una mayor
oportunidad de producir una estimacion mas cercana al parametro de poblacion que se esta
considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parametro solo que la
distribucion muestral de medias tiene una menor varianza, por lo que la media se convierte en un
estimador eIiciente e insesgado.

Coherencia.- Una estadistica es un estimador coherente de un parametro de poblacion, si al
aumentar el tamao de la muestra se tiene casi la certeza de que el valor de la estadistica se
aproxima bastante al valor del parametro de la poblacion. Si un estimador es coherente se vuelve
mas conIiable si tenemos tamaos de muestras mas grandes.

Suficiencia.- Un estimador es suIiciente si utiliza una cantidad de la inIormacion contenida de la
muestra que ningun otro estimador podria extraer inIormacion adicional de la muestra sobre el
parametro de la poblacion que se esta estimando.
Es decir se pretende que al extraer la muestra el estadistico calculado contenga toda la
inIormacion de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan
todos los datos. Cuando se calcula la mediana de una muestra solo se utiliza a un dato o a dos.
Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con esto se
deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la
varianza, desviacion estandar, etc.; se tendra un estimador suIiciente.







136
Estimacin por Intervalos

Un estimado puntual, por ser un solo numero, no proporciona por si mismo inIormacion alguna
sobre la precision y conIiabilidad de la estimacion. Por ejemplo, imagine que se usa el estadistico
x para calcular un estimado puntual de la resistencia real a la ruptura de toallas de papel de cierta
marca, y suponga que x 9322.7. Debido a la variabilidad de la muestra, nunca se tendra el caso
de que = x .El estimado puntual nada dice sobre lo cercano que esta de . Una alternativa para
reportar un solo valor del parametro que se este estimando es calcular e inIormar todo un
intervalo de valores Iactibles, un estimado de intervalo o intervalo de conIianza (IC).
Un intervalo de conIianza se calcula siempre seleccionando primero un nivel de conIianza, que es
una medida del grado de Iiabilidad en el intervalo. Un intervalo de conIianza con un nivel de
conIianza de 95 de la resistencia real promedio a la ruptura podria tener un limite inIerior de
9162.5 y uno superior de 9482.9. Entonces, en un nivel de conIianza de 95, es posible tener
cualquier valor de entre 9162.5 y 9482.9. Un nivel de conIianza de 95 implica que 95 de
todas las muestras daria lugar a un intervalo que incluye o cualquier otro parametro que se este
estimando, y solo 5 de las muestras producira un intervalo erroneo.
Cuanto mayor sea el nivel de conIianza podremos creer que el valor del parametro que se estima
esta dentro del intervalo.
Una interpretacion correcta de la "conIianza de 95" radica en la interpretacion Irecuente de
probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que si
el experimento donde A esta deIinido re realiza una y otra vez, a largo plazo A ocurrira 95 de
las veces. Para este caso
El 95 de los intervalos de conIianza calculados contendran a .



Esta es una construccion repetida de intervalos de conIianza de 95 y se puede observar que de
los 11 intervalos calculados solo el tercero y el ultimo no contienen el valor de .
137
De acuerdo con esta interpretacion, el nivel de conIianza de 95 no es tanto un enunciado sobre
cualquier intervalo en particular, mas bien se reIiere a lo que sucederia si se tuvieran que
construir un gran numero de intervalos semejantes.
Encontrar z a partir de un nivel de conIianza
Existen varias tablas en las cuales podemos encontrar el valor de z, segun sea el area
proporcionada por la misma. En esta seccion se realizara un ejemplo para encontrar el valor de z
utilizando tres tablas diIerentes.
Ejemplo:
Encuentre el valor de z para un nivel de conIianza del 95.
Solucin 1.
Se utilizara la tabla que tiene el area bajo la curva de - hasta z. Si lo vemos graIicamente seria:

El nivel de conIianza bilateral esta dividido en partes iguales bajo la curva:

En base a la tabla que se esta utilizando, se tendra que buscar el area de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.

Por lo que el valor de z es de 1.96.
Solucin 2.
Si se utiliza una tabla en donde el area bajo la curva es de 0 a z:

En este caso solo se tendra que buscar adentro de la tabla el area de 0.475 y el resultado del valor
de z sera el mismo, para este ejemplo 1.96.
138

Solucin 3.
Para la tabla en donde el area bajo la curva va desde z hasta :

Se busca el valor de 0.025 para encontrar z de 1.96.
Independientemente del valor del Nivel de ConIianza este sera el procedimiento a seguir para
localizar a z. En el caso de que no se encuentre el valor exacto se tendra que interpolar.

Estimacin para la Media
Es conocido de nosotros durante este curso, que en base a la distribucion muestral de medias que
se genero en el tema anterior, la Iormula para el calculo de probabilidad es la siguiente:
n
x
:


=
Como en este caso no conocemos el parametro y lo queremos estimar por medio de la media de
la muestra, solo se despejara de la Iormula anterior, quedando lo siguiente:
n
:
x

=
De esta Iormula se puede observar que tanto el tamao de la muestra como el valor de z se
conoceran. Z se puede obtener de la tabla de la distribucion normal a partir del nivel de conIianza
establecido. Pero en ocasiones se desconoce o por lo que en esos casos lo correcto es utilizar otra
distribucion llamada "t" de student si la poblacion de donde provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacion puntual de la
desviacion estandar, es decir igualar la desviacion estandar de la muestra a la de la poblacion (s
o).

Ejemplos:
1. Se encuentra que la concentracion promedio de zinc que se saca del agua a partir de una
muestra de mediciones de zinc en 36 sitios diIerentes es de 2.6 gramos por mililitro. Encuentre
los intervalos de conIianza de 95 y 99 para la concentracion media de zinc en el rio. Suponga
que la desviacion estandar de la poblacion es 0.3.
Solucion.
La estimacion puntual de es x 2.6. El valor de z para un nivel de conIianza del 95 es 1.96,
por lo tanto:
139

70 . 2 50 . 2
36
) 3 . 0 )( 96 . 1 (
6 . 2 v
n
:
x = = =



Para un nivel de conIianza de 99 el valor de z es de 2.575 por lo que el intervalo sera mas
amplio:
73 . 2 47 . 2
36
) 3 . 0 )( 575 . 2 (
6 . 2 v
n
:
x = = =



El intervalo de conIianza proporciona una estimacion de la precision de nuestra estimacion
puntual. Si es realmente el valor central de intervalo, entonces x estima sin error. La mayor
parte de las veces, sin embargo, x no sera exactamente igual a y la estimacion puntual es
erronea. La magnitud de este error sera el valor absoluto de la diIerencia entre y x , y podemos
tener el nivel de conIianza de que esta diIerencia no excedera.
n
:

Como se puede observar en los resultados del ejercicio se tiene un error de estimacion mayor
cuando el nivel de conIianza es del 99 y mas pequeo cuando se reduce a un nivel de conIianza
del 95.
2. Una empresa electrica Iabrica Iocos que tienen una duracion aproximadamente distribuida de
Iorma normal con una desviacion estandar de 40 horas. Si una muestra de 30 Iocos tiene una
duracion promedio de 780 horas, encuentre un intervalo de conIianza de 96 para la media de la
poblacion de todos los Iocos que produce esta empresa.

Solucin.
795 765
30
) 40 )( 054 . 2 (
780
30
) 40 )( 054 . 2 (
780 < < = + < < = + < <

n
:
x
n
:
x
Con un nivel de conIianza del 96 se sabe que la duracion media de los Iocos que produce la
empresa esta entre 765 y 765 horas.

140
3. La prueba de corte sesgado es el procedimiento mas aceptado para evaluar la calidad de una
union entre un material de reparacion y su sustrato de concreto. El articulo "Testing the Bond
Beteen Repair Materials and Concrete Substrate" inIorma que, en cierta investigacion, se
obtuvo una resistencia promedio muestral de 17.17 N/mm
2
, con una muestra de 48 observaciones
de resistencia al corte, y la desviacion estandar muestral Iue 3.28 N/mm
2
. Utilice un nivel de
conIianza inIerior del 95 para estimar la media real de la resistencia al corte.
Solucion.
En este ejercicio se nos presentan dos situaciones diIerentes a los ejercicios anteriores. La
primera que desconoce la desviacion estandar de la poblacion y la segunda que nos piden un
intervalo de conIianza unilateral.
El primer caso ya se habia comentado y se solucionara utilizando la desviacion estandar de la
muestra como estimacion puntual de sigma.
Para el intervalo de conIianza unilateral, se cargara el area bajo la curva hacia un solo lado como
sigue:

39 . 16
48
) 38 . 3 )( 654 . 1 (
17 . 17 = = = =
n
:
x


Esto quiere decir que con un nivel de conIianza de 95, el valor de la media esta en el intervalo
(16.39, ).

INTERVALO DE CONFIANZA PARA ; CON o DESCONOCIDA

Si X y S son la media y la desviacion estandar de una muestra aleatoria de una poblacion normal
con varianza
2
, desconocida, un intervalo de conIianza de (1 - u) 100 para es:
n
S
t X
n
S
t X
2 2

+ < <

Donde

t
/2
es el valor t con n-1 grados de libertad, que deja un area de u /2 a la derecha.
Se hace una distincion entre los casos de o conocida y o desconocida al calcular las estimaciones
del intervalo de conIianza. Se debe enIatizar que para el primer caso se utiliza el teorema del
limite central, mientras que para o desconocida se hace uso de la distribucion muestral de la
variable aleatoria t. Sin embargo, el uso de la distribucion t se basa en la premisa de que el
muestreo se realiza de una distribucion normal. En tanto que la distribucion tenga Iorma
aproximada de campana, los intervalos de conIianza se pueden calcular cuando la varianza se
141
desconoce mediante el uso de la distribucion t y se puede esperar buenos resultados.
Con mucha Irecuencia los estadisticos recomiendan que aun cuando la normalidad no se pueda
suponer, con o desconocida y n 30, S puede reemplazar a o y se puede utilizar el intervalo de
conIianza:
n
S
Z X
2


Por lo general este se denomina como un intervalo de confianza de muestra grande. La
justiIicacion yace solo en la presuncion de que con una muestra grande como 30, s estara muy
cerca de la o real y de esta manera el teorema del limite central sigue valiendo. Se debe hacer
enIasis en que esto es solo una aproximacion y que la calidad de este enIoque mejora a medida
que el tamao de la muestra crece mas.
Ejemplos:
1. El contenido de siete contenedores similares de acido sulIurico son 9.8, 10.2, 10.4, 9.8, 10.0,
10.2, y 9.6 litros. Encuentre un intervalo de conIianza del 95 para la media de todos los
contenedores si se supone una distribucion aproximadamente normal.
Solucin.
La media muestral y la desviacion estandar para los datos dados son:
= X 10 y s 0.283
En la tabla se encuentra que t
0.025
2.447 con 6 grados de libertad, de aqui, el intervalo de
conIianza de 95 para es:

+ < <

7
283 . 0
) 477 . 2 ( 0 . 10
7
283 . 0
) 477 . 2 ( 0 . 10

Con un nivel de conIianza del 95 se sabe que el promedio del contenido de los contenedores
esta entre 9.47 y 10.26 litros.

2. Un articulo publicado en el Journal of Testing and Evaluation presenta las siguientes 20
mediciones del tiempo de combustion residual en segundos de especimenes tratados de ropa de
dormir para nios:
9.85 - 9.93 - 9.75 - 9.77 - 9.67 - 9.87 - 9.67 - 9.94 - 9.85 - 9.75
9.83 - 9.92 - 9.74 - 9.99 - 9.88 - 9.95 - 9.95 - 9.93 - 9.92 - 9.89

142
Se desea encontrar un nivel de conIianza del 95 para el tiempo de combustion residual
promedio. Supongase que el tiempo de combustion residual sigue una distribucion normal.
Solucin.
La media muestral y la desviacion estandar para los datos dados son:
= X 9.8525 y s 0.0965
En la tabla se encuentra que t
0.025
2.093 con 19 grados de libertad, de aqui, el intervalo de
conIianza de 95 para es:

+ < <

20
0965 . 0
) 093 . 2 ( 8525 . 9
20
0965 . 0
) 093 . 2 ( 8525 . 9

Por lo tanto, se tiene una conIianza del 95 de que el tiempo de combustion residual promedio se
encuentra entre 9.8073 y 9.8977 segundos.





















143
PRUEBA DE HIPOTESIS

Las secciones anteriores han mostrado como puede estimarse un parametro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un solo numero (estimador puntual) o un
intervalo de valores posibles (intervalo de conIianza). Sin embargo, muchos problemas de
ingenieria, ciencia, y administracion, requieren que se tome una decision entre aceptar o rechazar
una proposicion sobre algun parametro. Esta proposicion recibe el nombre de hipotesis. Este es
uno de los aspectos mas utiles de la inIerencia estadistica, puesto que muchos tipos de problemas
de toma de decisiones, pruebas o experimentos en el mundo de la ingenieria, pueden Iormularse
como problemas de prueba de hipotesis.
Una hipotesis estadistica es una proposicion o supuesto sobre los parametros de una o mas
poblaciones.
Suponga que se tiene interes en la rapidez de combustion de un agente propulsor solido utilizado
en los sistemas de salida de emergencia para la tripulacion de aeronaves. El interes se centra
sobre la rapidez de combustion promedio. De manera especiIica, el interes recae en decir si la
rapidez de combustion promedio es o no 50 cm./s. Esto puede expresarse de manera Iormal como

H
o
; 50 cm/s
H
1
; / 50 cm/s

La proposicion H
o
; 50 cm./s, se conoce como hipotesis nula, mientras que la proposicion H
1
;
= 50 cm./s, recibe el nombre de hipotesis alternativa. Puesto que la hipotesis alternativa
especiIica valores de que pueden ser mayores o menores que 50 cm./s, tambien se conoce como
hipotesis alternativa bilateral. En algunas situaciones, lo que se desea es Iormular una hipotesis
alternativa unilateral, como en

H
o
; 50 cm/s H
o
; 50 cm/s o H
1
; 50 cm/s H
1
; ~ 50 cm/s
Es importante recordar que las hipotesis siempre son proposiciones sobre la poblacion o
distribucion bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parametro de la poblacion especiIicado en la hipotesis nula se determina en una de tres maneras
diIerentes:

Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo
de la prueba de hipotesis usualmente es determinar si ha cambiado el valor del parametro.
Puede obtenerse a partir de alguna teoria o modelo que se relaciona con el proceso bajo estudio.
En este caso, el objetivo de la prueba de hipotesis es veriIicar la teoria o modelo.

144
Cuando el valor del parametro proviene de consideraciones externas, tales como las
especiIicaciones de diseo o ingenieria, o de obligaciones contractuales. En esta situacion, el
objetivo usual de la prueba de hipotesis es probar el cumplimiento de las especiIicaciones.

Un procedimiento que conduce a una decision sobre una hipotesis en particular recibe el nombre
de prueba de hiptesis. Los procedimientos de prueba de hipotesis dependen del empleo de la
inIormacion contenida en la muestra aleatoria de la poblacion de interes. Si esta inIormacion es
consistente con la hipotesis, se concluye que esta es verdadera; sin embargo si esta inIormacion
es inconsistente con la hipotesis, se concluye que esta es Ialsa. Debe hacerse hincapie en que la
verdad o Ialsedad de una hipotesis en particular nunca puede conocerse con certidumbre, a menos
que pueda examinarse a toda la poblacion. Usualmente esto es imposible en muchas situaciones
practicas. Por tanto, es necesario desarrollar un procedimiento de prueba de hipotesis teniendo en
cuenta la probabilidad de llegar a una conclusion equivocada.
La hiptesis nula, representada por H
o
, es la aIirmacion sobre una o mas caracteristicas de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hiptesis alternativa, representada por H
1
, es la aIirmacion contradictoria a H
o
, y esta es la
hipotesis del investigador.
La hipotesis nula se rechaza en Iavor de la hipotesis alternativa, solo si la evidencia muestral
sugiere que H
o
es Ialsa. Si la muestra no contradice decididamente a H
o
, se continua creyendo en
la validez de la hipotesis nula. Entonces, las dos conclusiones posibles de un analisis por prueba
de hipotesis son rechazar H
o
o no rechazar H
o
.

Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustion del
agente propulsor presentado con anterioridad. La hipotesis nula es que la rapidez promedio de
combustion es 50 cm./s, mientras que la hipotesis alternativa es que esta no es igual a 50 cm/s.
Esto es, se desea probar:
H
o
; 50 cm/s
H
1
; / 50 cm/s

Supongase que se realiza una prueba sobre una muestra de 10 especimenes, y que se observa cual
es la rapidez de combustion promedio muestral. La media muestral es un estimador de la media
verdadera de la poblacion. Un valor de la media muestral que este proximo al valor hipotetico
50 cm./s es una evidencia de que el verdadero valor de la media es realmente 50 cm./s; esto
es, tal evidencia apoya la hipotesis nula H
o
. Por otra parte, una media muestral muy diIerente de
50 cm./s constituye una evidencia que apoya la hipotesis alternativa H
1
. Por tanto, en este caso, la
media muestral es el estadistico de prueba.
145

La media muestral puede tomar muchos valores diIerentes. Supongase que si 48.5 x 51.5,
entonces no se rechaza la hipotesis nula H
o
; 50 cm./s, y que si x 48.5 o x ~51.5, entonces se
acepta la hipotesis alternativa H
1
; = 50 cm./s.
Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la region critica de la
prueba, mientras que todos los valores que estan en el intervalo 48.5 x 51.5 Iorman la
region de aceptacion. Las Ironteras entre las regiones criticas y de aceptacion reciben el nombre
de valores criticos. La costumbre es establecer conclusiones con respecto a la hipotesis nula H
o
.
Por tanto, se rechaza H
o
en Iavor de H
1
si el estadistico de prueba cae en la region critica, de lo
contrario, no se rechaza H
o
.

Este procedimiento de decision puede conducir a una de dos conclusiones erroneas. Por ejemplo,
es posible que el valor verdadero de la rapidez promedio de combustion del agente propulsor sea
igual a 50 cm./s. Sin embargo, para todos los especimenes bajo prueba, bien puede observarse un
valor del estadistico de prueba x que cae en la region critica. En este caso, la hipotesis nula H
o

sera rechazada en Iavor de la alternativa H
1
cuando, de hecho, H
o
en realidad es verdadera. Este
tipo de conclusion equivocada se conoce como error tipo I.
El error tipo I o error o se deIine como el rechazo de la hipotesis nula H
o
cuando esta es
verdadera. Tambien es conocido como u o nivel de signiIicancia.
Si tuvieramos un nivel de conIianza del 95 entonces el nivel de signiIicancia seria del 5.
Analogamente si se tiene un nivel de conIianza del 90 entonces el nivel de signiIicancia seria
del 10.
Ahora supongase que la verdadera rapidez promedio de combustion es diIerente de 50 cm./s,
aunque la media muestral x caiga dentro de la region de aceptacion. En este caso se acepta H
o

cuando esta es Ialsa. Este tipo de conclusion recibe el nombre de error tipo II.
El error tipo II error se deIine como la aceptacion de la hipotesis nula cuando esta es Ialsa.
Por tanto, al probar cualquier hipotesis estadistica, existen cuatro situaciones diIerentes que
determinan si la decision Iinal es correcta o erronea.

Decision H
o
es verdadera H
o
es Ialsa
Aceptar H
o
No hay error Error tipo II o
Rechazar H
o
Error tipo I o u No hay error

Los errores tipo I y tipo II estn relacionados. Una disminucion en la probabilidad de uno por
lo general tiene como resultado un aumento en la probabilidad del otro.
146
El tamao de la region critica, y por tanto la probabilidad de cometer un error tipo I, siempre se
puede reducir al ajustar el o los valores criticos.
Un aumento en el tamao muestral n reducira u y de Iorma simultanea.
Si la hipotesis nula es Ialsa, es un maximo cuando el valor real del parametro se aproxima al
hipotetico. Entre mas grande sea la distancia entre el valor real y el valor hipotetico, sera menor


PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS INDEPENDIENTEMENTE
DE LA DISTRIBUCION QUE SE ESTE TRATANDO

Interpretar correctamente hacia que distribucion muestral se ajustan los datos del enunciado.
Interpretar correctamente los datos del enunciado diIerenciando los parametros de los
estadisticos. Asi mismo se debe determinar en este punto inIormacion implicita como el tipo de
muestreo y si la poblacion es Iinita o inIinita.
Establecer simultaneamente el ensayo de hipotesis y el planteamiento graIico del problema. El
ensayo de hipotesis esta en Iuncion de parametros ya que se quiere evaluar el universo de donde
proviene la muestra. En este punto se determina el tipo de ensayo (unilateral o bilateral).
Establecer la regla de decision. Esta se puede establecer en Iuncion del valor critico, el cual se
obtiene dependiendo del valor de u (Error tipo I o nivel de signiIicancia) o en Iuncion del
estadistico limite de la distribucion muestral. Cada una de las hipotesis debera ser argumentada
correctamente para tomar la decision, la cual estara en Iuncion de la hipotesis nula o H
o
.
Calcular el estadistico real, y situarlo para tomar la decision.
JustiIicar la toma de decision y concluir.

Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipotesis que son:
Unilateral Derecho
Unilateral Izquierdo
Bilateral
Dependiendo de la evaluacion que se quiera hacer se seleccionara el tipo de ensayo.

Unilateral Derecho. El investigador desea comprobar la hipotesis de un aumento en el
parametro, en este caso el nivel de signiIicancia se carga todo hacia el lado derecho, para deIinir
las regiones de aceptacion y de rechazo.
Ensayo de hipotesis:
H
o
; Parametro _ x
147
H
1
; Parametro ~ x

Unilateral Izquierdo: El investigador desea comprobar la hipotesis de una disminucion en el
parametro, en este caso el nivel de signiIicancia se carga todo hacia el lado izquierdo, para deIinir
las regiones de aceptacion y de rechazo.
Ensayo de hipotesis:
H
o
; Parametro _ x
H
1
; Parametro x

Bilateral: El investigador desea comprobar la hipotesis de un cambio en el parametro. El nivel de
signiIicancia se divide en dos y existen dos regiones de rechazo.
Ensayo de hipotesis:
H
o
; Parametro x
H
1
; Parametro = x

Para realizar los ejemplos y ejercicios de ensayo de hipotesis se recomienda seguir los pasos
mencionados anteriormente. Los ejemplos siguientes se solucionaran por los pasos
recomendados, teniendose una variedad de problemas en donde se incluiran a todas las
distribuciones muestrales que se han visto hasta aqui.

Ejemplos:
148

1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado muestra
una vida promedio de 71.8 aos. Suponga una desviacion estandar poblacional de 8.9 aos, esto
parece indicar que la vida media hoy en dia es mayor que 70 aos? Utilice un nivel de
signiIicancia de 0.05.

Solucin.
Se trata de una distribucion muestral de medias con desviacion estandar conocida.
Datos:
70 aos ; o 8.9 aos ; x 71.8 aos ; n 100 ; u 0.05
Ensayo de hipotesis
H
o
; 70 aos.
H
1
; ~ 70 aos.

Regla de decision:
Si z
R _
1.645 no se rechaza H
o
.
Si z
R ~
1.645 se rechaza H
o
.
Calculos:
02 . 2
100
9 . 8
70 8 . 71
=

=
n
x
Z
R
R


1ustificacin y decisin.
Como 2.02 ~1.645 se rechaza H
o
y se concluye con un nivel de signiIicancia del 0.05 que la vida
media hoy en dia es mayor que 70 aos.
Existe otra manera de resolver este ejercicio, tomando la decision en base al estadistico real, en
este caso la media de la muestra. De la Iormula de la distribucion muestral de medias se despeja
la media de la muestra:
n
x
Z
L
L


=
46 . 71
100
) 9 . 8 )( 645 . 1 (
70 = + = + =
n
Z
x
L
L



149

Regla de decision:
Si
R
x 71.46 No se rechaza H
o
Si
R
x ~ 71.46 Se rechaza H
o
Como la media de la muestral es de 71.8 aos y es mayor al valor de la media muestral limite de
71.46 por lo tanto se rechaza H
o
y se llega a la misma conclusion.

2. Una empresa electrica Iabrica Iocos que tienen una duracion que se distribuye de Iorma
aproximadamente normal con una media de 800 horas y una desviacion estandar de 40 horas. Si
una muestra aleatoria de 30 Iocos tiene una duracion promedio de 788 horas, muestran los datos
suIiciente evidencia para decir que la duracion media ha cambiado? Utilice un nivel de
signiIicancia del 0.04.

Solucin.
Se trata de una distribucion muestral de medias con desviacion estandar conocida.
Datos:
800 horas ; o 40 horas ; x 788 horas ; n 30 ; u 0.04
Ensayo de hipotesis
H
o
; 800 horas
H
1
; = 800 horas

Regla de Decision:
Si 2.052 _ Z
R
_ 2.052 No se rechaza H
o
Si Z
R
-2.052 o si Z
R
~ 2.052 Se rechaza H
o
Calculos:
150
643 . 1
30
40
800 788
=

=
n
x
Z
R
R



1ustificacin y decisin:
Como 2.052 _ -1.643 _ 2.052 por lo tanto, no se rechaza H
o
y se concluye con un nivel de
signiIicancia del 0.04 que la duracion media de los Iocos no ha cambiado.
Solucin por el otro mtodo.
98 . 814 02 . 785
30
) 40 )( 052 . 2 (
800 v
n
Z
x
L
= = =



Regla de decision:
Si 785.02
R
x 814.98 No se rechaza H
o
Si
R
x 785.02 o
R
x ~ 814.98 se rechaza H
o
Como la
R
x 788 horas, entonces no se rechaza H
o
y se concluye que la duracion media de los
Iocos no ha cambiado.

3. Una muestra aleatoria de 64 bolsas de palomitas de maiz pesan, en promedio 5.23 onzas con
una desviacion estandar de 0.24 onzas. Pruebe la hipotesis de que 5.5 onzas contra al
hipotesis alternativa, 5.5 onzas en el nivel de signiIicamcia de 0.05.

Solucin:
Se trata de una distribucion muestral de medias con desviacion estandar desconocida, pero como
el tamao de muestra es mayor a 30 se puede tomar la desviacion muestral como un estimador
puntual para la poblacional.
Datos:
5.5 onzas ; s 0.24 onzas ; x 5.23 onzas ; n 64 ; u 0.05
Ensayo de hipotesis
H
o
; 5.5 onzas
H
1
; 5.5 onzas
151

Regla de decision:
Si Z
R
_-1.645 No se rechaza H
o
Si Z
R
-1.645 Se rechaza H
o
Calculos:
9
64
24 . 0
5 . 5 23 . 5
=

=
n
x
Z
R
R


1ustificacin y decisin:
Como 9 -1.645 por lo tanto se rechaza H
o
y se concluye con un nivel de signiIicancia del 0.05
que las bolsas de palomitas pesan en promedio menos de 5.5 onzas.
Solucin por el otro mtodo
45 . 5
64
) 24 . 0 )( 645 . 1 (
5 . 5 = = =
n
Z
x
L
L

.

Regla de decision:
Si
R
x 5.45 No se Rechaza H
o
Si
R
x 5.45 Se rechaza H
o
Como la
R
x 5.23 y este valor es menor que 5.45 por lo tanto se rechaza H
o
.

4. Un constructor aIirma que se instalan bombas de calor en 70 de todas las casas que se
construyen hoy en dia en la ciudad de Richmond. Estaria de acuerdo con esta aIirmacion si una
investigacion de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de
calor? Utilice un nivel de signiIicancia de 0.10.

Solucin.
152
Se trata de una distribucion muestral de proporciones.
Datos:
P 0.70 ; p 8/15 0.5333 ; n 15 ; u 0.10
Ensayo de hipotesis
H
o
; P 0.70
H
1
; P = 0.70

Regla de Decision:
Si 1.645 _ Z
R
_ 1.645 No se rechaza H
o
Si Z
R
-1.645 o si Z
R
~ 1.645 Se rechaza H
o
Calculos:
41 . 1
15
) 30 . 0 )( 70 . 0 (
70 . 0 533 . 0
=

=
n
Pq
P p
Z
R

1ustificacin y decisin:
Como 1.645 _ -1.41 _ 1.645 No se rechaza H
o
y se concluye con un nivel de signiIicancia de
0.10 que la aIirmacion del constructor es cierta.
Solucin por el otro mtodo.
894 . 0 505 . 0
15
) 30 . 0 )( 70 . 0 (
645 . 1 70 . 0 v
n
Pq
: p p
L L
= = =

Regla de decision:
Si 0.505 _ p
R
_ 0.894 No se rechaza H
o
Si p
R
0.505 o si Z
R
~ 0.894 Se rechaza H
o
Como el valor del estadistico real es de 0.533 por lo tanto no se rechaza H
o
y se llega a la misma
conclusion.
153

5. Un Iabricante de semiconductores produce controladores que se emplean en aplicaciones de
motores automovilisticos. El cliente requiere que la Iraccion de controladores deIectuosos en uno
de los pasos de manuIactura criticos no sea mayor que 0.05, y que el Iabricante demuestre esta
caracteristica del proceso de Iabricacion con este nivel de calidad, utilizando u 0.05. El
Iabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que
cuatro de ellos son deIectuosos. El Iabricante puede demostrar al cliente la calidad del proceso?

Solucin.
Se trata de una distribucion muestral de proporciones.
Datos:
P 0.05 ; p 4/200 0.02 ; n 200 ; u 0.05
Ensayo de hipotesis
H
o
; P 0.05
H
1
; P 0.05

Regla de decision:
Si Z
R
_-1.645 No se rechaza H
o
Si Z
R
-1.645 Se rechaza H
o
Calculos:
946 . 1
200
) 95 . 0 )( 05 . 0 (
05 . 0 02 . 0
=

=
n
Pq
P p
Z
R

1ustificacin y decisin:
Puesto que 1.946 -1.645, se rechaza H
o
y se concluye con un nivel de signiIicancia del 0.05
que la Iraccion de articulos deIectuosos es menor que 0.05.

6. Un diseador de productos esta interesado en reducir el tiempo de secado de una pintura
tapaporos. Se prueban dos Iormulas de pintura; la Iormula 1 tiene el contenido quimico estandar,
y la Iormula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de secado. De la
experiencia se sabe que la desviacion estandar del tiempo de secado es ocho minutos, y esta
variabilidad inherente no debe verse aIectada por la adicion del nuevo ingrediente. Se pintan diez
154
Piezas con la Iormula 1, y otros diez con la Iormula 2. Los dos tiempos promedio de secado
muestrales son 121 min. y 112 min. Respectivamente. A que conclusiones puede llegar el
diseador del producto sobre la eIicacia del nuevo ingrediente, utilizando u 0.05?

Solucin.
Se trata de una distribucion muestral de diIerencia de medias con desviacion estandar conocida.
Datos:
o
1
o
2
8;
mm x mm x 112 ; 121
2 1
= =
n
1
n
2
10
u 0.05

Ensayo de hipotesis
H
o
;
1
-
2
0
H
1
;
1
-
2
~ 0 Se desea rechazar H
o
si el nuevo ingrediente disminuye el tiempo promedio de
secado, por eso se pone la diIerencia mayor a cero o sea positiva para poder probar que
2
es
menor que
1
.

Regla de decision:
Si z
R
_ 1.645 no se rechaza H
o
.
Si z
R
~ 1.645 se rechaza H
o
.
Calculos:
52 . 2
10
8
10
8
0 ) 112 121 ( ) ( ) (
2 2
2
2
2
1
2
1
2 1 2 1
=
+

=
+

=
n n
x x
Z
R



JustiIicacion y decision:
Puesto que 2.52 ~1.645, se rechaza H
o
, y se concluye con un nivel de signiIicancia de 0.05 que la
adicion del nuevo ingrediente a la pintura si disminuye de manera signiIicativa el tiempo
promedio de secado.
Solucin por el otro mtodo
155
88 . 5
10
64
10
64
645 . 1 0 ) ( ) (
2
2
1
1
2
1
2 1 2 1
= + + = + + =
n n
: x x
L

.

Regla de decision:
Si
R
x x ) (
2 1
5.88 No se rechaza H
o
Si
R
x x ) (
2 1
~ 5.88 Se rechaza H
o
Puesto que
R
x x ) (
2 1
121-112 9 y este numero es mayor a 5.88 por lo tanto se rechaza H
o
.

7. Se utilizan dos maquinas para llenar botellas de plastico con un volumen neto de 16.0 onzas.
Las distribuciones de los volumenes de llenado pueden suponerse normales, con desviaciones
estandar o
1
0.020 y o
2
0.025 onzas. Un miembro del grupo de ingenieria de calidad sospecha
que el volumen neto de llenado de ambas maquinas es el mismo, sin importar si este es o no de
16 onzas. De cada maquina se toma una muestra aleatoria de 10 botellas. Se encuentra el
ingeniero en lo correcto? Utilice u 0.05

MAQUINA 1 MAQUINA 2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00

Solucin.
Se trata de una distribucion muestral de diIerencia de medias con desviacion estandar conocida.
Datos:
o
1
0.020 o
2
0.025
015 . 16
1
= x Este dato se obtuvo calculando la media de los datos en la maquina 1.
156
005 . 16
2
= x Este dato se obtuvo calculando la media de los datos en la maquina 2.
n
1
n
2
10
u 0.05
Ensayo de hipotesis
H
o
;
1
-
2
0
H
1
;
1
-
2
= 0 Si se cae en H
o
se podra probar que el volumen de llenado es el mismo en las dos
maquinas.

Regla de Decision:
Si 1.96 _ Z
R
_ 1.96 No se rechaza H
o
Si Z
R
-1.96 o si Z
R
~ 1.96 Se rechaza H
o
Calculos:
987 . 0
10
025 . 0
10
020 . 0
0 ) 005 . 16 015 . 16 ( ) ( ) (
2 2
2
2
2
1
2
1
2 1 2 1
=
+

=
+

=
n n
x x
Z
R



1ustificacin y decisin:
Como 1.96 0.987 1.96 entonces no se rechaza H
o
y se concluye con un nivel de
signiIicancia de 0.05 que las dos maquinas tienen en promedio la misma cantidad de llenado.
Solucin por el otro mtodo.
019 . 0 019 . 0
10
025 . 0
10
020 . 0
96 . 1 0 ) ( ) (
2 2
2
2
1
1
2
1
2 1 2 1
v
n n
: x x
L
= + + = + + =





157
Regla de decision:
Si 0-019
R
x x ) (
2 1
0.019 No se rechaza H
o
Si
R
x x ) (
2 1
-0.019 o
R
x x ) (
2 1
~ 0.019 Se rechaza H
o
Como
R
x x ) (
2 1
16.015 16.005 0.01, entonces cae en la region de aceptacion y no se
rechaza H
o
.

8. Existen dos tipos de plastico apropiados para su uso por un Iabricante de componentes
electronicos. La tension de ruptura de ese plastico es un parametro importante. Se sabe que o
1

o
2
1.0 psi. De una muestra aleatoria de tamao 10 y 12 para cada plastico respectivamente, se
tiene una media de 162.5 para el plastico 1 y de 155 para el plastico 2. La compaia no adoptara
el plastico 1 a menos que la tension de ruptura de este exceda a la del plastico 2 al menos por 10
psi. Con base a la inIormacion contenida en la muestra, la compaia debera utilizar el plastico
1? Utilice u 0.05 para llegar a una decision.

Solucin.
Se trata de una distribucion muestral de diIerencia de medias con desviacion estandar conocida.
Datos:
o
1
o
2
1.0 psi
5 . 162
1
= x 155
2
= x n
1
10 n
2
12 u 0.05
Ensayo de hipotesis
H
o
;
1
-
2
10
H
1
;
1
-
2
~ 10 Se desea rechazar H
o
si la media del plastico 1 supera a la media del plastico 2 en
por lo menos 10 psi.

Regla de decision:
Si z
R
_ 1.645 no se rechaza H
o
.
Si z
R
~ 1.645 se rechaza H
o
.
Calculos:
83 . 5
12
1
10
1
10 ) 155 5 . 162 ( ) ( ) (
2 2
2
2
2
1
2
1
2 1 2 1
=
+

=
+

=
n n
x x
Z
R



158
1ustificacin y decisin:
No existe evidencia suIiciente para apoyar el uso del plastico 1 ya que
5.83 1.645, por lo tanto no se rechaza H
o
.
Solucin por el otro mtodo.
70 . 10
12
1
10
1
645 . 1 10 ) ( ) (
2 2
2
2
1
1
2
1
2 1 2 1
= + + = + + =
n n
: x x
L



Regla de decision:
Si
R
x x ) (
2 1
_10.70 No se rechaza H
o
Si
R
x x ) (
2 1
~ 10.70 Se rechaza H
o
Puesto que
R
x x ) (
2 1
162.5-155 7.5 y este numero es no es mayor a 10.7 por lo tanto no se
rechaza H
o
.

9. Se evaluan dos tipos diIerentes de soluciones para pulir, para su posible uso en una operacion
de pulido en la Iabricacion de lentes intraoculares utilizados en el ojo humano despues de una
cirugia de cataratas. Se pulen 300 lentes con la primera solucion y, de estos, 253 no presentaron
deIectos inducidos por el pulido. Despues se pulen otros 300 lentes con la segunda solucion, de
los cuales 196 resultan satisIactorios. Existe alguna razon para creer que las dos soluciones para
pulir son diIerentes? Utilice u 0.01

Solucin.
Se trata de una distribucion muestral de diIerencia de proporciones.
Datos:
p
1
253/300 0.8433 ; p
2
196/300 0.6533 ; n
1
n
2
300
Ensayo de hipotesis:
H
o
; P
1
-P
2
0
H
1
; P
1
-P
2
0
159

Regla de Decision:
Si 2.575 Z
R
2.575 No se rechaza H
o
Si Z
R
-2.575 o si Z
R
~ 2.575 Se rechaza H
o
Calculos:
2
2 2
1
1 1
2 1 2 1
) ( ) (
n
q P
n
q P
P P p p
Z
R
+

=
En esta Iormula se puede observar que en el denominador se tienen a las proporciones
poblacionales o sea los parametros, los cuales no se conocen, por lo que en el ensayo de hipotesis
la Iormula para poder calcular la Z
R
cambia, estimando a el parametro comun P de la siguiente
Iorma:
2 1
2 2 1 1
2 1
2 1
n n
p n p n
P bien o
n n
x x
p
+
+
=
+
+
=
Entonces la Iormula de Z
R
quedaria de la siguiente manera:

+

=
2 1
2 1 2 1
1 1
) ( ) (
n n
Pq
P P p p
Z
R

Se calculara el valor de P:

7483 . 0
300 300
196 253
2 1
2 1
=
+
+
=
+
+
=
n n
x x
p
36 . 5
300
1
300
1
) 2517 . 0 )( 7483 . 0 (
0 ) 6533 . 0 8433 . 0 (
1 1
) ( ) (
2 1
2 1 2 1
=

+

=

+

=
n n
Pq
P P p p
Z
R


1ustificacin y decisin:
Puesto que 5.36 ~ 2.575, se rechaza la hipotesis nula y se concluye con un nivel de signiIicancia
de 0.01 que los dos Iluidos para pulir son diIerentes.
160

10. Se tomara el voto entre los residentes de una ciudad y el condado circundante para determinar
si se debe construir una planta quimica propuesta. El lugar de construccion esta dentro de los
limites de la ciudad y por esta razon muchos votantes del condado consideran que la propuesta
pasara debido a la gran proporcion de votantes que Iavorecen la construccion. Para determinar si
hay una diIerencia signiIicativa en la proporcion de votantes de la ciudad y votantes del condado
que Iavorecen la propuesta, se realiza una encuesta. Si 120 de 200 votantes de la ciudad
Iavorecen la propuesta y 240 de 500 residentes del condado tambien lo hacen, estaria de acuerdo
en que la proporcion de votantes de la ciudad que Iavorecen la propuesta es mas alto que la
proporcion de votantes del condado? Utilice un nivel de signiIicancia de 0.025.

Solucin.
Se trata de una distribucion muestral de diIerencia de proporciones.
Datos:
p
1
120/200 0.60 ; p
2
240/500 0.48 ; n
1
200 ; n
2
500
Ensayo de hipotesis:
H
o
; P
1
-P
2
0
H
1
; P
1
-P
2
~ 0

Regla de decision:
Si z
R
1.96 no se rechaza H
o
.
Si z
R
~ 1.96 se rechaza H
o
.
Calculos:
Se calculara el valor de P:
51 . 0
500 200
240 120
2 1
2 1
=
+
+
=
+
+
=
n n
x x
p

9 . 2
500
1
200
1
) 49 . 0 )( 51 . 0 (
0 ) 48 . 0 60 . 0 (
1 1
) ( ) (
2 1
2 1 2 1
=

+

=

+

=
n n
Pq
P P p p
Z
R

1ustificacin y decisin:
Puesto que 2.9 ~1.96, se rechaza la hipotesis nula y se concluye con un nivel de signiIicancia de
161
0.025 que la proporcion de votantes de la ciudad a Iavor de la propuesta es mas alta que la
proporcion de votantes del condado.

PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL,
VARIANZA DESCONOCIDA

Ciertamente sospechamos que las pruebas sobre una media poblacional con
2
desconocida,
debe incluir el uso de la distribucion t de Student. La estructura de la prueba es identica a la del
caso de o conocida, con la excepcion de que el valor o en la estadistica de prueba se reemplaza
por la estimacion de s calculada y la distribucion normal estandar se reemplaza con una
distribucion t.

Ejemplos:

1. El Instituto Electrico Edison publica ciIras del numero anual de Kiloatt-hora que gastan
varios aparatos electrodomesticos. Se aIirma que una aspiradora gasta un promedio de 46
kiloatt-hora al ao. Si una muestra aleatoria de 12 hogares que se incluye en un estudio
planeado indica que las aspiradoras gastan un promedio de 42 kiloatt-hora al ao con una
desviacion estandar de11.9 kiloatt-hora, esto sugiere con un nivel de signiIicancia de 0.05 que
las aspiradoras gastan, en promedio, menos de 46 kiloatt-hora anualmente? Suponga que la
poblacion de kiloatt-hora es normal.

Solucin:
Datos:
46 kiloatt-hora ; s 11.9 kiloatt-hora ; 42 kiloatt-hora
n 12 ; u 0.05

Ensayo de hipotesis
H
o
; 46 kiloatt-hora
H
1
; 46 kiloatt-hora

162
Regla de decision:
Si t
R
-1.796 No se rechaza H
o
Si t
R
-1.796 Se rechaza H
o
Calculos:
16 . 1
12
9 . 11
46 42
=

=
n
s
X
t
R
R


1ustificacin y decisin:
Como 1.16 ~ -1.796, por lo tanto no se rechaza H
o
y se concluye con un nivel de signiIicancia
del 0.05 que el numero promedio de kiloatt-hora que gastan al ao las aspiradoras no es
signiIicativamente menor que 46.

Solucin por el otro mtodo.

83 . 39
12
) 9 . 11 )( 796 . 1 (
46 = = =
n
s t
X
L
L



Regla de decision:
Si
R
x 39.83 No se Rechaza H
o
Si <
R
x 39.83 Se rechaza H
o
Como la =
R
x 42 y este valor no es menor que 39.83 por lo tanto no se rechaza H
o
.
Se puede aprovechar este ejemplo para calcular el valor de P, como el valor de t calculada es de
1.16, se busca en la tabla y se ve que el area a la izquierda de este valor es de 0.135 con 11 grados
de libertad, por lo tanto no se rechaza H
o
., ya que seria

un valor alto para un nivel de
signiIicancia.


163
2. Un articulo publicado en la revista Materials Engineering describe los resultados de pruebas de
resistencia a la adhesion de 22 especimenes de aleacion U-700. La carga para la que cada
especimen Ialla es la siguiente en MPa:

19.8 18.5 17.6 16.7 15.8
15.4 14.1 13.6 11.9 11.4
11.4 8.8 7.5 15.4 15.4
19.5 14.9 12.7 11.9 11.4
10.1 7.9

Sugieren los datos que la carga promedio de Ialla es mayor que 10Mpa? Supongase que la carga
donde se presenta la Ialla tiene una distribucion normal, y utilicese u 0.05. Calcule el valor de
P.

Solucin.
Datos:
10 ; s 3.55 ; = x 13.71 ; n 22 , u 0.05
Ensayo de hipotesis
H
o
; 10
H
1
; ~ 10

Regla de decision:
Si t
R
1.721 no se rechaza H
o
.
Si t
R
~ 1.721 se rechaza H
o
.
Calculos:

90 . 4
22
55 . 3
10 71 . 13
=

=
n
s
X
t
R
R


164
1ustificacin y decisin.
Como 4.90 ~1.721 se rechaza H
o
y se concluye con un nivel de signiIicancia del 0.05 que la carga
de Ialla promedio es mayor que 10Mpa.
Existe otra manera de resolver este ejercicio, tomando la decision en base al estadistico real, en
este caso la media de la muestra. De la Iormula de la distribucion muestral de medias se despeja
la media de la muestra:

30 . 11
22
) 55 . 3 )( 721 . 1 (
10 ; = + = + =

=
n
s t
x
n
s
x
t
L
L
L
L



Regla de decision:
Si
R
x 11.30 No se rechaza H
o
Si >
R
x 11.30 Se rechaza H
o

Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral limite de
11.30 por lo tanto se rechaza H
o
y se llega a la misma conclusion.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t 4.90.
Se observa que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de
3.819 el cual le corresponde un area a la derecha de 0.0005, por lo que para el valor de 4.90 el
valor de P es practicamente cero, y esto apoya la decision de rechazar H
o
.

3. Los pesos en libras de una muestra aleatoria de bebes de seis meses son: 14.6, 12.5, 15.3, 16.1,
14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5 de signiIicancia para determinar si el
peso promedio de todos los bebes de seis meses es distinto a 14 libras, suponga que sus pesos se
distribuyen normalmente y calcule el valor de P.

Solucin.
Datos:
14 libras ; s 1.21 libras ; = x 14.3 libras ; n 8 ; u 0.05
Ensayo de hipotesis
H
o
; 14 libras
H
1
; = 14 libras
165

Regla de Decision:
Si 2.365 t
R
2.365 No se rechaza H
o
Si t
R
-2.365 o si t
R
~ 2.365 Se rechaza H
o
Calculos:
7012 . 0
8
21 . 1
14 3 . 14
=

=
n
s
X
t
R
R



1ustificacin y decisin:
Como 2.365 0.7012 2.365 por lo tanto, no se rechaza H
o
y se concluye con un nivel de
signiIicancia del 0.05 que el peso promedio de todos los bebes de seis meses es de 14 libras.

Solucin por el otro mtodo.
01 . 15 98 . 12
8
) 21 . 1 )( 365 . 2 (
10 v
n
s t
x
L
L
= = =


Regla de decision:
Si 12.98
R
x 15.01 No se rechaza H
o
Si <
R
x 12.98 o >
R
x 15.01 se rechaza H
o
Como la = x 14.3 libras, entonces no se rechaza H
o
.
Para calcular el valor de P se busca en la tabla el valor de 0.7012 con 7 grados de libertad. Se
observa que este valor no se encuentra pero se puede interpolar entre los valores de 0.549 y 0.896
con areas de 0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el valor de 0.2561.

166


BIBLIOGRAFIA

MEYER. P.L. PROBABL. Y APLCACONES ESTADSTCAS. ADDSON-WESLEY
BEROAMERCANA. MEXCO 1986.

SANTALO, L.A. PROB. E NFERENCA ESTADSTCA. MONOGRAFA NRO. 11,
SERE DE MATEM.(EDTADO POR LA OEA 1970).

ARLEY, A Y BUCH,R. NTROD. A LA TEORA DE LA PROB. Y LA ESTAD.
ALHAMBRA,
MADRD 1968.

CRAMER,H. ELEMENTOS DE LA TEORA DE PROB. Y APLCACONES.AGULAR,
MADRD
1963.

DXON W Y MASSEY F.J. NTRODUCCON AL ANALSS ESTADSTCO.MC GRAW
HLL
1970.
KREF, A., LEVY, S. CLCULO DE PROBABLDADES. PROBLEMAS. PRMDE.
1978.

JOSE H. CHOURO. ESTADSTCA, ESTADSTCA, EDT. BOSFERA CARACAS
1987
DAVD SALAMA. ESTADSTCA METODOLOGA Y APLCACONES, TPOGRAFA
PRNCPOS, CARACAS 1992.

CASAS SNCHEZ, J.M., GARCA PREZ, C. Y OTROS. PROBLEMAS DE
ESTADSTCA. DESCRPTVA, PROBABLDAD E NFERENCA. ED. PRMDE 1998.
M.R. SPEGEL. PROBABLDAD Y ESTADSTCA. SCHAUM. MC GRAW-HLL.

NAVEGADORES DE LA NTERNET.

Vous aimerez peut-être aussi