Vous êtes sur la page 1sur 154

INDICE

CAPITULO 1. IDEAS PRELIMINARES


Estadstica. Toma de decisiones. Poblacin y muestra.
Atributos y variables.

Pginas
1-2
CAPITULO 2. DESCRIPCION DE LA INFORMACION RELACIONADA
CON UNA CARACTERISTICA DE UNA POBLACION
Descripcin de informacin relacionada con un atributo.
Descripcin de informacin relacionada con una variable discreta.
Descripcin de informacin relacionada con una variable continua.
Gua 1 de ejercicios.

Pginas

3-5
5-10
10-15
16-17
CAPITULO 3. MEDIDAS DE RESUMEN
La media aritmtica.
La mediana y el percentil de orden K.
La moda.
Medidas de dispersin. La varianza y la desviacin tpica.
El coeficiente de variacin y el puntaje tpico.
Gua 2 de ejercicios.

Pginas
18-20
21-24
24-25
25-27
28-29
30-34
CAPITULO 4. DESCRIPCION DE LA INFORMACION RELACIONADA
CON DOS CARACTERISTICAS DE UNA POBLACION
Generalidades. Cuadro de doble entrada
Distribuciones de variables marginales y condicionales.
Gua 3 de ejercicios.

Pginas

35-39
40-44
45-46
CAPITULO 5. EL MODELO LINEAL SIMPLE
Generalidades acerca del modelo de regresin lineal simple.
El modelo exponencial.
Elementos del anlisis de correlacin.
Gua 4 de ejercicios.

Pginas
47-50
50-52
52-56
57-59
CAPITULO 6. ELEMENTOS DE PROBABILIDADES
Generalidades. Experimento. Espacio muestral. Suceso. Probabilidad
Probabilidad de sucesos compuestos.
Funcin de probabilidad.
Probabilidad Condicional e independencia.
Ley de la probabilidad total y ley de Bayes.
Gua 5 de ejercicios.
Pginas
60-67
67-70
70-73
73-78
78-83
84-87

CAPITULO 7. ALGUNAS DISTRIBUCIONES DE PROBABILIDAD
La distribucin binomial.
La distribucin exponencial.
La distribucin normal.
El teorema del lmite central.
Aproximacin normal de la binomial.
Gua 6 de ejercicios.
Pginas
88-92
92-93
93-98
99-100
100-102
102-105



CAPITULO 8. ELEMENTOS DE INFERENCIA
Generalidades.
Estimacin de parmetros. Intervalo de confianza para .
Intervalo de confianza para el parmetro o .
Intervalo de confianza para el cuociente de varianzas.
Intervalo de confianza para la diferencia de medias.
Intervalo de confianza para el parmetro p .
Intervalo de confianza para la diferencia de proporciones.
Prueba de hiptesis relacionada con el parmetro .
Prueba de hiptesis relacionada con el parmetro o .
Prueba de hiptesis relacionada con la diferencia de medias.
Prueba de hiptesis relacionada con el parmetro p .
Prueba de hiptesis relacionada con la diferencia de proporciones.
Gua 7 de ejercicios.


CAPITULO 9. ALGUNAS APLICACIONES DE LA PRUEBA
2
_
Prueba de hiptesis relacionada con la distribucin uniforme.
Prueba de hiptesis relacionada con un patrn histrico.
Prueba de hiptesis para la diferencia entre proporciones.
Prueba de independencia de dos variables categricas.
Gua 8 de ejercicios.


TABLAS ESTADISTICAS



Pginas
106-107
107-112
112-113
113-114
115-116
116-117
118
120-122
123-125

125-127
127-129
129-130
131-133


Pginas
134-137
137-139
140-142
143-145
146-149


150-153








CAPITULO 1
IDEAS O CONCEPTOS PRELIMINARES

1.1. ESTADSTICA
La Estadstica, se puede considerar como un conjunto de mtodos y
procedimientos para obtener, describir e interpretar datos, u observaciones de
algn fenmeno, o de algn experimento, con el fin de elaborar conclusiones e
inferencias vlidas, que sirvan para orientar una determinada actividad; la cual,
generalmente, est asociada a tomar decisiones relacionadas con algn
problema.

1.2. TOMA DE DECISIONES

Una de las actividades fundamentales que realiza una persona que dirige,
ya sea una empresa, o un grupo de trabajo, es la toma de decisiones. Tomar una
buena decisin implica seguir, por lo menos, las siguientes etapas:
a) Definir claramente el problema. Esto implica, entre otras cosas, especificar la
poblacin en estudio y las variables, asociadas a los objetivos del estudio.
b) Obtener la informacin necesaria, usando por ejemplo: encuestas, fichas,
entrevistas personales, etc.
c) Describir la informacin obtenida, usando por ejemplo: cuadros, grficos,
medidas de resumen.
d) Interpretar los resultados obtenidos en la etapa anterior.
e) Elaborar conclusiones.
f) Tomar las decisiones, ms adecuadas, de acuerdo al anlisis anterior.
La Estadstica Descriptiva, nos va a proporcionar los mtodos y tcnicas para
describir e interpretar la informacin que se tiene de algn fenmeno, o problema,
de tal modo que esto sirva como una base objetiva para tomar alguna decisin
relacionada con l.
1.3. POBLACIN Y MUESTRA
El conjunto total de elementos , de donde se puede obtener informacin
del fenmeno en estudio, recibe el nombre de Poblacin o Universo.
Por razones prcticas , y/o econmicas , generalmente no es posible
obtener la informacin en todos los elementos de la poblacin, se recurre entonces
a una parte representativa de ella llamada Muestra.
En cualquier investigacin, o anlisis, es fundamental que la muestra sea lo
ms representativa de la poblacin de donde proviene, de manera que, las
conclusiones que de ella se obtengan, aseguren la seriedad y objetividad del
estudio que se ha hecho. Esto es de vital importancia, sobre todo cuando se
desea inferir caractersticas referentes a la poblacin total, a partir de una muestra
de ella. Debe tenerse presente que, para que una muestra sea representativa de
una poblacin, sus componentes deben ser elegidos al azar, de modo de asegurar
que cualquier elemento de la poblacin tenga la misma probabilidad de ser elegido
en la muestra.

1.4. ATRIBUTOS Y VARIABLES
El estudio de un fenmeno, implica la obtencin de informacin de alguna
de sus caractersticas, las cuales se pueden expresar cualitativamente o
cuantitativamente.
Llamaremos Atributos, a las caractersticas de los fenmenos susceptibles
de expresarse cualitativamente, por ejemplo; actividad, estado civil, etc.
Llamaremos Variables, a las caractersticas de los fenmenos susceptibles
de expresarse cuantitativamente, por ejemplo: ingreso mensual, ventas, etc.
Diremos que una variable es Discreta, cuando slo toma ciertos valores
dentro de un intervalo, por ejemplo: Nmero de cargas familiares por empleado,
Nmero de artculos fallados, etc.
Diremos que una variable es Continua, cuando toma cualquier valor dentro
de un intervalo, por ejemplo: ventas diarias, gastos de operaciones, etc.
Observacin.
Otra forma ms rigurosa de definir Variable Discreta se ver ms adelante
en el captulo de Variables Aleatorias. All una variable se dir discreta, cuando
toma valores dentro de un conjunto finito o infinito numerable, mientras que la
variable se considerar continua, cuando toma valores dentro de un subconjunto
de nmeros reales.



CAPITULO 2
DESCRIPCION DE LA INFORMACIN RELACIONADA
CON UNA CARACTERSTICA DE UNA POBLACIN

Para describir la informacin que se obtiene de una caracterstica de un
fenmeno, se usan una serie de instrumentos estadsticos, los cuales iremos
ocupando a travs del curso. Entre los instrumentos ms usados estn los cuadros
de frecuencias y los grficos. En esta oportunidad consideraremos los siguientes
casos: informacin relacionada con un atributo, con una variable discreta y con
una variable continua.

2.1. DESCRIPCION DE INFORMACIN RELACIONADA CON UN
ATRIBUTO.
Cuando la informacin se refiere a atributos, los cuadros y grficos son
relativamente fciles de realizar y, las distintas formas de hacerlo, depende
fundamentalmente de la habilidad e imaginacin de la persona que realiza el
trabajo.
A modo de ejemplo, consideremos lo que se describe en el siguiente Cuadro.


DISTRIBUCIN DEL PERSONAL INTAC S.A DIC. 2007.

SECCION N DE PERSONAS PORCENTAJE
ARMADURIA 64 47,1
ADMINISTRACIN 42 30,9
SERVICIOS 30 22,0
TOTAL 136 100,0


Esta misma informacin se puede describir tambin en grficos, como los
que se dan a continuacin: el de Barras y el Circular.


DISTRIBUCIN DEL PERSONAL DE INTAC ARICA S.A.
DIC. 2007
Personas Porc.












ARMADURIA ADMINISTR. SERVICIOS




DISTRIBUCION DEL PERSONAL DE
"INTAC" ARICA S.A. DIC 2007
ARMADURIA
ADMINISTRAC.
SERVICIOS
64
42
30
30,9
22,0
47,1
47,1%
30,9%
22,0%



Apreciacin General.
Tanto en el Cuadro como en los Grficos, es posible apreciar que, en
cuanto a personal, sera relativamente ms importante la Seccin Armadura.

Recomendacin.
En general, en la construccin de cuadros y grficos, es conveniente
tener presente ciertas formalidades, que faciliten su comprensin y permitan
interpretar correctamente los resultados. As, por ejemplo, es importante que el
encabezamiento contenga la informacin mnima necesaria para entender
claramente lo que all se describe. Lo mismo debe hacerse en los
encabezamientos de columnas de los cuadros y en los ejes de los grficos.

2.2. DESCRIPCION DE INFORMACIN RELACIONADA CON UNA
VARIABLE DISCRETA.
CASO 1.
A travs del siguiente ejemplo, veremos un procedimiento para describir
el comportamiento de una masa de datos relacionados con una variable
discreta.
Supongamos que los directivos de la empresa AVA, la cual tiene 4500
empleados, desean un Informe acerca del Nmero de Cargas Familiares de
sus empleados, porque la empresa desea implementar un sistema de
bonificacin de acuerdo con el comportamiento de dicha variable. Para hacer
este anlisis, se eligi una muestra aleatoria de 53 empleados.
Un procedimiento que se podra seguir es:
1) Obtener la informacin de las fichas de cada empleado. Supongamos que ,
los siguientes datos corresponden al nmero de cargas familiares de cada uno de
los 53 empleados de la empresa, elegidos aleatoriamente.

3 2 0 2 4 3 1 4 5 0 0 1
5 3 2 4 3 3 2 1 5 4 3 2
2 4 1 1 3 3 3 2 1 3 2 4
3 5 4 5 4 3 2 5 1 6 2 3
4 6 0 1 2

2) Describir la informacin disponible mediante un Cuadro de Frecuencias, que
sea lo ms completo posible en cuanto a la informacin que entrega. Se sugiere el
siguiente, el cual contiene cinco columnas, donde se indican: las Clases, las
Frecuencias Absolutas, las Frecuencias Relativas, las Frecuencias Absolutas y las
Frecuencias Relativas Acumuladas.

CARGAS FAMILIARES POR EMPLEADO AVA S.A. ENE. 2008

CARGAS FAM. EMPLEADOS PORCENTAJE
(BASE 53)
EMPLEADOS.
(ACUMULADOS)
PORCENTAJES
(ACUMULADOS)
0 4 7,5 4 7,5
1 8 15,1 12 22,6
2 11 20,8 23 43,4
3 13 24,5 36 67,9
4 9 17,0 45 84,9
5 6 11,3 51 96,2
6 2 3,8 53 100,0

En general, cualquier Cuadro de Frecuencias de este tipo, consta de las
siguientes partes:
a) Encabezamiento, donde se indica toda la informacin mnima necesaria para
entender claramente lo que all se describe.
b) Primera columna, donde se indican los distintos valores de la variable que se
presentan en la masa de datos. Se designan, en general con
i
y .

i
y = CLASES O CATEGORIAS
En el ejemplo, 3
4
= y , cuya interpretacin es, Algunos empleados de AVA
tenan tres cargas familiares cada uno.
c) Segunda Columna, donde se indica el nmero de veces que aparece cada clase
i
y en la masa de datos.
Se designan, =
i
f FRECUENCIAS ABSOLUTAS
En el ejemplo, 11
3
= f , lo cual se interpreta diciendo, 11 empleados de
AVA tenan 2 cargas familiares cada uno.
d) Tercera Columna, donde se indican, mediante porcentajes, la importancia
relativa de cada clase
i
y .
Se designan, =
i
h FRECUENCIAS RELATIVAS
Adems, % 100
n
f
h
i
i
= , donde n es el nmero total de datos.

En el ejemplo, 0 , 17
5
= h , cuya interpretacin es, el 17 % de los
empleados de AVA tendran 4 cargas familiares cada uno.

e) Cuarta y Quinta Columna, aqu se indican las Frecuencias Absolutas y Relativas
Acumuladas. Se designan:

=
k
F FRECUENCIA ABSOLUTA ACUMULADA =

=
=
k
i
i
i
f
1

=
k
H FRECUENCIA RELATIVA ACUMULADA =

=
=
k
i
i
i
h
1


En el ejemplo, 23
3
= F , lo cual se interpreta diciendo, Hay 23
empleados de AVA, con : 0 , 1 2 cargas familiares cada uno.
En el ejemplo, 9 , 67
4
= H % , lo cual se interpreta diciendo, el 67.9
% de los empleados de AVA, tendran cada uno: 0 , 1 , 2 3 cargas
familiares
La masa de datos se puede describir tambin mediante grficos, como
el de Barras, para las frecuencias absolutas, y como el de Escalera, para las
frecuencias acumuladas. Estos dos Grficos se presentan a continuacin.

GRAFICOS DE BARRA Y EN ESCALERA.

Otra forma de describir la informacin, relacionada con una variable
discreta, es mediante los grficos de Barra, para las frecuencias absolutas, y los
grficos en Escalera para las frecuencias acumuladas. Estos grficos describen, en
forma geomtrica, lo mismo que se resume en el cuadro de frecuencias. El grfico
de barra, que se presenta a continuacin corresponde al Caso 1.

Grfico de Barra. Caso 1.

CARGAS FAMILIARES POR EMPLEADO AVA S.A. ENERO 08
Empleados Porcentaje












0 1 2 3 4 5 6
Cargas Familiares

Construccin.
En este grfico, cada barra es ubicada en la clase
i
y , del eje horizontal,
a una altura equivalente a la frecuencia absoluta
i
f . En el eje vertical derecho se
indican los porcentajes correspondientes
i
h .
Interpretacin de la Tercera Barra.
Hay 11 empleados de la empresa que tienen 2 cargas familiares cada
uno, ellos representaran al 20,8 % del total de empleados .
Observacin.
13
11
9
8
6
4
2
0
7,5
15,1
20,8
24,5
17,0
11,3
3,2
El grfico permite visualizar, en forma ms rpida, aspectos del
comportamiento de la variable en estudio, como por ejemplo: lo ms frecuente
(barra ms alta), lo menos frecuente, etc.

Grfico de Escalera. Caso 1.
En este grfico se describe lo que corresponde a las frecuencias absolutas
y relativas acumuladas.


CARGAS FAM. POR EMPLEADO AVA S.A. ENE 08 (ACUM.)
Empleados Porcen










0 1 2 3 4 5 6
Cargas Familiares
Construccin.
En este grfico, cada punto est ubicado frente a la clase
i
y , a una
altura equivalente a la frecuencia acumulada
i
F .
Interpretacin del Tercer escaln.
Hay 23 empleados que tienen cada uno : 0, 1, 2 cargas familiares,
ellos representaran al 43,2 % del total de empleados .
Grfico de Barras Horizontal.
Lo mismo que est descrito en los grficos anteriores, se puede resumir
usando barras horizontales.
N DE CARGAS FAMILIARES POR EMPLEADO AVA S.A. ENE. 2008

53
51
45
36
23
12
4
0
100,0
96,2
84,9
67,9
43,4
22,6
7,5
N DE PORCENT. N EMPL. PORCENT.
EMPL. BASE 53 ACUMUL. ACUMUL.

4 7.5 4 7.5

8 15.1 12 22.5

11 20.8 23 43.4










Observacin.
En general, un informe acerca del comportamiento de un grupo de datos,
de una variable, debera incluir algn cuadro y/o grfico, junto con algunas
conclusiones, que se puedan deducir de los resultados obtenidos.
Un Informe relacionado con el caso que se plantea aqu, podra incluir,
por ejemplo, el ltimo grfico y las siguientes conclusiones :
1) Dentro de la empresa, lo ms frecuente es que los empleados tengan 3
cargas familiares cada uno.
2) El 45,3 % de los empleados tendran, cada uno, 2 3 cargas.
3) La mayora de los empleados de la empresa, un 77 4 % tendran, cada uno: 1
, 2 , 3, 4 cargas.
4) Etc.

2.3. DESCRIPCION DE INFORMACIN RELACIONADA CON
UNA VARIABLE CONTINUA

En esta parte, veremos la forma de describir el comportamiento de un
conjunto de datos de una variable continua en estudio, mediante los
correspondientes Cuadros de Frecuencia y Grficos. Para esto, usaremos como
material de trabajo el siguiente caso supuesto:

Caso 2: Consumo Mensual de Electricidad por Departamento
Aqu, vamos a suponer que se ha hecho un estudio sobre el Consumo
Mensual de Electricidad ( en Kw / hr ), en los departamentos de los edificios del
sector Norte de Arica. Para esto, se eligi una muestra aleatoria de 40
departamentos, de la poblacin en estudio consistente en 1500 departamentos. El
propsito de este anlisis, es tomar alguna decisin sobre rebajas en las tarifas de
consumo, de acuerdo con el comportamiento de la variable en estudio.

La variable en estudio es Consumo mensual de electricidad
en [ Kw / hr ] .
La poblacin en estudio est constituida por 1.500 departamentos.

La muestra est constituida por los 40 datos, los cuales corresponden a
los consumos mensuales de electricidad de cada uno de estos departamentos.
Estos consumos estn expresados en kilowatt por hora (kw/h).

MASA DE DATOS: CONSUMO MENSUAL DE ELECTRICIDAD
( en Kw / hr ) POR DEPARTAMENTO.
123 135 111 186 115 123 141 117 97 132
154 151 91 110 158 61 68 59 154 143
108 86 122 94 76 94 65 119 85 132
82 173 75 81 85 101 98 125 130 178

La informacin contenida en la Masa de Datos, se clasifica en general, en
Intervalos de Clase, de igual amplitud; sin embargo, tambin pueden usarse
intervalos de distintas amplitudes.
En este caso, la informacin disponible, se va a describir mediante un
cuadro de frecuencias, donde los datos sern clasificados de acuerdo a intervalos
de clase que, en general son de igual amplitud.
Definicin de los intervalos
Consideremos una masa de n datos, asociados a una variable continua.
Un procedimiento para determinar el nmero k de intervalos, de igual amplitud c
, para clasificar la informacin disponible, es el siguiente.
El nmero k de intervalos puede ser arbitrario, o usar un nmero entero que est
alrededor de la n . En el ejemplo, n = 40 , su raz cuadrada es
aproximadamente 6,3 . Por lo tanto podemos clasificar los datos de acuerdo a 5 ,
6 7 intervalos de igual amplitud. En este caso usaremos 5.
Una vez que est definido k , debemos determinar el valor de la amplitud c de
cada intervalo, de la siguiente manera: en la masa de datos, ubicamos el valor
mximo y el valor mnimo. Hacemos la diferencia entre ellos, el resultado es el
rango real, que describe la variacin total que se observa en la masa de datos.
Dividimos el rango real por el nmero k de intervalos. Definimos c como el
entero inmediatamente superior al cuociente calculado.
En el ejemplo tenemos :
X ( mximo ) - X ( mnimo ) = 186 - 59 = 127 [ Kw / hr ]
Dividimos 127 : 5 = 25,4 . Por lo tanto, definimos c = 26 .
De acuerdo con lo anterior, debemos corregir el rango. As, dado que , k =
5 y c = 26 , entonces, el rango corregido es 130 .
Ahora bien, la diferencia entre ambos rangos es de 3 unidades . El rango
corregido es ms amplio que el real en estas 3 unidades, entonces es necesario
corregir el valor mnimo y / o el valor mximo original, para definir los 5 intervalos
de amplitud 26. Esto se hace repartiendo, en ambos extremos, las 3 unidades en
forma ms o menos equitativa. En el ejemplo, tenemos dos opciones, para corregir
los extremos.
X ( mnimo ) = 57 y X ( mximo ) = 187 , o ,
X ( mnimo ) = 58 y X ( mximo ) = 188
Usando la primera opcin, podemos definir los intervalos de clase, de
amplitud c = 26 .
I
1
= [ 57 ; 83 ] ; I
2
= ] 83 ; 109 ] ; I
3
= ] 109 ; 135 ]
I
4
= ] 135 ; 161 ] ; I
5
= ] 161 ; 187 ]
Observacin.
A modo de ejemplo, vemos que el tercer intervalo describe el conjunto, de
valores de x mayores que 109 , pero, menores o iguales que 135.
Hemos definido los 5 intervalos de clase, de amplitud 26 , para clasificar
los datos disponibles, que nos permitir describir, o resumir, lo que tenemos en la
masa de datos, obtenidos para este caso, mediante el siguiente cuadro de
frecuencias, que se gener al asignar cada dato al intervalo correspondiente.

CONSUMO MENS. DE ELECTRICIDAD POR DEPARTAM. ENE. 2008
CONS. MENS.
(Kw /hr)
DEPARTAM. PORCENTAJE DEPARTAM.
(ACUMULADOS)
PORCENTAJES
(ACUMULADOS)
57 83 8 20,0 8 20,0
83 109 10 25,0 18 45,0
109 135 13 32,5 31 77,5
135 161 6 15,0 37 92,5
161 - 187 3 7,5 40 100,0

Observaciones.
1. Los Intervalos de Clase se designarn, I
i
= ] y
i-1
; y
i
]
2. La Amplitud de cada intervalo I
i
es c
i
= y
i
- y
i-1


3. Llamaremos Marca de Clase, del intervalo
i
I al valor medio, o promedio entre
los valores inferior y superior, o sea,
Marca de Clase
2
i
y
1 i
y
M
i
+

=
Observacin.
Geomtricamente, la marca de clase corresponde al punto medio del intervalo de
clase I
i
.

Interpretacin de resultados Caso 2.

I
2
= ] 83 ; 109 ] algunos departamentos consumen, cada uno, entre 83 y 109
kw/hr de electricidad por mes
f
3
. = 13 Deptos. Hay 13 departamentos que consumen, cada uno, entre 109 y
135 kw/hr de electricidad por mes
h
4
= 15,0 % el 15 % de los departamentos consumira, cada uno, entre 135 y
161 kw/hr de electricidad por mes
F
3
= 31 Deptos. Hay 31 departamentos que consumen, cada uno, entre 57 y
135 kx/hr de electricidad por mes
H
2
= 45,0 % el 45 % de los departamentos consumira, cada uno, entre 57 y
109 kw/hr de electricidad por mes

Algunas Conclusiones asociadas al Caso 2.

1) El consumo mensual de electricidad ms frecuente entre los departamentos
estara entre 109 y 135 kw/hr.
2) El 57.5 % de los departamentos consumiran, cada uno, entre 83 y 135 kw/hr
de electricidad por mes.
3) El 77.5 % de los departamentos consumiran, cada uno, entre 57 y 135 kw/hr
de electricidad por mes.
4) Slo el 7.5 % de los departamentos consumiran, cada uno, ms de 161 kw/hr
de electricidad por mes.

GRAFICOS HISTOGRAMA Y OJIVA

La descripcin de la informacin, relacionada con una variable continua,
se puede hacer, geomtricamente, a travs de dos grficos; uno para las
frecuencias absolutas, llamado Histograma, y otro para las frecuencias
acumuladas, llamado Ojiva.

Histograma para al Caso 2.

CONSUMO MENSUAL ELECTRICIDAD POR DEPTO. ENE 08.

Deptos. Porcent.







13
10
8
6
32.5
25.0
20.0
15.0





57 83 109 135 161 187
Consumo Mensual [ kw/hr ]

Construccin.

Para construir el Histograma, se levanta, en cada intervalo de clase
i
I , del
eje horizontal, una barra de altura equivalente a la frecuencia absoluta
i
f .
En el eje vertical derecho se indican los porcentajes
i
h .
Otra forma de presentacin del Histograma se hace usando las marcas de
clase
i
M . En cada una de ellas se ubica un punto a una altura equivalente a la
frecuencia absoluta
i
f . Despus stos se unen mediante lneas rectas formando
una poligonal que comienza en 57 y termina en 187.

Interpretacin de la cuarta barra.

Hay 6 departamentos que consumen, cada uno, entre 135 y 161 kw/hr de
electricidad mensual, ellos representaran al 15 % del total de departamentos de la
poblacin en estudio.

Ojiva para el Caso 2.

CONSUMO MENSUAL ELECTRICIDAD POR DEPTO. ENE. 08
(ACUMULADOS)

Deptos. Porcentaje






3
0
7.5
0
40
37
31
100.0
92.5
77.5









57 83 109 135 161 187
Consumo mensual [ kw/hr ]

La ojiva se construye ubicando un punto en el extremo superior de cada intervalo
i
I a una altura equivalente a la frecuencia acumulada
i
F . Luego se unen los
puntos en una poligonal.

Interpretacin del tercer punto.

Hay 31 departamentos que consumen, cada uno, entre 57 y 135 kw/hr de
electricidad por mes; ellos representaran al 77.5 % del total de departamentos.
GUIA 1 DE EJERCICIOS

Los datos que se dan a continuacin corresponden a algunas
caractersticas medidas a travs de una Encuesta Socio Econmica, efectuada en la
Poblacin Sica Sica en Arica, en Enero de 2003. Para esto se eligi una muestra
aleatoria de 37 familias, elegidas en la poblacin en estudio, constituida por 2500
familias.
Describa la informacin obtenida mediante Cuadros de Frecuencias y
Grficos.
En cada caso indique: variable y poblacin en estudio, muestra, tipo de
caracterstica a medir, algunas interpretaciones y conclusiones que se deriven de
los resultados.

CASO 3: NUMERO DE HIJOS ESTUDIANTES POR FAMILIA
Masa de Datos
18
8
0
45.0
20.0
0
4 3 1 3 4 3 0 0 1 4 3 3
4 1 0 2 1 2 2 3 1 0 2 5
2 4 3 2 5 3 3 0 1 3 1 0 1


CASO 4: INGRESO MENSUAL POR FAMILIA (en miles de $)
Masa de Datos
125 115 102 128 118 103 114 119 128
104 85 110 89 145 101 117 126 108
87 112 122 136 130 105 111 82 113
110 119 88 146 132 148 134 148 139 131


CASO 5: TIPO DE VIVIENDA

A: De ladrillo o bloqueta B: De madera
C: De material ligero.

Masa de Datos
A C A B C B A B B B A A B C
A B C B B C C A B B B C C A
B C B C B A B B C


CASO 6: CAPTURA MENSUAL POR GOLETA PESQUERA

La siguiente informacin corresponde a la Captura Mensual de anchoveta,
efectuada en una muestra aleatoria de 45 goletas, de 250 toneladas de capacidad.
Los datos estn expresados en miles de toneladas. La muestra proviene de una
poblacin de 1300 goletas.

Masa de Datos
1,540 1,862 2,352 1,274 2,054 2,345 1,465
1,347 1,745 1,963 2,147 1,662 1,486 1,275
1,945 2,200 1,347 1,748 1,565 1,678 2,345
1,865 1,476 1,628 1,275 1,566 1,627 1,345
1,862 1,432 2,021 1,658 1,830 1,476 1,325
1,478 1,965 1,275 1,586 1,976 2,248 1,476
1,325 1,278 1,155

a) Construya un Cuadro de Frecuencias de 6 intervalos de igual amplitud e
interprete un valor de cada columna.
b) Construya el Histograma y la Ojiva. Interprete la segunda barra del
Histograma y el tercer punto de la Ojiva.
c) Escriba algunas conclusiones acerca del comportamiento de la variable en
estudio, basndose en los resultados obtenidos en el Cuadro de Frecuencias.





CAPITULO 3
MEDIDAS DE RESUMEN

Las Medidas de Resumen, son valores (tericos) de la variable que sirven
para caracterizar el comportamiento de una poblacin en estudio en relacin a
dicha variable, principalmente respecto de dos aspectos: la Tendencia y la
Variabilidad. La Tendencia, tiene que ver con algn valor alrededor del cual se
agrupa la mayora de los datos. La Variabilidad, tiene que ver con el hecho que la
variable toma valores diferentes cuando se observa de elemento en elemento de la
poblacin. Algunas de las medidas de resumen que veremos en este curso, son
las siguientes: la media aritmtica, la moda, la mediana, los percentiles, la
desviacin tpica, el coeficiente de variacin y el puntaje tpico.

1. LA MEDIA ARITMTICA.

Esta medida de resumen es la de uso ms frecuente. Se usa para
caracterizar el comportamiento de la variable en relacin con el aspecto
Tendencia, que tiene que ver con la forma como los datos de la variable en
estudio tenderan a agruparse alrededor de un valor terico. Se le llama Media
y se designa generalmente con x .

La Media, para datos no agrupados.

Consideremos una muestra de n datos de una variable. Es decir, la
muestra est constituida por datos, tales como :

n
x x x ......., ,......... ,
2 1


Se define la Media Aritmtica de la variable en estudio en la siguiente
forma:

n
x
n
i
i
x

=
=
1


La Media, para datos agrupados por valores puntuales.

Supongamos que las n observaciones corresponden a una variable
discreta, y estn agrupadas en k clases. Entonces, la Media se calcula en la
siguiente forma:

n
f y
k
i
i i
x

=
=
1

donde
i
f es la frecuencia absoluta con que se presenta cada clase
i
y en la masa
de datos.
Ejemplo: Calcular e interpretar la Media en el siguiente caso.
Cargas familiares
i
y : 0 1 2 3 4
Empleados
i
f : 3 6 10 11 5
3 , 2
5 11 10 6 3
5 4 11 3 10 2 6 1 3 0
=
+ + + +
+ + + +
= x
Interpretacin: El promedio de cargas familiares, por empleado,
Sera de 2 cargas.

La Media para datos agrupados por intervalos.

Supongamos que los n datos se refieren a una variable continua y estn
clasificados segn k intervalos de clases | |
i i i
y y I ;
1
= , entonces la Media
se calcula de la siguiente manera.

n
f M
k
i
i i
x

=
=
1

donde
i
M es la Marca de Clase correspondiente al intervalo
i
I .
Recordemos que, la Marca de Clase, para un intervalo
i
I est dado por la
expresin,

2
1 i i
i
y y
M
+
=


La marca de clase
i
M es un valor puntual que representa a todos los valores
que estn en el intervalo. Geomtricamente, representa al punto medio del
intervalo
i
I .
Ejemplo: La distribucin de las edades de una muestra de los empleados de
una empresa, se describe en el siguiente cuadro:

EDADES NRO.DE EMPL.
i
f
i
M
i i
f M
18 24 10 21 210
24 30 9 27 243
30 36 14 33 462
36 42 11 39 429
Mas de 42 6 45 270
SUMAS n = 50

= 1614

3 , 32
50
1614
= = x
Interpretacin: La edad promedio, por empleado de la empresa, sera de
32 aos.

Observacin:

En ciertas ocasiones las observaciones de una variable en estudio estn
clasificadas en clases x
i
las cuales, tienen dentro de la poblacin en estudio,
diferente peso o ponderacin, en tal caso, se puede definir lo que llamaremos
Media Aritmtica Ponderada, que se calcula mediante la siguiente frmula:

=
=
k
i
i i
w x x
1


Donde, w
i
es la ponderacin que tiene, cada clase x
i
, dentro de la
poblacin en estudio ( k representa el nmero de clases).
En otras palabras, la ponderacin cuantifica la importancia relativa que tiene cada
clase dentro de la poblacin en estudio.




2. LA MEDIANA

La Mediana, que designaremos Me, se define como aquel valor
(terico), de la variable en estudio, que deja por debajo de l, como mximo, al
50% del total de observaciones. Osea, la Mediana sera un valor de la variable
que, tericamente, debera estar ubicado en el centro de la distribucin ordenada
de los datos, que va desde el valor mnimo observado al valor mximo.

La Mediana, para datos no agrupados.

Para calcular la Mediana, en este caso, se ordenan los datos en orden
creciente (o decreciente). Despus se calcula el valor determinante n/2 , siendo
n el total de datos.
Entonces, la Mediana ser el dato ubicado en el lugar asociado al entero
inmediatamente superior a n/2.
Ejemplo: Consideremos el siguiente conjunto de datos, los cuales ya
estn ordenados.

13 15 15 18 23 23 29
31 37 42 43 47 50 55

En este caso, n = 14 y n/2 = 7. Por lo tanto, la Mediana es el valor
ubicado en el lugar 8, o sea , Me = 31

La Mediana, para datos agrupados por valores puntuales.

Consideremos un conjunto de n datos agrupados en k clases y
i
. Para
calcular la Mediana, en este caso, se procede de la siguiente manera:
1) Se calculan las Frecuencias absolutas acumuladas F
i
.
2) Se calcula el valor determinante n/2 , y se ubica la frecuencia acumulada F
j
,
cuyo valor sea inmediatamente superior a n/2.
3) Entonces, la Mediana ser la clase y
j ,
asociada a la frecuencia F
j
.
Es decir para este caso, Me = y
j


Ejemplo: Calcular e interpretar la Mediana para la informacin que
se describe en el siguiente Cuadro:


j
y 5 8 12 17 20
i
f 11 15 7 12 6

i
F 11 26 33 45 51

En este caso, n/2 = 51/2 = 25,5, esto implica que la frecuencia
acumulada F
j
= F
2
= 26 .
Luego, la Mediana es el valor de la clase y
2
, es decir , Me = 8
Interpretacin: El 50 % de los datos en esta distribucin, toma los
valores 5 u 8.

La Mediana, para datos agrupados por intervalos.

Para calcular la Mediana en este caso, se procede en forma anloga a
como se hizo en el ejemplo anterior, hasta la determinacin de F
j
, que nos
permite ubicar el intervalo I
j
, que contiene a la mediana Me. O sea,

| |
j j j
y y I Me ;
1
= e
Una vez que se ha ubicado este intervalo, se procede a calcular la
Mediana, usando la siguiente frmula:


1
1
1
5 , 0

+ =
j j
j
j j
F F
F n
c y Me
El valor determinante, para el clculo de la Mediana, es n/2 0,5 n.
Este valor permite ubicar F
j ,
y, como consecuencia, el intervalo I
j
que
contiene a la Mediana.
En la frmula y
j-1
, es el extremo inferior del intervalo que contiene a
la Mediana, mientras que c
j
es la amplitud de dicho intervalo.
La frecuencia acumulada F
j-1
corresponde a aquella que, aparece
antes que F
j
en el cuadro.

Ejemplo: Calcular e interpretar la Mediana usando los datos disponibles
en el siguiente cuadro.
TIEMPO DE ARMADO DE CARBURADOR POR OPERARIO
TIEMPO (MIN) Nro. Operarios f
i
F
i

12 16 13 13
16 20 16 29
20 24 19 48
24 28 15 63
28 32 9 72


Aqu, el valor determinante es n/2 = 72/2 = 36 , esto implica que,
F
j
= F
3
= 48 . Luego, la Me | | 24 ; 20
3
= I c . Entonces,

47 , 21
29 48
29 36
4 20 =

+ = e M

Interpretacin: El 50% de los operarios emplearan, cada uno, entre
12 y 21,5 minutos en el armado del carburador.


3. EL PERCENTIL DE ORDEN k.

El percentil de orden k ( k = 1, 2, 3, ..........., 99), se define como aquel
valor de la variable que deja por debajo de l, a lo sumo, al k% del total de datos.
Se designa P
k
. La Mediana se puede considerar como un caso particular de
percentil, es el P
50
.
Hay algunos percentiles que reciben denominaciones especiales como
por ejemplo:


3 int ; 9
3 ; 1
3 60 9 90
3 75 1 25
il Qu Q P Decil D P
Cuartil C P Cuartil C P
= = = =
= = = =


Para calcular el Percentil k, se procede en forma anloga a como se
hizo para el clculo de la Mediana, pero cambiando el valor determinante n/2 por
nk/100 0.01 n k . As, para datos agrupados por intervalos,

1
1
1
01 . 0



+ =
j j
j
j j k
F F
F k n
c y P
Ejemplo: Consideremos los datos referentes al Tiempo de armado
de carburador que se describen en el caso de la pgina anterior. Calculemos el
65
P .
Aqu, el valor determinante es 0.01 n k = 0.01 72 65 = 46,8 ;
esto implica que, de acuerdo al cuadro 48
3
= = F F
j
. Por lo tanto ,
| | 24 ; 20
3 65
= I P c
. 7 . 23
29 48
29 8 . 46
4 20
65
min P =

+ =
Interpretacin: El 65 % de los operarios empleara entre 12 y
23.7 minutos en el armado del carburador.

4. LA MODA O MODO.

La Moda, que designaremos Mo, se define como aquel valor de la
variable que se presenta con mayor frecuencia en la distribucin. Una distribucin
puede tener ms de una moda.
La Moda para datos no agrupados.
Cuando los datos no estn agrupados, la moda es aquel dato x
j
que se
repite ms veces en la distribucin.

La Moda para datos agrupados por valores puntuales.
Para calcular la Moda, en este caso, se ubica la frecuencia absoluta
mxima que llamaremos f
j
. Entonces la Moda es el valor correspondiente a la
clase y
j
.

La Moda, para datos agrupados por intervalos.
Tal como en el caso anterior, para calcular la Moda se ubica primero la
frecuencia absoluta mxima f
j
. Entonces, la Moda pertenece al intervalo
| |
j j j
y y I ;
1
= , que llamaremos Intervalo Modal. Luego, la Moda se calcula
mediante la siguiente frmula ,

( ) ( )
1 1
1
1
+

+

+ =
j j j j
j j
j j
f f f f
f f
c y Mo

Ejemplo: Retomemos el caso anterior, para calcular e interpretar la
Moda de la distribucin.

Aqu: 19
3 max
= = = f f f
j
, luego la Mo | | 24 ; 20
3
= e I
Por lo tanto, Mo
( ) ( )
7 , 21
15 19 16 19
16 19
4 20 =
+

+ =
Interpretacin: Lo ms frecuente sera que un operario emplee 21,7
minutos en el armado del carburador.

MEDIDAS DE DISPERSIN o DE VARIACIN.

En esta seccin continuaremos con la discusin de cmo describir un
conjunto de observaciones por medio de medidas estadsticas, las cuales dan
informacin acerca de algn aspecto del comportamiento de la poblacin en
estudio para una variable X.
Uno de los aspectos que se consideran para caracterizar el
comportamiento de una poblacin, para una variable en estudio es la
Variabilidad , que tiene que ver con el hecho de que el fenmeno en estudio,
asociado a la variable se manifiesta de manera diferente cuando se observa en
cada elemento de la poblacin en estudio.
En general, es deseable que los elementos de una poblacin, para una
variable en estudio, sean lo ms parecidos posible; o sea que varen muy poco
entre ellos.
Este aspecto se puede cuantificar mediante ciertos valores que pueden
calcularse a partir de los datos disponibles.
Mientras las medidas de variacin ( o de dispersin) son, con toda
seguridad, tiles para propsitos descriptivos, una apreciacin ms completa de la
importancia del concepto de variacin no ser posible hasta que no se comience
el estudio de la Inferencia Estadstica, entonces, posiblemente quedar claro por
qu casi se puede decir que, la inferencia estadstica puede ser definida como el
estudio de la variacin.
Existen varias medidas de resumen que sirven para cuantificar la
variabilidad en el comportamiento de una poblacin en estudio; sin embargo, en
esta ocasin analizaremos slo las ms importantes, y que son de uso frecuente,
tales como: la Desviacin Tpica, el Coeficiente de Variacin y el Puntaje Tpico.

1. LA VARIANZA Y LA DESVIACIN TIPICA MUESTRAL.

La medida de dispersin de uso ms frecuente es, sin lugar a dudas, la
Varianza y su raz cuadrada, llamada Desviacin Tpica ( o Desviacin
Estndar). La Desviacin Tpica, es una medida de dispersin absoluta, que se
usa para cuantificar el aspecto variabilidad dentro del comportamiento de una
poblacin, para una variable en estudio.

La Desviacin Tpica para datos no agrupados.
Consideremos un conjunto de n datos:
n
x x x ........., , ,
2 1
, los cuales
constituyen una muestra de la poblacin en estudio, entonces la Desviacin Tpica
Muestral de X, se define:

( ) n , ,......... 2 , 1 i , x x
1 n
1 2
i
s =

=



Observaciones:
a) La Desviacin Tpica s, se interpreta como un promedio de las diferencias entre
cada valor de la variable respecto del valor medio de ella.
b) El valor
2
s es la Varianza Muestral de X, y es siempre mayor o igual a cero.
Por lo tanto, lo mismo ocurre con la Desviacin Tpica s.
c) Para una poblacin de N elementos, el clculo se hace dividiendo la sumatoria
de la frmula anterior por N en vez de por n 1. En tal caso, la Desviacin Tpica
se denomina o.

La Desviacin Tpica para datos agrupados por valores
puntuales.
Supongamos que los datos de la muestra estn clasificados en k clases
i
y
, entonces la Desviacin Tpica s, se define:
( ) k , ,......... 2 , 1 i , f x y
1 n
1
i
2
i
s =

=



La Desviacin Tpica para datos agrupados por intervalos.
Consideremos que los datos de la muestra estn clasificados en k
intervalos
i
I , entonces la Desviacin Tpica s, se define:

( ) k , ,......... 2 , 1 i , f x M
1 n
1
i
2
i
s =

=



Recordemos que
i
M es la Marca de Clase del intervalo
i
I .
Ejemplo: Calcular e interpretar la Desviacin Tpica muestral de la
Venta diaria de Kioskos, informacin que se describe en el siguiente Cuadro. El
cuadro incluye, adems, los clculos necesarios para obtener la desviacin s.

VTA.DIARIA
(MILES DE $)
N DE NEG.

i
f

i
M
i i
f M
x M
i

( )
i i
f x M
2

Hasta 14 9 11 99 -9.9 882,1


14 20 12 17 204 -3,9 182,5
20 26 10 23 230 2,1 44,1
26 32 14 29 406 8,1 918,5

= 45

= 939

= 2 , 2027

07 , 46 44 : 2 , 2027 ; 9 , 20 45 : 939
2
= = = = s x , luego , s = 6,787
Interpretacin: La venta promedio diaria por kiosko, sera de $
20.900, con una variabilidad absoluta de $ 6.787.
Tambin se puede decir que el promedio de las diferencias entre las
ventas diarias de cada kiosko en relacin a la venta promedio, por kiosko, sera de
$ 6.787.-
Observacin: En este ejemplo podemos apreciar que el clculo de la
media y la desviacin tpica implica bastante tiempo, pero esto se puede obviar si
se dispone de una calculadora cientfica.

2. EL COEFICIENTE DE VARIACIN.

El Coeficiente de Variacin, que designaremos CV, es una medida de
dispersin relativa que se define para una variable X, en la siguiente forma:
% 100
x
s
CV
x
s
CV o = =
El Coeficiente de Variacin se utiliza para medir el grado de
homogeneidad, o de parecido de los elementos de la poblacin en estudio.
As, los elementos de dicha poblacin sern ms parecidos u homogneos en la
medida que el coeficiente de variacin sea ms cercano a cero.

Ejemplo: Calcular e interpretar el coeficiente de variacin para el
ejemplo anterior:
% 5 , 32 325 , 0
9 , 20
787 , 6
= = = CV
Osea, en relacin a la Venta diaria, los kioskos tendran un grado de
homogeneidad de un 32,5%.

Observacin : La Media, la Desviacin Tpica y el Coeficiente de
Variacin, son las medidas que se usan frecuentemente para caracterizar el
comportamiento de una poblacin en relacin a una variable en estudio.
En el ejemplo, que acabamos de desarrollar podemos concluir, basndonos
en los resultados obtenidos para dichas medidas que: La Venta Promedio Diaria
por kiosko sera de $ 20.900.-, con una variabilidad absoluta de $ 6.787.-, y una
variabilidad relativa al promedio de 32.5%.

Observacin: El coeficiente de variacin es una medida de dispersin
relativa, lo cual implica que no depende de la unidad de medida de la variable en
estudio. Esto hace que esta medida sea til para comparar, por ejemplo: dos
poblaciones en relacin al comportamiento de una misma variable, o una poblacin
en relacin al comportamiento de dos variables. As, se podr determinar cul
poblacin es ms homognea, o, respecto de qu variable la poblacin presenta
un mayor grado de homogeneidad.

3. EL PUNTAJE TIPICO.

El Puntaje Tpico para un valor particular
0
x , que designaremos z (x
o
),
es una medida de dispersin relativa, ella cuantifica la desviacin del valor
particular
0
x respecto de la Media, en unidades de Desviacin Tpica.
Se define , z (x
0
) =
s
x x
0

Por lo tanto, se puede considerar que z servira para comparar el
comportamiento de un elemento particular de la poblacin, en relacin al
comportamiento general de ella, que est caracterizada por la Media que cuantifica
la Tendencia y por la Desviacin Tpica que cuantifica la Variabilidad.

Ejemplo: Consideremos el caso de las Ventas diarias de los kioskos. Aqu
vamos a calcular e interpretar los puntajes tpicos para dos kioskos: uno que vende
$ 25.400 diarios, y otro que vende $ 14.800.-
a) 66 , 0
787 , 6
9 , 20 4 , 25
) 4 , 25 ( z =

=
Esto significa que el kiosko que vende $ 25.400.- diarios estara sobre la venta
promedio por kiosko, 0,66 veces la desviacin tpica.

b) 9 , 0
787 , 6
9 , 20 8 , 14
) 8 , 14 ( z =

=
Por lo tanto, el kiosko que vende $ 14.800 diarios estara bajo la venta
promedio por kiosko, 0,9 veces la desviacin tpica.











GUIA 2 DE EJERCICIOS

1. En un conjunto de fbricas que producen artculos electrnicos existen 5
tipos de Incentivos de Produccin, sobre el sueldo base de los trabajadores (en
porcentaje). En el siguiente Cuadro, aparecen dichos incentivos y las frecuencias
relativas acumuladas correspondientes. El estudio se hizo en base a una muestra
de 83 trabajadores.
INCENTIVOS
( EN % )
PORCENTAJES
(ACUMULADOS)
10 21,7
15 48,2
25 66,3
30 88,0
33 100,0

a) Complete el Cuadro de Frecuencias con :
i i i
F y h f ;
b) Construya los Grficos correspondientes. Interprete.
c) Calcule e interprete : la Media, la Desviacin Tpica y el Coeficiente de
Variacin.
d) Calcule e interprete : la Moda, la Mediana y el Percentil 65.
e) Calcule e interprete el Puntaje Tpico de un trabajador que recibe 30% de
incentivo sobre su sueldo base.
f) Calcule, qu porcentaje de los trabajadores recibiran 15 % o 25 % de
incentivo sobre su sueldo base.
2. En una masa de datos, correspondientes a una variable continua los valores
mximo y mnimo son 243 y 37, respectivamente.
a) Defina 7 intervalos de clase de igual amplitud.
b) Defina 5 intervalos de clase de igual amplitud.

3. En el siguiente Cuadro, se describe el comportamiento del Gasto
operacional semanal (en miles de pesos), en una muestra de 64 servicentros
Copec, en las regiones, sin considerar Santiago.

GASTO OPERAC. SEMANAL
(MILES DE PESOS)
SERVICENTROS
350 400 5
400 450 11
450 500 9
500 550 14
550 600 12
600 650 6
650 700 7


a) Complete el Cuadro de Frecuencias.
b) Construya los Grficos correspondientes. Interprete.
c) Calcule e interprete : la Media, la Desviacin Tpica y el Coeficiente de
Variacin.
d) Elabore una conclusin en base a los resultados anteriores.
e) Calcule e interprete : la Moda, la Mediana y el Percentil 70.
g) El gasto semanal de un servicentro est bajo el gasto promedio semanal por
servicentro, 1,03 veces la desviacin tpica, calcule el gasto semanal de dicho
servicentro.
h) En Santiago, el gasto promedio por servicentro fue $ 605.000.- con una
variabilidad absoluta de $ 62.972. Compare lo anterior con lo que ocurre en
regiones y elabore una conclusin en base a las Medias y a los Coeficientes de
Variacin.
i) Determine qu porcentaje de los servicentros de regiones tendran un gasto
superior a $ 565.000 semanales.
i) Determine qu porcentaje de los servicentros de regiones tendran un gasto
entre 425000 y 575000 pesos.
j) Si el total de servicentros de las regiones es de 7200, calcule aproximadamente
cuntos de ellos tendran un gasto inferior a $ 580000.
k) Si el total de servicentros de las regiones es de 7200, calcule aproximadamente
cuntos de ellos tendran un gasto semanal entre 450000 y 600000 pesos.
4. Los siguientes datos corresponden al nmero de reparaciones por mquina,
para una muestra de 68 .

3 5 2 4 0 5 3 1 3 4 2 2
3 1 4 0 2 1 4 2 5 2 4 5
3 1 3 0 5 3 2 5 0 3 4 1
3 4 1 3 4 3 0 4 5 0 1 2
1 5 3 3 3 2 4 0 3 4 2 4
3 2 4 1 1 5 3 4

a) Construya un cuadro de frecuencias, e interprete un resultado de cada
columna.
b) Construya los grficos de barras y en escalera. Interprete una de las barras y
uno de los escalones.
c) Calcule, usando el cuadro de frecuencias : la media, la desviacin tpica, el
coeficiente de variacin, la moda, la mediana y el percentil 67.

5. La informacin que se da a continuacin corresponde a la captura mensual de
anchoveta, por goleta, en una muestra de 45 de ellas. Los datos estn expresados
en toneladas, y la muestra proviene de una poblacin total de 745 goletas.
1540 1862 2352 1274 2054 2345 1465 1347 1745 1963 2147
1662 1486 1275 1945 2200 1748 1565 1678 2345 1865 1476
1628 1275 1566 1672 1345 1862 1432 2021 1658 1830 1476
1325 1478 1965 1275 1586 1976 2248 1476 1325 1278 1155

a) Construya un cuadro de frecuencias de 6 intervalos, de igual amplitud, e
interprete un valor de cada columna.
b) Construya el histograma y la ojiva. Interprete la segunda barra del histograma
y el tercer punto de la ojiva.
c) Use el cuadro de frecuencias, para calcular e interpretar : la media, la
desviacin tpica,el coeficiente de variacin y el puntaje tpico para una goleta que
captura 2300 toneladas en un mes.
d) Use el cuadro de frecuencias, para calcular , aproximadamente, cuntas
goletas de las 745 capturaran menos de 1500 toneladas.
e) Use el cuadro de frecuencias para calcular, en forma aproximada, qu
porcentaje de las goletas deberan capturar entre 1400 y 1800 toneladas
mensuales de anchoveta.
f) Suponga que, en otro puerto pesquero, los barcos de la flota tienen una
captura promedio por goleta de 1568 toneladas mensuales, con una variabilidad
absoluta de 182 toneladas. Compare los dos coeficientes de variacin y, de
acuerdo a los resultados, elabore una conclusin.
a) Use el cuadro de frecuencias para calcular e interpretar la moda de la
distribucin.
b) Use el cuadro de frecuencias para calcular e interpretar el tercer quintil de la
distribucin.

6. Una empresa de movilizacin colectiva posee 66 buses. Cada da Jueves, se
controla el gasto de petrleo, considerando 8 horas de funcionamiento. Los datos
recogidos en uno de estos controles se describen en el siguiente cuadro.

GASTO (litros) BUSES GASTO (litros) BUSES
50 - 55 3 75 - 80 10
55 - 60 6 80 - 85 9
60 - 65 5 85 - 90 8
65 - 70 9 90 - 95 5
70 - 75 7 95 - 100 4

a) Calcule e interprete : la media, la desviacin tpica, el coeficiente de variacin, la
moda, la mediana y el percentil 38.
b) Calcule e interprete el puntaje tpico de un bus que, en un da, gasta 65,5 litros
de petrleo.
a) En esta empresa se ha implementado un sistema de mantencin de cada
bus, cada cierto nmero de das y de acuerdo a los rangos de gasto de
combustible, criterio que se describe a continuacin.

MANTENCION GASTO (litros) PORCENTAJE
Cada 10 das 50 - 68
Cada 7 das 68 - 87
Cada 5 das 87 - 100

Calcule, aproximadamente, que porcentaje de los buses deberan revisarse de
acuerdo a este criterio. Los resultados regstrelos en la tercera columna del cuadro.

7. En el siguiente cuadro se describen los porcentajes acumulados, respecto del
nmero de accidentes mensuales, ocurridos en una muestra de 84 goletas
pesqueras.

ACCIDENTES 1 2 3 4 5 6
PORCENTAJES
ACUMULADOS

34,9

58,1

76,7

88,3

95,3

100

a) Calcule e interprete: la media, la desviacin tpica, y el percentil 85.
b) Construya el grfico de barras y el grfico en escalera.
c) Interprete el valor de la tercera frecuencia relativa acumulada.
d) Calcule e interprete : la mediana, el coeficiente de variacin y la moda.
e) Construya el cuadro de frecuencias.

8) El grupo de vendedores, de una empresa distribuidora, se compone de 200
hombres y 150 mujeres. Respecto del monto de las ventas diarias de los
vendedores, se tiene la siguiente informacin.
Para los hombres: CV = 5,8 % ; Media = $ 540000.
Para las mujeres : CV = 9,6 %. ; Media = $ 685000.

a) Calcule e interprete la venta promedio por vendedor.
b) Si un hombre vende $ 620.000 , y una mujer $ 710.000 , Cul de los dos
tendra un rendimiento mejor dentro de su grupo.







CAPITULO 4
DESCRIPCION DE LA INFORMACIN RELACIONADA
CON DOS CARACTERSTICAS DE UNA POBLACIN

GENERALIDADES.

En este captulo, nos abocaremos al anlisis de una poblacin estadstica
de la cual nos interesa su comportamiento respecto de dos caractersticas variables
X e Y. En general, stas sern observadas en cada elemento de una muestra de
dicha poblacin, es decir, cada observacin o dato estar compuesto de un par de
nmeros ( )
i i
y x , , donde
i
x representa el valor de la variable X e
i
y el de la
variable Y, observados ambos en un mismo elemento i de la muestra.
Podemos hablar entonces de una Variable Bidimensional ( ) Y X, ; por
lo tanto, la masa de datos, obtenidos en la muestra de tamao n, consistir de
un conjunto de n pares ordenados ( )
i i
y x , .
Supongamos, por ejemplo, que estamos interesados en las Ventas
mensuales Y versus los Gastos mensuales de Propaganda X , en los negocios
que venden artculos electrnicos. Para esto, podemos elegir una muestra, por
ejemplo, de 20 negocios y, en cada uno de ellos, indagamos por las Ventas y el
Gasto de Propaganda, obtenindose as una masa de 20 pares ordenados.

Masa de datos = ( ) ( ) ( ) { }
20 20 2 2 1 1
, ........ , , , y x y x y x , donde , por
ejemplo, ( )
2 2
, y x indica que, en el segundo negocio encuestado la Venta Mensual
era de $
2
y y el Gasto en Propaganda era de $
2
x .

Para describir la informacin obtenida en una muestra de n datos, de
una variable bidimensional ( X,Y ) , se usan generalmente cuadros estadsticos de
doble entrada, grficos y/o medidas de resumen.

El Anlisis de Regresin y Correlacin , nos proporcionar la metodologa



para pesquisar si existe alguna relacin entre las dos variables, cul funcin se
ajusta mejor a los datos observados en la muestra y, tambin, cmo medir la
calidad de dicho ajuste.

CUADRO DE DOBLE ENTRADA.

El Cuadro de Doble Entrada, es un instrumento estadstico que sirve para
describir el comportamiento de una masa de datos, de una variable ( X,Y ),
observados en una muestra.
Para construirlo se deben determinar las Clases, o los Intervalos de
Clase, que servirn para clasificar la informacin que se tiene tanto de la variable
X como de la variable Y.
Para la Masa de Datos obtenidos para la variable (X, Y), el Cuadro de
Doble Entrada tiene en general la siguiente forma.

ENCABEZAMIENTO
Y
X

1
y
2
y
j
y

r
y
TOTAL

i
f .

1
x
11
f
12
f
j
f
1

r
f
1

1
f .

2
x
21
f
22
f
j
f
2

r
f
2

2
f .

i
x
1 i
f
2 i
f
ij
f
r i
f
i
f .

k
x
1 k
f
2 k
f
j k
f
r k
f
k
f .
TOTAL
f
. j


1 .
f
2 .
f
j
f
.

r
f
.

f.. = n

Respecto del cuadro se deben hacer las siguientes observaciones:
a) Los datos observados de la variable x, se suponen clasificados en k clases
( o en intervalos de clase). Anlogamente, los datos obtenidos para Y estn
clasificados en r clases ( o en intervalos de clase). Se dir entonces que la
informacin obtenida est descrita en un Cuadro de k x r., o sea, de k filas por r
columnas. El cuadro se genera al asignar cada par ordenado de la muestra a la
casilla ij correspondiente.
b) En el Cuadro,
ij
f es una frecuencia absoluta que indica el nmero de
veces que, en la masa de datos, se repiten el valor
i
x de la variable X, junto con el
valor
j
y de la variable Y. En otras palabras, el nmero de veces que, en el total
de n datos, aparece el par (
i
x ,
j
y ) .
c) A la parte central del cuadro , o sea, a la que contiene a las frecuencias
ij
f ,
la llamaremos Matriz de Frecuencias de k filas por r columnas, cada par
ordenado ser clasificado entonces en una de las casillas de la Matriz.
d) La Fila de Totales generada por f
.j
donde j = 1, 2,........r, la llamaremos
Fila Marginal; mientras que, los totales descritos por f
i.
, donde i= 1 , 2 , .........k,
se dirn que estn en la Columna Marginal. Es obvio que, f
..
= n.
e) La Frecuencia Marginal f
i.
, indica el nmero de veces que en los datos se
repite el valor
i
x de la variable X, independiente del valor que toma la variable Y.
f) En cambio, f
.j
nos indica en cuntos de los n elementos de la muestra se
ha observado el valor
j
y de la variable Y, sin considerar lo que ocurre con la
variable X.

Ejemplo:
Estamos interesados en hacer un anlisis de los Sueldos, y del Nmero de
Cargas Familiares, de los profesores de Enseanza Bsica de la ciudad. Para esto
se elige una muestra representativa de ellos. Vamos a suponer que los datos
obtenidos son los que se describen en la siguiente masa de datos, que se
encuentra en la pgina siguiente. All, cada profesor encuestado tiene un nmero
de identificacin, junto con lo valores correspondientes a sus Cargas Familiares X,
y a su Sueldo Y, en miles de $.









PROFESOR CAR. FAM. X SUELDO
SEMANAL Y
PROFESOR CAR. FAM. X SUELDO
SEMANAL Y
1 2 25,7 33 1 30,8
2 3 29,4 34 2 61,7
3 3 32,5 35 1 45,2
4 0 25,0 36 3 57,4
5 1 33,7 37 1 30,5
6 3 45,3 38 2 39,6
7 2 58,7 39 1 32,3
8 0 21,5 40 2 42,7
9 2 39,7 41 3 37,5
10 2 49,3 42 2 28,3
11 1 33,8 43 3 45,3
12 3 62,4 44 1 31,4
13 0 47,2 45 1 36,2
14 2 39,4 46 0 38,8
15 1 28,4 47 1 41,7
16 2 45,6 48 3 27,6
17 2 52,3 49 2 35,4
18 3 39,7 50 0 47,2
19 0 28,2 51 1 52,8
20 3 25,6 52 2 29,4
21 2 37,9 53 3 39,6
22 1 58,2 54 2 54,7
23 2 49,3 55 0 50,5
24 0 50,6 56 0 41,7
25 1 48,9 57 1 30,8
26 1 53,6 58 2 25,6
27 3 60,7 59 3 58,2
28 1 44,8 60 2 32,9
29 2 30,5 61 3 52,7
30 2 60,7 62 2 45,3
31 1 58,5 63 3 61,5
32 2 38,3 64 2 42,7

Para la construccin del Cuadro, procederemos de la siguiente manera:
a) Supongamos que, la informacin que tenemos la queremos describir en un
Cuadro de 4 x 3. Esto significa que los datos de la variable Cargas Familiares X,
las clasificaremos segn 4 clases, mientras que los Sueldos Y sern clasificados
segn 3 intervalos.
b) Determinemos las clases y los Intervalos. Los diferentes valores que toma
la variable cargas familiares, en la masa de datos, constituyen las clases y en este
caso son : 0, 1, 2, 3. Por otra parte, para determinar los 3 intervalos consideramos
lo siguiente:
5 , 21 ; 4 , 62 = =
min max
y y ; Rango = 62,4 - 21,5 = 40,9
40,9 : 3 = 13,6 ; luego, c = 14
Esto significa que si queremos clasificar la informacin en base a
Intervalos de igual amplitud debemos ampliar el Rango a 42 3 14 = - , luego los
intervalos de clase sern:
] 21 - 35 ] ] 35 - 49 ] ] 49 - 63 ]

c) Una vez definidas las clases y los intervalos se toma cada uno de los datos
( X, Y), obtenidos en los 64 profesores encuestados, y se clasifican en las casillas
correspondientes del Cuadro de Doble Entrada.

d) Lo anterior genera el Cuadro, que aparece a continuacin, el cual describe en
forma resumida al grupo de observaciones obtenidas en los 64 profesores.

CARGAS FAMILIARES V/S SUELDOS SEMANALES (miles $)
PROFESORES E. BASICA. (ABR. 2007)
SUELDOS Y
CARG.FAM. X
21 - 35 35 - 49 49 - 63
TOTAL
0 3 4 2 9
1 8 5 4 17
2 6 10 7 23
3 4 5 6 15
TOTAL
21 24 19 64

Usando lo que directamente describe el Cuadro, redactemos algunas
interpretaciones:
10
32
= f ; esto indica que 10 de los profesores encuestados tenan 2
cargas familiares y un sueldo entre 35.000 y $ 49.000.-
19
3 .
= f ; de los profesores encuestados, 19 de ellos tenan un sueldo
entre 49.000 y $ 63.000.-
17
. 2
= f ; 17 de los profesores encuestados tenan 1 carga familiar.
Observacin.
Estas frecuencias absolutas se pueden expresar tambin en relacin a los
totales correspondientes usando porcentajes.

DISTRIBUCIONES DE LAS VARIABLES MARGINALES Y DE LAS
VARIABLES CONDICIONALES.

Consideremos un conjunto de datos de la variable bidimensional ( X, Y),
los cuales hemos descrito en forma resumida en un Cuadro de Doble Entrada.
Si estamos interesados en el comportamiento de X , independientemente
de lo que ocurre con Y, entonces hablaremos de la Distribucin de la Variable
Marginal X, o sea, para la muestra esta distribucin ser la siguiente:
X
k i
x x x x ... .......... .......... ........
2 1

Frec.
. . . 2 . 1
....... .......... ..
k i
f f f f
En cambio, la Distribucin de la Variable Marginal Y, ser:
Y
r j
y y y y ... .......... .......... ........
2 1

Frec.
r j
f f f f
. . . 2 . 1 .
.... .......... ..

Ahora bien, podemos interesarnos tambin en el comportamiento de la
variable Y, para un valor (o valores dentro de un intervalo) particular
m
x de la
variable X, nos referiremos entonces a la Distribucin de la Variable Condicional
m
X X
Y
=
(se lee Y condicionado a
m
x ).
Por ejemplo, la Distribucin de la Variable Condicional
2
X X
Y
=
, ser:

2
x X
Y
=

r j
y y y y ... .......... .......... ........
2 1

Frec.
r j
f f f f
2 . 2 22 21
........ .......... . ..
En cambio, la Distribucin de la Variable condicional
j
y Y
X
=
es,

j
y Y
X
=

k i
x x x x ... .......... .......... ........
2 1

Frec.
j k j i j j
f f f f
. . 2 1
.... .......... ..
Ejemplo: Usemos el Caso, descrito en la pgina anterior, para mostrar
distribuciones marginales y condicionales.

Distribucin de la Variable Marginal X.
Esta distribucin describe el comportamiento de las Cargas Familiares de
los profesores, sin considerar los Sueldos.
N DE CARGAS FAMILIARES POR PROFESOR
CARGAS. FAM. X
0 1 2 3
PROFESORES
9 17 23 15

Distribucin de la Variable Marginal Y.
Esta distribucin describe el comportamiento de los sueldos semanales de
los profesores, sin considerar las Cargas Familiares.

SUELDOS (miles de $) POR PROFESOR
SUELDOS Y
21 - 35 35 - 49 49 - 63
PROFESORES
21 24 19

Distribucin de la Variable Condicional
2 = X
Y
Esta distribucin describe el comportamiento de los Sueldos de los
profesores que tienen dos cargas familiares.

SUELDOS PROFESORES CON 2 CARGAS FAMILIARES
SUELDOS Y ( MILES DE $ )
21 - 35 35 - 49 49 - 63
PROFESORES
6 10 7

Interpretemos la segunda frecuencia. Ella indica que 10 de los 23
profesores, con dos cargas familiares cada uno, tienen sueldos que varan entre
35.000 y $ 49.000.-

Distribucin de la Variable Condicional
) 63 ; 49 ( Y
X
=

Esta distribucin describe el comportamiento de las Cargas Familiares de
los profesores con Sueldos entre 49.000 y $ 63.000.

CARGAS FAMILIARES DE PROFESORES CON
SUELDOS DE 49.000 A $ 63.000.
CARGAS FAMILIARES
0 1 2 3
PROFESORES
2 4 7 6

Interpretacin de la Tercera Frecuencia
De los 19 profesores con Sueldos entre 49.000 y $ 63.000, 7 de
ellos tienen cada uno 2 cargas familiares.

MEDIDAS DE RESUMEN DE VARIABLES MARGINALES Y DE
VARIABLES CONDICIONALES.

De acuerdo a lo descrito en los cuadros anteriores, podemos concluir que
las distribuciones definidas corresponden a variables de tipo unidimensional, por
lo tanto, en ellas podemos usar las medidas de resumen, ya estudiadas en los
captulos anteriores, para describir su comportamiento.
De acuerdo con esto, se podrn calcular e interpretar, por ejemplo, las
siguientes medidas de resumen: Media, Moda, Percentiles, Desviacin Tpica,
Coeficiente de Variacin, Puntaje Tpico, etc.; de las Variables Marginales X e Y,
algunas de las cuales aparecen a continuacin.

Medias M (X) M (Y)
Modas Mo (X) Mo (Y)
Percentiles ) ( X P
k
) (Y P
k
Desv. Tpicas S (X) S (Y)
Coef. De Variac. CV (X) CV (Y)
Punt. Tpico ) ( X
k
x
z ) (Y
k
y
z

Las mismas Medidas de Resumen se pueden calcular para las Variables
Condicionales, por ejemplo: |
.
|

\
|
=
i
x X
Y M ; |
.
|

\
|
=
i
y Y
X M ; |
.
|

\
|
=
k
x X
Y Mo |
.
|

\
|
=
r
y Y k
X P
, etc.
Ejemplo: Usemos el Caso descrito anteriormente, para calcular e
interpretar algunas de las siguientes medidas de resumen:

M (X) , S (X) , ) (
42
Y P y ) X ( P
) 49 ; 35 ( y 35 e

Distribucin de la Variable Marginal X.
CARGAS FAMILIARES
0 1 2 3
PROFESORES
9 17 23 15

De aqu se obtienen las medidas de resumen.
M (X) = 1.7 ~ 2 cargas S (X) = 0.99 ~ 1 carga
Es decir, el nmero promedio de cargas familiares por profesor, sera 2.
Por otra parte, el promedio de las diferencias entre el nmero de cargas
familiares de cada uno de los profesores respecto del promedio de cargas, por
profesor, sera igual a 1.

Para calcular ) (
42
Y P , usamos la Distribucin siguiente:
SUELDO Y
21 35 35 - 49 49 63
PROFESORES f
21 24 19
F 21 45 64


2 42 2
45 88 , 26 42 64 , 0 01 , 0 I P F F n k
j
e = = = =
Luego, ) (
42
Y P = 35 +
24
21 88 , 26
14


= 38,92 = $ 38.920
Es decir, el 42 % de los profesores tendran Sueldos entre 21.000 y
38.920 pesos.
Para calcular ) X ( P
) 49 ; 35 ( y 35 e
, usamos la siguiente distribucin,
) 49 ; 35 ( y
X
e

0 1 2 3
f 4 5 10 5
F 4 9 19 24


2 35 2
9 4 , 8 35 24 , 0 01 , 0 y P F F n k
j
= = = = =
Por lo tanto, ) X ( P
) 49 ; 35 ( y 35 e
= 1 carga familiar
Esto significa que el 35 % de los profesores, con sueldos entre 35.000 y
49.000 pesos, tendran cada uno 0 1 carga familiar.

PROBLEMA DE APLICACIN.
El siguiente Cuadro describe el comportamiento diario de los Gastos de
Operaciones (en miles de pesos), versus el Volumen de Produccin (en miles de
cajas, de una muestra de 117 plantas embotelladoras de cierta bebida gaseosa.

GASTOS Y
PRODUC. X
50 80 80 - 110 110 - 140 140 170
10 14 8 5 2 0
14 18 7 3 5 1
18 22 8 12 9 5
22 26 0 8 10 4
26 30 1 7 13 9

1) Compare los coeficientes de variacin de las variables marginales y, de
acuerdo a los resultados, elabore una conclusin.
2) Calcule e interprete el puntaje tpico z, de la planta embotelladora de
Arica, la cual tiene un gasto diario de $ 89.400 y en volumen de produccin est
clasificada en el tercer intervalo.
3) Calcule e interprete el volumen promedio de produccin diaria, por planta
embotelladora.
4) Calcule e interprete la moda de la variable marginal Y.
5) Calcule e interprete ) X ( P
) 140 ; 80 ( Y 73 e
.
6) Determine aproximadamente en cuntas de las 117 plantas embotelladoras
los gastos de operaciones seran superiores a $ 138.500.
7) De las plantas embotelladoras, que tienen un gasto operacional entre 80000 y
140000 pesos diarios, qu porcentaje de ellas produciran diariamente entre 16500
25500 cajas de bebidas
8) De las plantas embotelladoras, que tienen una produccin diaria entre 14000
y 26000 cajas de bebida, qu porcentaje de ellas tendran un gasto operacional
superior a $ 80000.
GUIA 3 DE EJERCICIOS

1. En el siguiente Cuadro, se describe la informacin obtenida en una muestra de
144 almacenes, en relacin con las utilidades mensuales (en millones de pesos), y
, las deudas anuales (en millones de pesos), que tienen dichas empresas con las
entidades financieras.

DEUDA
UTILIDAD
1,251,75 1,75-2,25 2,252,75 2,753,25
5,8 6,1 4 7 11 6
6,1 6,4 5 10 9 7
6,4 6,7 7 9 12 10
6,7 7,0 6 5 8 5
7,0 7,3 3 6 10 4

a) Calcule los coeficientes de variacin de las variables marginales. Compare los
resultados obtenidos y elabore una conclusin.
b) Calcule e interprete la Moda, para la utilidad mensual de los almacenes que
tienen una deuda anual entre 1,75 y 2,75 millones de pesos.
c) De los negocios que, en el mes obtuvieron una utilidad superior a 6,4 millones
de pesos, uno de ellos est por debajo de la deuda promedio en 1,23 unidades
de desviacin tpica. Calcule la deuda anual de dicho almacn.
d) Calcule e interprete cuntos almacenes, con deudas anuales superiores a 1,75
millones de $, obtuvieron utilidades entre $ 6.250.000 y $ 6.735.000.
e) Calcule e interprete el percentil 34 de la utilidad mensual de los almacenes.
f) Suponga que la muestra proviene de una poblacin de 4862 almacenes; calcule
en forma aproximada, cuntos tendran una deuda superior a 1.850.000 pesos.
g) Calcule qu porcentaje de los almacenes, con utilidades anuales inferiores a 7
millones de $, tendran deudas inferiores $ 2.530.000. Interprete el resultado
obtenido.



2. En el siguiente Cuadro, se describe la informacin obtenida en una muestra de
149 operarios de una empresa constructora, en relacin con sus edades y con los
das de licencia mdica, que tuvieron durante un ao de trabajo.

DIAS DE LIC. Y
EDAD X
7-12 12-17 17-20 20-23 TOTAL
30 33 4 11 7 6 28
33 38 5 9 10 7 31
38 - 43 7 9 12 5 33
43 - 50 6 10 8 11 35
50 58 3 6 9 4 22
TOTAL 25 45 46 33 149

a) Calcule los coeficientes de variacin de las variables marginales. Compare los
resultados obtenidos y elabore una conclusin.
b) Calcule e interprete la Moda, para la edad de los operarios, que tuvieron
durante el ao entre 12 y 20 das de licencia mdica.
c) De los operarios que, en el ao tuvieron menos de 17 das de licencia mdica,
calcule e interprete el puntaje tpico de aquellos que tienen 40 aos y, tambin, de
los que tienen 30 aos.
d) Calcule e interprete cuntos operarios, de los 149 considerados en la
muestra, tuvieron en el ao entre 15 y 21 das de licencia mdica.
a) Calcule e interprete el percentil 75 para la edad, de los operarios que
tuvieron menos de 20 das de licencia mdica durante el ao.
f) Suponga que la muestra proviene de una poblacin de 6875 operarios; calcule
en forma aproximada, cuntos tendran una edad inferior a 40 aos. Interprete el
resultado obtenido.
g) Del total de operarios, de la poblacin en estudio, determine en forma
aproximada, cuntos, de acuerdo a su edad, estaran dentro del segundo quintil.
Interprete el resultado obtenido. Adems calcule cuntos estarin entre el
segundo y el tercer quintil.
h) Calcule e interprete el tercer cuartil, para los das de licencia mdica, de los
operarios, que tienen ms de 45 aos de edad. Interprete el resultado obtenido.
CAPITULO 5
EL MODELO LINEAL SIMPLE

Generalidades
Consideremos una Poblacin en estudio, en relacin a dos variables X e Y, que
suponemos estn asociadas, en el sentido que, sera posible determinar el valor
esperado de la variable Y, para un valor dado de la variable X. Uno de los modelos
de uso muy frecuente, que se puede proponer para describir la relacin entre X e
Y, es el llamado Modelo de Regresin o de Prediccin Lineal Simple, que tiene la
siguiente forma,
Y = | X + o + c (1)
Donde: Y es la variable dependiente (o respuesta)
X es la variable independiente (o predictora)
| y o son los parmetros del modelo
c es el error aleatorio, es una variable, que se supone Normal, y
su valor esperado es cero.

Estimacin del Modelo
El Modelo (1), establece una relacin entre las variables X e Y, en la poblacin
en estudio. Pero, como no se conocen los parmetros | y o que determinan el
modelo, asociado al fenmeno particular en estudio, es necesario hacer una
estimacin de ellos mediante los resultados observados en una muestra aleatoria
de la poblacin en estudio.
As, se obtienen los estimadores B y A, de los parmetros | y o
respectivamente, con lo que el Modelo Lineal Simple, estimado, es,
y

= B x + A (2)
Geomtricamente este modelo representa una Lnea Recta, la cual,
tericamente, se ajustara a los puntos muestrales, asociados a los n datos
muestrales : (x
1
, y
1
), (x
2
, y
2
). .., (x
n
, y
n
) ; donde , el par (x
i
, y
i
) es la
observacin hecha en el elemento i, de la muestra, tanto para la variable X, como
para la variable Y.
Al ubicar, en el plano geomtrico, los puntos muestrales, asociados a los n
datos muestrales ( x
i
, y
i
), resulta una figura llamada Diagrama de Dispersin.
Este diagrama, ayuda a visualizar si los puntos tienden, o no a alinearse segn una
recta. Ahora bien, suponiendo que sea posible ajustar una lnea recta, debemos
determinar cual, de todas las posibles rectas, sera la ms adecuada.
El llamado Mtodo de Mnimos Cuadrados, plantea que la recta, asociada a la
ecuacin, y

= B x + A , que se ajusta mejor al conjunto de puntos muestrales


(x
i
, y
i
) es aquella en que se verifica que, la suma de los errores cuadrticos es
mnima. O sea, (
i i
y y )
2
es Mnima , donde: i = 1, 2, , n e
i
y es el
valor de Y, estimado por el modelo, para x = x
i
, e y
i
es el valor observado en la
muestra para x= x
i

Los parmetros estimados del modelo ( mnimo cuadrtico ), se calculan con
las frmulas :

=
2 2
) (
) ( ) (
i
i
i i i i
x x n
y x y x n
B

n
x
n
y
i i
B A

=

En el Grfico siguiente, se describe la situacin de los puntos mustrales, en el
plano geomtrico, junto con la recta, asociada a la ecuacin A Bx y + = ,
ajustada por el mtodo de mnimos cuadrados.









.
.
.
.
.
.
.
.
.
.
0
y
0
y

0 0
y y


Y
A x B y + =





Observaciones:
1. En el modelo, y = B x + A , y nos da el valor esperado de la respuesta Y,
para un valor determinado de la variable predictora X.
2. B nos da la variacin que experimenta la respuesta Y, cuando X varia en una
unidad.
3. Esta variacin puede ser positiva o negativa. As, si B > 0 implica que el valor
esperado de Y vara directamente con X; mientras que, B < 0 implica que la
variacin es inversa.
4. A nos da el valor esperado de la respuesta Y , para x = 0.
5. Tericamente el modelo permite calcular Y para cualquier valor de X ; sin
embargo, hay restricciones que deben tomarse en cuenta para cada caso
particular; como por ejemplo, si realmente tiene sentido el valor esperado de Y ,
cuando X = 0 , o cuando X es un nmero negativo , o cuando X es un nmero
muy grande.
6. Las calculadoras cientficas tienen el mdulo estadstico LR ( o REG ), que
permite determinar, rpidamente, los valores de B , A y r
7. El Error Estndar de la Estimacin de y sobre x , se calcula con la frmula ,

2

2
)

(
2 2
/


=

n
y A y x B y
n
y y
i i i i i i
x y
s
Geomtricamente, el error estndar de la estimacin de y sobre x , mide la
dispersin de los puntos en torno a la recta de regresin y = B x+ A

Ejemplo: Una empresa desea modelar la relacin entre sus Ventas anuales , y
las Ventas, del ao anterior, de la industria en general (en miles de UF). Para
esto, se eligi una muestra, obtenindose los siguientes resultados:

AO 2001 2002 2003 2004 2005 2006
VTA.CIA. 0,53 1,08 1,12 1,45 1,38 1,67
VTA.IND. 10,20 12,25 12,85 14,90 14,10 15,20
0
x
X
AO 2000 2001 2002 2003 2004 2005


a) Ajuste, a los datos un modelo lineal simple.
b) Use el modelo para estimar la venta esperada por la empresa para el ao
2007.
Definamos las variables, de acuerdo al objetivo del anlisis.
La variable respuesta y es la venta anual de la empresa; mientras que, la
variable predictora x es la venta anual de la industria en general, en el ao
anterior.
Usando el mdulo REG, de una calculadora cientfica, se obtienen los siguientes
resultados : A = -1,546 y B = 0.208 ; por lo tanto, el modelo estimado es,
y

= 0,208 x 1,546
Geomtricamente, este modelo est asociado a una recta, la cual est ajustada
a los 6 puntos muestrales.
La venta esperada para el 2007 se obtiene reemplazando, en el modelo, el
monto de la venta de la industria en general, en el 2006. Supongamos que esta
fue de 15,8 (miles de UF). Entonces, y

= 0,20815,8 1,546 = 1,7404 ; o sea,


la venta esperada para el 2007 sera de 1,7404 miles de UF.

El Modelo Exponencial
Consideremos una muestra de n datos: (xi , yi) con i=1, n
Supongamos que, a este conjunto de observaciones podemos ajustar una
Funcin Exponencial, tal como,
Y = a b
x
(1)
Ahora bien, para obtener estimaciones de los parmetros a y b en base a los
datos de la muestra, de la poblacin en estudio, hagamos las siguientes
consideraciones:
1) Apliquemos a la igualdad (1) la funcin logaritmo natural ln, esto genera la
siguiente expresin.
ln(Y) = X ln(b) + ln(a)
2) En esta igualdad, hagamos las siguientes sustituciones:
Z = ln(Y) ; B = ln(b) ; A = ln(a)
3) Obtenemos as, la siguiente igualdad,
Z = B X + A
Sabemos que esta relacin est asociada a una Recta, donde B y A, se
obtienen en base a los n datos muestrales ( x
i
, ln y
i
), ajustando un modelo lineal
simple.
4) Entonces, los valores de B y A, se obtienen con las frmulas:


=
2 2
) (
) ln ( ) ( ln
i
i
i i i i
x x n
y x y x n
B

n
x
n
y
i i
B A

=
ln


5) Una vez determinados los valores de B y A, podemos encontrar los valores de
a y b, de la exponencial que se ajusta a los datos:
B = ln(b), lo cual implica que, b = anti ln(B)
A = ln(a), lo cual implica que, a = anti ln(A)

Ejemplo: Una empresa, que exporta cierto producto, desea predecir las
Ventas para el ao 2008, para esto dispone de los datos histricos que se dan a
continuacin, donde la variable predictora es t (en aos), y la variable dependiente
es la Venta V (en millones de dlares). La variable , toma valores enteros entre
1, que corresponde al ao 2000 y 8, que corresponde al 2007.

Ao Tiempo t Venta V Ao Tiempo t Venta V
2000 1 5,1 2004 5 6,9
2001 2 5,4 2005 6 7,5
2002 3 5,9 2006 7 8,9
2003 4 6,4 2007 8 11,2
Ajustaremos a estos datos un modelo exponencial, esto implica determinar los
valores de a y b, en el modelo, V = a b
t

Recordemos que, los pares ordenados son de la forma (t, 1n V), o sea, los
datos son:
T 1 2 3 4 5 6 7 8
Ln(V) 1,63 1,69 1,77 1,86 1,93 2,01 2,19 2,42

De aqu, se obtienen: B = 1n(b) = 0,105 y A = 1n(a) = 1,465
Por lo tanto, esto implica que: b = antiln(0,105) = 1,111
a = antiln(1,465) = 4,328
Entonces, el modelo exponencial estimado, ajustado a los datos es,
V = 4,328 ( 1,111 )
t

Si en este modelo hacemos t = 9, que corresponde al ao 2008, obtenemos la
venta estimada, o sea,
V (1998) = 4,328 ( 1,111 )
9
= 11,16 millones de dlares


ELEMENTOS DEL ANLISIS DE CORRELACIN
Hemos determinado la Ecuacin de la Recta, mnimo cuadrtica, descrita por,
y

= B x + A , asociada al modelo lineal simple (as como tambin se ha


analizado el modelo exponencial). Dicha recta, es la que mejor ajusta a la nube de
puntos, correspondientes a los datos muestrales, en el sentido dado por el criterio
mnimo cuadrtico. Se dice que, tal recta, es la que mejor ajusta a las
observaciones muestrales.
Sin embargo, el hecho de que podamos determinar dicha recta, para cualquier
conjunto de datos muestrales, no garantiza que el ajuste sea de buena calidad,
tampoco garantiza que tal dependencia funcional exista.
Debemos abordar entonces el problema de medir la calidad del ajuste lineal, al
respecto, diremos que:
1) El ajuste es perfecto, si todos los puntos observados quedan sobre la
recta ajustada.
2) El ajuste no es perfecto, si ocurre lo contrario.
3) Entre dos ajustes no perfectos, diremos que es mejor aquel que presenta una
menor dispersin conjunta, de los puntos respecto de la recta de regresin.
Para medir la calidad del ajuste lineal, se usa una medida llamada Coeficiente
de Correlacin, que designaremos por r, o su cuadrado r
2
, llamado Coeficiente
de Determinacin. Para n datos muestrales (x
i
, y
i
), el clculo de r se hace con
la frmula,




=
) ) ( ( ) ) ( (
) ( ) (
2
2
2
2
i i i i
i i i i
y y n x x n
y x y x n
r

Observaciones:

1) El valor de r, vara entre 1 y +1. La calidad del ajuste es mejor, en la
medida que, r sea ms cercano a 1 o +1.
2) El valor de r, cuando se trabaja con el modelo exponencial, se calcula con la
misma frmula, pero cambiando y
i
por 1n(y
i
).
La Tabla que se da a continuacin, contiene los valores crticos, de referencia de r,
que serviran para decidir si habra evidencia de relacin lineal, entre las variables
X e Y, de acuerdo al tamao n de la muestra.

Tabla de Puntos de Decisin r
dec
para determinar
Correlacin Lineal para diferentes tamaos muestrales

n r
dec
n r
dec
n r
dec


5 0,787 14 0,532 26 0,388
6 0.811 15 0,514 28 0,374
7 0,754 16 0,497 30 0,361
8 0,707 17 0,482 40 0,312
9 0,666 18 0,468 50 0,279
10 0,632 19 0,456 60 0,254
11 0,602 20 0,444 80 0,220
12 0,576 22 0,423 100 0,196
13 0,553 24 0,404

La evidencia de relacin lineal, entre las dos variables, se dara, de acuerdo a
este criterio, cuando el valor calculado de r, est entre 1 y r
dec
, o r
dec
y +1.


Observaciones:
1) Es importante tener presente que, concluir que hay una relacin entre dos
variables no significa, de ninguna manera, una relacin de causa y efecto.
2) Un valor de r cercano a cero implica que, no habra relacin lineal entre las dos
variables. Pero, esto no descarta la posibilidad de existencia de una relacin no
lineal.

Ejemplo: Consideremos el problema, donde se aplic el modelo exponencial,
para el clculo del coeficiente de correlacin r. All:
ti = 36 ; ti ln(Vi) = 74,16

ln(V
i
) = 15,5 ; t
i
2
= 204

| 1n(V
i
) |
2
= 30,52 ; i = 1, 2, .., 8

r = 8 74,16 - 36 15,5__ ____
(8 204 - 1296) ( 8 30,52 - 240,25)

r = 0,9735 ;
2
r = 0,9477 = 94,8 %

Para n = 8, el punto de decisin, que aparece en la Tabla de la pgina anterior
es r
dec
= 0,707.
Podemos concluir entonces que, el modelo V = 4,328 (1,111)
t
sera
adecuado para explicar las Ventas en el tiempo, por supuesto dentro de ciertas
limitaciones.

Observacin:
Para el mismo ejemplo de las ventas anuales, vamos a ajustar un modelo lineal
simple. Este resulta ser,

V = 0,780 t + 3,654

El valor para el coeficiente de correlacin es r = 0,938 que, de acuerdo a la
Tabla de puntos de decisin, implicara que, tambin, el modelo lineal simple, sera
adecuado para explicar la relacin de las Ventas en el Tiempo. Sin embargo, si
comparamos los valores de r, de ambos modelos, vemos que es ms cercano a +1
el que corresponde al modelo exponencial.
PROBLEMA.
El administrador de una DISCO est tratando de decidir si debera aumentar
sus gastos semanales de publicidad, para mejorar sus ingresos por semana. Los
datos de las ltimas 8 semanas sobre los ingresos (en millones de pesos), y los
gastos de publicidad (en miles de pesos), se dan en la siguiente Tabla.

Semana 1 2 3 4 5 6 7 8
Gastos 31 37 13 48 18 38 45 23
Ingresos 7,24 7,48 5,84 8,13 4,87 8,25 7,48 6,47

a) Ajuste a los datos un modelo lineal simple. Use el modelo para predecir el
ingreso semanal esperado, suponiendo que se gasten $ 45.000 en publicidad radial
durante la semana. Interprete.
b) Interprete el valor obtenido de B y el de A.
c) Interprete el valor obtenido para el valor de r y de
2
r .
d) Calcule e interprete el error estndar
x y
s
/
.
Respuesta a).
Usando el mdulo estadstico REG. LIN., se obtiene:
B = 0,081 ; A = 4,423 ; r = 0,875 ; % 6 , 76 766 , 0
2
= = r


= = = 76 , 55 ; 93 , 1853 ; 161 , 398
2
i i i i
y y x y

Luego, el modelo ajustado a los datos muestrales es ,
423 , 4 081 , 0

+ = x y
Donde x es el gasto de publicidad semanal e y es el ingreso semanal.
Ahora bien, si el gasto semanal fuera de $ 45.000 , entonces el ingreso
semanal esperado sera de , .$ 068 , 8 423 , 4 45 081 , 0

) 45 (
mill y = + =
Respuesta b).
Dado que B = 0,081 , podemos decir que, si el gasto en publicidad radial
semanal aumentara en $ 1.000 , entonces, el aumento esperado en el ingreso
semanal sera de 0,081 mill. $ ; o sea , $ 81.000.
Dado que A = 4,423 , podemos decir que, si no se gastara en publicidad
radial, entonces, el ingreso semanal esperado sera de $ 4.423.000 .

Respuesta c).
Dado que r= 0,875, se podra decir que el modelo 423 , 4 081 , 0

+ = x y ,
explicara adecuadamente la relacin lineal entre el ingreso semanal de la Disco y
el gasto semanal que se hace en publicidad radial.
Dado que % 6 , 76 766 , 0
2
= = r , podemos decir que, la variabilidad total, en los
ingresos semanales de la Disco, estara explicada en un 76,6 % por la
variabilidad en los gastos semanales que se hacen en publicidad radial. Solo un
23,4 % de dicha variabilidad total estara explicada por factores ajenos al gasto de
publicidad.

Respuesta d).

2

2
)

(
2 2
/


=

n
y A y x B y
n
y y
i i i i i i
x y
s
$ . 477 , 0
6
76 , 55 423 , 4 93 , 1853 081 , 0 161 , 398
/
mill
x y
s =

=
Esto significa que , de acuerdo a los gastos semanales de publicidad, la
variabilidad absoluta en los ingresos semanales de la Disco, estimados por el
modelo de prediccin 423 , 4 081 , 0

+ = x y , sera de $ 477.000 .








GUIA 4 DE EJERCICIOS

1. Los siguientes datos corresponden a los ingresos mensuales X, en miles de
pesos, de familias de alumnos egresados de Enseanza media, junto con los
puntajes Y, que ellos obtuvieron en la P.S.U. Los datos se registraron para una
muestra aleatoria de 12 alumnos.

AL A B C D E F G H I J K L
X

320 230 145 270 420 125 190 470 345 245 185 275
Y

510 440 406 525 615 460 448 582 564 483 412 458

Se pide :
a) El modelo de regresin lineal, ajustado a los datos muestrales
b) El valor esperado de la respuesta Y , cuando X es $ 450.000. Interprete el
resultado.
c) La interpretacin de la pendiente B del modelo.
d) La interpretacin del intercepto A del modelo.
e) El coeficiente de correlacin lineal, y su interpretacin.

2. Se ha hecho una investigacin, en los negocios de feria de Arica, para
establecer la posible relacin entre la utilidad mensual, que ellos obtienen en miles
de $, y el gasto mensual en propaganda radial, en miles de $ . Los resultados
obtenidos, en una muestra aleatoria, se describen en la siguiente Tabla.

NEG. 1 2 3 4 5 6 7 8 9
X

48 33 60 41 47 58 52 35 49
Y

714 580 806 473 657 930 678 406 652


Se pide:

a) El diagrama de dispersin de los puntos asociados a los datos.
b) El modelo de regresin lineal, ajustado a los datos muestrales
c) El valor esperado de la respuesta Y , cuando X es $ 53000. Interprete el
resultado.
d) La interpretacin de la pendiente B del modelo.
e) La interpretacin del intercepto A del modelo.
f) El coeficiente de correlacin lineal y su interpretacin.
g) El coeficiente de determinacin y su interpretacin.
h) El error estndar de Y sobre X, y su interpretacin.

3. Un corredor de bienes races estudi la relacin, entre el ingreso anual (en mill.
de pesos), de los compradores de propiedades, y el precio de venta de la
propiedad adquirida (en mill. de pesos). Los datos, obtenidos en base a una
muestra aleatoria de 10 compradores, se describen en la siguiente Tabla.

COM

1 2 3 4 5 6 7 8 9 10
X

10,8 12,9 9,6 13,9 8,5 20,1 29,6 18,5 27,3 17,3
Y

8,3 22,5 7,8 20,2 14,5 37,2 32,8 24,7 31,5 29,1

Se pide:

a) El diagrama de dispersin de los puntos asociados a los datos.
a) El modelo de regresin lineal, ajustado a los datos muestrales
b) El valor esperado de la respuesta Y , cuando X es $ 22.000.000. Interprete el
resultado.
d) La interpretacin de la pendiente B del modelo.
e) La interpretacin del intercepto A del modelo.

f) El coeficiente de correlacin lineal y su interpretacin.
g) El coeficiente de determinacin y su interpretacin.
h) El error estndar de Y sobre X, y su interpretacin.

4. El tonelaje de la carga mensual , movilizada por una empresa de transporte, en
un perodo de 12 meses , entre Enero y Diciembre, se describe en la siguiente
Tabla.

MES

ENE FEB MAR ABR MAY JUN
CARGA

95,34 76,27 115,32 102,39 106,29 132,58

MES

JUL AGO SET OCT NOV DIC
CARGA

123,64 115,27 148,41 129,42 95,73 152,81

Se pide:

a) El diagrama de dispersin.
b) El modelo de regresin lineal, ajustado a los datos muestrales.
c) Dibuje la recta ajustada a los puntos muestrales.
d) La interpretacin de la pendiente del modelo.
e) La interpretacin del intercepto del modelo.
f) El coeficiente de correlacin lineal, y su interpretacin.
g) La interpretacin del coeficiente de determinacin.
h) El error estndar de Y sobre X, y su interpretacin.
i) El valor esperado de la respuesta Y, cuando X es el valor promedio.




CAPITULO 6
ELEMENTOS DE PROBABILIDADES.

GENERALIDADES

Consideremos un EXPERIMENTO (o un fenmeno), que admite por lo
menos dos resultados. Por ejemplo, si se lanza una vez un dado, con sus caras
numeradas del 1 al 6, y estamos interesados en la cara que queda hacia arriba,
tendremos la posibilidad de observar uno cualesquiera de los siguientes 6
RESULTADOS que, si el dado est bueno , son igualmente posibles:

Resultados : 1 , 2, 3, 4, 5, 6

Podemos asumir entonces que, estos 6 resultados, igualmente posibles,
forman un conjunto asociado a este experimento en estudio. Este conjunto que
designamos O (omega), recibe el nombre genrico de ESPACIO MUESTRAL,
asociado al experimento en estudio . O sea, para el experimento del dado,
O = { } 6 , 5 , 4 , 3 , 2 , 1 . Supongamos que nos interesa que, al lanzar el dado,
resulte un nmero impar; es decir: 1, 3 5. Como se ve, estos resultados forman
un conjunto, que designaremos A, y que llamaremos en general SUCESO, asociado
al experimento en estudio. Es decir, en este caso, { } 5 , 3 , 1 = A
Pero tambin, podemos estar interesados en otros sucesos asociados al
mismo experimento del dado, por ejemplo:
B: que resulte el 1 el 6
C: que resulte un nmero menor que 5
D: que resulte un nmero mayor que 6
E: que resulte un nmero mayor o igual a 1, pero menor o igual a 6
Lo que podemos apreciar aqu, es que todos estos SUCESOS son
conjuntos, que estn incluidos, o sea, son subconjuntos del espacio muestral O,
asociado al experimento en estudio. As, vemos que:

{ } O c = 5 , 3 , 1 A ; { } O c = 6 , 1 B ; { } O c = 4 , 3 , 2 , 1 C
O c =| D ; { } O c O = = 6 , 5 , 4 , 3 , 2 , 1 E

Ahora bien, supongamos que se nos presenta la oportunidad de apostar,
ya sea porque el nmero que resulte sea impar, o que sea menor que 5. Tenemos
entonces un problema de DECISIN: Apostamos por el suceso A o por el suceso
C ?. Es evidente que la intuicin nos aconsejara apostar por el suceso C, que
tiene 4 resultados a su favor, o sea, 4 posibilidades de ocurrir, de un total de 6;
mientras que, el suceso A ocurrira slo en 3 de los 6 resultados posibles.
De lo anterior, podemos rescatar que, en general, hay aqu dos ideas que
podramos formalizar, y que nos interesan, porque nos servirn de base para
tomar una decisin. Lo primero, podemos considerar que un suceso OCURRE,
cuando al efectuar el experimento aparece un resultado que est en el suceso. En
el ejemplo del dado, el suceso A ocurre cuando al lanzar el dado una vez resulta el
1, el 3, el 5; o sea A tiene 3 posibilidades de ocurrir; lo cual podemos expresarlo
como # A = 3. Lo segundo, de alguna manera sera conveniente tener una forma
de MEDIR o cuantificar la OCURRENCIA de un suceso, antes de que ocurra, para
poder COMPARAR con la ocurrencia de otro suceso y, as, tener una base objetiva
para decidir mejor, o con ventaja. Esta MEDIDA es justamente lo que
llamaremos PROBABILIDAD que, desde un punto de vista clsico, se obtiene como
la frecuencia, o el nmero de resultados favorables a que el suceso ocurra,
relativa al total de resultados posibles del experimento; o sea, para un suceso
cualquiera O c A , asociado a un experimento en estudio, se tiene,
| |
O
= =
#
#
) (
A
A P ocurra A suceso el que P ; donde,
# A = nmero de resultados favorables a que el suceso A ocurra.
# = O total de resultados posibles del experimento.

Ejemplo: Para el experimento del dado, tenemos,

{ } 6 , 5 , 4 , 3 , 2 , 1 = O ; { } 5 , 3 , 1 = A ; { } 4 , 3 , 2 , 1 = C
5000 , 0
6
3
#
#
) ( = =
O
=
A
A P ; 6667 , 0
6
4
#
#
) ( = =
O
=
C
C P
Como se ve, ) ( ) ( A P C P > . Por lo tanto, la decisin adecuada es apostar
al suceso C. Para los otros sucesos: { } | = = D B ; 6 , 1 y O = E ,sus
probabilidades de ocurrencia son:
3333 , 0
6
2
) ( = = B P ; 0
6
0
) ( = = | P ; 1
6
6
) ( = = O P
RESUMIENDO:
Formalicemos lo visto hasta ahora.
1. O es el espacio muestral, asociado al experimento en estudio; o sea, el
conjunto de todos los resultados posibles del experimento.
2. A es un suceso, asociado al experimento, si y slo si, O c A .
3. El suceso A ocurre, cuando al efectuar el experimento aparece un
resultado que est en A.
4. La probabilidad que el suceso A ocurra, est dada por,
O
=
#
#
) (
A
A P
5. Si A y B son dos sucesos asociados al experimento, entonces al comparar
sus probabilidades de ocurrencia (antes de que los sucesos ocurran), podemos
decidir, objetivamente, por uno de los dos.

OBSERVACIONES:
1. La probabilidad de ocurrencia de cualquier suceso A es un nmero real
que vara entre 0 y 1. O sea,
O c s s A A P ; 1 ) ( 0
2. El espacio muestral O se dir SUCESO SEGURO ; su probabilidad de
ocurrencia es 1.
3. El SUCESO IMPOSIBLE es | , su probabilidad de ocurrencia es 0.
4. Se podra decir que existe una dualidad entre SUCESO y CONJUNTO,
donde el espacio muestral O es el conjunto universal y el suceso A es
subconjunto de O. Esto se puede describir, geomtricamente, mediante el
siguiente diagrama de Venn:


A
Esta dualidad, nos permite usar la teora de conjuntos en el tratamiento de
los sucesos asociados a un experimento en estudio. Por ejemplo, podemos
escribir, usando la simbologa de conjuntos:
O c A SUCESO es A
A x que tal x OCURRE A e O e - , ,
B x que tal x OCURRE NO B e O e - , ,

PROBLEMAS RESUELTOS
En los problemas, que desarrollaremos a continuacin, el objetivo es
calcular probabilidades de sucesos que llamaremos simples, aplicando la
definicin clsica de probabilidad. O sea, vamos a contar los resultados
favorables a que el suceso de inters ocurra y, este nmero, se va a dividir por el
total de resultados posibles, para obtener como cuociente la probabilidad de
ocurrencia del suceso.

Problema 1: Se lanzan una vez dos dados numerados ( del 1 al 6), uno
negro y el otro rojo. Calcular la probabilidad que la suma de los dos nmeros que
quedan hacia arriba sumen por lo menos 10 puntos.
Anlisis Previo:
{ } 6 , 5 , 4 , 3 , 2 , 1
1
= O ; para el dado negro.
{ } 6 , 5 , 4 , 3 , 2 , 1
2
= O ; para el dado rojo.
( ) O = O O
2 1
x , es el espacio muestral asociado al experimento en
estudio. O sea, los resultados que contiene el espacio muestral son pares
ordenados ( x , y ) donde ,
1
O e x e
2
O e y .
El suceso de inters es:
A: que la suma de los dos nmeros sea al menos 10 ; o sea ,
( ) ( ) ( ) ( ) ( ) ( ) { } 6 , 6 , 5 , 6 , 4 , 6 , 6 , 5 , 5 , 5 , 6 , 4 = A
Si contamos los resultados contenidos en A en y O , tenemos:
) ( 36 6 6 # pares = = O ; # ) ( 6 pares A =
Luego , 1667 , 0
36
6
#
#
) ( = =
O
=
A
A P

Problema 2: Calcular la probabilidad de ganar el juego del loto con una
apuesta, y comparar con el juego del kino.
En el loto (el original), la apuesta consiste en elegir 6 nmeros diferentes
de un total de 36 (del 1 al 36); por lo tanto, el total de apuestas posibles est
dado por el nmero de combinaciones de 6 nmeros elegidos de 36 disponibles, es
decir,
792 . 947 . 1
6
36
# = = O
|
|
.
|

\
|
loto
apuestas
En el kino, la apuesta consiste en 15 nmeros elegidos de 25 disponibles
(del 1 al 25). Luego, 760 . 268 . 3
15
25
# = = O
|
|
.
|

\
|
kino
apuestas.
Los sucesos que nos interesan son:
A: que se gane el loto con 1 apuesta
B: que se gane el kino con 1 apuesta
# A = 1 apuesta ; # B = 1 apuesta.
Por lo tanto,
) ( 0 0000005 , 0
792 . 947 . 1
1
) ( | P A P = ~ = =
) ( 0 0000003 , 0
760 . 268 . 3
1
) ( | P B P = ~ = =
En ambos casos, las probabilidades son aproximadamente 0 ; lo cual
implicara que es casi imposible ganar ya sea, el loto, o el kino, con una
apuesta.

OBSERVACIONES:
Lo anterior puede servir de base para decidir por una de las alternativas
siguientes:
a) No apostar, ni al loto ni al kino, porque las probabilidades de ganar son
casi nulas en ambos juegos de azar.
b) Si se quiere apostar, para darle una oportunidad a la suerte, habra que
jugar al loto, porque, ) ( 0000003 , 0 0000005 , 0 ) ( B P A P = > =

Problema 3: Una persona olvid los ltimos dos dgitos (del 0 al 9), de
una clave, para abrir una caja de seguridad; pero, recordando que estos eran
diferentes, digit al azar. Calcule la probabilidad que la caja se abra.
Anlisis Previo:
Los dos nmeros que la persona olvid, forman una ordenacin de dos
dgitos tomados de 10 disponibles; por lo tanto,
# es ordenacion 90 9 10 0
10
2
= = = O ; # ordenacin A 1 =
Luego, | | 0111 , 0
90
1
) ( = = = A P abra se caja la que P

Problema 4: En el departamento de recursos humanos de una empresa,
se dispone de 6 operarios especializados y 3 ingenieros. Para un trabajo, en una
compaa minera, se ha solicitado a la empresa un equipo de 6 personas.
a) Calcule la probabilidad que el equipo quede conformado por 3 ingenieros
y 3 operarios.
b) Calcule la probabilidad que el equipo tenga por lo menos 4 operarios.
Respuesta a)
Personal disponible: 9 personas

ingenieros
operarios
3
6

Personal que se selecciona : 6 personas

ingenieros
operarios
3
3

A : que en el equipo de 6 , haya 3 operarios y 3 ingenieros
Los 3 operarios se eligen de 6 disponibles; por lo tanto, esto se puede
hacer de
|
|
.
|

\
|
3
6
maneras; o sea, de 20 maneras. Los 3 ingenieros del equipo se
eligen de 3 disponibles, es decir, de 1
3
3
=
|
|
.
|

\
|
manera.
Luego, hay
|
|
.
|

\
|
3
6
-
|
|
.
|

\
|
3
3
= 20 maneras de formar un equipo, de 6 personas
integrado por 3 operarios y 3 ingenieros; o sea, # A = 20
Por otra parte, hay 84
6
9
=
|
|
.
|

\
|
maneras de formar un equipo de 6 personas,
de 9 disponibles, sin restriccin, o sea, # 84 = O .
Entonces, 2381 , 0
84
20
) ( = = A P
Respuesta b)
Aqu, el suceso de inters es,
B: que el equipo de 6, tenga al menos 4 operarios
Lo anterior significa que en el equipo puede haber: 4 , 5 o 6 operarios.
O sea:
4 operarios y 2 ingenieros
5 operarios y 1 ingeniero
6 operarios y 0 ingeniero.
Luego, razonando como en (a) y considerando las 3 posibilidades, se tiene,
(

|
|
.
|

\
|
|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
0
3
6
6
1
3
5
6
2
3
4
6

6
9
1
) (B P
7619 , 0
84
1 18 45
) ( =
+ +
= B P

Problema 5.
1. En la maternidad del hospital, se ha hecho un estudio de los partos normales
y con cesrea, que se han atendido en pacientes, los cuales se han clasificado de
acuerdo a 4 rangos de edad. Los resultados obtenidos se obtuvieron en base a
una muestra aleatoria y se describen en la siguiente tabla.

EDAD PARTO NORMAL PARTO CON CESAREA
15 18 15 21
18 23 23 18
23 30 21 13
MS DE 30 10 12

a) Si una paciente tiene parto con cesrea cul es la probabilidad que sea
mayor de 18 aos?
b) Cul es la probabilidad que una paciente tenga entre 18 y 30 aos y su
parto resulte normal?
Respuesta a)
Sea A el suceso de inters. Del cuadro se desprende que 64 pacientes
tuvieron parto con cesrea, de estas, 43 tenan ms de 18 aos. Por lo tanto,
6719 , 0
64
43
) ( = = A P
Respuesta b)
Sea B el suceso de inters. En el cuadro podemos apreciar que, 44
pacientes tenan entre 18 y 30 aos y tuvieron su parto normal. El total de
pacientes atendidos fueron 133. Luego,
3308 , 0
133
44
) ( = = B P

OCURRENCIA DE SUCESOS COMPUESTOS.

Consideremos dos sucesos simples, O c B A , , asociados a un
experimento en estudio.
La definicin de ocurrencia de un suceso, junto con la existencia de la
dualidad suceso-conjunto, permiten determinar cuando ocurren sucesos
compuestos como : ( ) ( ) ( ) B A B A B A A , , , y otros.

EL SUCESO CONTRARIO DE A.
El suceso contrario de A, lo designaremos ( )
c
A o A . Por definicin,
A ocurre A x que tal x e O e - , ,
A x que tal x e O e - , ,
Pero, si A x e , entonces , A no ocurre.
Luego, El suceso A ocurre, cuando A no ocurre .
Adems, ( ) ( ) A P 1 A P =
EL SUCESO PRODUCTO A B .
El suceso producto AB, como conjunto corresponde a ( ) B A . Por
definicin,
AB ocurre ( ) B A x , tq , x e O e -
| | B x A x , tq , x e . e O e -
Pero, A x e significa que A ocurre y, B x e indica que B ocurre.
Luego, podemos decir, El suceso producto AB ocurre, cuando
ocurren simultneamente los dos sucesos A y B. Adems,
P ( A B ) = P ( A ) P ( B ) ; siempre que, los sucesos A y B sean
independientes.

EL SUCESO DIFERENCIA ( A-B).
Por definicin, podemos escribir
( ) B A ocurre ( ). , , B A x que tal x e O e -
| | B x y A x que tal x e e O e - , ,
Pero A x e equivale a que A ocurre y, B x e , a que B no ocurre.
Por lo tanto, podemos concluir, El suceso diferencia (A-B) ocurre,
cuando ocurre A y no ocurre B
Observacin:
Considerando el suceso (A-B) como conjunto, se tiene,
( ) A x B A x e e y B x e
A x e y B x e
( ) B A B A x = e
Luego, el suceso diferencia ( ) B A es igual al suceso producto B A .
Adems,
P ( A B ) = P ( A ) P ( B ) = P (A ) [ 1 - P ( B ) ] ;
siempre que, los sucesos A y B sean independientes.

EL SUCESO UNION ( ) B A .
Por definicin se tiene ,
( ) B A ocurre ( ) B A x , tq , x e O e -

| | B x o / y A x , tq , x e e O e -
Pero, B x o y A x e e / , significa las siguientes tres posibilidades:
ocurre slo A, ocurre slo B, o ocurren A y B. Por lo tanto, se concluye que, El
suceso unin ( ) B A ocurre, cuando ocurre al menos uno de los dos
sucesos A , B.
Adems, P ( A B ) = P ( A ) + P ( B ) - P ( A B )

DESCRIPCION GEOMTRICA.

Lo visto acerca de los sucesos compuestos, obtenidos a partir de los
sucesos simples A y B, se puede describir geomtricamente mediante el siguiente
diagrama:








De este diagrama, se pueden deducir algunas propiedades.
1) ( ) ( ) A B A B A =
2) ( ) ( ) B B A B A =
3) ( ) ( ) ( ) ( ) B A B A B A B A =

Adems, podemos definir el suceso ( ) ( ) ( ) B A B A B A = .
Usando la definicin de ocurrencia de un suceso, podemos escribir,
( ) B A ocurre O e - x , tq. , ( ) B A x e
O e - x , tq. , | | B x o A x e e
Pero, B x o A x e e , significa las siguientes dos posibilidades:
ocurre slo A, u ocurre slo B.
B A
AB
B A
A B
O ( ) B A
Por lo tanto, se concluye que, El suceso ( ) B A ocurre cuando
ocurre slo uno de los dos sucesos A, B .

SUCESOS MUTUAMENTE EXCLUYENTES.
Diremos que, dos sucesos O c B A , , asociados a un experimento en
estudio, son mutuamente excluyentes ( o excluyentes), cuando la ocurrencia de
uno de ellos no permite la ocurrencia del otro.
As, por ejemplo, si A ocurre entonces el resultado x del experimento
est en A, o sea, A x e . Pero, como la ocurrencia de A excluye la ocurrencia de B,
podemos escribir que B x e . Por lo tanto podemos concluir que el resultado x no
puede pertenecer a ambos sucesos. Luego, podemos escribir,
A y B son excluyentes | = B A .
Geomtricamente, esta situacin queda descrita en cualesquiera de los dos
siguientes diagramas.

a) b)



| = AB | = AB

FUNCION DE PROBABILIDAD.

Lo que se ver a continuacin, pretende mostrar un enfoque (axiomtico)
de la probabilidad, distinto a lo visto hasta ahora.
Definicin.
Sea O el espacio muestral, asociado a un experimento en estudio (o a un
fenmeno).
Sea A una coleccin de subconjuntos de O (coleccin de sucesos), que cumple
con los siguientes requisitos:
i) e | A
A
B
O
A B
O
ii) e A A e A A
iii)

I i
i
A
e
e A, para cualquier e
i
A A
NOTA:
La coleccin A se conoce como o lgebra ( sigma lgebra ), definida en
O. El potencial de O es, entonces, la ms grande de las o lgebras definidas
en O.
Se llamar PROBABILIDAD a la funcin, P : A R , tal que :
Axioma 1. 0 ) ( > A P ; para todo e A A
Axioma 2.

e e
=
|
|
.
|

\
|
I i
i
I i
i
A P A P ) (

; siempre que , | =
j k
A A ; para
todo, j k = y e
i
A A.
Axioma 3. 1 ) ( = O P

OBSERVACIONES.
1) De la definicin se desprende que P es una funcin de probabilidad, que
tiene como dominio el o lgebra A , donde sus elementos son subconjuntos de
O; o sea, SUCESOS, asociados al experimento en estudio.
2) La funcin de probabilidad P, asigna a cada suceso A, un nmero real
mayor o igual cero, pero menor o igual a uno. O sea, el recorrido de P es el
intervalo | | c 1 , 0 R
3) Del Axioma 2, se desprende que, si los sucesos A y B son excluyentes,
entonces, ( ) ( ) ( ) B P A P B A P + =
4) El Axioma 3 indica que la probabilidad de O es 1, lo cual es evidente, ya
que O, contiene todos los resultados posibles del experimento; de aqu que, a O
se le llame el suceso seguro.

ALGUNAS PROPIEDADES.
Basndose en la definicin de probabilidad como funcin, se pueden
demostrar, entre otras, las siguientes propiedades para sucesos simples A , B
asociados a un experimento.
1. ( ) A P A P = 1 ) (
2. 1 ) ( 0 s s A P
3. ( ) ) ( ) ( ) ( B A P B P A P B A P + =
4. ( ) 0 = | P
Vamos a demostrar la propiedad 3, que nos permite calcular la probabilidad de
ocurrencia de al menos uno de los dos sucesos A , B ; cuando, A y B no son
mutuamente excluyentes; o sea, cuando | = = B A B A .
Geomtricamente, esta situacin se describe en el siguiente diagrama:







Aqu, ( ) ( ) ( ) B A B A B A B A = . Apliquemos en esta igualdad la
funcin de probabilidad P; entonces, ( ) ( ) ( ) ( ) | | B A B A B A P B A P =
pero B A y B A B A , son conjuntos disjuntos 2 a 2; o sea, son mutuamente
excluyentes; entonces, por Axioma 2, se tiene,
P ( A B ) = P ( A B ) + P ( A B ) + P ( A B ) (1)
Por otra parte:
( A B ) ( A B ) = A P ( A B ) + P ( A B ) = P ( A ) (2)
( A B ) ( A B ) = B P ( A B ) + P ( A B ) = P ( B ) (3)
Ntese que, los trminos que aparecen en las expresiones (1) , (2) y (3), son
probabilidades de sucesos; o sea, son nmeros reales. Por lo tanto, si
reemplazamos (2) y (3) en (1) , se tiene,
P ( A B ) = P ( A ) - P ( A B ) + P ( A B ) + P ( B ) - P ( A B )
P ( A B ) = P ( A ) + P ( B ) - P ( A B )
RESUMIENDO:
A
B A
AB
B A
B
O

P [ que ocurra al menos uno de los dos sucesos A , B ] = P ( A B )
( ) ( ) ( ) ( ) B A P B A P B A P B A P + + = ; o tambin ,
( ) ( ) ( ) ( ) B A P B P A P B A P + =
Por otra parte,
P [ que ocurra solo uno de los dos sucesos A , B ] = P ( A B )
( ) ( ) ( ) B A P B A P B A P + =

PROBABILIDAD CONDICIONAL.

Sean O c
2 1
, A A , dos sucesos asociados a un experimento en estudio. Se
llamar PROBABILIAD CONDICIONAL de
2
A dado
1
A , a,
( )
( )
( )
1
2 1
1 2
/
A P
A A P
A A P = , con ( ) 0
1
= A P .
Aqu, el suceso de inters es
2
A ; mientras que el suceso condicionante es
1
A .
El valor de la probabilidad condicional P (
1 2
A / A ) , mide la ocurrencia del
suceso A
2
, suponiendo que el suceso A
1
ya ocurri.

Ejemplo.
Se lanza un dado numerado ( del 1 al 6 ) una vez. Calcular la probabilidad
que el nmero resultante sea impar, suponiendo que resultara un nmero mayor
que 2.
Aqu, el espacio muestral, y los sucesos simples involucrados en el ejemplo,
son:
O = { 1 , 2 , 3 , 4 , 5 , 6 }
Suceso de inters A
2
: que el nmero resultante sea impar ; o sea ,
{ } 5 , 3 , 1
2
= A
Suceso condicionante
1
A : que el nmero resultante sea mayor que 2 ; o
sea,
{ } 6 , 5 , 4 , 3
1
= A y ( )
6
4
1
= A P
Por otra parte,
{ } 5 , 3
2 1 2 1
= = A A A A ; y , ( )
6
2
2 1
= A A P
( )
1 2
/
2 sup
,
A A P
que mayor fue que oniendo
impar sea nmero el que
P =
(

=
( )
( )
5 , 0
4
2
1
2 1
= =
A P
A A P


OBSERVACIONES:
1) En el clculo de la probabilidad condicional, estn involucrados dos sucesos
simples, el de inters
2
A y el condicionante
1
A . Se aprecia, por otra parte que, en
cierto sentido, el espacio muestral O, se restringe al suceso condicionante
1
A .
2) La idea de dependencia de la ocurrencia del suceso
2
A , respecto de la
ocurrencia previa de
1
A , esta asociada con la probabilidad condicional ( )
1 2
/ A A P .
3) De la definicin de probabilidad condicional, dada por,
( )
1 2
/ A A P =
( )
( )
1
2 1
A P
A A P

podemos observar la relacin entre las ideas de dependencia, y de
ocurrencia
conjunta de los dos sucesos.
4) Ahora bien, es evidente que, si la ocurrencia de
2
A no depende de
1
A ,
entonces la, ( )
1 2
/ A A P es simplemente la ( )
2
A P ; o sea, ( )
1 2
/ A A P = ( )
2
A P
5) La probabilidad que ocurran simultneamente los sucesos
1
A y
2
A , se puede
calcular a partir de la definicin de probabilidad condicional. As,
( ) ) / ( ) (
1 2 1 2 1
A A P A P A A P = , cuando ,
2
A depende de
1
A .

SUCESOS INDEPENDIENTES.

Sean
1
A ,
2
A O c , sucesos asociados a un experimento en estudio.
1
A y
2
A se dirn sucesos mutuamente independientes cuando,
( ) ) ( ) (
2 1 2 1
A P A P A A P =
LEY DEL PRODUCTO.

Consideremos k sucesos O c
K
A A A A ...., ,......... , ,
3 2 1
; asociados a un
experimento en estudio. Si extendemos lo observado en (5), podemos obtener la
probabilidad que ocurran simultneamente los k sucesos; es decir, la probabilidad
del suceso producto ) ...., ,......... , , (
3 2 1 K
A A A A ,
( ) ( ) ( ) ( ) ( )
1 2 1 2 1 3 1 2 1 3 2 1
........ / .... / / .........

=
K K K
A A A A P A A A P A A P A P A A A A P
Pero, si los k sucesos son independientes, entonces,
( ) ( ) ( ) ( ) ( )
K K
A P A P A P A P A A A A P ..... .........
3 2 1 3 2 1
=

Ejemplo.
De una baraja de cartas se extraen una a una tres cartas; calcule la
probabilidad que las tres cartas sean reinas en las dos situaciones siguientes, la
eleccin de las cartas es:
a) Con devolucin a la baraja de la carta que se extrae.
b) Sin devolucin.

Anlisis previo.
En este experimento se efectan 3 operaciones que son sacar una a una
cada carta. Cada operacin genera un suceso. Luego, los sucesos simples son:
:
1
A que la primera carta extrada sea reina
:
2
A que la segunda carta extrada sea reina.

3
A : que la tercera carta extrada sea reina.
Por otra parte, la baraja tiene 52 cartas y, entre ellas, hay 4 reinas.
Nos interesa calcular,
( )
3 2 1
A A A P
reinas sean cartas
tres las que
P =
(


Luego, por la ley del producto,
( ) ) / ( ) / ( ) (
2 1 3 1 2 1 3 2 1
A A A P A A P A P A A A P =
Donde:
(

=
reina sea extraida
carta primera la que
P A P ) (
1

( )
(

=
fu lo primera la que oniendo reina
sea extraida carta segunda la que
P A A P
sup ,
/
1 2

( )
(

=
reinas fueron primeras dos las que oniendo
reina sea extrada carta tercera la que
P A A A P
sup
,
/
2 1 3

Calculemos estas probabilidades en las dos situaciones ya sealadas.
Caso (a) con devolucin

52
4
) (
1
= A P ; ( ) ( )
2 1 2
52
4
/ A P A A P = = ; porque la primera carta
extrada se devolvi a la baraja; es decir, la ocurrencia de
2
A es independiente de
la ocurrencia previa de
1
A .
Anlogamente, ( ) ) (
52
4
/
3 2 1 3
A P A A A P = =
Resumiendo, tenemos que,
( ) 00046 , 0
52
4
52
4
52
4
3 2 1
= = A A A P
Caso (b). sin devolucin
( )
52
4
1
= A P
( )
51
3
/
1 2
= A A P ; aqu el suceso
2
A depende de
1
A , porque se supone
que la primera carta extrada fue reina y no se devolvi a la baraja.
Anlogamente,
( )
50
2
/
2 1 3
= A A A P ; luego, en este caso,
( ) 00018 , 0
50
2
51
3
52
4
3 2 1
= = A A A P
Comparando las situaciones (a) y (b), concluimos que es ms probable
extraer al azar tres reinas, cuando la extraccin es con devolucin.

OBSERVACIN:
En este ejemplo de aplicacin de la ley del producto, se ha mostrado como
opera cuando los sucesos son independientes o dependientes.



Problema 6.
Una fbrica produce un artculo compuesto de dos partes, que funcionan en
forma independiente, las probabilidades que se presenten fallas en el artculo es
de 0,12 para la parte I y de 0,053 para la parte II. Calcule la probabilidad de que:
a. Falle la parte I pero no la II.
b. Un artculo elegido al azar, resulte fallado.
c. Un artculo elegido al azar, tenga slo una de las dos partes falladas.
d. Un artculo elegido al azar, no est fallado
Anlisis previo.
En este problema podemos identificar dos sucesos simples:
A : que falle la parte I ; B : que falle la parte II
La parte I y la II funcionan en forma independiente; por lo tanto, los sucesos
A y B son independientes, es decir,
( ) ( ) ( ) 0064 , 0 053 , 0 12 , 0 = = = B P A P B A P
a) ( ) B A P
II falle no pero
I falla que
P =
(

,

) ( B A P ) ( ) ( B P A P = ; siempre que A y B sean independientes .
Esto se puede demostrar a partir del diagrama,







( ) ( ) ( ) + = B A P B A P A P ( ) ) ( ) ( AB P A P B A P =
( ) B A P ( ) ( ) ( ) B P A P A P = ; porque A y B son independientes.
( ) ( ) ( ) | | B P A P B A P = 1
( ) ( ) = B P A P B A P ) ( B y A son independientes.
Anlogamente se puede probar que si A y B son independientes, tambin lo
son: A con B y A con B y A con B .
Luego, ( ) ( ) 053 , 0 1 12 , 0 = B A P = 0,1136

O
A
B A
AB
B A
B
b)
(

fallado est
artculo un que
P =
(

II I partes dos las de


una menos al fallada est que
P
,

( ) ) ( ) ( ) ( B A P B P A P B A P + = =
= 0,12 + 0,053 - 0,0064 = 0,1666
c) =
(

falladas partes dos las de


una slo tenga artculo un que
P ( ) ( ) B A P B A P B A P + = ) (
= ( ) ) ( ) ( ) ( B P A P B P A P + ( independencia )
= 053 , 0 88 , 0 947 , 0 12 , 0 + = 1603 , 0
d) ( ) B A P
fallado est no
artculo un que
P =
(

= ) ( ) ( B P A P ( independencia )
= 8334 , 0 947 , 0 88 , 0 =


LEY DE LA PROBABILIDAD TOTAL Y LEY DE BAYES.

Consideremos un suceso de inters O c B , asociado a un experimento en
estudio. Supongamos que la ocurrencia de B depende de que ocurra uno
cualesquiera de un conjunto de k sucesos: O c
K
A A A A ., ,......... , ,
3 2 1
; los cuales
forman un grupo completo de sucesos del espacio muestral O, asociado al
experimento. Geomtricamente, esto se puede describir mediante el diagrama
siguiente,









Esto significa que:
O
2
A
1
A
2
BA
K
BA
1
BA
B
3
BA
A
3

K
A

= | =
=
O =
j i todo para ;
j
A
i
A
k
1 i
y ,
i
A


(o sea los k sucesos A completan O)
El suceso B depende ya sea de
1
A , de
2
A ,..........., o de
k
A ; por lo tanto,
debe tener interseccin con cada uno de los k sucesos
i
A ; de ah, la posicin del
suceso de inters B en el diagrama. Podemos escribir entonces que,
( ) ( ) ( ) ( )
K
A B A B A B A B B = .......
3 2 1

Pero, los k sucesos (
i
A B ) son excluyentes. Por lo tanto, por el 2 . AX y,
aplicando la funcin de probabilidad, se tiene,
( ) ) ( ..... ) ( ) (
2 1 K
A B P A B P A B P B P + + + = .
Como B depende de
i
A , entonces, para todo i, entonces

=
=
k
i
i
A P
i
A B P B P
1
) ( ) / ( ) (
Esta expresin resume la ley de la probabilidad total.

OBSERVACIN.
La medida de la ocurrencia del suceso de inters B, dada por ) ( B P ,
considera (y totaliza) todas las opciones asociadas a la ocurrencia de los k
sucesos
i
A .

LEY DE BAYES

Asumiendo todas las consideraciones, que se plantearon para llegar a
enunciar la ley de la probabilidad total, trataremos ahora de calcular la
probabilidad que ocurra uno, cualesquiera, de los suceso
i
A , suponiendo que el
suceso B ya ocurri, o sea, queremos calcular ) / ( B A P
i
.
Por definicin de probabilidad condicional,
( )
) (
) / (
B P
A B P
B A P
i
i
=
Pero B, depende de
i
A , entonces, ) ( ) / ( ) (
i i i
A P A B P A B P =
Luego, ( )

=

=
k
i
i i
i
i
A P A B P
A P A B P
B A P
i
1
) ( ) / (
) ( ) / (
/
Esta es la expresin de la Ley de Bayes.

Problema.7
Un negocio se provee de cierto artculo el cual es producido por 3 fbricas:
la I, la II y la III. En la I, se provee del 28 % de sus necesidades, en la II del 33
% y en la III del 39 %. De lo que produce cada fbrica, se ha determinado que
seran defectuosos: 5,1 % de los artculos de la fbrica I; 3,2 % de los de la II; y
el 2,4 % de los de la III.
a) Defina los sucesos simples involucrados en el problema y sus
probabilidades de ocurrencia.
b) Calcule la probabilidad que un artculo elegido al azar, comprado por el
negocio sea defectuoso.
c) Si el negocio compra 3800 artculos aproximadamente cuntos seran
defectuosos.
d) Si se elige un artculo, y este es defectuoso, cul es la probabilidad que
provenga de la fbrica II.

Respuesta a)
El suceso de inters es, B: que el artculo sea defectuoso. Este suceso
depende de cual sea la fbrica de donde proviene el artculo. Ante esto, podemos
plantearnos las siguientes hiptesis:

1
A : que el artculo sea de la fbrica I.

2
A : que el artculo sea de la fbrica II.

3
A : que el artculo sea de la fbrica III

39 , 0 ) ( ; 33 , 0 ) ( ; 28 , 0 ) (
3 2 1
= = = A P A P A P
Por otra parte, se ha determinado que:
024 , 0 ) / ( ; 032 , 0 ) / ( ; 051 , 0 ) / (
3 2 1
= = = A B P A B P A B P
Respuesta b)
De acuerdo con el anlisis anterior, podemos aplicar la ley de la
probabilidad total.
( ) ( )

=
= =
(

3
1
/ ) (
i
i i
A P A B P B P
defectuoso sea
artculo el que
P
( ) 39 , 0 024 , 0 33 , 0 032 , 0 28 , 0 051 , 0 + + = B P = 0,0342
Respuesta c)
La probabilidad que un artculo comprado sea defectuoso es 0,0342; por lo
tanto, si se compran 3800 se tendran aproximadamente, 3800 0,0342 artculos
defectuosos; o sea , 129,96 ~ 130.
Respuesta d)
Aqu se trata de calcular la probabilidad que ocurra el suceso
2
A ,
suponiendo que B ya ocurri. Por lo tanto, aplicamos la Ley de Bayes.
( )
0342 , 0
33 , 0 032 , 0
) (
) ( ) / (
/
2 2
2

=

=
B P
A P A B P
B A P = 0,3088
Problema 8.
En una fbrica, se quiere evaluar la efectividad de un programa de
seguridad que requiere que algunos operarios, seleccionados al azar, usen casco
de seguridad. Durante el perodo de prueba, se encontr que los operarios que
usan cascos de seguridad siempre, algunas veces o nunca, estn en la razn de 4 :
5 : 3. Tambin, se encontr que sufren lesiones un 2,2 % de los que siempre
usan el casco; 4,3 % de los que lo usan algunas veces y 8 % de los que no lo usan
nunca.
a) Defina los sucesos simples involucrados en el problema.
b) Si en la fbrica trabajan 560 operarios, aproximadamente cuntos de
ellos no debera sufrir lesiones.
c) Si supiramos que 120 operarios no sufriran lesiones, calcule cuntos de
ellos habran usado cascos de seguridad algunas veces o nunca.
Respuesta a)
B: que el operario sufra alguna lesin.
Este suceso B, depende de:

1
A : que el operario use casco siempre

2
A : que el operario use casco algunas veces.

3
A : que el operario use casco nunca.
Se determin que, el uso del casco siempre, algunas veces o nunca est en
la razn de 4 : 5: 3. O sea, de cada 12 operarios 4 lo usan siempre, 5 algunas
veces y 3 nunca. Por lo tanto,
( )
12
3
) ( ;
12
5
) ( ;
12
4
3 2 1
= = = A P A P A P
Por otra parte, dependiendo de la frecuencia del uso del casco, las
probabilidades que un operario sufra alguna lesin son:
( ) 08 , 0 ) / ( ; 043 , 0 ) / ( ; 022 , 0 /
3 2 1
= = = A B P A B P A B P
Respuesta b)
Para calcular la probabilidad, que un operario sufra alguna lesin, debemos
considerar todas las posibilidades en cuanto al uso del casco; por lo tanto,
aplicamos la ley de la probabilidad total.
( ) ) A ( P A / B P ) B ( P
i i
3
1 i
=

=

( ) 3 08 , 0 5 043 , 0 4 022 , 0
12
1
+ + =
Luego, P ( B ) = 0,0453
Por lo tanto, de los 560 operarios, no deberan sufrir alguna lesin
535 9547 , 0 560 ) 0453 , 0 1 ( 560 ~ = .
Respuesta c)
Aqu vamos a suponer que un operario no sufre alguna lesin, o sea, este
suceso es el contrario de B, que designamos B . Debemos calcular.
) / ( ) / ( ) / (
3 2 3 2
B A P B A P B A A P + = , o tambin ,
= 1 - ) B / A ( P
1

Pero, por la ley de Bayes,


) B ( P
)
1
A ( P )
1
A / B ( P
) B /
1
A ( P =
) A / B ( P 1 ) A / B ( P
1 1
= = 1 0,022 = 0,978
) B ( P 1 ) B ( P = = 1 - 0,0453 = 0,9547
Luego,
12 9547 , 0
4 978 , 0
) B / A ( P
1
= = 0,3415 ; y ,
) B / ) A A ( P
3 2
= 1 - 0,3415 = 0,6585
Ahora bien, en la eventualidad que 120 operarios no sufran lesiones, se
tendran 79 02 , 79 6585 , 0 120 ~ = que usaron casco algunas veces o
nunca.

Problema 9.
En el siguiente cuadro, se describe el comportamiento del gasto semanal de
combustible (en litros), versus la carga semanal transportada (en toneladas), en
base a una muestra de 191 camiones del mismo tipo.
CARGA
GASTO
320-335 335-350 350-365 365-380 380-395
1000-1150 9 11 6 4 2
1150-1300 3 6 5 9 7
1300-1450 10 9 12 8 5
1450-1600 2 5 8 13 11
1600-1750 2 7 14 10 13

a) Calcule la probabilidad que un camin consuma semanalmente entre 1000 y
1300 litros de combustible, y su carga transportada sea superior a las 365
toneladas por semana.
b) Suponga que un camin transporte entre 335 y 380 toneladas en la semana;
en tal caso, cul es la probabilidad que gaste entre 1150 y 1600 litros de
combustible por semana.
Respuesta a)
Sea A el suceso; entonces, 1152 , 0
191
16 6
) ( =
+
= A P
Respuesta b)
Sea B el suceso; entonces, 5906 , 0
44 45 38
30 25 20
) ( =
+ +
+ +
= B P



GUIA 5. DE EJERCICIOS

1. Se lanzan dos dados, calcule la probabilidad de ocurrencia de los siguientes
eventos.
a) La suma de puntos sea 8 y la diferencia 4. ( Resp. 0,0556 ).
b) La suma sea 8, suponiendo que la diferencia sea 4. ( Resp. 0,5 ).

2. En una caja hay 6 fichas que estn numeradas del 1 al 6. Una a una se
extraen al azar todas ellas. Calcule la probabilidad que las fichas extradas
aparezcan en orden creciente. ( Resp. 0,0014 ).

3. Entre 35 fichas de un archivo se encuentra la ficha que se necesita. Del
archivo se extraen al azar 8 fichas. Calcule la probabilidad que entre ellas est la
ficha que se necesita. ( Resp. 0,2286 ).

4. En un depsito hay 5 productos idnticos, 3 de ellos pintados. Se sacan al azar
2, calcule la probabilidad que, entre estos, se encuentren:
a) uno pintado. ( Resp. 0,6 ). b) dos pintados. ( Resp. 0,3 ).
c) al menos uno pintado. ( Resp. 0,9 ).

5. Un examen, para obtener licencia de conducir, consta de 25 preguntas. De
stas, un postulante esta seguro de contestar correctamente 20. Si el examinador
hace tres preguntas, cul es la probabilidad que el postulante las conteste
correctamente. ( Resp. 0,4957 )

6. Un dispositivo contiene dos elementos, que funcionan en forma independiente.
Las probabilidades de falla de estos elementos son, respectivamente, 0,05 y 0,08.
Calcule la probabilidad que falle el dispositivo si, para que esto ocurra, es
suficiente que falle al menos uno de los dos elementos. ( Resp. 0,126 ).

7. La probabilidad que una investigacin, orientada a crear un programa de
insercin social, tenga xito, se estima en 0,80. Adems, se estima en 0,55 la
probabilidad de que los gastos para mantenerlo estn dentro del presupuesto
inicial y, en 0,35, la probabilidad que se cumplan los dos objetivos.
a) Defina claramente los sucesos simples involucrados en el problema.
b) Determine si tales sucesos son independientes o no. Justifique su respuesta.
( Resp. No, porque, 0,80 0,55 = 0,44, es distinto de 0,35 )
c) Calcule la probabilidad que se logre por lo menos uno de los dos objetivos.
( Resp. 1 ).
d) Calcule la probabilidad que se logre solo uno de los dos objetivos.
( Resp. 0,65 )

8. En una empresa financiera se ha hecho un estudio del estado de los crditos
otorgados, considerando si estaban pagados o no. Se tom como base una
muestra de clientes elegidos al azar, clasificados en cuatro grupos etreos. Los
resultados se describen en la siguiente Tabla.

EDAD CREDITO PAGADO CREDITO IMPAGO TOTAL
20 - 25 15 25 40
25 - 30 28 10 38
30 - 35 35 13 48
MAS DE 35 43 12 55
TOTAL 121 60 181

a) Si un cliente tiene su crdito impago, estime la probabilidad de que tenga entre
20 y 30 aos de edad. ( Resp. 0,5833 ).
b) Calcule la probabilidad que un cliente tenga ms de 25 aos y su crdito este
pagado. ( Resp. 0,5856 ).
c) Calcule la probabilidad que un cliente tenga su crdito pagado, suponiendo que
tenga ms de 30 aos. ( Resp. 0,7573 ).

9. La probabilidad que el precio del dlar en Enero baje de $ 510 se estima en
0,65; mientras que, se estima en 0,72 la probabilidad que el precio de la libra de
cobre suba a 3,50 dlares. Por otra parte, se estima en 0,88 la probabilidad que
ocurra por lo menos uno de estos dos eventos.
a) Defina los sucesos involucrados en el problema.
b) Calcule la probabilidad que el precio del dlar baje de $ 510, y el precio de la
libra de cobre suba de 3,50 dlares, durante el mes de Enero. (Resp. 0,49)
c) Calcule la probabilidad que el precio del dlar baje de $ 510, suponiendo que el
precio de la libra de cobre baje de 3,50 dlares, durante el mes de Enero.
( Resp. 0,5714 )

10. Una empresa constructora va a participar en 18 propuestas pblicas; de las
cuales, 8 son de financiamiento regional, 6 de financiamiento municipal y 4 de otro
tipo de financiamiento. Si se consideran 7 cualesquiera de las 18 propuestas,
calcule la probabilidad que, entre ellas por lo menos 5 sean de financiamiento
municipal. ( Resp. 0,0128 )

11. Una bodega contiene 4650 artculos electrnicos, algunos de los cuales estn
afectados por oxidacin y/o sulfatacin. Para determinar la magnitud del dao, se
eligi al azar una muestra de 282 artculos. Los resultados fueron los siguientes:
38 artculos estaban sulfatados y oxidados; 53 sulfatados y no oxidados; 68
oxidados y no sulfatados; 123 ni oxidados ni sulfatados. De la bodega se elige un
artculo, cul es la probabilidad que est:
a) Oxidado y sulfatado. ( Resp. 0,1348 )
b) Sulfatado y no oxidado. ( Resp. 0,1879 )
c) Oxidado. ( Resp. 0,3759 )
d) Ni oxidado ni sulfatado. ( Resp. 0,4362 ).
Adems, determine en forma aproximada, cuntos de los 4650 artculos, que
estn en bodega, estaran en las situaciones que se sealan en las preguntas a),
b) , c) y d). ( Resp.: 627 para el caso a) ; 874 para el caso b) ; 1748 para el caso
c) ; y 2028 para el caso d) ).

12. Una empresa cuenta con un grupo de 15 profesionales, de los cuales 5 son
administrativos, 6 tcnicos y 4 ingenieros. Se requiere formar una comisin de 6
profesionales.
a) Calcule la probabilidad que entre ellos haya 3 tcnicos. ( Resp. 0,3357 )
b) Calcule la probabilidad que entre ellos haya 2 ingenieros y 3 tcnicos.
( Resp. 0,1199 )
c) Calcule la probabilidad que entre ellos haya por lo menos 3 administrativos.
( Resp. 0,2867 ).
d) Calcule la probabilidad que entre ellos haya 2 administrativos y 7 tcnicos.
( Resp. 0 ).

13. Un negocio se provee de cierto artculo, el cual es producido por tres fbricas:
I , II , III. De la fbrica I, se provee del 28 % de sus necesidades; de la II del 33
% y, de la III, del 39 %. De lo que produce cada fbrica se ha determinado que,
seran defectuosos: 5,1 % de los artculos de la fbrica I, 3,2 % de los de la II y,
2,4 % de los de la III.
a) Defina los sucesos simples involucrados en el problema y, sus probabilidades
de ocurrencia.
b) Calcule la probabilidad que un artculo, elegido al azar, comprado por el
negocio, sea defectuoso. ( Resp. 0,0343 ).
c) Si en bodega se tienen 3650 artculos calcule, aproximadamente, cuntos seran
defectuosos. ( Resp. 125 ).

14. En una fbrica existen dos personas, las cuales controlan que cada producto
cumpla con el estndar de calidad. La probabilidad que el control lo realice la
primera persona se estima en 0,55 y, la segunda en 045. Por otra parte se estima
en 0,9 la probabilidad que el producto sea reconocido como estndar, si lo controla
la primera persona y, en 0,98 si el control lo hace la segunda persona. Si un
producto fuera reconocido como estndar, cul es la probabilidad que el control
haya sido realizado por la segunda persona. ( Resp. 0,47 ).

15. El nmero de camiones que pasan por una gasolinera, con respecto a otros
vehculos, que tambin pasan por all, guarda una relacin de 3 es a 2. Se estima
que el 10 % de los camiones se abastecen de combustible; mientras que, de los
otros vehculos se estima que pasan a abastecerse de combustible el 20 %. Si a la
gasolinera llega una mquina a abastecerse de combustible, cul es la probabilidad
que esta sea un camin. ( Resp. 0,4286 ).

CAPITULO 7
ALGUNAS DISTRIBUCIONES DE PROBABILIDAD

En este captulo, presentaremos algunos modelos probabilsticos, que sirven
para describir fenmenos, o experimentos que, aunque son distintos, tienen un
comportamiento probabilstico semejante. Por ejemplo: lanzar una moneda y ver
el resultado; es decir, cara o sello . Nacimiento de un ser humano que da
como resultados hombre o mujer. En ambos casos se producen solo dos
resultados; por lo que, tanto el experimento de la moneda, como el fenmeno del
nacimiento, se pueden describir mediante el mismo tipo de modelo probabilstico.
Hay una gran cantidad de distribuciones de probabilidad, que pueden servir
para modelar experimentos o fenmenos, los cuales deben adecuarse al
experimento particular en estudio.
En este texto, trataremos algunos modelos que son de uso ms frecuente, en
aplicaciones a problemas reales; tales como la distribucin binomial, la distribucin
exponencial y la distribucin normal.

LA DISTRIBUCION DE BERNOULLI.

Aqu, se trata de describir el comportamiento de un experimento, o de un
fenmeno, que solo admite dos resultados que , en general, llamaremos xito y
Fracaso. Por ejemplo: El lanzamiento de una moneda, que genera dos
resultados Cara , Sello . El nacimiento de un ser humano, Hombre , Mujer.
El control de la calidad de un artculo, Fallado , Bueno.
En general, el espacio muestral, asociado a un experimento de este tipo, que
llamaremos experimento Bernoulli , es, O = { XITO , FRACASO }

Definamos la v.a. en la siguiente forma ,
X : O R ; tal que : X (XITO) = 1 , X (FRACASO) = 0
Una variable aleatoria discreta, como esta, se comporta segn la siguiente funcin
de probabilidad, llamada Modelo de Bernoulli, de parmetro p

f ( x ) = P ( X = x ) =

=
=
0 ; 1
1 ;
x si p
x si p

Donde, p = Probabilidad de xito = P ( x = 1 )

Las caractersticas numricas de una variable X de este tipo, asociadas a un
experimento Bernoulli, son las siguientes:

Promedio de X = E ( X ) = p ; Varianza de X = V ( X ) = p (1 - p) ;
Desviacin tpica de X = o ( X ) = ) 1 ( p p

LA DISTRIBUCION BINOMIAL.

Consideremos un experimento consistente en n ensayos o intentos (en
condiciones idnticas) de un experimento Bernoulli. Aqu, la variable aleatoria X es
la que nos d el nmero de xitos en los n ensayos, independientes, del
experimento. Por lo tanto X es una variable aleatoria discreta, que toma valores
en el conjunto, C = { 0 , 1 , 2 , 3 , ..........., n }
La funcin de probabilidad, que describe el comportamiento de este tipo de
experimento, recibe el nombre de Modelo Binomial, de parmetros n y p , y
est dado por la expresin,

x n x
) p 1 ( p
x
n
) x X ( P ) x ( f

|
|
.
|

\
|
= = =
con x = 0 , 1 , 2 , ,......., n

La probabilidad de xito en un ensayo del experimento es igual al parmetro
p.
La notacin que se usa, para indicar que la variable es de tipo Binomial, de
parmetros n y p , es, X ~ B ( n = ..... ; p = ..... )
La probabilidad de ocurrencia de un suceso A c C , asociado al experimento
en estudio, esta dada por la expresin, P ( A ) =

eA x
) x ( f


Las caractersticas numricas de una variable binomial, estn dadas por:
Promedio de X = E ( X ) = p n ; Varianza de X = V ( X ) = ) 1 ( p p n
Desviacin tpica de X = o ( X ) = ) 1 ( p p n
Ahora bien, una variable aleatoria discreta X tiene una distribucin binomial si
se dan las siguientes condiciones:
El experimento consiste en un nmero fijo de n ensayos idnticos, e
independientes.
Cada ensayo puede tener uno, de dos resultados posibles, que reciben el
nombre genrico de xito (o evento favorable), y Fracaso (o evento
desfavorable).
La probabilidad p de xito es la misma en cada ensayo.
Se define X como el nmero de xitos en n ensayos.

Ejemplo 1.
Histricamente se ha determinado que, el 68 % de los alumnos que siguen
cierto curso de postgrado lo aprueban. Estos cursos se hacen en base a grupos de
12 alumnos.
a) Calcule la probabilidad que el curso sea aprobado por 8 alumnos de los 12.
b) Calcule la probabilidad que, de los 12 alumnos que toman el curso, aprueben
por lo menos 10.
c) Calcule la esperanza o promedio, y la desviacin tpica, de la variable
involucrada en el ejemplo.
Respuestas :
Antes de responder las preguntas, es conveniente precisar la variable X
involucrada en el ejemplo.
X : Nmero de alumnos que aprueban de un total de 12
X ~ B ( n = 12 ; p = 0,68 ) ; o sea ,

x 12 x
) 32 , 0 ( ) 68 , 0 (
x
12
) x X ( P ) x ( f

|
|
.
|

\
|
= = =
con x = 0 , 1 , 2 , ,......., 12
Respuesta a)
P [que de los 12 alumnos, aprueben 8 ] = P (x = 8)

P (x = 8) = 2375 , 0 0105 , 0 0457 , 0 495 ) 32 , 0 ( ) 68 , 0 (
8
12
4 8
= =
|
|
.
|

\
|

Respuesta b)
P [que de los 12 alumnos, aprueben por lo menos 10 ] = P (x > 10)
= P (x = 10) + P (x = 11) + P (x = 12)
= 0,1426 + 0,0552 + 0,0098 . Luego, P (x >10) = 0,2076
Respuesta c)
Promedio de X = E ( X ) = n p = 12 0,68 = 8,16 = 8 alumnos
Esto significa que, en promedio, de cada 12 alumnos que toman el curso, 8 lo
aprobaran.
Desviacin tpica de X = ) p 1 ( p n ) x ( = o
32 , 0 68 , 0 12 ) x ( = o = 2,6112 = 1,62 = 2 alumnos

Ejemplo 2.
Una empresa constructora ha ganado el 65 % de las propuestas pblicas en
que ha concursado en el pasado. . En los prximos dos meses, concursar en 20
propuestas.
a) Defina la variable involucrada en el problema.
b) Calcule la probabilidad que gane 10 de estas propuestas.
c) Calcule la probabilidad que gane entre 10 y 12 de estas propuestas.
Respuesta a)
X : Nmero de propuestas ganadas de un total de 20
X ~ B ( n = 20 ; p = 0,65 ) ; por lo tanto, el modelo es,

x 20 x
) 35 , 0 ( ) 65 , 0 (
x
20
) x X ( P ) x ( f

|
|
.
|

\
|
= = =
con x = 0 , 1 , 2 , ,......., 20
Respuesta b)
P [ que gane 10 de las 20 propuestas ] = P (x = 10)

10 10
) 35 , 0 ( ) 65 , 0 (
10
20
) 10 ( ) 10 (
|
|
.
|

\
|
= = = x P f
P (x = 10) = 184756 0,0135 0,000028 = 0,0698

Respuesta c)
P [ que gane entre 10 y 12 de las 20 propuestas ] =
= P (x = 10) + P (x = 11) + P (x = 12)
= 0,0698 + 0,1165 + 0,1617 = 0,3480

LA DISTRIBUCION EXPONENCIAL.

Una variable aleatoria continua X , asociada a un experimento en estudio, se
comporta en forma EXPONENCIAL, con parmetro o , cuando la funcin de
probabilidad, que define su comportamiento, est dada por,
0 x ; e ) x ( f
x

o
o =
Notacin : X ~ exp ( ) ..... = o

Las probabilidades de sucesos, asociados a una variable exponencial, se
calculan con las siguientes frmulas, que se derivan de lo anterior.
1. P ( x s a ) = 1 - e
a o

2. P ( x b ) = 1 - P ( x s b )
= 1 - (1 - e
b o
) . Luego, P ( x b ) = e
b o

3. P ( c s s x d ) = (1 - e
d o
) - (1 - e
c o
).
Luego, P ( c s s x d ) = e
c o
- e
d o


Caractersticas numricas de una variable exponencial X.

Promedio de X =
o
1
; V ( X ) =
2
1
o
; o ( X ) =
o
1
= Prom(X)
De acuerdo a lo anterior, se tiene que el parmetro de la exponencial est
dado por,
) ( Pr
1
X om
= o
Por esta razn, la funcin de densidad de una variable exponencial se escribe,
tambin, en la siguiente forma,
0 ;
) ( Pr
1
) (
) ( Pr
x e
X om
x f
X om
x

=

Ejemplo 3.
Se ha determinado que, la duracin en horas, de un artculo que produce una
mquina automtica, se comporta en forma exponencial, con parmetro
o = 0,007 .
a) Defina la variable involucrada en el ejemplo.
b) Calcule la probabilidad que, un artculo elegido al azar, dure por lo menos 135
horas.
c) Calcule la duracin promedio por artculo.
Respuesta a)
X : Duracin [ hrs ]
X ~ exp ( o = 0,007) ; o sea , el modelo est dado por,
0 x ; e 007 , 0 ) x ( f
x 007 , 0

= , y , adems ,
x
e x X P
007 , 0
1 ) (

= s
Respuesta b)
P [ que la duracin del art. sea al menos 135 hrs. ] = P (x > 135)
P (x > 135 ) =
945 , 0 135 007 , 0
e e

= = 0,3887
Respuesta c)
Prom ( X ) =
o
1
=
007 , 0
1
= 142,9 horas.
O sea, la duracin promedio por artculo sera de 142,9 horas. La desviacin
tpica tambin es igual a 142,9 horas.

LA DISTRIBUCION NORMAL.

Una variable aleatoria continua X, asociada a un experimento en estudio, se
comporta en forma NORMAL, con parmetros
2
y o , cuando su funcin de
densidad, que describe su comportamiento est dada por,

2
2
) x (
2
1
2
e
2
1
) x ( f
o

o t
= ; con x ) , ( e
OBSERVACIONES.
1. Notacin : X ~ N ( ...... ; .....
2
= o = )
2. Al examinar la funcin de probabilidad, de la variable normal, se puede
observar que esta queda totalmente determinada cuando se conocen los valores
de los parmetros
2
y o . O sea, esta funcin representa en realidad una
familia de distribuciones normales.
3. La descripcin geomtrica de una distribucin normal, est asociada a una
curva llamada la Campana de Gauss .
4. La funcin f tiene un mximo absoluto cuando x es igual al parmetro .
5. La curva es simtrica respecto al eje vertical que pasa por x = .

6. En la grfica, podemos apreciar que:
0 ) x ( f > ; para todo x . Adems, se puede probar que,
P ( x ) = 1 ; lo cual, geomtricamente es equivalente a la medida
del Area total de la regin encerrada por la campana.
7. Para un suceso A = { x / a b x s s } , su probabilidad de ocurrencia est
dada por,
P ( a b x s s ) =
}
o

o t
b
a
) x (
2
1
2
2
2
e
2
1


Caractersticas numricas de una variable Normal X.
Promedio de X = ; V ( X ) =
2
o ; Desviacin tpica de X = o

Probabilidad de ocurrencia de un suceso, asociado a una variable
normal.

La probabilidad de un suceso A , asociado a una variable normal, representa un
problema de clculo demasiado complicado; porque, debe calcularse con la
frmula que aparece en la observacin 7, para cada
2
y o , del caso particular
en estudio Sin embargo es posible hacerlo ms simple usando la llamada
Distribucin Normal Tipificada ( o Standard ), que describe el comportamiento de
una variable Z , que est relacionada con la variable X , mediante la expresin,
o

=
X
Z
Se puede probar que Z se comporta en forma normal con parmetros fijos
1 y 0
2
= o = ; la cual, recibe el nombre de Normal tipificada o Normal
standard. La notacin, que se usa es la siguiente, Z ~ N ( 0 ; 1 )
Esta funcin de probabilidad de la variable tipificada Z est dada por,

2
2
1
z
e
2
1
) z ( f

t
= ; con z ) , ( e

Su funcin de distribucin acumulativa se designa ) z ( u , y, est dada por
) z ( u = P ( Z ) z s =
}

z
dz e
z
2
2
2
1
t


El valor de la funcin ) z ( u , para cada valor particular de z , que nos da la
probabilidad que la variable sea menor o igual a dicho valor particular, estn
calculados y tabulados en Tablas, que estn disponibles en cualquier Texto de
Estadstica. Con esto, es posible calcular la probabilidad de cualquier suceso,
asociado a la variable Z , y , por consiguiente, a cualquier suceso que tenga que
ver con la variable normal X , previa transformacin de X a Z.

As, para el clculo de probabilidades de sucesos, asociados a una variable
normal tipificada z , se usarn las siguientes frmulas
(a). P ( z s a ) = ) a ( u
(b). P ( z b ) = 1 - P ( z s b ) = 1 - ) b ( u
(c). P ( c d z s s ) = ) d ( u - ) c ( u

Observacin.
Las probabilidades, dadas por ) z ( u , aparecen en la Tabla 1, para z positivo,
y en la Tabla 1a , para z negativo.

Ejemplos.

Determine las siguientes probabilidades, usando las Tablas 1 y 1a.
1. P ( z s 1,37 ) = ) 37 , 1 ( u , esta probabilidad esta en la Tabla 1a , para
z = 1,37 . All, se obtiene, P (z s 1,37) = 0,9147 .







2. P ( z - 0,43 ) = 1 - P ( z s -0,43 ) = 1 - ) 43 , 0 ( u
P ( z - 0,43 ) = 1 - 0,3336 = 0,6664






3. P ( -0,20 05 , 1 z s s ) = ) 05 , 1 ( u - ) 20 , 0 ( u
= 0,8531 - 0,4207 = 0,4324






Geomtricamente, las probabilidades calculadas, son equivalentes a las
medidas de las reas de las regiones que se muestran en cada caso; mientras que,
los distintos valores de z corresponden a puntos del eje horizontal Z.



Ejemplo 4.

El consumo mensual de agua, en las casas de una poblacin, se comporta en
forma normal, con media de 56,7 metros cbicos y desviacin tpica de 8,3 metros
cbicos.
a) Defina claramente la variable, involucrada en el problema.
b) Calcule la probabilidad que una casa, elegida al azar, consuma por lo menos 65
metros cbicos de agua en el mes.
c) Si la poblacin est constituida por 1300 casas, calcule en forma aproximada
cuntas deberan consumir menos de 50 metros cbicos de agua al mes.
d) La empresa distribuidora, subsidia al 10,5 % de las casas con consumos
mensuales bajos. Calcule el consumo mensual de agua que debe tener, como
mximo una casa, para acceder a este beneficio.

Respuesta a)
X : Consumo mensual [ m
3
] , X ~ N ( ) 3 , 8 ; .. 7 , 56 = = o

3 , 8
7 , 56 X
Z

= ~ N ( 0 ; 1 )

Respuesta b)
P [ que una casa consuma al menos 65 m
3
] = P ( x 65 > )
P ( x 65 > ) = P ( z )
3 , 8
7 , 56 65
> = 1 - P ( z < 1 )
= 1 - ) 1 ( u = 1 - 0,8413 = 0,1587

Respuesta c)
P [ que una casa consuma menos de 50 m
3
] = P ( x 50 )
P ( z )
3 , 8
7 , 56 50
= P ( z ) 81 , 0 = ) 81 , 0 ( u = 0,2090

Por lo tanto, de las 1300 casas, tenemos 1300 0,2090 = 271,7 ; o sea,
aproximadamente, 272 casas que tendran un consumo mensual de agua inferior
a 50 m
3
.
Respuesta d)
Sea x
M
el consumo mximo , entonces,
P [ que una casa acceda al subsidio ] = P ( x < x
M
) = 0,105
P ( z )
3 , 8
7 , 56 x
M

= 0,1050
3 , 8
7 , 56 x
M

= -1,25
(aproximado, segn la tabla 1). Por lo tanto,
x
M
= -1,25 8,3 + 56,7 = 46,3 m
3


Ejemplo 5.
El peso promedio, por saco de harina de pescado, de una partida grande de
sacos, es de 48,8 kilos. El 88,5 %, de la partida de sacos, pesa ms de 48 kilos
cada uno.
a) Suponiendo que el peso de los sacos se distribuye en forma normal, calcule la
desviacin tpica del peso de los sacos.
b) Calcule, aproximadamente, cuntos sacos de un embarque de 20000 deberin
pesar, cada uno, entre 45 y 50 kilos.

Respuesta a)
X : Peso [ kilos ] , X ~ N ( ) ? ; 8 , 48 = o =
Z =
o
8 , 48 x
~ N (0 ; 1) ; P (x > 48 ) = 0,885 ; P ( z >
o
8 , 48 48
)
= P (z > -
o
8 , 0
)= 0,885 1 - P (z s -
o
8 , 0
) = 0,885 P ( z s -
o
8 , 0
)
= 0,115 -
o
8 , 0
= -1,20 o = 0,67 kilos, es la desviacin tpica.

Respuesta b)
( )
9731 , 0 0262 , 0 9633 , 0 ) 94 , 1 ( ) 79 , 1 (
) 94 , 1 79 , 1 ( ) ( 50 5 , 47
50 5 , 47
67 , 0
8 , 48 50
67 , 0
8 , 48 5 , 47
= = u u =
s s = s s = s s =
(


z P z P x P
Kgs y entre
pese saco un que
P
20000 0,9731 = 19462 sacos del embarque pesaran entre 47,5 y 50 Kgs.


EL TEOREMA DEL LIMITE CENTRAL. T .L.C

Consideremos una poblacin, que se estudia en relacin a una variable
aleatoria X , la cual est definida por su funcin de probabilidad f
X
. Esta
poblacin, est caracterizada por su esperanza y su varianza que son,
respectivamente, E ( x ) =
2
X X
) x ( V y o = . Si en la poblacin, se eligen
muestras de tamao n y, para cada muestra, se obtiene la media muestral x ,
entonces , dichas medias varan de muestra en muestra; por lo tanto, la media
muestral x es una variable aleatoria. El teorema del lmite central plantea que, la
variable x se comporta en forma normal, con parmetros :
=
x x
y
n
x
x
o
= o
Resumiendo :
X ~ f
X
; en la poblacin en estudio con : E ( x ) =
2
X X
) x ( V y o =
Si se eligen muestras, de tamao n , entonces , la Media muestral ,
X ~ N ( =
x x
;
n
x
x
o
= o ) y , por lo tanto ,
Z =
n
x
x
x
o

~ N ( 0 ; 1 )

Ejemplo 6.
Se ha determinado que, la duracin en horas, de un artculo que produce
una mquina automtica, se comporta en forma exponencial, con parmetro
o = 0,007 . Si se elige una muestra aleatoria de 22 artculos, cul es la
probabilidad que la duracin media, por artculo, vare entre 130 y 160 horas.

Respuesta.
Identifiquemos las variables involucradas en el ejemplo.
X : Duracin [ horas ]
X ~ exp (o = 0,007) , con ,
E ( x ) = 9 , 142
1
x X
= o =
o
= horas .
Por otra parte ,
X : Duracin media [ horas ] ; y, por el teorema del lmite central,
X ~ N ( =
x x
= 142,9 ;
n
x
x
o
= o =
22
9 , 142
= 30,5 )

5 , 30
9 , 142 X
Z

= ~ N ( 0 ; 1 ) . Entonces,
P[que, en 22 artculos, la duracin media vare entre 130 y 160 horas] =

= P ( 160 x 130 s s ) = P ( s

5 , 30
9 , 142 130
5 , 30
9 , 142 160
Z

s )
= P ( -0,42 s z s 0,56 ) = ) 56 , 0 ( u - ) 42 , 0 ( u
= 0,7123 - 0,3372 = 0,3751

APROXIMACION NORMAL DE LA BINOMIAL

Consideremos una variable aleatoria discreta X, que se comporta en forma
binomial. O sea, X ~ B ( n = ...... ; p = ...... ) y su funcin de probabilidad
est dada por ,

x n x
) p 1 ( p
x
n
) x X ( P ) x ( f

|
|
.
|

\
|
= = = ; con x = 0 , 1 , 2 , ,...., n
Cuando n es grande (n>20), resulta demasiado laborioso calcular la
probabilidad de algn suceso que contenga gran cantidad de valores particulares
de la variable x. Sin embargo, esta dificultad se puede subsanar aproximando la
distribucin binomial mediante una normal. Pero, sabemos que, la distribucin
normal describe el comportamiento de una variable continua; mientras que, la
binomial lo hace para una variable discreta. Esto se soluciona transformando la
v.a.d. X , en una v.a.c. X
c
, mediante lo que llamaremos correccin por
continuidad, que se expresa por la relacin, X
c
= X 5 , 0
Entonces, la variable corregida se comporta en forma normal, con los
parmetros que se dan a continuacin. Es decir,

X
c
= ( X 5 , 0 ) ~ N ( ) p 1 ( p n ; p n
c c
X X
= o = )
Z =
) p 1 ( p n
p n ) 5 , 0 x (


~ N ( 0 ; 1 )
En general, la aproximacin normal de la binomial, se usa cuando n p,
y n p ( 1 - p ) tienen valores de por lo menos 5.

OBSERVACIN.
La correccin por continuidad se hace en la siguiente forma.
1. ) 5 , 0 ( ) ( + s = s a x P a x P
2. ) 5 , 0 ( ) ( = > b x P b x P
3. ) 5 , 0 5 , 0 ( ) ( + s s = s s c x c P d x c P

Ejemplo 7.
Se ha determinado que, en los colegios de enseanza media, el 65 % de los
alumnos fuma cigarrillos. Si se elige una muestra aleatoria de 250 alumnos, cul es
la probabilidad que, por lo menos, 150 sean fumadores.

Respuesta.
Definicin de las variables involucradas en el ejemplo.
X : Nmero de alumnos que fuman de un total de 250
X ~ B ( n = 250 ; p = 0,65 ) ; o sea ,

x 250 x
) 35 , 0 ( ) 65 , 0 (
x
250
) x X ( P ) x ( f

|
|
.
|

\
|
= = = ; con x = 0 , 1 , 2 , ..., 250
Si usramos directamente este modelo, deberamos calcular lo siguiente.
P [ que de los 250 alumnos, por lo menos, 150 fumen ] = P ( x ) 150 >
=
x 250 x
250
150
) 35 , 0 ( ) 65 , 0 (
x
250

|
|
.
|

\
|
; lo cual implica hacer 101 clculos.
Sin embargo, dado que: np = 2500,65 = 162,5 y np(1 - p) = 56,9 ;
ambos valores son mayores que 5; entonces, podemos usar la aproximacin
normal de la binomial. Para esto, debemos hacer la correccin por continuidad.
Por lo tanto,
X
c
= ( X 5 , 0 ) ~ N ( 54 , 7 ) p 1 ( p n ; 5 , 162 p n
c c
X X
= = o = = )

Z =
) p 1 ( p n
p n ) 5 , 0 x (


~ N ( 0 ; 1 )

P [ que de los 250 alumnos, por lo menos, 150 fumen ] = P ( x ) 150 >
P ( x ) 150 > = P ( x
c
> 150 - 0,5 ) = P ( x
c
> 149,5 )
= P (
54 , 7
5 , 162 5 , 149
z

> ) = P ( z > -1,72 )
= 1 - P ( z < -1,72 ) = 1 - ) 72 , 1 ( u = 1 - 0,0427 = 0,9573

GUIA 6 DE EJERCICIOS

1. Una gran lote de artculos es aceptado si un control, en base a una muestra
aleatoria de 8 artculos, da como resultado no ms de 1 artculo defectuoso. Si con
el proveedor se concert, como mximo, 5 % de artculos defectuosos en cada
lote, cul es la probabilidad que un lote de artculos sea aceptado.
( Resp. 0,9427 ).

2. Histricamente se ha determinado que , de cada 100 reclamos que se presentan
en el Servicio Nacional del Consumidor (SERNAC), 62 son fallados a favor del
consumidor. Si en un da se presentan 12 reclamos, cul es la probabilidad que:
a) 10 sean fallados a favor del consumidor. ( Resp. 0,0801).
b) No ms de 9 sean fallados a favor del consumidor. ( Resp. 0,1070 ).
c) Calcule la probabilidad que, de 80 consumidores que presentan algn reclamo
en el Sernac, no ms de 10 obtengan fallos adversos. ( Resp. 0 ).

3. Se ha determinado, de acuerdo a la experiencia anterior que, los puntajes
finales de un examen de Estadstica se distribuyen en forma Normal, con media de
68 puntos y desviacin tpica de 13 puntos.
a) Si el puntaje mnimo aprobatorio fuera de 55 puntos, calcule el nmero
aproximado de alumnos que aprobaran de un total de 328. ( Resp. 276 ).


b) Si se decidiera que han de aprobar 250 alumnos, de 328 que dan el examen,
calcule el puntaje mnimo que un alumno necesita para aprobar la asignatura.
( Resp. 58,64 puntos ).
c) En una muestra aleatoria de 23 alumnos que dan el examen, cul es la
probabilidad que el puntaje promedio, por alumno, sea de al menos 70 puntos.
( Resp. 0,2297 )

4. La cantidad de bebida, envasada en botellas, que entrega una mquina
automtica, es una variable que se comporta en forma Normal, con media de 200
cc y desviacin tpica de 15 cc.
a) Calcule la probabilidad que una botella, elegida al azar, contenga entre 190 y
198 cc de bebida. ( Resp. 0,1969 ).
b) El 2,34 % de las botellas son rechazadas por contener una cantidad insuficiente
de bebida. Determine cul es la cantidad mnima de bebida, que debe contener
una botella, para no ser rechazada. ( Resp. 170,15 cc ).
c) Si se elige una muestra aleatoria de 10 botellas, cul es la probabilidad que la
cantidad promedio de bebida, por botella, sea de al menos 195 cc.
( Resp. 0,8531 ).

5. La duracin, en miles de horas, de una pieza metlica de una mquina, se
comporta en forma Exponencial, con parmetro o igual a 0,35 . Calcule la
probabilidad que una pieza metlica, elegida al azar, dure:
a) Por lo menos 3000 horas. ( Resp. 0,3499 ).
b) Entre 2800 y 3100 horas. ( Resp. 0,0374 ).
c) Suponga que se elige una muestra aleatoria de 20 piezas, calcule la probabilidad
que la duracin media por pieza sea de no ms de 2500 horas.
( Resp. 0,2877 ).
d) Se ha determinado que el 3,8 % de estas piezas metlicas no cumplen con la
garanta del fabricante y, en tal caso el comprador puede solicitar una nueva.
Calcule la duracin mnima, que debe tener cualesquiera de estas piezas, para que
el comprador no haga uso de la garanta. ( Resp. 111 horas).

6. En un estudio hecho en consultorios municipales de salud se ha determinado
que el tiempo de atencin por paciente, se distribuye en forma Exponencial, con
promedio de 10,5 minutos por paciente.
a) Defina la variable involucrada en el problema.
b) Calcule la probabilidad que el tiempo de atencin de una paciente sea de no
ms de 12 minutos. ( Resp. 0,6809 ).
c) Calcule la probabilidad que el tiempo de atencin de una paciente vare entre
10 y 13 minutos. ( Resp. 0,0959 ).
d) Si se considera una muestra aleatoria de 15 pacientes, cul es la probabilidad
que el tiempo de atencin promedio, por paciente, sea como mximo de 15
minutos. ( Resp. 0,9515 ).

7. El consumo mensual de electricidad, en las casas de una poblacin, se comporta
en forma Normal, con media de 132,7 Kw / h, y desviacin tpica de 15,4 Kw / h.
a) Calcule la probabilidad que una casa, elegida al azar, consuma mensualmente
menos de 118 Kw / h de electricidad. ( Resp. 0,1711 9.
b) Si el total de casas de la poblacin es 380, calcule aproximadamente cuntas
deberan consumir entre 125 y 140 Kw / h de electricidad. ( Resp. 142 ).
c) Si se eligieran al azar 20 casas, cul es la probabilidad que el consumo promedio
mensual de electricidad, por casa, vare entre 128 y 141 Kw / h.
( Resp. 0,9051 ).
d) La empresa elctrica subsidia al 8,5 % de las casas con consumos mensuales
bajos. Calcule el consumo mximo mensual, que debe tener una casa, para
acceder a este beneficio. ( Resp. 111,6 Kw/h ).

8. Se embarcan motores elctricos pequeos en lotes de 50. Antes de que el
cargamento sea aceptado, un inspector de calidad elige 5 motores y los prueba. Si
ninguno de los motores probados tiene defectos, el lote es aceptado. Si se
encuentra que uno o ms son defectuosos, se prueban todos los motores del lote.
La norma del fabricante es que, en cada lote, puede haber 3 defectuosos.
a) Calcule la probabilidad que, en cada lote, un motor sea defectuoso.
( Resp. 0,06 )

b) Calcule la probabilidad que sea necesaria una inspeccin completa del lote.
( Resp. 0,2661 ).

9. Una empresa fabrica diariamente 1200 bloquetas para la construccin. La
resistencia a la rotura de la bloqueta es una variable que se comporta en forma
Normal, con media de 420 Kg / cm
2
, y desviacin tpica de 68 Kg / cm
2
. Por otra
parte, se considera que una bloqueta es defectuosa si su resistencia a la rotura es
menor de 340 Kg / cm
2
.
a) Calcule la probabilidad que una bloqueta sea defectuosa. ( Resp. 0,1190 ).
b) Calcule la probabilidad que una bloqueta tenga una resistencia de por lo menos
450 Kg / cm
2
. ( Resp. 0,3300 ).
c) Calcule la probabilidad que, de las 1200 bloquetas que se fabrican diariamente,
al menos 135 sean defectuosas. Previamente, defina la variable involucrada en la
pregunta. ( Resp. 0,7703 ).
d) Calcule la probabilidad que, de las 1200 bloquetas que se fabrican diariamente,
se encuentren entre 130 y 140 defectuosas. ( Resp. 0,3037 ).

10. Un anlisis de los accidentes de trnsito, que se producen anualmente, ha
determinado que el 43,7 % de ellos se deben al consumo excesivo de alcohol de
los conductores de los vehculos.
a) Suponga que en un ao se produzcan 15 accidentes. Calcule la probabilidad
que no ms de 12 se deban al consumo excesivo de alcohol. ( Resp. 0,0007 ).
b) Se estima que en un ao se podran producir 87 accidentes. Calcule la
probabilidad que entre 40 y 55 de ellos no tengan relacin con el consumo
excesivo de alcohol. ( Resp. 0,9005 ).

11. El tiempo promedio que un turista emplea en los trmites de inmigracin, en
las fronteras de Per y Chile, se estima en 18,5 minutos. Se supone que dicho
tiempo se comporta en forma exponencial.
Si se considera una muestra aleatoria de 23 turistas, cul es la probabilidad
que el tiempo promedio de atencin, por turista, sea de por lo menos 16,5
minutos. ( Resp. 0,6985 ).

CAPITULO 8
ELEMENTOS DE INFERENCIA

La inferencia consiste bsicamente en estudiar una poblacin, para una
variable en estudio, en base a una muestra aleatoria de ella. Tericamente, la
poblacin tiene un comportamiento que est descrito por su funcin de
probabilidad
X
f , que puede ser de cuanta, si la variable en estudio es discreta , o
de densidad, si la variable es continua. Por otra parte, la poblacin est
caracterizada, principalmente, por la esperanza de X que llamamos , y la
varianza de X , que llamamos
2
o , que nos permiten medir la tendencia y la
variabilidad en el comportamiento de la poblacin, para la variable en estudio. En
general, cuando se estudia una poblacin, desconocemos
X
f , o los parmetros
o
2
o . Sin embargo, es posible hacer una estimacin de ellos, usando una
muestra aleatoria, elegida en la poblacin. Esto es, hacer inferencias acerca de la
poblacin que nos interesa estudiar, mediante los resultados observados en la
muestra elegida en ella. O sea, el objetivo del investigador es proyectar estos
resultados, obtenidos en la muestra aleatoria, hacia toda la poblacin de donde
proviene la muestra. Esto implica un error de estimacin, pero este se puede
cuantificar, considerando que en dicho error influyen la confiabilidad, que se da a
la investigacin, la variabilidad, el tamao de la muestra, y el tamao de la
poblacin ( si se conoce ).
En particular, para este curso, haremos inferencias relacionadas con los
parmetros de poblaciones que se suponen se comportan , ya sea en forma
normal , o en forma binomial. Por lo tanto, los parmetros a estimar son y
2
o ., de una poblacin normal, y , p de una poblacin binomial.
Los estimadores puntuales de estos parmetros, que se calculan con los datos
muestrales, son , respectivamente , x , que es la media muestral; s , que es
la desviacin tpica muestral , y , p , que es la proporcin muestral.
Los mtodos inferenciales, abordan principalmente dos tipos de problemas,
suponiendo que conocemos el comportamiento probabilstico de la poblacin en
estudio:
La estimacin del verdadero valor del parmetro.
La prueba de hiptesis relacionada con el verdadero valor del
parmetro.

ESTIMACIN DE PARAMETROS

La estimacin de un parmetro, se hace mediante un intervalo de
confianza,es decir, mediante un par de nmeros, que constituyen el lmite
inferior, y el lmite superior, entre los cuales debera estar el verdadero valor del
parmetro, con una probabilidad , fijada a priori por el investigador. Esta
probabilidad recibe el nombre de nivel de confianza o confiabilidad , y se
designa . Es deseable que un intervalo de este tipo, sea lo ms estrecho posible
y, adems, contenga el verdadero valor del parmetro con una probabilidad alta.

Intervalo de confianza del, 100 %, para el verdadero valor
del parmetro , de una poblacin normal.

Sea X la variable en estudio, suponemos que, X ~ N ( ;
2
o ) ; en la
poblacin en estudio.
Queremos estimar o inferir, el verdadero valor de , mediante una muestra
aleatoria, de tamao n.
Esta estimacin se har mediante un intervalo de confianza IC, el cual est
estructurado en la siguiente forma IC [ ] : x E ; donde:
x es la media Muestral y E es el error de estimacin.
El objetivo es determinar los lmites, inferior y superior, del intervalo.

O sea, L
i
= x - E y L
s
= x + E , entre las cuales estara el
verdadero valor del parmetro , con una probabilidad .
En general, para hacer una estimacin de parmetro es necesario conocer la
distribucin del estimador puntual del parmetro.
En este caso, sabemos, por el teorema del lmite central, que,
x ~ )
n
; ( N
x
x x
o
= o = ; adems ,

n
x
z
o

=

~ N ( 0 ; 1 )
Esto implica que podemos encontrar un valor z
c
de Z, tal que,

o = = s s 1 ) z Z z ( P
c c

Reemplazando, tenemos ,
o
o

= =
|
|
|
|
.
|

\
|
s

s 1
c
Z
n
x
c
Z P
o
o

o
= =
|
|
.
|

\
|
s s 1
n
Z x
n
Z P
c c

o
o

o
= =
|
|
.
|

\
|
+ s s 1
n
Z X
n
Z X P
c c

o
o o
= =
|
|
.
|

\
|
+ s s 1
n
Z X
n
Z X P
c c


De lo anterior se deduce que, los lmites del intervalo de confianza son :
L
i
=
n
c
z x
o
y L
s
=
n
c
z x
o
+
Donde : z
c
= z
) 1 (
2
o

, y el error de estimacin es ,
E = z
) 1 (
2
o


n
o
.
En el error de estimacin E , z
c
cuantifica la confiabilidad , mientras que ,
cuantifica la Variabilidad. Por otra parte, tambin influye en el error E, el tamao
n de la muestra y el tamao N, de la poblacin en estudio, lo cual se mide
mediante el factor de correccin para poblaciones finitas, que aparece en la
expresin siguiente.

1 N
n N
n
z E
) 1 (
2

o
=
o


En esta expresin, es la confiabilidad o nivel de confianza ; adems,
= 1 - o , o , o = 1 - . o recibe el nombre de nivel de significacin. El valor ,
) 1 (
2
o

z , se encuentra en la Tabla 1, para una probabilidad igual a ,


)
2
1 (
o

.
Resumiendo , IC [ ] :
1 N
n N
n
z x
) 1 (
2


Aqu, se supone que la desviacin tpica poblacional o es conocida
Si N no se conoce, entonces el factor de correccin no se considera
dentro del error.

Observacin importante.
Supongamos una poblacin normal infinita , con o conocida , donde
queremos determinar el tamao mnimo de la muestra para estimar el verdadero
valor de la media poblacional ., con una confiabilidad , y aceptando un error
mximo de estimacin E . O sea, esto significa que,
z
) 1 (
2
o


n
o
s E , esto implica que,
E

) (
z
2
1
n
o
o

> .
Luego ,
2
E
z
n

)
2
1 (
(
(

o
>
o




Intervalo de confianza, del 100 % , para el parmetro , de
una poblacin normal, en que y son desconocidos.

Recordemos que, el estimador puntual de es x , y el de es s. x y s se
calculan con los datos de la muetra : x
1
, x
2
, ......... , x
n
.
Se puede demostrar que , la variable , t , que se define a continuacin , tiene
un comportamiento de Student , con ( n 1 ) grados de libertad . O sea,

n
s
x
t

= ~ t
) 1 n (

Por lo tanto, podemos determinar un valor t
c
de t , tal que ,
o = = s s 1 ) t t t ( P
c c

Si hacemos el reemplazo de t , y procedemos como lo hicimos anteriormente
para z , obtenemos finalmente el intervalo de confianza para .
| |
n
s
t x : C I
) 1 n ; 1 (
2

o

El valor de de t , que aparece en el intervalo, se encuentra en la Tabla 2.
Adems, si conocemos el tamao N de la poblacin debemos incluir en el error de
estimacin E , el factor de correccin para poblaciones finitas. En tal caso, el error
de estimacin es

1 N
n N

n
s
t E
) 1 n ; 1 (
2

=

o

Con esto, se puede concluir que, = + s s ) E x E x ( P

EJEMPLO DE REFERENCIA 1.
De los alumnos que asisten a un curso de formacin profesional, se eligieron
al azar dos grupos, uno de 13 alumnos y el otro de 11. En cada grupo, se aplicaron
mtodos pedaggicos distintos. Suponga que el rendimiento de los alumnos se
comporta en forma normal, para ambos grupos. Los exmenes finales, idnticos
para cada grupo, dieron los siguientes resultados.
Para el grupo 1, donde se aplic el mtodo 1: n
1
= 13 alumnos ;
Media = 68 puntos ; Desviacin tpica = 12 puntos .
Para el grupo 2, donde se aplic el mtodo 2 : n
2
= 11 alumnos ;
Media = 54 puntos ; Desviacin tpica = 10 puntos .
a) Defina claramente la variable, y las poblaciones en estudio.
b) Determine un intervalo de confianza del 95 %, para el rendimiento promedio
verdadero, por alumno, si se aplicara el mtodo 1.
c) Determine un intervalo de confianza del 95 %, para la desviacin tpica del
rendimiento por alumno, si se usara el mtodo pedaggico 2.
d) Determine un intervalo de confianza, del 95 %, para el cuociente entre las
varianzas verdaderas, asociadas a ambos mtodos. De acuerdo al resultado,
determine si es factible el supuesto de igualdad de varianzas ( homocedasticidad ).
e) Determine un intervalo de confianza del 95 %, para la diferencia entre las
medias verdaderas de los rendimientos, por alumno, asociados a ambos mtodos.

Respuesta 1a)
Definicin de la variable.
X : Rendimiento [ puntos ] ; X ~ N(
1
;
1
) ; en la
poblacin de alumnos en que se aplica el mtodo 1.
X ~ N (
2
;
2
) ; en la poblacin de alumnos en que se aplica el mtodo
2.

Respuesta 1b)

975 , 0
2
1 ; 05 , 0 ; 95 , 0
alumnos 13 n ; puntos 2 1 s ; puntos 68 x
=
o
= o =
= = =

E =
13
12
) 12 ; 975 , 0 (
t = 2,18 3,33 = 7,26 = 7,3 puntos
| |

= + =
= =

ptos 3 , 75 3 , 7 68 L
ptos 7 , 60 3 , 7 68 L
26 , 7 68 : IC
s
i


Conclusin
95 , 0 ) . ptos 3 , 75 . ptos 7 , 60 ( P = s s
Donde, es el rendimiento promedio verdadero, por alumno, sometido al
mtodo pedaggico 1

Observaciones.
1. El valor de t , se encuentra en la tabla 2, pero si los grados de libertad son
mayores a 30 , o sea, si (n 1) > 30 , entonces el valor de t se aproxima con el
valor correspondiente a
)
2
1 (
z
o

, que se encuentra en la Tabla 1. Resumiendo


,
)
2
1 ( ) 1 n ;
2
1 (
z t
o

o

~ ; si ( n - 1 ) > 30
2. Si el valor del parmetro , en la poblacin normal en estudio, es conocido
entonces,
IC [ ] :
1 N
n N
n
z x
) 1 (
2


3. Para una poblacin infinita, o sea, cuando N es indeterminado, el error de
estimacin est dado por,

n
z E
o
o

)
2
1 (
=


Intervalo de Confianza, del 100 %, para el verdadero valor
del parmetro , en una poblacin normal.

La variable X, se supone que se comporta en forma normal en una poblacin
en estudio. O sea, X ~ N ( ; )
Elegimos una m.a. de tamao , para estimar el valor verdadero de , mediante
el siguiente IC.
IC [ ] = [ L
i
; L
s
] ; donde :

) 1 n ;
2
1 (
2
2
i
s ) 1 n (
L

_

= y
) 1 n ;
2
(
2
2
s
s ) 1 n (
L

o
_

=

s es la desviacin tpica muestral ; o = 1 -
s
2
es la varianza muestral
Con esto se concluye que, = s s o ) L L ( P
s i


Respuesta 1c)
Datos , asociados al mtodo 2:
n = 11 alumno ; x = 54 ptos. ; s = 10 ptos. ; s
2
= 100 [ptos]
2

= 0,95 ; o = 0,05 ; o /2 = 0,025 ; 975 , 0 2 / 1 = o
L
i
= . 99 , 6
48 , 20
1000
) 10 ; 975 , 0 (
100 10
2
ptos
X
= =


L
s
= . 54 , 17
25 , 3
1000
) 10 ; 025 , 0 (
1000
2
ptos
X
= =
Conclusin.
95 , 0 ) . ptos 5 , 17 . ptos 0 , 7 ( P = s s o
Donde, o es la desviacin tpica verdadera del rendimiento, por alumno,
sometido al mtodo pedaggico 2.

Intervalo de confianza, del 100 %, para el cuociente
2
2
2
1
o
o
,
entre las varianzas verdaderas, de dos poblaciones normales

Aqu la Variable X se comporta en forma normal para ambas poblaciones. O
sea,
X ~ ) ; ( N
2
1 1
o ; en la poblacin 1.
X ~ ) ; ( N
2
2 2
o . ; en la poblacin 2.
Para estimar
2
2
2
1
o
o
, elegimos una m.a. de tamao n
1
en la poblacin 1; y
una m.a. de tamao
2
n , en la poblacin 2. Con los resultados obtenidos se
determina el siguiente intervalo de confianza.
IC [
2
2
2
1
o
o
] = [
s i
L ; L ]

) ) 1 n ( / ) 1 n ( ; 1 (
i
2 1
2
2
2
2
1
F
1
s
s
L

o
= y
) ) 1 n ( / ) 1 n ( ; 1 (
s
1 2
2
2
2
2
1
F
s
s
L

o
=

Con esto se concluye que,
o
o
= s s ) L L ( P
s i 2
2
2
1

Observaciones:
1. Las frmulas para L
i
y L
s
, estn restringidas a que , el cuociente , 1
s
s
2
2
2
1
>
. Esto se consigue poniendo en el numerador la varianza muestral que sea mayor.
2) El intervalo de confianza para el cuociente entre las varianzas verdaderas, de
ambas poblaciones normales, permite determinar la factibilidad de que sean
iguales ( supuesto de homocedasticidad ), a pesar de ser desconocidas. Esto se
puede afirmar cuando el IC contiene al valor 1. Lo anterior es importante, porque
garantiza que ambas poblaciones sean homogneas, cuando se quiere hacer una
comparacin adecuada entre las medias poblacionales,

Respuesta 1d)
Datos :
100 s ; 10 s ; 54 X ; 11 n
144 s ; 12 s ; 68 X ; 13 n
2
2 2
2
2
2
1 1
1
1
= = = =
= = = =

775 , 0 2 / 1 ; 05 , 0 95 , 0 = = = o o
1 44 , 1
100
144
s
s
2
2
2
1
= =
L
i
398 , 0 3978 , 0
62 , 3
44 , 1 44 , 1 44 , 1
) 10 / 12 ; 975 , 0 ( ) 10 / 12 ; 975 , 0 (
~ = = =
F F

L
s
= 37 , 3 44 , 1 F 44 , 1
) 12 / 10 ; 975 , 0 (
= = 4,853
Con esto se concluye que, 95 , 0 ) 853 , 4 398 , 0 ( P
2
2
2
1
= s s
o
o

Donde,
2
2
2
1
o
o
es el cuociente entre las varianzas verdaderas, vinculadas a los
rendimientos de los alumnos sometidos a ambos mtodos.
Aqu, se observa que,
(

e
o
o
2
2
2
1
IC 1 . Por lo tanto, es factible que,

2
2
2
1
2
2
2
1
1 o o
o
o
= =
(

; es decir, se cumplira el supuesto de


homocedasticidad . Luego, ambas poblaciones seran homogneas.

Intervalo de confianza, del 100 %, para la diferencia
(
2 1
) entre las medias verdaderas de dos poblaciones
normales independientes.

La variable X, se supone que se comporta en forma normal en ambas
poblaciones. O sea:
X ~ N (
1
,
1
) ; en la poblacin. 1
X ~ N (
2
,
2
) ; en la poblacin. 2
En la poblacin 1, se elige una m.a. de tamao
1
y , en la 2, se elige una
m.a. de tamao
2
.
Con los resultados muestrales se determina, el siguiente I.C.
I.C.(
1
-
2
) : ( E ) X X 2 1 ; donde,

( )
|
|
.
|

\
|
+
+
+
=
+
o
2 1 2 1
2
2 2
2
1 1
) 2 n n ; 1 (
n
1
n
1
2 n n
s 1 n s ) 1 n (
2 1
2
t E
Con esto se concluye que,
( ) ( ) ( ) = + s s E x x ) ( E x x P 2
1 2 1 2 1


Observacin. Es deseable que (
2 1
x x ) sea positivo. Si esto no ocurre,
se cambia el orden.

Respuesta 1e)
Determinemos un I.C. del 95% para la diferencia entre los rendimientos
promedios verdaderos, por alumno, asociados a los 2 grupos

975 , 0 2 / 1 05 , 0 95 , 0
100 s 10 s 54 x 11 n
144 s ; 12 s 68 x 13 n
2
2 2 2 2
2
2 1 1 1
= o = o =
= = = =
= = = =

07 , 2 ; . ptos 14 x x
) 22 ; 975 , 0 ( 2 1
t = =


|
.
|

\
|
+
+
11
1
13
1
22
100 10 144 12
56 , 4 1678 , 0 124 = =
El error de estimacin , 4 , 9 56 , 4 07 , 2 E = = ptos.
Luego , | |

=
=

. ptos 4 , 23 L
. ptos 6 , 4 L
44 , 9 14 : ( C I
s
i
)
2 1

Con esto se concluye que,
( ) 95 , 0 . ptos 4 , 23 . ptos 6 , 4 P
2 1
= s s
Donde, (
2 1
) es la diferencia entre los rendimientos promedio
verdaderos, por alumno, sometidos a ambos mtodos.

Observaciones.
1. Esta frmula para determinar | |
2 1
C I , supone que las 2 poblaciones son
homogneas ; o sea, debe cumplirse el supuesto de homocedasticidad, o de
igualdad de varianzas. Este supuesto se puede probar si se demuestra que el valor
(

e
o
o
2
2
2
1
C I 1
2. Es importante sealar que, si el valor | |
2 1
0 e C I entonces, es
factible que,
2 1 2 1
0 = = . Es decir, ambos promedios
poblacionales, an siendo desconocidos, seran iguales.


Intervalo de confianza, del 100 % , para el verdadero valor
del parmetro p, de una poblacin Binomial.

Aqu consideramos una poblacin de tamao N , que suponemos se
comporta en forma Binomial, para la variable X, donde X es el nmero de
elementos de la poblacin, que poseen la caracterstica en estudio.
Para esta poblacin, nos interesa el valor del parmetro p, que se define
como
N
x
p = , cuyo valor es desconocido. Por lo tanto vamos a estimar o inferir
su verdadero valor mediante un intervalo de confianza | |, ;
s i
L L C I
i
con una
confiabilidad , en base a una muestra aleatoria de tamao n. Este intervalo est
dado por,
| |
1 N
n N
n
) p 1 ( p
) 1 (
z p : p IC
2

o

Con esto se concluye que,
( )
n
x
p donde E p E p P p = = + s s , ,
x = nmero de elementos de la muestra, que poseen la caracterstica en
estudio.

Ejemplo de referencia 2.
Se esta experimentando con dos mtodos de recuperacin de enfermos. Con
el mtodo 1, se trataron 85, de los cuales se recuperaron 71. Con el mtodo 2, se
trataron 90 y se recuperaron 64.
a) Determine un IC del 96,5 % , para la proporcin verdadera de enfermos que se
recuperaran con el mtodo 1.
b) Determine un IC del 93,5 % , para la diferencia entre las proporciones
verdaderas de enfermos que deberan recuperarse con ambos mtodos.

Respuesta para el ejemplo 2a)

Variable X: nmero de enfermos que se recuperan con el mtodo 1.
| |
n
) p 1 ( p
z p : p C I
) 1 (
2



9825 , 0 1 ; 0175 , 0 ; 035 , 0 1
965 , 0 ; 1647 , 0 p 1 ; 8353 , 0
85
71
p
2 2
= = = = o
= = = =
o o

z
) 9825 , 0 (
= 2,11 (mide la confiabilidad de la investigacin)
0402 , 0
85
) 8353 , 0 1 ( 8353 , 0 ) 1 (
=

n
p p

0848 , 0 0402 , 0 11 , 2 E = =
| |

= =
= + =

7505 , 0 0848 , 0 8353 , 0
9201 , 0 0848 , 0 8353 , 0
0848 , 0 8353 , 0 :
i
s
L
L
p C I

Con esto se concluye que, 965 , 0 ) % 01 , 92 % 05 , 75 ( P p = s s .
O sea, la proporcin de enfermos que mejoraran con el mtodo 1 estara entre un
75,05 % y un 92,01 % , con una confiabilidad del 96,5 %
Intervalo de confianza, del 100 % , para el verdadero valor
de la diferencia ) (
2 1
p p , entre los parmetros, de dos
poblaciones Binomiales

Se eligen muestras aleatorias, de tamaos
2 1
n y n , en las respectivas
poblaciones, para estimar, con una confiabilidad , la diferencia ( )
2 1
p p , entre
las verdaderas proporciones.

2
2 2
1
1 1
2
) 1 ( ) 1 (
) 1 (
2 1 2 1
) ( : ) (
n
p p
n
p p
z p p p p IC

+
o

Con esto se concluye que,
( ) ( ) = + s s ) E p p ) ( E p p ( P
2 1 2 1 2 1
p p
Observacin. Es recomendable elegir 0 ) p p (
2 1


Respuesta para el ejemplo 2b)
Para el mtodo 1 : 71 x , 85 n
1 1
= =
Para el mtodo 2 : 935 , 0 ; 64 x ; 90 n
2 2
= = =

85 , 1
9675 , 0 1 ; 035 , 0 ; 065 , 0 ; 935 , 0
2889 , 0 1 ; 7111 , 0
90
64

1647 , 0 1 ; 8353 , 0
85
71

) 9675 , 0 (
) 1 (
2 2
2 2
1 1
2
= =
= = = =
= = =
= = =

z z
p p
p p
o
o o
o

0624 , 0 00228 , 0 00162 , 0
0 9
2889 , 0 7111 , 0
85
1647 , 0 8353 , 0
= + =


1154 , 0 0624 , 0 85 , 1 E ; 1242 , 0 p p
2 1
= = =
| | 1154 , 0 1242 , 0 :
2 1
p p C I

=
=
2396 , 0
0088 , 0
s
i
L
L

Con esto se concluye que,

935 , 0 ) 0 % 96 , 23 % 88 , 0 ( P
2 1
p p = s s

O sea, la diferencia entre las proporciones verdaderas de enfermos que
mejoraran con ambos mtodos estara entre un 0,88 % y un 23,96 % , con una
confiabilidad del 96,5 %
PRUEBA DE HIPOTESIS RELACIONADA CON LOS PARAMETROS DE UNA
POBLACION EN ESTUDIO.

Hiptesis.
Una hiptesis estadstica es una conjetura relacionada con el verdadero valor
de un parmetro, de una poblacin conocida.
Prueba de Hiptesis. Una prueba de hiptesis, relacionada con los
parmetros de una poblacin en estudio, es un proceso que comienza con el
planteamiento de las hiptesis , de investigacin
1
H , y , nula
0
H , y termina
con la decisin de rechazar, o no , la hiptesis
0
H . Esto implicara aceptar
1
H ,
que tambin recibe el nombre de hiptesis alternativa .
Sin embargo, existe el riesgo de rechazar la hiptesis nula
0
H , cuando esta
hiptesis es realmente cierta o verdadera.
Este riesgo se cuantifica mediante el nivel de significacin o , y se define
como la probabilidad de rechazar
0
H , cuando ella es realmente cierta. O sea,
) , (
0 0
verdadera es que dado rechazar de P H H = o
Observacin. Recordemos que, o = 1 .
Generalmente , 01 , 0 05 , 0 = = o o
El ejemplo, que se plantea a continuacin, se usar como referencia para las
pruebas que se desarrollan ms adelante.

EJEMPLO DE REFERENCIA 3.
De los alumnos que asisten a un curso de formacin profesional, se eligieron
al azar dos grupos, uno de 13 alumnos y el otro de 11. En cada grupo, se aplicaron
mtodos pedaggicos distintos. Suponga que el rendimiento de los alumnos se
comporta en forma normal, para ambos grupos. Los exmenes finales, idnticos
para cada grupo, dieron los siguientes resultados.
Para el grupo 1, donde se aplic el mtodo 1: n
1
= 13 alumnos ;
Media = 68 puntos ; Desviacin tpica = 12 puntos .

Para el grupo 2, donde se aplic el mtodo 2 : n
2
= 11 alumnos ;
Media = 54 puntos ; Desviacin tpica = 10 puntos .
a) Con el mtodo 1, se afirma que el rendimiento promedio verdadero , por
alumno, sera de al menos 75 puntos. Con un nivel de significacin del 5 %, sera
aceptable esta afirmacin .
b) Con el mtodo 2, se afirma que la desviacin tpica, del rendimiento por
alumno, no debera ser superior a 8 puntos. Con un nivel de significacin del 5 %,
sera aceptable esta afirmacin.
c) Con un nivel de significacin del 5 %, pruebe si el mtodo 1, aplicado a los
alumnos, da , en promedio, rendimientos significativamente superiores al de los
alumnos donde se aplica el mtodo 2.


Prueba de hiptesis relacionada con el verdadero
valor del parmetro , de una poblacin normal.

Se supone que X ~ N ( ; ), en la poblacin en estudio. Elegimos una
muestra aleatoria, de tamao n , para disear la prueba.

1 Etapa. Planteamiento de las hiptesis.
Las hiptesis, que se pueden plantear son las tres que se dan a continuacin,
donde se indican la hiptesis nula H
0
, junto con la respectiva hiptesis de
investigacin H
1

H
0
:

>
s
=



0
0
0
versus H
1
:

=



0
0
0



En el ejemplo 3a)
75 : H vs 75 : H
1 0
>
La hiptesis H
1
se plantea de acuerdo con lo que el investigador observa en
la muestra. En este caso, para el experimento con los 13 alumnos se obtuvo x =
68 puntos. Por lo tanto, para el investigador, no sera cierto lo que se plantea en
la hiptesis nula H
0
.
En las siguientes etapas de la prueba, veremos si la discrepancia entre la
media muestral x = 68 , y la media poblacional 75 > , es significativa o no,
asumiendo un riesgo del 5 %.

2 Etapa. Estadstica de prueba, suponiendo H
0
cierta.

n
s
x
0
0
t

= ~ . ; " "
0 ) 1 (
cierta es H si
n
t



En el ejemplo 3a)
13 n ; 75 ; 12 s ; 68 x
0
= = = =
10 , 2
12
13 ) 75 68 (
0
t =

=

3 Etapa. Regin de Rechazo de H
0 ,
para un n.s. o , y para
cada una de las tres hiptesis H
1.


a) { }
) 1 ; 1 ( ) 1 ; 1 (
0 1 0
2 2
/ ) : (

> s = =
n n
t t H H R R t t t
o o

El valor de
c
n
t t =
) 1 ; 1 (
2
o
; es el valor crtico de la estadstica t , que se
encuentra en la Tabla 2, y define la regin de rechazo de H
0
. Se dice que esto
implica un ensayo bilateral o de 2 colas. La grfica siguiente muestra los intervalos
de valores de t , que forman la regin de rechazo de H
0 .




b) { } t t t
) 1 n ; 1 ( 0 1 0
/ ) : H ( H R R
o
> =
Esto implica un ensayo unilateral o de una cola.

c) { } t t t
) 1 n ; 1 ( 0 1 0
/ ) : H ( H R R
o
s =



En el ejemplo 3a)
75 : H s / v 75 : H
1 0
>
{ } t t t 78 , 1 / ) 75 : H ( H R R
) 12 ; 95 , 0 ( 1 0
= = s
} { 78 , 1 / H R R t t
0
s =

4 Etapa. Decisin.
La hiptesis nula H
0
, se rechaza al nivel de significacin (n.s.) o , cada vez
que, en cada caso, la estadstica de prueba,
0 0
H R R t e
En tal caso, aceptaramos la hiptesis de investigacin H
1.


En el ejemplo 3a)

0 o crtico 0
H R R , sea o ; 78 , 1 10 , 2 t t t e = s =
Pero, % 5 del . s .. n al , rechaza se H H R R
0 0 0
t e

Conclusin.
La evidencia estadstica muestra que, realmente, en promedio, los
rendimientos de los alumnos sometidos al mtodo pedaggico 1, no seran
superiores o iguales a 75 puntos.

Prueba de hiptesis relacionada con el verdadero
valor del parmetro o de una poblacin normal.

Se supone que, X ~ N ( ; ) en la poblacin en estudio.

1 Etapa. Planteamiento de las hiptesis.

o o
o o
o = o

o > o
o s o
o = o
2
0
2
2
0
2
2
0
2
2
0
2
1
2
0
2
2
0
2
0
: H s / v : H



En el ejemplo 3b)
H
0
: s v sea o / 64 , ; 8
2
s s o o H
1
: 64 , ; 8
2
o o sea o


2 etapa. Estadstica de prueba, suponiendo H
0
cierta.

( )
2
0
2
2
0
s 1 n
o

= _ ~ cierta es Ho si ,
2
) 1 n (
_ .

En el ejemplo 3b)
64 ; 100 s ; 10 s ; 11 n
2
o
2
= o = = =
63 , 15
64
100 10
2
0
= = _

3 Etapa. Regin de Rechazo de H
0 ,
para un n.s. o , y para
cada una de las tres hiptesis H
1.


a) { }
2
) 1 ; 1 (
2 2
) 1 ; (
2 2 2
0
2
1
2 2
0 / ) : (

> s s = =
n n
O
H RRH
o o
_ _ _ _ _ o o
Los valores crticos de la estadstica
2
_ , que define la regin de rechazo de
la hiptesis nula, se encuentra en la Tabla 3.





b) { }
2
) 1 n ; 1 (
2 2
2
0
2
1 O
/ ) : H ( RRH
o
_ > _ _ = o o


c) { }
2
) 1 n ; (
2 2
2
0
2
1 O
0 / ) : H ( RRH
o
_ s _ s _ = o o



En el ejemplo 3b)
{ } 31 , 18 / ) 64 : H ( RRH
2
) 10 ; 95 , 0 (
2 2 2
1 O
= _ > _ _ = o

4 Etapa. Decisin.
La hiptesis nula H
0
, se rechaza al n.s. o , cada vez que, en cada caso, la
estadstica de prueba
2
0
_
e
RRH
0
En caso contrario H
0
no se rechaza.
En el ejemplo 3b)

2 2
0
31 , 18 63 , 16
crtico
_ _ = =
O sea, % 5 del . s . n al rechaza se no H RRH
0 0
2
0
e _ .

Conclusin.
La evidencia estadstica muestra que, realmente, la variabilidad absoluta en
los puntajes de la prueba, cuando se aplica el mtodo pedaggico 2, no superara
los 8 puntos.


Prueba de hiptesis relacionada con el verdadero
Valor de ( )
2 1
, para dos poblaciones normales
Independientes.

Se supone que, la variable :
X ~ N (
1
;
1
) ; en la poblacin. 1
X ~ N (
2
;
2
) ; en la poblacin. 2

Adems, se supone que las poblaciones son independientes y se cumple el
supuesto de homocedasticidad (igualdad de varianzas). Es decir, se debe
determinar previamente mediante un intervalo de confianza, para el cuociente
entre las varianzas que, el valor
(

e
o
o
2
2
2
1
IC 1 , lo cual implicara la factibilidad
que,
2
2
2
1
2
2
2
1
1 o o
o
o
= =
(

.

1 Etapa. Planteamiento de las hiptesis.

s
= =
2 1
2 1 2 1
0
, sea o ; 0
: H , versus,


=
2 1
2 1
1
: H



En el ejemplo 3c)

2 1 1 2 1 0
: H s / v : H s

2 etapa. Estadstica de prueba, suponiendo H
0
cierta.


2
1
2
1
n
1
n
1
x x
c
s
t
0
+

= ; donde ,
2
) 1 ( ) 1 (
2
1
2
2 2
2
1 1
+
+
=
n n
s n s n
c
s

0
t ~
) 2 n n (
2 1
t
+
; si H
0
es cierta

En el ejemplo 3c).
07 , 3
56 , 4
14
11
1
13
1
22
100 10 144 12
14
100 ; 144 ; 14 54 68
0
2
2
2
1 2 1
= =
|
.
|

\
|
+
+
=
= = = =
t
s s ptos x x


3 Etapa. Regin de Rechazo de H
0 ,
para un n.s. o , y para
cada una de las tres hiptesis H
1.


a) { }
) 2 ; 1 ( ) 2 ; 1 (
2 1 1 0
2 1
2
2 1
2
/ ) : (
+ +
> s = =
n n n n
t t H H R R t t t
o o

b) { }
) 2 ; 1 ( 2 1 1 0
2 1
/ ) : (
+
> =
n n
t H H R R t t
o


En el ejemplo 3c)
{ } 72 , 1 t / ) : H ( H R R
) 2 2 ; 95 , 0 ( 2 1 1 0
t t = > =

4 Etapa. Decisin.
H
0
se rechaza, al n.s.o , cada vez que, en cada caso ,
0 0
RRH t e

En el ejemplo 3c).

) crtico (
t t 72 , 1 07 , 3
0
= = ; o sea ,
0 0
RRH t e
Por lo tanto, la hiptesis nula H
0
, se rechaza, al n.s. del 5 % .
Conclusin.
La evidencia estadstica muestra que, los alumnos, tratados mediante el
mtodo 1, obtendran, en promedio, mejores rendimientos que los alumnos
tratados con el mtodo 2.

Prueba de hiptesis relacionada con el verdadero valor
del parmetro p , de una poblacin binomial.

EJEMPLO DE REFERENCIA 4.
Se esta experimentando con dos mtodos de recuperacin de enfermos. Con
el mtodo 1, se trataron 85, de los cuales se recuperaron 71. Con el mtodo 2, se
trataron 90 y se recuperaron 64.
a) Se afirma que, la proporcin verdadera de enfermos que deberan recuperarse
con el mtodo 2 es por lo menos 75 % . Con un nivel de significacin del 5 %
pruebe si esta afirmacin es aceptable.
b) Con un nivel de significacin del 3,85 % , se podra afirmar que, el mtodo 1
es ms efectivo en la recuperacin de los enfermos.

1. Etapa. Planteamiento de las hiptesis.

Las hiptesis, que se pueden plantear, son las tres que se dan a continuacin,
donde se indican la hiptesis nula H
0
, junto con la respectivas hiptesis de
investigacin H
1


H
0
:

>
s
=
0
0
0
p p
p p
p p
versus H
1
:

=
0
0
0
p p
p p
p p



En el ejemplo 4 a)
75 , 0 p : H s / v 75 , 0 p : H
1 0
>
La hiptesis de investigacin H
1
, se basa en lo observado en la muestra, que
dio una proporcin muestral de 0,7111 , que es inferior a la proporcin poblacional
0,75.

2 etapa. Estadstica de prueba, suponiendo H
0
cierta.


) p 1 ( p n
p n x
0 0
0
0
z

= ~ N ( 0 , 1 ) , si H
0
es cierta

En el ejemplo 4 a)

85 , 0
25 , 0 75 , 0 90
75 , 0 90 64
0
z =

=

3 Etapa. Regin de Rechazo de H
0 ,
para un n.s. o , y para
cada una de las tres hiptesis H
1.


a) { }
) 1 ( ) 1 (
0 1 O
2 2
z z z z / z ) p p : H ( RRH
o o

> s = =

b) { }
) 1 ( 0 1 O
z z / z ) p p : H ( RRH
o
> =

c) { }
) 1 ( 0 1 O
z z / z ) p p : H ( RRH
o
s =

En el ejemplo 4 a)
{ } 65 , 1 z z / z ) 75 , 0 p : H ( RRH
) 95 , 0 ( 1 O
= s =

4 Etapa. Decisin.

La hiptesis nula H
0
, se rechaza al n.s. o , cada vez que, en cada caso, la
estadstica de prueba
0
z
e
RRH
0
En caso contrario H
0
no se rechaza.

En el ejemplo 4 a)

) crtico (
z 65 , 1 85 , 0
0
z = = . O sea,
% 5 del . s . n al rechaza se no H RRH
0 0
0
z e

Conclusin.
La evidencia estadstica muestra que, realmente, la proporcin de enfermos,
que se recuperara al ser tratados con el mtodo 2, sera de por lo menos el 75
%.


Prueba de hiptesis relacionada con el verdadero
valor de ) p p (
2 1
,para dos poblaciones binomiales
independientes

1. Etapa. Planteamiento de las hiptesis.

s
= =
2 1
2 1 2 1
0
, , 0
:
p p
p p o p p
H ,versus,

=
2 1
2 1
1
:
p p
p p
H


En el ejemplo 4b)

2 1 1 2 1 0
p p : H s / v p p : H s

2 etapa. Estadstica de prueba, suponiendo H
0
cierta.

)
1 1
( ) 1 (

2
1
2 1
0
n n
p p
p p
z
+

= ~ N ( 0 ; 1 ) , si H
0
es cierta y
donde ,
2 1
2 1
n n
x x
p
+
+
= .

En el ejemplo 4b)

0385 , 0 ; 2286 , 0 p 1 ; 7714 , 0 p
7111 , 0 p ; 90 n ; 64 x
8353 , 0 p ; 85 n ; 71 x
2 2 2
1 1 1
= o = =
= = =
= = =

96 , 1
)
90
1
85
1
( 2286 , 0 7714 , 0
7111 , 0 8353 , 0
0
z =
+

=

3 Etapa. Regin de Rechazo de H
0 ,
para un n.s. o , y para
cada una de las tres hiptesis H
1.

a) { }
) 1 ( ) 1 (
2 1 1 O
2 2
z z z z / z ) p p : H ( RRH
o o

> s = =
b) { }
) 1 ( 2 1 1 O
z z / z ) p p : H ( RRH
o
> =

En el ejemplo 4b)
{ } 77 , 1 z z / z ) p p : H ( RRH
) 9615 , 0 ( 2 1 1 O
= > =

4 Etapa. Decisin.
La hiptesis nula H
0
, se rechaza al n.s.o , cada vez que, en cada caso, la
estadstica de prueba
0
z
e
RRH
0
En caso contrario H
0
no se rechaza.

En el ejemplo 4b)

) crtico (
z 77 , 1 96 , 1
0
z = = . O sea,
% 85 , 3 del . s . n al rechaza se H RRH
0 0
0
z e


Conclusin.
La evidencia estadstica muestra que, realmente, la proporcin de enfermos,
que se recuperaran con el mtodo 1 sera superior a la proporcin de los que se
recuperaran con el mtodo 2.












GUIA 7 DE EJERCICIOS

1. Una investigacin hecha en base a una muestra de 24 familias, elegidas
aleatoriamente en una poblacin de 1650 , dio los siguientes resultados,
relacionados con sus gastos mensuales de consumo, en miles de pesos. Suponga
que la poblacin se comporta en forma normal.

65,8 72,5 62,7 71,8 64,7 82,5 70,3 68,2 82,1 69,1 72,4 65,1
68,6 70,8 63,9 80,5 72,7 69,2 75,3 80,6 64,9 72,5 67,3 66,2

a) Defina la variable en estudio.
b) Determine un intervalo de confianza, del 95 %, para el gasto promedio
mensual de consumo, por familia, de la poblacin en estudio.
c) Pruebe la hiptesis que la desviacin tpica, de los gastos mensuales de
consumo, no debera superar los $5200, asumiendo un riesgo del 5 %.
d) Antes de realizar la investigacin se afirmaba que, el gasto promedio mensual
de consumo, por familia, de la poblacin en estudio, no debera superar los $
65000. Con un nivel de significacin del 1 %, determine si la evidencia estadstica,
que aporta la investigacin realizada, demuestra que lo afirmado se mantiene
vigente o no.

2. Una empresa pesquera desea estimar, con una confiabilidad del 92,8
%, la proporcin verdadera de de trabajadores que estn a favor de que
se corrija el programa de aseguramiento de la calidad. Esta estimacin
debe contemplar un error mximo de 0,038. En un sondeo previo, se
determin una estimacin de 0,698 para dicha proporcin. Determine el
tamao mnimo de la muestra, que debera elegirse aleatriamente,
entre todos los trabajadores, para alcanzar el objetivo deseado, si el
total de trabajadores de la empresa es de 1250.

3. Se hizo una investigacin en dos sectores diferentes A y B de la ciudad, para
determinar la proporcin de personas enfermas de influenza (prevalencia). En el
sector A, se control una muestra de 250 personas y se encontraron 56 de ellas
enfermas. En el sector B, se controlaron 278 de las cuales 37 estaban enfermas.
a) Use un nivel de significacin de confianza de 4,3 % para probar si habra
diferencia significativa en las prevalencias de la enfermedad en ambos sectores.
b) Determine un intervalo de confianza del 95,2 % para la tasa de prevalencia de
influenza, en el sector A, donde vive un total de 2356 personas.
c) Se afirma que, por lo menos el 15 % de las personas, que habitan en el sector
B, estaran enfermas. Use un nivel de significacin del 4,5 % para probar si lo que
se afirma es correcto.

4. Se ha hecho una investigacin, considerando jvenes entre 17 y 18 aos de
edad, de dos estratos econmicos : medio y bajo. En el estrato medio, se
encuestaron 685 jvenes, de los cuales 162 se pronunciaron a favor del servicio
militar obligatorio. En el estrato bajo de 523 jvenes , 292 se pronunciaron a favor
del servicio militar obligatorio.
a) Determine un intervalo de confianza del 96,3 %, para estimar la diferencia
entre los porcentajes verdaderos, de jvenes de estrato medio y bajo, que estaran
apoyando el servicio militar obligatorio. Determine , adems, si la diferencia
observada es o no significativa. Justifique.
b) Se afirma que, por lo menos el 80 % de los jvenes, de estrato econmico
medio, no estaran de acuerdo con que el servicio militar sea obligatorio. Use un
nivel de significacin del 5, 3 % para probar si lo que se afirma es correcto.

5. Una empresa constructora necesita comprar bloquetas. La calidad de la
bloqueta, est asociada principalmente a su resistencia a la rotura (en kg/cm
2
).
La empresa recibe ofertas de dos fbricas. Para tomar una decisin, el
departamento tcnico de la empresa, prueba muestras aleatorias de bloquetas
provenientes de cada una de las dos fbricas, obtenindose los siguientes
resultados, para la resistencia a la rotura.
FABR ROC: 21,8 22,6 23,4 21,7 24,6 22,8 23,5 24,3 20,9
FABR DUR: 25,2 24,8 29,7 31,3 28,7 27,6 30,9 28,8 31,1 32
a) La empresa debe decidir qu tipo de bloqueta comprar, en base a los
resultados del experimento, diseado por el departamento tcnico, suponiendo
que la variable se comporta en forma normal para ambas poblaciones. Si ellos
asumen un riesgo, o nivel de significacin de 5 %, cul debera ser la
recomendacin de dicho departamento. Indique claramente todas las etapas a
seguir, para llegar a la decisin y a la conclusin.
b) Determine un intervalo de confianza, del 95 %, para el cuociente entre las
varianzas verdaderas de las resistencias de ambos tipos de bloqueta. De acuerdo
al resultado obtenido, justifique si se cumplira el supuesto de igualdad de
varianzas.

6. Un estudio hecho en cultivos de limones, consider una parcela experimental
de 1680 rboles. All, se eligi aleatoriamente una muestra aleatoria de 35 rboles,
para estimar, mediante un intervalo de confianza, la cosecha promedio real (en
Kg), por cada rbol de la parcela. Los resultados obtenidos, en base a la muestra,
dieron el siguiente intervalo de confianza: Lmite inferior = 77,8 Kg ; Lmite
superior = 86,8 Kg ; Varianza muestral = 278,23 . Se supone que la cosecha se
comporta en forma normal.
a) Determine la cosecha promedio, por rbol, obtenida mediante la muestra, el
error de estimacin y la confiabilidad que se us en la investigacin
b) Determine un intervalo de confianza del 95 % para la desviacin tpica de la
cosecha por rbol.
c) Se considera que, la variabilidad absoluta de la cosecha, en esta granja
experimental, no debera ser superior a 15 Kgs.. Con un nivel de significacin del 5
%, pruebe si esta afirmacin es correcta o no, de acuerdo a lo observado en la
muestra de 35 rboles.

7. Se quiere hacer una investigacin para estimar, con un 99 % de confianza, el
ingreso promedio mensual verdadero de los cuidadores de autos. Para esto, se
hizo un muestreo piloto y se determin que la desviacin tpica verdadera sera
de $12.500. Si el error de estimacin mximo aceptable es de $ 4500, calcule el
tamao mnimo de la muestra que debera usarse para realizar la investigacin. Se
estima adems que, el nmero total de personas que realizan esta actividad en
Arica es de 356 personas.

CAPITULO 9
ALGUNAS APLICACIONES DE LA PRUEBA
CHI CUADRADA

En este captulo abordaremos tres aplicaciones de la prueba chi cuadrada que
son de uso frecuente. Estas son:
La prueba de bondad de ajuste
La prueba para la diferencia entre proporciones poblacionales.
La prueba de independencia de dos variables categricas.

PRUEBA DE BONDAD DE AJUSTE.
La hiptesis nula, en una prueba de bondad de ajuste, es una conjetura
relacionada con el patrn de comportamiento esperado, de una serie de
categoras, o clases, asociadas a una caracterstica en estudio. Por ejemplo, este
comportamiento puede ser uniforme, normal, binomial, u otro.
La estadstica de prueba, suponiendo Ho cierta, esta dada por,

=

e
f
e
f
o
f
2
2
) (
_
Como se ve, esta estadstica se basa en la diferencia que hay entre la
frecuencia esperada, en la poblacin en estudio, y las frecuencias observadas en la
muestra.
Se puede probar que esta estadstica tiene una distribucin
2
) 1 ( m k
_ , o sea,
2
_ , con ) 1 ( m k grados de libertad; donde : k es el nmero de categoras ; y
m es el nmero de parmetros estimados.

Observacines:
1. En este curso veremos como implementar una prueba que tiene que ver con
una distribucin uniforme y, tambin, con una distribucin que se ajusta a un
comportamiento histrico, de la poblacin en estudio
2. Es deseable que, las frecuencias esperadas f
e
> 5 , si no es as, deberan
juntarse categoras.
Prueba de hiptesis relacionada con la distribucin
Uniforme.

Ejemplo de referencia 1.
Una fbrica, que produce cierto tipo de artculo, trabaja con 5 mquinas de
precisin. Se supone que el nmero diario de productos fallados, por mquina,
debera ser el mismo. Cada mquina produce diariamente 250 artculos.
Diariamente se controla el nmero de artculos fallados por mquina. En uno
de estos das, el control dio los siguientes resultados : 7 artculos fallados en la
mquina 1, 6 en la mquina 2, 10 en la mquina 3, 5 en la mquina 4 y 9 en la
mquina 5. Use un nivel de significacin de 5 % para probar la igualdad en el
nmero de artculos fallados por cada una de las 5 mquinas.
En general, una prueba de este tipo se implementa como un proceso que
comienza con el planteamiento de las hiptesis y termina con la decisin de
rechazar o no la hiptesis nula.

1. Etapa. Planteamiento de las hiptesis.


0
H : El nmero de elementos, asociados a la caracterstica en estudio, se
distribuye en forma uniforme entre las categoras

1
H : El nmero de elementos, asociados a la caracterstica en estudio, no
se distribuye en forma uniforme entre las categoras

En el ejemplo de referencia 1.

0
H : El nmero diario de artculos fallados se distribuye en forma
uniforme entre las 5 mquinas

1
H : El nmero diario de artculos fallados no se distribuye en forma
uniforme entre las 5 mquinas
La hiptesis de investigacin
1
H , se basa en los resultados del control; all, se
aprecia que, en la muestra, el nmero diario de artculos fallados es diferente para
cada una de las 5 mquinas.
2. Etapa. Estadstica de prueba, suponiendo
0
H cierta.

=

e
f
e
f
o
f
2
2
0
) (
_

En el ejemplo de referencia 1.
Para calcular la estadstica de prueba podemos organizar los datos en la
siguiente Tabla.

Maq.1 Maq.2 Maq.3 Maq.4 Maq.5 Total
N de Art. Fall. en la
muestra.
0
f
7 6 10 5 9 40
N esperado de Art.
Fall.si
0
H cierta.
e
f
8 8 8 8 8 40

Entonces,
8
2
) 8 9 (
8
2
) 8 5 (
8
2
) 8 10 (
8
2
) 8 6 (
8
2
) 8 7 (
2
0

+

= _
O sea, =
2
0
_ 2,375

3. Etapa. Regin de rechazo de
0
H , para un n.s. o .
El valor crtico de
2
_ , que define la regin de rechazo de
0
H , est dado por
2
) 1 ; 1 ( o
_
m k
. Por lo tanto, la regin de rechazo de
0
H , est definida por el
intervalo. { }
2
) 1 ; 1 (
2 2
0
/
o
_ _ _

> =
m k
RRH .

En el ejemplo de referencia 1.
El nmero k de categoras es 5, el nmero de parmetros m es cero; por lo
tanto el nmero de grados de libertad es (5-0-1) = 4. Dado que o = 0,05 ,
entonces, 1-o = 0,95
El valor crtico,
2
) 95 , 0 ; 4 (
2
) 1 ; 1 (
_ _
o
=
m k
= 9,49 se encuentra en la Tabla 3.
Luego, { } 49 , 9 /
2 2
0
> = _ _ RRH .

4.Etapa. Decisin.
La hiptesis nula
0
H , se rechaza al n.s. o , cada vez que, la estadstica de
prueba
2
0
_ pertenece a la regin de rechazo de
0
H (
2
0
_ e RR
0
H ); en caso
contrario
0
H no se rechaza.

En el ejemplo de referencia 1.
=
2
0
_ 2,375 < 9,49 =
2
crit
_ ; o sea,
2
0
_ e
0
RRH
Entonces, la hiptesis nula
0
H , no se rechaza, al n.s. del 5 % .

Conclusin.
La evidencia estadstica muestra que, realmente, el nmero diario de artculos
fallados por mquina, se distribuye en forma uniforme.
La diferencia observada en la muestra no es significativa; es decir, se debera
al muestreo.

Prueba de hiptesis relacionada con una distribucin
basada en un patrn histrico.

Ejemplo de referencia 2.
En una encuesta a profesores de enseanza bsica y media, realizada en aos
anteriores, se determin que el 18,7 % de ellos estaban de acuerdo con el sistema
de administracin municipal de la educacin; 27,6 % con el sistema particular
subvencionado y, un 53,7 % manifestaron el deseo de volver a la administracin
del ministerio de educacin (Mineduc).
En el ao 2007, se encuestaron aleatoriamente 1425 profesores de bsica y
media; de los cuales, 217 se pronunciaron a favor de la administracin municipal,
311 por la particular subvencionada y 897 por la administracin del Mineduc.
Con un nivel de significacin del 5 %, determine si existe evidencia estadstica
para afirmar que la opinin de los profesores en el 2007, respecto de la
administracin de la educacin, habra cambiado o no en relacin a los aos
anteriores.
En general, las etapas para una prueba de este tipo se describen a
continuacin.

1. Etapa. Planteamiento de las hiptesis.


0
H : El nmero de elementos, asociados a la caracterstica en estudio, se
distribuye de acuerdo a un determinado comportamiento histrico

1
H : El nmero de elementos, asociados a la caracterstica en estudio, no
se distribuye de acuerdo al comportamiento histrico sealado en
0
H

En el ejemplo de referencia 2.

0
H : Los porcentajes de profesores que estn de acuerdo, ya sea con la
administracin educacional particular, particular subvencionada o por
el Mineduc son, respectivamente, 18,7 % , 27,6 % y 53,7 % .
histrico

1
H : En el ao 2007, el patrn histrico de comportamiento de los
profesores, respecto de la administracin de la educacin, habra
cambiado en relacin a los aos anteriores

2. Etapa. Estadstica de prueba, suponiendo
0
H cierta.

=

e
f
e
f
o
f
2
2
0
) (
_

En el ejemplo de referencia 2.
Para calcular la estadstica de prueba podemos organizar los datos en la
siguiente Tabla.
Adm.Mun Part.Subv Mineduc. Total
N de Prof.
0
f 217 311 897 1425
N esperado de Prof.
e
f 266,5 393,3 765,2 1425

Entonces,
2 , 765
2
) 2 , 765 897 (
3 , 393
2
) 3 , 393 311 (
5 , 266
2
) 5 , 266 217 (
2
0

+

= _
O sea, =
2
0
_ 49,11
3. Etapa. Regin de rechazo de
0
H , para un n.s. o .
El valor crtico de
2
_ , que define la regin de rechazo de
0
H , est dado por
2
) 1 ; 1 ( o
_
m k
. Por lo tanto, la regin de rechazo de
0
H , est definida por el
intervalo. { }
2
) 1 ; 1 (
2 2
0
/
o
_ _ _

> =
m k
RRH .

En el ejemplo de referencia 2.
El nmero k de categoras es 3, el nmero de parmetros m es cero; por lo
tanto el nmero de grados de libertad es (3-0-1) = 2. Dado que o = 0,05 ,
entonces, 1-o = 0,95
El valor crtico,
2
) 95 , 0 ; 2 (
2
) 1 ; 1 (
_ _
o
=
m k
= 5,99 se encuentra en la Tabla 3.
Luego, { } 99 , 5 /
2 2
0
> = _ _ RRH .

4.Etapa. Decisin.
La hiptesis nula
0
H , se rechaza al n.s. o , cada vez que, la estadstica de
prueba
2
0
_ pertenece a la regin de rechazo de
0
H (
2
0
_ e RR
0
H ); en caso
contrario
0
H no se rechaza.

En el ejemplo de referencia 2.
=
2
0
_ 49,11 > 5,99 =
2
crit
_ ; o sea,
2
0
_ e
0
RRH
Entonces, la hiptesis nula
0
H , se rechaza, al n.s. del 5 % .

Conclusin.
La evidencia estadstica muestra que, realmente, en el ao 2007, el patrn
histrico de comportamiento de los profesores, respecto de la administracin de la
educacin, habra cambiado en relacin a los aos anteriores
Prueba de hiptesis para la diferencia entre proporciones
poblacionales.

Ejemplo de referencia 3.

Se hizo una encuesta e estudiantes, que estuvieran debidamente informados,
acerca de la nueva ley de educacin, presentada al congreso por el gobierno. Se
encuestaron al azar 55 estudiantes de cuarto medio, 62 universitarios y 34 de
postgrado. Se les consult si estaban a favor o en contra del proyecto.
Manifestaron estar a favor del proyecto 37 de los estudiantes encuestados de
cuarto medio, 49 de los universitarios y, 26 de los alumnos de postgrado.
Asumiendo un nivel de significacin del 1 %, se podra afirmar que, las
opiniones seran significativamente diferentes entre los tres tipos de estudiantes.

En general, las etapas para una prueba de este tipo se describen a
continuacin.

1. Etapa. Planteamiento de las hiptesis.


0
H : Las diferentes proporciones poblacionales son iguales entre si
O sea, p p p p p
i
= = = = = ......
3 2 1


1
H : Las diferentes proporciones poblacionales no son iguales entre si
O sea, i n a para p p
i
lg ; =

Observacin.
La proporcin
i
i
i
N
X
p = ; donde
i
X es el nmero de elementos de la
poblacin i, que poseen la caracterstica en estudio.


En el ejemplo de referencia 3.

0
H : Las proporciones de alumnos que estn de acuerdo con la nueva ley
de educacin seran iguales, ya sea que sean cuarto medio,
universitarios o de postgrado.

1
H : Al menos una, de dichas proporciones, sera diferente de las dems.

2. Etapa. Estadstica de prueba, suponiendo
0
H cierta.


=
j
j j
i
E
i
E
i
O
2
2
0
) (
_

En el ejemplo de referencia 3.
Para calcular la estadstica de prueba podemos organizar los datos en la
siguiente Tabla.

Estudiantes 4 Medio Universit. Postgrado Total
A favor 37 (40,8) 49 (36,3) 26 (25,2) 112
En contra 18 (14,2) 13 (16,0) 8 (8,8) 39
Total 55 62 34 151

Entonces,
8 , 8
2
) 8 . 8 8 (
16
2
) 16 13 (
2 , 14
2
) 2 , 14 18 (
2 , 25
2
) 2 , 25 26 (
3 , 36
2
) 3 , 36 49 (
8 , 40
2
) 8 , 40 37 (
2
0

+

= _
O sea, =
2
0
_ 6,47

Observacin.
Las frecuencias observadas en cada casilla ij del cuadro, se designan en
general con
ij
O . Mientras que, las frecuencias esperadas se designan con
ij
E .
Estas frecuencias esperadas, que en el cuadro aparecen entre parntesis, se
calculan con la siguiente frmula,

general Total
j columna la de Total i fila la de Total
ij
E
) ( ) (
=
3. Etapa. Regin de rechazo de
0
H , para un n.s. o .
El valor crtico de
2
_ , que define la regin de rechazo de
0
H , est dado por
| |
2
1 ; ) 1 ( ) 1 ( o
_
c f
; donde, los grados de libertad se obtienen del cuadro multiplicando
el nmero de filas menos 1, por el nmero de columnas menos 1. Adems, hay
que hacer notar que el nmero de columnas corresponde al nmero de
proporciones. La regin de rechazo de
0
H , est definida entonces por el intervalo.
| |
{ }
2
1 ; ) 1 ( ) 1 (
2 2
0
/
o
_ _ _

> =
c f
RRH .

En el ejemplo de referencia 3.
El nmero de filas es 2, el nmero de columnas es 3; por lo tanto el nmero de
grados de libertad es 12 = 2. o = 0,01 , entonces, 1-o = 0,99
El valor crtico,
| |
2
1 ; ) 1 ( ) 1 ( o
_
c f
=
) 99 , 0 ; 2 (
_ = 9,21 se encuentra en la Tabla 3.
Luego, { } 21 , 9 /
2 2
0
> = _ _ RRH .

4.Etapa. Decisin.
La hiptesis nula
0
H , se rechaza al n.s. o , cada vez que, la estadstica de
prueba
2
0
_ pertenece a la regin de rechazo de
0
H (
2
0
_ e RR
0
H ); en caso
contrario
0
H no se rechaza.

En el ejemplo de referencia 3.
=
2
0
_ 6,47 < 9,21 =
2
crit
_ ; o sea,
2
0
_ e
0
RRH
Entonces, la hiptesis nula
0
H , no se rechaza, al n.s. del 1 % .

Conclusin.
La evidencia estadstica muestra que, realmente, la opinin de los estudiantes
de cuarto medio, universitarios y de postgrado, seria coincidente en relacin a
apoyar el proyecto de educacin presentado al congreso nacional.
O sea, la diferencia observada en las proporciones muestrales, para cada tipo
de alumno, no seria realmente significativa.

Prueba de independencia de dos variables categricas.

En este caso, la prueba chi-cuadrada es, en la prctica, un clculo de la
diferencia total que existe entre los resultados observados en la muestra y los que,
tericamente, se daran en dos variables categricas, si estas no estuvieran
asociadas o relacionadas; es decir, si las variables fueran independientes en su
comportamiento. Esto ltimo constituye la hiptesis nula de la prueba. Si esta
diferencia es tan grande, que no puede explicarse por un azar de muestreo,
entonces se confirmara la hiptesis de investigacin, de asociacin entre las dos
variables, al rechazarse la hiptesis nula.
Esta decisin depende del valor de la estadstica chi-cuadrada observada. Si
esta es igual o menor que el valor de la chi-cuadrado terica, a un determinado
nivel de significacin, y con unos grados de libertad dados, no se podra rechazar
la hiptesis nula y, por tanto, tendramos que llegar a la conclusin que la
discrepancia no es significativa

Ejemplo de referencia 4.
Se hizo una investigacin en los jardines infantiles de Arica, con el objetivo de
determinar si habra asociacin entre la agresividad del prvulo y la calidad de la
comunicacin afectiva dentro de su hogar. Para esto, se eligi una muestra
aleatoria de 70 prvulos y se us un nivel de significacin del 5 %.
Los resultados, se describen en el siguiente cuadro.

Comunicacin afectiva
Agresividad
Buena Mala
Total
Sin agresividad 30 5 35
Con agresividad 17 18 35
Total 47 23 70

En general, la prueba de independencia chi-cuadrada se implementa en base a
las etapas que se describen a continuacin. Adems, en cada etapa, se alude al
problema de referencia, vinculado a la investigacin realizada en los jardines
infantiles.
1. Etapa. Planteamiento de las hiptesis.


0
H : Las variables seran independientes en su comportamiento

1
H : El comportamiento de las dos variables estara relacionado

En el ejemplo de referencia 4.

0
H : La agresividad del prvulo en el jardn infantil, sera independiente de
la calidad de la comunicacin afectiva en su hogar.

1
H : La agresividad del prvulo en el jardn infantil, estara asociada o
relacionada con la calidad de la comunicacin afectiva en su hogar.

2. Etapa. Estadstica de prueba, suponiendo
0
H cierta.


=
j
j j
i
E
i
E
i
O
2
2
0
) (
_
En el ejemplo de referencia 4 .
Para calcular la estadstica de prueba podemos organizar los datos en la
siguiente Tabla.

Comunicacin afectiva
Agresividad
Buena Mala
Total
Sin agresividad 30 (23,5) 5 (11,5) 35
Con agresividad 17 (23,5) 18 (11,5) 35
Total 47 23 70

Entonces,
5 , 11
2
) 5 , 11 18 (
5 , 23
2
) 5 , 23 17 (
5 , 11
2
) 5 , 11 5 (
5 , 23
2
) 5 , 23 33 (
2
0

+

= _
O sea,
2
0
_ = 10,94
Observacin.
Las frecuencias observadas en cada casilla ij del cuadro, se designan en
general con
ij
O . Mientras que, las frecuencias esperadas se designan con
ij
E .
Estas frecuencias esperadas, que en el cuadro aparecen entre parntesis, se
calculan con la siguiente frmula,

general Total
j columna la de Total i fila la de Total
ij
E
) ( ) (
=

3. Etapa. Regin de rechazo de
0
H , para un n.s. o .
El valor crtico de
2
_ , que define la regin de rechazo de
0
H , est dado por
| |
2
1 ; ) 1 ( ) 1 ( o
_
c f
; donde, los grados de libertad se obtienen del cuadro multiplicando
el nmero de filas menos 1, por el nmero de columnas menos 1.
La regin de rechazo de
0
H , est definida entonces por el intervalo.

| |
{ }
2
1 ; ) 1 ( ) 1 (
2 2
0
/
o
_ _ _

> =
c f
RRH .

En el ejemplo de referencia 4.
El nmero de filas es 2, el nmero de columnas es 2; por lo tanto el nmero de
grados de libertad es 11 = 1. o = 0,05 , entonces, 1-o = 0,95
El valor crtico,
| |
2
1 ; ) 1 ( ) 1 ( o
_
c f
=
) 95 , 0 ; 1 (
_ = 3,84 se encuentra en la Tabla 3.
Luego, { } 84 , 3 /
2 2
0
> = _ _ RRH .

4.Etapa. Decisin.
La hiptesis nula
0
H , se rechaza al n.s. o , cada vez que, la estadstica de
prueba
2
0
_ pertenece a la regin de rechazo de
0
H (
2
0
_ e RR
0
H ); en caso
contrario
0
H no se rechaza.
En el ejemplo de referencia 4 .
=
2
0
_ 10,94 > 3,84 =
2
crit
_ ; o sea,
2
0
_ e
0
RRH
Entonces, la hiptesis nula
0
H , se rechaza, al n.s. del 5 % .

Conclusin.
La evidencia estadstica muestra que, realmente, la agresividad del prvulo en
el jardn infantil estara relacionada con la calidad de la comunicacin afectiva
dentro de su hogar.
GUIA 8 DE EJERCICIOS

1. Una empresa, que se dedica a la instalacin de televisin por cable, ha dividido
su regin en cuatro sectores socioeconmicos. La empresa va a ser vendida y, a
un posible comprador se le ha manifestado que las instalaciones que hace la
empresa estn, mas o menos, igualmente distribuidas entre los 4 sectores. El
posible comprador, toma una muestra aleatoria de 72 instalaciones, hechas el ao
anterior, disponibles en los archivos de la empresa. El control realizado, da como
resultado lo que se registra en la siguiente tabla. Use un nivel de significacin del 5
% para determinar si habra uniformidad en las instalaciones por sector.

Sector I II III IV
N de instalac. 16 18 17 21

2. Un distribuidor de autos, de una marca conocida, vende tres tipos de
modelos, cuyos precios se pueden catalogar de bajo, intermedio y alto. Antes de
una promocin de ventas, destinada a destacar las virtudes del modelo ms caro,
los porcentajes histricos de autos vendidos eran de 46,8 %, 29,3 % y 23,9 %,
para los de precio bajo, intermedio y alto respectivamente. De una muestra
aleatoria de 75 autos, se vendieron 29 de precio bajo 20 de precio intermedio y 26
de precio alto. Use un nivel de significacin del 2,5 % para probar si, realmente, la
promocin del auto caro, dio un resultado significativo.

3. La direccin de una escuela de enseanza bsica ha hecho un estudio, en base
a una muestra de 287 apoderados, para determinar si habra asociacin o relacin
entre su categora de ingreso, de acuerdo al rea residencial donde vive, y su nivel
de participacin en los programas de la escuela.
La direccin clasific a los apoderados en tres categoras de ingreso: bajo ,
medio y alto. Mientras que, respecto de su participacin en los programas de la
escuela les asign los siguientes niveles: nunca , ocasional y regular
Utilice un nivel de significacin del 5 %, para probar si habra asociacin entre
las 3 categoras de ingreso y los 3 niveles de participacin.
Los resultados de la investigacin se describen en el siguiente cuadro.

Ingreso
Participacin
Bajo Medio Alto Total
Nunca 28 48 16 92
Ocasional 22 65 14 101
Regular 17 74 3 94
Total 67 187 33 287


4. Se ha hecho una investigacin de un programa especial de televisin, que
trata acerca de la salud en la familia. Se encuestaron, en forma aleatoria a 60
personas, en cada uno de 4 sectores socio-econmicos de la ciudad, a las que se
les pregunt si vean o no dicho programa. Se trata de determinar, usando un nivel
de significacin del 5 %, si las proporciones de personas, que ven el programa,
seran diferentes de acuerdo al sector en que habitan. Los resultados de la
encuesta se registran en el siguiente
cuadro.

Sector I II III IV
Ven el progr. 15 24 12 21
No ven el progr. 45 36 48 39

5. Se ha hecho una investigacin, relacionada con la reaccin de la gente y,
considerando su simpata poltica, acerca de la nueva ley de previsin. Los
resultados de la consulta se registran en el siguiente cuadro. Con esta informacin
y, usando un nivel de significacin del 5 % , se podra asegurar que la reaccin de
la gente, en relacin a dicha ley, est influenciada por su simpata poltica.

Reaccin
Simpata poltica
A favor Neutral En contra
Concertacin 120 20 20
Alianza 77 21 42
Otra 55 15 30


6. Con el propsito de organizar en forma ptima los requerimientos, en cuanto a
abastecimiento, de cierto restaurant de la ciudad, se ha llegado a determinar que
el nmero de clientes atendidos diariamente, entre Lunes y Domingo, estn en la
razn de 3 : 4 : 6 . 9 : 15 : 10 : 8 .
Peridicamente este modelo histrico es controlado aleatoriamente. En uno de
estos controles, fueron atendidos en el restaurant el siguiente nmero de clientes,
en cada da de la semana.

Da Lun. Mar. Mie. Jue. Vie. Sab. Dom.
Clientes 130 210 285 460 670 735 510

Use un nivel de significacin del 5 % para determinar si, de acuerdo a los
resultados del control, el modelo histrico est vigente.

7. En cierta ciudad, se han implementado 4 programas de asistencia a jvenes
consumidores de pasta base de cocana. Para esto, se eligieron aleatriamente 50
jvenes adictos, los que fueron asignados al azar a cada uno de los 4 programas.
Despus de 1 ao, se hizo un control a cada uno de los jvenes, que haban sido
asignados a cada uno de los 4 programas, con el fin de determinar si se haban
recuperado o haban reincidido. Use un nivel de significacin del 5 % para
determinar si, cualesquiera de los 4 programas, sera igualmente efectivo en el
tratamiento para la recuperacin de jvenes adictos. La informacin obtenida se
describe en el siguiente cuadro.


Programa 1 2 3 4 Total
Recuperados 31 37 35 38 141
Reincidentes 19 13 15 12 59
Total 50 50 50 50 200


8. Para determinar si el sexo y la edad estaran relacionados, en los
compradores de telfonos celulares de ltima generacin, se hizo una
investigacin en base a una muestra aleatoria de 244 compradores de
estos equipos. Los resultados se describen en el siguiente cuadro. Use un
nivel de significacin del 5 % para probar si hay relacin o no, entre sexo y
edad, en los clientes que compran este tipo de celular.

Sexo
Edad
Masculino Femenino Total
Menos de 30 aos 68 73 141
30 aos o mas 52 51 103
Total 120 124 244


9. Histricamente, se ha determinado que un 35,8 % de los alumnos del primer
semestre, de las carreras de ingeniera, reprueban la asignatura de Clculo 1, ya
sea que estudien en la universidad de Tarapac, Arturo Prat, Norte o La Serena.
De los resultados obtenidos en el primer semestre de 2007 se obtuvieron los
siguientes resultados.
De 146 alumnos de la universidad de Tarapac, reprobaron 41; de 132 de la
A. Prat, reprobaron 55; de 157 de la Norte, reprobaron 66; y, de 153 de La
Serena, reprobaron 49.
Con un nivel de significacin del 5 % pruebe si la proporcin de alumnos
reprobados de clculo 1, en el 2007, se mantiene igual a 35,8 %, para cada una
de las carreras de ingeniera de las 4 universidades.

Vous aimerez peut-être aussi