Vous êtes sur la page 1sur 92

UNIVERSIDAD NACIONAL DE

INGENIERIA
FACULTAD TECNOLOGA DE LA CONSTRUCCIN

MAESTRA EN VAS TERRESTRES

CURSO PROPEDEUTICO

ESTADISTICA APLICADA

PROFESOR:
MSC. ELIAS MARTINEZ RAYO

1
ESTADISTICA DESCRIPTIVA

INTRODUCCIN

QUE ES LA ESTADSTICA?
Escribiendo de manera formal un poco ms acertada la definicin de Estadstica
podemos decir que:
Es un conjunto de tcnicas para la coleccin, organizacin, presentacin, manejo,
descripcin y anlisis de informacin, de manera que las conclusiones obtenidas de ellas
tengan un grado de confiabilidad especificado.

CONCEPTOS BSICOS

Estadstica Descriptiva:
Estudia los mtodos adecuados que nos conducen a recopilar, organizar, sintetizar y
describir una informacin (conjunto de datos) a travs de tablas, grficos y medidas
descriptivas.

Estadstica Inferencial:
Estudia los mtodos adecuados que nos conducen a tomar decisiones generales acerca de
una poblacin, utilizando los datos de una muestra, o sea: es la interpretacin y
generalizacin de los resultados obtenidos del estudio descriptivo.

Poblacin:
Una poblacin es el conjunto total de mediciones de inters en las que se estudia una
caracterstica dada. El tamao de las poblaciones es el nmero de elementos o mediciones
que contiene.
Por ejemplo. En un estudio sobre los costos de construccin, la poblacin puede
consistir en los precios unitarios de los materiales de construccin.
En un estudio socio-econmico, la poblacin puede consistir en el nmero de
personas que habitan en un municipio determinado.
En un estudio de control de calidad, la poblacin puede consistir en la valoracin
(numrica o cualitativa) de cada artculo que contiene un lote.

Muestra:
Es un subconjunto de la poblacin que contiene las mediciones obtenidas mediante un
experimento estadstico.
Los mtodos estadsticos proporcionan las tcnicas necesarias para el diseo de
experimentos o encuestas, y su procesamiento. Da los criterios para decidir el tamao
adecuado de una muestra, como obtener una muestra, como definir y probar hiptesis y
proporciona una medida de la bondad o confiabilidad de las inferencias.

VARIABLES:
Una variable se simboliza con letras maysculas del Alfabeto tal como X, Y, H, etc;
pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Las
variables pueden ser cualitativas o cuantitativas.

2
Cuantitativas: Si la variable en estudio se puede expresar numricamente, entonces se
llama variable cuantitativa. Estas pueden ser discretas o continuas.

DISCRETAS: cuando nicamente asumen valores enteros. Son resultado de contar un


nmero de objetos u observaciones.

Ejemplos
Nmero de viviendas en una cuadra
Nmero de hijos por vivienda
Nmero de automviles que cruzaron un puente en una hora determinada.

CONTINUAS: cuando pueden asumir cualquier valor en una escala continua (real).
Ejemplos:
La carga mxima que soporta un cable
La vida til de una lmpara
El rea de una parcela
La distancia entre dos puntos.

Cualitativas: Si la variable en estudio es no numrica, se llama variable cualitativa.


Estudiaremos las nominales y ordinales.

Nominales: Cuando se obtienen a partir de la definicin de categoras y se pueden contar


los elementos de esa categora.

Ejemplos
Sexo (masculino o femenino)
Estado civil (soltero o casado)
Departamento de origen (Managua, Len, Granada, etc.)
Nivel educativo (Pre-escolar, primaria, secundaria, ect.)

Ordinales o Jerarquizados: Cuando son susceptibles de un ordenamiento relativo, pero


no de mediciones cuantitativas: primero, segundo, tercero, etc.

Ejemplos
Valoracin de un arbitro
Preferencias de un cliente
Cuando se trabaja con datos cualitativos es adecuado codificarlos para su posterior
procesamiento.
Por ejemplo, la variable sexo se puede codificar as:
0, si la persona es del sexo masculino

X=

1, si la persona es del sexo femenino

3
DESCRIPCIN DE DATOS
Los datos estadsticos, obtenidos de experimentos, muestras o cualquier coleccin de
mediciones, comnmente son tantos que, para poder describirlos y analizarlos, requieren
ser reducidos a una forma ms adecuada. Comenzaremos con la presentacin de datos
agrupados en una tabla y posteriormente en forma de grficos.
Distribucin de Frecuencia
Es una ordenacin tabular de datos estadsticas que muestran cuantos elementos o que
parte de los estos estn en diferentes intervalos (clases o categoras) en los cuales se
agrupan los datos. La distribucin de frecuencia pueden ser distribuciones numricas o
cualitativas.

Construccin de una Tabla de Distribucin de Frecuencias (TDF).


Para la construccin de una TDF, existen varias tcnicas, en general se recomienda que el
nmero de clases deban oscilar entre cinco y quince; y esto depender del nmero de
elementos que tenga la informacin que se agrupar en ella.

La tcnica que mostraremos a continuacin, es una tcnica que de antemano se debe dar
el nmero de clases. Lo haremos con un ejemplo.

Ejemplo 1
En una cooperativa de taxis de Managua se midi el consumo de gasolina,
obteniendo los kilmetros que hicieron 40 vehculos por galn de consumo. Los
resultados fueron los siguientes:

45 38.4 44.3 44.2 43.6 45.3 44.5 39.8 44.2 44.4


43.2 44.0 43.8 43.8 45.5 44.5 44.6 44 45.2 38.7
44.4 44.7 44.1 44.3 43.9 44.1 45.8 42.2 41.2 40.6
42.1 45.6 44.5 39.7 40.7 42.3 45.2 43.3 44.7 38.6

Agrupe estos datos en una distribucin de frecuencias que tenga 7 clases


Solucin:
1) Hallar el rango; R = 45.8-38.4=7.4
7 .4
2) Establezca el cociente R / K; K: nmero de intervalos, 1 . 057
7
3) Para la seleccin de la amplitud de las clases, debe tomarse en cuenta el
nmero de decimales en los datos.
En este caso u = 0.1 (dos decimales).
Luego, 1.057 se trunca hasta un decimal; es decir:
C = 1.0 + 0.1 = 1.1
4) Construir el primer intervalo:
Li = Vmenor = 38.4 (lmite inferior)
Ls = Vmenor + C u = 38.4 + 1.1 0.1 = 39.4 (lmite superior)
5) Para obtener los lmites de los dems intervalos, solamente se suma la amplitud
a cada lmite anterior.
Notas: 1) El ltimo intervalo deber contener al dato mayor.
2) Ls = Li +C u; para cualquier clase.

4
La TDF contiene la siguiente informacin, la cual se agrega en columnas a la
par de las clases:
-
La frecuencia, denotada por f, representa el nmero de datos que estn contenidos
en cada clase.
-
La frecuencia relativa, denotada por fr, definida como: fr = fi/n, donde i = 1 hasta
k, donde k representa a las clases y n es el total de datos.
-
El porcentaje de la frecuencia, denotada por %f, definida como:
%f = 100 fr.
-
La frecuencia acumulada, denotada por F, definida como: F = f i (i = 1 hasta k,
donde k representa a las clases).
-
El porciento de la frecuencia acumulada, denotada por %F, definida por:
-
%F = F n/100.
-
La marca de clase, denotada por X, definida como el punto medio de cada clase.
X = (Li + Ls) / 2.
-
Los limites reales, LIR = LI - u/2 y LSR = LS + u/2. Para los limites reales,
vamos a convenir que tienen esta forma: (LIR, LSR], abiertos por la izquierda y
cerrados por la derecha.

DIAGRAMA DE TRONCO Y HOJAS

Los datos se pueden ordenar en un diagrama de Tronco y hojas, para facilitar la


construccin de la TDF.
Ordenacin de los datos en tronco y hojas, para obtener la frecuencia absoluta, en este
caso tomamos como tronco los enteros y como hojas los decimales.
Tronco hojas
38. 4, 6, 7
39 7, 8,
40 6, 7
41 2
42 1, 2, 3
43 2, 3. 6, 8, 8, 9
44 0, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 5, 6. 7, 7
45 0, 2, 2, 3, 5, 6, 8

T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua

LI LS f Fr F %F X LIR LSR
38.4 39.4 3 0.075 3 0.075 38.9 38.35 39.45
39.5 40.5 2 0.05 5 0.125 40 39.45 40.55
40.6 41.6 3 0.075 8 0.2 41.1 40.55 41.65
41.7 42.7 3 0.075 12 0.275 42.2 41.65 42.75
42.8 43.8 5 0.125 17 0.4 43.3 42.75 43.85
43.9 44.9 17 0.425 33 0.825 44.4 43.85 44.95
45 46 7 0.175 40 1 45.5 44.95 46.05

5
Ejercicios

1. En la zona baja de Managua hay 27 pozos, que suministran agua a la ciudad


Capital, los caudales de dichos pozos se miden en galones por minuto (GPM) y sus
mediciones son las siguientes:

800 2200 1212 1200 2230 1115 1100 51.1 1100


1000 800 800 1000 1200 800 750 710 700
1200 600 550 450 400 380 350 1200 1000

a) agrupe estos datos en una distribucin que tenga 6 clases.

2. Los contenidos de nicotina, en miligramos, de 40 cigarrillos de cierta marca son:

1.09 1.79 2.03 1.63 1.69 0.85 1.64 1.51


1.74 1.37 1.86 2.31 1.88 2.17 1.75 1.82
1.58 1.75 0.72 1.97 1.40 1.68 2.28 1.67
2.11 1.92 2.46 1.70 2.37 1.85 1.24 2.09
1.64 1.47 1.93 1.90 1.79 2.08 2.55 1.69
a) Construya una T.D.F con 6 intervalos.

REPRESENTACIN GRFICA

REGLA DE LOS
La mayora de las graficas estadsticas se presentan en el plano cartesiano.
Para las dimensiones de las grficas, se acostumbra usar el criterio de los ; es decir,
que la altura mxima de la informacin que se presenta en el eje de las ordenadas, sea:
3/4 de la dimensin de la informacin que se presenta en el eje de las abcisas; o sea:
Y = (3/4) X.

HISTOGRAMA DE FRECUENCIAS
Un histograma de frecuencia consiste en una serie de rectngulos que tiene sus bases
sobre el eje horizontal (x), con centros en las marcas de clases y longitud igual al tamao
de los intervalos de clase. Las alturas sobre el eje vertical (y) son proporcionales a las
frecuencias de las clases.

POLIGONO DE FRECUENCIAS.
Es un grfico que une los puntos cuyas coordenadas corresponden a cada marca de clase
como abcisa y su frecuencia correspondiente como ordenada.

OJIVA O POLIGONO DE FRECUENCIAS ACUMULADAS.

Es un grfica que muestra las frecuencias acumuladas para cada valor o clase.

Del ejemplo 1, obtendremos el histograma, el polgono y la ojiva.


Solucin:

6
La TDF es:
T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua

LI LS f F X LIR LSR
38.4 39.4 3 3 38.9 38.35 39.45
39.5 40.5 2 5 40 39.45 40.55
40.6 41.6 3 8 41.1 40.55 41.65
41.7 42.7 3 12 42.2 41.65 42.75
42.8 43.8 5 17 43.3 42.75 43.85
43.9 44.9 17 33 44.4 43.85 44.95
45 46 7 40 45.5 44.95 46.05

Histogram
18
15
12
9
6
3
0
38.35 39.45 40.55 41.65 42.75 43.85 44.95 46.05

Poligono
18
15
12
9
6
3
0
38.9 40 41.1 42.2 43.3 44.4 45.5

7
Ojiva
40
35
30
25
20
15
10
5
0
39.45 40.55 41.65 42.75 43.85 44.95 46.05

DIAGRAMA DE BARRAS.

Similares a los histogramas, las alturas de las barras representan las frecuencias de las
clases, pero no hay una escala horizontal continua.

DIAGRAMA DE BARRAS

5
FRECUENCIA

0
1 2 3 4 5 6

CLASES

DIAGRAMA CIRCULAR

Es un crculo que se divide en sectores circulares proporcionales con las categoras o


clases que se muestran. Los ngulos correspondientes a cada sector se encuentran a
travs de una regla de tres. De igual forma los porcentajes que se muestran.

El diagrama circular se acompaa de una leyenda, donde se especifica la informacin


que se muestra en cada uno de los sectores del crculo.

8
DIAGRAMA CIRCULAR

13%

40%
20%

27%

MEDIDAS DESCRIPTIVAS (ESTADIGRAFOS)

Medidas de Tendencia Central:

Las medidas de tendencia central son la media aritmtica, la mediana y la moda, las
cuales calcularemos para datos agrupados y no agrupados.

Consideraremos que los datos estn agrupados, cuando estn representados en una
TDF.

MEDIA ARITMTICA
La media aritmtica, representa el valor promedio de los datos, se denota por:
X : media aritmtica para una muestra y como:
: media aritmtica para una poblacin.

Estaremos utilizando la notacin para una muestra, aunque los clculos son validos para
las medidas o parmetros poblacionales.
Para datos agrupados se calcula como:
k

f X
i 1
i i
X= ; donde: f: es la frecuencia absoluta,
n
X: es la marca de clase y
n: el nmero de observaciones.
Para datos no agrupados se calcula como:
n

x
i 1
x= ; donde: X: es cada observacin
n
n: el nmero de observaciones.

9
LA MEDIANA
Es un valor central que tiene la caracterstica de dividir en dos partes iguales las
observaciones. Un 50% de las observaciones son menores o iguales a la mediana y el
otro 50% mayor o igual, se denota por Me.

Para datos agrupados se define:


n
2 F
Me = Li + . C ; donde
f

Li: Limite inferior real del intervalo que contiene a la Me.
F: Frecuencia acumulada anterior al intervalo que contiene a la M e.
f: Frecuencia absoluta del intervalo que contiene a la Me.
C: Amplitud de clase.
Para obtener la Mediana, identificamos la clase que contiene a la mediana, la cual ser
donde la primera frecuencia acumulada es mayor o igual a: n/2.

Para datos no agrupados: se ordenan los datos y se escoge el valor central del
conjunto datos; para esto se debe considerar cuando el nmero de datos es par o impar.
Si n es impar, entonces:
n 1
Me = Dato [ posicin ( )]
2

Ejemplo:
Sean los datos 3,4,4,5,6,7,,8,8,9,9,10. (n =11)
Me = Dato (6) = 7

Si n es par, entonces:

n n2
Dato [ posicin ( 2 )] Dato [ posicin( 2 )]
Me =
2

O sea: el promedio de los dos datos centrales.
Ejemplo: 3,4,4,5,6,7,8,8,9,9,10,11. (n =12)

Me = (Dato (6) + Dato (7))/ 2 = (7 + 8) / 2 = 7.5

LA MODA:

De una serie de datos es: el nmero que ocurre con mayor frecuencia, el que ms se
repite (datos no agrupados). Basta observar el nmero que ms se repite.

Para datos agrupados, la moda esta en la mayor concentracin de datos (mayor


frecuencia), la clase con mayor frecuencia es la clase modal. La moda si existe puede ser
no nica y se denota por Mo, se define como:

10
1
Mo = Li + . C ; donde

1 2
Li: Limite interior real del intervalo Modal.
1: Mayor frecuencia menos la inmediata anterior
2: Mayor frecuencia menos la inmediata posterior
C: Amplitud de Clases

Formas de la Distribucin:
-
Muchas distribuciones de variables continuas se pueden representar de manera grafica
mediante una curva en forma de campana.
-
Se dice que una distribucin es simtrica, si se puede doblar a lo largo de un eje
vertical de modo que los lados coincidan, en este caso la x, la Me y Mo coinciden, en el
punto de simetra.

Mo = Me = X
- Se dice que es Asimtrica positiva o Sesgada a la derecha si Mo< Me <
x.

Mo< Me < x
-
Se dice que Asimtrica Negativa o Sesgada a la izquierda, si x < Me <
Mo.

x<Me<Mo

11
MEDIDAS DE VARIABILIDAD:
Son medidas que expresan variabilidad o dispersin alrededor de un valor promedio. Una
vez localizado el centro de distribucin de un conjunto de datos nos vemos en la
necesidad de medir el grado en que se dispersan o diseminan los datos alrededor del valor
promedio.
Varianza
Expresa variabilidad al cuadrado de los datos alrededor del valor promedio se representa
por S2 (para una muestra) y como 2 (para una poblacin) y se obtiene:

Datos agrupados Datos no agrupados

S 2

n x2i f i ( xf i ) 2
S 2

( x x) 2

n( n 1) n 1
x: marca de clase x: datos
f: frecuencia x: media aritmtica
n: total de datos n: total de datos
La varianza es un valor no negativo.

Desviacin Estndar
Expresa variabilidad lineal de los datos alrededor del valor promedio. Es la raz
cuadrada de la varianza.
Se representa por: S, para una muestra
y como: , para una poblacin.
Se obtiene: tanto para datos agrupados como para no agrupados.

Coeficiente de Variacin

s
CV =
x
Se utiliza para comparar la variabilidad de dos o ms distribuciones, ser ms
representativa (menos variabilidad) la que tenga el CV ms pequeo.

Del ejemplo 1 , calcularemos e interpretaremos las medidas descriptivas para datos


agrupados.

T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua

LI LS f F X LIR LSR
38.4 39.4 3 3 38.9 38.35 39.45
39.5 40.5 2 5 40 39.45 40.55
40.6 41.6 3 8 41.1 40.55 41.65
41.7 42.7 3 12 42.2 41.65 42.75
42.8 43.8 5 17 43.3 42.75 43.85
43.9 44.9 17 33 44.4 43.85 44.95
45 46 7 40 45.5 44.95 46.05

12
Solucin:
Medidas de tendencia central
-
X = 1736..4/40 = 43.41.
Los taxis recorren en promedio 43.41 Km. por galn de gasolina.
-
Para le mediana se calcula primero: n/2 = 20, luego se observa en la columna de las
frecuencias acumuladas, cual es la primera clase que contiene a 20. En este caso es la
sexta clase, entonces:
Me = 43.85 + [(20 16) / 17] 1.1 = 44.3.
El 50% de los vehculos usados como taxis recorren menos de 44.3
Km. Por galn de gasolina.
-
Para la moda se ubica la clase que contiene a la moda, que es: la que tiene la
mayor frecuencia, en este caso la sexta.

Mo = 4835 + [(12/(12+10))] 1.1 = 44.45.


Lo mas comn es que los vehculos usados en la cooperativa de Taxis, recorran 44.45
Km. Por galn de gasolina.

Nota: con estas medidas se deduce que la forma de la distribucin es asimtrica


negativa, ya que la media es menor que la mediana y la moda.

Medidas de variabilidad

Para la varianza se obtienen los productos de las dos ltimas columnas de la tabla anterior
y sus respectivas sumas. Las unidades de la varianza son cuadradas.

-
S2 = [40 (75529.1) (1736.4)2] / (40*39) = 3.8968 (Km por galn)2 .
La variabilidad cuadrtica del kilometraje recorrido por los taxis alrededor de la
media es de 3.8968 (Km por galn)2.
-
La desviacin estndar se obtiene extrayendo la raz cuadrada a la varianza y sus
unidades son lineales, entonces:
S =1.974
La variabilidad lineal del kilometraje recorrido por los taxis es de 1.974 Km., alrededor de
la media.
-
Para el coeficiente de variacin, simplemente se divide la desviacin estndar
entre la media.
CV = 1.974/43.41 = 0.04547.

13
INTRODUCCION A LA TEORIA DE PROBABILIDAD.
INTRODUCCION

Cuando operamos con procesos fsicos, biolgicos y sociales que generan observaciones
que no es posible predecir con exactitud, entonces decimos que estamos ante eventos o
sucesos aleatorios. La frecuencia relativa con la cual, ocurren estos sucesos en una gran
cantidad de observaciones es a menudo estable. Esto nos da una idea intuitiva, pero
significativa de la probabilidad de ocurrencia de un evento aleatorio en una observacin
futura.
CONCEPTOS BASICOS

EXPERIMENTO ALEATORIO

Definicin
Un experimento aleatorio es un proceso con diversos resultados posibles que no se
conocen de antemano o que no pueden predecirse con certeza.

Ejemplos:
1) Lanzamiento de una moneda 10 veces. Cuntas caras caen?
2) Seleccionar una muestra de 1000 transistores de un cargamento de artculos
similares. Saldr ms de un transistor defectuoso?
3) Observar diariamente la temperatura en un cierto punto al medioda durante 90
das. En cuntos das pasa de 30 grados?
4) Evaluar un proyecto de investigacin y desarrollo. En seis meses saldr con xito
un nuevo producto?

ESPACIO MUESTRAL

Definicin
El conjunto de todos los resultados posibles de un experimento aleatorio se denomina
espacio muestral, lo denotaremos con la letra S.

Ejemplos:
Consideremos los siguientes experimentos
1) Lanzamiento de una moneda, el espacio muestral es:
S = {C, S}, donde: C: cara; S: sol.
2) Lanzamiento de una moneda dos veces, el espacio muestral es:
S = {CC, CS, SC, SS}
3) Lanzamiento de una moneda tres veces, el espacio muestral es:

S = {CCC, CCS, CSC, SCC, SSS, SSC, SCS, CSS}

Nota: En experimentos repetidos, como el anterior, hay una frmula que nos permite
saber cuntos elementos tiene el espacio muestral, la cual se puede expresar como:
Xn : numero de resultados posibles del experimento repetido, donde
X: resultados posibles del experimento
n: veces que se repite el experimento.

14
Si la moneda se lanzara cinco veces, entonces el total de posibles resultados de este
experimento seria: 25 = 16

Nota: Esta frmula nos permite conocer el # de elementos del espacio muestral,
pero no los elementos.

EVENTO
Definicin
Un subconjunto del espacio muestral se denomina evento o suceso, los denotaremos con
letras maysculas. A, B, C, etc. denotarn sucesos.

Ejemplo
En el lanzamiento de un dado, S = {1, 2, 3, 4, 5, 6}
Algunos sucesos son:
A: "El nmero que muestra la cara superior es a lo ms cuatro" A = {1, 2, 3, 4}
B: " El nmero que muestra la cara superior es exactamente seis" B = {6}
C: " El nmero que muestra la cara superior es impar" C = {1, 3, 5}
D: " El nmero que muestra la cara superior es un nmero menor que 7.
(D = S).
E: " El nmero que muestra la cara superior es un nmero mayor que 8.
(E = ).
A los eventos D y E se le denominan evento seguro y evento imposible respectivamente.

OPERACIONES CON EVENTOS Y PROPIEDADES.

a) Unin:
El suceso A B ocurre, si ocurre el suceso A u ocurre el suceso B o bien
ocurren mbos.
La unin de sucesos tiene las siguientes propiedades:
i) A U A = A,
ii) A U B = B U A,
iii) A U = A ,
iv) A U S = S,
v) Si A < B, A U B = B

b) Interseccin:
El suceso A B ocurre, si ocurren A y B simultneamente.
La interseccin de eventos tiene las siguientes propiedades:
i) A B = B A,
j) ii) A A = A,
k) iii) A S = A,
l) iv) A = ,
m) v) Si A < B, A B = A

Se puede generalizar la unin e interseccin de eventos a una sucesin finita o infinita


de eventos cualesquiera.

15
Nota: Dos eventos A y B son disjuntos o mutuamente excluyentes, si no pueden
ocurrir ambos de manera simultnea, es decir, su interseccin es el suceso imposible. (A
B = )

c) Complemento:
Se dice que ocurre el suceso Ac, si no ocurre el suceso A.
El complemento de un suceso tiene las siguientes propiedades:
i) (Ac)c = A,
ii) ii) A U Ac = S,
iii) iii) A Ac = ,
iv) iv) c = S,
v) v) Sc =

d) Diferencia
El suceso A B ocurre, si ocurre A y no ocurre B.
La diferencia tiene las siguientes propiedades
a) A B = A Bc
b) A B B A
c) A Ac =
d) Ac = S A.
Adems, existen otras propiedades:
i) A ( B C) = (A B) (A C)
ii) A ( B C ) = (A B) (A C)
iii) (A B ) c = Ac Bc (ley de Morgan)
iv) ( A B)c = Ac Bc (ley de Morgan)

EJEMPLO.
Un comerciante de automviles usados tiene dos PINOLEROS 1976 en su lote y estamos
interesados en saber cuntos de ellos vendern dos vendedores en una semana dada.

Puede ocurrir que los vendedores en esa semana vendan 0, 1 2 automviles, por lo
tanto, sea x: la cantidad vendida por el primer vendedor, y: la cantidad vendida por el
segundo vendedor, as: S = {(x, y) 0 x 2, 0 y 2}

PROBABILIDAD

Para describir cuantitativamente el grado de posibilidad objetiva de que se produzca uno u


otro suceso observable de un experimento, se cuenta con la funcin numrica P(A),
llamada probabilidad del suceso A.
- Si estamos seguros que el suceso ocurrir decimos que su probabilidad es 1, (suceso
seguro).
- Si estamos seguros que no ocurrir, decimos que su probabilidad es cero
(suceso imposible).
- Afirmar que la probabilidad de un suceso es 0.25, significa que hay un 25% de
posibilidades de que ocurra y un 75% de que no ocurra; es decir que ocurrir con un
promedio de 1 cada 4 veces.

Hay dos procedimientos para asignar o estimar la probabilidad de un suceso.

16
ENFOQUE CLSICO

CONCEPTO DE PROBABILIDAD CLASICA.

Definicin
Si un suceso A puede ocurrir de n maneras diferentes, de un total de N maneras posibles,
todas igualmente probables entonces:

n nmeros de veces que se observa A


P ( A)
N nmero total de datos

ENFOQUE COMO FRECUENCIA RELATIVA

CONCEPTO DE PROBABILIDAD COMO FRECUENCIA RELATIVA

Definicin
Si despus de N repeticiones de un experimento, donde N es muy grande, un
suceso A ocurre n veces, entonces:
n
P(A)
N
Como se pudo observar ambos enfoques presentan debilidades. Una forma de superar
estos aspectos es introducir un enfoque matemtico del concepto de probabilidades,
mediante axiomas y teoremas consistentes.

POBABILIDAD MATEMATICA

AXIOMAS DE PROBABILIDAD.
Sea E un experimento aleatorio y S el espacio muestral asociado a dicho experimento. A
cada suceso A < S se le asigna un nmero real P(A) denominado la probabilidad de que
el suceso A ocurra. Este nmero debe cumplir los siguientes axiomas:
a) Para cualquier suceso A, P(A) 0
b) P(S) = 1
c) Para cualquier sucesin infinita de sucesos disjuntos (o mutuamente
excluyentes) A1, A2, A3,.... + , se cumple que:
P (A1 U A2 U) = P (A1) + P (A2) +; O de manera compacta

P ( Ai) = P (Ai)
i=1 i=1

TEOREMAS DE PROBABILIDAD.
Teorema 1. P() = 0
Teorema 2. Para cualquier sucesin finita de n sucesos disjuntos, A 1 , A2, ... , An
n n
P ( Ai ) = P(Ai)
i=1 i=1
Teorema 3. Para cualquier suceso A, P(Ac) = 1 P(A)

17
Teorema 4. Para cualquier suceso A, 0 P(A) 1
Teorema 5. Si A < B, P(A) P(B)
Teorema 6. Para dos sucesos cualesquiera A y B,
P(A B) = P(A) + P(B) - P(A B).

Probabilidad de la Unin de n- Sucesos.

Para sucesos cualesquiera A1, A2,...., An, se cumple que:


n n
P ( Ai) = P(Ai) - P(Ai Aj) + P(Ai Aj Ak)
i=1 i =1 i<j i < j< k
- P(Ai Aj Ak Al ) + ... + (-1) n+1P(A1 A2... An)
i<j<k<l

EJEMPLOS.

1. Se selecciona una bola de una urna que contiene bolas rojas, blancas, azules
amarillas y verdes. Si la probabilidad de seleccionar una bola roja es 1/5 y la de
seleccionar una blanca es 2/5, cul es la probabilidad de seleccionar una bola azul,
amarilla o verde?
SOLUCION:
Sea A: la bola seleccionada es roja, B: la bola seleccionada es blanca, C: la bola
seleccionada es azul D: la bola seleccionada es amarilla E: la bola seleccionada es
verde

Se desea encontrar P(C D E). Pero si ocurre C, D E significa que no ocurre A ni


ocurre B, o sea, no ocurre la unin de A y B.
Por lo tanto P(C D E ) = 1 P(A B) = 1 P(A) P(B) = 1 1/5 2/5 = 2/5

2. Es posible tener una asignacin de probabilidades tal como: P(A) = ,


P(A B) = 1/3 y P(B) = ?
SOLUCION:
No es posible porque (A B) < B, as, P(A B) P(B), as, 1/3 debe ser menor o
igual que lo cual es falso.

3. En una empresa que tiene 500 empleados, 200 estn en un Curso de control de
calidad, 400 en diseo de experimentos y 200 en ambos cursos, calcular la
probabilidad de que al seleccionar un empleado al azar:
a) est al menos en un curso,
b) no est en ninguno de los cursos
SOLUCION:
Sea A: "el empleado est en el curso de control de calidad
B: "el empleado est en el curso de diseo de experimentos"
a) Como son 400 empleados los que estn en el curso de diseo de experimentos,
200 estn en control y 200 estn en ambos cursos, A es un subconjunto de B
(prubelo usando diagramas de Venn), as, A U B = B y por lo tanto, P( A U B)
= P(B) = 400/ 500 = 0.8

18
b) Se pide que el empleado no est en ninguno de los cursos, o sea que no ocurra A
ni ocurra B, o sea, P(Ac Bc ) = P(A U B)c = 1 P(A U B) =
1 0.8 = 0.2

TECNICAS DE CONTEO.

REGLA MULTIPLICATIVA
Si una operacin puede efectuarse de n1 maneras diferentes, y si para cada una de stos
resultados se puede efectuar una segunda operacin de n2 maneras diferentes, y si para
cada pareja de resultados de las operaciones anteriores se puede efectuar una tercera
operacin de n3, maneras diferentes..., y finalmente una k-sima operacin puede
efectuarse de nk maneras diferentes, todas la k operaciones pueden realizarse en el
orden especificado en:
N = n1 n2 .... nk maneras diferentes.

Ejemplo
Considere un experimento que consiste en lanzar una moneda equilibrada dos veces y un
dado equilibrado.
n1 = 2 (posibilidades de primer moneda)
n2 = 2 (posibilidades de segunda moneda)
n3 = 6 (posibilidades del dado)

El total de posibles resultados de este experimento ser: N = 2*2*6 = 24

PERMUTACIONES
El nmero de maneras en que se pueden ordenar k objetos de un total de n objetos, se
denota: nPk , sin repeticin se define como:
nPk = n (n 1) (n 2) ... (n k + 1).

Nota: si multiplicamos y dividimos la expresin anterior por (n k)!. Obtendramos lo


siguiente:

nPk = n (n 1) (n 2) ... (n k + 1) (n k)! / (n k)!


= n! / (n k)!. Lo cual es equivalente a la definicin anterior.

Ejemplo.
Cuantos nmeros de tres cifras, sin repetir; se pueden obtener con los dgitos:
1, 2, 3, 4, y 5.
Solucin:
El total de nmeros es: 5P3 = 5!/2! = 60

Teorema.
El numero de permutaciones de n objetos de los cuales n1 son de un tipo, n2 son de un
segundo tipo, y nk son de un k-simo tipo son:
N = n! / (n1! n2! n3!... nk!)

19
Ejemplo.
Si en un grupo de 8 estudiantes de la UNI, tres son civil, dos de elctrica, dos de qumica
y uno de arquitectura y se desean ordenar de tal forma que los de la misma carrera estn
juntos, de cuantas maneras diferentes se puede hacer eso?
Solucin:
n=8
n1 = 3
n2 = 2
n3 = 2
n4 = 1
N = 8! / (3! *2!* 2!*1!) = 1680.

COMBINACIONES
El nmero de maneras de seleccionar k objetos de un total de n objetos, se denota
como: nCk , (el orden es irrelevante), es:
nCk = n!/ k! (n k)!

Ejemplo
Se van elegir al azar cuatro estudiantes de un grupo formado por tres estudiantes no
graduados y cinco estudiantes graduados, para ocupar ciertos puestos en el Consejo
Estudiantil.
El total de formas en que se pueden seleccionar es: 8C4 = 8! / 4!(4!) =70 (El orden de
eleccin no interesa)

Otros Ejemplos:

1. Se lanzan cinco monedas. Determinar la probabilidad de obtener cuatro caras.


SOLUCION:
El espacio consta de 2*2*2*2*2 = 32 posibilidades. Las sucesiones del
evento

A: se obtienen cuatro caras y un sol son:


CCCCS, CSCCC, CCSCC, CCCSC, SCCCC.
As, P(A) = 5/32

2. Una moneda equilibrada va a ser lanzada diez veces. Determinar:


a) la probabilidad de obtener exactamente tres caras,
b) la probabilidad de obtener a lo sumo tres caras.
SOLUCION:
El espacio muestral consta de 210 = 1024 posibilidades. El nmero de sucesiones de
tres caras es 10 C 3 = 120
a) Sea A: caen exactamente tres caras, entonces, P(A) = 120 / 1024
= 0.1172
c) Sea B: obtener a lo sumo tres caras, el nmero de posibilidades de que
ocurra el suceso B es: 10 C 0 + 10 C 1 + 10 C 2 + 10 C 3 = 176 y
P(B) = 176 / 1024 = 0.1719

20
Teorema.

El total de maneras en que se puede dividir un conjunto de n elementos en p


subconjuntos de los cuales n1 elementos estn en el primer subconjunto,
n2 elementos estn en el segundo subconjunto, y np elementos estn en el p-simo
subconjunto, est dado por:

n n!
= -------------------------
n1!, n2!, n3!,..., np! n1! n2! n3!... nk!

Ejemplo.
Siete estudiantes de la UNI (Recinto Simn Bolvar) van a una reunin al Recinto Pedro
Araz Palacios en tres vehculos de las autoridades universitarias, en los cuales caben tres
en un vehculo y dos en los restantes vehculos, de cuantas formas pueden viajar a dicha
reunin?
Solucin:

7 7!
= --------- = 210.
3, 2 ,2 3! 2! 2

2.6 SUCESOS INDEPENDIENTES.

Suponga que dos sucesos A y B ocurren independientemente uno de otro en el sentido de


que la ocurrencia o no ocurrencia de cualquiera de ellos no tiene relacin ni influye sobre
la ocurrencia o no Ocurrencia del otro. Bajo estas condiciones, se cumple que:
P(A B) = P(A) P(B).

Ejemplo.
Considere el experimento en el cual, una moneda y un dado se lanzan simultneamente.
Sea A: obtener una cara en el lanzamiento de la moneda y sea el suceso B: obtener 1
2 al lanzar el dado.
Solucin:
De esta forma P(A) = , P(B) = 1/3, P(A B) = 1/6, ya que hay 12 resultadosposibles
del experimento y dos posibilidades en los sucesos: (C,1) y (C,2).
(Haciendo un diagrama de rbol se aprecian muy bien estos resultados).
De esta forma observe P(A B) = P(A) P(B).
Teorema
Si A y B son dos sucesos independientes, entonces, tambin lo son:
A y Bc, Ac y Bc.

21
Independencia de varios sucesos:

Los sucesos A1, A2, ... , Ak , son independientes si:


n n
P( Ai ) = P(Ai )
i=1 i=1
Adems, debe cumplirse que la independencia de los sucesos debe ser: por grupos de
dos, grupos de tres, grupos de cuatro,...., hasta todo el grupo de k-sucesos.
Por ejemplo, para un experimento dado, sea S = {a, b, c, d} donde los elementos de S
son equiprobables. Sean A = { a, b}, B = { a, c}, C = { a, d}. Entonces estos tres
sucesos no son independientes ya que P(ABC) = que difiere de P(A) P(B) P(C), sin
embargo son independientes por pares ya P(AB) = P(AC) = P(BC) = y P(A) = P(B) =
P(C) = .
Nota: Dos sucesos A y B mutuamente excluyentes pueden ser Independientes?
Dos sucesos A y B independientes pueden ser mutuamente excluyentes?

Ejemplo.
Suponga que dos mquinas 1 y 2 de una fbrica funcionan independientemente una de
otra. Sea A el suceso que la mquina 1 se estropee durante un perodo de 8 horas y sea
B el suceso que la mquina 2 se estropee en el mismo perodo, adems, suponga que
P(A) = 1/3 y P(B) = 1/4. Determinar la probabilidad de que al menos una de las mquinas
se estropee durante ese perodo.
Solucion:
Se desea encontrar P(A U B), como A y B son independientes,
P(A B ) = P(A) P(B) = (1/3) (1/4) = 1/12 ; As ,
P(A U B) = 1/3 + 1/4 - 1/12 = 0.5

PROBABILIDAD CONDICIONAL.

Supngase que se realiza un experimento cuyo espacio muestral es S y tambin que se


han especificado las probabilidades para todos los sucesos de S. Se desea determinar la
probabilidad de un suceso A cuando se sabe que otro suceso B ha ocurrido. Si B ha
ocurrido, entonces, se sabe que el resultado del experimento es uno de los elementos
incluidos en B. Por tanto, para evaluar que A ocurra, se debe considerar el conjunto de
los elementos incluidos en B que tambin implican la ocurrencia de A.

La probabilidad condicional se denota as: P(A B) y se lee: probabilidad que ocurra el


evento A dado que ocurri el evento B. O de forma abreviada: la probabilidad de A dado
B.

Definicin
La probabilidad de A dado B esta dada por:

P (A B)
P(A B) = --------------, P(B) 0
P(B)

22
De igual manera se define:
P(B A)
P( B A) = --------------, P(A) 0
P(A)

EJEMPLOS.

1) Supngase que se han lanzado dos dados y se ha observado que la Suma T de los
nmeros ha sido impar. Determinar la probabilidad de que T haya sido menor que
ocho.

Solucion:
El espacio muestral S consta de 36 posibilidades, por la regla multiplicativa, 6
posibilidades del primero y 6 del segundo.
Sea A = { T < 8 } y B = { T es impar }, se desea calcular P(A B ).
Obsrvese que A B = { 3, 5, 7}, por lo que P( A B) = 2 /36 + 4 /36 + 6 /36 =
1/3
As, P(A B ) = 1/3 / 1/2 = 2/3

2) Se lanzan dos dados repetidamente y en cada lanzamiento se observa la suma T de los


dos nmeros, determinar la probabilidad p de que el valor T = 7 sea observado antes
de que se obtenga el valor T = 8.

Solucion:
Repetir el experimento hasta que se obtenga T = 7 T = 8 implica que los resultados
del experimento quedan reducido a estos valores. Sea A = {T=7} y B = {T=7 T =
8}, de esta forma A B = A, y
P(A B) = P(A) / P(B) = (6/36) / (6/36 + 5/36) = 6/11

Notas:
Si dos sucesos A y B son:
a) mutuamente excluyentes, entonces: P(AB) = 0
b) independientes, entonces: P(AB) = P(A)

Ley Multiplicativa de Probabilidades Condicionales:


Sean A y B dos sucesos que no son independientes, entonces de la definicin de
probabilidad condicional se deduce que:
P(A B) = P(B) P(A B) P (A B) = P(A) P(B A).

La ley multiplicativa de probabilidades se puede generalizar para n sucesos de acuerdo al


siguiente teorema.

Teorema.

Sean A1, A2, ... , An sucesos que verifican que P(A1 A2 ... An - 1 ) > 0. Entonces:
P(A1 A2 ... An ) = P(A1) P(A2 A1) ... P(An A1 A2 ... An 1)

23
EJEMPLO.

1) Suponga que se van a extraer dos balones aleatoriomente y sin reemplazamiento de


una urna que contiene r balones rojo y b azules. Determinar la probabilidad de que el
primer baln sea rojo y el segundo sea azul

SOLUCION:
Sean los sucesos, A: "el primer baln extrado es rojo" y B: "el segundo baln extrado
es azul". Se desea encontrar P( A B)
Las probabilidades a utilizarse son las siguientes: P(A) = r/ (r + b) y
P(BA) = b/(r + b - 1).
Luego, P(A B) = P(A) P(BA) = (r/(r + b) ) ( b/(r + b - 1)
= r b / (r + b) (r + b - 1)

2.8 PROBABILIDAD Y PARTICIONES.

A1 A2

B
A3 Particin del espacio muestral con cinco
A5 A4 eventos Mutuamente excluyentes

Sea S el espacio muestral de un experimento aleatorio y considrense los sucesos A 1, A2,


... , Ak, de S de forma que sean disjuntos y Ai = S. Entonces estos k sucesos constituyen
una particin del espacio muestral S.

Si los k sucesos A1, ... , Ak constituyen una particin de S y B es cualquier otro suceso en
S, los sucesos A1 B, A2 B, ... , Ak B, constituyen una particin de B y por lo tanto
B = (A1 B) ( A2 B) ... (Ak B) .

Adems, puesto que los k sucesos del lado derecho de la expresin anterior son disjuntos,
entonces:
k k
P(B) = P(Aj B) = P(Aj ) P( BAj ) , con P(Aj ) > 0.
j=1 j=1

A esta expresin se le conoce como probabilidad total.

EJEMPLO.
Dos cajas contienen cerraduras grandes y cerraduras pequeas. Supongamos que una
caja contiene 60 cerraduras grandes y 40 pequeas y que la otra caja contiene 10 grandes
y 20 pequeas. Suponga que tambin se selecciona una caja al azar y que se extrae una
cerradura aleatoriamente de la misma. Determinar la probabilidad de que esta cerradura
sea grande.

24
Solucion:
Sean: A1: "la caja seleccionada es la primera",
A2: "la caja seleccionada es la segunda, estos eventos son los de la particin,
y B: "la cerradura seleccionada es grande

Entonces, P(A1) = P(A2) = 1/2. Se debe determinar P(B). Se conoce adems que:
P(BA1) = 60/ 100 = 3/5 y P(B A2 ) = 10/ 30 = 1/3
De esta forma P(B) = (1/2) (3/5) + (1/2) (1/3) = 14/ 10 = 7/5

2.9 TEOREMA DE BAYES.


Suponga que los sucesos A1, ... , Ak constituyen una particin del espacio muestral S, tal
que P(Aj ) > 0, para j = 1, ... , k y sea B cualquier suceso, tal que, P(B) > 0. Entonces,
para: i = 1,.. , k, se cumple que:


P( A) P B j
A
P A B j n

P( A) P B
i 1
i
A

La deduccin del teorema se hace usando la definicin de probabilidad condicional y que


los Aj forman una particin del espacio muestral.

El teorema de Bayes proporciona una regla sencilla para calcular la probabilidad


condicional de cada suceso Ai dado B a partir de las probabilidades condicionales de B
dado cada uno de los sucesos Ai y la probabilidad incondicional de cada A i.

EJEMPLO.
Para la fabricacin de un gran lote de artculos similares se utilizaron tres mquinas M1, M2
y M3 . Suponga que el 20% de los artculos fueron fabricados por la mquina M 1, el 30%
por la mquina M2 y el 50% por la mquina M3. Suponga adems que el 1% de los
artculos fabricados por la mquina M1 son defectuosos, el 2% de los fabricados por la
mquina M2 son defectuosos y el 3% de los artculos fabricados por la mquina M 3 son
defectuosos. Por ltimo, supngase que se selecciona al azar uno de los artculos del lote
y que resulta ser defectuoso. Determinar la probabilidad de que este artculo haya sido
fabricado por la mquina M2.
Solucion:
Sean: B: "el artculo seleccionado fue defectuoso
A1 : El artculo seleccionado fue fabricado por la mquina 1
A2 : El artculo seleccionado fue fabricado por la mquina 2
A3 : El artculo seleccionado fue fabricado por la mquina 3
Se desea encontrar P (A2 B). Se conoce que:
P(A1) = 0.2, P(A2) = 0.3, P(A3) = 0.5 y adems:
P(BA1) = 0.01, P(B A2) = 0.02 y P(BA3) = 0.03

De esta forma, usando el teorema de Bayes tenemos:

P(A2 B) = [ (0.3) (0.02)] / [ (0.2) (0.01) + (0.3) (0.02) + (0.5) (0.03)] = 0.26

25
Nota: La probabilidad P(Ai) se denomina usualmente probabilidad inicial del suceso Ai
antes de haber ocurrido el suceso B y P(AiB) se denomina probabilidad final despus
de que ocurri el suceso B.

As, en el ejemplo anterior, P(A2 ) es la probabilidad inicial de que el artculo seleccionado


haya sido producido por la mquina 2 antes de que se conozca si el artculo es o no
defectuoso, P(A2 B) es la probabilidad final de que el artculo seleccionado haya sido
producido por la mquina 2, al saber que dicho artculo fue defectuoso.

Si un experimento se lleva a cabo secuencial mente, entonces, la probabilidad final de


cualquier suceso puede tambin ser calculada secuencial mente. Despus de haber
realizado cada paso, la probabilidad final del suceso encontrado en ese paso, sirve como
probabilidad inicial para el paso siguiente.

PROBLEMAS RESUELTOS.

1. Se tienen dos cajas con piezas, la primera contiene 4 piezas estndar y 5 no


estndar, la segunda contiene 3 estndar y 7 no estndar. Se saca una pieza
en la oscuridad de la primera caja y se introduce en la segunda caja. Cual es la
probabilidad de sacar una pieza no estndar de la segunda caja?

SOLUCION:

Caja I Caja II

4 st 3 st
5 no st 7 no st

Sean los eventos: A: la pieza trasladada de la primera caja es estndar


B: la pieza trasladada de la primera caja es no estndar
C: la pieza extrada de la segunda caja es no estndar
Debe notarse que C = (AC) U (BC) ya que las dos cajas constituyen una particin (eventos
A y B) , por lo tanto:
P(C) = P(AC) + P(BC) =P(A) P(C A)+P(B) P(CB)
= (4/9) (7 /11) + (5 / 9 ) (8 /11)
= 68 / 99 = 0.6868

2. Entre cinco aspirantes a puestos de Ingenieros en una empresa a dos se les


considera excelentes, y a los dems se les considera buenos. Un gerente escoge
al azar dos de los cinco para la entrevista. Calcular la probabilidad de que el
gerente escoja:
a) a los dos excelentes,
b) por lo menos a uno de los excelentes,
c) a los dos excelentes, dado que ya se sabe que uno de los seleccionados es
excelente.

26
Solucin:
a) El numero de maneras de escoger a los dos aspirantes es 5 C 2 = 10
Sea A: el gerente escoge dos excelentes, P(A) = 2 C 2 / 10 = 1 /10

b) Sea B: el gerente escoge al menos uno de los excelentes, esto significa


que el gerente escoge a un excelente o a los dos. Por lo tanto:

(2C 2 + ( 2 C 1 ) ( 3 C 1)
P(B) = = 7/ 10
10

a) Debe notarse que A B, por lo que A B = A, as:


P(AB ) = P(A) / P(B)
= 1/ 7

3. Tres tiradores disparan hacia el mismo blanco. La probabilidad de que cada


uno de ellos de en el blanco es 1/6, 1/4 y 1/3 respectivamente. Si cada uno
dispara una vez, cual es la probabilidad de que:
a) exactamente uno de en el blanco,
b) al menos un tirador de en el blanco,
c) si un tirador dio en el blanco, cual es la probabilidad de que este sea el
primero.

Solucion:

Sea A: el primer tirador da en el blanco


B: el segundo tirador da en el blanco
C: el tercer tirador da en el blanco

a) El suceso D: exactamente uno da en el blanco es equivalente a:


ABc Cc U Ac B Cc U Ac Bc C, de esta manera:

P(D) = (1/6) (3/4) (2/3) + (5/6)(1/4)(2/3) + (5/6)(3/4)(1/3)


= 0.44
b) El suceso E: al menos un tirador da en el blanco equivale al suceso:
A U B U C, entonces:

P(E) = P(A U B U C) = = 1 P(Ac Bc CC )


= 1 (5/6)(3/4)(2/3)
= 0.5833 = 31 / 72

c) Se desea calcular la probabilidad P(A E).


P ( A E ) P ( A) / 1 / 6)(3 / 4)(2 / 3)
P AE 0.1935
P( E ) P( E ) (31 / 72)

4. Una urna contiene 4 bolas numeradas 1, 2, 3, 4 respectivamente. Se


seleccionan dos bolas al azar y sean los eventos

27
A: la suma de los nmeros de las bolas es 5 = { (1,4), (2,3), (3.2), (4,1)} y
Bi: la primera bola seleccionada tiene el nmero i.
Calcular: a) P(A Bi)
b) P(BiA)
Solucion:
a) Si el primer nmero es i, slo hay tres posibilidades para el otro, solo en
una de estas Posibilidades la suma es 5, por tanto, P(A Bi ) = 1 / 3
P( B j A) P( B j ) P A B j (1 / 4)(1 / 3) 1
P B j
A
P( A) P( A) (4 / 12) 4

5. Una caja contiene 24 bombillos de las cuales 4 son defectuosas. Si una


persona selecciona al azar 10 bombillas de la caja y una segunda persona
selecciona las restantes, cual es la probabilidad de que la misma persona
selecciones las 4 bombillas defectuosas.
Solucin:
El nmero de maneras de seleccionar las bombillas es: 24C10

Sea A: la primer persona toma las 4 bombillas defectuosas


B: la segunda persona toma las 4 bombillas defectuosas

Se desea encontrar P(AUB).


El nmero de maneras que ocurra el suceso A es:
(20 C6) (4 C 4 ) = 20C6 y
El nmero de maneras de que ocurra el suceso B es:
(20C10 ) (4C4) = 20C10
20 C6 + 20C10
P(A U B ) = = 223516/1961256
24C10

6. Una planta armadora recibe microcircuitos provenientes de tres distintos


fabricantes. El 50% del total se compra al primer fabricante, mientras que los
restantes se dividen en partes iguales. El porcentaje de los circuitos defectuosos para
el primero, segundo y tercer fabricante es 5%, 10% y 12% respectivamente. Si los
circuitos se almacenan en las plantas sin importar quien fue el proveedor, determinar:
a) la probabilidad de que una unidad armada en la planta contenga un circuito
defectuoso,
b) si un circuito no esta defectuoso, cual es la probabilidad de que haya sido
vendido por el segundo proveedor.
Solucion:
Sean: A: la planta contiene un circuito defectuoso
Bi: el circuito proviene de la fabrica i
a) Se desea encontrar la probabilidad del evento A, se conoce que:
P(B1) = 0.5 y que: P(B2) = P(B3) = 0.25, adems:
P(A B1 ) = 0.05, P(A B2 ) = 0.10 y P(A B3 ) = 0.12.

28
Entonces: P(A) = P(Bi) P(A Bi)
= (0.5)(0.05) + (0.25)(0.10) + (0.25) (0.12) = 0.08

b) Se desea encontrar ahora P(B2 Ac) , se conoce que P(Ac) = 0.92, entonces:

P(B2) P( Ac B2 ) (0.25) (0.90)


P(B2 Ac) = = = 0.2445
P(Ac ) P(Ac B) 0.92

.
VARIABLES ALEATORIAS
INTRODUCCION
En la mayora de experimentos se producen resultados cuya interpretacin se puede
realizar en funcin de nmeros reales, como por ejemplo: el nmero de candidatos para
determinada eleccin, el nmero de enfermedades en cierta ciudad en un periodo
determinado, la estatura de un grupo de estudiantes, etc. Dichos resultados que podran
variar de un experimento a otro, reciben el nombre de variables aleatorias.
En este capitulo estudiaremos el concepto de variable aleatoria, tipos de variables, valor
esperado y varianza de una sola variable y la distribucin de probabilidad conjunta de dos
variables aleatorias.
Las variables aleatorias las denotaremos con letras maysculas.

VARIABLE ALEATORIA

DEFINICIN

Una Variable Aleatoria es una funcin que asocia a cada elemento del espacio muestral un
numero real, su dominio es el espacio muestral.

Si X es la variable, entonces: X: S R
La Variable Aleatoria X es Discreta: si el nmero de elementos es finito o infinito
contable. Esta variable esta asociada a valores enteros.

EJEMPLO 1
Consideremos el experimento de lanzar una moneda tres veces, cuyo espacio muestral es:
S = {ccc, ccs, csc, scc, sss, ssc, scs, css}

Si definimos la variable aleatoria X: como el # de caras que se obtienen en los tres


lanzamientos, entonces los valores que se asociaran a cada uno de los elementos del
espacio muestral serian: 3, 2, 2, 2, 0, 1, 1, 1, respectivamente. Estos serian los posibles
valores que puede tomar X. Dicha variable es discreta.

Los valores de X = {0, 1, 2, 3} (a este conjunto de valores se les llama rango de la


variable).

29
La Variable Aleatoria X es Continua, si puede tomar un numero infinito de valores
posibles, asociados con uno o ms intervalos de los # reales.

Nota: generalmente los problemas relacionados con variable aleatoria continuas vienen
asociados con su funcin de densidad, tema que trataremos a continuacin.

3.3 FUNCIN DE PROBABILIDAD O DE DENSIDAD

Las variables aleatorias toman cada uno sus diferentes valores con cierta probabilidad.

En el ejemplo anterior:
P(X = 0) = f(0) = 1/8.
P(X = 1) = f(1) = 3/8.
P(X = 2) = f(2) = 3/8.
P(X = 3) = f(3) = 1/8.
Al conjunto de estas probabilidades se les llama:

Funcin de probabilidad (para el caso discreto)


Funcin de densidad (para el caso continuo).
Nota: Para el caso discreto la funcin de probabilidad se puede expresar en la siguiente
tabla (tomaremos el ejemplo anterior):

X 0 1 2 3

F(x) 1/8 3/8 3/8 1/8

Estas funciones deben satisfacer algunas condiciones, que mostraremos en la siguiente


definicin.

DEFINICIN
La funcin f(x) es una funcin de probabilidad (para X discreta) o una funcin de
densidad (para X continua), si:

i) f (x) 0, para toda x


n
ii) a) f (x) 1 ; (X discreta)
i 1

b)
f ( x ) dx = 1; (X continua)

iii) a) P(X = x) = f(x); (X discreta)


b
b) ) P(a<X<b) =
a f ( x ) dx ; (X continua.)

30
Nota: Es importante sealar que: la probabilidad de que una variable continua
tome un valor puntual dentro de cierto intervalo es igual a cero; o sea:
P(X = k) = O, k = constante.

EJEMPLO
Se extraen aleatoriamente y en forma sucesiva dos pelotas de una urna que contiene 4 de
color rojo y 3 de color blanco (todas de igual forma y tamao). Sea X el nmero de
pelotas rojas, encontrar la distribucin de probabilidad asociada a la variable.
Solucin (la variable es discreta)
El espacio muestral es: S = {RR, RB, BR, BB}
Los valores que puede tomar X son: 0, 1, 2 (rango de la variable)
Las probabilidades con que X puede tomar sus diferentes valores son:

f(2) = P(RR) = P( x = 2 ) = (4/7)(3/6) =2/7


f(1) = P(RB o BR) = P( x = 1) = (4/7)(3/6)2 = 4/7
f(0) = P(BB) = P( x = 0 ) = (3/7)(2/6) = 1/7
Las cuales se pueden expresar as:

X 0 1 2
f(x) 2/7 4/7 1/7

EJEMPLO
La funcin de densidad de una V.A. X est dada por:

cos x
si 0 < x < /2
b
x
f (x) = si 2 < x < 3
10
0 si no

Encontrar el valor de b.
Solucin:
Para encontrar el valor de b, usamos la condicin 2), b) (para el caso continuo) de la
definicin anterior:



f ( x ) dx = 1;

2 cos x 3 x
0 b
dx 2 10
dx 1

x2
sen x
2
0 32 1
b 20

31
1 9 4
1,
b 20 20
b = 4/3

DISTRIBUCIN ACUMULADA

Definicin
Sea X una variable aleatoria discreta o contina, la distribucin o funcin acumulada
asociada a esta, la denotaremos con F y se define como:

F (x) = P(X x) = f x i
; (X discreta)
xi X

x
F(x) = P(X x) = f ( x) dx ; (X continua)
Nota: La distribucin acumulada para el caso discreto y continuo es una
funcin definida para todos los reales.

PROPIEDADES DE LA DISTRIBUCION ACUMULADA

i) P(X = n) = F( n ) - F( n - 1) ; n N
ii) P (x a ) = F (a)
iii) P ( a X b) = F (b) - F (a)
iv) P (X b ) = 1 - P (x b ) = 1 - F (b) (complemento)
v) P (X b ) = 1 - P (x b ) (otra presentacin del complemento)

EJEMPLO
Del problema del ejemplo 2, encontrar la distribucin o funcin acumulada asociada a la
variable.

Solucin:
F (x) = P(X x) = f (xi) ; (X discreta)
xi x
Se parte de la funcin de probabilidad:

0, si x < 0
X 0 1 2 1/7, si 0 x < 1
F(x) = 5/7, si 1 x < 2
f(x) 1/7 4/7 2/7 1, si x 2

EJEMPLO
Dada la funcin de densidad de la variable aleatoria X:

32
X2 , si 0< x < 1
f(x) = 1, si 1< x< 5/3
0, en otro valor

Hallar:
a) F(x)
b) P( 1/2 < x < 2 )
Solucin:


x
a) Usamos: F(x) = P(X x) = f ( x ) dx ; (X continua)

x
F(x) = 0dx 0 , si x < 0

0 x 3

F ( x ) 0dx x dx x , si 0 x 1
2

0
3

0 1 x
1 2
F ( x ) 0dx x dx dx x 1 x , si 1 x 5 / 3
2

0 1 3 3

0 1 5/3 x
F( X ) = F ( x ) 0dx x dx dx odx 1
2
1, si x > 5/3.
0 1 5/3

La distribucin acumulada podemos expresarla as:

0, si x<0
x3 / 3, si 0<x<1
F( X ) = x (2/3), si 1 < x < 5/3
1, si x > 5/3

b) Esta probabilidad se puede calcular con la funcin de densidad (f) o con la


acumulada (F), usando lo siguiente:

Con la funcin de densidad:

b
P(a<X<b) =
a f ( x ) dx ; (X continua.)

1 1.2
x dx dx 0.492
2
P(0.5 < x < 1.2) =
1/ 2 1
O con la funcin acumulada, haciendo uso de sus propiedades:

33
P(a<X<b) = F (b) F(a), (para el caso continuo la P(a<X<b) = P(a<X b));
por lo tanto:
P(0.5 < x < 1.2) = F(1.2) F(0.5) = (1.2 2/3) (0.5)3/3 = 0.492

VALOR ESPERADO O ESPERANZA MATEMTICA DE UNA VARIABLE


ALEATORIA

Definicin.
El valor esperado de V.A. X esta dado por:
n
E(x) = = x.f ( x ) ; si x es discreta
i 1

E(x) = = x.f ( x ) dx ; si x es continua

Propiedades de E(x)
1) E (k) = k ; si k es constante
2) E (ax + b) = a E (x) + b ; si a y b es constante
3) E [g(x)] = g(x). f(x) ; si x discreta

4) E[(g(x)] =

g( x )f ( x ) dx ; si x continua

VARIANZA DE UNA VARIABLE ALEATORIA


Definicin.
La varianza de x se define como:

V (x) = 2(x) = E [(x - )2]


Nota: Si se desarrolla el binomio y se aplican propiedades de la esperanza, se obtiene una
expresin equivalente, que suele ser mas sencilla para el calculo de la varianza:
V(x) = E x2 - 2x + 2 (Desarrollando el Binomio)
= E (x2) - 2E (x) + 2 (propiedades de E (x))
= E (x2) - 2 2 + 2 (E (x) = )
V (x) = E (x ) - 2 ; para x Discreta o Continua
2 2

Propiedades de V(x)
1) V(k) = 0 ; si k es constante.
2) V(ax) = a2 V(x)
3) V (ax + b) = a2 V(x)
4) V (g(x) ) = E {[g(x) - g(x) ]2} = [g(x) - g(x)]
2
f (x) (Discreta)

5) V (g(x) ) = E {[g(x) - g(x) ]2} =
(g( x ) g ( x ) ) 2 f ( x ) dx (Continua)

Distribucin de Probabilidad Conjunta para dos variables aleatorias

34
Si X y Y son dos variables aleatorias discretas, la distribucin de probabilidad para sus
ocurrencias simultneas se representa mediante la funcin f(x, y), para cualquier par de
Valores (x, y) dentro del rango de las variables aleatorias X y Y y se le llama Distribucin
de Probabilidad Conjunta de X y Y.

Definicin.

La funcin f(x, y) es una Distribucin de Probabilidad Conjunta o funcin de masa de


probabilidad de las variables aleatorias X y Y, si:
1) f(x, y) 0
2) f(x, y) =1
3) P(X = x, Y = y) = f(x, y)

EJEMPLO
Supngase que se extraen dos bolgrafos, uno tras otro de una caja que contiene tres
buenos y uno defectuoso, las extracciones son sin reemplazo. Sea X el # de bolgrafos
defectuosos en la primera extraccin y Y el # de bolgrafos defectuosos en la segunda
extraccin.
Solucin:
Note que X y Y solo pueden tomar los valores 0 y 1 y los posibles pares de valores (x, y)
son: (0 ,0), (0 ,1), (1 ,0), (1,1).
Podemos calcular:
P(X = 0, Y = 0) = f (0, 0) = (3/4) (2/3) =0.5
P(X = 0, Y = 1) = f (0, 1) = (3/4) (1/3) =0.25
P(X = 1, Y = 0) = f (1, 0) = (1/4) (1) =0.25
P(X = 1, Y = 1) = f (1,1) = 0 (imposible)
Estos resultados se pueden mostrar en la siguiente tabla:

X 0 1 Total fila
Y
0 0.5 0.25 0.75
1 0.25 0 0.25

Total colum 0.75 0.25 1

DEFINICIN
La funcin f(x,y) es una funcin de densidad conjunta de las variables aleatorias
continuas X y Y, si:

i) f ( x , y) 0 ; para toda (x, y)



ii) f (x, y) dx dy 1
iii) P[( x , y) A ] f ( x , y)dxdy ; para cualquier regin A del plano xy
A
EJEMPLO

35
Una vinatera opera en instalaciones para atencin a quien llega en automvil y a quien
llega caminando. En un da seleccionado al azar, sean X y Y, respectivamente, las
proporciones del tiempo que se utiliza en cada instalacin y suponga que la funcin de
densidad conjunta de estas variables aleatorias es:

f(x, y) = 2/3 (x + 2y), 0 x 1, 0 y 1


0 , en otra parte

a) verificar la condicin ii) de la definicin


b) encuentre P[(x, y) A], donde A = {(x, y)| 0<x<0.5, 0.2<y<0.5}
Solucin:
a) La regin que esta definida por f(x,y) = 2/3 (x + 2y), es el cuadrado: 0 x 1, 0
y 1 y es cero en cualquier otra parte de plano, entonces:

2
1 12 2 1 x
0 0 3
f ( x , y ) dx dy 2 xy ) | 10 dy
( x 2 y ) dx dy
(
3 0 2
2 1 1 2 1 2 1
( 2 y ) dx ( y y 2 ) |10 ( 1)
3 0 2 3 2 3 2
= 2/3 (3/2)
=1

b) P [(x, y) A] = P (0 < x < 1/2, 1/5 < y < 1/2)


2 1/ 2 1/ 2
3 1 / 5 0
( x 2y ) dx dy
2
= ( x 2xy ) |10/ 2 dy
2 0 .5
3 0 .2 2
2 0.5 1
3 0.2 8
= ( y ) |10/ 2 dy
2
= 2/3 (
y

y )| 1/ 2
1/ 5
8 2
= 2 / 3 [1/16 + 1/8 1/40 1/50]
= 0.095

DISTRIBUCIONES MARGINALES

DEFINICIN

Las Distribuciones Marginales de X sola y Y sola estn dadas por:

g(x) = f ( x , y) y h(y) = f ( x, y) (Discreta)


y x

36

g(x) = f ( x, y) dy ; h ( y) f (x, y) dx (Continua)

Nota: para el caso discreto, los totales por columna (en la tabla de probabilidades
conjuntas) son las distribuciones o probabilidades marginales para X y los totales por fila
las de Y.

EJEMPLO
Para el ejemplo # 6 (de los bolgrafos) las distribuciones marginales son:
Para X: (la cual representa la funcin de probabilidad de la variable X)

X 0 1
g(x) 0.75 0.25

Para Y: (tambin representa la funcin de probabilidad de la variable Y)

y 0 1
h(Y) 0.75 0.25

EJEMPLO 9

Para el ejemplo de la vinatera (caso continuo): las distribuciones marginales son:

Para X:
1
g( x ) f ( x, y )dy 0 2 / 3 (x 2y ) dy 2 / 3 ( xy y 2 ) | 10

2
= (x + 1); para 0 x 1.
3

La cual se podra expresar como la funcin de densidad de X, as:


2
( x 1) , si 0 x 1
3
g(x) =
0 , para los dems valores.

Para Y:
1
h( y ) f ( x, y )dx 2 / 3 ( x 2y ) dx 2 / 3 ( x 2 / 2 2xy) |01
0

= 2/3(0.5 + 2y), para 0 y 1


De igual forma se puede expresar como la funcin de densidad de la variable aleatoria Y:

2/3(1/2 + 2y), si 0 y 1
h(y) =
0 , para los dems valores.

37
3.9 DISTRIBUCIONES CONDICIONALES

DEFINICIN
Sean X y Y dos variables aleatorias (discretas o continuas), La Distribucin condicional
de la variable aleatoria Y, dado que X = x es:
f ( x , y)
f(y | x) = ; g(x) > 0
g( x )
La Distribucin condicional de la variable aleatoria X, dado que Y = y es:
f ( x , y)
f(x | y ) = ; h(y) > 0
h ( y)

Ejemplo 10
En el ejemplo de los bolgrafos, hallar la distribucin condicional de Y, dado X = 1.
Solucin:
Hallamos g(1) = 0.25 (2da columna de al tabla)

f (1, y) f (1, y)
f(y|1) = 4 f (1, y)
g(1) 0.25
f (0 | 1) = 4 f (1, 0) = 4 (0.25) = 1

f (1 | 1) = 4f (1, 1) = 4 (0) = 0

y 0 1

f ( y | 1) 1 0

Nota: P (Y = 1 | x = 1) = 0 (Se interpreta as: si se sabe que en la 1era extraccin el


bolgrafo es defectuoso, la probabilidad que lo sea en la 2 da extraccin es cero o
imposible).

INDEPENDENCIA ESTADSTICA

DEFINICIN

Sean X y Y dos V.A, discretas o continuas, con distribucin de probabilidad conjunta


f(x,y) y distribuciones marginales g(x) y h(y), respectivamente. Se dice que las V.A X y Y
son Estadsticamente Independientes si y solo si:

f(x,y) = g(x) h(y); para toda (x,y) dentro de sus rangos.


EJEMPLO
Se puede demostrar que las V.A del ejemplo de los bolgrafos no son independientes, ya
que:

f(0, 0) = 0.5 y g(0) = 0.75, h(0) = 0.75


f(0, 0) g(0) . h(0)

38
EJEMPLO
La fraccin x de atletas varones y la fraccin y de atletas mujeres que compiten en una
jornada deportiva se describen mediante la funcin de densidad conjunta:

8xy; 0 y x 1
f(x,y) , encuentre: xy
0 ; otrocaso
Solucin:
Calculamos las marginales:
x
g( x ) 0
f ( x, y)dy 8xy dy 4x y 2 | 0 x 4x 3 ; 0 x 1
1
= f ( x , y) dx 8xy dx 4 x y | y 4 y 4 y ; 0 y 1
2 1 3
h(y)
y

Luego:

1 1
xy f ( x , y) dx dy 0 y 8x
2 2
E (xy) = y dx dy

1 x
0 0 8x
2 2
= y dy dx

1 y3 x 18 8 6 1 4
= 8x dx 0 3 x dx
2 5
0
|
3 0 18
x |0 =
9
1 4
x = E (x) = xg(x) dx 4x 4dx
0 5
1 4 3 4 5 1
y h ( y) dy 0 y y |0
2 4
y = E (Y) = ( 4 y 4 y ) = 8/15
3 5
4 4 8 4
xy = .
9 5 15 225

EJERCICIOS RESUELTOS

1) Se sabe que un grupo de 4 componentes contiene dos defectuosos, un inspector


prueba los componente uno a uno. Hasta encontrar los 2 defectuosos, una vez encontrado
el 2do defectuoso concluye las pruebas, si X es el nmero de pruebas necesarias hasta
encontrar el segundo defectuoso:
a) Encuentre la distribucin de probabilidad
b) Encuentre la funcin acumulada

39
c) Si el costo de prueba de un componente es de dos y el costo de
reparacin de un defectuoso es cuatro. Encuentre el costo total esperado
Solucin
Sea x: nmero de pruebas necesarias hasta hallar el 2do defectuoso
S = { DD, BDD, DBD, BBDD, DBBD, BDBD}
2 1 1
a) p (x = 2) = p (DD) = . X 2 3 4
4 3 6
f(x) 1/6 1/3 1/2
2 2 1
p (x = 3) = 2p (BDD) = 2 . . 1
4 3 2 3
2 1 2 1
p (x = 4) = 3p (BBDD) = 3 . . .1
4 3 2 2
0; si x < 2
b) 1/6; si 2 x < 3
F(x) = 1/2; si 3 x < 4
1 ; si x 4

c) C = 2x + 8 E (C) = 2E (x) + 8 = 2 [ 2 (1/6) + 3 (1/3) + 4 (1/2) ] + 8


= 44/3 = 14.67
2) Al examinar pozos de agua en un distrito con respecto a dos impurezas encontradas
frecuentemente en el agua potable, se encontr que el 20% de los pozos no revelaban
impurezas alguna, el 40% tenia impureza A, y el 50% impureza B (naturalmente,
algunos tenan ambas impurezas). Si se escoge un pozo del distrito al azar, y si X es el
nmero de impurezas encontradas en el pozo.
Encuentre:
a) F (x)
b) P (1 x 2)
c) E (x),
d) V (x)
Solucin:
Si el 20% no tiene impureza, entonces el 80% tiene impureza
p(AB) = p (A) + p (B) - p (AB)
80 = 40 + 50 - p (AB)
p (AB) = 10% (ambas impurezas)

S B A

0.3
0.1 0.4

0.2

x 0 1 2
f(x) 0.2 0.7 0.1

40
a)
0, si x < 0
0.2, si 0 x1
F (x) = 0.9, si 1 x<2
1, si x 2

b) P (1 x 2) = F (2) - F (0) = 1 - 0.2 = 0.8


c) E (x) = 0.(0.2) + 1 (0.7) + 2 (0.1) = 0.9
E (x2) = 02 (0.2) + 12 (0.7) + 22 (0.1) = 1.1
d) V (x) = E (x2) - 2
V (x) = 1.1 - (0.9)2 = 0.29

4. Considere un sistema de agua que fluye a travs de unas vlvulas de A a B como lo


muestra la figura. Las vlvulas 1, 2 y 3 funcionan independientemente y cada una se
abre correctamente como una probabilidad de 0.8. Si y es el nmero de vas abiertas
desde A a B encontrar:
a) la distribucin de probabilidad,
b) el valor esperado,
c) funcin acumulada,
d) varianza.
3

A B

1 2
Solucin:
Los valores que puede tomar la variable son: Y = { 0, 1, 2 }
Sean: Vi la vlvula i funciona correctamente. p (Vi) = 0.8 , p (Vi') = 0.2, entonces:
P (y = 0) = p (V'' V '2 V'3) + p (V'' V2 V'3) + p ( V'' V'2 V3)
(0.2)3 + (0.2)(0.8)(0.2) + (0.2)(0.2)(0.8) = 0.072
p (y = 1) = p (V' V'2 V'3) +p (V' V 2 V3) + p (V1 V2 V3) + p (V'' V2 V3)
0.8 (0.2)2 + (0.8)2 (0.2) + (0.8)2 (0.2) + (0.2) (0.8)2 = 0.416
p (y = 2) = p (V' V2 V3) = (0.8)3 = 0.512
a) La distribucin de probabilidad es:

y 0 1 2
f(x) 0.072 0.416 0.512

b) Valor esperado
E (y) = 0 (0.072) + 1 (0.416) + 2 (0.512)
E (y) = 1.44 ~ 1 (en promedio se espera que estn abiertas, aproximadamente,
una de las vas)
c) 0 si y < 0
0.072 si 0 y < 1
F (y) = 0.488 si 1 y < 2
1 si y 2

41
d) V (y) = E (y2) - 2
E (y2) = 02 (0.072) + 12 (0.416) + 22 (0.512) = 2.464, entonces:
V (y) = 2.464 - (1.44)2 = 0.3904

5) En un juego de azar se le paga a una persona C$5 si al tirar al aire 3 monedas


obtiene puras caras o puros soles, mientras que esta persona deber pagar
C$ 3 crdobas si obtiene una o dos caras:
a) cul es la ganancia esperada del jugador?
b) Calcule el valor esperado de la funcin: g (x) = 2x 2 + 3x - 6
Solucin:
a) S {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS}
La funcin de probabilidad es:

X 5 -3 gana (C$5)
Pierde (C$ -3)
f(x) 2/8 6/8

Ganancia esperada ser:


2 6
E (x) = 5 * + (-3) * = -1
8 8
Pierde en promedio C$ 1

b) E [ g (x) ] = E [ 2x2 + 3x - 6 ] = 2 E (x2) + 3 E (x) - 6


2 6
Calculemos E (x2) = 52 * + (-3)2 * = 13
8 8
Sustituyendo E (x) y E(x2) , E [g(x)] = 2( (13) + 3 (-1) - 6 = 17

11. Supongamos que cada estudiante de la carrera de ingenieria en sistemas fue


clasificado de acuerdo a los cursos de matematica (matematica 1, matematica
2 y matematica 3) y de acuerdo con el numero de veces que visitaron la
biblioteca (nunca, una vez o mas de una vez). Las proporciones se muestran
en la sigiente tabla:

Visita a Biblioteca
Cursos de Matematica nunca Una vez Mas de una vez g(y)
Matematica 1 0.07 0.13 0.18 0.38
Matematica 2 0.06 0.12 0.16 0.34
Matematica 3 0.08 0.10 0.10 0.28

Sean: X: Cursos de matematica = {mat 1 = 1, mat 2 = 2, mat 3 = 3}


Y: Visita a biblioteca = {nunca = 0, una vez = 1, mas de una vez = 2}
a) Determinar cada una de las probabilidades siguientes:
P(X = 2), P(Y 1), P(X 2, Y 1), P(X > Y).
b) Las distribuciones marginales.

42
c) Vericar si son o no independientes.
d) Valor esperado de g(x,y) = x +y.
e) Encontrar la distribucion de probabilidad condicional: f(y | x = 2).
f) Si un estudiante seleccionado al azar esta en matematica 2, cual es la
probabilidad que haya visitado una vez la biblioteca?
Solucion:
a) P(X = 2) = f(2,0) + f(2,1) + f(2,2)
= 0.06 + 0.12 + 0.16 = 0.34.
P(Y 1) = f(1,1) +f(2.1) + f(3,1) + f(1,2) +f(2,2) + f(3,2)
= 0.13 + 0.12 + 0.10 + 0.18 + 0.16 + 0.10 = 0.79.
P(X 2, Y 1) = f(1,1) +f(2.1) + f(1,2) +f(2,2)
= 0.13+0.12+ 0.18+0.16 = 0.59.
P(X > Y) = f(1,0) + f(2,0) +f(2,1) + f(3,0) + f(3,1) + f(3,2)
= 0.07 + 0.06 +0.12 + 0.18 + 016 + 0.10 = 0.69.

b)
Visita a Biblioteca (Y)
Cursos de Matematica(X) 0 1 2 g(y)
1 0.07 0.13 0.18 0.38
2 0.06 0.12 0.16 0.34
3 0.08 0.10 0.10 0.28
f(x) 0.21 0.35 0.44 1

Las sumas por filas son las marginales para los cursos de matematica.
Las sumas por columnas son las marginales para las visitas a bibioteca.

x 1 2 3 y 0 1 2
f(x) 0.38 0.34 0.28 h(y) 0.21 0.35 0.44

c) Para verificar la independencia usamos: Si f(x,y) = g(x) h(y), para cada par de
Valores, entonces X e Y son independientes.
Veamos: f(1,0) = 0.07 g(1) h(0) = 0.38 (0.21) = 0.0798.
Se concluye que X e Y son dependientes estadisticamente.

d) Valor esperado de g(x,y) = x + y.

g(x,y) = E [g (x, y)] = (x y ) f (x, y )


x y
= 1f(1,0) + 2f(1,1) + 3f(1,2) + 2f(2,0) + 3f(2.1) + 4f(2,2) + 3f(3,0)
+ 4f(3,1) + 5f(3,2)
= 1(0.07) + 2(0.13) + 3(0.18) + 2(0.06) +3(0.12) + 4(0.16)
+ 3(0.08) + 4(0.10) + 5(0.10)
= 3.13.
e) Encontraremos la probabilidad condicional: f(y | x = 2).

f ( 2, y ) f ( 2, y )
f(y|x = 2) = , Y puede tomar los valores: 0, 1, 2.
g( 2) 0.34

43
Entonces, la distribucin condicional es:

f(y = 0 | x = 2) = f(2,0)/0.34 = 0.06/0.34 = 0.17647.


f(y = 1 | x = 2) = f(2,1)/0.34 = 0.12/0.34 = 0.35294
f(y = 2 | x = 2) = f(2,2)/0.34 = 0.16/0.34 = 0.47059

Se puede expresar en la tabla:

Y 0 1 2
f(y | x = 2) 0.17647 0.35294 0.47059

a) Si un estudiante seleccionado al azar esta en matematica 2, cual es la probabilidad


que haya visitado una vez la biblioteca?

f(y = 1 | x = 2) = f(2,1)/0.34 = 0.12/0.34 = 0.35294.

DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

Existen Estudiaremos modelos probabilsticas o distribuciones de probabilidad de variables


aleatorias discretas.

DISTRIBUCIN BINOMIAL

Si la distribucin binomial se aplica al muestreo, el muestreo debe realizarse con


reemplazo.

Esta distribucin tiene las siguientes propiedades:

1. El experimento consiste en n intentos repetidos.


2. Los resultados de cada uno de los intentos puede clasificarse como xito o como
fracaso. La probabilidad de xito se denota por: p y la del fracaso por: q. Adems
estas probabilidades son complementarias; o sea: p + q =1.
3. Las probabilidades de xito representadas por p, permanecen constantes para todos
los intentos.
4. Los intentos repetidos son independientes.
5. La v.a. X representa el # de xitos en los n ensayos.

Definicin
Una v.a. X tiene una distribucin Binomial, si y solo si, su distribucin de probabilidad est
dada por:

x
f (x, n, p) = n
x p

1p1x , para X = 0,1,2 ,... ,n.

44
Teorema.

La media y la varianza de la distribucin binomial estn dadas por:

= n p, 2 = n p (1-p)

Ejemplo 1
Un examen consta de cuatro preguntas de seleccin mltiple con tres alternativas donde
solo una es la correcta, si X es el nmero de respuestas correctas, cuando el estudiante
esta adivinando. Encontrar la funcin de probabilidades asociada a la variable.
Solucin

El estudiante en cada pregunta tiene dos posibilidades: responder correctamente


o incorrectamente. Como tiene que responder cuatro de manera independiente
P(responda correctamente) = 1/3 = p
P(responda incorrectamente) = 2/3 = q

Utilizando la distribucin binomial:


n = 4,
los valores que puede tomar la variable son: x = {0, 1, 2, 3, 4}
Las probabilidades con que la variable toma sus distintos valores sern:
P (x = 0, n = 4, p =1/3) = 4C0 ( 1/3 )0 ( 2/3 )4 = 16/81
P (x = 1, n = 4, p =1/3) = 4C1 ( 1/3 )1 ( 2/3 )3 = 32/81
P (x = 2, n = 4, p =1/3) = 4C2 (1/3 ) 2 ( 2/3 )2 = 24/81
p (x = 3, n = 4, p =1/3) = 4C3 ( 1/3 )3 ( 2/3 )1 = 8/81
P (x = 4, n = 4, p = 1/3) = 4C4 ( 1/3 )4 ( 2/3 )0 = 1/81
La funcin de probabilidad se puede expresar en la siguiente tabla:

X 0 1 2 3 4

f(x) 16/81 32/81 24/81 8/81 1/81

Ejemplo 2

Un distribuidor de semillas ha determinado a partir de numerosos ensayos que el 5% de


un grupo grande de semillas no germina. Si dicho distribuidor vende las semillas en
paquetes de 20 y garantiza que el 90% germina. Cul es la probabilidad de que:

a) Exactamente 15 semillas germinen?


b) A lo sumo 4 semillas no germinen?
c) Ms de 7 pero menos de 17 semillas germinen?
d) Un paquete no cumpla la garanta?
e) Germinen entre 2 y 17 semillas inclusive?

Solucin:
P(una semilla germine) = 0.95 = p

45
P(una semilla no germine) = 0.05 = q
a) Aqu se pregunta: Cul es la probabilidad que 15 de 20 semillas
Germinen?
Es lo mismo decir:
Cul es la probabilidad que 5 de 20 semillas no
Germinen?
Porque: Si 15 de 20 germinan, 5 no lo hacen. (Por complemento)

Entonces como la probabilidad p = 0.95, no esta en la tabla se usa equivalencia:

P ( x = 15, n = 20, p = 0.95, ) P ( x = 5 , n = 20, p = 0.05 )


= F ( 5 ) - F ( 4 ) (hacienda uso de propiedad)
= 0.9997 - 0.9974
= 0.0023.

b) Para esta pregunta se toma q como la probabilidad de xito, entonces:

P ( x 4, n = 20, q = 0.05) = F ( 4 ) (hacienda uso de propiedad)


= 0.9974

c) Aqu tendremos que hacer uso de equivalencia para poder dar respuesta a la
pregunta.

P ( 7 < x < 17, n = 20, p = 0.95 ) P ( 3 < x < 13, n = 20, q = 0.05)
= F ( 12 ) - F ( 3 ) [hacienda uso de
propiedad: P ( a X b) = F (b) - F (a)]
= 1 - 0.9841 = 0.0159.
Observemos la lgica:
En el intervalo de:
7 < x < 17, se afirma que 8 de 20 semillas germinan, en el intervalo equivalente:
3 < x < 13, deber aparecer que: 12 de 20 semillas no lo hagan.
Lo cual es correcto.
Tambin:
En el intervalo:
7 < x < 17, se afirma que 16 de 20 semillas germinan, en el intervalo equivalente:
3 < x < 13, deber aparecer que: 4 de 20 semillas no lo hagan.
Lo cual tambin es correcto.

De igual forma ocurre con todos los valores que toma la variable X en la probabilidad del
xito con la equivalencia en el fracaso.

d) Garanta: 90% germina 20 ( 0.9 ) = 18


10% no germina 20 ( 0.1 ) = 2

No se cumplira la garanta si: ms de 2 semillas no germinan; es lo mismo decir: que


menos de 18 germinen. Por lo tanto, podemos resolver con la probabilidad que no
germine:

46
P ( x > 2, n = 20, q = 0.05 ) = 1 - P ( x 2 )
= 1 - F (2)
= 1 - 0.9245 = 0.0755

e) P ( 2 x 17, 20, 0.95 ) P ( 3 x 18, 20, 0.05 )


= F ( 18 ) - F ( 2 )
= 1 - 0.9245 = 0.0755

Ejemplo 3

Una empresa vende cuatro artculos seleccionados al azar entre un lote grande del cual se
sabe que tiene el 10% de piezas defectuosas. Sea X es el nmero de piezas defectuosas,
de entre los cuatro que se vendieron. El comprador del artculo regresa las piezas
defectuosas para su reparacin y el costo de reparacin es:
C = 3x2+x +2, calcule el costo de reparacin esperado.

Solucion:
Binomial con:
n=4 E [ C ] = E [ 3x2 + x + 2 ]
p = 0.1 = 3 E (x2) + E (x) + 2 [v (x) = E (x 2) - 2 ]
2
q = 0.9 = 3 [v ( x ) + ] + + 2 [E (x2) = v (x) + 2]
=n p = 3 [ n p q + ( n . p )2 ] + n p + 2
2
=n pq = 3 [ 4 ( 0.1 ) ( 0.9 ) + (1 * 0.1) 2 ] + 4 * 0.1 + 2

= 3.96 promedio del costo de reparacin

DISTRIBUCIN BINOMIAL NEGATIVA

En lugar de encontrar la probabilidad de x xitos en n ensayos, se est interesado en la


probabilidad de que: el k-simo xito ocurra en el x-simo ensayo.

Este modelo presenta las siguientes caractersticas:


1. Se realizan ensayos independientes hasta obtener k xitos
2. La v.a. X cuenta el nmero de ensayos necesarios para conseguir los k xitos.

Definicin.
Una v. a. X tiene una distribucin binomial negativa, si y solo si su Distribucin de
probabilidad esta dada por:

P(x)= x 1
k 1 p q
k x-k
x = k, k + 1, k + 2 ......

Teorema
k kq
E (x) = ; V (x) =
p p2

47
Ejemplo 1
Si la probabilidad es de 0.75 que una persona crea un rumor acerca de cierto poltico.
Determine la probabilidad de que:
a) La 8va persona en or el rumor sea la quinta en creerlo
b) La 15 va persona en or el rumor sea la dcima en creerlo

Solucion:
a) P = 0.75
q = 0.25
x=8
k=5 0.75
8 1
5 1
5
0.25 3 = 0.1298

b) x = 15 0.75
15 1
10 1
10
0.25 5 = 0.1101
k = 10

Ejemplo 2
Un gran lote de bombas usadas contiene un 20% de llas que no sirven y necesitan
reparacin. Se manda a un mecnico con tres juegos de reparacin. Selecciona bombas
al azar y las prueba una tras otra. Si trabaja una bomba, prosigue con la siguiente. Si no
trabaja, le instala uno de sus juegos de reparacin. Supngase que tarda 10 minutos en
probar si una bomba trabaja o no, y 30 minutos en probar y reparar una bomba que no
trabaja. Cual es el valor esperado y desviacin estndar del tiempo total que llevar
terminar con sus tres juegos de reparacin.
Solucin:
Sea X: el nmero de bombas que prueba hasta que se encuentra la tercera
defectuosa
P(defectuosa) = 0.2.
El xito del mecnico es hallar las bombas defectuosas. El desea que la X bomba
que prueba sea la tercera defectuosa. Binomial negativa, K = 3.

El tiempo total que tarda con los tres juegos de reparaciones es:

T = 10 ( x - 3 ) + 3 ( 30 )
T = 10x - 30 + 90
T = 10x + 60
E [ T ] = E [ 10x + 60 ] = 10 E (x) + 60 (E(x) = k/p, binomial negativa)
3
= 10 + 60 = 150 + 60 = 210 min. (En promedio, el tiempo total que
0 .2
le llevara terminar con sus tres juegos de reparacin es de 210 minutos)
3 0.8
V ( T ) = V ( 10x + 60 ) = 102 V (x) = 100 2
= 100 (60) = 6000
0.2

48
As: el tiempo total para instalar los juegos de reparacin es en promedio de 210
minutos con una desviacin estndar de 6000 = 77.46 minutos.

DISTRIBUCIN HIPERGEOMTRICA

Esta distribucin no requiere independencia y se basa en el muestreo llevado a cabo sin


reemplazo.
La distribucin hipergeomtrica posee las siguientes propiedades:

1. Una muestra de tamao n se selecciona sin reemplazo de un total de N


resultados.
2. k resultados del total N pueden clasificarse como xitos y N-k como fracasos.
3. La v.a. cuenta el nmero de xitos obtenidos de los k posibles resultados considerados
xitos.

Definicin.

Una v. a. tiene distribucin hipergeomtrica si y solo si su distribucin de probabilidad est


dada por:

k
x
NK
nx


P(x)= ; x = 0, 1....... n
N
n

Teorema.
La media y la varianza de la distribucin hipergeomtrica son:

nk n . k N K N n
E (x) = , V (x) =
N N 2 N 1

Aproximacin de Hipergeomtrica a Binomial

Cuando N es muy grande resulta complicado resolver las combinaciones, en este caso es
conveniente resolver los problemas de hipergeomtrica a travs de aproximacin a la
binomial haciendo:
K
P
N
Ejemplo 1
Entre 120 aspirantes para ocupar un empleo solo 80 estn calificados para hacerlo. Si se
selecciona a cinco de estos aspirantes para una entrevista determine la probabilidad de
que:
a) Solamente dos estn calificados para el trabajo

49
b) Ms de uno este calificado para el trabajo
c) Cual es el valor esperado de aspirantes calificado para el trabajo
Solucin:

80
2
120 80
52


N = 120 a) P ( x = 2 ) = = 0.164
120
5

K = 80 b) P ( x > 1 ) = 1 - P ( x 1 )
n=5 =1-[P(0)+ P(1)]


80
0
40
5
80
1
40
4
=1-


120
5

= 1 - 0.0418 = 0.958

5 * 80
c) E ( x ) = = 3.33 3
120
Se esperan aproximadamente en promedio a 3 aspirantes calificados par el trabajo, de
los cinco seleccionados.

Ejemplo 2
Un ingeniero de control de calidad inspecciona una muestra tomada al azar de dos
calculadoras porttil de cada lote de 18 unidades que llega y acepta el lote si ambas
estn en buenas condiciones, en caso contrario, se inspecciona todo el lote y el lote se
carga al distribuidor. Cuales son las probabilidades de que este lote sea aceptado sin
mayor inspeccin si contiene:
a) Cuatro calculadoras en mal estado
b) Ocho calculadoras en mal estado
c) Doce calculadoras en mal estado.
Solucin:
a) k = 4
= 0.5947
4
0
14
2

N = 18 P(x=0)=
18
2
n=2 b) k = 8
= 0.2941
8
0
10
2

x=0 P(x=0)=
18
2
c) k = 12

50

12
0
6
2

P(x=0)= = 0.098
18
2

Ejemplo 3
Una compaa recibe un lote de 1000 unidades, para aceptarlo selecciona 10
unidades de manera aleatoria y se inspeccionan. Si ninguna se encuentra defectuosa
el lote se acepta de otro modo se rechaza. Si el lote contiene un 5% de unidades
defectuosas determine la probabilidad de rechazar el lote.
Solucin: N = 1000, x 1, k = 50, n = 10
= 1 - 0.5973
50
0
950
10


P(x1)=1-P(x<1)=1-P(0) = 1-
1000
10
= 0.4027
(Probabilidad de Rechazar el lote)

Podemos resolver el ejercicio por aproximacin a Binomial

50
P= = 0.05 P ( x 1, n = 10, p = 0.05 ) = 1 - P ( x < 1 )
1000
=1-F(0)
= 1 - 0.5987 = 0.4013

DISTRIBUCIN DE POISSON

Un experimento de Poisson tiene las siguientes caractersticas:

1. El nmero de resultados que ocurren en un intervalo de tiempo o regin especficos


es independiente del nmero que ocurre en cualquier otro intervalo disjunto de tiempo
o regin del espacio disjunto.
2. La probabilidad de que un resultado sencillo ocurra en un intervalo de tiempo muy
corto o en una regin pequea es proporcional a la longitud del intervalo de tiempo o
al tamao de la regin y no depende del #de resultados que ocurren fuera de este
intervalo o regin.
3. La v.a. representa el nmero eventos independientes que ocurren a una rapidez
constante sobre el tiempo o el espacio.

Definicin.

Una v.a. tiene una distribucin de poisson, si y solo si la distribucin de probabilidad est
dada por:

e t t x
P(x)= ; x = 0, 1, 2, ...... :
x!
Donde : es el nmero promedio de resultados por unidad de tiempo o regin.

51
Teorema.

La media y la varianza de la distribucin de Poisson estn dadas por:

E ( x ) = t, v ( x ) = t.

APROXIMACIN DE BINOMIAL A POISSON

Cuando n y P 0. Entonces se puede aproximar de la distribucin


binomial a la de poisson, haciendo:
= = n. p

e x n . p n . p x
binomial = n . p P(x)=
e
x! x!
poisson =

Nota: Los problemas de poisson se pueden resolver haciendo uso de tabla, de igual
forma que los de Binomial, se utilizan las propiedades de la distribucin acumulada.

Ejemplo 1.

Una pizarra telefnica recibe 360 llamadas en una hora, pero no puede recibir ms de 7
llamadas en un minuto. Calcular la probabilidad de que:

a) Se produzcan 10 llamadas en 2 minutos


b) La pizarra quede saturada en 1 minuto
c) Se produzcan ms de 2, pero de menos de 10 llamadas en un minuto
d) Se produzcan ms de 15 llamadas en 3 minutos
e) La pizarra quede sobresaturada en 3 minutos.

Solucin

h = 360 (llamadas en una hora)


m = 6 (llamadas en un minuto, usando caracterstica 2, proporcionalidad)

e 6*2 1210
P ( x = 10, = 6, t = 2 ) = = 0.1048.
10!
Resolveremos la pregunta haciendo uso de la tabla, en este caso t = 12.

P ( x = 10, = 6, t = 2 ) = F ( 10 ) - F ( 9 )
= 0.3472 - 0.2424
= 0.1048
b) La pizarra queda saturada, si recibe 7 llamadas en un minuto, entonces:

52
e 6*1 6 7
P (x = 7, = 6, t = 1) = = 0.1377. (Saturada en un minuto)
7!

Con la tabla: t = 6
P (x = 7, = 6, t = 1) = F ( 7 ) - F ( 6 )
= 0.7440 - 0.6063
= 0.1377. (Saturada en un minuto)
9 6 x
e 6
( )
c) P ( 2 < x < 10, = 6, t = 1) = (Para satisfaccin, es importante
x3 x!
= 0.8541. realizar esta suma)

Con la tabla: t = 6.

=F(9)-F(2)
= 0.9161 - 0.0620 = 0.8541

d) P ( x > 15, = 6, t =3 ) = 1 - P ( x 15, 18 )


15 18 x
e
(18 )
=1- = 0.7133.
x 0 x!
Con la tabla: t = 18.

P ( x > 15, = 6, t =3 ) = 1 - 0.2867 = 0.7133.

e) Esta ultima la haremos directamente con la tabla: t = 18.


P ( x > 21, = 6, t = 3 ) = 1 - P ( x 21, 18 )

= 1 - 0.7991 = 0.2009

Ejemplo 2.

Un fabricante de alimento utiliza un extrusor (mquina que produce alimentos) que


produce una ganancia igual a $200 por hora cuando trabaja. Sin embargo, el extrusor
se descompone en promedio dos veces cada diez horas de funcionamiento. Si Y
representa el nmero de descomposturas durante el tiempo de funcionamiento, la
ganancia generada por la mquina esta dada por R=200t-50y2 en la cual t representa
las horas de funcionamiento. El extrusor se detiene para mantenimiento de rutina a
intervalos regulares, y trabaja como mquina nueva despus de ese mantenimiento.
Calcular el intervalo ptimo de mantenimiento t 0 para que sea mxima la ganancia
esperada entre paros.
Solucin:

E [R] = E [200t - 50 y2]


= 200t - 50 E (y2);
= 200t - 50 [V (y) + 2]; V (y) = E (y2) - 2, despejando:
E (y2) = V (y) - 2 .

53
= 2 (para 10 horas)
= 2/ 10 (para 1 hora)
= t = (1 /5) t (para t horas)
v ( y ) = t = (1 /5) t.
Sustituyendo en la expresin anterior:

1 1 2
= 200t - 50
5 t t = 200t - 10t - 2t2 = 190t - 2t2.
25
Derivando respecto a t0 e igualando a cero:

E R

t0
= 190 - 4t = 0

- 4t0 = - 190 t0 = 47.5 horas.

para este tiempo obtenemos la ganancia mxima esperada.

Ejemplo 3.
La probabilidad de que una persona muera por una infeccin respiratoria es de 0.002.
Encuentre la probabilidad que mueran:

a) Menos de 5 de las prximas 2000 personas


b) Ms de 3 de las prximas 1600 personas
c) Entre 7 y 15 inclusive de las prximas 6000 personas.

Solucin:

Este es un problema de una variable con distribucin Binomial. Observemos que la tabla
no resuelve porque el tamao de n es muy grande. Podramos hacerlo con la frmula de la
funcin de probabilidad, sin embargo sera muy tedioso estar realizando estas sumas.
Entonces usaremos la aproximacin a Poison. En las aproximaciones las unidades de
t son iguales a 1, por lo tanto: t = .

a) n = 2000 P ( x < 5, = 4 ) = F ( 4 )
p = 0.002 = 0.6288
= n * p = 200 (0.002) = 4

b) n = 1600 P ( x > 3, 3.2 ) = 1 - P ( x 3 )


P = 0.002 =1-F(3)
= 1600 (0.002) = 3.2 = 1 - 0.6025
= 0.3975

c) n = 6000 P ( 7 x 15, 12 ) = F ( 15 ) - F ( 6 )
P = 0.002 = 0.8444 - 0.0458 = 0.7986
= 6000 (0.002) = 12

54
DISTRIBUCIONES DE PROBABILIDAD CONTINUAS

INTRODUCCIN

En este capitulo estudiaremos la distribucin normal, la cual es una de las mas


importantes de variable continua. Tambin estudiaremos la normal estndar, que es un
caso particular de la anterior y de mucha utilidad en el clculo de probabilidades.
Adems estudiaremos las distribuciones Ji cuadrado y t de studet. Al final veremos el
teorema de Chevyshev.

5.3. DISTRIBUCIN NORMAL

La distribucin de probabilidad continua ms importante en el campo de la estadstica es


la distribucin normal, su grfica, llamada curva normal, es una curva en forma de
campana. Curva Normal

Definicin.

La funcin de densidad de la v.a. normal X con media y Varianza 2, es:


1 x
1 ( )2
P (x) = e 2 ; -<x<
2
Propiedades.
1. La media se encuentra al centro del eje horizontal donde la curva tiene la mxima
altura.
2. La curva es simtrica con respecto al eje vertical que pasa por la media. O sea: e
50% de los datos se encuentran a la izquierda de la media y el otro tanto a la derecha.
3. La curva se aproxima en forma asinttica al eje horizontal, a medida que avanza en
uno u en otro sentido a partir de la media.
4. El rea total bajo la curva y por encima del eje horizontal es igual a uno.

5.

3 2 + + 2 + 3
68.26%
95.46%
99.74%

55
Lo que expresa esta ltima propiedad es lo siguiente:

- A una desviacin estndar, alrededor de la media se concentra el 68.26% de


los datos.
- A dos desviaciones estndar alrededor de la media se concentra el 95.46% de
los datos.
- A tres desviaciones estndar alrededor de la media se concentra el 99.74% de
los datos.
- De aqu podemos deducir que: si una desviacin estndar es pequea,
para un conjunto de observaciones, estos datos se encontraran
localizadas cerca de la media y viceversa.

DISTRIBUCIN NORMAL ESTNDAR


Definicin.

La distribucin normal con media = 0 y 2 = 1, se llama:


Distribucin normal estndar.
Notas: - Las distribuciones normales con media: y varianza: 2, se pueden
denotar as: N (, 2).
- La normal estndar ser: N (0, 1).
- Si se tiene una distribucin normal cualquiera, se puede estandarizar
haciendo la transformacin:
x
Z= . Los valores de Z los redondearemos a dos decimales.

Ejemplo.
Dada la distribucin normal: N(18, 16), estandarizar los valores, X = 13, 23 y 26
Solucin:
13 18
Para X = 13. Z = = -1.25.
4
23 18
Para X = 23. Z = = 1.25.
4
26 18
Para X = 26. Z = = 2.00.
4

5.3.2. Calculo de probabilidades haciendo uso de la tabla N (0,1)


(rea bajo la curva)
Area a la izquierda de x. Se estandariza el valor de x y luego se busca en la tabla el valor
de la funcin (z), donde: z es el valor estndar de x y la
p(X < x) = (z).
Area a la derecha de x. Se estandariza el valor de x y luego se busca en la tabla
el valor de la funcin (z), donde: z es el valor estndar de x y la:
p(X > x ) = 1- (z).
Area comprendida entre dos valores x1 y x2 , donde x1< X < x2. Se standarizan
los valores de x1 y x2 y luego se busca en la tabla el valor de la funciones:
(z1) y (z2), donde: z1 es el valor estndar de x1 y z2 es el valor estndar
de x2 y la: p(x1< X < x2) = (z2) - (z1).

56
Ejemplos

- Supngase que el dimetro externo de cierto tipo de pieza (Balinera) se encuentre


distribuido de manera normal con media de 3.5 cm. y varianza de 0.0004 cm 2, si el
dimetro de estos piezas no debe ser menor a 3.47 cm., ni mayor a 3.53 cm.:
a) Cual es la probabilidad que el dimetro sea menor a 3.48 cm?
b) Cual es la probabilidad que el dimetro sea mayor a 3.51 cm?
c) Cual es el porcentaje de estas piezas que deben desecharse?
d) Bajo que valor se obtiene el 60% de las piezas con menor dimetro?

Solucin:
= 3.5, 2 = 0.0004, = 0.02
a)

P(x < 3.48) = (z), estandarizando x = 3.48.


3.48 3.5
=
0.02
= (-1.00), se busca en la tabla
= 0.1587

b) P (x > 3.5) = 1 - (z)


3.51 3.5
=1-
0.02
= 1 - (0.50)
= 1 0.6915
= 0.3085
c)
P (3.47 < x < 3.53) = (z2) - (z1), estandarizando: x2 = 3.53 y x1 = 3.47.
3.53 3.5 3.47 3.5
=
0.02 0.02
= (1.5) - (-1.5)= 0.9332 - 0.0688 = 0.8664
x
a) Aqu deseamos conocer el valor de x, el cual se despeja de: z = , entonces:

x = +z

En este caso se conoce (z) = 0.6000, entonces necesitamos conocer z.


Se busca en la tabla: (z) = 0.6000, si no esta, buscamos el valor mas prximo a el y con
este valor aproximamos el valor de z, el valor mas prximo a 0.6000 es 0.5987, entonces
el valor aproximado de z = 0.25. Con esta aproximacin obtenemos el valor aproximado
de x.

P (X < x) = (z) = 0.6000 0.5987 z = 0.25


X = + z
X = 3.5 + (0.25) (0.02) = 3.505

57
- Una distribucin normal tiene media de 61.6 determine desviacin estndar si
el 20% del rea total situada bajo la curva se ubica a la derecha de 70.

Solucin:
x x
Despejamos , de z = , entonces: =
z

Necesitamos conocer z, de igual forma que en la ultima pregunta del problema


anterior conocemos: (z) = 0.8. Aproximaremos el valor de z.
x
P (x > 70) = 0.20
z
P (x < 70) = 0.8000
70 61.6
0.8000 0.7995 z = 0.84 = 10.71
0.84

- Un estudiante se traslada diariamente de su casa a la universidad, en promedio el viaje


le toma 24 minutos con una desviacin estndar de 3.8 minutos. Si los tiempos de
traslado se distribuyen de manera normal:
a) Cual es la probabilidad que un traslado le tome al menos media hora
a) Si la universidad inicia clases a las 7:00 a.m y l sale de su casa a las 6:45 a.m
Qu porcentaje de las veces llega tarde a sus clases?.
b) Si deja la casa a las 6:35 a.m y en la Universidad sirven un caf entre las 6:50 a.m
y 7:00 a.m Cul es la probabilidad que se pierda el caf?.
c) Encuentre el periodo arriba del cual se localiza el 15% de los traslados ms lentos.
d) Calcular la probabilidad de que 2 de los siguientes 3 traslados tomarn al menos
media hora.
Solucin:
= 24 min, = 3.8 min
30 24
a) P (x > 30) = 1 - (z) = 1 - = 1 - (1.58) = 1 - 0.9429
3 .8
= 0.0571 probabilidad que un traslado le tome al
menos 1/2 hora

b) Para obtener el % de las veces que llega tarde, se encuentra primero la


probabilidad de las veces que llega tarde, luego esta se multiplica por 100 para
tener el %. El llegara tarde si el traslado dura ms de 15 minutos. Entonces:

P (x > 15) = 1 - (z) = 1 - 15 24


3 .8
= 1 - (-2.37) = 1 - 0.0089
= 0.9911. El 99.11% de las veces llega tarde a clases.

c) El se perdera el caf, si el traslado le toma ms de 25 minutos, entonces:


P (x > 25) = 1 - (z)
25 24
= 1- = 1 - (0.26) = 1 - 0.6026 = 0.3974.
3 . 8

58
Probabilidad que se pierda el caf

d) El 15% de los traslados ms lentos se ubicaran a la derecha de la curva, el periodo


solicitado es el valor de x.

P (X> x) = 0.15 x = + z
P (X < x) = (z) = 0.8500 = 24 + (1.04)(3.8)
0.8500 0.8508 z = 1.04 = 27.952 minutos.

e) Este es una pregunta que se responde con la distribucin Binomial usando la


Probabilidad del inciso (a)

n=3 p (x = 2, n = 3, p = 0.0571) = 3 (0.0571)2 (0.9429)


2
x=2 = 0.0092
p = 0.0571
q = 0.9429
- Supngase que la cantidad de caf por una mquina llenadora en frasco de 6 onzas
sigue una distribucin normal con varianza de 0.0025 onzas. Si solo el 3% de los frascos
van a contener menos de 6 onzas de caf Cul debe ser el contenido medio de stos
frascos.
Solucin:

P (x < 6) = (z) = 0.03


0.0300 0.0301 z = -1.88
2 = 0.0025 = x - z
= 0.05 = 6 - (-1.88)(0.05)
= 6.094
El contenido promedio debe ser de 6.094 onzas

5.3.3. APROXIMACIN DE BINOMIAL A NORMAL

Cuando n es relativamente grande y p es cercano a 0.5, se pueden aproximar los


problemas Binomiales a la Normal.
n
p 0.5
Una posible gua para determinar cundo puede utilizarse aproximacin normal es tener
en cuenta el clculo de n p y n q. Si mbos productos, n p y n q, son mayores o
iguales a 5, la aproximacin ser buena.
Con el siguiente ejemplo mostraremos como aproximar un problema de distribucion
binomial a normal. Recordemos que la distribucion Binomial es de variable discreta y la
Normal de variable continua.

59
Ejemplo

La probabilidad que una computadora posea defecto despues de haber sido ensamblada
es 0.4. Si se sabe que han sido ensambladas 100 computadoras, cul es la prbabilidad de
que:
a) Exactamente 31 tengan defectos?
b) A lo sumo 42 tengan defectos?
c) Al menos 30 tengan defectos?
d) Entre 33 y 46 tengan defectos?
e) Ms de 46 pero menos de 68 no tengan defectos?
Solucin :
Este es un problema de distribucion binomial, La primer pregunta la contestaremos con la
funcion de probabilidad binomial y tambien veremos como aproximar a la Normal, el resto
de preguntas las contestaremos por aproximacion. Note que la probabilidad del xito en
las primeras cuatro preguntas es q.
P(que tenga defecto) = 0.4 = q
P(que no tenga defecto) = 0.6 = p

a) p (X = 31, n = 100, q = 0.4) = 100C31 (0.4)31 (0.6)69 = 0.0151.

Aproximando a la normal debemos considerar lo siguiente:


Cualquier valor continuo entre 30.5 y 31.5 se redondea al inmediato
entero 31 y para estandarizar los valores se calculan la media y la desviacion
estandar con los datos de la distribucion binomial, como mostramos a
continuacin , entonces:
p (X = 31, n = 100, q = 0.4) P(30.5 < x < 31.5)
31.5 40 30.5 40
= n.q = 40 =
4.899 4.899
2 = n.p.q = 24 = (-1.73) - (-1.94)
= 4.899 = 0.0418 - 0.0262 = 0.0156
Como pueden apreciar la aproximacion es bastante buena.

b) Aproximando a la normal debemos considerar lo siguiente: Cualquier valor


continuo entre 42 y 42.5 se redondea al inmediato entero 42, entonces:

42.5 40
p (x 42, n = 100, q = 0.4) p(x 42.5) = = (0.51) = 0.6950
4.899
c) Aproximando a la normal debemos considerar lo siguiente: Cualquier valor
continuo entre 29.5 y 30 se redondea al inmediato entero 30, entonces:

p (x 30, n = 100, q = 0.4) p(x > 29.5) = 1 - p (x 29.5) (por complemento)


29.5 40
= 1- = 1 - (-2.14)
4.899
= 1 - 0.0162 = 0.9838

60
d) P (33 x 46, n = 100, q = 0.4) p(32.5 < x 46.5) = (z2) - (z1)
46.5 40 32.5 40
=
4.899 4.899
= (1.33) - (-1.53)
= 0.9082 - 0.0630 = 0.8452

e) Para esta pregunta el xito es que no tenga defectos: p = 0.6, entonces:


= n p = 100 (0.6) = 60 y la desviacion estandar es la misma, = 4.899.
Para realizar la aproximacion, observe que los valores que toma x son:
47 x 67, por lo tanto la equivalencia en la normal es:

p (46 < x < 68, n = 100, p = 0.6) p(46.5 < x < 67.5)
= (z2) - (z1)
67 . 5 60
= 46 . 5 60

4 . 899 4 . 899
= (1.53) - (-2.75) = 0.9370 - 0.0030
= 0.934

5.4 DISTRIBUCIN JI CUADRADO

Definicin.
La variable aleatoria X tiene una distribucin Ji-Cuadrado con v grados de libertad, si su
funcin de densidad es:
v x
1 1
f (x) x 2 e 2 x0
v
v
2 2
2
Donde v es un entero positivo (grados de libertad) y es la funcin Gamma.

Teorema
La media y la varianza de la distribucin Ji Cuadrado son:
= v y 2 = 2v

Propiedades
Enunciaremos algunas propiedades de la distribucin Ji-Cuadrado.

1) Si la variable X tiene una distribucin normal estndar, entonces: X2 tiene


distribucin Ji-Cuadrado con un grado de libertad (v = 1).
2) Si X1, X2, , Xn son variables aleatorias independientes con distribuciones normales
estndar, entonces:

61
n
xi
2
Y=
i 1
Tiene distribucin Ji-Cuadrado con n grados de libertad (v = n).

3) Si X1, X2, , Xn son variables aleatorias independientes con distribuciones con


distribuciones Ji-Cuadradas con v1, v2, , vn grados de libertad, entonces:
n
xi
2
Y=
i 1
Tiene distribucin Ji-Cuadrada con: v1 + v2 + +vn grados de libertad.

4) Si s2 es la varianza de una muestra aleatoria de tamao n de una


Poblacin normal que tiene la varianza 2, entonces el estadstico.

2 ( n 1)s
2
x 2

Es una variable aleatoria que tiene una distribucin Ji-cuadrado con v = n 1
grados de libertad.

Notas: - El estadstico enunciado en la ltima propiedad se suele buscar en la tabla


para la distribucin ji-Cuadrado con v grados de libertad.

- Este estadstico se denota as: X2(1-), v.

- Un valor X20.95 , 6 = 12.592 (Deja un rea de 0.05 a su derecha). Debido


a que la grfica no es simtrica, debemos buscar tambin el valor de:
X20.05 , 6 = 1.635 (Deja un rea de 0.95 a su derecha). Como el 95% de
una distribucin Ji-Cuadrada esta entre X20.025 , v y X20.975 , v, entonces
debemos analizar lo siguiente:
Un valor de X2 que cae a la izquierda de X2 0.025, v no es probable que
Ocurra a menos que el valor supuesto de la varianza (2), sea muy
grande. De igual manera, un valor de X2 que cae a la derecha de
X2 0.975, v no es probable que ocurra a menos que dicho valor supuesto
sea muy pequeo.
O sea: es posible tener un valor X2 entre los valores de X20.025 , v y
X20.095 , v cuando la varianza (2) es la correcta.

- P(X2 > X2(1-), v) = .

- Cuando los grados de libertad exceden a 30, las probabilidades relacionadas con
Ji cuadrada pueden aproximarse con la normal.

Ejemplo
Un fabricante de computadoras garantiza que estas durarn, en promedio, 3 aos con
una desviacin estndar de un ao. Si 6 de ests computadoras duraron: 1.9, 2.4, 3.0,

62
3.5, 3.8 y 4.2 aos antes de ser reparadas la primera vez. Debera el fabricante estar
convencido an de que sus computadoras tienen una desviacin estndar de un ao?

Solucin:
Primero calcularemos s2, podemos utilizar la frmula siguiente.
n n
n xi2 ( x1)2
i 1 i 1 (6) (62.7 ) (353.44)
s2 0.75867
n(n 1) 6(5)
Ahora utilizamos la frmula del teorema anterior, para calcular x2
2 (n 1) s 2 (5) ( 0.75867 )
x 3.7933
2 1
Buscamos en la tabla de Ji-Cuadrado el valor de 3.7933 con v = 5 y encontramos que el
ms prximo es para x20.50, 5 = 4.351. Los valores de X2 = 3.7933 se encuentran entre
0.831 y 12.832 (X20.975 , 5 = 0.831 y X20.025 , 5 = 12.832), como 2 = 1, entonces es
correcto.

Por lo que parece razonable que el fabricante no debe dudar de que sus computadoras
tengan una desviacin estndar de un ao.

5.5. DISTRIBUCIN t o t de STUDENT

La distribucin t de student fue obtenida por W. S. Gosset (1876-1937), el era un qumico


que trabajaba para la cervecera Guinness En Dubln, Alemania, en 1908.

Para muestras aleatorias tomadas de una poblacin normal con una media y la varianza
2, la media de la muestra aleatoria ( x ) tiene una distribucin normal con la media y
2 x
la varianza , es decir, tiene la distribucin normal estndar. La dificultad
n / n
principal que se presenta en la aplicacin de este resultado es que en la prctica 2 suele
ser desconocida, lo que obliga a reemplazarla por un valor de la varianza de la muestra
x
(s2). Mas adelante veremos la distribucin de densidad de para muestras
s/ n
aleatorias de poblaciones normales.
La distribucin t de Student se define as.

Definicin.

Sean dos variables aleatorias independientes Y y Z, tales que: Y tenga una distribucin
normal estndar y Z tenga una distribucin Ji-Cuadrado con v grados de libertad y
supongamos que la variable X se define por:

63
Y
X= ,
1/ 2
Z

v
Entonces, la distribucin de X se llama: La distribucin t de Student

La funcin de densidad de esta variable, est dada por:


v 1
v 1
x2 2
F(x) = 2 1 , Para: - < x <
v v
v
2

Y se denomina: Distribucin t de Student con v grados de libertad.

Teorema.
La media y la varianza de la distribucin t de student con v grados de libertad estn dadas
por:
n
=0 y 2 = , para n > 2.
n2
Teorema.

Si X y Y S2 son la media y la varianza de una muestra aleatoria n tomadas de una


poblacin normal con la media y la varianza 2, entonces.
x
t
s/ n
tiene la distribucin t, con v = n 1 grados de libertad.
Notas:
- La distribucin t de Student tiene mucha similitud con la normal, ambas
son simtricas alrededor de su media, sus grficas tienen forma de
campana, pero la distribucin t es ms variable.

- Representaremos los valores crticos de esta distribucin por: t 1- , v , los


cuales se encuentran en la tabla t Student, ubicando en la horizontal a t 1-
Y los grados de libertad en la columna, luego se interceptan, igual que se
procedio con la normal.
- La p(t > t1- , v ) = o la p(t < t1- , v) = 1 - . Esto significa que a la
derecha del valor critico se encuentra un rea igual a y por debajo un
rea igual a 1 - .

- Dado que la distribucin t es simtrica, se tiene que: t = - t1-

- Para n 30 la curva de la distribucin t, se ajusta mucho a la Normal


Estndar.

64
Ejemplo:
Un bus de una cooperativa de transporte, que viaja de Managua al Norte, en 16 recorridos
completos (ida y vuelta), tubo un consumo promedio de combustible (Diesel) de 16.4
galones; con una desviacin estndar de 2.1 galones.

Demuestre la afirmacin de que el consumo promedio de combustible de este bus es de


12 galones por hora.

Solucin:

n = 16
x 16.4 12.0
= 12.0 t 8.3809
s/ n (2.1)(4)
s = 2.1

En la tabla se busca con v = n 1 = 15 grados de libertad, el valor de 8.3809 y el valor


ms prximo que encontramos es t1- , v = t0.995 , 15 = 2.947; de donde:
1 - = 0.995, entonces: = 0.005; por lo tanto: la P( t > 2.947) = 0.005; por lo que la
probabilidad de que t sea mayor que 8.3809 debe ser despreciable (insignificante),
entonces es acertado pensar que el consumo promedio de diesel de dicho bus es mayor
que 12 galones.

5.6. TH DE CHEBYSHEV

Se ha deducido que para una desviacin estndar pequea de un conjunto de valores,


significa que stos se encuentran concentrados cerca de la madia y viceversa. El
matemtico ruso P. L. Chevyshev (1821-1894) desarrollo un teorema que permite
determinar la proporcin mnima de las observaciones que se encuentran a una distancia
de k desviaciones estndar de su media.

Teorema de Chevyshev.

Para un conjunto cualquiera de observaciones, la proporcin mnima de estas que se


1
encuentran a k desviaciones estndar de la media es al menos: 1 - ; o sea:
k 2
1
P [ - k x + k ] 1 -
k2
Esta desigualdad es vlida para variables discretas como para continuas. Adems, si no
conocemos la ley de probabilidad ser posible encontrar un lmite inferior para la
probabilidad en este intervalo para la cual existan y , pero slo nos indica:
cuando menos qu proporcin'' deber estar entre ciertos valores.

65
Ejemplos

- Los registros de una lnea area muestran que sus vuelos entre dos ciudades llegan en
promedio 5.4 minutos tarde con desviacin estndar de 1.4 minutos. Cundo menos
qu porcentaje de sus vuelos entre dos ciudades llegan entre:
a) 2.6 y 8.2 minutos tarde?
b) 1.6 minutos antes y 12.4 minutos tarde?

Solucin:
= 5.4
= 1.4
5.4 2.6
a) - k = 2.6 5.4 - 2.6 = k (1.4) k= =2
1.4
1 1
P [ 2.6 x 8.2 ] 1 - =1- = 0.75
k2 4
Cuando menos 75% de los aviones de la lnea area llegan entre 2.6 y 8.2 minutos
tarde
1 1
b) P [ 1.6 x 12.4 ] 1 - =1- = 0.96
k2 25
+ k = 12.4 Al menos el 96% de los aviones de la

1.4k = 12.4 - 5.4 lnea area llegan entre 1.6 minutos


12.4 5.4
k= =5 antes y 12.4 minutos despus
1.4
5.4 1.6
o bien k = =5
1.4

- Supngase que en promedio 1 de 1,000 personas comente un error numrico al


elaborar su declaracin de impuestos. Encuentre un intervalo en el cual se tenga una
8
probabilidad de por lo menos del nmero de personas que incurren en errores en
9
esta actividad de entre las 10,000 declaraciones.
Solucin:

1
P= = 0.001
1,000
n = 10,000 = n p = 10, = = 2
1 8 8 1
1 1
k2 9 9 k2

66
1 1
K=3
9 k2
8
P [ k ]
9
8
10 3 10 p [ -19.49 x 9.49 ]
9
El nmero de personas que incurren en errores al elaborar su declaracin de impuestos de
un total de 10,000 es al menos de 9 con una probabilidad de al menos 8/9 (o bien
88.89%).

- Un fabricante de neumticos para automvil reporta que de un embarque de


5,000 neumticos enviados a un distribuidor local, 1,000 estn ligeramente
manchados. Si alguien compra al distribuidor 10 de estos neumticos aleatoria
mente. Interprete el Th de Cheybyshev para 2 desviaciones estndar.
Solucin:
nk
N = 5,000 (x) =
N
n = 10
nk N k N n
K = 1,000 2 (x) =
N 2 N 1
10 1,000 10 1,000 4,000 4,990
= 2 2 (x) =
5,000 5,000 2 4,999
(x) = 1.26
1 3
Intervalo: 2 = 2 2 (1.26); 1
4 4
P [ -0.52 x 4.52 ] 3/4

ESTIMACION

INTRODUCCIN
La inferencia estadstica o estadstica inferencial se refiere a un conjunto de
mtodos mediante los cuales podemos hacer afirmaciones con respecto a una
poblacin completa a partir nicamente de la observacin de una parte de ella
(muestra).

Dos formas bsicas para realizar inferencia estadstica son la Estimacin y el


Contraste de Hiptesis, tambin llamado "Prueba de hiptesis.

El nmero de datos n (tamao de muestra) es casi siempre elegido de antemano


(a travs del muestreo) en problemas de estimacin y prueba de hiptesis.

67
Anteriormente se han calculado algunas medidas descriptivas, tales como: la media, la
varianza, la proporcin etc. Cuando calculamos estas medidas en una muestra, suelen
identificarse como: estadsticos y cuando hablamos de los mismos en una poblacin los
identificamos como: parmetros.

O sea: x , S2, p , etc. son estadsticos y


, 2, P, etc. son parmetros
ESTIMACIN

Definicin
Estimacin es la aproximacin a los parmetros poblacionales, en Funcin de estadsticos
muestrales conocidos.
Existen dos tipos de estimaciones de parmetros:
- La estimacin puntual.
- la estimacin por intervalo de confianza.

As, el problema principal en la teora de la estimacin consiste en determinar mtodos


para buscar valoras estimados de parmetros desconocidos de un modelo probabilstico,
basados en muestras.

Los problemas de estimacin en la que se emplea la distribucin Binomial pueden


reducirse generalmente a los problemas de estimacin para la proporcin.

Los problemas de estimacin en la que se emplea la distribucin Normal, distribucin


T de Studen, distribucin Chi-cuadrada y distribucin de Fischer, pueden reducirse
generalmente a los problemas de estimacin para la media y la varianza.

ESTIMACIN PUNTUAL

Definicin

Es el nmero que se obtiene mediante clculos a partir de valores de la muestra que


sirven como aproximacin al parmetro que se desea estimar. Los estimadores puntuales
para los parmetros poblacionales son los parmetros mustrales correspondientes.

Ejemplo
La edad promedio de los estudiantes de segundo ao de cualquier carrera en la UNI, la
estimamos de 19 aos. Para confirmar o rechazar esto, debemos tomar una muestra
representativa y calcular la edad promedio de la muestra para contrastarla con dicha
estimacin.
En este caso se hace consideracin a un solo numero (edad promedio de la muestra), que
ser una estimacin puntual del valor del parmetro poblacional desconocido.

En general: una estimacin puntual es un nmero o punto que se da al parmetro


poblacional tal como: = , = x, 2 = S2, P = p.
En la estimacin puntual no se puede afirmar, con cierta seguridad, que tan prximo
estaramos del verdadero valor del parmetro poblacional, aunque este justificado que son

68
buenos estimadores puntuales de los parmetros poblacionales los mustrales
correspondientes.
Pero pueden utilizarse diversas propiedades estadsticas de los estimadores para decidir
que estimador es l mas apropiado en una situacin dada, cual nos expondr el menor
riesgo, cual nos brindar la mayor cantidad de informacin al ms bajo costo, etc. Las
propiedades especificas de los estimadores que analizaremos son: Insesgabilidad,
Varianza mnima, Consistencia y Suficiencia.

ESTIMADORES INSESGADOS
omo es difcil que haya un estimador ideal que siempre de la respuesta correcta, es
razonable pensar que un estimador deba hacerlo cuando menos en promedio. Dicho de
otra forma, parecera esperado que el valor medio de un estimador sea igual al parmetro
que se supone estima, si este fuese el caso se dice que el estimador es insesgado; de lo
contrario es sesgado.

Definicin
Una estadstica es un estimador insesgado del parmetro , si y solo si, E( )= .

De acuerdo con esta definicin y el teorema siguiente: Si x1, x2,..., xn , constituyen una
muestra aleatoria de una poblacin infinita que tiene la media y la variancia 2,
entonces: E( x )= y la Var( x )= 2/n.
se deduce que:
la media muestral x es un estimador insesgado de la media poblacional .

Veremos el siguiente ejemplo:


X
Si la variable X tiene una distribucin Binomial, demuestre que p = : la proporcin de
n
xitos observados, es un estimador insesgado del parmetro P: proporcin de xitos en la
poblacin.

(Queremos demostrar que E(X/n)= P).


Demostracin.

Como E(x)=n P (media de una distribucin Binomial), se deduce que:


1 1
E(x/n)= . E(x)= . n P = P. Es lo que queramos demostrar.
n n
Teorema:

Si s2 es la varianza de una muestra tomada al azar de una poblacin infinita, entonces


E(s2)= 2.
Nota: Aunque s2 es un estimador insesgado de la varianza de una poblacin infinita, no
es un estimador insesgado de la varianza de una poblacin finita y en ningn
caso es s un estimador insesgado de .

69
6.4.1.2. ESTIMADOR INSESGADO DE VARIANZA MNIMA
Si tenemos que elegir uno de varios estimadores insesgados, por lo general tomamos
aquel cuya distribucin muestral tenga la varianza ms pequea. Para verificar si un
estimador insesgado tiene la varianza mnima, nos valemos del hecho de que si es un
estimador insesgado de , puede demostrarse en condiciones muy generales que la
varianza de debe satisfacer la desigualdad:

1
Var( )
ln f x
2

n E

Donde:
f(x): es el valor de la densidad de la poblacin de x
n: es el tamao de la muestra aleatoria.

Esta relacin nos conduce al siguiente resultado.

Teorema.

Si es un estimador insesgado de y 1 ,
Var ( )
ln f x
2

nE


Entonces es un estimador insesgado de varianza mnima de .

ESTIMACIN POR INTERVALO

A diferencia de la estimacin puntual, el resultado de la estimacin por intervalo de


confianza es un intervalo que puede afirmarse, con cierta seguridad, que en este se
encuentra el parmetro a estimar.

La estimacin por intervalo esta determinado por dos nmeros que se obtienen a partir
de clculos de valores de la muestra y que se espera contenga el valor del parmetro que
se desea. O sea: 1 < < 2.

La estimacin por intervalo se construye de forma tal, que la probabilidad que el intervalo
contenga al parmetro pueda especificarse, a este valor se le llama: nivel de confianza
coeficiente de confianza, tal probabilidad es: 1 - , siendo su complemento, un
valor de probabilidad pequea, conocida como margen de error o nivel de
significacin. Los niveles de confianza y significacin pueden expresarse de forma
anloga a travs de porcentajes.
La probabilidad de que el intervalo contenga al parmetro a estimar puede escribirse as:

70
P ( 1 < < 2) = 1 -
A dicho intervalo se le conoce como: Intervalo de confianza del (1 - ) 100%, donde
1 y 2 son los limites de confianza inferior y superior respectivamente.

ESTIMACIN POR INTERVALO DE CONFIANZA PARA LA MEDIA


CON VARIANZA CONOCIDA.

Sea una variable X con distribucin normal ( , 2) en una poblacin determinada y


consideremos (x1,..., xn) una muestra simple de X tomada en dicha poblacin siendo la

y varianza
2
varianza conocida con media x =
x
2
n
.

La probabilidad de que un valor normal Z se encuentre dentro de intervalo, se puede


escribir as:

P (-Z 1- /2 Z Z 1- /2) =1-

x
Donde el valor estndar de z es: Z = , sustituyendo:

n
x
P (-Z 1- /2

Z 1- /2) = 1 - , despejando , se obtiene:
n

P (x - Z 1- /2 x + Z 1- /2 )=1-
n n
A los valores: - Z 1- /2 y Z 1- /2 se les llaman valores crticos y se buscan en la tabla
normal.
El valor critico: - Z 1- /2 = Z /2.

El intervalo se puede escribir de forma compacta as:



x Z 1- /2
n
Teorema

Si x y s2 son la media y la varianza de una muestra aleatoria de tamao n seleccionada


de una poblacin normal con la varianza 2 conocida, entonces un intervalo con una
confianza de (1 - ) 100% para la media , est dado por:

x - Z 1- /2 x + Z 1- /2
n n
La precisin en la estimacin por intervalo esta determinada por la dimensin del
intervalo. Un intervalo de confianza de gran longitud no es de gran utilidad si tenemos en
cuenta la objetividad o precisin.

71
Mientras menor sea el ancho del intervalo mayor ser su precisin, evidentemente la
precisin esta en relacin inversa con el nivel de confianza al disminuir uno aumenta el
otro, si permanecen fijas las restantes condiciones.

En esta situacin se debe examinar entre las restantes condiciones si algn elemento
puede influir de forma que ambos disminuyan, el otro elemento es la cantidad de
informacin (tamao de muestra) con que se cuenta.

Se puede encontrar una ecuacin que relacione los tres elementos.

Sea X una variable aleatoria con distribucin normal ( , 2) y sea (X1,..., Xn) una muestra
simple aleatoria de esta variable, si se denota el ancho del intervalo por 2, donde : es el
mximo error permisible, entonces se puede llegar a la siguiente identidad:

Ancho de intervalo: Ls - Li = 2 = x + Z 1- /2 - x + Z 1- /2
n n

2 = 2 Z 1- /2
n

De esto resulta que: = Z 1- /2
n

En esta relacin se encuentran los tres elementos. Para comprender la relacin entre ellos,
deben analizarse por pareja, haciendo constante el tercer elemento.

Para calcular el nmero de elementos que debe tener la muestra, podemos despejar n y
se obtiene:

z1 / 2
2

n

Ejemplo 1

La cantidad de litros de lubricantes que se consumen en un mes en una cooperativa de


transporte es una variable aleatoria con distribucin normal ( , 81) se toma una muestra
aleatoria de 4 meses y se obtienen: 1,200, 1,250, 1,195, 1,190 litros de consumo.
a) Determine una estimacin puntual para el consumo promedio de lubricantes por mes.
Solucin
1,200 + ... + 1,190
x =----------------------------- = 1,208.75 litros
4
= 1,208.75 litros.
Se estima que el consumo promedio de lubricantes por mes en dicha cooperativa de
transporte es de 1,208.75 litros.

b) Calcule un intervalo de confianza para el consumo medio de lubricantes en un mes,


con un nivel de confianza del 90 %.

72
Solucin

x - Z 1- /2 x +Z 1- /2
n n
Para = 0.1, Z 1- /2 = Z 0.95 = 1.645, x = 1208.75, = 9, entonces:
1208.75 1.645(9)/2 1208.75 + 1.645(9)/2
1,201.34 1,216.15
El consumo promedio de lubricantes por mes en esta cooperativa de transporte esta
comprendido entre: 1,201.34 y 1,216.15 litros con un nivel de confianza del 90 %.

b) Si se supone que la longitud del intervalo es muy grande para el trabajo


que se debe realizar y se desea disminuir a 10 litros, calcule el tamao que
tendr la muestra si se mantiene fijo el nivel de confianza.

Solucin
2 = ancho = 10, = 5, entonces:

Z 1- /2 2
n= --------------- = (1.645*9 / 5)2 = 8.7675 9


La muestra debera ser de 9 meses para que el intervalo tenga una longitud de 10 litros.

ESTIMACIN POR INTERVALO DE CONFIANZA DE LA MEDIA CON VARIANZA


DESCONOCIDA.

Cuando se trabaja con una muestra de una poblacin normal con varianza 2 desconocida
y su tamao es n<30, entonces se puede construir un intervalo de confianza del (1 - )
100% para la media , con la variable aleatoria:

x
t , que tiene una distribucin t de student con n-1 grados de libertad, as:
s/ n
P (-t (1- /2), (n-1) t t (1- /2), (n-1)) = 1 -
x
P (-t (1- /2), (n-1) t (1- /2), (n-1)) = 1 - , despejando
s/ n
s s
P ( x -t (1- /2), (n-1) x - t (1- /2), (n-1)) )=1-
n n

Teorema

Si x y s2 son la media y la varianza de una muestra aleatoria de tamao n seleccionada


de una poblacin normal con la varianza 2 desconocida, entonces un intervalo con una
confianza de (1 - ) 100% para la media , est dado por:

s s
x -t (1- /2), (n-1) x - t (1- /2), (n-1))
n n

73
Nota :
Si la varianza 2 es desconocida y el tamao de la muestra es n 30, entonces se utiliza el
intervalo para cuando la 2 es conocida y se estima con la desviacin estndar de la
muestra (S).

La relacin entre la precisin, el ancho del intervalo y el tamao de la informacin se


puede obtener de manera semejante, que con el anterior intervalo.

Ejemplo
Una muestra aleatoria de 18 alumnos graduados en la UNI dio un promedio 73.3 en todas
las asignaturas de su plan de estudio con una desviacin estndar de 7.8. Suponiendo que
las notas se distribuyen de manera normal. Encuentre e interprete un intervalo de
confianza del 98% para el nmero promedio de graduados en la universidad.
Solucion
Para este ejercicio no se conoce la varianza poblacional y el tamao de la muestra es
menor que 30, entonces usaremos la distribucin t.
Para = 0.2, t (1- /2), (n-1) = t 0.99, 17 = 2.567, n = 18, x = 73.3, s = 7.8, entonces:
s s
x -t (1- /2), (n-1)
x -t (1- /2), (n-1))
n n
73.3 2.567
7.8
73.3 + 2.567
7.8
18 18

72.211 74.389
El promedio de los graduados en la UNI, vara de 72.211 a 74.389 con un nivel de
confianza del 98%.

6.4.5 ESTIMACIN POR INTERVALO DE CONFIANZA PARA DIFERENCIAS


DE MEDIAS.

Si x 1 y x 2 son medias de dos muestras aleatorias independientes de tamao n 1 y n2


seleccionadas de poblaciones normales que tienen medias 1 y 2 y varianzas 12 y

2 , se puede demostrar que la variable: x


2
1 - x 2, es una variable aleatoria que tiene
distribucin normal con media:
= 1 - 2
y varianza:
2
2 2
2
= 1 +
n1 n2
De lo anterior resulta que:
x 1 x 2 1 2 tiene una distribucin normal estndar.
z
1 2
2 2

n1 n2

74
De lo anterior se deduce el siguiente teorema.

Teorema
Si x 1 y x 2 son las medias de muestras aleatorias independientes de tamaos n 1 y n2

1 y 2
2 2
seleccionadas de poblaciones normales con las varianzas conocidas, entonces
un intervalo con una confianza de (1 - ) 100% para 1 - 2, est dado por:
( x 1 - x 2) - z (1- /2) 1
2

2
2
1 - 2 ( x 1 - x 2) + z (1- /2) 1
2

2
2

n1 n2 n1 n2
Ejemplo

Se tomo una muestra al azar de 50 estudiantes de la carrera ingeniera en sistemas y dio


como promedio una nota de 65 en la asignatura de estadstica y 48 estudiantes de
computacin en la misma asignatura dieron un promedio de 62, construya un intervalo de
confianza del 95% para la diferencia real entre los promedios de las dos carreras,
sabiendo que las desviaciones estndar en dicha asignatura son respectivamente: 6
(industrial) y 7 (sistemas).
Solucin
= 0.05, z (1- /2) = z0.975 = 1.96
n1 = 50, x 1 = 65, 1= 6,
n2 = 48, x 2 = 62, 2 = 7

36 49 36 49
(65 - 62) 1.96 1 - 2 (65 - 62) + 1.96
50 48 50 48

-0.414 1 - 2 5.586.
En este intervalo la diferencia entre los promedios reales puede ser cero, por lo tanto se
puede concluir que: Estadsticamente no hay diferencia significativa entre los promedios
de ambas carreras en la asignatura de estadstica, con un nivel de confianza del 95%.

ESTIMACIN POR INTERVALO DE CONFIANZA PARA DIFERENCIAS


DE MEDIAS CON VARIANZAS DESCONOCIDAS.

Tambin se obtiene un intervalo de confianza de (1 - ) 100% para 1 - 2 con las


1 2
2 2
varianzas = desconocidas y los tamaos de las muestras son menores que 30.

Teorema
Si x 1 y x 2 son las medias de muestras aleatorias independientes de tamaos
n1<30 y n2<30 seleccionadas de poblaciones normales con las varianzas

1 2 desconocidas, entonces un intervalo con una confianza de


2 2
=
(1 - ) 100% para 1 - 2, est dado por:

75
( x 1 - x 2) - t(1- /2), ( n1 n2
+ -1) Sp 1

1 1 - 2
n1 n 2
( x 1 - x 2) + t(1- /2), ( Sp 1 1
n1 n2+ -1)
n1 n 2
Donde: 2

n 1 1 s 2
1
n 2 1 s 2
2
sp
n1 n 2 1
1 2
2 2
Si = son desconocidas y los tamaos de las muestras son mayores o iguales a
30, el intervalo de confianza para 1 - 2, ser el mismo para cuando se conocen las
1 y 2 , por las varianzas muestrales respectivas.
2 2
varianzas poblacionales, estimando

Ejemplo
Una empresa tiene dos mquinas troqueladoras de lminas de zinc ubicadas en los
departamentos de Masaya y Len, se desea comparar el tiempo promedio diario (en
minutos) que estas mquinas no trabajan, con un intervalo de confianza del 99%, para
ello se seleccionaron 15 das aleatoriamente por cada mquina y los resultados fueron:
n1 = 15, x 1 = 45 minutos, S1 = 2.5 minutos.
n2 = 15, x 2 = 36 minutos, S2 = 3 minutos.
Se asume que las varianzas son iguales, pero desconocidas.
Solucin :
= 0.01, t(1- /2),( + - 1) = t(0.995), (29) = 2.756
n1 n2
2 15 1 6.25 15 19 = 7.362,
sp 15 15 1
entonces : Sp = 2.71

1 1 1 1
(45 - 36) 2.756(2.71) 1 - 2 (45 - 36) + 2.756(2.71)
15 15 15 15

6.273 1 - 2 11.727
La diferencia promedio diaria que estas mquinas troqueladoras no trabajan est entre
6.273 y 11.727 minutos, con una confianza del 99%.

ESTIMACIN POR INTERVALO DE CONFIANZA PARA PROPORCIONES.

En muchos casos es necesario obtener muestras de poblaciones binomiales, a travs de


estas podemos hacer estimaciones para el parmetro P: proporcin de xitos,
valindonos del hecho que para cuando n es lo suficientemente grande la distribucin
binomial se puede aproximar a la normal.
Teorema
Si p : es la proporcin de xitos de una muestra seleccionada aleatoriamente de una
poblacin binomial, entonces un intervalo de confianza del (1 - ) 100% para el
parmetro Binomial P, est dado por:

76
p 1 p p 1 p
p - Z (1- /2) P p - Z (1- /2)
n n
x
Donde: p =
n

Ejemplo
Un fabricante de bloques para construccin asegura a una ferretera que le compra el
producto en forma regular, que el porcentaje de bloques defectuosos no es mayor del 5
%. La ferretera decide comprobar la afirmacin del fabricante seleccionando de su
inventario 200 unidades de ese producto y los revisa en busca de defectos. Deber
sospechar la compaa de la afirmacin del fabricante, si se descubre un total de 19
bloques defectuosos en la muestra?
Solucion

Cuando el nivel de confianza no se especifica, se debe asumir que es del 95%.


La sospecha estara apoyada, si existe un intervalo de confiabilidad alta para el cual la
proporcin se encuentre completamente a la derecha del valor asegurado.
Para = 0.5, Z 1- /2 = Z 0.975 =1.96
p = 19/200 (proporcin de defectuosos), n = 200.

(19/200) 1.96
19 / 200181/ 200 P (19/200) + 1.96 19 / 200181/ 200
200 200

0.05436 P 0.1356,
Pasando el intervalo a porcentajes, se tiene que:

5.43% P 13.56%
La sospecha de la compaa esta apoyada con un nivel de confianza del 95 %.

ESTIMACIN POR INTERVALO DE CONFIANZA PARA DIFERENCIA


DE PROPORCIONES.

Ahora veremos como comparar dos parmetros binomiales P 1 y P2, partiendo de dos
muestras aleatorias independientes tomadas de dos poblaciones binomiales. Se puede

deducir que: Si p 1 =
x1 = p2 =
x2 , son las proporciones de xitos de las dos
n1 n2
muestras aleatorias independientes, seleccionadas de dos poblaciones binomiales,
entonces: p 1 - p 2 tiene aproximadamente una distribucin normal con

media: = P1 P2 y varianza: 2 = p 1 q 1 p 2 q 2 .
n1 n2
Tambin se deduce que la variable aleatoria:

77

Z = p p
1 2
p 1 p 2 , tiene aproximadamente la distribucin normal estndar.
p1 q1 p 2 q 2

n1 n2

Teorema.

Si p 1 y p 2: son las proporciones de xitos de dos muestras independientes,


seleccionadas aleatoriamente de dos poblaciones binomiales, entonces un
Intervalo de confianza del (1 - ) 100% para P1 P2, est dado por:

( p 1 - p 2) - Z p 1 1 p 1 p 2 1 p 2 P1 P2
(1- /2)
n1 n2
( p 1 - p 2) - Z (1- /2)
p 1 1 p 1 p 2 1 p 2

n1 n2
Donde: p 1 = x1 y p2 = x2
n1 n2
Ejemplo
En un estudio realizado sobre la duracin que tienen las llantas de dos marcas, se obtuvo
lo siguiente: 34 de 200 de la marca A y 29 de la marca B, no duraron los 48,000 kms de
garanta que ofrecen estas dos marcas. Obtenga un intervalo de confianza del 90%, para
la diferencia real de la duracin de estas dos marcas de llantas.
Solucin
p 1 = 34/200, proporcin de llantas para la marca A, que no duraron los
48,000 Km.
p 2 = 29/200, proporcin de llantas para la marca B, que no duraron los
48,000 Km.
Para = 0.1, Z (1- /2) = Z0.95 = 1.645.

[(34/200) (29/200) - 1.645


34 / 200166 / 200 29 / 200171/ 200 P P2
1
200 200

[(34/200) (29/200) - 1.645


34 / 200166 / 200 29 / 200171/ 200
200 200
-0.035 P1 P2 0.085.
En realidad no hay diferencia significativa en la duracin de estos dos tipos de llantas, con
una confianza del 90%.

78
ESTIMACIN POR INTERVALO DE CONFIANZA PARA LA VARIANZA.

Teorema.
Si S2 es la varianza de una muestra aleatoria de tamao n, Seleccionada de una poblacin
normal, entonces un intervalo del (1 - ) 100% para el parmetro 2, est dado por:
n 1 s2 n 1 s2

2


2 2

1 / 2 , n 1 / 2 , n 1

Para obtener un intervalo de confianza para la desviacin estndar, basta extraer races
cuadradas al intervalo anterior.

Ejemplo
Los pesos (en kilogramos) de 10 paquetes de semilla distribuidos por cierta compaa son:
46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, 46.0. Encuentre e interprete un
intervalo de confianza al 95% para la desviacin estndar de dichos paquetes de semilla.
Solucion

0.975, 9 = 19.02 0.025, 9 = 2.7


2 2
n = 10, S2 = 0.2862, = 0.05,

9(0.2862) 2 9(0.2862)
19.02 2.70
0.1355 2 0.9540, extrayendo raz cuadrada,

0.3681 0.9767
La variacin lineal de los pesos de los paquetes de semilla, est entre
0.3681 y 0.9767 Kg. alrededor del promedio.

PRUEBA DE HIPTESIS

INTRODUCCIN

Una hiptesis estadstica es una afirmacin con respecto a una distribucin de probabilidad
(por ejemplo, podramos decir que un cierto fenmeno se comporta de forma que puede
explicarse por una distribucin Binomial). En particular, una hiptesis estadstica puede ser
una afirmacin con respecto a un parmetro (si sabemos que la distribucin es Binomial,
entonces podramos establecer la hiptesis de que la probabilidad de xito es p = 0.5).

HIPOTESIS: Es una afirmacin o suposicin y no un hecho establecido.


Ejemplo:
Un fabricante de ladrillos puede afirmar la hiptesis que sus ladrillos tienen una resistencia
a la ruptura promedio de 750 libras.

HIPOTESIS ESTADISTICA: Son afirmaciones sobre uno o mas parmetros de


Una o ms poblaciones.

TIPOS DE HIPOTESIS: Existe la hiptesis nula y la hiptesis alternativa.

79
HIPOTESIS NULA: Esta hiptesis hace una afirmacin diciendo que no haydiferencia
entre el verdadero valor y su valor hipottico. Se denota como: H 0. La hiptesis nula es la
que se somete a comprobacin.

HIPOTESIS ALTERNATIVA: Representa en alguna forma la negacin de la Hiptesis


nula. Se denota como: H1.

Ejemplo:
Un fabricante de vidrio para ventanas, puede afirmar que la resistencia a la presin de los
mismos es de 125 psi. Podramos plantear en la hiptesis Nula as:
H0: = 125 psi.
La alternativa la podramos expresarla de tres maneras distintas:

H1: 125, A esta se le conoce como prueba Bilateral o de dos colas.


H1: < 125, A esta se le conoce como prueba unilateral Izquierda.
H1: > 125, A esta se le conoce como prueba unilateral derecha.

TIPOS DE ERRORES: Cuando se toma una decisin con respecto a una


Hiptesis Nula, corremos el riesgo de cometer el error
De tipo 1 o el error de tipo 2.

El rechazo de la hiptesis nula cuando en realidad Ho es cierta constituye un error de


tipo 1.
El aceptar la hiptesis nula cuando en realidad Ho es falsa constituye un error de tipo 2.
Estos dos tipos de errores los mostraremos en la siguiente tabla:

Rechazar H0 No rechazar H0
H0 verdadera Error tipo I Decisin correcta
H0 falsa Decisin correcta Error tipo II
En estas circunstancias no podemos cometer ambos errores en forma simultnea, pero el
error del tipo 1 lo minimizaremos utilizando un nivel de confianza.

1 - : se le conoce como nivel de confianza.


: Se conoce como nivel de significacin o nivel de error y es la mxima
Probabilidad de cometer el error de Tipo I, al tomar la decisin.

Regin crtica. Es la regin de rechazo de la hiptesis nula en una prueba,


es decir, es le conjunto de valores del estadstico que conduce
a rechazar la hiptesis nula.

Pasos para la comprobacin de una hiptesis


1. Planteamiento de las hiptesis.
2. Seleccin del estadstico de prueba.
3. Determinacin de la regin crtica.
4. Decisin estadstica.
5. Conclusin.

80
PRUEBA DE HIPTESIS RELATIVAS A LA MEDIA CON LA VARIANZA 2
CONOCIDA
Supongamos que se desea probar, sobre la base de una muestra aleatoria, seleccionada
de una poblacin normal con la varianza 2 conocida, la hiptesis nula:
H0: = 0 , donde: 0 es el valor hipottico.
Entonces el estadstico de prueba ser: Z= x
0

n
a) Contra la alternativa: H1: 0, la regin crtica es:
Z < Z /2 o Z > Z 1-/2
Z /2 y Z 1-/2: valores crticos (frontera entre la regin critica y la regin de
aceptacin de la hiptesis nula).
Nota: Z /2 = - Z 1-/2

b) Contra la alternativa: H1: < 0, la regin crtica es:


Z<Z
Z: valor crtico
Nota: Z = - Z 1-

c) Contra la alternativa: H1: > 0, la regin crtica es:


Z > Z 1-
Z1-: valor crtico.

En cualquiera de los casos si se cumple la relacin en las regiones crticas se rechaza la


hiptesis nula, en caso contrario se acepta.

Ejemplo
Un comprador de bloques para la construccin de viviendas cree que la calidad de los
mismos est disminuyendo. De experiencias anteriores se sabe que la resistencia
promedio a la compresin es de 200 Kg-fuerza. Con una varianza de 10 (Kg-fuerza)2.
Una muestra de 100 bloques dio una resistencia promedio a la compresin de 198.6 Kg-
fuerza. Probar la hiptesis de la calidad afirmada por el comprador con un nivel de
significacin de 0.01.
Solucion
0 = 200, 2 = 10, = 10, n = 100, x 198.6 , = 0.01.
a) primer paso. Planteamiento de las hiptesis.
H0: = 200
H1: < 200
b) segundo paso. Seleccin del estadstico de prueba.
198.6 200
Z= = -4.427.
10
100
c) tercer paso. Determinacin de la regin crtica.
Z = Z 0.01 = -2.33.
d) Cuarto paso. Decisin estadstica.
Se rechaza H0, si Z < Z .
-4.427 < -2.33 (verdadero). Se rechaza H0.
e) Quinto paso. Conclusin.

81
El comprador tiene la razn, la calidad de los bloques esta disminuyendo, la
resistencia promedio a la compresin de los bloques que compra no es de
200 Kg-fuerza.

PRUEBA DE HIPTESIS PARA LA MEDIA CON LA VARIANZA 2 DESCONOCIDA


Y EL TAMAO DE LA MUESTRA ES MENOR QUE 30.

Supongamos ahora que se desea probar, sobre la base de una muestra aleatoria,
seleccionada de una poblacin normal con la varianza 2 desconocida y el tamao de la
muestra menor que 30, la hiptesis nula:
H0: = 0 , donde: 0 es el valor hipottico.
Entonces el estadstico de prueba ser:
x
t 0
s/ n
Que es una variable aleatoria con distribucin t de Student con n-1 grados de libertad.
a) Contra la alternativa: H1: 0, la regin crtica es:
t < t (/2), (n-1) o t > t (1-/2), (n-1)
t (/2), (n-1) y t (1-/2), (n-1): valores crticos (frontera entre la regin critica y la
regin de aceptacin de la hiptesis nula).
Nota: t (/2), (n-1) = - t (1-/2), (n-1)

b) Contra la alternativa: H1: < 0, la regin crtica es:


t < t , (n-1), t, (n-1): valor crtico
Nota: t , (n-1) = - t (1- ), (n-1)
c) Contra la alternativa: H1: > 0, la regin crtica es:
t > t (1-), (n-1), t(1-), (n-1): valor crtico.

En cualquiera de los casos si se cumple la relacin en las regiones crticas se rechaza la


hiptesis nula, en caso contrario se acepta.

Ejemplo
Se afirma que la dureza de un determinado caucho es de 68 grados shore. Se probaron 15
especimenes y se obtuvo que la dureza promedio es igual a 64.9 grados Shore con una
desviacin estndar de 1.5 grados Shore. Hay evidencia suficiente para rechazar la
afirmacin anterior con un nivel de confianza del 98%.
Solucin
0 = 68, n = 15, x 64.1 , S = 1.5, = 0.02.
a) primer paso. Planteamiento de las hiptesis.
H0: = 68
H1: 68
b) segundo paso. Seleccin del estadstico de prueba.
64.9 68
t= = -8.0042.
1 .5
15
c) tercer paso. Determinacin de la regin crtica.

82
t (/2), (n-1) = t0.01,14 = -2.624 t (1-/2), (n-1) = t0.99, 14 = 2.624

d) Cuarto paso. Decisin estadstica.


Se rechaza H0, si t < t (/2), (n-1) o t > t (1-/2), (n-1)
-8.0042 < -2.624 o -8.0042 > 2.624 (la disyuncin es verdadera).
(V) (F) Se rechaza H0.
e) Quinto paso. Conclusin.
Se rechaza lo dicho. Se puede afirmar que la dureza promedio del caucho no
es de 68 grados shore, con un nivel de significacin del 2%.

Nota: Si la varianza 2 es desconocida y el tamao de la muestra es lo suficientemente


grande (n 30), tomada de una poblacin normal que no necesariamente es normal,
entonces se utiliza el estadstico de prueba para cuando la 2 es conocida y la desviacin
estndar se estima con la desviacin estndar de la muestra (S).

Ejemplo
El PH del agua que sale de una planta de filtracin debe ser por especificacin de 7. Se
toman en forma independiente 36 muestras de agua de dicha planta y se obtuvo un
promedio del PH de 6.76 con una desviacin estndar de 0.8. Habr razn para dudar de
que se mantenga la especificacin del Ph del agua en la planta? Probarlo con = 0.02.

Solucin
Se desconoce la varianza poblacional y el tamao de la muestra es mayor que 30, por lo
tanto usaremos la normal para contrastar las hiptesis. Se estimar la desviacin estndar
poblacional por la muestral.
0 = 7, n = 36, x 6.76 , S = 0.8, 0.8, = 0.02.
a) primer paso. Planteamiento de las hiptesis.
H0 : = 7
H1: 7
b) segundo paso. Seleccin del estadstico de prueba.
6.76 7
Z= = -1.8.
0 .8
36
c) tercer paso. Determinacin de la regin crtica.
Z (/2) = Z0.01 -2.33 Z (1-/2) = Z0.99, 14 2.33
d) Cuarto paso. Decisin estadstica.
Se rechaza H0, si Z < Z /2 o Z > Z 1-/2
-1.8 < -2.33 o -1.8 > 2.33 (la disyuncin es falsa)
(F) (F) Se acepta H0
e) Quinto paso. Conclusin.
El PH del agua en esa planta, mantiene su especificacin de 7, con una confianza
del 98%.

PRUEBA DE HIPTESIS PARA DIFERENCIAS ENTRE MEDIAS

1 y 2 .
2 2
CUANDO SE CONOCEN LAS VARIANZAS

83
En muchas investigaciones interesa conocer la relacin entre las medias de dos
poblaciones.
Si x 1 y x 2 son medias de dos muestras aleatorias independientes de tamao n 1 y n2
seleccionadas de poblaciones normales que tienen medias 1 y 2 y varianzas

1 y 2 . Supongamos ahora que se desea probar, sobre la base de estas


2 2
conocidas
muestras, la hiptesis nula: H0: 1 - 2 = D0, donde D0: es la diferencia hipottica.
Entonces el estadstico de prueba es:

z
x 1 x 2 D o
1
2 2
2
n1 n 2

a) Contra la alternativa: H1: 1 - 2 D0, la regin crtica es:


Z < Z /2 o Z > Z 1-/2, Z /2 y Z 1-/2: valores crticos

b) Contra la alternativa: H1: 1 - 2 < D0, la regin crtica es:


Z < Z , Z: valor crtico

c) Contra la alternativa: H1: 1 - 2 > D0, la regin crtica es:


Z > Z 1- , Z1-: valor crtico.
En cualquiera de los casos si se cumple la relacin en las regiones crticas se rechaza la
hiptesis nula, en caso contrario se acepta.

Ejemplo
Dos tipos diferentes de botellas de vidrio son adecuados para la utilizacin en una
embotelladora de gaseosas. La resistencia a la presin interna es una caracterstica de
calidad importante. Se sabe que las desviaciones estndares son iguales a 3 lb. Se tomo
una muestra aleatoria de 16 botellas del primer tipo y dio una resistencia promedio a la
presin de 180.8 lb. Una muestra de igual tamao del segundo tipo dio una resistencia
promedio a la presin de 175.1 lb. La embotelladora no utilizara las botellas del tipo 1 a no
ser que su resistencia promedio a la presin exceda a las del tipo 2 en por lo menos 5 lb,
con una confianza del 99%.

Solucion
En este problema se conocen las varianzas poblacionales de las resistencias a la presin
de ambos tipos de botellas, 1 = 2 = 3 lb., 12 = 22 = 9 lb2, = 0.01.
n1 = 16, x 1 = 180.8 lb.
n2 = 16, x 2 = 175.1 lb.

a) primer paso. Planteamiento de las hiptesis.


H0 : 1 - 2 5
H1: 1 - 2 < 5
b) segundo paso. Seleccin del estadstico de prueba.

84
z
180.8 175.1 5 = 0.93.
9 9

16 16
c) tercer paso. Determinacin de la regin crtica.
Z = Z 0.01 = -2.33.

d) Cuarto paso. Decisin estadstica.


Se rechaza H0, si Z < Z .
0.93 < -2.33 (falso). Se acepta H0.
e) Quinto paso. Conclusin.
Se puede concluir con una confianza del 98% que: la embotelladora usar las
botellas del tipo 1, ya que su resistencia a la presin interna es mayor o igual
a 5 libras.

PRUEBA DE HIPTESIS PARA DIFERENCIAS ENTRE MEDIAS,

1 y 2 .
2 2
CUANDO SE DESCONOCEN LAS VARIANZAS

Es muy comn comparar dos promedios de dos poblaciones en las cuales se desconocen
sus varianzas.
Supongamos que x 1 y x 2 son medias de dos muestras aleatorias independientes de
tamao n1 < 30 y n2 < 30, seleccionadas de poblaciones normales que tienen medias 1

y 2 y varianzas desconocidas, pero iguales ( 12 = 2 ). Supongamos ahora que se


2

desea probar, sobre la base de estas muestras, la hiptesis nula:


H0: 1 - 2 = D0, donde D0: es la diferencia hipottica.
Entonces el estadstico de prueba es:

t
x 1 x 2 D o , donde:
1 1
sp
n1 n 2

2

n1 1s12 n 2 1s 22
s
n1 n 2 1
p

a) Contra la alternativa: H1: 1 - 2 D0, la regin crtica es:


t < t (/2), (n1+n2 -2) o t > t (1-/2), (n1+n2 -2)
t /2 y t 1-/2: valores crticos

b) Contra la alternativa: H1: 1 - 2 < D0, la regin crtica es:


t < t , (n1+n2 -2), t: valor crtico

c) Contra la alternativa: H1: 1 - 2 > D0, la regin crtica es:


t > t 1- (n1+n2 -2), t1-: valor crtico.

85
En cualquiera de los casos si se cumple la relacin en las regiones crticas se rechaza la
hiptesis nula, en caso contrario se acepta.

Ejemplo
La estatura media de 25 estudiantes de la carrera de ingeniera civil es de 68.2 pulgadas
con una desviacin estndar de 2.3 pulgadas, mientras que 25 de ingeniera Agrcola
promediaron 67.5 pulgadas de estatura con desviacin estndar de 2.8 pulgadas. Se
podra afirmar que los que estudian civil sean mas altos que los que estudian agrcola,
probarlo con = 0.05.
Solucin
En este caso se desconocen las varianzas de las estaturas de los estudiantes de ambas

1 2 ), adems los tamaos de


2 2
carreras, entonces supondremos que son iguales, ( =
las muestras son menores que 30. = 0.05. Usaremos t de student.
n1 = 16, x 1 = 68.2 pulg, S1 = 2.3.
n2 = 16, x 2 = 67.5 pulg, S2 = 2.8
a) primer paso. Planteamiento de las hiptesis.
H0 : 1 - 2 = 0
H1: 1 - 2 > 0
b) segundo paso. Seleccin del estadstico de prueba.
2 2
s
2 16 (
2.3 ) 16 (2.8 ) = 7.001, entonces Sp = 2.646.
p 30
t
68.2 67.5 0
= 0.935.
1 1
2.646
25 25
c) tercer paso. Determinacin de la regin crtica.
t 1-, 30 = t 0.95, 30 = 1.697.
d) Cuarto paso. Decisin estadstica.
Se rechaza H0, si t > t0.95 ,30
0.935 > 1.697 (falso). Se acepta H0.
e) Quinto paso. Conclusin.
No hay razn para dudar que los que estudian Civil sean mas altos que los que
estudian Agrcola, con una confianza del 95%.

Nota: Si las varianzas poblacionales son desconocidas y los tamaos de las muestras son
lo suficientemente grande (n 30), tomadas de dos poblaciones que son normales,
entonces se utiliza el estadstico de prueba para cuando las varianzas son conocidas y las
desviaciones estndar poblacionales se estiman con las desviaciones estndar de las
muestras.

Ejemplo
Interesa comparar los caudales de un ro en los meses de Agosto y Septiembre. En los
Treinta y un das del mes de Agosto el caudal promedio fue de 8.85 pies 3 por segundo
con una desviacin estndar 2.5 pies3 por segundo. En los treinta das del mes de
Septiembre el caudal promedio fue de 7.95 pies3 por segundo con una desviacin estndar

86
1.8 pies3 por segundo. Hay evidencia suficiente para decir que en esos dos meses, el ro
tiene diferentes caudales, con un nivel de significacin de 0.05.
Solucin
En este caso se desconocen las varianzas poblacionales pero, los tamaos de las muestras
son mayores o iguales a 30. Usaremos la normal y estimaremos las varianzas.
n1 = 31, x 1 = 8.85, S1 = 2.5.
n2 = 30, x 2 = 7.95, S2 = 1.8
a) primer paso. Planteamiento de las hiptesis.
H0 : 1 - 2 = 0
H1: 1 - 2 0
b) segundo paso. Seleccin del estadstico de prueba.

z
8.85 7.95 0 = 1.617.
2 2
2 .5 1 .8
31 30
c) tercer paso. Determinacin de la regin crtica.
Z/2 = Z0.025 = -1.96, Z 1-/2 = t 0.975 = 1.96.
d) Cuarto paso. Decisin estadstica.
Se rechaza H0, si Z < Z /2 o Z > Z 1-/2
1.617 < -1.96 o 1.617 > 1.96. (Falso). Se acepta H0.
(F) (F)
e) Quinto paso. Conclusin.
Se puede afirmar con una confianza del 95% que no hay diferencia en los
caudales de dicho ro, en los meses de Agosto y Septiembre.

PRUEBA DE HIPTESIS RELATIVAS A LA PROPORCION


CON UNA SOLA MUESTRA.

Con muestras pequeas, tomadas de una poblacin binomial se puede probar la hiptesis
de que la proporcin P: nmero de xitos, sea igual a algn valor dado, (P 0). La variable
adecuada para efectuar esta prueba es la binomial.

Para probar la hiptesis: H0: P = P0


H1: P < P0, con un nivel de error .
Se usa la distribucin binomial para obtener el valor: P = p(X x, n, p = P0).
Donde x: es el # de xitos en la muestra.
Se rechaza H0, si P .
Para probar la hiptesis: H0: P = P0
H1: P > P0, con un nivel de error .
Se usa la distribucin binomial para obtener el valor: P = p(X x, n, p = P0).
Donde x: es el # de xitos en la muestra.
Se rechaza H0, si P .
Para probar la hiptesis: H0: P = P0
H1: P P0, con un nivel de error .
Se usa la distribucin binomial para obtener p(X x, n, p = P0), luego se obtiene el
valor: P = 2p(X x, n, p = P0).

87
Donde x: es el # de xitos en la muestra.
x x
Se rechaza H0, si: > P0 y P o < P0 y P .
n n

Ejemplo
Una empresa que vende e instala paneles solares, afirma que en una comarca de un
municipio del departamento de chontales, el 10% de las casas poseen este tipo de energa
alternativa. Que dira usted, si en una muestra de 16 casas tomada en dicha comarca
solamente una tiene panel solar, utilice = 0.05.
Solucion
H0 : P = 0.1
H1 : P 0.1
Hallemos el valor de P , P = 2P(X 1, n = 20, p = 0.1). Buscando en la tabla binomial la
probabilidad: P(X 1, n = 16, p = 0.1) = F(1) = 0.5147.
P = 2(0.8108) = 1.0294.
x
Si esto es cierto < P0 y P , se rechaza la H0.
n
1
= 0.0625 < 0.1 y 1.6216 0.05 (la conjuncin es falsa)
16
(F) (F)
Conclusin: Se acepta la hiptesis nula, por lo tanto la empresa que vende paneles solares
tiene razn en dicha comarca, esto se afirma con un nivel de error de 0.05.

Nota: Cuando el tamao de la muestra es lo suficientemente grande el calculo de


estas probabilidades se pueden obtener a travs de aproximacin a la normal.

Veamos el siguiente ejemplo.

Ejemplo
Para el examen de admisin que se practica anualmente en la UNI, se afirma que no ms
del 5% de los bachilleres que lo realizan lo aprueban. En una muestra tomada al azar de
200 de estos alumnos 8 aprobaron, probar lo dicho con = 0.05.
Solucion
H0 : P 0.05
H1 : P > 0.05
Para hallar el valor de P, con la binomial el planteamiento sera:
P = p(X 8, n = 200, p = 0.05).

Calcularemos esta probabilidad, aproximando a la normal:

p(X 8, n = 200, p = 0.05) p(x > 7.5) = 1- (z),


x
donde Z =

Como el problema es binomial, obtenemos = np y 2 = npq, entonces:
= 200(.05) = 10 y 2 = 200(0.05) (0 .95) = 9.5, = 3.0822.

88
x
Z= = (7.5 10)/3.0822 = -0.81.

p(X 8, n = 200, p = 0.05) p(x > 7.5) = 1- (z)= 1 - (-0.81)
= 1 - 0.209 = 0.791. Por lo tanto:
P = 0.791 0.05, es falso, por lo tanto se acepta H0.
Concluimos que es correcta la afirmacin, con = 0.05.

PRUEBA PARA LA DIFERENCIA DE PROPORCIONES.

La prueba para comparar dos proporciones poblacionales, la veremos para muestras


grandes, donde el estadstico de prueba ser la variable normal estndar:

Z=
p1 p2 p1 p2 =
p1 p2 D0
p1 q1 p2 q2 p1 q1 p2 q2

n1 n2 n1 n2
Es comn, en este tipo de problemas, desconocer las proporciones poblacionales, en esta
situacin se consideran: P1 = P2 y q1 = q2, sustituyendo en la expresin anterior:

Z=
p1 p2 D0 , donde el valor de P se estima por: P = n1p1 n2 p2 .
1
pq
1 n1 n2

n1 n 2
Para: H0: P1 - P2 = D0, donde D0: es la diferencia hipottica.
a) Contra la alternativa: H1: P1 - P2 D0, la regin crtica es:

Z < Z /2 o Z > Z 1-/2 , Z /2 y Z 1-/2: valores crticos


b) Contra la alternativa: H1: P1 - P2 < D0, la regin crtica es:
Z < Z , Z: valor crtico

c) Contra la alternativa: H1: P1 - P2 > D0, la regin crtica es:


Z > Z 1- , Z1-: valor crtico.

Ejemplo
En un estudio para medir la proporcin de los habitantes de dos barrios de Managua que
estn en desacuerdo con la construccin de una antena para telefona celular, se encontr
que 48 de 200 del primero estn en desacuerdos en la construccin, mientras que 38 de
160 del segundo barrio tambin estn de acuerdo. Existe alguna diferencia significativa
entre las proporciones de residentes de ambos barrios que estn en desacuerdo con la
construccin de dicha antena, probarlo con = 0.05.
Solucion
p1 = 48/200 = 0.24. (En desacuerdo del primer barrio)
p2 = 38/160 = 0.2375. (En desacuerdo del segundo barrio)

89
a) primer paso. Planteamiento de las hiptesis.
H0: P1 - P2 = 0
H1: P1 - P2 0
b) segundo paso. Seleccin del estadstico de prueba.

n1p1 n 2 p 2 200(0.24) 0.2375(160)


Primero estimemos P y q: P = = = 0.239,
n1 n2 200 160
Entonces: q = 0.761.

z
0.24 0.2375 0 = 0.055.
1 1
0.239(0.761)
200 160
c) tercer paso. Determinacin de la regin crtica.
Z/2 = Z0.025 = -1.96, Z 1-/2 = t 0.975 = 1.96.

d) Cuarto paso. Decisin estadstica.


Se rechaza H0, si Z < Z /2 o Z > Z 1-/2
0.055 < -1.96 o 0.055 > 1.96. (Falso). Se acepta H0.
(F) (F)
e) Quinto paso. Conclusin.
No hay diferencia significativa en la proporcin de habitantes de los dos barrios
que estn en desacuerdo con la construccin de dicha antena, con una
confianza del 95%.

PRUEBA DE HIPTESIS RELATIVA A LA VARIANZA

En esta seccin estudiaremos el problema de hiptesis relacionadas a la varianza de una


poblacin. Estas pruebas son necesarias, por ejemplo: si desea controlar la variabilidad o
uniformidad de un producto o de un trabajo.

Para probar la hiptesis nula: H0: 2 = 20, en base a una muestra aleatoria tomada de
una poblacin normal con varianza: 20, el estadstico de prueba adecuado es la variable
aleatoria que tiene distribucin Ji-cuadrada con n-1 grados de libertad:
(n 1) s 2
x2 .

2
0
a) Contra la hiptesis alternativa: H1: 2 20, la regin critica es:

1 / 2 / 2
2 2 2 2
o
b) Contra la hiptesis alternativa: H1: 2 < 20, la regin critica es:

1
2 2

c) Contra la hiptesis alternativa: H1: 2 > 20, la regin critica es:

2 2

Los valores crticos se buscan en la tabla Ji-cuadrada con: v = n-1 (grados de libertad).

90
Ejemplo

Una compaa que produce arandelas afirma que la variacin cuadrtica del dimetro
interno es de 0.0002 cm2. Una muestra aleatoria de 10 de estas arandelas dio una
desviacin estndar de 0.02 cm. Si se supone que las medidas de estos dimetros se
distribuyen normales, habr evidencia para refutar lo afirmado por la compaa?
Solucion
= 0.05, n = 10, S = 0.02 cm., S2 = 0.0004 cm2

a) primer paso. Planteamiento de las hiptesis.


H0: 2 = 0.0002 cm2
H1: 2 0.0002 cm2
b) segundo paso. Seleccin del estadstico de prueba.
(9) 0.0004
x2 = 18.
0.0002
c) tercer paso. Determinacin de la regin crtica.

1 / 2 = 0.975 , 9 = 19.02 / 2 = 0.025 , 9 = 2.7


2 2 2 2
o

d) Cuarto paso. Decisin estadstica.

1 / 2 / 2
2 2 2 2
Se rechaza H0, si o
18 < 19.02 o 18 > 2.7 (Verdadero). Se rechaza H0.
(v) (V)
e) Quinto paso. Conclusin.
Con un 95% de confianza se puede refutar lo que dice la compaa productora de
arandelas.

EJERCICIOS RESUELTOS

1. un ingeniero que trabaja para un fabricante de llantas investiga la duracin de


un compuesto nuevo de caucho. Para ello construye 16 llantas y las prueba en
una carretera hasta que dura la vida til de estas. Los datos obtenidos en Km.
son: 60613, 59836, 59554, 60252, 59784, 60221, 60311, 50040, 60545, 60257,
60000, 59997, 69997, 60135, 60220, 60523. al ingeniero le gustara saber si la
vida til promedio de la nueva llanta excede los 60000 km. Pruebe las hiptesis
apropiadas a un nivel de significacin del 5%.
Solucin
Se desconoce la varianza y n < 30.
n = 16, x 60142.5625 , S = 3654.913, = 0.05.
a) primer paso. Planteamiento de las hiptesis.
H0: = 60
H1: > 60
b) segundo paso. Seleccin del estadstico de prueba.
60142.8125 6000
t= = 0.1563
3654.913
16
c) tercer paso. Determinacin de la regin crtica.

91
1

t (1-), (n-1) = t 0.95, 15 = 1.753


d) Cuarto paso. Decisin estadstica.
Se rechaza H0, si t > t (1-), (n-1)
0.1563< 1.753
(F) Se acepta H0.
e) Quinto paso. Conclusin.
La vida til de las llantas no excede los 60000 km, con un nivel de error del 5%.

2. Se realiz un estudio sobre la economa de combustible para dos marcas de


automviles, uno Europeo y el otro Norteamericano. Para ello se escogi un
vehiculo de cada marca y se observ el rendimiento en kilmetros para diez
tanques de combustible en cada automvil, los resultados fueron los
siguientes, (Km. por galn):
Norteamericano: 24.7, 24.9, 24.8, 24.6, 24.9, 23.9, 29.7, 24.9, 24.5, 24.8
Europeo: 41.7, 42.8, 42.3, 42.4, 41.6, 39.9, 39.5, 40.8, 41.9, 29.6
Los datos apoyan la afirmacin de que el rendimiento en kilmetros del vehiculo europeo
es al menos 15 Km. por galn mayor que el norteamericano?
Solucin
Se desconocen las varianzas y los tamaos de muestras son menores a 30.
= 0.05.
Americano Europeo
n1 = 10, n2 = 10
x 1
= 24.67 2
= 40.25
x
S1 = 0.302 s2 = 3.893
a) primer paso. Planteamiento de las hiptesis.
H0: 2 - 1 15
H1: 2 - 1 < 15
b) segundo paso. Seleccin del estadstico de prueba.
t = x x d 0 = 40 . 25 24 . 67 15 = 0.1563
2 1
1 1
2 . 754
sp 1 1
n1 n 2
10 10

s
2

9 0 .302 2 9 3 .893 2 = 7.58,
p 18
sp = 2.754
c) tercer paso. Determinacin de la regin crtica.
-t (1-), (n-1) = -t 0.95, 15 = -1.734
d) Cuarto paso. Decisin estadstica.
Se rechaza H0, si t < t (1-), (n-1)
0.471< -1.734
(F) Se acepta H0.
e) Quinto paso. Conclusin.
Se puede afirmar que el rendimiento del vehiculo europeo es al
menos 15 Km. por galn ms econmico que el norteamericano,
con = 0.05.

92

Vous aimerez peut-être aussi