Vous êtes sur la page 1sur 462

?

ESTAASVTCA

illtodos y Z\pficaciones

Iidtin Galinclo

I'3O CII:N CIA EDITOI3ES

20ll

Captulo

Anlisis Exploratorio de Datos


Nuestra

fe en Dios. El resto debe produc'ir datos.


Annimo

En cualquier actividad de Ia ciencia, la tcnica, Ios negocios o de la vida cotidiana, que d como
resultado una serie de mediciones, se obtiene ms informacin que las simples cifras recolectadas. El
cmo conseguir la informacin, su anlisis e interpretacin se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las caractersticas ms importantes de los datos obtenidos.
Los datos pueden ordenarse en tablas; sin embargo, stas no muestran su comportamiento global.
Su representacin grfica ayuda a captar fcilmente tendencias y establecer modelos probabilsticos.
Conjuntamente con el empleo de mtodos numr'icos sencillos, se puede presentar datos, resumir informacin y dar una respuesta rpida del comportamiento global de Ias unidades de donde provienen
dichos datos.
En este captulo examinaremos varios de estos mtodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadstica.

1.1.

Introduccin

En primer lugar, demos una definicin de la ciencia Estadstica que recoge mucho de lo que ella realiza.

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a


individuos, grupos, series de hechos, etc. y deducir de ello, gracias al anlisis de estos datos. unos
significados precisos o unas previsiones para el futuro.

1.1.1. Divisin de la Estadstica


Para su mejor estudio, a Ia Estadstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.

La Estadst'ica Descriptiua -tambin conocida como An.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentacin de datos en forma de tablas y grficos. Est diseada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como
:ales.

Capitulo

7.

AnIsis Exploratorio de Datos

se deriva de mur:stras, de observrciones hechas slo rcerca de una parte de


un conjunto numeroso de elementos y esto irnplica qrre su anlisis requiere de generalizaciones que van
ms all de Ios datos. Como consecnerrcia, la caracter'stica ms importante del reciente crecimiento
de la Estadstica ha sido un cambio err el nfasis de los mtodos que describen a mtodos que sirven
para hacer generalizaciones. La Estadstica Inferencial investiga o analiza una poblacin partiendo de
la informacin obtenida a travs de muestras.

La Esto,dstica I'nferencial

!.L.2. Algunos problemas que resuelve la Estadstica


Para aplicar los mtodos estadsticos a la informacin disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.

Descripcin de datos. El primer problema que, histricamente, aborda la Estadstica es la descripcin de datos. Supongamos que se han tomado ciertas mediciones, que pueden ser los gastos de
alimentacin en las familias, la produccin de las mquinas de un taller, o las preferencias en un grupo
de votantes. Se trata de encontrar procedimientos para resumir Ia informacin contenida en los datos.

Anlisis de muestras. Es frecuente que, por razones tcnicas o econmicas? no sea posible estudiar
los elementos de una poblacin. Por ejemplo, para determinar Ia opinin de la poblacin ante las
elecciones solo se investiga a un grupo pequeo, ya que es imposible consultar a todas las personas
en capacidad de votar. Anlogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricacin o para de terminar el nivel de ocupacin de la poblacin.

La Estadstica se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
poblacin a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:

Decidir si un proceso industrial funciona o no adecuadamente, de acuerdo a las especificaciones.

Estudiar la relacin entre consumo de tabaco y cncer.

hzgar respecto a la demanda potencial de un producto, mediante un estudio de mercado.


Orientar la estrategia electoral de un partido polltico.
Interpretar una prueba de inteligencia.

Medicin de relaciones. Los gastos en alimentacin de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cul ser el ga.sto de una familia de ingresos dados. Entonces,
no existe una relacin exacta, sino estadstica. Determinar y medir estas relaciones es importante
porque, debido a los errores de medicin, las relaciones que observamos entre variables fsicas, sociales
o tcnicas son, casi siempre, estadsticas.
Preguntas como: Depende la calidad de un producto de las condiciones de fabricacin y transporte?
Cmo se relaciona el rendimiento escolar con variables familiares o sociolgicas? Cul es la relacin
entre desocupacin e inflacin?, se responden en trminos estadsticos.
econmicas y fsicas tienen cierta inercia en su evolucin y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo prra prever su comportamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconmicas.

Prediccin. Muchas variables

7.2. Definiciones bsicas

1.1.3. Obtencin de informacin


Cuando se examina un proceso o un fenmeno podemos producil una variada informacin, entonces
es preciso determinar cul es la de inters para Ios fines que tengamos y cmo conseguirla; as mismo,
se debe tener una idea del nmero de observaciones que son necesarias para disponer de informacirr
confiable.

Para la obtencin de informacin estadstica se emplean dos formas bien diferenciadas: los mtodos
de muestreo y los experimentos diseados.
Una investigacin por muestreo es un estudio cuya finalidad es la recoleccin de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.
Un experimento es cualquier proceso o estudio en el que se realiza una recoleccin de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparacin de una nueva
aleacin de acero para usar en los automviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.

L.2.

Definiciones b:sicas

Las que antes indicamos son las principales aplicaciones de la Estadstica, cuando esta ciencia se
utiliza para analizar procesos o fenmenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la Estadstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.
Aqu surgen varias ideas importantes en todo anlisis estadstico: la unidad muestral,la poblacin (o
uniaerso) y la muestra.

Definicin (de unidad muestral o experimental) Una unidad

es una persona,

animal, planta o

cosa que es examinada por un investigador; es el objeto bsico sobre el cual el estudio o experimento
se lleva a cabo.

Por ejemplo, una persona, un mono, un plato de semillas, un grupo de facturas.

Definicin (de poblacin o universo) Una poblacin

es una coleccin completa de personas,

animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.

Definicin (de muestra)

Es un grupo de unidades seleccionadas de la poblacin de acuerdo con


un plan o regla, con el objetivo de obtener conclusiones sobre la poblacin de la cual proviene.

EI nrmero de unidades que constituyen la muestra se denomina tamao muestral.


Generalmente, se selecciona una muestra porque la poblacin es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la poblacin general, lo que se logra mediante
una seleccin al azar de las unidades. Tambin, es importante que el investigador defina, completa
y cuidadosamente, la poblacin antes de recolectar una muestra, incluyendo una descripcin de los
miembros a ser seleccionados.

A continuacin damos varios ejemplos:

Captulo

7.

Anlisis Exploratorio de Datos

7.

Se desea establecel

2.

En un estudio se quiere conocer el <<rating>> de sintona de los canales de teievisin de una


ciudad. La poblacin est constituida por los hogares que poseen televisor y una muestra Ios
hogares de 40 manzanas distribuidas en la ciudad.

3.

Una duea de almacn desea estimar el gasto medio de compra de sus clientes en su almacn
en el ltimo ao. La poblacin es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, servira para tener una idea del
gasto medio de los clientes.

la estructula demogrfic4, pol edad, de lti poblacin ecuatoriana. El universo


Io forman los datos de nacimientos existentes en las ofi.cinas clel Registro Civil. Una mr-restra
puede ser tomada considerando las persolas cuyo apellido comienza con ia letra A.

En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser sta.1

I-.3. Datos y escalas de medicin


A

Ias mediciones o valores obtenidos en un estudio estadstico se los denomina datos provenientes de

una variable estadstica.

1.3.1. Tipos de datos


Los datos pueden ser:

1. Cualitativos (Descriptivos

o categricos): Cuando ellos describen caractersticas que no

son

medibles; por ejemplo, el sexo de un animal, el color de los zapatos, la profesin de una persona.

2. Cuantitativos

(Numricos): Cuando ellos describen caractersticas que son medibles; por ejemplo, la temperatura del ambiente, el nmero de hijos de un matrimonio, el salario de una persona.

A su vez, las variables cuantitativas se clasifican en discretas y en continuas.

Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones


que pertenecen a l son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el nmero de clientes que ingresa a un almacn en un da, el
nmero de aos que vive una persona.
Datos continuos. Un conjunto

de datos se denomina continuo si Ios valores u observaciones que


pertenecen a l pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.

L.3.2.

Escalas de medicin

Definicin (de escala de medicin) Una escala de medicin

es un instrumento de medida con

el que se asignan valores a las unidades estadsticas.


I

La eleccin apropiada de las muestras se explicar en profundidad en el Captulo

13

7.4. Caracterst,icas de los datos


Escala nominal' Un conjrrnto de clatos cst mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a 1 se lcs puedc asignar un cdigo, en la forma cle nn nrimero, clonde los nrmeros
sor simplemete ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclenclos o medios.

Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cst medido <:n esca,la ord.inal si a los valores qne per.tenecen a
l se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categoras, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la seal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y psima. Un puntaje de
b indica
mejor seal que un puntaje de 4. As, los datos resultantes son ordinales.

Escala de intervalo. Un conjunto de datos est medid o en escala d,e interualo si los valores que
pertenecen a l pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particularidad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son vlidas las operaciones de adicin y sustraccin) pero no las de multiplicacin y divisin.
Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centgrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).

Escala de razn. Un conjunto de datos est medido en escala d,e razn si los valores que pertenecen
a l pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
vlidas las operaciones de adicin, sustraccin, multiplicacin y divisin.
Ejemplos de datos en escala de lazn son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida rtil de una mqnina.

1.3.3. Valoresatpicos

Un valor atpico -tambin denominado valor inusual o valor extremo- en un conjunto de datos,
es
una observacin que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeo, cotriparado con Ios dernis.

Un valor atpico

>uede ser el rcsultado de un error en una medicin, en cuyo caso distorsiona Ia


interpretacin de los datos al tetrer una influencia excesiva sobre los clculos a partir
de la muestra.
Si el valor atpico cs un lesultado genuino es importante, porque podra indicar nn
compoltamicnto
extremo del proceso en estudio. Por esta razn, toclos los valores atpicos deben
ser exarniados
cuidadosamente antes de rcalizar un anlisis formal y no se los debera eliminar
sin una.justificacin

pre\1a.

L.4.

Caractersticas de los datos

Todo conjunto de datos presenta ciertas caractersticas que perrniten, en rlna pr.imera
aproximacin,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
caractersticas
son: la localizacin, la dispersin y la simetra.

Captulo 7. AnIisis Exploratorio de Datos


o tr ocalizacin. La krcaliztcin
En gc'rrcr:rl,

se rrricle

<le nn conjrrnto clc clatos cs la Posicin lelatir'r cltic cllos lllesentan.


la localizrcin lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.

r,:rr la rnedici<in cl<r la rstrttu'r rl<,r lrrr grlipo de personirFj) l)s medicioncs estrr'n
entre los trcirrta centrnetlos (clc los rccirr naciclos) y los cLos mctlos veinl,e centnetros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.

Por cljernplo,
localiza,cl.s

La iclea de localizacin

fr-ic introcluci<la

por R. A. Fisher er 7922.

Dispersin. Los

valores obtenidos en url mnestra no son todos iguales. La valiacin cntre


sc
estos valoles
denomnzt dispe'rsin. Curndo sc mide la dispersin sc desea dctectar el grado
de disemirracin de los valores individuales alrededor del centro de ias observaciones.

En los procesos de manufactura o de medicin) una alta precisin est asociada con una baja
dispersin.

El concepto de dispersin fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887)

identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.

Simetra y asimetra. Un conjunto de datos es sirntrico cuando los valores de los datos estn
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simtricos:
1.

Son fciles de interpretar, pLles los dal;os cre estn por encima y por debajo del pr.rnto medio

pueden sel considelaclos con un misrrio critcrio;


2.

Pelmitcn la fcii deteccin de valores atpicos;

d.

Adrniten la comparacin con conjurrtos de datos similales, en tr'minos de la dispersin.

Figula 1.1: Forma csqucrntica

cle clatos simtricos

y asimtricos.

La asimctra cn un conjrtnto cie datos es el lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rns alejados qrre 1os \rlores
clue se enclrerrtran cn ei otro lrdo.

1"5. Distribucin
La distribuci,n

de f,recuenaias

de ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos dtos dc rnancra qlle sc ponga de maniliesto l locrlizacin y Ia clispersin de lrs olserva-

cloLcs.

7.5. Distrbucin de frecuencias


Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegr'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.lnr \rez qlle se los ha dividido cn grupos serrsiltlcs.
Si se dispone (le un nrrnelo alto dc obsclvacioues) r, se procede r cstablccel cr,rntas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta informacin b,sicr se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.
Par'r

la confeccin de ltna tabla, de distribucin dc frecuencias es lecomcrrdablc segu.ir los sigrrientes

Pasos:

Procedirniento.

1.

Se

ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuacin

sus frecuencias absolutas n1,

2.

TL2

... n.

Ntese que

D rLi:
i:r

n.

Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n para el nrmero total de observaciones: / - 3. Xo es ms que
TL

la proporcin de aparecimiento de cada observacin.

3.

Pueden, tambin, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones anteriores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de nmeros flaccionarios.

Una tabla de distribucin de frecuencias tiene cl siguiente aspecto:

Valor de la
variable (r)

Frecuencia
absoluta (n)

rI

TL1

tr2

n2

rk
Total

Fbec. absoluta
acumulada (/,)
l/r : nr
Nz: Nt * nz

l/:l/-1

TLI,

Flec. relativa
acumulada (8,)

FYecuencia

relativa (/')

Ft: ft
Fz: Ft t

ft
Jz

*n

fz

F*:Fn:I.fn

fr

Ejemplo. En nna fbrica de muebles de rnaclera, se contlol

e1 tiempo (en minutos) neccsario para


completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:

32.9

JJ.4

Dt <
.)r).J
at o

33.6
33.6

JJ.r)

,ta
JJ.

33.8
32.9

tto
33.8

.'),

JJ.J

32.8

J.).1

.1.). i )

J,]..)

33.5

33.6
34.4
33.0

.4

33.6

33.8

33.9

.)J. J

JJ.I)

33.6

,]to

t')

J.4

-L

t).!

JJ.

ot 1
r)r).1

,),).

t)

.1.).)
r)r).,)

.lc r

r)

Ji.-

,)

33.6

.\

,/
1
J+.1

'?a

33.9

33.8

c.t o
.ltr-L

tD t
r).).r)

33.9

34.0

,1.).J

32.9
,u q
.),)-i

.)

'),)
JJ.A

33.6

J. i)

JJ.

. i

1'),4

.)

a.)

.).).,)

1D
JJ.t
tt 1
JJ. l.)t
!)().+

:'t3.0

tD
,),).4
^

OD D
JJ.J

J.+

33.6

33.6

DD
rlJ.+

33.0

'12

r)

,j.l
JJ.1

33.6

JJ.U

33.6

33.1

,),
JJ.

.),)..)

33.0

.).) ,.)

33.4

J.

34.0

,1,1.

to

.),). I

J.J.

')

J+.1

J.J.

Dt(
r),).rl
2q7

tao

L)J.+

.),1.

33.1
.)t r
r)r).J

33.9
1') n

il

33.6
,-),1.,

33.8

iJ

r',

33.8
33.0

Capitulo
La sigr-riente taJrla rrnrestra

li

7.

Anlisis Exploratorio de Datos

clistrilrrcin cle flecrrerrcits dc clatos illrliviclrtrlns (crr 17 r':rl,rres).

(rnin)

f,tecuencia
absoluta (n)

,t:.1
32.8
32.9
33.0

,t 1I
r)J.
aD o

28

JJ.J

10

JJ.4

t2
I4

38
50

33.6

13

64
77

.)).

85

Tierrrpcr

F\'ec. rbsoluta
acurmrlada (;\)

Fl"ecuencia
rela.tiva ( l )

F!'cc. relrtiva
acurnulada (,F,)

0.01

0.01

0.01

003

0.02
0.05

10

19

33.8
33.9
34"0

9r

0.05
0.09
0.09
0.10
0.12
0.14
0.13
0.08
0.06

95

0.04

97

34.t

t a

99
99

34.3
34.4

99

r00
r00

0.02
0.02
0.00
0.00
0.01

Total

0. 10

0.19
0.28
0.38
0.50
0.64

0.77
0.85
0.91
0.95
0.97
0.99
0.99
0.99
1.00
1.00

Sc ha presentado una distribucin de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, informacin resunicla, puede ser conveniente resumirla arr.
rrrtis, c;r'eando clrses. La agrr-rpac:in cle clatos cn clrscs sirnplificir Ia presentacin y el estuclio cle la
distribucin) allnqlle se pierden algunos rleta,lles.

A continuacirr
agmpatlos en

sc enLlnleran los ptrsos a scguir para

constrllir una clistribr-rcin de fiecnencirs

cle dat,os

clrses:

Decida el nmero de clases (ft). La

siguienl,e talrlr puccle clar rura olientacin adccuada cn

Ia rnayor'tr de los casos.

Nmero de

Nmero de clases

observaciones

recomendado

20-50

51

100

- 2U0
- 500
501 - 1000
101
201

10

t|-20

rns clc 1000

Calcule la iongitud de ia clase. La longitrrcl clc la cllsc cs igual a Ia obsclrracin rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrrnrero
cor)venicnte) que tenga el mismo nurelo de decimales qlre los drtos.

li1 ttrcnor,

.4
,)

/nrx - frnn
k

Construya las clases indicando los cxtremos de Ias misrnas. Corro ayllda

parzr clculos

J)ostcIioICS:

a) El extremo inferior' (16)

plimera clase ser cl lrrrrero ilrnediatarnentc rnerror- a1 r'alor'


mnimo, quc tierle rrn clecirnrl rns y qlle terlnrna cn cncode

1a

7.5. Distribucin de frecuencias


b) f,os restantes extremos de las clases
clase al extrenro cle

c1rse

se obtienen ailadiendo repetidarnente la longitud de


anterior, hasta cnbrir todo el rango cle valolcs.

L, : Li-t I A, .j : i,2,...,k.
4

Marque cada observacin dentro de la clase que le corresponda. Determine la frecuencia


absoluta,

5.

7r,,

corrspondiente a cada clase.

Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda
las frecuencias lelativa y acumuladas) como se explic anteriorrnente.

a calcular

Observacin. El nmero de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).

Ejemplo. (Continuacin.) Construir una distribucin

de frecuencias por clases de los datos de las

mediciones del tiempo necesario para armar anaqueles.

Solucin: De acuerdo a la tabla los datos

se

distribuirn en k:7 clases. Los mximos y los mnimos

son:

r^5* --

34.4,

rm.

: 32.7,

rmx

trni.

L.7,

1n

longitud de la clase
que se redondea a

: ::: :0.24,
7

A:0.2.

Fijemos los extremos de los intervalos: el extremo inferior debe ser el nmero inmediatamente menor al
valor mnimo, que termina en 5 y tiene un decimal ms que los datos; es decir, Lo:32.65. Luego, Ios
extremos siguientes se determinan sumando, sucesivamente, 0.2 al extremo inferior hasta sobrepasar
el mximo valor de las observaciones:

L1 : Lo * A:
L2 : Lt * A:

*
32.85 *
32.65

:
0.2 :
0.2

32.85
33.05

Ls :

Le -l

A:34.25 *0.2:34.45

Finalmente, se determinan las frecuencias de cada clase.

A continuacin se muestran los resultados.


Tiempo
(min)
JZ.ti5 - J2.E5
32.85 - 33.05
33.05 - 33.25
33.25 - 33.45
33.45 - 33.65
33.65 - 33.85
33.85 - 34.05
34.05 - 34.25
34.25 - 34.45
Total

FYecuencia

absoluta

(n)

FYec. absoluta
acumulada (.11,)

-tYecuencia

relativa

(/)

Flec. relativa
acumulada (fl)
0.02

97
99

0.02
0.08
0.18
0.22
0.27
0.14
0.06

0.02

0.99

100

0.01

10

r8

28

22
27

50

t4

91

77

100

0.10
0.28

0.50
0.77
0.91

0.97

r.00
1.00

Ntese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.

10

Captulo

1.6.

7. Anlisis Exploratorio de Datos

Representaciones grficas
de los datos

una rnanera rntly eficiente cle co'oce.


el cornlo.ta'riento de un conjunto
grficamente' ya que permite
cre datos es rerrese'tar.lo
dar rtna descripciin a.
-"r,lr" rpida y rit de entender. La importancia
i"o de b e ir acomp aado
il:T:T.5 f*13,T# l.:, :ll" : ".o an ,isis ". t

i:

::rff

J.t

;Tfi:,::l

1.6.1. Diagrama de puntos


un

di'aqrama d'e puntos es una


forma de resumir datos cuantitativos,
en ra que cad.a observacin
se
si se disponu a"'lo,"r,os datos,
cada punro

;'":T::1,1J*?ll""Til*'q,,:T: ffiJ:

il#;'

El diagrama de puntos deja apreciar:

1'

Larocarizacin general de ras


observaciones.

2.

La dispersin de las observaciones.

3'

La presencia de observaciones
inusuales o valores atpicos.

se aconseja utilizar este diagrama


para representar hasta
un mximo de 20 0bservaciones
individuales,
ffi :JJ.:ffi
s e p ue d en combi
n ar

i;;#;,
*.
ru"' i","n,",."iuJl'TT:#il"l'?;:X[::?l".;;

.H;.:".rTT:i :::il'Ji :* ::,,'*x;:::.:

lli"t-,;,TJrij:"ffi"#::;HX'uu
cuando

se construye

au

iT;':

un.diagrama de puntos se
deben toma dos decisiones.
La primera es determinar
,,*u
apropiada que

;i,:JffffJil,:HTJ;:::il;.1*:: ;:;**:."","11fT1,,"*u,0" ;.;l;;

"."u,u
Para datos nominales u ordinales,
un diagrama de puntos es.simirar
barras reemplazadas por
a un grfico de barras, con
una serie de puntos. Para
ras
iatos contin,os, un diagiama
a un histograrl&, con ros
de puntos es similar
rectangurs ieemplazado,
oorl.,-riior. (vcase r" ,'"*io" r.o.a
#:;::i:;"t;1:"::"t'"T"1il mediciones (en milmetros) de ros das de lruvia en er verano de 2006

6'4 4'0 3'2 4'6 3'2 8.2 6.0 0-2


4.6 5.2 0.6 2.0 11.8
El diagrama de puntos est
dado en la Figura

1.2.

i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.
En el diagrama observamos que:

16.4 3.2.

7,6. Representaciones

o
a

grficas de los datos

11_

1.
2.

Los datcs estn agnrpados ccrca del valor 3, antes que, digamos B o 10.

3.

EI valor 16.4 puede ser calificado de atpico, porque se clcuentra alejado del grupo principal de

Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentracin entre 0 y 8.
datos.

L.6.2. Diagrama de tallo y hojas

;e

to

El diagrama de puntos tiene algunas desventajas: es difcil regresar de los puntos a los datos y puede
hacerse confuso si se tiene un nmero alto de datos. Entonces, es conveniente utilizar otras herramientas para realizar su representacin grfica.

El diagrama de tallo g hojas, que es una tcnica semigrfica que se emplea para ilustrar las principales
caractersticas de los datos (localizacin, dispersin y simetra). Adems, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.

Mediante un ejemplo, veamos cmo se realiza el diagrama, p6o a paso.


Consideremos los siguientes datos:
08

19

77

01

13

04

15

02

07

09

05

16

00

o4

01

12

es)

tar

tr

)o

A los datos los clasificaremos considerando las decenas; as tendremos dos grupos, uno que empieza
con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
0

rar

lue

las
ar

A continuacin, para cada observacin anotamos el segundo dgito (de las unidades) a la derecha
la barra vertical, que vienen a constituir las hojas. La primera observacin 08 da
0
1

006

Al agregar la segunda observacin 19, da


0
1

8
9

Y as, se van aadiendo las observaciones hasta obtener:


0
1

8L79542041
976352

Los valores que forman las hojas pueden reordenarse de menor a mayor, as:
0

0LI2445789

235679

de

12

Captulo

7.

Anlisis Exploratorio de Datos

Podemos crear dos categoras en cada una de las decenas, en las cuales los dgitos de las unidades del
0 al 4 formen un F,rupo y los dgitos del 5 a 9 foimen otro; de esta manera se tiene:
t)

r42047

8795

to

9765

Cuando los datos constan de ms de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarn;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:
qD
DJ

55

79

106

188

47

118

47

58

82

113

208

60

88

Se pueden realizar dos diagramas de

tallo y hojas:

33,47,47,55,58, 60, 79, 82,

06, 13, 18, BB


08, 48

248

88

que est agrupado por centenas. El siguiente diagrama est agrupado en intervalos de 50:

33,47,47
55,58,60, 79, 82,88

06, 13, 18

88

08, 48

Asimismo, se pueden usar diagramas mltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo comn y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:
ft

4371
9888655

310

99875

311

678
03

.)

44
5779
0L23344

la izquierda estn ms agrupados en los valores bajos, con un rango mayor


y fuerte asimetra; mientras que el conjunto de la derecha es muy simtrico y con menor dispersin.
Se observa que los datos de

Tambin, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:

1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5

1.6.

7.6. Representaciones grficas de los datos


El cliaglanra rcsrrltalte

13

<rs:

5568

0.
1.

236679

2.

02

1.6.3. Grfico de sectores y grfico de barras


Los grficos de sectoles

y de barras son dos formas de lrcsentar gr-tlficamente datos categricos.

Supongamos que los datos aparecen resumidos en una tabla como Ia siguierrte:

Categoras

FYecuencias

absolutas

(n)

Fbecuencias

relativas

Ct

f,

Cz

n2

fz

Cn

;,

Total

ir

n,

(/)

Un grfico de sectores es un crculo dividido en segmentos, donde el rea de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categora. El ngulo central de la categora es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el grfico, se suele indicar el nombre, el nmero de
elementos y el porcentaje de cada categora.
Tambin, se puede resumir datos cualitativos mediante rn gr.fi,co de baryas. En stos, los datos
del mismo ancho, cada uno de los cuales representa una categora
particular. La longitud (y por lo tanto el rea) de cada rectngulo es proporcional al nmero de casos
en la categora que representa.
se exhiben mediante rectngulos,

Si los datos son nominales, las categoras se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categoras deben estar ordenadas.
Los grficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectngulos. Junto a cada uno de los segmentos que componen el grfico se coloca el nombre

el nmero de elementos

y el porcentaje de cada grupo.

Con el grfico de barras se distinguen las principales caractersticas de los datos, como aquellas causas
que son ms importantes o que ms frecuentemente se presentan en un proceso. Tambin, tiene la
ventaja de que se pueden realizar gr,,ficos de barras agntpadas, que consiste en representar sobre el
mismo grfico ms de dos variables -siempre que estn medidas en las mismas unidades-, permitiendo
realizar comparaciones,

Ejemplo. En una empresa financiera,


marcas. Un

los empleados disponen de computadortrs porttiles de distintas


resumen del nmero de mquinas, de acuerdo a su respectiva marca, se presenta en el

siguiente cuadro.

de
Marca Nmero
respuestas

Toshiba
Dell
HP

135
76
53

%
42
23
16

de
Marca Nmero
respuestas
Lenovo
43
19
No sabe

%
13

t4

Captulo

7.

AnIisis Exploratorio de Datos

Representar mediante grficos de sectores

y de barras.

Solucin: Los grficos se encuentran err Ia Figura

1.3.

Toshiba

Toshiba Dell

HP

Lenovo

No sabe

Figura 1.3: Grficos de barras y de sectores.

L.6.4, Histograma
Un histograrna es un conjunto de rectngulos, cada uno de los cuales representa un intervalo de
agrupacin. Sus bases son iguales al intervalo de clase empleado en la distribucin de frecuencias
y las alturas son proporcionales a la frecuencia absoluta,fi, o relativa / de la clase.

El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atpicas

y cualquier brecha entre los datos.

Ejemplo. (Continuacin.) El histograma correspondiente a la tabla

de distribucin de frecuencias

de los tiempos de ensamblaje de anaqueles se presenta a continuacin.

Figura 1.4:

1.6.5. Polgono de frecuencias y ojiva


Un polgono de frecuencis es un grfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.

7.7. Ejercicios

15

La ojiua

es un polgono de frecuencias acumuladas; es decir, en las abscisas se colocan los lmites


superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es til para:
1.

Calcular el nmero o el porcentaje de observaciones que corresponden a un intervalo determinado


de Ia variable.

2.

Calcular los percentiles de la distribucin de los datos.

Ejemplo. (Continuacin.) El polgono de frecuencias y la ojiva, correspondientes a la tabla

de

distribucin de frecuencias de los tiempos de ensamblaje de anaqueles se presenta a continuacin.

Figura 1.5: Polgono de frecuencias y ojiva.


Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representacin grfica
correspondiente, es necesario disponer de valores que permitan describir y compara los conjuntos de
datos, mediante nmeros que indiquen su posicin, su variabilidad y su forma. sto se realiza con las
llamadas medidas estadsticas o simplemente estadsticos.

L.7.

Ejercicios

1.

D ejemplos (preferentemente de su propio campo) de poblaciones y muestras.

2.

Para cada uno de los distintos tipos de datos: discretos (categricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.

3.

En una encuesta de opinin acerca de las preferencias de bebidas gaseosas, por sus colores: negro
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:

l
i

N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I

Construya el grfico de sectores circulares.

4.

Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasificados segn su rendimiento acadmico en la materia lenguaje.

Calificacin %
Insuficiente 53
tre

ta.

Regular 26
Bueno
15
Muy bueno 5
Sobresaliente

Captulo

16

a)
b)
c)
E

i).

,Con qu

tipo

d<;

7.

Anlisis Exploratorio de Datos

datos esti ustcd tlalra,jauclo? Explique.

Retrlir:e los gr'ficos cle pastel

y dc barrtr,s clc los

drtos.

.Qu porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?

En Ia siguiente tabla se describe diferentes razas


vadas.
R,aza

basset
boxer'

bauceron

bulldog
caniche
chiguagua
cocker

colley
doberman
dogo

fox hound
galgo

labrador
mastin
pekins
podenco

pointer
san bernardo
teckel
teI'ranora

d<r

perros, segn varias caractersticas obser-

Tamao Peso Velocidad Agresividad Funcin


2
11
I
2
I
22
2
2

32
11
11
11
2I
32
32
33
32
32
22
32
11
22
32
33
11
22

r)

3
3
3
3
2

2
2
2

1
1

r)

2
2
2
3

2
2

donde la codificacin es la siguiente:

Tamao: 1 tamao pequeo; 2 tamao mediano; 3 tamao grande.


Peso: 1 peso pequeo; 2 peso mediano; 3 peso grande.
Velocidad: 1 velocidad leve;' 2 velocidad mediana; 3 velocidad grande.
Agresividad: 1 agresividad leve; 2 agresividad grande.
Funcin: 1 comparia;2 caza;3 utilidad.

a) A qu tipo de datos pertenece cada caracterstica definida en la tabla?;


b) Para cada variable, realice el grfico de pastel o el grfico de barras;
c) Compare los distintos grficos y deduzca cules variables estn relacionadas. Explique
respuesta.

6.

Se tiene

la siguiente informacin acerca de la composicin del cuerpo humano.

Figura 1.6: Distribucin de materiales en el cuerpo y distribucin de las proteinas.

su

t7

7.7. Ejercicios
,Qu porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?

7.

Se registr Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:

8.2
4.6
5.9
6.5

13.3

10.1

11.5

10.5
10.0

72.6

13.0
13.1
10.4

L2.7

10.8
15.0

13.5
t2.0
14.1
t3.2

7.6

r0.4

4.3

7.7

5.0

t2.0

8.3

13.6

a) Realice un diagrama de puntos para los datos;


b) Realice un diagrama de tallo y hojas;
c) Determine la tabla de frecuencias;
d) Dibuje el histograma;
e) Compare este ltimo con los diagramas de puntos y de tallo y hojas.
8.

La inversin anual, en miles de dlares, de una muestra de 40 pequeas empresas fueron:

36 19 29 37
2042534
27 77 31 10
46 26 12 23

33 22 29
24 27 27
28 15 41.
18 33 25

31 2L 35
24 26 31
30 18 39
28 23 28

a) Elabore una distribucin de frecuencias con 7 intervalos de clase;


b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversin entre 14 mil y
9.

10.

20 mil dlares.

Los ingresos mensuales de una muestra de pequeos comerciantes se tabularon en una distribucin de frecuencias simtrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mnimo 125 dlares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dlares y el 70 % de los ingresos son menores que 275 dlares. Cul es el
porcentaje de los ingresos que son superiores a 285 dlares?
Se tiene

la siguiente tabla acerca de las edades de los obreros de cierta empresa:


Edades

22-27
27

-32

32-37
37-42
42-47

No. de
obreros
L4
17

25
10

I4

Encuentre el porcentaje de obreros cuyas edades estn comprendidas entre 35 y 40 aos.

11. La siguiente

tabla muestra la distribucin de las notas en un examen.


Nota

No. alumnos

0-5

5-10

18

10-15

i5

r5-20

10

Qu porcentaje tuvieron una nota comprendida entre 8

17?

7.

AnIisis Exploratorio de Datos

18

Captulo

12

Al clasifical las no+"as cle 0 a 100 cn un exarnen,

13.

En la tabla se indi,can los tiempos de espera en las ventanilias de un banco.

se obtuvo una distribucin simt,rica, con 5


intervalos de clase de iglral ancho. Si el 10% desaprotr con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ,qrr porcentaje de alurrinos obtuvo una nota rnenor
de 60?

Tiempo (rnin)

03

Frec. absoluta

Frec. relativa

32

3-6
6-9

0.30

9-12
12-

005

0.10

15

Halle el tamao de Ia muestra y complete la tabla de distribucin de frecuencias.

14.

Los pesos de n artculos se ordenaron en una tabla de distribucin de frecuencias de 7 intervalos


de igual ancho de clase, donde: mn : 50 g, mx : 120 g.

Adems,

ft : fz, fs:

fs,

a) Determine el valor

b)

fs t fa I fz :0.36,

n1-l nz

n3 -r n4

-_-

560 y U.

:64.

de n;

Cuntos de estos artculos tendrn un peso mayor o igual a 60 g

15. Halle el tarnao de la muestra y

y menor a 110

g?

reconstruya Ia siguiente tabla simtrica de distribucin de

frecuencias.

Intervalo

Frec. absoluta

10- t2
12-

Frec. relativa

Frec. relativa
acumulada
0.24

0.52
5

18-20

16.

La tabla muestra la distribucin del ingreso familiar mensual de 80 familias.


Intervalo

- 680
- 720
720 - 760
760 - 800
800 - 840
640
680

Frec. absoluta

Frec. absoluta
acurnulada

48

60

Frec. relativa

0.r25
0.075

Determine el nmero de familias que tienen un ingreso menor a 800 dlares mensuales.

17.

Dado el siguiente histograma de frecuencias relativas.


[c, /], si el total de la rnuestra es de 400?

Cuntas observaciones hay en el rango

2(

7.7. Ejercicios

Figura

i8.

1_9

1.7:

En el siguiente grfico se muestra el consumo de energa en una fbrica.

Qu porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?

19

En la siguiente ojiva

se

representan los porcentajes de personas que componen un grupo de

personas) segn su edad.

100

55
45
25
10

12
Figura

17
1.9:

Determine qu porcentaje de personas tienen edades comprendidas entre 10 y 15 aos.


go

20.

Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.

Captulo

20

7.

Anlisis Exploratorio de Datos

/D

Figura 1.10:
Reconstruya la tabla de distribucin de frecuencias.

1.8.

Medidas de localizacin

Cuando se dispone de un conjunto de observaciones, es de inters encontrat el valor en torno al cual


se agrupan la mayora de ellas o el centro de las mismas. Las medidas descriptivas que permiten
especificar estos valores se denominan medidas de localizacin o md,idas de tendencia central.
Existe una amplia variedad de medidas de localizacin; nos concentraremos en las ms empleadas: el
promedio, la mediana, la moda, la media geomtrica y la media armnica.

1.8.1. La media muestral o promedio


Definicin (de promedio o media aritmtica) El promedio, notado como 7, de un conjunto
de n mediciones 21, r2t...,,rn es igual a la suma de sus valores dividido entre n; es decir,
n
&-

Drn
i=l

rt*rz*.'.*rn

Si las observaciones estn agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:

Observacin

Flec. absoluta

rI

fLy

I2

n2

rk

nk

donde n es la frecuencia absoluta de la observacin ,ri, el promedio se calcula por


k

Dnn'n
:t

I: ---=-,
n

&

COn

n:

sa

z_rn.
d:l

7,8. Medidas de localizacin

2L

Si los datos se presentan en una tabla de frecuencias, agrupados por clases:

se calcula el

Clase

LIC

LSC

Punto medio

Frec. absoluta

l1

5t

rl

Tr1

I2

S2

r2

TL2

t"

9p

;r

rLk

punto medio cle cacla clase rromo iri

:; l I

s' ' '

Q,:1,2,, .. , k) y el promedio es

rr,

i1

con 7:l

n.

i:7

Ventajas e inconvenientes del empleo del promedio:

ual
ten

;EI

1.
2.
3.
4.
5.

Se expresa en Ias mismas unidades que

la variable.

En su clculo intervienen todos los valores de la distribucin.


Es el centro de gravedad de toda la distribucin, representando a todos Ios valores observados.
Es nico.
Su principal inconveniente es que se ve afectado por la presencia de valores atpicos.

Ejemplos

1.

Calcular el sueldo promedio de diez personas que ganan (en dIares):

170 r72 168 165 173

Soluci,n: Se dispone de n

t78 180 165 767

172.

10 observaciones sin agrupar, entonces

11*rzl..'*rn

&-

n,

170

:
ro la

2.

+168 +

172

165

+ 173 + 178 +

180

165

767

r72

10

I7L.

Calcular la estatura promedio de 46 seoras, cuyas medidas se dan a continuacin.

Estatura
Flecuencia

1.45

1.48
4

1.50

1 It
t,du

1,55
72

1 ta
L,(, f

1.60

i.63

1.65
1

t)

Solucin: Como las mediciones estn agrupados en una tabla de datos individuales, aplicamos
Ia frmula que considera la frecuencia de cada una de ellas.
Tngase presente que el nmero de clases s k

y el tamao de la muestra

r:i:l

n'r
n,

2x

I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65


46

r.545.
Los 46 seoras examinadas tienen una estatura promedio de 1.545 metros.

es

n:

46.

Captulo

22
3.

7,

AnIisis Exploratoro de Datos

En una cooperativa de ahorro y crdito se realiz Ia tabla de frecuencias


ahorros de sus socios (en dIares), segn se presenta en la tabla,
Desde

Hasta

Fbecuencia

0
100

100
200

72

200

30

300
400

400

77

500

186

500

600

224

600

700

209

700

800

r22

800

900
1000

53

900

de Ios montos de los

28
46

19

Calcular el promedio de los ahorros de los socios de la cooperativa.

Soluci'n: Los datos estn agrupados en 10 clases. En primer lugar encontraremos el punto
medio de cada clase y los pondremos en la tabla:
Desde

Hasta

0
100

100

Punto medio

(z)

Flecuencia

50

72

200

150

28

200

30

250

46

300
400

400
500

350
450

186

500

600

550

600

700

650

224
209

700

800

760

722

800

900
1000

850

53
19

900

(n)

7r

950

Ahora, empleamos Ia frmula que considera la frecuencia de cada una.


Tenemos que k

10

10

y D n:970.
i:1

Por tanto,

10

D'*n

t--l

TL

12

x 50*28 x 150+.,. +53 x 950*

19

950

970
555.155.

El ahorro promedio de los cooperados

es de b5b.16 dlares.

1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localizacin, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, ao desde el cual su empleo se ha generalizado.

Definicin (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.

1.8. Medidas de localizacin


Se

la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el

23
50 % de

las observaciones.
Si disponemos de un conjunto de datos individuales, para el cIculo de Ia mediana se procede de

Ia siguiente manera:

1.
2.

Se ordenan las

n observaciones rt,12,.

..,rn

de manera creciente.

Si el nmero de observaciones es impar, entonces n:2rnl1, La mediana es la observacin


que se encuentra en eI lugar m * I. As, si disponemos de r : 29 observaciones ordenadas
de manera creciente, m : 14 es decir, Ia mediana es la observacin que se encuentra en el

lugar14*1:15.

3.

Si el nmero de observaciones es par, entonces n:2m. La mediana es igual a la suma de


las observaciones que se encuentran en los lugares m y rn * 1, dividido para dos. As, si el
nmero de observaciones es de n : 30, entonces rn: 15; Ia mediana es el promedio de Ias
observaciones que se encuentran en los lugares 15 y 16.

Si los datos estn resumidos en una tabla de distribucin de frecuencias de datos individuales.

1.
2.

Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.

Calcule

I2"v red.ondee

al entero ms cercano. Determine en Ia columna de Ia frecuencia

acumulada a qu dato pertenece, comparando el valor obtenido con el valor de la frecuencia


acumulada que es igual o inmediatamente superior; ste valor es la mediana.
Si los datos estn resumidos en una tabla de distribucin de frecuencias por clases, la mediana
se determina

1.

por interpolacin,

as:

Establezca en qu intervalo est el valor mediano. Para sto, se determina la primera


n
clase cuya frecuencia acumulad.a se
a mayor o igual a
Dicho intervalo se denomina clase

5.

med'iana.

2.

La mediana se calcula con la frmula


n,

Med,: L_t-r
donde:

; - nl-r
=-A,

lmite inferior de la clase mediana.


es la frecuencia acumulada del intervalo inmediatamente anterior al intervalo de la

,L-1 es el

At-r

mediana.

la frecuencia absoluta de la clase mediana.


A es Ia longitud de la clase de Ia mediana.
La interpretacin grfica del clculo de la mediana se encuentra en la Figura 1.11.
n es

la mediana de un conjunto de datos no necesariamente pertenece a ste. La propiedad


fundamental de la mediana es dividir al conjunto de observaciones en la mitad.
Ntese que

Ventajas e inconvenientes del empleo de Ia mediana:


1.

Es la medida mis representativa en el caso de variables que solo admitan la escala ordinal.

2.

Es fcil de calcular.

.).

En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atpicos.

4.

En su determinacin no intervienen todos los valores de Ia variable.

Captulo

24

7.

AnIisis Exploratorio de Datos

L MC

lal

Figura 1.11: Interpretacin geomtrica del clculo de la mediana.

Ejemplos

1.

Determinar la mediana de los siguientes datos:

5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5


Soluci,n: Se tienen n : IL observaciones, por Io que Tn
lugar 5*1. Ordenemos los datos

5, entonces Ia mediana est en el

3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9
La mediana es la observacin que se encuentra en el sexto lugart

2. (Continuacin.)

4.3.

7.0.

Qz:4.8.

Calcular Ia mediana de los sueldos de diez personas que ganan (en dlares):

t70 r72 168 165 L73 178 180 165 167 L72.
Solucin:

Se tiene

n:

10 observaciones, que ordenadas dan


1,

165 165 767 168 r70 772 772 773 178

180.

Por lo tanto, la mediana es el promedio entre las observaciones quinta y sexta:

^ 770+172
er:
i:171.
3. (Continuacin.) Calcular la mediana de la estatura
Estatura
(r)

Fbecuencia

absoluta

(n)

*
ET

la
de 46 seoras, cuyas medidas son:

FYecuencia
acurnulada (lr)

7.45

1.48

1.50

11

1.53

19

1.55

T2

31

r.57

nl

38

1.60

42

1.63

45

1.65

46

r)

I
fi

21:

7.8. Medidas de localizacin

Soluci,n: Las mediciones estn agrupados en una tabla de datos individuales y el tama0,d,9,1,1i
muestra es n: 46.
, . .iJ,riri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
As, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "

4.

Para la liquidacin del impuesto a Ia renta, en una pequea empresa, se calcularon lcs'ingbesoS
anuales (en dlares) de todos los empleados. La tabla de distribucin de frecuencias es la
,i'_lsiguiente:
Nmero de
Fbecuencia
Ingreso anual
,,,r.1 t,
personas (n)
acumulada (Nr)

- 3000
- 4200
4200 - 5400
5400 - 7250
7250 - 9000

2400
3000

9000

3
23

20
35
25
15

12000

,,r,; r ix

58
83
98
100

Solucin: Los datos estn dados en una tabla de frecuencias por clases con r:

llri.il

100.

Entonces, ?2:50; por tanto, la mediana se encuentra en el intervalo (a200;500)';'de!t'nnera


que A: 5400 - 4200: 1200.

i-nel

Ahora, tenemos que

* - *n-,
Med: L;I*TO
: 4200 + tO:"rrg

!{-es):

:5L25.7.

'i

rr,','i;tr

:'.i

r1i','1,\q;?.

35

t;i

La mediana del ingreso anual de los empleados de la empresa


oist25'.1lil*J]
'" -1--.\' lrii:Lli-'rr

ir1;({

"i'j ..'ilrrrrrri

l:

'rli;rl.lirll;l

1.8.3. La rnoda

r"i

Definicin (de moda) L" moda de un conjunto de ddob'es aquel valor que tiene la mayor
frecuencia absoluta.
Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o ms modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinacin es til construir una
tabla de frecuencias de los datos.

Si los datos estn resumidos en una tabla de distribucin de frecuencias por clases, la m'6dr
"e
determina mediante la frmula:
ii
,,'t:) i, ri ) lfl;'{

Mo:L* dt,O' trz, O


t

I = :,(' i,
li) il);jii-),1fli

;i,

ii lfrli/.

donde:
tr-1 es el lmite inferior de la clase modal.

y la frecuencia de la clase anterior.


d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.
d1 es la diferencia entre la frecuencia de la clase modal

A es la longitud de la clase de la mediana.

r ;iri:,rt ;,I

7.

Captulo

AnIisis Exploratorio de Datos

Aunque la icler de <<valol rn1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estacistica, dc rnlnela
forrnal, hasta cre Ia polrlirliz K. Peu'son en 1894.

Ventajas e inconvenientes del empleo de la moda:

1.

Es fcil de calcular e interpletar.

2.

Es la nica medida de Iocalizacin que ptiede obtenerse en Ias variables de tipo cualitativo.

3.

En su determinacin no intervienen todos los valoles de la distribucin.

Ejemplos

1.

Supngase que las notas de un examen de estadstica fueron las siguientes:

9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8

7.0.

Soluc'in: La moda de este conjunto es Mo:9.0, que es el valor que ms veces se repite.

2.

Calcular la moda de los siguientes datos:

Observacin
Fbecuencia
Solucin: La mayor frecuencia

3.

2.7

4.5

6.0

8.7

9.2

.)

es 6, correspondiente al

valor 4, por lo tanto Mo:4.

Para la liquidacin del impuesto a la renta, en una pequea empresa, se calcularon los ingresos
anuales (en dlares) de todos los empleados. La tabla de distribucin de frecuencias es la
siguiente:
Nmero de

Ingreso anual
2400
3000
4200

- 3000
- 4200
- 5400

5400
7250
9000

personas

(n)

20

7250

35
25

9000

15

12 000

Solucin: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).

: 50; por tanto, la mediana estar el el intervalo


dr :35 -20:15, d:35 - 25:10 y A:5400 - 4200:7200.

Entonces,,2I

(4200; 5400), de manera que

Ahora, tenemos que

A[o : L.--t* ,O'


,O
d't -l d'z

4200+,,,15,.1200
15+10

4920.

I
i,

La moda del ingreso anual de los empleados de la empresa es 4920 dlares.

:-

7.8. Medidas de Iocalizacit't


1.8.4.

27

La media georntrica

Definicin (de media geomtrica) La media geornt,rica, notaclzr corno .{lG,


n, meclicions r1, 12:.. ., nr es igrral a Ia taz r-sirna de su ltroclucto; es decir,

clc urr conjunto dc

AIG: Vqxrrx-xrk.
Si las obselvaciones estn agrupadas en una tabla de fi'ecuencias de datos individuales,

x...xr'tlt.
MG: {r:7,
"";,
Si las observaciones estn agrupadas en una tabla de frecuencias por clases, la expresin es la
misma, pero utilizando el punto medio de Ia clase z.
El empleo ms frecuente de la media geomtrica es el de promediar variables tales como porcentajes,
:asas, nmeros ndices; es decir, en los casos en los que se supone que la variable presenta variaciones
acumulativas.

Ventajas e inconvenientes del ernpleo de la media geomtrica:

1.
2.
3.
1.

En su clculo intervienen todos los valores de Ia distribucin.


Los valores extremos tienen menor influencia que en la media aritmtica.
Es rnica.

Su clculo es ms complicado que el de la media aritmtica y solo se la puede calcular cuando


todos los valores son positivos.

50s

;la

Ejemplo. Calcular la media geomtrica de la estatura

de cinco personas que miden (en metros):

t.70 r.72 1.68 1.65 r.73.


Solucin:

n:5 observaciones; por tanto,


MG : (rx12x-xrn

Se dispone de

otT
11.70 x I.72 x 1.68 x 1.65 x

I.73:

1.696.

La media geomtrica de las citadas estaturas es 1.696 m.

1.8.5. La rnedia armnica


que

Definicin (de media armnica) La media armnica, notada como NI H, de un conjunto de n


mediciones rrt r2t . . . , rt. es el recproco de la media aritmtica de los recprocos de esos n valores;
es decir,

Su empleo no es aconsejable en distribuciones de variables con valores pequeos. Se suele

utilizar para

promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.

Captulo

28

7.

AnIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo de la media armnica:

1.
2.
3.

En su clculo intervienen todos los valores de Ia distribucin.


Su clculo no tiene sentido cuando algn valor de la variable toma valor cero.
Es nica.

Ejemplo. Calcular la media armnica

de la estatura de cinco personas que miden (en metros):

1.70 t.72 1.68 1.65 r.73.


Solucin:

Se dispone de

n:5

observaciones; por tanto,

:
11111
L.70 I.72 1.68 1.65 r.73

1.696.

-_r-r-_r-_L-

La media armnica de las citadas estaturas es 1.696 m.

1.8.6. Percentiles, cuartiles y quintiles


Antes de finalizar esta seccin, es conveniente referirnos a varios trminos que son de uso comn
en la prrctica estadstica: los cuartiles, Ios quintiles y los percentiles. Estas medidas estadsticas
corresponden a lo que se denomina medidas de posicin no central.

A un conjunto de datos ordenado se lo puede dividir en un nmero fijo de partes iguales; cuando
divide en cien partes se tienen los percentiles.

se lo

Definicin (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribucin de los datos en 100 partes iguales.
los percentiles se les nota como P. Con ellos se puede encontrar regiones donde se acumulan los
datos; as, el 30 % de los datos estn por debajo del trigsimo percentil.

Para su clculo se procede de Ia siguiente manera:

Si los datos no estrn agrupados o estn en una tabla de datos individuales, se efecta la siguiente
descomposicin:

nk
100

: j *r,

donde:

es la parte enter u

es la parte fraccionaria

a" !.

100

a. *.
100

Entonces, se tiene que

"+-,
rj+L,

si

r:

o;

sir>0.

7.8. Meddas de localizacin


Si los rlrtos i:sttirr

29

rrJruprclos crr c:lascs, sc c:rlctila rucclirnt<r

,tk, _

l{r.
"
I'A,:LA-ta 1oo

',1,
,

7Lk'

rlor

rcler:

,L 1 es cl lrrrite inferior del intervalo (cuva fi'ecucrrcia rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'

l-l
n

cs la fi'ecuencia acumulada hasta .L-1.

es la frecuencia absohrta del intervalo h.

A es la longitud del intervalo h.


Ejemplos

1.

Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):

165 165 167 168 170 L72 r72 r73 178


Solu,c'in: Tenemos eue

Par-a P2g, k

n:

180.

10.

:20
nk
100

10x20
100

: j *r

2+0

Entottces,r':0y j:2;
P,
Pzo

Para P33, li; : 33


10

x33
100

los

Entonces,

r:0.3

:3+0.3.

j:3.
P : rj+t
PS : r:168.

ente

2. (Continuacin.)

Calcular el percentil de orden 86 de los ingresos anuales de los empleados de

Lrna enlpresa.

Ingreso anual

2400

3000

4200
5400
7250
9000

3000
4200
5400

7250
9000

Soht,cin: Teuemos qlte

12000

100.

Nmero de
personas

(n)

FYecuencia

acumulada (/r)

,)

20

23

35

58

25

83

15

9B

100

Captulo

30

1.

Anlisis Exploratorio de Datos

:86 y n,k: 100 x 86 : 86.


100
100
EI intcrrrrio h cloncle se cricu<rutrrr P5; cs (7250, 9000) y Lt-t:7250.
Tarnlritt, sc tierre qr,tc ly',-1 :83, r*.:15 y A:9000 -72;.0:1750
Parzr,l)66. k

Con estos datos, obtenemos:

'k

. - 100 L-I
nk

,I)A,

D-

72to +
tLUv
|

rSri

7600.

uu

n,.

- 83 trrn

15

--'l

Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.

Definicin (de cuartiles)

Son valores que dividen a la distribucin de los datos en 4 partes, cada

una de las cuales engloba eI25% de los mismos.


Los cuartiles son 3:

.
.

El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr

P2.

El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y
cttmple que Q2

se

Pso.

El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe -

Pz.

As, para el clculo de los cuartiles solo se deber tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).

500

mln

Qt

500

Qt

max

Figura 1.12: Disposicin de los cuartiles en un conjunto de datos.

Definicin (de quintiles) Los quintiles son valores

que dividen a la distribucin de Ios datos en


cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.

Los quintiies son 4:

.
r

El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue
El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que
El cuarto quintil (g), qr" deja a su izquierda

9z

P2o.

P4o.

- Poo.
el 80% de los datos y se cumple que q4 - P80.
qB

7.8. Medidas de localizacin

31

Ejernplos

1.

Dctcrrniuar los cuartilcs infcliol y surcliol cle las estaturas de 46 seoras,

(Continuacin.)
cuyas ntedidrs son:

Estatura
(r)

absoluta

(n)

r.45

1.48

1.50

11

1.53

19

1.55

72

31

L.57
1.60
1.63

3B

42

1.65

Sohtcin: Tenemos que n

,,1

.)

P25,

Pz.

46

por tanto,

k:25

nk
i00

46x25

)'se

100

r:

lr

11

p, : r j+t
PZs : rn:

rrden

Para el cuartil superior, Q

Pzs, k

:75

46x75

35

100

I.53.

0.5.

0.5 y
P,

Pzs
2

0.5.

tlr

100

r:

nk

Es decir,

0.5 y

Pn.

46.

Para el cuartil inferior, Q1

De manera que,

Frecuencia
acumulada (i,)

Fbecuencia

* l-rt
rsa : 1.57.

(Continuacin.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.

Ingreso anual
2400

3000

4200
5400
7250
9000

3000
D'lu.

P+0.
'60.

D-^

EU'

4200
5400
7250 9000 12000

Solu,cin: Tenemos que n

100.

Nmero de
personas

(r)

FYecuencia

acumulada (Nr)

t)

20

23

DT

58
83

Jd

25
15

9B

100

Captulo

32

. Cuartil inferior:
El irrtelr'rlo

Qt

7.

Pz;,

AnIisis Exploratorio de Datos

k::25

Y:
100

109ri.25

N- t : 23,nt

100

Q1 es @200;5a00) y
35 y A :54U0

l doncle se enc:uentra

Tambirr, se tiene que

J,

Z.

Lt-t:4200.

- 4200 :

1200.

Entonces, lesrrlta que:

t'/t

P, :
Pzs

Cuartil superior: Qs:

Pzs, k

- Ar,.-,
Lt-tI loonk "'
t<_t?

4200

4268.6.

:75

+'",;;'"
Ji)

t #:

1200

tO?tt

: tt.

Lxt:540A.
Tambin, se tiene que N-1 : 58, n :25 y A :7250 - 5400 : 1850.
El intervalo h donde

se encuentra P75 es (5a00; 7250)

Con estos datos, obtenemos:

nb

e-t,

P : Ln-t-t r nk
Pzs

b4oo+

75;58raso

: 6658.

1.9.

25

Medidas de dispersin

Luego de determinar Ia localizacin de las observaciones, es conveniente medir su grado de clispcrsin


alrededor del centro. Las medidas que permiten especificar esta caracterstica se denomnan nedidas
de dispersin.

Estas medidas deben tener la propiedad de que si los datos estn ampliamente extendidos, la medida
ser alta; y cuando los datos se encuentren muy agrupados, ser baja.
Existen varias medidas de dispersin, nosotros vamos a analizar la desviacin estndar, el rango y el
rango intercuartil.

1.9.1. La desviacin estndar


llna vez que

se ha calculado el promedio de las mediciones, un indicador de su variabilidad es la


desviacin de cada medicin particular corr respecto al promedio, r- r. Pero sta da r.rna informacin
vlida para cada medicin y no para toda la muestra. Para tal efecto se emplea la desviacin estndar,
medida de dispersin fue introducida por K. Pearson en 1894.

Definicin (de desviacin estndar o desviacin tpica) La desviacin estndar, notada como
s, de nn corljunto de n mediciones 11, 12, ... 2,, es la raz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n

n-I

D,@,
i:l

1; es clecir,

7.9. Medidas de dispersin

33

\tese que la desviacin estndal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs

clrLt:

aquellas que corresponden a los datos originales.


Para su clculo tambiu se cnrplea la frnrula equivalente

- n \r)'
n-I
De la misma manera que para Ia media aritmtica se consideran los siguientes casos:

'

Si las observaciones estn agrupadas en una tabla de frecuencias de datos individuales:

Observacin

FYec. absoluta

Il

TL1

r2

n2

x) te

;o

la desviacin estndar se calcula por


k

o s:
'

in

- n(T)2
n-7

DnnrT

i:I

con n:,

ni.

i:r

Si los datos se presentan en una tabla de frecuencias, agrupados por clases:

as

Clase

LIC

LSC

Punto medio
I1
I2

Flec. absoluta

ly

Sl

ida

l2

S2

rel

l"

Sk

rk

nk

TL1

n2

s se calcula por
k

la

-itn(r-r)2
i:7

in

o 8:

Lnr - nlI)'
i:l
n-I
O

/-\

con n: \-nr.
/-
;-l

ilar,

Ventajas e inconvenientes del empleo de la desviacin estndar:

l.

Se expresa en Ias mismas unidades que los datos originales.

2.

En su clculo intervienen todos los valores de la distribucin y por ello puede ser complicado.

3.

Es nica.

4.

Se ve

muy afectada por la presencia de valores atpicos.

7.

Captulo

34

Anlisis Exploratorio de Datos

Ejemplos

1.

(Continuacin.)

Calcular la clesviacin estrrdar cle los srreldos cle diez l)crsonrrs que ganan

(en dlares):

r70 t72 168 165 173 178

180

Solu,cin: Previamente se haba calculado el promedio

165 167

7: L7I.

t72.

Con sto, resulta que:

*i@n-,'
(170

t7L)2 + (I72

+...+

I7r)2

(167

10-1

tTL)2

O72

LTr)2

1.

Esos sueldos tienen una desviacin estndar de 5.1 dlares.


2.

(Continuacin.) Calcular la desviacin estndar de Ia estatura de 46 seoras, cuyas medidas


son:

Estatura

t.45

1.48

1.50

1.53

1.55

L.57

1.60

1.63

1.65

Frecuencia

t2

:46, k - 9 y r:1.545.
el valor a. f nor'n,

Solu,c'in: Anteriormente se determin que


Para realizar el clculo, obtengamos

71.

i:t

+ 3(1'63)2 + 1(1.65)2 :

D"nr? :2(t.+s)2 + 4(t.458)'+'"

109.9615

i:1

Entonces, se tiene que

Dn *?-n@)2 ffi
o:,
:.@:0.04627.
,
n-l
n-r

D-

o-t

La estatura de las seoras analizadas tiene una desviacin estndar de 4.6 cm.

3. (Continuacin.)

Calcular la desviacin tpica de los montos de ahorros de los socios de una


cooperativa de ahorro y crdito:

Hasta

Punto medio (r)

FYecuencia (ni)

100

100

200

50
150

28

Desde

Solucin: Antes

12

200

30

250

46

300
400

400

77

500

350
450

186

500

600

550

224

600

700

650

209

700

800

750

r22

800
900

900
1000

850
950

53
19

se determin que

n : 970, k

10 y V

-- 555.155.

7.9. Medidas de dispersin

35

Calculemos lzr siguiente sumatona:


9

I,,r
'i-7

r,l :

12(rtQ2

+ 28(150)2 +'. . +

De manera que la desviacirr tpica

b3(850)2

19(950)2

330025000

es

D ro"? - "(")2

,i.:1

n-7

:V/33002ffiro-i

:riY'

tlonjuntamente con la desviacin estndar se suele definir la uarianza muestral de un conjunto de


ratos, notada s2, como Ia suma de los cuadrados de las desviaciones respecto a su promedio, dividido
:or el uno menos que el nmero de observaciones en el conjunto de datos y se calcula mediante

"ln:

las

"

{'o

;\f

,;-1

- 7)2

EI rango y el rango intercuartil

r,9.2.

Definicin (de rango o recorrido) El rango de n

mediciones

es

igual a la diferencia entre los

'.'alores mayor y menor de las mismas:

Rango

T..'x

Ei rango se puede utilizar para hallar una aproximacin de la desviacin estndar mediante las si--rrientes relaciones

R.anso

= ---)
1/n

R,anso

"=--,

para n 176,

para 16 q

para100<n(400,

para n > 400.

100,

Ventajas e inconvenientes del empleo del rango:

1.

En su clculo solo intervienen los dos valores extremos de Ia distribucin y por ello se ve muy
afectado por Ia presencia de valores atpicos.

2.

trs fcil de calcular.

Definicin (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto
latos

es

de

igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,

RIQ:
Las definiciones de los cuartiles superior e inferior
en 1882.

Qs

Qt.

y del rango intercuartil fueron dadas por F. Galton

Captulo

36

7.

AnIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo del rango intercuartil:

1.

Es fh<:il cle

2.

Se vc Poco afectrcio

3.

En su deterrninacin no intclvierre

calcul.rr'.

por la Plerselcia dc
lr

atpicos.

r,r.lores

totiliclad cle los clatos.

Ejemplo. (Continuacin.) Calcular' la desviacin

estrrdrl de lr cstrturr clc 46 seoras, cllvas

meclidas sc reslrmen en la siguierrtc ttblr:

Estatura

r.45

r.48

r.50

1.53

1.55

1.57

1.60

r.o.)

1.65

Fbecuencia

Ir

12

Solucin: Antes

se

dctermin que Q1 :1.53 Y Qs:I.57. Adems, zm':7.45y

r,'*:1.65.

Entonces,
Rango

RIQ

Tmx

Qs

fnrn

- Qt :

1.65

1.57

- I.45 :

1'53

0.20.

0.04.

Adems, podemos calcular una aproximacin de la desviacin estndar de los datos:

sFr

Rango

0.20

0.05.

Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la frmula respectiva.

1.9.3. El coeficiente de variacin


Definicin (de coeficiente de variacin) El

coeficiente de variacin, notado y>ot CV, es ig-ual


a la desviacin estndar- divididr por la medir, rrritmtica; es riecir,
s

CT':1

Esta rnediclr se utilizr l)lra conlpr'rr las rnccliciones de


unidades o por distintos individuos.
Si u.rr conjurrto de clrtos es honrog(rneo, CV

<

1; si

Cf/ >

tunr

misrna magnitrici rclizrrir cn distintas

1.5. los dzrtos poclran ser hctclogncos.

Ventajas e inconvenientes dei empleo clel coeficiente de variacin:

1.

Es urrr medida rdimensioual.

2.

En sn clculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atpicos.

3.

Puede ser difcil de interpretar.

4.

Picrde su significtrdo si el prorredio es iguai a cero.

7.7A. Medidas de fornta


Ejernplo. (Continuacirr.)
-irr1rr (crL ckilzrrcs)

Crlcrrlrr

r:l

c:oerficrierrtc

Dta
JI

clc r'rriacirr clcrl srrclclo clc cliez pcrsorrrs clllc

170 rT2 168 165 r73 r78 180 165 167 r72.
:

:,1

uc,iir: Pleviarrx:rrtc

s<t

Itrba cirlculaclo clur:

r:

5.1. Con sto, r'esulta

que:

5'1 :0.02982.

CV:! T --omo

177 1' ,s

777

el valor de coeficiente es muy ba.jo, los datos son homogneos.

1.10. Medidas de forma


-{asta ahora, heruos arralizado la localizacin y la dispersin cle una distribucin, pero necesitamos
. r'locer ms sobre el comportamiento de los datos. En esta seccin, analizaremos las medidas de
-,)
- )inla'.
- as medidas de forma de ttna

distlibucin

se clasifican en dos

grllpos: medidas dc asinietr'a y medidas

cttrtosis.

--

1.10.1. Asirnetrra
midc cl grado de asimetr'a de la distribucirr r,le sus datos
sti meclia. Es aclirncnsional v se definc corno srg=Lre:

coet'czente d,e a,s'intetra, dc nrra variable

tolno

\-1.r, _ ,):t ln,


'

/_-'

As:

,i.:

'

,s3

--,--.

crtl,o,s cle nnL variable cstrr coltstituidas por los r.alores alejaclos de la meda (r,a.1oles cxtrcmos).
--:,a l'rriable es l,sini:tricr si srr
col ;r nn 1rclo cs rns larga que sr1 colr al otro y sinrtricr si ambrs
solr
igual
cle
largas.
-es

si As > 0. la clistribui:in seri asiurtiicr a


cola a la izquierrl:r.

. si As - 0la distlilncicin
.

lr

1a

ser' sirntticr. AnLbas colas son igual dc luugirs.

si As < 0 la clistribrrcirt seri rsirntlica a ltr izcluicrcla. La cola a lur izqnierdl es ms lrrrgir que
la cola a Ir clelechr.

rEn la definicin cle las trrecliclrs rte tirma no hal,'unidac.l


r

clcrcclir. La cola a la clerechr es ms lirrga que

cclacl

cle

criterios cntre los especi:rlista,s, por lo

clrLc

hay una amlrlia

Captulo

38

1.

AnIisis Exploratorio de Datos

L,lO.2. Apuntamiento o curtosis


EI coeficiente de apuntamiento o curtosis de una variable sirve para medir el grado de concentracin
de los valores que toma en torno a su media. Se elige como referencia una variable con distribucin
normal, de tal modo que para ella el coeficiente de apuntamiento es cero.

Ap:

ir", - *)n l,

i:t

-J.

e4

Segn su apuntamiento, una variable puede ser:

Leptocrtica, si Ap ) 0; es decir, es ms apuntada que Ia normal. Los valores que toma la


variable estn muy concentrados en torno a su media y hay pocos valores extremos.
Mesocrtica, si

Ap:0;

es decir, es

tan apuntada como la normal.

Platicrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.

Figura 1.13: Curtosis de curvas simtricas.

Ejemplo. (Continuacin.) Calcular los coeficientes de simetra y apuntamiento de los sueldos de


diez personas que ganan (en dlares):

t70 172 168 165 r73 178 180 165 t67


Solucin: Previamente se haba calculado que 7

i@n-e)'
i:7

(170

171)3

: l7l y s :

+ 072 -171)3 +

172.

5.1. Adems,

(167

i71)3 + O72

- t7D3

10

55.8.

i{,n-n)n
i:l
n

- LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 10


1191.
(170

I7D4

7.77. Otras representaciones grfrcas

39

- ntOnCeS,

\-.
\ r; 1J"
T).

In

As:

)11

T\'' lr,
55.8

'i-I

(5.1)3

so

0.42r.

Ap:

ir", - ,)n l,

i:t

1191

t
-J-

s4

(5.1)n

-.)

-t.239.
Ia

-,cs datos son levemente asimtricos, con asimetra hacia la derecha; tambin, son platicrticos,
;,,rsible presencia de valores atpicos.

x)

1.11. Otras representaciones grificas


-

os grficos analizados anteriormente no requieren realizar clculos de medidas estadsticas. Los


==ficos que a continuacin se presentan, s los emplean; por tanto, son ms poderosos al realizar un
'-nlisis.

1.11.1. Diagrama de balanza


FI di,agrama de balanz fue introducido en el ao 2000, como una herramienta que muestra, en un
lismo grfico, la forma de los datos, su valor central y su variabilidad al representar el promedio, el
:-nimo, el mximo y Ia desviacin estndar de los datos.
?ara su construccin se procede de la siguiente manera:
de
1.

Se calcula el promedio, la desviacin estndar, el mnimo

y el mrximo del conjunto de datos que

se analiza.

Sobre una recta se ubican los valores del promedio, el mnimo y el mximo. Los segmentos que
unen el promedio con el mnimo y con el mximo se denominan brazos de Ia balanza.

Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviacin estndar.

Debajo del valor del promedio se dibuja un tringulo.

EI diagrama queda as:

Figura 1.14:

.x+.s

Captulo

40

El rliagrarrir

clc.

7.

AnIisis Exploratorio de Datos

brrlrnzir st: iritc:r'pletr clc 1a sigrricrrtc luirrrcr'r:

rlci grlico.

Si los cltos solL sinrrtlic:os, r:l valor del plonreclio se sitr rrr r:l

en torno ri ccntlcl. los lr-Lzos rlr: l,r balrnz ser'ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l r.l coutlor lt-,s lrr'rzos clc lr balrnza s<)r''rir liilgos.

,)

Si nno dc los rlos blrzos clc 1r brlarrz es muchr rlrs largo crc r:l otlo, nos inclica (llre los
sorl asirr)tricos y clue hay posible prcsencia cle r'rloles atpicos en ls obselvciones.

Si los

<:c:rrtLo

drtcs estilr agrrrptrdos

(l1tos

Puede ser irtil combinrr' (solrre el mismo gr'fico) con un cliagrzrma clc prrni;os pzrra visualizrl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.

Ejemplo. Realizal el diagrama

de balanza de los siguientes datos:

5 5 5 5 1010202027
39 55 55 60 60 60 68 75 90

35
90

Soluci,n,: Estos datos tieneu las siguientes carac;ter'sticas:

rnrr:5, rnx:90, r:39.7, s:29.3


Entonces,
:L

-S

T *s

El ciizrglirlrr

29.3:10.4.
39.7+29,3:69.0.
39.7

<lc balarrzr ie nurstlt it crorrtirn.rrcirjn:

st0 28 3 4C 5S 60 1fi 80

gCI

Figura 1 .15;
Scgirrt sc obscrvit crr i'i gilico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrtricros. Arlcrris, lcs br'rzrs cie ir blrnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtotr
la posrble plcserrcia cle vakrrcs atpicos elr cl ex1 r'errro clcrecho.

1.11"2. Diagrarna de ca.ja


El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lurl herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, lr foltna de los clatos, sn r'r,lol ccntlal y srr rrariabiliclrcI irl rcprr:sentar ir rne<lirrra.
los crrrtilcs) el r'1rlgo intercualtil y el rango c1e las observacicxrcs.
Para su constluccin se procede de la sigr.riente rnInera:

l.

Soble lrn lnel holizontal se locrlizrn l mcdiana. Ios cuartiles inferior y supr:rior 'los clatos
nrnilro I'mixirno.

7.77. Otras representaciones grfrcas


,l

Se constrrtye rtna ca..ja angosta qlre une a

4L

Qt y Qz; a continurcin,

se clivicle estar caja cn

clos

mecliatrte una lnea qne pase por Qz.


t

.J.

:n

Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnnimo y hacia el valor mximo de los datos.

la Figura 1.16 se mnestra un diagrama de caja.

trt
Qt

min

Qz

max

Qr

Figura 1.16: Diagrama de caja.

;--n diagrama de caja es especialmente


-"-:lores atpicos

til para examinar la simetra de los datos, la presencia


y para comparar dos conjuntos de muchos datos.

de

Ejemplos

1. (Continuacin.) Trazar el diagrama de caja correspondiente a los datos de la estatura

de 46

seoras, cuyas medidas son:

Estatura

r.45

1.48

1.50

1.53

1.55

L.57

1.60

1.63

1.65

Flecuencia

12

Solucin: Antes

se determin que

Qr

1.53, Qz

L.55, Qs

t.57, rrnn: I.45 y z16*

1.65.

El diagrama de caja es el siguiente:


.

-lttc:cr

lr rti

: .tliI)

t.4s

1.55

r.60

1.65

Figura 1.17:

.l(lIJIr

Como se observa, los datos son bastante simtricos, con una fuerte concentracin en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atpicos (el mnimo

y el mximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres

250 mujeres, que realizan

Captulo

42

7.

Anlisis Exploratorio de Datos

tlab:r.jos rro c:llificaclos, olrtcniudosc ltr sigtticttto tabl:

Ingreso

flombres

Mujeres

180
190

55

200

20

75

270

')ri)
.f

25

220

AN

40

230

75
20

45

10

240

Comparar los ingresos de los dos grupos mediante sus diagramas de caja.

Solucin:

Se tiene

la siguiente tabla que resume las medidas descriptivas reqtteridas:

Flombres
Mujeres

max

220

Qs
230

200

220

230

mIn

Qt

Qz

i90

270

180

190

240

Con todos estos elementos, los diagramas de caja son


240

230

o
ut

22O

fl
s zro
tr

200
190
'180

Sexo

Figura 1.18:
En el diagrama correspondiente a las mujeres, observamos que la mediana no se encuentra en Ia
mitad de la caja, denotando una asimetra, con fuerte concentracin hacia valores bajos. Como
Ias vallas son cortas, podemos inferir que no hay presencia de valores atpicos.

En el diagrama que corresponde a los hombres, se observa que Ia mediana est en Ia mitad de la
caja, indicando que Ios datos son simtricos. Como la valla inferior es ms larga qr-re la superior,
rros indica que rlrl valor de 190 es atpico para los hombres.

De acuerdo a las posiciones de los diagramas, se observa que) en general, las mujeres tienen
ingresos menores. Tarnbin, se aprecia que los ingresos de los hombres estn ms concentrados
alrededor de la rnediana qne los de las mujeles, denotando que aquellos son ms homogneos.

L.1-2. Ejercicios
i.

Una persona est rnanejando un carro en una autopista a 70 km/h y nota que el nmero de autos
a los que pasa es igual al nmero de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. Por qu?

7.72. Ejerccios
2.

Dadas

8 nrccliciones:

Deterrnine: rr) f; lr)


3

Dadas n

: I

4, 2, 6. 5, 7, 5, 4,

lr niecliarrr;

mediciones:

c)

,s;

43

6.

cl) el lango; e) la asimetra;

5, 8, 8, 4, 4, 9, 7, 5,

4.

Deterrnine: a) 7, b) la mediana; c) s; d) el rango; e) el RIQ;

1.

f) Ia cr-rrtosis.

f) la asimetra; f) curtosis.

En 1904, Cushny y Peebles publicaron en el artculo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos ismeros de Ia molcula hidrocinamida hidro
bromida en prodrtcir sueo. Se present la variacin en el nrmero de horas de sueo por noche
al usar las dos versiones de Ia droga:

Paciente Dextro Levo

+0.7
-1.6
-0.2
-L2
-0.1
+3.4
+3.7
+0.8
+0.0
+2.0

2
.)

4
5
6

7
8

10

+1.9
+0.8
+1.1
+0.1

-0.1
+4.4
+5.5
+1.6
+4.6
+3.4

un diagrama de puntos para cada uno de los dos tipos de drogas y comparrelos.
Cul de los dos ismeros es ms efectivo en producir aumento en las horas de sueo?

a) Realice

b) Realice un diagrama de

tallo y hojas con los datos.

c) Calcule el promedio, la mediana


Cul es ms efectiva? Explique.
.

tenla

y la desviacin estndar de los datos de las dos drogas.

Un inversor tiene ahorros repartidos en 3 depsitos con 2000, 5000 y 10000 dlares, respectivamente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
Cul es el tipo de inters que recibe?
En una empresa se registr la edad (en aos completos) de sus empleados, resultando la siguiente
tabla:

Como

31 49 36
45 61 40
51 18 29
36 40 46
56 35 48

Idela
)ertor,
trenen

39
39
34
37
44

56 29 57
47 27 36
42 38 62
49 25 2r
42 43 49

4t 40 51
37 16 37
31 28 25
39 35 37
22 25 28

trados
teos.

a) Determine el nmero de clases que

b) Construya la tabla

: autos

dio, la

7.

de frecuencias

se debe

utilizar en la distribucin de frecuencias;

y el histograma;

c)

Qu porcentaje de los empleados es menor que 50?;

d)

Qu porcentaje de los empleados es mayor que 35.5?

En una bodega de venta de licores se registr las principales. caractersticas de 25 marcas

de

Captulo

44

7.

AnIisis Exploratorio de Datos

rn'hiskys:

Nota de
calidad

7.5

I
I

I2
t2

0
0
2

Precio
de venta

Proporcin
de malta

70

60

20
20

65
74

20
25

70

25

6
7

,J

70

30
30

55
93

8
9

62
87
78
83
90
110

10
11
T2

13

t4
15
16

113

t7

96

18
19
20

82

r27

2I

90

22
23

86
100

24
25

100
95

160

a) Identifique el tipo

b)
c)

Tiempo de
aejarniento

No. de
whisky

Categora

.,

30

J,l
tt
Jd

6.5

tt
JJ

35

8.5
8.5

40
40
40
40
40
45
45

2
2

100
100
100
100

3
3

i00
100

8
5.5
T2

8.5

T2

dt

12

8.5

,
2
2

3
3
3
3

2
1

L2

12
12
10

4
2

11

q
d

T2

de dato que representa a cada una de las variables;

y hojas para el precio de venta y ei tiempo de aejamiento;


Calcule el promedio, la moda y la mediana del precio, la proporcin de malta y el tiempo

Realice un diagrama de tallo

de aejamiento;

d)

Encuentre la desviacin estndar, el RIQ V el coeficiente de variacin del precio, la proporcin de malta y el tiempo de aejamiento;

e) Calcule los coeficientes de asimetra y de apuntamiento del precio, la proporcin de malta


y el tiempo de aejamiento;

f)
8.

Realice un grfico de barras de Ia categora y de la nota de calidad.

Calcule el promedio, la mediana y la moda de las edades de 25 personas:

32 33 34 31 32 31 34 32 34 32 31 34
31 32 32 34 34 32 33 34 33 33 34 31
9.

Dados los datos

sus frecuencias:

Halle: a) e; b) Mo; c) s; d) el rango.

10. Dados

los datos v sus frecuencias:

Halle: a) Qz; b) 7; c) s; d) RIQ.

31

7.72. Ejercicios

il.

45

Sc rcirlizti rttta irrr'<rstigacirn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets
crr rlivrtlsos tllutr:ctttts clc lr trirrrlrcl, ob1<:ni:rrr[os<t los sigrricnt<:s cLttos (cl<ilarcs):
50
49
49

+t
46
a)

4:l 39
43 39
43 39
41 39
47 38

43
44
44
45
46

40
40

,)r),J

38

33 26 36
33 27 36

38

4U

40
40

.)r) I

oi
,l

38
37

.).)
,),)

,)a
,l

') E
,)r)

32 28 35

37

<:rrrctetrsticrs

.)o
r)i

30
30
J)^
.)t,

28

Determine la dislribucin de frecuencias inclivicluales de los datos;

b) Elabore la distribucin de frecueucirs con datos agnrpaclos l)or clases;


c)

-2.

A partir de la distribucin obtenida, trace el histograma.

A continuacin se dan los resultados de la estatrrra de 100 estudiantes:

Esratura (en cm)


No. de eslrrdiantes

| 155 160

165

I 10 14

170 \75

26

180

185

28128

Halle:
a) Ia estatura promedio

b) la media armnica
c) Ia mediana

y Ia desviacin estndar;

y la media geomtrica;

y eI RIQ.

A partir de la siguiente distribucirr de liecuencias,


o;

lpo
Encuentre:

ror-

a)

rlta

y superior y la mediana;

los cuartiles inferior

b) Ia media armnica;
c) la media geomtrica.

-=.

La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 das:
Intervalo
qA

4--

6-B
8-10

l0
a)

12

Flecuencia

Intervalo

21

12-14

16
15

26
OD

74 16
16 18
18 20
20 22

Frecrrencia

I4
20
22
1E
:,-)

Deterrrile: cl plomedio, Ia mecliana y los cuartiles inferior y superior;

b) Constmya el cliagrama de ca.ja de los datos.

Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el rea nrral
dc los cantones dc Zapotillo y N{zrcar y corresponden al nrrnero de hornbres y de rnujeres que

Captulo

7.

AnIisis Exploratorio de Datos

intcgran las frmilias encuestadas.

Hombres

Hornbres

\4ujeres

X4ujercs

Hombres

X4ujercs

Homblr:s \tlujercs

2
c

.)

t)

.)

.)

4
b

.)

2
t
d

4
4

a)

Realice un diagrama de puntos de los datos, clasificados por sexo;

b)

Realice la tabla de frecuencias y el histograma de los datos, segn el sexo de los encuestados;

c) Construya el diagrama
d) Interprete y compare

de caja de los datos;

los resultados obtenidos en a), b) y c);

e) Determine el nmero total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.

16.

Las siguientes temperaturas fueron tomadas al medio da en Quito (en

22, 24, 2r, 24, 20, 22,


a) Calcule el promedio y la desviacin estndar

'C) durante

una semana:

19.

de dichas temperaturas;

b) Para transformar los grados Celsius (c) en grados Fahrenheit (/) ." usa la ecuacin / :
1.Bc * 32. Determine el promedio y Ia desviacin estndar de las temperaturas en grados
Fahrenheit;

c) Encuentre alguna relacin entre

los promedios y las varianzas calculados en a) V b).

17. En una investigacin

sobre la razn por Ia que frecuentemente haban colas muy largas en las
cajas de un banco, se obtuvo informacin del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuacin:

6.0 5.9 4.0 3.1 1.9


4.8 4.8 5.1 6.0 4.2
5.2 2.8 4.7 1.8 5.1
3.6 4.4 2.0 2.8 4.8
3.7 4.5 3.9 2.3 5.5
a) Calcule la desviacin

estndar

5.3
4.4
5.8
3.1
5.3

2.7 5.2
5.3 7.4
2.9 5.7
1.5 5.9
5.8 2.4

2.9 5.2
4.4 4.1
3.8 5.8
3.6 4.6
5.5 3.7

y su aproximacin a partir del rango;

b) Determine (,' * s), (r I2s) y (e + 3s);


c) Determine el nmero de observaciones que se encuentran en cada uno

de los intervalos;

d) Construya el diagrama de caja de los datos y compare con los resultados de la parte
Qu observa?

b).

7.72. Ejercicios

18.

47

La siguientc tabla muestra los tiempos de duracin (en minutos) de las versiones en DVD de
pelculas dirigidas por Alfred Hitchcock:

Pelcula

Tiempo

Pelcula

119

Dial M fbr

120

Foreign

116

I Confess

The Birds
Family Plot

Frenzy

The Man Who Knew Too


North by Northwest
The Paradise Cane

Much

120
136
116
113

Window
Rope
Spellbound
To Catch a Thief
Under Capricorn
Rear

81
111
103

Il7

22

Tiempo

Murder

105

Correspondent

120

f08

X4arnie
Notorious
Psycho
Rebecca
Shadow of a Doubt
Strangers on a Train
Topaz
Vertiso

130
103
108

132
108
101

126
128

ios;
a) Construya

un diagrama de tallo y hojas de los datos;

b) Calcule la mediana de los tiempos;

los cuartiles inferior y superior. Use esta informacin para detectar algn valor
y
atpico para trazar el diagrama de caja;

c) Calcule
:e el

ray

d) Determine el promedio

y la desviacin estndar;

datos mediante un diagrama de balanza. Cules datos influyen ms en los


valores calculados?

e) Represente los

f)

Calcule los coeficientes de asimetra y de apuntamiento.

19.

Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. Qu porcentaje de los alumnos
aprobaron el examen?

10.

Un automvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. Cul es el
recorrido promedio de cada llanta?

+-

J-

ados

11. El kilometraje

que marca un auto, luego de 4 aos de uso, es 100 mil kilmetros. Si el dueo
lo compr nuevo y lo hace descansar 1 da, luego de usarlo 4 das seguidos, cul es el recorrido
promedio diario de los das manejados, considerando aos de 365 das?

las
a los

')2. De 400 alumnos


promedio es 160

13

Se

de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
cm. Cul es la estatura promedio de los varones?

tiene cuatro nmeros. AI aadir el promedio de tres de ellos al nmero restante, se obtienen
y 29. Si se excluye al mayor de estos nmeros) cul es el promedio de

los nmeros 17, 2I, 23


los tres restantes?

)/

El promedio de 53 nmeros es 600. Si se eliminan 3 nmeros consecutivos, se observa que


nuevo promedio aumenta en 5To. Cul es el mayor de dichos nmeros consecutivos?

25.

Calcule la mediana de las siguientes temperaturas:

6:

e b).

Temp. ("C)
No. das

20.5

20.0

19.5

19.0

18.5

18.0

t7.5

13

el

Captulo

48
26

Calculi:

Ir mecliatrr

7.

Arlisis Exploratorio de Datos

Ir urocla <lc krs

sigrri<lrtcs clatcls
Iutclrrlo
10 - 2i)

I'r'ccucucia

20 -30
30 - 4i)

.)
'J

40
50
27.

3
12

50
60

Los sueldos en una emprcsa son las siguierrtes:


1

gelente:

10 000

secretaria:

650

3 empleados: 500 (cada uno)


2 ayudantes: 400 (cada uno)
1

conserjc:

300

Cul es la medida de localizacin ms representativa?


28

En una reunin hay 50 varones con una edad media de 20.5 aos y 25 mu.jeres, las que en
promedio ,or, ] mis jvenes qne los \arones. Halle el nrmero entero ms prximo a la edacl
'10
media de las personas de dicha leunin.

29.

Un ftrmador dice que su vicio empez con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y as sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.

a)
b)

,A cuntas semanas de

habcl empezado ocnrri sto?;

Cuntos cigarr-illos diarios, cn prornedio, fum hasta la primera ser)ana que lleg al nlximcr
de su consumo?

30.

Si cada uno de los 28 millones de habitantes de cierto pas come) el promedio, 12 kg de pescadcr
al ao, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
Cuntas toneladas de pescado fresco se consumen? en promedio, por ao?

31.

En una muestra de 20 empresas florcolas se obtuvieron los siguientes datos sobre el nrnero de
empleados y sus ingresos anuales, en miles de dlares:
No. dc
empleaclos

10 30
30 s0
50 - 100

Ingresos anlrales
50

100

100

250

250

- 1000
0

10

Calcule:

a) el ingreso medio anual de las ernprcsrrs;


b) el nmero de empleados promedio.

32.

De los datos de rrna tabla de distribucin de frecuencias, con 5 intervalos de clase ;r ancho de
clase corntn, se observ que: Qz:24, x: : l$, 13 :24, nB : 2'n,r, n5 : )71r. .Qu porcerrtaje
del total sor nrenores de 30?

7.72. Ejercicios

49

cunto es igual la suma de cifras dc la media aritmtica de la siguiente serie de nmeros'/

cifrrs n cifrrs

34. La siguiente tabla muestra la distribucin

<rifils

r cifrrs

de sueldos de 210 trabajadores de una empresa.

Sueldo

Trabajadores

600 700
700 800
800 - 900
900 1000

100

1000

20
60
20

1100

10

a) Halle Ia moda de los sueldos;


b) Debido al aumento de Ia productividad, los sueldos sufrieron un incremento del

70%o y,

adicionalmente, un aumento de 50 dlares. Halle el nuevo sueldo promedio.

35.

En una muestra de 1000 trabaiadores, se registr sus sueldos en una tabla de frecuencias:
Sueldo

ue en

, edad

400
800
1200

400
- 800

de 20

150
300

- 1200
- 1600

200
250

2000

100

1600

rnda,

Trabajadores

a) Calcule la moda de los datos;


b) Qu porcentaje de los trabajadores tiene

sueldos comprendidos entre

el promedio y la

mediana?

irimo

36

En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.

scado
lser\4.

rero de

Figura 1.19:
Halle la diferencia entre el promedio y Ia mediana.
37

En Ia seccin de pediatra de un hospital, Ios nios atendidos se clasifi.caron segn su


obteniendo la siguiente tabla:
Edad

Frec. absoluta

Frec. absoluta
acumulada

03
rcho de

centaje

3-6
6-9
9-12

Frec. relativa

Frec. relativa
acumulada

0.2
20

0.85
80

edad,

Captulo 7. Anlisis Exploratorio de Datos

50

Calcrrle el pronrr:clio, la rnecliarrr


38

v la clesvircil estnclar

la cclacl de los niuos rtcndirlos.

Err la sigr.rierite tabla se rnuestr'r ir clistlilnciu ck: frecnencias clc lrs vcntas rcrlizadls pol'
60 locales de uu ccntro comelcial popr-tlal de Ia ciudad cle Quitrt.
Punto
medio (r)

Si Ios intervalos tienen igual


Ias ventas.

39

cle

Frec. absoluta

lcs

Frec. relativa

longitud, halle el promedio, la mediana y la desviacin estndar de

En Ia siguiente tabla se muestra la distribucin de frecuencias de los pesos de 100 personas:


Peso

(t e)

Frec. absoluta

Frec. relativa

0-24
24-48
48-72
72-96

Frec. relativa
acumulada

0.18
26

0.78

Calcule la mediana del peso de estos individuos.


40

La siguiente tabla incompleta muestra Ia distribucin de frecuencias de los dcpsitos bancarios


realizados por 50 clientes, siendo el ancho de clase es constante e igual a 200.
Intervalo

Punto
medio (r)

Frec. absoluta
("0)

Frec. absoluta
acumulada (l/r)

Frec. relativa

(f)

0.22
I 100

t2
7

0.06

Luego de completar la tabla, calcule:

a)

cuntos clientes realizaron depsitos menores a 1000 dlares?;

b)

qu porcentaje de clientes realizaron depsitos entre 1200 5' 1600 dlares?;

c) el promedio, la mediana y la moda de

los depsitos.

Captulo 2

El Concepto de Probabldad
Las preguntas ms importantes de Ia uida son, para la
tnaAor parte, realmente solo problemas de probabili,dad

Pierre Simon Laplace

-r

la naturalezay en la vida cotidiana se presentan fenmenos cuyo resultado se determina antici-

-.damente mediante la aplicacin de ciertas leyes o frmulas; por ejemplo, los resultados de mediciones
:-rmtricas, los clculos financieros o ciertos procesos fsicos.

-enrbin existen fenmenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se d; por ejemplo, la ganancia que obtendr un inversionista
-=-pus de dos aos, el tiempo que sobrevivir un cnyuge a la muerte de su pareja o el nmero de
;-ros eu pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipacin a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.
?ara dar una explicacin matemtica a aquellos resultados que aparecen en experiencias en que est
-r'olucrado el azar, se desarroll la teora de probabilidades.

2.L. Resea histrica


-

a presencia del hueso de astrgalo de oveja, que constituye el antecedente inmediato del dado, en las
=-<cavaciones arqueolgicas ms antiguas, parece confirmar que los juegos de azar tienen una antigedad

mil aos. En Ia India, en el Rig-Veda (aproximadamente 1000 aos a.C.), se menciona un


;:ego de dados como un intento de medir la probabilidad. En Grecia, Sfocles atribuye a Palmedes
-= invencin del juego de dados, durante el sitio de Tloya. As, en casi todas las culturas antiguas
= posible encontrar referencias que nos indican que el estudio de los fenmenos aleatorios (dados,
-Jresencia de lluvia, el clima, etc.) fue muy importante.

-:

ms de 40

=n el Renacimiento se produjo un abandono progresivo de explicaciones teolgicas, lo que condujo a


';a reconsideracin de los experimentos de resultado incierto, y los matemticos italianos del siglo
\VI empezaron a interpretar los resultados de experimentos aleatorios simples. Por ejemplo, Cardano,
:n 1526, estableci, por condiciones de simetra, la equiprobabilidad de aparicin de las caras de un
jado. Por su parte, Galileo (1564 - 7642), respondiendo a un jugador que le pregunt por qu es
ns difcil obtener 9 tirando tres dados que obtener 10, razon que de las 216 combinaciones posibles
51

Captulo

52

ccluiplobables, 25 coticltrcett a 9
C o n,si, d, eraz'i, o ne.

o'p'ra,'il

q i,r

t,

oco

2. El Concepto de Probabilidad

y 27 a 10. Galileo public

estos rcsultrcios en un tlatrclo liarnaclo

d,e,t, d,o,rli.

El desarrolio clel anilisis rnatenrtico

los juegos dc azal se produjo durrnte los siglos XVI y XVII.


Algunos autores consideran como origen del clculo de probabilidades la lesolucin del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Mer, fue cnro debera repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemticos public al respecto, s lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.
c,le

Durante el siglo XVIII, el clculo de probabilidades se extendi a problemas fsicos y de seguros


martimos. El factor principal de su desarrollo fue el conjunto de problemas de astronoma y de
fsica que surgieron ligados a la constatacin emprica de la teora de Newton. Un primer problerna
fue el tratamiento de los errores de medicin: se dispona de varias medidas independientes de una
determinada magnitud fsica y se presentaba el interrogante de cmo combinarlas para obtener un
resultado ms preciso. Daniel Bernoulli (1700 - 1782) proporcion la primera solucin al problema de
calcular una cantidad desconocida a partir de un conjunto de mediciones de su valor que) por el error
experimental, presentan variabilidad.
Pierre Simn Laplace (I749 - 7827), introdujo la primera definicin explcita de probabilidad y desarroll la ley normal como modelo para describir la variabilidad de los errores de medida. En esta poca
tambin hubo importantes contribucfones de matemticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenmenos.

Durante el siglo XIX, los matemticos y astrnomos continuaron ampliando la teora, de manera que
a mediados de este siglo ya existan Ias herramientas que permitieron su consolidacin como una rama,
cientfica. A pesar de ello, la aplicacin de estos principios se restringa a Ia Fsica y la Astronoma.
Una descripcin axiomtica de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituy la base de la moderna teora, tal como hoy la conocemos. Con sto, se consigui elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.

En las ltimas dcadas, el empleo de la teora de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicacin, como la ingeniera, el clculo actuarial o la economa
ha crecido enormemente y su conocimiento es una necesidad imprescindible.
Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del anlisis combinatorio.

_I--

2.2.

Fundamentos de anlisis combinatorio

Primero, definamos eI factori,al de un nmero entero positivo

n!:nx(n-1)

como el producto

x2xl. con0!:1

Ahora, consideremos un conjunto finito compuesto por n elementos diferentes: {a1,a2,...,a,-}. Se


por k elementos (k I
El nmero de estos subconjuntos
").
depende de si los conjuntos son ordenados o no. Las colecciones ordenadas se llaman uariaciones y
las no ordenadas combinaci,ones.
desea formar una coleccin constituida

2.2. Fundantentos de anlisis contbinatorio

53

Definicin (de variacin)

Se clenorninr variaci(rrr a cr.cla nrro cle los irrrcgJ,os orclcrrrrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'l cluc estos arrcrglos rlificrcrL cn algur
.-enientr.i o en el orden de colocacin.

r-

rrrrnero cle r'rrirciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a

,nl

Wn:'n

(n-A:)!

Definicin (de combinacin)

Se denomina combinacin a cada uno de los subcorr.juntos de k


(A: ( n), sin tener eu cttenta el ordcn de los rnismos, de
elernentos
de
otro
de
n
.-ementos, tomados
--.anera que no pueden haber dos combinaciones con los mismos elernentos.

:-

nmero de combinaciones de k elementos que pueden obtenerse a partir de un conjunto de n


.-:mentos, denotado por Cf., es igual a
nl.

kt(n

{ Cf se le denomin

k)t'

a coef.ciente bi,nomi,al.

E.jemplo. Encontrar el nrmero de variaciones y de combinaciones de dos elementos que


-.'tener a partir del conjunto {a,b,c}.

-:'lucin:
a)

Se tiene

Se pueden

n : 3 y lr :

formar

2.

3! : 6 :
V! : .-(3-2)! ;1
(a,

'o) Se pueden formar

^2
"3 -

se pueden

b),

(b,

6 variaciones, qlle soII:

a), (a,r), (c,a), (b,c), (c,b).

3!
:
2(3 - 2)! ^-L
2.r

3 combinaciones:

{o,b}, {o,"}, {b,r}.


Definicin (de permutacin) Una permutacin de n elementos

r:

es cada una de las variaciones

los n elementos distintos.

=- nmero de permutaciones de

n elementos

es igual a

Pn:
Ejemplo. Encontrar
I 'iuc'in: Son P3

n!'

Ias permutaciones que se pueden forurar a

3!

paltir del conjunto {a,b,c}.

6 permutaciones; stas son:

(a,b,c), (a,c,b), (r,o"b), (c,b,a), (b,c,a), (b,a,c).


-dirora, consideremos dos conjuntos de rn

y n elementos, respectivamente:

A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.

Captulo

54

2. El Concepto de Probabilidad

Parejas. Con los n elementos <.lc A y los tr elerucntos


<rr: contcngan lln cleniento rle c:rdr con.jrrnto.

cle

cs posible forrnrl nt,xTt ptrlejirs (rt,,lt,)

Ejemplo. En uur fibrica cle calzrc,lo se confcccirnrn 4 Lnodcl<s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.
Gencralicemos estc concepto a arreglos mrltiplcs.

Arreglos mltiples. Consideremos los conjuntos A: {at,a2,...,a,rr} de n elementos, B :


{,b2,...,b,r}dcnelementos,yassucesivamentehastaG:{g,g2,...,g"}deselementos. Con
ellos es posible formar rnxn x...x s arreglos (a,b,...,gr) que contienen un elemento dc cada
corr.lunto.

Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y as sucesivamente, hasta un procedimiento G de s rnaneras.
La accin consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.

Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios segn su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.

Anteriormente, se examin las permutaciones de elementos de un conjunto, pero sin repeticin; si ahora
queremos determinar las permutaciones con repeticin, bastar considerar en los arreglos mltiples el
mismo conjunto.

Definicin (de perrnutacin con repeticin) llna permutacin con repeticin, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.
El nmero de permutaciones con repeticin es igual
P,\,

nk

Ejemplo. Con los elementos del conjunto A: {a,b,c}, cuntas permutaciones con repeticin,

de

dos elementos, se pueden formar?

Soluc'in: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene
y k :2; entonces, hay un total de 32 : 9 permutaciones con repeticin; ellas son:
(a,

2.3.

a), (a,b), (a,c), (b,o), (b,b),

(b,

n:

c), (c,a), (c,b), (c,c).

Eventos y espacios muestrales

Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<l nmero que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.

Definicin (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situacin que involucre incertidumbre.
Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de ms de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras

2.4. Defrnicin axiotntica de la probabilidad

bl)

llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cst conformado de Los cventos
-lementales <(sale dos>>, <srle c;uatro>> y <<sale seis>.
,Jbselvernos que todo cvento relacionado con una pn,reba

se pr"rede

desclibir en trminos de evertos

.lenrenta,les.

Definicin (de espacio muestral) La coleccin

de todos los eventos elementales, notirdo por Q,

-e denomina espacio muestral:

A: {rl o es evento

elemental}.

lntonces, un evento no es ms que un subconjunto del espacio muestral O.

por Gaiileo para resolver el problema


-e por qu en el lanzamiento de tres dados "10" y "11" aparecen ms frecuentemente qr-re "9" y "72" .
?ara resolverlo list todos los casos posibles.
Sealemos que el concepto de espacio muestral fue introducido

-,

olviendo al ejemplo, si consideramos el nmero de puntos que aparecen al arrojar un dado, tenemos:
Espacio muestral: Q

{1, 2,3,4,5,6}.

A-- { el nmero que sale es par }: {2,4,6}.


-''rmo los eventos se asocian a conjuntos, es natural pensar que sus operaciones tienen algn significado
rmo eventos.

::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi--rnes de las teoras de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.

Notacin
0
0

.4r B
-4. B

.4\B

-4':CI\A

A)B:A
,4C B

lnterpretacin en la teora
de conjuntos
Elemento o punto
Conjunto de puntos
Conjunto vaco
Unin de conjuntos
Interseccin de conjuntos
Diferencia de conjuntos
Conjunto complementario
Conjuntos disjuntos
A es subconjunto de B

:s claro que estos

s
IS

Interpretacin en la teora
de probabilidades
Evento o suceso
Espacio muestral (suceso seguro)
Evento imposible
Por lo menos uno de los eventos A o B ocurre
Ambos eventos A y B ocurren
A ocurre y B no ocurre
No ocurre A
A y B se excluyen mutuamente (incompatibles)
Si A ocurre, tambin B

conceptos se extienden a cualquier sucesin de eventos.

2.4. Definicin axiomtica de la probabilidad


Lna probabilidad provee una descripcin cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de inters.
Formalmente, la probabilidad de un evento ,4 se define como una funcin que cumple:

Captulo

56

2. EI Concepto de Probabilidad

ii

Figura 2.1: Interpretacin de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, tambin B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").

. A1.

Para todo evento A: 0 < Pr(A) S 1.

. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles:

Pr(A U B)

Pr(,a) + Pr(B).

De aqu, no es difcil demostrar que en general se cumple la relacin:

Pr(A u B)

Pr(A) + erla

- Pr(. B)

(2.1)

conocida como frmula de Ia probabilidad para Ia unin.

Ejemplos

1.

Dados los eventos A,


conjuntos los eventos:

B y C del espacio muestral f). Expresar mediante las operaciones

entre

a) Tan solo ocurre A.

b)
c)

Si ocurre A, no ocurre B.

Por lo menos dos de los eventos ocurren.

Solucin:

a)

Puede ocurrir A,
r E AA B" NC".

b)

Si no ocurre

y simultneamente no ocurre B y no ocurre C;

B entonces ocurre B";

es decir que <<si

es decir que el evento es

ocurre A, tambin ocurre -8">>, el evento

esc AcB".
c) Ocurrirn (Ay B) o (Ay C) o @ V C) o (Ay B y C), pero el ltimo evento est contenido
en los tres primeros. El resultado es: (,4n B)U(AnC) U (BnC).

2.

Demostrar que:

a) Pr(")

- 1-

Pr(A).

2.5. Clculo de probabilidades


b) Si A C B

errtorices PL(A)

:)t

< PL(ll).

Soht,cin,:

0: AA' (conAyA"disjuntos), entoncesi)or A3.. PL(O) :Pl(A) +Pr(A") vpolA2.,


Pr(O) : 1; corr lo que se obtiene: 1 : Pr'(A) + Pr(") v el lesultaclo es inrnediato.
b) Si A C B entonces B: AO(A' tl.B) siendo Ay (A ttB) incompatibles; por lo tanto, por'
A3. Pr(B) : Pr(A) + Pr(4" n B).
a)

Por ,A1.,

.A.

Pr(A n B) > 0, entonces Pr(B) > Pr(A).

continuacin damos varias definiciones de mucha utilidad:

1.

Dos eventos son igualmente probables si Pr(,4)

2.

El evento A es ms probable que B si Pr(A) > Pr(B).

3.

Pr(B).

Euento c'ierto.- Es el que siempre aparece en la realizacin de un experimento, su probabilidad


es igual a 1.

4.

Euento zmpos'ible.- Es aquel que jams puede ocurrir, su probabilidad es igual a 0.

2.5. Clculo de probabilidades


-\l realizar el clculo de Ias probabilidades

es necesario distinguir de qu
Cisponemos; ellos pueden ser: fi.nito, infinito numerable o continuo.

tipo de espacio muestral

2.5.L. Espacios muestrales finitos


Si consideramos el evento A: {rtru)2...,o}, su probabilidad est completamente determinada si
conocemos sus valores en cada elemento Pr({r,,,1}), Pr({a.'2}), . . ., Pr({c,.',}); entonces,

Pr(A)

(2.2)

DPr({a.'}).
i:t

Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.
Si convenimos en designar Card(A) el nmero k de elementos del conjunto ,4
de elementos del espacio muestral; entonces,

Pr(A) :

Casos favorables de

y Card(O) el nmero l/

Casos posibles

Card(A) k
Carcl(A) /
Es decir, la probabilidad de un evento aleatorio A es igual a Ia relrcin cntre el nrmero de everrtos
eiementales favorables (cuando A sucede) y el nirmero total de eventos elementales del espacio muesrral. Esta definicin es satisfactoria en ploblemas referentes a jr,regos de azan',loteras o experimentos
sencillos.

2. EI Concepto de Probabilidad

Captulo

58

En el ejemplo clel lanzamicrtto cle


O

dado cortsicleremos el evcnto A <<salc rtn nrimero

rrn

: 6,
Card(A) :3.

{1, 2,3,4,5,6},

Card(O)

{2,4,6},

Pr(A)

rar>>:

Card(A)
:-:-31
:ffi
62

En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos
anlisis combinatorio al clculo de probabilidades.

de

Ejemplos

1.

En un estante hay 2 libros de historia y 3 de biologa. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biologa sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,n:

a) Por defi.licin, O : {11r, Hz,Bt,Bz,Bs}.


Sea A el evento <<escoger un libro de biologa>>;
Pr(A)
'-'

b)

es decir,

A: {Bt,Bz,Bs}.

:9'1!9
:I
Card(f^)) 5'

Que ambas veces se seleccione un libro de biologa significa:

.
.

que la primera eleccin es un libro de biologa, entonces se tiene 3 casos favorables; y


que la segunda eleccin tambin sea un libro de biologa, entonces hay 2 casos favorables.

As, el nmero de casos favorables es igual a 3 x 2 : 6.


El nmero de casos posibles, de todas las parejas sin repeticin, es 5 x 4
Entonces, la probabilidad buscada es

63
u- 20
2.

Por tanto,

:20.

10'

En la final de un concurso escolar de matemtica participan 6 alumnos, de los cuales 3 pertenecen


al colegio A. Si se premia a los dos primeros con regalos diferentes, cul es la probabilidad de
que los alumnos del colegio A obtengan los 2 premios?

Solucirt: El conjunto f) est constituido por las parejas que se pueden formar con los 6 participantes. El nmero total de parejas es Vfr
Sea el evento

B:

: fr :

tO.

<<ganan los alumnos del colegio A>>.

El nmero de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,

Pr(B)

3.

:*:0.,

Entre 100 fotografas de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.

Solucin: Ei espacio muestral Q est formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.

2.5. CIculo de probabilidades

59

nrmero de resultados favorables que nos interesa es igual


escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'

al total de formas como pueden

El

La probabilidad buscada

es

Pr(A)

4,

CP^
:e';:10.
1

En el Consejo Universitario cada una de las 10 facultades est representada por el decano y
el subdecano. Se nombra una comisin de 10 miembros elegidos aI azar. Determinar Ia probabilidad de que:

de

a) una determinada facultad est representada;


b) todas Ias facultades estn representadas.
Solucin:
)ma
i) la

facultad dada no est representada>>, y


en
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
cuestin, por Io tanto existe" C18 casos favorables'
EI nmero de comisiones diferentes de 10 miembros que se pueden formar con los 20 miem-

a) Considerando el evento complementario A':

bros es C|$,

entonces

Pr(a")

<<una

r_rlq g
: s,
:;ifr

finalmente,

Pr(A)
s'Y

-1-*:#

x0.7632.

de maneras diferentes en que pueda estar un representante de cada facultad en la


comisin es 210. La probabilidad del evento B: <<todas las facultades estn representadas>>

b) EI nmero

bles.

Pr(B)

#ry

0.00554.

arrojan dos dados. Hallar la probabilidad del evento


salen ms de dos puntos).
Se

{al menos en uno de los dos dados

Solucin: EI espacio muestral puede describirse como


reCen

cl:

rd de

rarti-

{(i,

j)li, j: L,2,...,6},

j
donde el evento elemental (i,j) corresponde a los puntos aparecidos en un dado y los puntos
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen ms de dos puntos y
con B2 el evento anlogo para el segundo dado:

Bt : {U,j)l i-_ 3,4,5,6; i :1,2,-..,6},


Bz : {(i, j)l i -- L2,. . . ,6; i :3,,4, 5,6}
u10
Leden

por lo tanto, card(B1) : card(Bz) :21. Puesto


Card(B1 B) :42 :16. Ahora bien,

Pr(81)

Pr(Bz)

:'! :
36

qrue

?, y

B1l\82: {(i, i)l


Pr(81

i,i :3,4,5,6},

Bz):#:

entonces

Captulo

60

2. El Concepto de Probabilidad

Dc la fr'rnula dc probtrbilidacl para la nrrirr se obtiene:

Pr(A) :

Pr(l]1

Bz): Pr(Br) + PL(82) - Pr(81

2248
: 5-5-9:b

Se recomienda que el

Bz)

lector resuelva este ejercicio rnediante el ernpleo del evento complernentario.

2.5.2. Espacios muestrales infinitos numerables


Sea

f)

{cur,

u)2...run,...} un espacio muestral infinito numerable; entonces, resulta

que

:1,
ie,1i,,,))
i:l
luego, si

es un evento de Q, su probabilidad se calcula por

Pr(A)

: t Pr({a.'}).
u,A

Para el clculo de las probabilidades, generalmente, se utilizan series numricas infinitas.

Ejemplo. Juan y Andrs juegan tenis con la misma habilidad.


hasta que uno de ellos gane 2 sets seguidos. Halle la
par de sets para terminar el juego.

Solucin: Sean los eventos: J:

<<gana el

Deciden jugar una secuencia de sets


probabilidad de que se necesite jugar nmero

set Juan>> y A: <<gana el set Andrs>>.

Segrn el enunciado, el espacio muestral est conformado

rL
1.
2.
3.
4.
5.
El evento B:

Empieza Juan ganando

JJ

JAA
JAJJ
JAJAA
JAJAJJ

por los siguientes eventos elementales:

Empieza Andrs ganando


AA
AJJ
AJAA
AJAJJ
AJA.IAA

*
*

jugar hasta que uno de ellos gane 2 sets consecutivos>> es la unin de los eventos
que estn sealados con una estrella (*) en el espacio muestral.
<<se

Se tiene que

Pr(JJ) +

Pr(AA) :

Pr(JAJJ)+ Pr(AJAA)
Las restantes probabilidades,on

i'
1

=.
8

l,32', l12g'etc'

Entonces, la probabilidad de B est dada por la suma

Pr(B)

:
:

[Pr(JJ) + Pr(AA)] + [Pr(JAJJ) + er(e;eA)]

1111
_
_
_
_l_

_l_

-.t-

2'8'32'128 -

_-!- -.

')2tt-l

_.1_

_l_

+...

2.5. Clculo de probabilidades


La srrlrr cle est selie geornritrir;r es igual a ?, ,r,,r'Io clrrc Pr(B)

33

61

?.

2,5.3. Espacios rnuestrales continuos


Sttpongamos cte sc tienc rtna" figura rltrna f) v <lcntro de ella sc encucrrtr'1 otrr figura A (Figura 2.2).
Sobre Ia figura Q se hr rrrrlCrdo uu pttnto al azar'. Suponiendo <1ue la prolrabilidtrcl clc que el punto
':aiga en A es rropolcional al ilea de Ia figula y no de su forrna o posicid-rn, la prolrabiliclad de quc el
'r-ttlto caiga en la figu'a A cs:
r-ca de A

l'r'(-4)

Area de f)

-.

Figura 2.2: Interpretacin geomtrica de Ia probabilidad.

ItS

)ro

En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs

Pr(A):

\{edida cle ,4
\tledida de O'

Ejemplos

1,

Sobre un plano se trazaron circunferencias concntricas de radios 5 cm y 10 cm, respectivamente.


Halle Ia probabilidad de que un punto marcado aI azar en ia circunferencia mayor caiga tambin

en el anillo forrnado por las dos circunferencias (Figura 2.3).

Figura 2.3:
Sol:ucir: El r'ea del crculo lnayol es

,5: I02rcm2: 100ir<'rrr2.

El rea del anillo comprendido entre las dos circunferencias es igual a la diferencia entre las dos
reas:

7:

(702n

52n) cm2

75tr cnt2; entonces,

Pr(A)

T
75r cttt2
:s:loo;"-t:o'75'

Captulo

62

2.

l) :

{(:r;. !l) I () <:t; I 1; il


v sitP<ttticrttlo c.irrr: io<lrl prulto
Sr:L

2. El Concepto de Proba'bilidad

:l I ii
<l<r

(i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtolir


(l'itrrr,'l;r risrirr rlolrrrlrilirltlrl ilc sLl 1r".rLtLo clL r;rrerL1a.
Jr

il 4

,,4n8

117

Figura 2.4:
Detclrninar' la probabilidacl de los evcntos:

A: {(r,y)/0 I r < tl2; 0< y < t};


lr) B : {(",y)10 ( r { 1; 0 < y < lla);
.d)

c) An B;
d) A B.
Solttctr:

O: 1 x 1 : 1.
re.r cle A:!
* t: 1. eutrnces pr(.,{) - !12 :!.
22
1:
l,) rcu de B - *
j,,,,rto,,,", Pr(1J) :+ =
i
' 1:
a) rca

cle

.,) r'ea rt: A

:;

" I: j,

"r,tou.",

pr.(A n B)

cl) Por la fr'inula dc la unirr,

Pr(A u a)

2.8"

Fr(,a) + Pr(B)

111ir
2488

- Fr( n IJ)

;i!e::cir:ios

Anlisis cornbinatorio

l"

Culcuie lcis siguierri,cs (ioccitintcs bilorrrilcs Cf,: n)

2.

C.lc.le

Vf

3. Dctcrtrtirc
it) rt,:3

eri
r:1

l<,rs

sigrricrrtcs cr:jos: ,r)

Vl; lr) V!;

Ci; b) C1]; r) Ci:

,r) V3; cl) \.].

tttirnclo tle lrr:ilruiar.:i'rn('s ( lr rilr,,,,l.iiurt' lg


1r)

n :4

c)

rt:5:

4. Dci,clttiilrt cL rrirrrcro <1r: rarr:iils fllrtrarl,Ls

1 r)]r:rrrr:irr r

:(t
'l)'t t

i;r-,i los crlctrretrtos rlc los,

2.6. Ejercicios
a) Carrl(,'l)
b) CaLrt(A)

f,
,).

-.)
I
Car rl(ll)

Clar <l(13)

C:)

,t)

t-).)

- 8, CaLri(lJ) : lj;
Card(.,1) : 1ij. Clald(t: - 5.

CaLcl(,'l)

Cr-rntcls alrcglos se prrerlcu forrnu corr los eleurcntos de los cou.lrurtos cuvr cardinrliclrd sc in<lica:

: 2
Ctrrcl(B) :7;

: 4;
b) Card(A) :5;
a) Card(A)

6.

Carcl(C)

- 5.
:4;

Card(D)

5.

Cnntas palejas con rclposicrn pueden formar-se con conjuntos crtya crlclina.lidad

n:3;

a)
l.

Crrrd(C)

Card(13)

b)

rz:5;

c)rt:T;

es:

d) rr,:8.

Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:

a) A: {a,,e,'i,o,z} cn grLlpos de tres elementos;


b) B : {I,2,3,4, 5,6} en grupos de tres elementos.
8.

Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposicin y parejas con reposicin:

^)

b) B: {I,2,3,4,5,6).

A: {a,e,i,o,u};

r;r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:iir::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. De cuntas maneras se pueclerr elcgrr esr,e par dc fiutcrorrilios
si el presidente debe ser nn ;:iente?

Ul

hospital cuenta con 21 ci r.ijanos (ion ri)s,


.Cunttrs ternas sc pueclen f:rrnar?

,,'-.ies

hay que folrnar ter-uas para relizar guardias.

Un amigo le quiere regalar a tro 3 cliscos y los quiele clegir cntre los 10 que ms Ie gustan.

.Dc

cuntas marreras pucde hace'lo?


')

c,iirs, r'ccolclando quc stas


sorr difclentes, J.as malc al azar-. Halle la probabilic.lad de que se haya marcado las cifras
Al

marc:ar urr nrniero telcfnico lula persona olvid las trcs rltimas

correctts.

De entre 9 empleados se deben selecciorrar a 3 para viajar a 3 Jrlar,'s A, B y C fuera dc la


ciuclad. Cacla empleado ir a una planta. De cuntos modos se puede iracer la seleccin de los
ernpleaclos que via.jarn?

Eu cl ejcrcrcio rntelior considresc qrre los 3 enrpleirclos \an a ir


rnaneras se puede hacer la seleccicin?

l misrna

planta.

.D<:

curintas

Si cn el ejelcicio antcrior, cle los 9 ernplcaclos, 7 son homl>res. Cul es Ia probabilidacl


entrc los tr<ls cscr-lgiclos'/

de

sclecciorra: cxrcta,rnentc r.rrrtr nrr-er


_)

.Currtos nrirneros de 6 cifras pucderr haccrse con los

rr) sin rcstliccin

algrrua'/;

b)

dgitos

sin rcpctil ling;'.url

{I,2,3.4,

cifra?; c)

5, 6}:

maStolcs crc 500000?

Sicte pcrsonrs h1n soiicitado empleo para lleuar dos r.acantcs. De currtos modos se puerclen
llcrrar lts vat:rrrtcs si:

rr) la pr:irncrl i)crlsoul selcccionaclr tecibr,r


b) no hay clifer'<lrrcil cntre las racan1 cs'/

nr:tyor

salario que la s,)grul(ia?;

Captulo 2. EI Concepto de Probabilidad

64

y en el

18.

i',Cttrrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos
.iuegan toclos contla to<[os. rul{) crr crsa V otlo <lc visil rlrte?

19.

Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rns del pan 1,
la catne, puede ir cou todo lo siguiente r sin ello: salsr clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. .Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?

20.

La produccin de una rnqnina cronsta de 4 frses. Ilirl' 6 lneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrrr. Detelmine de cnntas forrnas distintas
se puede montar Ia mquina en este proceso de produccirr.

21. Eu un plano hay 15 puntos

quc

de los cuales rro hay tles que sean colineales. Cr-riintas rectas

determinan?
22.

Cuntos tringulos determinan los vrtices de un polgono regular de 9 lados?

23.

Una heladera tiene 16 sabores disponibles. De cuntas formas se pueden pedir 6 helados si:

a) no se elije el mismo sabor ms de una vez?;


b) se puede pedir un mismo sabor hasta 6 veces?;
c) un sabor no se puede pedir ms de 5 veces?;
d) la mitad debe ser de fresa?
Un entrenador de frtbol debe seleccionar a 11 jugadores de entre los que haba

24.

conocado
anteriormente para Ia concentracin. Si puede hacer su seleccin de 72376 maneras, .cuntos
jugadores estuvieron preserrtes en Ia concentracin? (Se supone que ningirn .jugador tiene un
puesto fijo de juego.)

25

En un Ienguaje de computacin, un identificador consta de una Ietra o de una letra seguida de


hasta siete smbolos, qrte ptteden ser letras o dgitos. (En este lenguaje son indistinguibles las
letras maysculas y minrscrrlas, hay 26 letras y 10 dgitos.) ',Cuntos identificadores diferentes
se pueden utilizar en el lenguaje de computacin?

26.

En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete


maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. De cuntas maneras se pueden registrar los resultados si:
a) X gana en cinco

sets?;

b) para ganar el partido


27.

se necesita

jugar como mnimo

tr.es sets?

De cuntos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el

pulgar?

Definicin de probabilidad
28

Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones


conro uniones e intersecciones de A, B y C y de sus conrplementos.

ocurre; c) No ocurre ms que un e\-ento:


b) Por Io menos uno de los eventos A, B, C d) Ocurlert exactanlellte cios eveutos;
ocnrre;
e) Ocrrrren no ms de dos e\-entos.
a) Ninguno

de los eventos

A, B, C

29. Con el empleo de Ia definicin

de probabilidad, dernuestre:

2.6. Ejercicios
a) Pr(0) : o;
b) Pr(AuB) : Pr(A) +Pr(B)
aj

-Pr(Ana);

c) Pr(A u B) < Pr(A) + Pr(B);


cl) Pr(A) : Pr(-4nB) +Pr'(AnB').

30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.

i,
AS

31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1.


2
3"
Pr(A'O B) en los siguientes

casos:

a) A y .B son incompatibles; b) A C B;
:32.

Se consideran dos eventos

Determine el valor de

Ay B, con Pr(A) :

c) Pr(A n B)
0.375,

Pr(B)

0.5 y

er(AnB) :0.125.

c) Pr(" ) B");
d) Pr(" n B) y Pr(A.

a) Pr(") y Pr(B");
b) Pr(A u B);
A y B dos eventos tales que Pr(A)

:0.9 y Pr(B) :0.8.

: :1
8

Demuestre

Calcule:

Bc).

quePr(AnB) >

'),).

Sean

0.7.

34.

Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar


resultado. Escriba el espacio muestral del experimento.

el

rdo

tos

,JD

utl

de
las

tes

Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprtelas):

a) Pr(A);
b) Pr(,A u B);
c) Pr(B");

ete

d) Pr(A n B);
e) Pr(A \ B);

f)

Pr(" B");

g) Pr[(A n B)"];

h) Pr(A u B').

lue
:

36.

En la interseccin de una autopista, los automviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observacin se registra el sentido de la maniobra de los tres primeros
vehculos.

a)

Cul es el espacio muestral del experimento?;

b)

rel

Sea A el suceso <<a lo ms uno de Ios coches gira a la derecha>>, B: <<todos los vehculos
giran en Ia misma direccin>> y C: <<exactamente uno de los coches gira a la derecha>>.
Qu relacin existe entre Ios sucesos B y C?;
c) Enuncie y halle los elementos de los sucesos B', BUC, A)8, AcaB".

Clculo de probabilidades
.)/.

Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se har el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:

Captulo

66

38

scloc:r:iorr<i

a)

SC

l,)

s(l s<rlc<:r:ioLra

Sttpong:t quo
r.cgLttLc[,r

2. El

Concepto de Probabilidad

itl plovrtr:clor' /l;


ttl 1>r'ovccrlr.rt A c ():

c) cl proverr:clor

cll ttn soLt(:o itr lrrolrirlrilicltcl rlc galiar

rt.'tnio,'s

3^Si 1a
:.
irrolrabilirlrr1
i

r[c

Bur:r1 rl

c1

,,1 rro sc sclc<:cionr

prirner prcrrric-r.,,

nretrros rrrro clc los rlrs

la probabiliclrcl clc garrrl solo rrrro dc los rlos plenrios'/


39

f v

1a,1" girnzrr cl
3

ltlcrnios es ;-l . ;.r:irlcrrlc

Sc enr'rtt 3 oficios a 3 personas diferrentcs. Sin ernbrr'lo, una secretria distr'rcla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(l rl z1r. Si turr coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:

a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40

4I

La fbrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:

a)

se piclan uno azul, uno blanco

b)
c)
d)

se piclan dos azules;

y uno rojo;

se pida por lo menos rrno vcrde;

exactarnente cios rle los cluc se pidicron tengan el rnisnro color.

Lr-icgo dc las 1>ntel)ls tr)I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje

obtenido. Los rcsrtltr<los uo le llegtrn al empleador pol lo quc l contlatr a clos aspirantes al
azar'. ,Cul cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor crlificados?
,1

r)

43

Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.

En ttna caja hay 20 fotografas en la cual htry 6 mal tomadas.

,Cul es

la probabilidrd

de

selecciorrar 2 fotografas clefectuosas'/


44.

Entre 100 artculos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altculos
escogidos aI azar, no sc tenga ms cle un artculo defectnoso.

45

Un distribuiclor de electrodomsticos recibe un euvo de 20 pianchas, cie las curles hay 3 defcctuosas. Para conocer si el lote est buerro pmeba 6 aparatos. trl distribuidor aceptari el lote
si cltcttetitra a lo rns ltn aparato dcfec:tnoso cntrc los prolrados. Cul cs lt pl'ollabili<lad cle
rechazar el envo'/

46.

De un ttft-rrir, quc contietre 100 boletos. se extrerr tres bolctos ganadores. ;.Crr1 cs la lrrob:rbiliclad de que gane una persona que conrlrr:

a) 4 boletos?;

lr)

solo un bolcto?

47.

Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan unr ca:i-i'la,l merrol clue
la que el cliente comprr. tlu inspect,or clc la Dircccin de Hiclrocarbrrros r-i..it:r aiertorirmente
cinco de ellas para velificar si la cantidad'n'enrlidr cs correctt. ,CLrl es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?

48.

En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil'


40 cartas. ,Cul es la probabilidad de que un jugador tenga:

,Le

rrn mazo de

2.7. Independencia y condicionalidad


r)

67

urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;

l,) 4 cu'tas <lel rnismo pirlo'/;


t:)

rrua

<<rorrcla>>; cs

rlecir', 3 calt.rs rle ia rnisrna clelornillci<in (as, clos, etc.)?

i9

En nrr closet hay 6 pales cle zrpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.

50

Err los pases europeos existe una forma muy popular de lotera, llamada Lotto, que consiste en
seleccionar'6 nmeros de una cartilla que contiene 44 nrmeros (del I aI 44). El da del sorteo
se seleccionan 6 bolas al azar y sin reposicin. Una persona gana el premio principal si los
6 nmeros sorteados coinciden con los seleccionados; tambin se puede ganar prernios si 4 o 5
nrmeros sorteados coinciden. Determine la probabilidad de:

rle

OS

na

a) ganar el premio principal;


rra

51.

de

b)

ganar al menos un premio.

Una persona presiona, aI azar, 8 cifras en una calculadora. Cul es la probabilidad de los
eventos siguientes:

a)

,4.: <todas las cifras sean distintas>?;

b) B: <<el producto de las 8 cifras es un nmero par>>?;


c) C: <<las 8 cifras forman un conjunto creciente>?;
d) D: <<la suma de las cifras es igual a 3>>?
aje

i2.

probabilidad de que un punto marcado aI azar en el crculo mayor caiga tambin en el crculo

,al

menor.

.1.J.
=.)

Dentro de un cancha de baloncesto, cuyas dimensiones son 20 m por 12 m, se encuentran dos


charcos que tienen forma de crculos, de 8 y 5 m de dimetro respectivamente. Cul es la
probabilidad de que una pelota lanzada a la cancha caiga dentro de uno de los charcos?

.J+
=1

Dentro de un rectngulo de base 10 cm y altura 6 cm se encuentra un crculo que es tangente


a 3 de los lados. Si se marca un punto al azar dentro del rectngulo, calcule la probabilidad de
que el punto no se encuentre dentro del crculo.

ule

de

Llos

bcote
de

En un crculo de 20 cm de radio se encuentra un crculo menor de radio 10 cm. Halle la

Dentro del rectngulo limitado por las rectas , : -L,, :;,


A : -7, A : l, se tiene el
grfico de la funcin trigonomtrica seno. Sobre el rectngulo cae una gota de tinta. Cul es
la probabilidad de que Ia gota de tinta haya cado dentro del rea comprendida entre el eje r y
la curva A: sel:x? (Observacin: Suponga que el rea, de Ia mancha de tinta es despreciable.)

2.7.

lue
nte
lue
,de

Independencia y condicionalidad

Fn la teora de probabilidad un concepto muy til es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da informacin sobre si otro evento ocurrir o no; es decir, Ios
-r-entos no influyen uno sobre otro.

Definicin (de independencia) Dos eventos A y B se llaman independientes si la probabilidad


de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
Pr(A n B) :Pr(A) x Pr(B).

2. El

Captulo

Concepto de Prcbabilidad

Esta dcfinicin se puede extender a cualquier nrmero de eventos.

Observacin.- Si A y B son independientes, se puede dernostrar que sus respectivos complementos


son independientes; es decir, que se cumple:

B'): Pr(A) x Pr(g").


Pr(A n B) : Pr(A') x Pr(B),
Pr(A" n B') : Pr(A') x Pr(g").

Pr(An

No se debe confundir los conceptos de eventos independientes y de mutuarnente incompatibles (disjuntos).

Ejemplos

1.

: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2;


1I;0
<y <Il ). Probar si A y B son independientes.
r

Sea Q

< y < I}, B

: {(",A)10 <

Figura 2.5:
Soluc'in: Segn la Figura 2.5 se tiene que Pr(A)

Pr(A) x Pr(B)
Por otro lado, antes se calcul que Pr(A n
Como se cumple que Pr(A n

2.

B)

B)

i,

:+"

PrlB)
\/4 :

l.
1

entonces

11
48'

Pr(A) x Pr(B), entonces los eventos A y B son independientes.

En una mquina, para la sealizacin de emergencia se han instalado dos indicadores que funcionan independientemente. La probabilidad de que el indicador funcione durante una avera es
de 0.95 para el primero y 0.9 para el segundo. Hallar la probabilidad de que durante una avera
solo funcione un indicador.
{funciona el primer indicador} y B: {funciona el segr,rndo indicador}.
El evento f, : {funciona solo un indicador} puede expresarse como C : (-{ i B')U (A l\ B).
Calculemos cada una de ellas:
Soluctn: Sean

A:

Pr(AnB") :
Pr(A'n

B) :

Pr(A) xPr(B') :(0.95)(1 -0.9) :0095.


Pr(A') x Pr(B) : (1 - 0.95)(0.9) : 0.045.

2.7. Independencia y condicionalidad


Pcu lo trutto.

Pr(C)

Pr'(,4 a 13")

Pr(4"

13)

:0.095 +

0.045

69

0.14.

Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<rrtcniclo <,1<'l suero c1t tllll tttttestra.
La proba.bilidacl cle <-re cada uno cometr Lln el'ror eu Ir lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:srectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rneclicitt pol lo meros ttno de:
Ios investigrclores coureta Lrrl erlor.
Soluc,i,n,: Ser el evento

complerrento es A"

{por lo menos uno de los investigaclolcs coniete urr crror},

: {ninguno de los investigadores

el

comete un error}.

Pr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.


Sean p la probabilidad de que el i-simo investigador cometa un error (i: I,2,3),

Caiculrrernos
(dis-

Pr(A') :

Resulta que Pr(A)

/0<

- 1-

0.612

(1
(1

entonces

-pr)(t-pz)(I-pz)
- 0.1)(1 - 0.15)(1 - 0.2) :0.612.

0.388.

n concepto estrechamente relacionado con la independencia es el de condicionalidad de eventos, que


.e lo puede enunciar de la siguiente manera: <<se tiene fijo un cierto evento B, se desea conocer cul
- la probabilidad de que ocltrra un evento A, sabiendo que ocurri B>>.
r-

?or ejemplo, suponga que usted va a almorzar al mismo Iugar todos los viernes y que su almuerzo
- sirve en 15 rninutos (evento A) con probabilidad 0.9. Sin embargo, daclo que usted nota que e1
_rstaurante est excepcionalmente lleno (evento B, fijo), la probabiliciad de clue sirvan su almuerzo en
-5 minutos pnede reducirse a 0.7. sta es la probabilidad condicional de ser servdo en 15 mirr.utos,
rado qne el restartrante est excepcionalmente lleno.

Definicin (de probabilidad condicionada) Consicleremos un espacio tnttestral Q y un evento


3 e Q tal que Pr(B) 10. La probabilidad condicional de que un evento A octtrra, en el supuesto
:,-re B ha ocurlido) se representa por Pr(AlB) (que se lee <<probabilidad de A, dado B>>), se define

Pr(AlB):HF
Ejemplos

-.

En nn estudio sociolgico sobre Ia fidelidad en el matrimonio sc obtu'u,o el siguiente modelo


probabilstico, calificando al hombre y a Ia mujer como fiel (,F) o iufiel (/).

entes.

Mu.jer

e fun-

Hombre

es

avera

lra

r).

a)

n B).

b)

0.22 0.24
0.31 0.23

.Cul es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
(luc srr csposo es infiel'/
'.Cul es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo

Sol'u,cin; Corrvengarnos en la siguiente notcirr de los ercrrtos:

fi.el,
,41F: N{u.ler fiel,

.f1F: Hornbre

111: Hombre iuficl,


11,/1: \4Lr.jer

infiel.

Captulo

70

2. El Concepto de Probabilidad

a) Dcseamos calcular
PI(II I-IAI F)

: f'r(II F.

n{F)
Pr(r1F)

De 1a tabla se obi:ierrcr cllle

),

trL(i1F . AI F)
Pr(n1F)

0.22 + 0.31

:0.53.

Con sto,

Pr(111lrt{F)

b)

0.22
0.53

0.415.

Calculcmos
Pr(A,I FIH
con

Pr(MFnf{f) :0.31

n HI)
i) : Pr(MF
Pr(H/)
y

PI(III):

+ 0.23 :

0.31

0"54.

Entonces,
pr.(,41

2.

FIHI\:
'

g'31
0.54

:0.bT4.

En un taller trabajan 7 hornl)res y 3 mujcles. Se escogen al azar 3 personas. Hallar la probabilidad de que todas las pcrsonas selcccionadas sean hombres.

Solucin: Designemos los siguienfes eventos:


A: el primcr selcccionado

es hombre,

B: el scgundo seleccionado es hombr-e,


C: el tercer selecciorraclo es honiirre.

* La probabiliclad

cle que el

primelo

s<-.r

u La probabiliciad de <+re el seguriclo

hombre es Pr(A)
\/

- :10

sea hombre a ccndicin de qrre el

primelo f.,e hornbre

ES:

__\_r--l
Pr(BlA\:9:?
9 3
u La pI'rbabilidad de que el tercero sea hombre sabir:rrdo
es la probabiiidacl dc C dado A y B:
:'r(C An
tr-ir pr"obabiiidrci buscacla

?, (,{

2.8.

tlc clrrc las i,lcs i)crsonrs

I B. C):

que los dos primeros trnrbin lo son,

: !.
ll),E

escc.rgiclirs sean

PL(,,t) x P: (13lri) x Pr(Cl4

i',

holrlrres

::
B)'1(l,i:

es

I:

Frobabilidad coxmpleta y fnrutula de Bayes

La probabilidrd
f:xclltt'giss B

t,

A, que puccic ocrrriir sclo rl lllrlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:


82, .. , 8,, (Figura 2.6), talcs (llre sli unirr es el espacio rri,r.:j r.- j ,'1 (lada por
clc:

Pr (A)

Lttt cvonto

I'r(131)Pr(,,t1-ts1)

Iri(82)Fr(Al1l2) + .."+

lt

\n,.r /? ' nr /
1r'.\L.tt_

1'|r

I'r,!,, i - :

(2 3)

2.8. Probabilidad cornpleta y frtnula de Eayes


donde Pr(81)

+ Pr(82) + .. . + Pr(B,,)

77

1.

La igualdad (2.3) se clenornirra la fr'rnttl,a dc la prolttt,bi,lidad com,pleta.

Figura 2.6: Particin del espacio muestral fl.


Supongamos que el evento A puede ocurrir a condicin de que aparezca uno de los eventos
..., Bn. Si A ya ocurri, la probabiiidad (condicional) del evento B es igual a

Pr(B6lA)

Bt,

Bz,

Pr(AnB)
:ffi:g;ffi

Pr(B)Pr(AlB)

i:I
Fsta ieualdad se denomina frmtil,a de Bayes.

?ara

clculo mediante la frmula de Bayes puede resultar conveniente disponer las probabilidades
diaqrama de "'rbol como el siguiente'.

e1

:t rn

A'
A
Ac
A

Pr(81)Pr(Al81)
Pr(81)Pr(A'lB1)
Pr(82)Pr(AlB2)
Pr(82)Pr(A'lB2)

Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")

rsta dispctsicirr de los datos facilita la rcaiizacin de los clculos ya que


nicamente se debe realizar
-na slrma de los resultados en las ramas de inters

Ejer.:rIos

l. En una oficina hay 6 computadorrs

de marca y 4 ciones. La probabiliclad de que al utilizar una


y 0"8 para las clones. Un empleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
mc1lrina, sta encienda correctameirte es 0.95 para las de marca

.4oluci,n: Definamos los eventos:


.3)

A: el empleado ul,iliza una mquina de marca,

B: el crnpleado utiliza una mquina cin,


C: la mquina enciende correctarnente.

Captulo

72

2. EI Concepto de Probabilidad

Sc ticrrc,

PL(A)

:*:,,0,

Pr(ClA):

Pr(ll)

4
:r0:,,.n.

Pr(ClB):

0.95,

0 8.

Si reprcsentrmos las probabilicladcs crr un ditrglama cle rbol se tiene:


C

PL(A) Pr(ClA)

(0 6)(0.e5)

Pr(B) Pr(ClB)

(0.4)(0.80)

Por la frmula de la probabilidad completa,

Pr(C) : Pr(A)Pr(ClA) + Pr(B) Pr(ClB)


: 0.6 x 0.95 * 0.4 x 0.8 : 0.89.

2.

Dos mquinas envasan gaseosa de manera automtica, resultando que la primera envasa el doble
qrre la segunda. La primera mquina envasa el 60% de las botellas con Ia cantidad exacta y
la segunda el84%. Una botella tomada del transportador result llena con Ia cantidad exacta.
Hallar la probabilidad de que haya sido envasada por:

b) Ia segunda mquina.

a) la primera mquina;

Sohtcin: Designenos por eventos:


A: la botella est llena con la canticlad exacta;
81: Ia botella ha sido envasacla por Ia primera

rnqr-rina;

82: la botella ha sido envasada por la segunda rnquina.

a)

Se tiene

Pr(81)

: j,2I

Pr(82)

: :.

La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido envasada por Ia primera mquina es
Pr(AlB1) :0.6.
La probabilidad de clue la botella contenga la cantidad exacta, si ha sido envasada por la
segunda mquina,

es

Pr(AlB2):

0.84.

Por tanto, la probabilidad de que la botellr tomada aI azar contenga la cantidd exacta

PL(A) :

es

Pr(81)PL(Al81) +Pr(82)Pt(AlBz)

: 21

5x0.6+j"0.84:0.68.

La probabilidad del evento <<se escogi nna botella con Ia canticlad e\acta llcna<ta por la
plimera mquina>> es igr-ral tr
2

Pr(.ts114):

Pr(Al81) _ =3 X 0.6 _
Pr(A)
0.68

Pr (81)

ri-,
rLl

i;

2.8. Probabilidad cornpleta y frmula de Bayes


1-,)

73

Ltr prcibttbilidtrd del crcnto <se escogi unr botcllr r:on la cantidad exacta llcuada poi'

Iir

segurrcla m<rirrir>> es

Pr(BzlA):

o'84
i
"
- " o.o, -

Pr'(82) Pr(AlI]2)''

'l

17.

Este resultado tarnbin se puede calcular eurpleando cl concepto dc evento cornl lerlentario.
Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr lios. Se
glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rrios.

sabe que la

a) Calcular la probabilidad de que un habitante, seleccionado aleatoriamente, tenga gripe.


b) Si un habitante tiene gripe, cul es Ia probabilidad de que ste sea anciano o nio?
Solucin: Designemos los eventos:
A: el habitante es anciano. D: el habitante es adulto.

l/:
oble

tay

el habitante es nio.

G: la persona tiene gripe.

a) Si utilizamos el diagrama de rbol tenemos:


G

cta.

Pr(.4) Pr(GlA)

(0.25)(0.05)

Pr(D) Pr(clD)

(0.35)(0.04)

Pr(N) Pr(GlN)

(0.40)(0.02)

Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:

Pr(G)

:
:

Pr(A)Pr(GlA) +Pr(D)Pr(clD) +Pr(r/)Pr(clr/)


0.25 x 0.05 + 0.35 x 0.04 + 0.4 x 0.02: 0.0345.

La probabilidad de que un habitante de la ciudad tenga gripe es del3.45r/o.

r Ia

b) Por la frmula de Bayes:

:
Pr(r/lc) :
Pr(,alc)

ta

es

x 0.05 t25
0.0345 345'
_ 0.40 x 0.02 80
0.0345 345

Pr(A)Pr(GlA) _

Pr(G)

Pr(.n)Pr(Gl.nr)
Pr(G)

0.25

Consecuentemente,

or

lr

Pr(,4u/lG)

Pr(AlG) +Pr(.n/lc)

r25

80

345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, ste sea anciano o rriiro, es clel 59.4%.

Captulo 2. EI Concepto de Probabilidad

74
4

EI 35'/r, clc los ct'clitos clttrt rtt<-ltger rtrr banc<l es parr vivicncla, eI 50%, ltara pr.ochrc:ciu y el r'esto
(r()llsittlllo. R,cstrltrrr lltot()sos r:l 20(X, tk: krs cl'rtlit,cts
l)r1 i
ltrua vivicr,la, el l5%, rlc los clrlitgs
lrillrr >r'orlrrcrcin y t>l 70c,4, r[c Ios cr'ditos I)i,t'a c:orrsurr]o.

a) Dr:tcrrnine la probabilidad

de quc uu crdito elegido al azar', sc pague a tieurpo.

1;) La plobabilidad de que urr crdito c-re ha resnltrdo en rnora) haya siclo otorgaclo para Ia
ploduccin.

Solucin: Designemos los eventos:

vivienda. P: cl crdito es para produccin.


es para consumo. A,[: e] crdito est en mora.

1/: el crdito es para

C: el crdito

a)

Tengamos presente que el evento <<el crdito se paga a tiempo> es el complemento del
evento <el crdito est en mora>; entonces, buscamos Pr(M.).
Por la frmula de la probabilidad total,

Pr(M) :

Pr(MlV) Pr(y) +Pr(MlP)Pr(P) +Pr(MlC)Pr(C)


0.2 x 0.35 + 0.15 x 0.5 * 0.7 x 0.15 :0.25.

:
De manera que Pr(M")

: t - Pr(M) - 1 -

0.25

0.75.

b) Por la frmula de Bayes,

Pr(PlM)

2.9.
1.

Pr(P)Pr(MlP)

Ejercicios
Sean

A y B dos eventos con Pr(A) # 0 V Pr(B)


Pr(A n B)

10.

Pr(B)Pr(,alr)

Demuestre que

Pr(/) Pr(BlA).

2.

DemuestrequesiAyBsoneventosindependientesysiAeBentonces,pr(B)

Se consideran los eventos

.).

Ay B tales que Pr(,4) :

a) Pr(AlB);
b) Pr(BlA);

4.

];

pr(a) :

c) Pr(A"lB);
d) Pr(B"lA);

p.(A aB):i.catcule:
e) Pr(,4'lB"):
f) Pr(8" --l').

Srrponga que un punto es elegido aleatoriamente en el cuadrado

cle que el

Sea

punto est en el tringulo

unitario. Si se conoce que el


r:].
autteslaprobabilidad

- 0,A:I,tr:0y
limitaclo por y:i,,*:IU,*.:

pttntoestenelrectngulolimitado porgl

5.

];

:lopr(A) :0.

l,

Q: {(r,a)/0 <r 1I;0<g < 1} el espacio rnuestral de un fennrerro aleatorio.

Ia probabilidad de los eventos:

a)

"

A:{(",101r <t; 0<a<Ll2};

b) B: El tringulo limitado por las rectas r:0;A:0;

g:I - t:

Calcule

2.9. Ejercicios
c)

.StO

.Son

75

indepcndicntes los cvenlos A v B?

tOS

En el crrachrdo uniclacl ser crrrsi<leran los siguientcs cventos:

rla

z:0, A: L, A:
por r :0, a :0, !,/ :

A: El tringulo lirnitado por

x:

+713.

B:

- r.

E1

tringulo limitado

a) Halle PL(B \ A), Pr(BlA) y Pr(A I B'');


b) Pruebe si A y B son independientes
Un inspector debe seleccionar a un trabajadol cle entre 4 aspirantes numerados del 1 al 4. La
seleccin Ia lleva a cabo mezclando los nmeros y tomando uno aI azar. Sean: A el evento <<se
seleciona al trabajador 1o al 2>>; B, el evento <(se selecciona al trabajador 1o al 3>>; y C, el
evento <<se selecciona el trabajador 1>. Son independientes:
Ay B?;b) Ay C?

del

")

Se lanzan dos dados, cul es la probabilidad de que en los dos dados salga el 3, si se sabe que
la suma es 6?

En una biblioteca hay B libros de literatura de ciencia fi.ccin, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.
10

La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envo postal, encuentre:

a) la probabilidad de que ambos libros lleguen a su destino;


b) la probabilidad de que al menos un libro llegue a su destino.
11.

Suponga que el 5% de todos los hombres y el 0.25 % de todas las rnnjeres sufren daltonismo.
Una persona escogida al azar resulta ser daltnica. Cul es la probabilidad de que esta persona
sea un hombre? (se considera que la cantidad de hombres y mujeres es igual).

t2.

El 35% de los crditos de un banco

1t
1J

En una exhibicin de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla despus de escuchar la opinin de un experto sobre la
autenticidad de la pintura. El experto est en lo correcto en 9 de cada 10 casos, en promedio.

es para vivienda, el 50%o para industrias y el 15 % para


consumo. Resultan morosos eI 20To de los crditos para vivienda, el 15% de los crditos para
industrias y el 70 % de los crditos para consumo. Calcule Ia probabilidad de que se pague un
crdito elegido al azar.

a) Dado

que el experto decide que la pintura es autntica, icul es la probabilidad de que l


no se equivoque?;

Le

b) Si el experto decide

que Ia pintura es una copia, entonces el visitante la devuelve y escoge


otra, cul es Ia probabilidad de que Ia segunda pintura escogida sea original?

el

dad
14.

cule

Hay una epidernia de clera (C). Consideramos como uno de los sntomas la diarrea (D), pero
este sntoma se presenta tambin en personas con intoxicacin (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:

Pr(DlC): 0.99; Pr(Dl1) : 0.5;

Pr(Dl,n/)

0.004

dela poblacin tiene clera y el 0.5% intoxicacin. Si


persona
una
tiene diarrea calcule la probabilidad de que tenga clera.
Se dan los siguientes porcentajes: el 27o

Captulo 2. EI Concepto de Probabilidad

76
15.

cl vitrts del SIDA eu la sangle cl el cliagnstico correcto coll urra probabiliclrcl rlcl 9ll %. Sogrin clatos mdicos) lrrio clc carla 2 000 habitantes cl<ll pas. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)arr una persorl1) 1',clril es la proira.lriliclacl
cle que cllr, r'elnrcrrte tcnga Ia enfermedrd?

16.

Utra emplesa financiera opera en las tles regiones del pas: Costa, Sierra y Arnazona. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazona. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazona
del 8 %. Si la empresa tiene 1000 clientes, determine cuntos pagan sus deudas puntualmente.

17.

Una encuesta revela que el 70% de la poblacin tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:

Urta pru<tlril

a)

l)tlr rlctct:trt

El tanto por ciento de la poblacin que no tiene trabajo;

b) La probabilidad de que una persona elegida

al

azar tenga estudios secundarios entre las que

no tienen trabajo.

18.

De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones


similares y la formacin acadmica necesaria
Con formacin Sin formacin

16
24

Con experienc a
Sin experienc a

32

128

Halle las probabilidades de encontrar una persona:

d) sin formacin dado que no tiene experien-

con experiencia y con folmacin;


b) con experrencra;
a)

cia.

c) con experiencia dado que tiene formacin;

19.

En una investigacin sobre el crdito bancario a trabajadores agrcolas se obtu\o el siguiente


modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.

Deudor
SI

NO

Propietario
SI NO

12
20

28
64

Calcule la probabilidad de quc:

20

a) un campesino
b) un campesino

mantenga deudas con Ia banca;

c) un carnpesino

sea propietario, dado que no es deudor;

d) un campesino

sea deudor, dado que es propietario del terreno.

sea dueo dei terreno que cultiva;

A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-ernpleados ern hombles. Scsenta de los empleados pasaron el exameli 1., _:
..

C''ralenta clc los


.lcanzaron rurl

2.9. Ejercicios
ro-

77

calificrciu rriayot que cicrto rrivcL Pledetr:r'ruilrdo cle arr'<x,'eclrarnictrtci.


hornll'ers y rnujer-cs fue Ia sigrrielrte:

CS

Lr clrsific-Lcin entre

[cl

Honrlrr.cs (11)

N{u,lcres (,4'1)

'24

36
24

Pasaron (P)
pasarou
(.Ay')
No

)%

r6

Se

ien

Sr-rponga que se selecciona

al azar un eurpleado dc los 100 que hicielon el examen.

lna

a) Calcule la probabilidad de que el empleado


b) Calcule la probabilidad de que el emplead.,
c) Son independientes P y H?;
d) Son independientes P y M?

Lte.

2%
ule:

q.ue

2I.

Laya ptrsado y sea hornbre;


sea hombre dado ctrtrc pas el examen;

Los empleados de la compaa Crrz del Sur se encuentran distribuidos en 3 divisiones: Administracin, Operacin de Planta y Ventas. La siguiente tabla indica el nrmero de empleados en
cada divisin, clasificados por sexo.
Mujeres (M)

ones

Administracin (A)
Operacin (0)
Ventas (V)
Si se elige un empleado

a)

cul

es

Hombres

20

30

60

r40

100

50

(-F1)

al azar,

la probabilidad de que sea mujer?, y de que trabaje en ventas?;


la probabilidad de que sea hombre y trabaje en la divisin de Administracn?;
la probabilidad de que trabaje en la Operacin de Planta si es mujer?;

b) cul es
c) cul es
d) ,cul es la probabilidad de que sea mujer si trabaja en Ia divisin de Ventas?;
e) Son los sucesos V y H independientes? y los sucesos Ay M?
ente

22.

) que

Dada la siguiente tabla que indica el comportamiento respecto del hbito de fumar en un grupo
de 100 estudiantes que fueron averiguados.

Hbito

Sexo

No

fuma Fuma Ex-fumador TOTA

Hombre 16
Mujer 30
TOTAL 46

10
16
26

24
4
28

50
50
100

a) Encuentre las distribuciones de las variables <<sexo>> y <hbito de fumar>>;


b) Encuentre las probabilidades de los eventos: <<la persona fuma>> y <<la persona fuma,

dado

que es mujer>>;

c)

23.

Son independientes los eventos <<ser rnujer>>

<<fumar>>? Por qu?

Del total de socios de un


b, son hornbre, u ? .on profesionales. Adems,
"lt I
soll lro rrofcsiorrtrlcs. S"
a? azal' uu ,r'ri"rntrr'3 a"l .tut-,,
"lig"
la probabilidacl de que sea hornbre y profesional;

de los

a) calcule

lt

b) calcule la probabilidad de qne sea hombre, dado que es profesional;

Lulr

las mu.jeres
*0"
J

'"'

ii-- -I. -

-.

ar

Ciptuto 2. El Concepto de Probabilidad

78

c) Deterrline si sott irrdcpendierttes


24

los evcntos <sel mujcr>>

<<no ser'profesional>>.

Ertttttfbric;a. el 707o clcloscmpleadossonlojanos. Decntrcloslo.jtrnos, cl 50%sonhombrcs,


mientras qr.re de los no lojanos, slo son hombres el 207o.
a) Qu porcentaje de empleados no lojanos son mujeres?;

b) Calcule la probabilidad de que un empleado de Ia oficina sea mujer;


c) Fernando trabaja en dicha

25. En

oficina. Cul

es

la pfobabilidad de que sea lojano?

un pas hay 4 partidos polticos que se dividen la opinin pblica. Se sabe que:

El 35% de la poblacin

adhiere al partido I.

EI SI% adhiere al partido II.

El28% adhiere al partido III.

El6%

adhiere al partido IV.

Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mnimos. Entre los adherentes al partido II, esa proporcin es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mnimos, calcule la probabilidad que sea adherente al partido I.
26.

La seora Sonia se fue de viaje y encarg a su hijo, Pablo, que riegue el rosal. La probabilidad
de que Pablo olvide regar el rosal durante su ausen"iu

El rosal est en un estado inseguro:


3
", ].

si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Despus del viaje Sonia encuentra el rosal seco, cul
es Ia probabilidad de que Pablo no lo haya regado?
27.

Se estima que slo un20To de los que compran acciones en Bolsa tienen conocimientos burstiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos burstiles.
slo un 10% obtienen beneficios. Se desea saber:

a)

El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;

b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido

beneficios, cul es la probabilidad de que tenga conocimientos burstiles?

28. En un supermercado

el 70 % de las compras las realizan las mujeres; de las compras realizadas


por estas, el 80 % supera los 20 dlares, mientras que de las compras realizadas por hombres slo
el 30% supera esa cantidad.

a) Elegido un comprobante de compra al azar,

cul es la probabilidad de que supere los

2C

dlares?;

b)

Si se sabe que el comprobante de compra no supera las 20 dlares, cul es la probabilidac


de que Ia compra haya sido hecha por una mu.jer?

29. En una universidad

existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[


y 200 chicos; y en C, 150 chicas y 150 chicos.

chicos; en B, 300 chicas


a) Calcule

la probabilidad de que un estudiante, elegido al azar, sea chico;

b) Si un estudiante elegido al azar resultara ser chico, cul es su facultad ms probable?

-;t

)r-i;!:..r-rnr.-

j\--ii-r5v:--r-.'

i_--:

-:-=-rr--

l-

2.9. Ejercicos
30.

-i-

Etr.e los cinco rrstirantes a un calgo cle geleute, a <los se ios considera excelentes y a los rierns
se les consicler'r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule lr,
probabiiidacl de que se esco.ia:
a) a los dos excelentes;

b) por lo menos a uno de los excelentes;


c) a los dos excelentes dado que se sabe que por lo menos uno de los seleccionados es excelente.
31

A y B para ensear una destreza manual. El ndice de reprobados es


del 20 To para el mtodo A y 10 To para el mtodo B. Sin embargo, el mtodo B es ms caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os mtodos, pero no puede aprender en forma correcta. Cul es Ia probabilidad de
Se dispone de dos mtodos

que se le haya adiestrado con el mtodo A?


32

dos

ido
un

JJ

dad
uro:

5de
cul

,iles.
:iles,

:l-1

rnido

:adas

En los exmenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si l ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
candidatos son realmente capaces, encuentre Ia proporcin de estudiantes capaces que ingresan
a la universidad.
Segn datos de investigaciones genticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
a) el

hijo sea de ojos oscuros, si el padre

b) el

hijo sea de ojos claros, dado que el padre es de ojos claros.

es de ojos oscuros;

Como un acto de buena vecindad Dios y Satans acordaron un intercambio cultural entre el
Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ngeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad ms frecuentemente que los
ngeles. Los demonios mienten el 80 % de las veces y los ngeles mienten el20% de las veces (en
estos das es difcil encontrar ngeles buenos!). Despus del intercambio, la proporcin entre los
demonios y ngeles en el Cielo es 2:3. Mi amigo Jos muri y fue al Cielo. l encuentra a una
persona en la calle y Ie pregunta donde encontrar un bao para hombres. Desafortunadamente,
Ios demonios y los ngeles no se pueden distinguir por su aspecto fsico. Deseamos determinar:

a) Cul es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de Jos?
b) Dado que la respuesta fue una mentira, cul es la probabilidad de que haya sido dada por

; slo

un demonio?
os 20
.)=

)'J

ilidad

Una compaa de tarjetas de crdito encuentra que cada mes el 50% de quienes poseen la tarjeta
cubren totalmente sus deudas.

a)

;y50

Si se seleccionan dos usuarios al azar, cul es la probabilidad de que ambos paguen totalmente su deuda ese mes?;

b) Si se selecciona un cliente al azar, cul es la probabilidad de que dicha persona pague


totalmente sus deudas en dos meses consecutivos?

c)
ef

En qu hiptesis se apoy para responder a los dos apartados anteriores? Le parece que
alguna de ellas no es razonable?;

Captulo

80

2. El

Concepto de ProbabIidad

rcgistlos cle la conipaa rnuestr'r quc el 90 % cle los clicutcs


que l)agau t<it.rllneut,e unr cLr<lrrtl nrensual tarnbin lo hacen al mes siguiente v <1uc slcr
eI 70%, clc los cluc l)o l)ag]lr totr.lrnente en llrl rnes cttl-ren totalmente srr dcrrcl al mes
siguierrte. Calculc, cn este cso. la probabilidad pedida en b).

<1) Urr cxarrrerr rnis <1etrllaclo der los

e) Con las hiptesis de d), calcule la probabilidad de que un cliente

seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;

f)
36

Calcule Ia probabilidad de que slo pague una de las dos cuentas.

Basndose en varios estlrdios, una compaa ha clasificado, de acuerdo con Ia posibilidad de


crrcorrtrar petrleo, las formaciones geolgicas en 3 tipos. La compaa pletende perforar tr.n
pozo en un determinado lugar, al que le asignan las probabilidades de 0.35, 0.40 y 0.25 para
los tres tipos de formaciones, respectivamente. De acuerdo con la experiencia, se sabe que el
petrleo se encuentra en Lrn 40% de las formaciones de tipo I, en un 20% de las de tipo II y en
un 30 % de las de tipo III. Si tras perforar el pozo, la compaa descubre a su pesar que all no

haba petrleo, determinar Ia probabilidad de que ese lugar se corresponda con una formacin
del tipo II.
37.

El cardinal de un espacio muestral finito

es

rn.

Los eventos A y B son independientes y cumplen

que:

Pr(A)

+Pr(B):p

Pr(A n

:+

Halle la cardinalidad de A.

38.

Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unin
es el espacio muestral, ertonces se tiene que

fi,:r e'1ana) : t.

Captulo 3
Variables Aleatorias, Esperanza y Varianza
(Jna uariable aleatoria es el alma de una obseruacin
(Jna obseruacin es el nacimiento de una uariable aleatoria

D. G. Watts, (1991)

:-

Ia realizacin del

este captulo introduciremos el concepto de l'ariable aleatoria, que nos facilitar


.-lisis de las principales caractersticas de los experimentos aleatorios y permitir definir las Ieyes de

::,,babilidad que ellos siguen, de manera muy general'

3.1. Variables aleatorias


de una
resultado de una prueba aleatoria no siempre es un nmero; por ejemplo, en el lanzamiento
de los eventos Ie podemos
-:,neda los resultados son <<cara>> y <<escudo>>. Sin embargo, a cada uno
probabilidad.
Ia
que rigen
-.rciar un nmero y sobre ellos aplicar las leyes

del nmero
l.-,nsideremos la definicin clsica de funcin real, donde la cantidad y se llama funcin
: si a tod.o valor z de la variable independiente, le corresponde un valor 3r de la variable dependiente'
j- esta idea la extendemos, se define una funcin donde la variable independiente no sea un nmero
:=l sino que, en nuestro caso, sea un espacio muestral'

Definicin (de variable aleatoria) Se llama variable aleatoria a cualquier funcin definida
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.

decir, Ia funcin

X:Q --) R
u F-f

--,nd,e

es

X(r)

un evettto) es Ltna variable aleatoria' Figura (3'1)'


81

en

Captulo

82

3.

Variables Aleatorias, Esperanza

Varianza

Figrira 3.1:

Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplcitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o ei evento elementl consistente en saiir

puntos, tenemos:
CI

Lavariable aleatoria

{cuf ,u)2,u)Srw4rrr'5rw6}.

X(rn): i identifica al nrmero z de puntos obtenidos al lanzar cl dado, se define

as:

X(rt)
X(rz)
X(rs)
X(rs)
X(rs)
X(ra)

:
:
:
:
:
:

1, corresponde al evento elemental {aparece un punto},


2, corresponde al evento elemental {aparecen dos puntos},

3, corresponde al eveuto elemental {aparecen tres puntos},


4, corresponde al evento elemental {aparecen cuatro puutos},
5, corresponde al evento elemental {aparecen cinco puutos},
6, corresponde al evento elemental {aparecen seis puntos}.

Al

arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el nmero de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:

x(r) :
x(r) :

1,

0,

si
si

<<sale cara>>;
<<sale escudo>>.

La definicin de la variable aleatoria depende del fenmeno a investigar.


Para evitar una escritura engorrosa, a los cu tales que X(cr-,) : se los notar como X : t.
probabilidad
La
Pr({o I X(r) : }) se pondr como Pr(X : ). De manera anloga se escribir
la Pr({c..'/ X(u) e (o,b]}) como Pr(n < X < b). Y as para cualquier intervalo convenierrtemente

Notacin.
defiuido.

Las variables aleatorias se clasificanten d'isc'retas

co'nti,rtuas, de acuerclo a los vlores qne ellas tomen.

3.1.1. Variables aleatorias discretas


Definicin (de variable aleatoria discreta) La variable aleatoria en cLr\ro recorrido el conjrlrrto
de los pr-rntos que tieuen probabilidad estrictarnente positiva es finito o infinito nunrerable se llarna
valiable aleatoria discreta.
Si el recorrido de la variable aleatoria

es el conjunto de nmeros

Pr{X:z}>0.

{rr,rr,....x,....}, ." tiene que

3.7. Variables
\rkrtniis, ti p,, : Pr'(X

x:). cs

lir ytt'tillzrlrilirlrrl
'PI

aleatorias

<lc tlrtc

+'P)+ "'

-1-

1),,

tonrc

l "' -

83

<rl

vtlol

ru, sc ctuttplc <ue

1.

rn ottas palablas, X

os disc:r'cta si rrna unirlarl rkr urlsr clc plobabiliclrd csti <listribrricla sobre el e.ie
-=al, cc'rrLcerrtrnclose rrril rnrsr I)ositi\'1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y

.:- los restaltes purrtos uo l)ry

lnasr.

-,-r'iables

aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'


- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacn, etc.

la vez qlre se ha determinado las probabilidades isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,n de probabilidad, que es una tabla con
-

:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:


1

Pt

PZ

P,,

: r)

Pr(X
Ejemplos

Consideremos la prueba consistente en arrojar tres monedas. Tenemos

qr.re

: {{ccc}, {cc E}, {c E E}, {E E E}}.

Si X es la variable aleatoria que cuenta el nirmero de escudos resultantes,


valores 0, 7, 2 y 3. De rnanera que

Po :

Pr(X

:0) : PL({CCC}):

Pt : Pr(X:
Pz : Pr(X :
Ps
Se tiene que su ley de

Pr(X

probabilidad

puede tomar los

8'
t
J

1)

: PL({CCE}):

2)

Pr({C EE})

3)

Pr(iE EEI)

-:.

g'
8'
1

es

Pr(X : r)
y se cumple que

1/8

318

318

r18

1331
Po*h-lPz+Pt : B + d + S + g :

Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta distancia. Nos interesa analizal los eventos uJ: <<rlmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.

Definimos la variable aleatoria

EI

corrj

X:

<<nrnero de balas gastadas>>:

nnto de posibles valores que puede tcmar Ia variable aleatoria es { 1, 2,3,

. . .}

Este es un conjunto infinito numerable, pues no se conoce un mximo para el nmero de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntera-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.
Ms adelante se demostrar que tambin se cumple que

i p: I
i:r

col

p: Pr{X :

}.

Captulo

84

3.

Variables Aleatorias, Esperanza

Definicin (de funcin de distribucin)


-F tal que
V

e R,

Sea

Varianza

una variable aleatoria discreta, la funcin leal

F(t): Pr(X

<

se denomina funcin de distribucin de Ia variable aleatoria

X.

Propiedades

1.

La funcin

2. F() :

F es creciente,

Pr(x S t)

con

,fT.".F()

0V

,ffL,P(t)

1.

Prp

3. Pr(a< X<b):F(b) -f.(o).


4. Pr(o ( X <b): F'(b) - F(") *Pr(X:

a)'

Observacin. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el lmite, por la izquierda, de la funcin de distribucin en el punto a. Este concepto tiene
importancia para el clculo de las probabilidades en los puntos donde ,F tiene saltos.

Ejemplos

1.

Continuando con el ejemplo del lanzamiento de tres monedas, se tiene que


1
F(0) : Po: ,-,

F(1)

: po+pr:j*::;,
:;,

F(2) : potpttpz:*.:*:
F(3)

: po:-pt-rpz+o.::*3*3** :t

Con esto, Ia funcin de distribucin

F(t)

es

0, si <0;
Il8, si 0(<1;
Il2, si L<t<2;
718, si

1,

2(<3;

si 23.

Los grficos de las funciones de probabilidad y de distribucin se dan en la Figura 3.2:


F(t)
0.4

0.3

0.75

0.2

0.

0.1

H
H

o
Figura 3.2:

3.1. Valial-ies aleatorias

8r

Elr rrrLr lltrr<:l-,ir rkt c:tli<lr<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt l') Piczas lrn'!i ].,1[tttttt.
t .1 rlcf<r<:tlrosrs. L)rr cl rkrP;uliunollt() rlc <:rrrtlol tlt' r:irlir[rrI st: lrrrrt turt nrttcsl tl tlc ]] lriczits
Clorrstlrril lr lct'rkr lr r'rriirlrlc alcrtoLir <<Lrirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
La r'ilialrlr: a,lcrtolia

Sol,tLr:irin,:

crL crLcstirilr prr<rrlc

torrrar'krs r'rlolr.s 0. 1.2 \,J: rIctr:nnirolnos

srrs prol)rl )ilir [<ics.

El

llrill<:r'<.1

r[c srrbc:onjrrrrtos

cl<l

3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.

que es Card(O).

r
.

X:0, cutolrccs toclrs las Piczas sou dcfcctuosas, lriv C[ lorrnirs clc <:scogctlirs.
Si ,Y : 1, crrtorrc:es 1 es lrucrrr y 2 sorr clefcctrrosrs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buenls v Cl de cscoger las clefectnosas) crrton(ies lrv CC; forurts clc: cornlrilrrr lrs lrttettrs
Si

y las

Si

defectuosas.

X : 2,ltay C!

conjuntos de las piezas buenrs

y C] dc dcfcctuosas)

prr'-r,

rrn total

cle

Cl|6C| formas cle combinarlas.

Si

X:

3, hay

C!

cornbinaciones de piezas bueuas.

Entclnces,

Pr(X:
Pr(X:

O)

: g: *,

: 1) : 9A9?
::.
ciz 55'

Pr(r

\:W:#,

Pr(X:t):#:#

Lo qrre se lesune etr slr clistlibucirirt cle probabilicl;rcl:

A; loll

l2l3

Para clefinir urrr variablc alertoriir no cs nccesario cxhil.il urr fcrtcirrrcrto rleat<lrio pat'ticttltrr',
es suficiente clar ulla funcin cle probabilictad o cle clistlibucicln rre cr-rrnpla las plopic<lrclcs
enunciadrs.

3.

La funciu cle distribucin de una

"'ariable

aleatorir

se clefine rnoclirute:

si l,<-3;

si -3<<0;
si 0(t<2;
si >2,

Coustruil Ia tal-la de clistribucin de probabilidacl clc )'.


Sol'ucit: De acuerdo a la definicin de la ftrnciu cle clistribucirr roclenlos \'ol cluc
aleatoria tornr los valoles -3,0 y 2.

/(-3) :

De rnttcrr <te lrr

:
(2) :

Pr:(Y: -3)

: F(-3) - F(--) :

,i(0)

Pr(Y:0) :r(0)

.f

Pr.()',

trbl-L

: 2) :

F(2)

-,, :;,

-F.(0-):;- j:j,
- F(2-) :

1 j: j

clc clistliltrci<in cle rt'olrtrl riliclacl cs

l-rlo

l2

Pr()':trlIl2 lll4lIl4

lr r-rrirblc

Captulo

86

4.

Unr variable rleatoria

3.

Variables Aleatorias, Esperanza

Varianza

est dcfinida medirnte lir siguierrte lcy de plobabilidacl

Jr
a)

l rlzl | qI

Determinar F(r).

f(r)y F(r).
Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).

b) Graficar
c)

Soluci,n:

a) Evidentemente,

oSi11r12,
o Si2(r(3,
Si3{r14,
Si41r15,
o Sir)5,

f'(r) :0pararlI,ahora

F(r):
F(r) :

pr : 0.3.
pt -f pz:

0.5.

F(r):pL+p2*ps:0.6.
F(r) : h I p2* ps + p+ :
F(r) : h I p2 * ps + p+ I

0.75.
ps

I.

Es decir,

F(r):

b) Los grficos

0, sir<1;
0.3, si 1( r 12;
0.5, si2(r13;
0.6, si3<r14;
0.75, si4(r{5;
1, sir)5.

son:

Pr
F
0.
0.

0.1

0.1

Figura 3.3:

c)

Se tiene:

Pr(X: f) :
Pr(X < 1) :
Pr(x < 1) :

<X<2):
Pr(1 < X<2) :
Pr(1 < X <2) :
Pr(l

.P(1) :
F(1) F(2) F'(1)

F(1-)

0.3

- 0:

0.3,

6.3,

Pr(X : 1) :
'(1) : 0.5 -

F(2) -F(1) +Pr(X


F(2) - F(1) - Pr(X

0.3

0.3

:
:

- 0.3 :

0,

:0.2,

- 0.3 + 0.3 :
2) :0.2 - 0.2 : 0.
1)

0.

0.5,

3.7. Variables aleatonas

87

3,1.2. Variables aleatorias continuas


Definicin (de variable aleatoria continua) La variable aleatoria ouyo recorrido
inito o infinito de R se llama variable aleatoria corrtinua.
Tambin, se dice que Lrna variable aleatoria

es continua si para todo valor real

Pr(X:

es

un intervalo

se tiene que

:0.

z)

variables continuas representan mediciones; por ejemplo, la estatura de una persona,


-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:ngre que tiene un animal.
- sualmente, las

Definicin (de funcin de distribucin)


F tal que
V R,
=e

Sea

una variable aleatoria continua, Ia funcin real

F(t): Pr(X < )

denomina funcin de distribucin de la variable aleatoria X.

Fropiedades

l.

es creciente,

Pr(a< X

con

Im F() :

.
/+-oo

0y
. lm
- l-*m

F(t) :

<b):Pr(<X <b) :Pr( < X < b) :Pt(a <X

Definicin (de funcin de densidad) La funcin


-'t

es

una funcin real

)
") f (r)
b)

< b) :f'(b)

F(").

de densidad de una variable aleatoria continua

que cumple:

0 Para cualquier valor z.

/A f@)dr:r.

c) Para cualquier intervalo A: lo,b], se tiene


Pr(A)

-,

1.

que

:Pr(<X<b) :

.l.o

-amos cmo estrr relacionadas las funciones de distribucin

Teorema. Si F y

f {')

o'

y de densidad. (Ver Figura

3.4)

son las funciones de distribucin y de densidad de la variable aleatoria


:.spectivamente, ellas estn ligadas mediante las igualdades

F(r):

l"*r@ot y

(*):

F'(r).

Capt,tttra

88

3.

VaranJes Aleadorias, Espet'anza

I \-ariattza

{t}

Figura 3.4: Relicin cntr-c las firncion<:s clc clclsidaci y

c1e

clistrilruc:irr.

Tengamos presente qtte para el clculo de plobabilidrdes se emplea la siguiente equivalencia:


b

Pr(a<X<q: I I(r)dr:F(b) -F(").


En las valiables aleatorias continuas es suficiente indicar la funcin de densidad o Ia funcin de distribucin para que la variable aleatoria qr-rede completamente definida.
Ejemplos

1.

Unr variable aleatoria

est defirriclr mediante Ia funcin de distribucin


plrir
3

jt

z < -1;

parr

-1(r(;i
1t
uara .r: ) -.
'

-3

Hallrr la probabilidaci cle clue la varialle aleatoria


Solrc'in: La probabilidad de que

torne un valor en el

tome un valol en (a,b) es Pr(a <

interva
t'

1\

('' j/

X <b): F(b) - F(").

Sia:0.b:1obt"r,"rnu,

"'(0.".1)

fiurcin de densidacl de una valirble aleatoria est clada por /(z) : (\.e-s:L cn el intern,alc
0 fitera cle cste itttetvalo. Hallar' el vrlor de la constante cv para que /(z) asclefilriclr scl unA funcin <le densidld.
Lr

(0,-) v f @):

Sol.rt,ci,n: Primero verifi<lrremr)s clue

./(r) > 0.

En (-oo,0l no Lay plobleml Pucs

/(r) :

0.

3.7. Variables

aleatorias

En (0, oo) se debe tener f (") >- 0, es decir (\e-3*


se dobe tener que a ) 0.

Ahora, verifiquemo. or,"


'

/'* f (r)ctr:
.l-o."'

1, o

) 0. Pero Vr (0, rc), e t"

>

"". .lo/'- .,e-3*d.r: l.

La integral

,lo*

o" -3"d,

/.

.lo "_J*d.r: lj"


L3
-o.
:T.
3 [o-lJ

l'*

.,

a.

Consecuentemente,

: tt entonces a :

3.

Dada la funcin de densidad de la variable aleatoria continua X:

( o, sic(o;
f(*): { cosr, si0(r<rf2;
I o, sir>rf2.

r dis-

a) Hallar la funcin de distribucin F'(r).

b) Determinar: pr

(t = *. ;), e, (x ,;),"'(;

<x <

#)

Solucin:

a) Utilizando la frmula F(z)


o Si r < 0, "f(r)

:0,

.l:*JQ)

de manera

d,t:

que
rr

F(r): l_*Odt:0.
o Si 0 1r 1r12, f (x):

cosr,

ento

F(r)

: Io Oat+ |fE costdt:senr.


J-a
Jo

'(n).

ces

o Si r > 7r/2, f (r) :0.,


n/2

F(r):

l_*t+ Io"/'costd,t*

La funcin de distribucin

I_,,

0d: senr

es:

( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
erval<

(r)

b) Para calcular las probabilidades emplearemos Ia funcin de distribucin.


r Pr(a < X <b) :F(b) - F("). Si : I y U:[,

6"

as

"'(=".)

-"()
"()
:
*" () : rfr1
2 -5
'"" () -

0.36603.

1.

0; entouces,

Captulo

90

o Pr(X

n)

3.

Variables Aleatorias, Esperanza

: 1- Pr(X .

o)

: 1- F(a).
,4Si o: 1'

"("'i) :

'-'(;)

1-sen/1):
r-Jt2
\ 4/

_
e Pr(a < X < b) : F'(b) - F(o), con :

t.(;/ r s*<;)

112\

0.29289.

vb-_.

3"

17tr

t2

:'(#) -.(;)
:1-sen(;)
:

4.

Varianza

:t-+

0.13397.

La funcin de densidad de una variable aleatoria ? est dada por f (t)


fuera de este intervalo. Hallar las probabilidades:

: t-f,

"n(1,2)

y /()

c) Pr(? t 1.);
d) Pr(1.4<7<3).

a) Pr(0<?<1.8);
b) Pr(1.2<T<1.5);

Solucin: Para el clculo de las probabilidades utilizaremos la funcin de densidad.

a) Pr(0<?<1.8):

Pr(O<7<1.8)

: l" Iudt:,loftot*.1, f(t)


: lo' * .1," (, - ;) dt: t iQ' rl

"I.8

11 8

dt

oo,

ql,',"

: j lltt al' - 1.8) - o) : o.zz.

b) Pr(1.2<?<1.5):

: l'

r 1.5

Pr(1.2<?<1.5)

f{ua'

: l,',' (' -;) " : LQ'-',1,;

: ] lltr sl' - 1 b) - ((1.2)' - t.z))

c) Pr(T >

0.255.

1.5):

Pr(? > 1.5)

: 1-Pr(?<1b) -1- ([:_odt+


,,)
[," (t-;)
r,-;U'-t)
] frrr ul'- r.s) - (1'- 1)]

l,':

t-f,O.rrl:o62b

3.2. Distribuciones de funciotres de variables aleatorias


,t)

Pr(r.4<7<3):
PL(1.4

r.1

3) :

<I <

I fUl,tL: .lIt. J()rt


.l t.

),Lt

_ t)',n+o

[,'^('-;)"* 1,'o
1..

..

ilt'-2)-({r+)2-

5.

91

Hallar la funcin de densidad

/(r)

72.

de una variable aleatoria cuya funcin de distribucin

es

'17

4'

Soluctn: Utilicemos la relacin f (")

):0

: F'(").

: 0, entonces /(r) : F'(r) : 0.


Si 0 1r 1I, ,@): sen 2r, entonces f (r): F'(r):2cos2r.
+

.
.

Si

Si

r ,\,4' 16:1,

< 0, F(r)

entonces

/(r) : F'(r):0.

Es decir,

6.

(r): { zcoszr' si 0 < 'lTn,


caso contrario.
|. 0,

La vida til de un elemento electrnico est dada por la funcin de densidad

( !"-,,r,
(t):
f
\ 0,
|.
'2

si > o;
en Io dems;

donde es el tiempo (en horas). Calcular la probabilidad de que un elemento dure ms de tres
horas, dado que ya ha estado en uso mis de dos horas.

Solucin: Nos interesa Pr(? >

3lf > 2), que segn

tiene:

Pr(?>3lT>rl

Ia frmula de la probabilidad condicional

:#fi;

porque Ia interseccin de los eventos (7 > 3) y (T > 2) es el evento

Pr(? > s) _
Pr(I > 2) -

3.2. Distribuciones

l'* |

se

(" > 3).

Entonces,

-rtz

./r rt
:- "-t1," _ e-rlz:
r'
[* !"-*
.lz 2

0.606.

de funciones de variables aleatorias

Sea g una funcin real cuyo dominio contiene


-l-na nueva variable aleatoria Y mediante

el recorrido de la variable aleatoria

y:

g(X),

X,

podemos definir

92

Captulo

3.

Variables Aleatorias, Esperanza

lo que quiere decir que, si la variable aleatoria

Varianza

est definida segn

X:O ---r ACR


u r-+ X(r)
y9por

gtB ------+ R conAe


r r---' g(r)

la variable aleatoria Y se define por

------+

ul-----'
Si conocemos la ley de distribucin

Si

Y(u): s6@)).

de X, vamos a determinar la ley de distribucin Fy de Y.

es variable aleatoria discreta,

Pr(I/: A):Pr(X :
donde

A:

n),

g(r).

Si X es una variable aleatoria continua. Supongamos que g es una funcin continua y estrictamente creciente en todo el eje real; entonces, existe la funcin inversa de g que la llamaremos l.
sta tambin es continua y estrictamente creciente, por lo que

A: g@)

si, y solo

si r:

h(A).

Examinemos la definicin de Fy:

Fv(t):

Pr(Y <

Pr(e(X)

t).

Aplicando la funcin inversa a los dos miembros de la desigualdad del argumento de la ltima
expresin se obtiene

Pr(e(X)

() :Pr(X<h()) : Fx(h(t)).

Luego, se tiene la siguiente equivalencia entre las funciones de distribucin de

Fv(t):

X y de Y:

k(h()).

Si las funciones F y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:

Fi@

Fk(h(t)) .h'(t).

Ello nos conduce a la siguiente relacin entre las funciones de densidad:

fv(t)

f x(h(t))

. h'

(t).

Observacin. Si la funcin g no es montona en el intervalo de los posibles valores de X,


hay que dividir este intervalo en subintervalos tales que g sea montona v aplicar el resultado
anterior.

3.2. Distribuciones de funciones dc valiables

aleaorias

9:]

Ejernrlos

1.

Da<[a ll [rrrrc:it <lc <listlilrrr<:in


<lc rkrusiclir<l d<l \" : u,X * b,

r'

clc lr varitll]cr rlcrtolit

pala: a)

rr,

-\.

hallrl

l.rs ftttt<:i<.trcs rl<r

rlisl tilrrrt iritr

) 0; lr) tr, < 0.

Soht.r:i.titt:

a)

Sca

\" : aX *b, o > 0.

Tenenros:

Fv'()

: Pr(Yl) :Pr(aX+b<)

: n'(" =+):r"(?)

Aclerns,

g(t)

: at t b,

h(L)

: +,

h'1t

: !,

Tambin,

!t.(t):;r"(?)
b) Si y : aX *b, con a ( 0, resulta que g() : at*
decreciente; sin embargo, podemos hallar Ia
definicin:

b, que es continua, pero estrictamente


ftrncin de distribucin de Y rnediante su

Fy(t) : Pr(Y<) :Pr(X+b<t)

: p,(x>-)-1-p,(x.4)
a)
a)
\
\
(
: r - Fx"\ fL!)
a / +p, \ x: '-')
e' /

a-

h.

La funcin de densidad

es

ft.o): F,(: -!,r*


Corrsidere la variable aleatoria
Solu,cir: Aqu,

9(r) :

: X2. Hallar

12, funcin que no

Si < 0, el evento
Fl,() :0.

<<X2

>>

su funcin de distribrrcin.

es stt'ictamente creciete. Por clefinicin tenemos:

Fv(t): Pr(Y (
.

(")

es vaco;

Vr(Xz < t).

por tanto, Pr(X2

<

0, lo que implica que

r Si20,

: -r/t).
Si F.v es coutiuua

SC

<0;
>0.
Si lr.v <s rl<lrivable

er

rlcusiclad:

<0;
>0.

94
3.

Captulo

3.

Variables Aleatorias, Esperanza

Detelntinar la ley de distribucin de la variablc aleatoria Y

I -s

I -21 o |

Varianza

X2, si X est definidr ruerliarrte:


2

Sol'ucin: Como Ia variable aleatoria es discreta, basta aplicar la relacin Pr(Y


ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que

A)

: Pr(X :

v2 l(-)rl(-z)rlo, lz,
Es decir,

Y
Como el valor Y

4.

lglq

lol+

4 se repite 2 veces, unificamos sus probabilidades y la tabla queda as:

Hallar la funcin de distribucin de la variable aleatoria Y

( 0,

k():{

si

e-X, si X est definida mediante

<-1;

-1<<1;
+,sisi>1.

( t,
Solucin:

Se tienen las siguientes igualdades:

Fv(t) :

Pr(Y < ) : Pr ("-* < t)


Pr(X > -ln) - 1- Pr(X < -ln)

:
: 1-f(-ln).

Por otro lado,

si -lnt<-I;
si - 1< -ln <
si -lnt>L.
si>e;
si e-l 1t 1 e:

0,

F(-

ln)

:{

:t

-ln*1
1,

2'

0,

-ln*1

2'

1;

si < e-1.

1,

Por tanto,

1,
Fv(t)

- 1- Fx? ln) :

si>e:

+ ln

0,

sie-'1t1e:
si<e-1.

3.3. Ejercicios

3.3.
1.

95

Ejercicios

Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas

y su rarrgo cle <lefinicin:

a) El nrrnero de bytes defectuosos en el disco duro de una computadora de 100


b) La distancia de lanzamiento de Ia jabalina por un atleta;
c) EI nirmero de goles que anota un equipo de fiitbol en Lln partido;
d) La cantidad de dinero, en dlares, ganada (o perdida) por un apostador;
e) trl tiempo de nso diario de una computadora;

f)

Gb;

El tiempo de espera del autobs en una parada;

g) El nrmero de aos que sobrevive una persona a la muerte de su cnyuge;


h) La variacin en el tiempo de sueo de una persona sometida a un tratamiento.
2

,l

4.

Indique al menos tres variables aleatorias discretas y tres variables aleatorias continuas. Especifique su rango de definicin.
Se arroja un dado y se designan por : {el nmero de los puntos aparecidos es par} y por
6 : {el nmero de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribucin y grafquelas.

Determine Ia funcin de distribucin de la variable aleatoria


se presenta en la tabla.

-2

rl4

que est definida por la ley que

rt

213 rlL2

Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los beneficios esperados son: si la novela es muy exitosa, 100 mil dlares; si la novela es moderadamente
existosa, 50 mil dlares; y, si es un fracaso, 10 mil dlares. Forme la ley de distribucin de los
beneficios esperados por el escritor.

Una agencia automotriz recibe un embarque de 20 automviles nuevos; entre stos, 2 tienen defectos. La agencia debe seleccionar, aleatoriamente, 3 automviles de entre los 20 para venderlos.
Forme la ley de distribucin de la variable aleatoria <<nmero de carros defectuosos entre los
escogidos>>.

IJn apuesto prncipe visita a un rey que tiene cuatro hijas casaderas, con la intencin de integrarse

en la familia. Las probabilidades que tiene el prncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El prncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-sima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su funcin de distribucin.
8

Una chapa para puertas consta de tres piezas mecnicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribucin de probabilidad del nmero de piezas que cumplen
las especificaciones en una chapa.

9.

Sea

una variable aleatoria discreta cuya funcin de probabilidad

a) Encuentre el valor de & para


b) CalculePr(l < X34).

que la funcin

p(r)

es

p(r) :

#,r

:1,2,3,4,5.

sea la funcin de probabilidad de

X;

C)a>tulo

l(.

3. Varitltl:s Aleatorias, Esperattza y Varianza

l,r lr:.'i,irr ,lr'rrol,irlrilirl:r<1 ./'cl<: rulr r'uiirllc

'1. lirr cl[r,

ir nlr cictlcl \'tlot' (lc

: 4,":. /(l) :'k:-

rrttlt srh'o cn lr.rs lrtttrtos

<:s

1011. .[(2)

/.:0. f

.i'

: 4r:- I.

r'.

;r) l)t,t<:rrrrire c.l valot ,lc c:


lr) (':rk'rrlo: PL(X < l). Pr(-X < 2). t'r'((l < .{ <

il.

-f

l()nrr lr)s vitl()los:

.l'(0)
l)iu

rl<rtlotir

t':r,r r''u'ialllc r,leatoli:r -Y se dicc

Pr'(x

<ur: sigrr<: lrr

: ft) :

.,*,0

3).

lcy cle B<rnfot'cl si se cttrnple qtte

(t

. i) , k: r,2,...,s.

a) \'irrifirue que es rtrra firncirr rle rt'oba,bilidad;


b) Calcrrle la probalriliclrd ctc obtcner utitnero impares;
c) Grati<rrc la funcirr de rrobabilidad.
t'2.

Urra r'rinble leatoria

)'se dcfine
I'r(Y

rt)
lr)

: A) : ;\-

i,

fijo c (a > 1) cualquiera mediante

: a*r,a*2,...

\'i.r'ifitrre que cs utut funciu de probabilidad;


l)crrrucstl'e cluc

r:) Fije ur valor


1:l

l)lra un errtero positivo

Pr()' >

tr)

!* pat'tr

>ara <'l rtrr-rnctrrr

Iirr,r r''rti,tlll<,aktrtorir clit't'cta

A;

e, (L* 1, ...i

!'gl'aficlue la fuucin de probabilidacl.

csti clefinida segittt

Pr(.f : A;):p(l -p)r',

A;

:0.

la ley

1,2,..

.y p (0, 1).

\i,r ilirrre clue es ulll funcin clc probalrilidir<t:


lr) l)r:rcrrrrine la ftrncin de distribttcitr;
r') (';rk'ttlc: Pr(X > 2), Pr(X > ). Pr(.f, < 3).
rr

11.

l)rr<ls ls funciones de derrsidad


t:st r':rr

errcuerrtre el valor de la constante c de

lien definidas.

a) /(c)

b) ./(r)

: ;," - t,' ::::.ffii,,


{
- 1- cll- rl.

,:) /(t ) =
15.

/,

{iZ;:,

:i

si 0 (

r(

2;

;: l]

Dncla la fttttciu de distlillrrt:ititr rk: r: r'tt'ia,lrlc alertori

si z(0;
si 0lr(1;
si | 3r <2;
t l:J.
:r fr.t.
si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
si ;u)5.
l.

0.

L 14.

F(.r:) =

C)al<:r

tlc lits

rt'o! r;.l,rriidul<ts:

.{:

tal manera que

ellas

3.3. Ejercicios

lr

a) Pr(l . X. S)'
b) Pr(2<X<+);

16.

Se tiene

97

Pr(O.X.)'
d) Pr(a<x<6).
c)

la funcin de distribucin de una variable aleatoria definida por

0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314,

si t/2<r<512;

1, si r>512.

Determine la funcin de probabilidad asociada y grafquela.

77. La funcin

de densidad de una variable aleatoria

( o,

(r):
fr\/

te

est definida mediante

si

r<I;

I sr"r,3", si + .0" =+t


.iit;'

[0,

a) Halle la funcin de distribucin .F;


b) Determine: Pr(X :0.2), Pr(X < rl4),Pr(X > n13),Pr(nlL2 < X < n).
5

Una variable aleatoria

tiene distribucin continua F, siendo

FQ):

( o.

I
t

si (o:
ct, si 0< t<I;
1, si >1.

a) Determine la constante c y halle la funcin

b)
9

Calcule las probabilidades

de densidad

/;

Pr(X: Il3),Pr(X < ll3), Pr(lxl <ll4).


Z con densidad de probabilidad
( (t+b)zb, si z [0, o];

Considere una variable aleatoria continua

/('):{ o,

: ellas

a) Calcule

los valores de los parmetros a

b) Encuentre la funcin
Una variable aleatoria

siz(lo,al.

b sabiendo que

p, (Z

1) :
\ -2)
=

1,
8',

de distribucin de Z.

tiene por funcin de distribucin a

sir<-2;
10,
F(r):l ar+b, si -2Sr<2;
sir>2.
I t,
a) Determine los valores de a y b;
b) Encuentre la densidad /;

c) Halle: Pr(X
Pr(lxl > 1.2).

El tiempo en minutos que una persona espera un autobs es una variable aleatoria cuya funcin
de densidad viene dada por las frmulas: /() : j ouru 0 < < t, f(t) :
o.ru I < t < 4,,

(t):0

para los dems valores de . Calcule Ia probabilidad de que el tiempo de espera sea:

Captulo

98

3. Variables Aleatorias,

c)

a) rnayor qu<l nn minr.rto;


b) rnenor que clos miuutos;
22

Esperanza

Varianza

rnayor que tres mirrutos.

Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
vendern 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas
Probabilidad

0t1t2

a) Determine la distribucin de probabilidad de X, el nmero de ventas;


b) Calcule la probabilidad de que al menos se realice una venta en el da.

23.

Un blanco circular de radio 1 se divide en 5 anillos,circulares por medio de 5 discos concntricos


1234
de radios: -.
-, -;,;, i t t. Un jugador lanza un dardo al blanco, si el dardo alcanza el anillo
b
(k:0.7.2.3.4), tiene k puntos y
circular comprendido entre los crculos de radios : y tl]. '\'"-v'L)L\v'
o
5
gana 5 - ,k dlares. Determine las distribuciones de probabilidad:

a) del puntaje

24.

b)

del jugador;

de Ia ganancia del jugador.

Una empresa alquila el tiempo de cmputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la funcin de densidad dada por:

*U'n-U'
f(t):{ 0,
[

si o( t<4;
caso contrario.

a) Determine la funcin de distribucin del tiempo de empleo

b)

de la computadora;

Calcule la probabilidad de que el tiempo de uso de la computadora, en una semana, sea


mayor que 2 horas;

c) EI presupuesto de la empresa solo cubre 3 horas de tiempo semanal


dora. Con qu frecuencia se rebasar ese lmite de presupuesto?;

d)

de uso de la computa-

Cunto tiempo de alquiler se debe presuponer por semana si esta cifra solo se puede rebasar

con una probabilidad de 0.1?

25. La cantidad de pan (en cientos de kilogramos) que vende una panadera

en un da es una variable

aleatoria con funcin de densidad

c,
si 0Sr13;'
c(6-r), si 3l r16;
caso contrario.
0,
a) Encuentre el valor de c;
b) Cul es la probabilidad que el nmero de kilos de pan que se vende en un da sea: (i) ms
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. Son independientes

Av

B?

26. La cantidad

(en gramos) de fertilizante qumico que una planta puede recibir es una variable
aleatoria cuya funcin de densidad es

f srla z;
(r): { ff, 0,
[

si

r [o' 8];

caso contrario.

Ejercicios

99

a) Halle la probabilidad de que Ia planta reciba merlos de 3 gramos;


b) Si la planta n)Ltere si recibe nlis dc 6 g, ,cul es la ltlobabilida<l de qne la planta muela por
exceso de fertilizante?;

c) Si se trata de establecel

para Ia cantidrd de fertilizante utilizada, cul es Ia


cntidad mxima recomendada utilizar para qne solo se sobrepase esta cantidad el 35 % de
Lrna norrrla

las veces?

l;.

Se

extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
al nmero de la bolita extrada. Una vez conocido el valor de X, extraemos una nueva bolita

alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los nmeros 2 y 3).
Llamamos Y al nmero de la bolita extrada en el segundo bolillero.
a) Calcule Pr(Y : 3lX : 1);
b) Calcule Pr(Y :3);
c) Son X yY independientes? Justifique;
d) Halle la distribucin de probabilidad de Y.

-1.

Una variable aleatoria

tiene densidad

f(n\:Ir'siz[o'1];
\"/-lo, sizl[0,t].
a) Si Y

b) catcule

-i.

X2, halle la funcin de distribucin de Y;


las probabilidades:

Una variable aleatoria

"'(+

< x2

f
Halle Ia ley de la variable T
IJna variable aleatoria

Q):

i'
l 0,
[

Halle la probabilidad Pr(X2

: (!
I

1];

[-1,1].

sirl-z,Z);
si n

<

l-2,21.

1).

est distribuida segn Ia ley


1

sigl-t,Z];

5,

caso contrario.

0,

Halle Ia funcin de densidad de la variable U


-')

si z

[-1'

tiene funcin de densidad

o1

si z e

: -52.

rf")

Una variable aleatoria

. t . :)
"' (

tiene funcin de densidad

(L

i.'.

<i)

Y2.

Una variable aleatoria X tiene densidad f x(") : s-t, si r


distribucin y de densidad de la variable aleatoria Z : e-x.
Una variable aleatoria

funciones de densidad de:

tiene funcin de distribucin

) 0.

Fy(r) -

Encuentre las funciones de

- e-o',

si

r ) 0.

Halle las

3.

Captulo

100

Variables Aleatorias, Esperanza

{Y:f7;

Varianza

b) Z :1tnt.

En las secciones precedentes vimos que una variable aleatoria queda definida por su funcin de distribucin, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribucin de probabilidad; para tal propsito, examinaremos dos
caractersticas tericas de las variabtes aleatorias: la esperanza y la varianza, que son dos parmetros
que miden la Iocalizacin y la dispersin de Ios valores que toma la variable.

3.4. La esperartza

materntica

La esperanza matemtica -o simplemente espernz&- de una variable aleatoria X, se simboliza por


E(X) y su definicin es la siguiente:

Definicin (de esperanza de una variable aleatoria discreta)

Sea

una variable aleatoria

discreta, la esperanza es un nmero real que se calcula segn:

1.

Si X toma un nmero finito de valores rr 12,


pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t

E(x)

..., rn con probabilidades h:Pr(X

: rt),

: f,o*rr.
l^-1

2.

X toma un nmero
k:I,2,-..;
Si

infinito de valores rr, 12, .. . con probabilidades p

: Pr(X :

rk),

oo

E(X) : ln*"r.
/c: f
Definicin (de esperanza de una variable aleatoria continua)
continua, cuya funcin de densidad es /(r),

una variable aleatoria


la esperanza es un nmero real que se calcula segn:

E@:

l:

A la esperanza tambin

Sea

rf (r) dr.

se la denomina media poblacional


se la suele notar como p.

o ualor esperado de la variable aleatoria y

Observacin. Si /(r) toma valores distintos de cero en un intervalo

[a.,

b], Ia esperanza se calcula

como

Fj(x):

rf (r)d,r.

La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuacin
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.

Propiedades

1.

La esperanza de una eonstante es el valor de la constante:


E(c)

:6,

cconstante.

3.4, La esperanza rnaterttica


D enostt'o,cir:

E(c)
dis-

2.

bles

101

: I t'.[ (r) rlr : ,t Ir@ .l'(t') tl,.r :


.l _./ _m

Aditividad. La esperanza

[@

(:'

c.

de la suma de dos variables aleatorias es igual a la suma de

la^s

esperarrzas de los dos surnandos:

dos

E(x+Y) :E(X) +E(Y).

tIoS

3.

Un factor constante c se puede sacar del smbolo de la esperanza matemtica:

Demostracin:

E(cX)

4.

Sea

l'c.

.l_*crf

En particutar si g(r)

Si

cE(X).

(r) O,

f@
"

.l_*rf

(r) dx

g una funcin real, la esperanza de la variable aleatoria Y

E(Y)

5.

E(cX)

E(g(x))

(x,)

cE(X).

S(X) est definida por

: [* s@)f (r)d,r.
J_a

12 se tiene

: l:,2q,d,.

X y Y son dos variables aleatorias independientes

E(xv)

: E(x)E(r).

Observaciones:

1.

1
rria y

Por las propiedades 2. y 3., si

Y:

aX

b, entonces

E(Y):aE(x)
2.

+b.

Si la funcin de densidad es simtrica respecto a Ia recta

r:

rr, entonces

E(X) : rn. (Figura

3.5)

cula

aclon
a, los

Figura 3.5: Funcin de densidad simtrica respecto a la recta n

TrL.

diferentes. Para diferen-iarlas es lecesario introducir otra caracterstica terica que informe sobre la dispersin de su posibles

Dos variables aleatorias con la misma esperanza pueden tener distribuciones


r-alores.

Captulo

LO2

3.

Variables Aleatorias, Esperanza

Lr iclea de <lspelanza
rrreclirnte

la

no ittclica ctuo csti clistlibuicl Ia mtsr en torrro su <l<ntro; sto sc


Ia valiable alertoria X, que se nota Var(X) o o2.
de nnt variable aleatoria

se calcula por:

Var(X)
o, equivalentemente, por

tipo de variable aleatoria,

es rrn nrmero

no negrrtivo que

: E(X -E(X))',

se calcula de

la siguiente manera:

Para una variable aleatoria discreta que toma un nmero finito de valores
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i

var(x)

:ilrr-E(x))2pn o
k:t

var(x)

:ir*r\-

rtt

r2t

.) trn con

(E(x))2.

k:L

Para una variable aleatoria discreta que toma un nmero infinito de valores
probabilidades p : Pr(X : rk), k : L,2,. ..:

Var(X)

3.

:E(x2) - (E(x))''

Var(x)
Segrn el

explrcs)

uari,an,zo, de

Definicin (de varianza) La varianzt

2.

Varianza

La varianza

3.5.

1.

: !["r - E(X))2pt o
lc=1

rr, 12, .. . con

- (E(x))'.

Para una variable aleatoria continua con funcin

var(x)

|lO

- E(x))'f (r) d.r

Observacin. Al igual que en la esperanza, si /(z) est definida en

var(x)

r) dr

- (E(x))'z

[a, b]:

l'o@- E(x)12/ @)d,r.

.la

La varianza da la idea de cun ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:

1.

Una mayor varianza indica que Ios valores tienden a estar ms alejados de la media.

2.

Una menor varianza indica que los valores tienden a estar ms concentrados alrededor de la
media.

Defrnicin (de desviacin estndar) La desviacin estndar de una variable aleatoria X


igual a Ia raz cuadrada de la varianza:

o:\@.

es

3.5. La varianza

103

Propiedades

].

Lr variarLzr

de

unr,

cero. Es decir, para tocla constante

corrstrrrte es

Var(c)

g,

c:

c constante.

Denostracin:

var(c) :

:
.l

2.

[*

E(c)]2

f (r) dr

[*

- c]2 @) ar

l'* oqrd"r:0.
_*

Un factor constante c se puede sacar del smbolo de la varianza, elevndolo al cuadrado:

Var(cX)

c2Var(X).

Dernostracin:

var(cx)

: l*

O"

E(cx))2 f (r) d,r

17r", -

cnr.)12 f (r) d"r

/'oo

: I "'1" - e(x)l/(r) dr :
J-*

c2yar(X).

'

3. Aditividad.

La varianza de la suma de dos variables aleatorias independientes es igual a la


suma de las varianzas de los dos sumandos. Es decir, si X y Y son independientes
Var(X
D

+Y) : Var(X) + Var(Y).

emostracin: En efecto,

Var(X +

Y) : E[(X + Y) - E(X +Y\2


: E[(x - E(x))+ (r - E(y))]2

Como las variables X y


Y - E(Y), por lo tanto,

E[(x

Var(X) + Var(Y) + 2Bl(x

E(y))l

son independientes, tambin lo son las cantidades

- E(x))(y - E(y))] :

En consecuencia, Var(X +

- E(x))(y -

EIX

- E(x)l .Ely - E(r)l :

X - E(X)

s.

y) : Var(X) + Var(Y).

,lbservacin. De las propiedades 1- y

2. se verifica que

Var(oX + b) :

a2

Yar(X).

Fj,emplos
de la

-.

La variable aleatoria discreta

est definida segn Ia ley

x I -41 6
p10.2

10.3

10
0.5

Hallar la esperanza y la varianza de: a) la variable aleatoria


0.5x +2.
Solucin:

X; b) Ia variable aleatoria Y :

Captulo

LO4

3.

Variables Aleatorias, Esperanza

Varianza

a)

E(X)

: D
: -4 x0.2 +6 x 0,3 * 10 x 0.5 :
A:1 "xp*,

6.

Calculemos E(X2):
3

n62): I ,?,p*,: (-q2e.2) + (6)2(0.3) + (10)2(0.b) :64.


k:1
Entonces,

Var(X)

b)

P(X2)

- (E(x))2 :64 -

Vamos a aplicar las propiedades de la esperanza

(6)2

:2a.

y la varianza para calcularlas:

E(v) : E(0.5X +2) :0.5E(X) + E(2)


: 0.5x6*2:5.
Var(Y) : Var(O.5X + 2) : (0.5)2 Var(X)
: 0.25 x 28 -- 7.
2.

En una rifa se venden 300 boletos, a un dlar cada uno. El primer premio es 100 dlares, el
segundo premio es 50 dlares y hay otros cinco premios de 10 dlares. Cul es la ganancia
esperada de una persona que compra un boleto?
Soluci,n: Sea

la cantidad ganada por un boleto premiado; entonces,

xl

1oo

so

I ro I

sigue la siguiente ley

p | 1/Boo | 1/3oo I sTaoo I zoaTaoo

As,

E(X)

rooxfr*5ox
0.67.

#.rox.*I+ox

293
300

Como la persona paga 1 dlar por el boleto, Ia ganancia (total) esperada es E(G)
-0.33 dlares; es decir, una prdida.

3.

0.67

- 1-

Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del nmero de intentos si separa las llaves que prob anteriormente.
Solu,cin: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
X: <<nmero de llaves utilizadas>), sigue la
siguiente ley:

abrir la cerradura; por lo que la variable aleatoria

xl1 I 213 I 4l

Entonces,

515

: D*ou:;I/c:3,
515
E(x') : Dk'rr:;tk2:rr,
E(x)

l--1

t-

l': I

Var(X) :

lI -

[:1

32

:2.

3.5. La varianza
4.

105

Una variable aleatorir X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley cre sigr.re X, si la esperanza rnatemtica y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,n: Esclibamos Ia ley de

Explesemos la esperanza

X:

y Ia varianza en funcin de 11 y

E(X)
La ley de X2

12:

0.6rr + 0.412 :

1.4.

es

Entonces,

E(X') :0.6r? + g.arl


v

Var(X)

n(X2)

- [E(X)]2 :

0.6r? + g.arl

- r.42 :

0.24

De aqu, se obtiene el sistema de ecuaciones

I
\

o.aq t olq:1.4
o.o"l -t o.4r| :2.2

Resolviendo eI sistema se obtienen dos pares de soluciones:

It : l, 12:2 y
Puesto

qLLe

12

z1

rZ:0.8.

1.8,

21, hallamos Ia ley de clistribucin de X:


t.4

.6

a) Hallar Ia esperanza y Ia varianza de

(,1.

ble ale
lealtoria

t<, -1;
si -1l<r
si r,) ' .).

que tiene funcin de distribucin:

si

b)

Se deflne

F(r)

la variable aleatoria Y

3;

Hal lar
rrsJU CSIper anza y su varlalza.

Soluczn:

a) Hallamos

1a

funcin de densidad

(r):

si

-1(r(3;

caso contrario.

De manera que

(,)
e (x') :
r2r@
[_,
E(x)

l_,

rf

1)

o":

(i)

r"

Captttlo 3. Variables Aleatorias, Esperanza y Varianza

106

Pot lo turto,

v.u(-K)

: p (x') - (E(x))2 :: - r' ::


J

b)

.)

Tenerrros la varirblc lertor-ir Y :5X *2, cuyzr. funcin de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:

E(Y) :

:5E(X)+E(2) :5 x It2:7,
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
E(5X +2)

.)

b.

Una valiable aleatoria


de este intervalo

est definicla por slr densidad

J'@):r+l2

f (r):0. Hllar la esperanza matemtica

"n

.)

el intervalo (0, 1), fuela

de la variable aleatolia

X3.

Soluctn:

E(v) :

rs

@)

o,

.lo'

,t (, **)

o,

,)ar:1" *1 4l
)"- ls 2 a)o
u--.40I3
'

7.

Determinar la esperanza y lti


csF() -1-e2t,t>0.

',

'

a valiable aleatoria

cr.rya fnncin de distlibrrcin

: F'(t):2"-2t, > 0; y 0, caso contrrrio.

Soluczn: La funcin de deusidad es:,/(/)


Calculemos Ia esperarrzn:

tr(x)
Irrtcgrando por partes, ponicriclo

fx

/.oo

.l_,"r.tb)nt: .lo

rL:

:1.

rl,u

2re-2''d,r.

e-2'cl,r; pol lo tanto: ilu,: dn,

2'
: -rc2 l-*1 l'n
r".,,rh
.lo
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-

l'*

z io-4c

l.

;'^'^
Entonces,

E(X):

lo*

,"-'2'rL*:r(i) - I

Necesitamos el clculo cle E(X2):

E(x')

: [:,2 q,a, :, .lo* ,2.

2"

tlr

Integrando por partes, clos veces. se llega a

2
La varialza buscada

ln ,,', "r!, = ?:!


4 2
Io

es

var(X)

E (X,)

(tr(.Y))2

1 tt/1\2

o
"

\ol

\o /

Lu

'r"-r',

S.S. La varianza
Etr ttlt slll)crlriercacro se ro,,.1,. ,,-.-

crescrir,e

ro7

-.

; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc

arcaroria quc

.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrl es Ia cnt jdact
de calnc quc se esr)
l)el'a vender diariamente
llin, halle ia desviaci"
en el supermercaclo?

b)

"r*0""..oq

Si la ganancia en el producto
se expresa
-r"4vvu por
r'L ccuacln
vvL la
ecuacin

ganancia

esperada.

Tam_

).

C:

fiX2 + 10.

Calcrile Ia

Soltt,cin:

a) Calcularemos
efectra

",

de la variable aleatoria
como er indicador
de las ventas que

,ro"r.lr,lifjlllza

E(x):

['o
to
" Gil o*:

,hl#];

:
:

La desviacin estndar
s d:

b) Entonces,

E(c)
-\v'/ :
:
la 'r'enta

cre

?(x'z)

cs

enl>
-= s,rrn,inie*;';;;;
::omtricas,
mtricas:
satrr

ar

icgo.

i I 992

138.89.

vC(D :

cre

car'e.

(E(x))2:1250 _ (33.33)2
i,/138.80

\
n(2.-,
"rl*o" *'o):

11.79 kg.

.r

IEE (x2) +to

1E(1250) + I0 :24.29.

la cirrle, cr supermer-caclo
csr)era ganar 24.2g

-- uontinucin, se cla
ulr ejernltlo de valiable
alcato
- r l<.rrlo dc ia
::tc1.l1 c1

,, o,

es

Val(X)

Por'

fo,o

:3333

As' el supernrercatro
espe.ara
-- vender
'v'uL 33.33 kg diarios
Calcrrlernos E (X2):

La r.ar.iarrza

valiatrza dc cs
dc anlisis ma
leatorias geont
ruatollas
geom

-Et.f.l[]11".[.o,,.

crrares

diarios.
ro iltfinito cle valores.

artificios qrre
]::? l"empleado
rtodo
ruLoclo
emrle,rdo por

rttrlttetldes lrsicas .lu


las sci ics

of Georrre ric: Xlouets, ,,


Tle Atuerialt
Stattstician, 46, 10g-10g

Captulo

r08

P,_1
, It,

Propiedad 1. Va (0,1),
Plopieclad

2.

Ya

Variables Aleatorias, Esperanza

3.

41,-

| -

l.;:0

(0,1),

k:r

lr -

(L

a,)ak

9. Una variable aleatoria X toma valores

Varianza

a'''.

I,2,3,.

I (1 -P)A
po,:-7,

. .)

con probabilidades

L- 1.'
h:I,'2,..,;

P (0,1).

Determinar sll esperanza y su vattatza'


Soluc'in:

E(x)

(r -P)k

: io-,k:i(-#)
A:1 '
A=1

: l-r)
i,'- :- (*)
ir, -or*
\nP/7_o
\ I'p)3'
p)k

Si

p (0, 1), entonces I

p e(0, f) y aplicando la propiedad

E(x)
prr-a

el cilculo

d.e

1:

(")

(#) r-i-r:-(#)

la varianza varrios a calculal E

(X'),

usando Ia notacin

Q: l- p; pol tanto

: ( *t) *n-:(-#) ',i'ronr


Veamos a qu es igual la surnatoria:
oo

oo

oo

oo

rnr :\nar +lnuk + lrek +


Dt
lc:3
k:2
k:r
k:7

'

Por la propiedad 2, se tiene que

:
Dttono

ct

q2

(X')

q3

+... - Dnr

L-p

k:r

k:1
Consecuenternente, E

queda como

E(x,)

:-(#) (;)+:

I-p
p2

in;r

: /. r,\\
'P)

3.6. Funcin generadora de rnornentos

3.6"

109

F\rncin generadora de momentos

Los momentos de una variable aleatoria son nmelos que representan algunas calactersticas de la
jistribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera nica a la ley de probabilidad.

Definicin (Mornentos)
el ntrnero

Sea

una variable aleatoria y sea

pr:E (Xk) es el k-simo momento de X.

f ntonces, tenemos que Ia media p

es el

un nmero natural. Cuando existe,

primer momento de la variable aleatoria; es decir,

F:

lJt.

-isociada a cada variable aleatoria podemos encontrar una funcin que permite calcular sus rnomentos.
fsta funcin tiene Ia propiedad de que, al igual que la funcin de distribucin, caracteriza de manera
:rica a la ley de probabilidad de la que proviene

Definicin (Funcin generadora de momentos) La funcin


ie la variable aleator"ia X es la funcin

generadora de momentos (f.g.m)

M(t):E("t"),
iefinida para valores reales de tales que la esperanza existe.
- . funcin generadora de momentos

se

utiliza tanto para variables aleatorias discretas como continuas.

alrt o

Ejemplos

Encontrar l funcin generadora de momentos de la variable aleatoria cuya funcin probabilidad


CS

x I -4 I 6 I 10

p 102 | 0.3 | 0.5

Solucin: Resulta que

I[(t) : E("t"):|pr"tr
k

0.2

e-at

0,3

e6

0.5

e1o

Hallar la funcin generadora de momentos de una variable aleatoria cuya funcin de densidad

es

rI si
r,
I
-1<r(3;
'
4
f\L;): \ -.
[ 0.

caso cont rario.

Solttcir: Tenernos que

M(t)

r-

("'')

: lt

,et'

f @) o'

l:, "t'!d,,
4

t:

^!)

-(

^-

4t

siguiente resu.ltado nos indica crno se pueden obtener los momentos de cualquier orden con el

:-:rpleo de la f.g.m.

Captulo

110

Teorema.

Sea

3.

Variables Aleatorias, Esperanza

Varianza

con furrcin generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier

orden; entonces,

j-nt,,,l
tr,,,=o

.,_

I-Ik-L qlxu):
\-'/dj",

Es decir, el k-simo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.

Observacin.

Se tiene que

E(X) : Ft y Var(X) :

Fz

F?.

Ejemplos

1.

Hallar la varianza de la variable aleatoria cuya funcin probabilidad

es

x I -4 I 6 I r0

p10.2 10.3 10.5

Soluc'in: Antes calculamos que il{()


.1

aual
t,)

o.-

dt2

AI

ft)

0.2 e-4t

_0.8e-at

3.2e-at

0.3 e6

1.8e6

10.8e6

por tanto,

0.5 e10;

belo
50e10.

Entonces,

ltt

ltz :
Por tanto, Var(X)

p2

ftnup:

#*

ro,

- u?:64 -

2. Hallar la varianza de la variable

-0.8e-a(o) + 1.8"u(o) - 5"10(0)


3,2e-_4(o)

(6)2

10.8e6(0)

b0e10(0)

:29.

aleatoria cuya funcin de densidad

(l

I@):l q,'si -1<r(3;


conrrario.
[ 0,

caso

Solucin,: Ya calculamos que

M(t):

eJL _ e-L

Por tanto,

!u,rt

(3t-1)e3*(1-t)e-r
t2
+t,

dt

#,u,

(st'

- 6t + 2) e3t -

',:r

- l:

.-)

es

6,

G4.

3,7. Ejercicios
Puesto que 1,1() no est definida para l,

111
2

0. para hallar

*r*r|,

regla de L'Hospital; entonces,

,ljz

M (0) aplicaremos la

trt :

4*g:
CN

Im
f+0

((st-1)e3+(t+t)e-) -1,
*Lurn*l
3

ttz

: #*ror: ls w(Q* - 6t + ?r"" - (t2 + zt + 2) et) :@t)

56
24

ors

Por lo tanto,

Var(X)

: pz- Lr?: 56.4


243

3.7. Ejercicios
l.

Halle la esperanza y la varianza de las variables aleatorias discretas definidas por

Yt 2 t 4 t 5 I

xl-0.7t10.24 10.61
pl 0.2 10.5 10.3

p 10.3 10.1 10.2 10.4

Se escoge aleatoriamente un nmero de conjunto $ : {-1;0; 1}. Sea


Encuentre su valor esperado, La varianza y la desviacin estndar de X.
Existe una variable aleatoria

Si

E(X)

50 y

b) E(-x);

Var(X)

120?

15. Encuentre:

cada nna con media p, y varianza o2.

a) Encuentre la esperanzay la varianza de,S: X -lY


b) Encuentre Ia espera\za y la varianza de ? : 3X;
d.e

el nmero escogido.

e) E(3x + 10);
f) Var(3x + 10).

X, Y y Z tres variables aleatorias independientes,

c) Calcule la esperanza y Ia varianza

E(X - 2) :8 y que E ((X + 1)2) :

c) Var(-X);
d) o(-2x);

a) E (x2);

Sean

que cumple qLre

es una variable aleatoria con

1-

Z;

A: \IjA,

d) Encuentre la esperanza de 52 y de A2.

X una variable aleatoria definida en el intervalo l-1;11 y sea f x(") su funcin de densidad.
Encuentre P(X) V Var(X) si:
Sea

a)

Jx\r): r;

b)

fy(r):lrl.

c)fx@):t-lzl.

d) f x@)

:t

'.

Encuentre la esperanza y desviacin estndal de las variables aleatorias definidas mediante las
leyes:

.) r(,)

r ( l;
si 1(.c14;

f 0.

si

sir>4.

:{ +,
t,

Captulo

t12

b)

c)

d)

e)

3,

(o
,
l:lr): {L2-r'

Variables Aleatoras, Esperattza

Varianza

sir!1;

t2 - si11.r.<2;
sir)2.
I t.
r,-..:l I Zr. si z e (0. l):
/(rt
o. sir((0, 1).
..\ < - *frt
f,(t:):
))' * Br - l2). si r (-5. -3):
'

I O,
(t.

--

caso contrario.

si

re

[1,2]:

f(r):1 '
I o, si zl11.2l.

(Determine primero el valor de c.)


8

Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p

ya.
q

10

11.

Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.
I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, adems 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribucin de X.
conociendo la esperanza E(X) :2.6 y la desviacin estndar o : 0.8.
Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp, de
los I'alores rt, 12 y 13) respectivamente.

12. La variable aleatolia X tiene tnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ,'
A.2. Determine la ley de distribucin de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable

aleatoria

tiene funcin d e distribucin

parar12l
0,
arlb, para21r14;
parar>4.
1,

F(r) :
a) I{alle

e1

valor de las constantes

cr

b;

b) Determine su funcin de densidad;


c) Halle 1as probabilidades: Pr(1 < X < 3) y Pr(X ,2.5);
d) Encuentre su esperanza y sr-l varlanza.

74.

Suponga que se escoge un nrmero real X en el intervato [2; 10] con urra funcin de densidad
Ia forma f (r) : Cz, donde C es una constante.

a) Halle el valor de C;
b) Calcule Pr(D), donde 1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X *
d) Encuentre la espera\za y la varianza de X.

35

> 0):

de

3.7. 4jercicios
15.

Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de eleccin mrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al rzrr. Encuentl-e:
a)

La ley

qr,re ciescribe

cl nrmero de respuestas cortcctas

b) El nrmero esperado,
c)
6

113

E(X), de respr-restas

del estucliantc;

correctas;

La valianza. Vur (.Y).

tlna organizac:n benfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dlales cada uno. E1 prerrio es un antomvil de 12 000 dlares. Si un ciudadarro
compra 2 boletos, cul es la ganancia esperada del comprador de los boletos?
IJna persona participa en un concurso de la televisin. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c despus de fallar la tercera pregunta.

a) Indique cui es el espacio muestral;

b)

Calcule la probabilidad de que d una respuesta correcta;

c) Halle la ganancia esperada;


d) Halle la esperanza y la varianza de Ia variable aleatoria que

describe el nmero de preguntas

realizadas al concursante.
Se asegura un vehculo de 50 000 dlares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un ao es de 0.02, cul es el valor de la prima que debe cobrar la
compaa de seguros, si espera ganar 200 dlares?
9

Si Roberto termina sus estudios en Junio, podr disfrutar de una beca para poder realizar un
curso de especializacin con todos los gastos pagados. Si aprueba en Septiembre, la beca slo le
cubrir el 40% de los gastos. Si no consigue aprobar, tambin realizar el curso pero abonando
50000 dlares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
slo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.
a) Halle

la distribucin de probabilidad del costo del curso de especializacin;

b) Determine el valor esperado de dicha variable.

:0,

Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dlares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilstico sobre la demanda de estos autos:

Demanda

Probabilidad

0.05

0.10
0.20
0.25
0.20
0.15
0.05

2
c

r)

4
5
()

Adems, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dlares por alquiler
del local y 15 por pago a ul empleado.

lL4

Captulo 3. Variables Alcatarias, Esperanza y Vatiai;za


a) Crlcttltt r:l tLtrrtelo csp<:r'aclo dc carlc-'s tocl,r

tellerro <re la agencia alqr-',il.rrri urr rla (;Lralquiera;

l,) CalcrLl<-r ltr girrrnirciir clirli csperad a:


,') Caicule Ia <l:sviacin cstinclal cle
'21

lii

gzrrranr;iir

Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselrr1ir lrlolrabilstic:o:

Cornpaa Ganancia Probabilidad , Cornpaa Ganancia Probabilidad


0.0r02

250

0.0346
0.0860

350
450

0.rs42

55t)

0.212:1

.I

650

0.2r23
0.1542
0.0860
0.0346
0.0156

Calcule Ia esperanza y la dcsviacin cstJrndar de la ganancia de una invcrsin en este portafolio.

22.Uncrculoderaclio1eszonificaclcen10"rculoscorclrtricosd.eradios
"' 10
10' 10"
lanza un dardo sobre el crculo, si stc cac en la zona ccmprerdida ertre los cr'culos de radios

i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i^"lJellar:zad.organa10-idlalcs,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.

23. EI espesor
2ao

del recubrimiento de unos cables tiene funcirr de densidud

tm.

ry,
'r'

corr 100

a) Determirre la media y la varianza del espesor del recublimiento;


b) Si el costo del recubrimiento es de 0.5 dlares por micrmetro de espesor,
medio por recubrir los cables?
24.

l1rn

<:r

<

,cul es el costo

Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrn cie densidad

(
f@):1oq1r'. sio( r<4'
|.

0,

caso contrario.

a) Calcule eI valor esperado de Ia cantidad de carne demandada y su desviacin estrrdar;


b) Si la ganancia est dada por Y :2X - 0.5. Calcule Ia ganancia esperada y su varianza,
25.

La longitud de ciertos gusanos se distribuye segn la funcin dc densidad

z - 1)(3 - 'c)' si 1 ( ''( 3:


@

I@): I

L 0,

crso

contrarirt.

a) Calcule la esperanza y la varianza dc la longitud clc los gnsanos:


b) Si para un estudio se considerarn aqrrellos eje:nplares clue ierrrr.n una longitud entre 1.7
cmy 2.4 cm, calcule el porcentaje cle gusanos que tienen es1-a calacter'stica.

26. El tiempo de uso diario


en horas) a

de la red Internet en Lrna oficina tiene

( gr2(g - ,\

f("):{'-r-'
0,
[

p,-r1 :r,;r-cin cie

sio((s:
carco

conira:-

densidad (medida

3.7. Ejercicios
a)

r-15

y la virriarrza rlcl tieurpo <.lialio clc rlso de lr lecl Intelnel,.


lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 cllares pol hora. CLlcule el vr,lor esperiiclo v
clesviat:iu estrrdat ck:l costr scur-nri (cn 5 clas laLorablcs) por el citilrio rrso.
Calcrrle cl vrlot eslrclaclo

lzl

La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <-re un atletr lanza la,jabirlina
CS

[. *t ,.,, (+)
,[(t': { 20zr \10n/
I O.

si

[0, lon2];

caqo corrtr.flrio.

a) Halle la probairiliclrd de qLre rula jal;alir'a lanzidr llcgue a nna distrncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviacin estndar de la distancia cubielta por la jabalina.
:3

Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por

Pr(X : k) :pqk,

con

q: L -p,r.ieren

Sea

claclas

por E(X) :!

: 0,1,2,...

y Var(X) : +.

pp'

una variable aleatoria discrcta que pucde tomar valores enteros, definicla por

Pr(X: r-l

a'
I ft - a)2n',

Pata'r_-1;
?' :0.7,2,,..

para

para elgn a cn (0,1).

a) Pruebe que la funcin de probabilidad


b) Demuestre que E(X) : g

:'-.

Sean

X y Y dos variables

est bien definida.

aleatorias independientes. Si

toma los valores 3,

1y

2 con pro-

babilidacles que son los 3 trminos de una progresin aritmtica cuya diferencia es j; mientras
tanto, Y tonta los valores 2,7 y 0 con probabilidades que forman una progresin geomtrica de
I

razn.r. Calcule la esperanzade XY +2Y


:'-

Dadas las variables aleatorias independientes

rx(,)

X.

X y Y, cuyas funciones

{3:' LJ"'"ik*,"

rv(v)

de densidad son:

: { t^' ..-l]l
[ 0,

''

caso contlario.

Calcule:

a)

E(x t Y);

b) E(2x

c) Yar( X

3Y + 5);

-2Y -3).

Las variablcs aleatorias X1, X2, . . . , X,, son independientcs e igualmente distribuiclas, tales que

Pr(XPr(Xn

1)

O)

Pr(X:

: *,
z

-f) : *,

i: I,2,...,fr.

Halle la esperanza matemtica y la varianzadela variable aleatoria

Sn: Xrt Xz*... * Xr.

116
33.

Captulo

3.

Variables Aleatorias, Esperanza

Varianza

Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos

Sr,: Xt t Xz + "'I
7,,

X1Y1

Xr,,,

X2Y2+ -. . + X,,Y,,.

Halle E(,5,,,), E(7',), Var(.9,,) y Var(T,,) si

E(X,)
Pr(Y

:1) :p,

: a,

Pr(Y

Var(X)

s2

-0) : q:l-It,

k:I,2,'..,n.

las variables aleatorias que tienen las siguientes Ieyes, encuentre Ia funcin generadora de
momentos v, mediante esta funcin, halle la esperanza y la v rtanza".

:14. Para

d) /(") :

Yl2l4l5

b)

p 1 0.3 1 0.1 1 0.2 10.4

c)

p 10.2 10,5 10.3

e) /(r) :

t)

I ;. si z 1-2,4):
I o. si r ( (-2,4).
( e-3'. siz)0

I o,

sir<o

si tt"tI'
f(r):f[. tsen3r'
caso contrario.
0,

35.

dos variables aleatorias independientes e idnticamente distribuidas con


Demuestre qtte Myy(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-

36.

sea

Sean

XyY

con f.g.m.

Mx(t), y sean a y b dos constantes. Demuestre

que

f.g.-. M(t)

Moy6(t):"'btwx(ot).

Captulo 4
Principales Distribuciones de Probablidad
Hay que erplorar sistemticamente el azar.
Facultad de Letras, Pars.

:r

este captulo se presentan, en detalle, algunos tipos de leyes que siguen las variables aleatorias, que
:f,arecen frecuentemente en problemas prcticos y cuyas propiedades deben ser conocidas.

-{ una variable aleatoria

que sigue una ley

L de parmetros (pr,pz) Ia notaremos como X

L(pt,pz).

{.1. Distribucin uniforme discreta


lla

variable aleatoria X, que puede tomar un nrmero finito de valores, 7,2, ..., n, cada uno de
tiene la misma probabilidad de ocurrir, se dice que sigue una ley de distribucin uniforme
:':creta. Es decir,

-,,-. cuales

Pr(X: k): -,1 k- L,2,''',n'


TL

E(X)

: n*7

VarlX)

^2 -'t
t2

: :U Vaflanza

' equiprobabilidad es la forma ms obvia de asignar probabilidades dentro de un fenmeno aleato:-,- cuyo comportarniento es desconocido. Esta ley aparece en los jr.regos de azar en los que todos
r,s jugadores tienen iguales posibilidades; adems, esta ley es la bsica en la simulacin de eventos
u,=atorios mediante comput adora.

Eemplos

-.

octaedro, considerando la variable ale-Ltoria que describe el nrimero


de puntos que aparece. Detelnlirrar su esperanza y varlarlza.
Se lanza rrn dado en folmr de

717

Captulo

118

Sol,tt,c'i,n: Sc tir:rre que

4.
?

Principales D istr ibttciones de P rob abilidad

r-F1

E(,Y)

n,2

-I

12

64-r

27

1')

Una mquina registra, en rninutos conipletos, la di.felencia de tiernpo en e1 paso cic crrrriones
por cierto lugar de la carretera. Se sabe clue ia diferencia mxima puede ser 9 rninutos. Si se
asrlme qne los arril-ros son aleatolios, calculal cl tiempo qlle se es1;erara exista errtlc dos rniJos
consecutivos, su varianza y desviacin estndar.
Soluci,n: La variable aleatoria puede tomar los valores 7,2,
tribucin uniforme, por Io tanto,

E(x)
Var(X)

..., 9, que suponemos

tiene dis-

: '+]:nrt:5min,
22
: +:

o :
3.

1; ,,trt,rt,""r,

(l

8+1
,2

Var(X) :

2.

: i),8:

)' sr: asigrtzr lir probabilitirl Pt (X

J6.6?

\/:6.62min2,
2.58 min.

Un reloj est descompuesto y suena) aleatoriamente, a la hora en punto; es decir, puede sonar
a Ia una, a las dos, . .., a las doce; dando ese mismo nmero de campanadas. Determinar la
esperanza y varianza de la varirble aleatoria que describe el nrmero de campanadas que se habr
de esperar que d el relo.j.

Solttcin: Encontremos la esperanza y la varianza, considerando

12+l
nll
22
n2 -r
L44-I
Var(X) :
72
72

E(x)

4.2. Distribucin

n:

12:

6.5 h,
11.92 h2

hipergeomtrica

Nos planteamos el siguiente problema: en una urna se tienen ly' bolas, n de las cuales son rojas y las
N -n restantes negras, de las cuales se extraen al azar r bolas; investigaremos la probabilidad de qne
el grupo eiegido contenga exactamente k bolas rojas. Aqu, k puecle ser cualquier entero entrc cclo l
TL

A T.

l,a probabilidad

es

Pr'(X

/,')

: Cf,C'f!,,

ci

Si consideramos l proporcin de irolas rojas en la composicin incial de bolas contenidas en la urna


n,
p : I y q : I- p, la frmula de Ia probabilidad puede expresalse colno

'

N"

Ck,,,Ch-"*

Pr(X: tt): ff,

A:0. 1,...,mn{Np,r},

por Io que la probabilidad p de obtener una bola roja se puede introducir como un parrnetro
define la ley.

que

4.2. Distribucin hipergeorntrica


-\ ttrta variable
.rrcr li;rItl

tl(A'.

Lir csp<rlauza

rlctotir
r').

c-rer

119

sigue una ley hipelgeorntlica cle lral,rnetlos

(Iy',n,r) se la uota

r.

cs

EIX) :'"'

i\/

-,'n.

'.' la rrarianza

vartx\:rL(l_
,u\-, i,
/ \'

/A/-r\ : rr(,
/l/-r\
" ' (,^,,
-ttt
_
_ r/
(v
1,,)
r)

Esta distribucin de probabilidad surge en el anlisis de muestras en control de la calidad de lotes


ie productos (en Ios cuales hay artculos tiles y defectuosos), en estudios censales de poblaciones
:nimales y al realizar muestreo sin reposicin.
- a siguiente
frmula de recurrencia facilita el clculo iterativo de las probabilidades de la leyl:

Po:

(,n-n)!(N-r)!
/!(/ -n-r)l
n'll-k
r-17-k

Pk : Pn-r f

: I,2,..

_n_r+k,

.,T.

Ejemplos

-.

En ttn grupo de 12 estudiantes 8 son sobresalientes. Por Iista se escogieron 9 al azar. a) Cul es
la probabilidad de que entre los estudiantes seleccionados hayan 5 sobresalientes?; b) Cuntos
estudiantes sobresalientes se espera encontrar entre los seleccionados?
SoIucin:

a)

Si consideramos la variable aleatoria


escogidos>>, se tiene:

Z:

<<Nmero de estudiantes sobresalientes entre los 9

Total de estudiantes, N :72;


Total de estudiantes sobresalientes, n:8;
Total de estudiantes escogidos, r :9;
Nmero de estudiantes sobresalientes escogidos, k
Por Io tanto, Z - 11(72,8,9) y

elqi :
Pr(Z :5) :

c?,

5.

8!

4l

5!3t4CI

12t -

14
55

9!3!

b)

Calctrlemos la esperanza de Z:

9x8
E(Z): rn
' 12
Se esperara encontrar 6 sobresalientes.
Drane, J. W., Cao, S., lVang, L. y Postelnicu,

T. (1993), "Limiting Forms of Probability \,Iass Functions via

-:- re Formulas," T he American Statist'icia'n, 47, 269-27 4.

Recur-

Captulo 4. Pncipales Distribuciones de Probabildad

L20

En trn contlol de calidacl inch.rstlirl se tonr un lote dc 10 lriezas l)lra nna irrsirelcin. ELr el lotc
Luy 8 piczas correctrs. Sr: tottiart al azat2 piezas. Formrr lil lcy clc clistlil.,rrcirin clel nrrnero clc
picz:rs corlcctas cntrc 1rs escogi<lir"s .y calcrrltrl su esl)eranz1.
Scht,c'i'r:

La variable

siguientes r,lores:

zt :

l'(nirmcro
0, L2:7, :t:3 : ).

aleatorir.

c-le

piezas correctas entre las escogiclas) tiene los

Ernplearerrios la ley hipergeomtlica con A:10 (rrrmero total cle piezas), : B (nrrncro total
de piezas correcta^s) y r :2 (tarnairo de Ia muestra); es decir, Y - ft(10,8,2), obteniendo:

Pr'()/

0)

C3C3
c?n

- 10x9 -

7x2
Pr(Y: 1) : cc 8x2
c?o

45

4,)

16

45

Bx7

Pr()':2):W

Ix2

28

45

45

Formemos la ley de distribucin buscada:

Yl o | 1 |

La esperanza

es

E(Y)

:6 116
45
-+1x-

28
+'2x-:1.6.
45
45

4.3. Distribuciones de Bernoulli y binomial


Si al realizar un experimento una vez, solo hay dos resultados posibles, se tiene una prueba de Bernoulli.
Se acosttrmbra referirse a uno de los resultados corno <<r'ito>>) qlle aparece con probabilidad p, y al
otro resultado como <<fracaso>>, que sucede con probabilidad g. Es evidente que p y q sol no negativos

y que

Pl q:

L.

Generalmente, se define la variable aleatoria que sigue una ley de Bernoulli as:

La ley de probabilidad

es

Pr(X:r):p,
La esperanza y la varianza son iguales

Pr(X:0) :t-p:q.

a:

E(X) :'p,

Vat'(X):

pq.

La ley de Belnoulli desempea un papel fundamental en el anlisis de fenmenos en los cuales solo se
tienen dos resultados mutuamente excluyentes, como es el caso de muchas preguntas en todo tipo de
encuestas o Ia cleterminacin del sexo de los recin nacidos.

4.3. Distribuciones de Bernoulli y binomial

L2L

Ejernplos

':. El mis ciolrocido es r:1 clel ltrrzaruiicnto


desequiiiblio en Ia monecla p v

.1

de una monecla hornog:tr<tir, acr

son clistintos cle

I
2r

y las probabilidades

son

: o) :

Pr(X

Si Lay

I.2

Consi<lr'cse el experimento cousistente en Lanzar un dado y la variabie aleatorir


de Jrnntos es nr.ayor que 4>>. Entorrces.

v : I t. si
^ 1 o, si

'I

X:

<<el

nrmero

t5. tj):
c..r {1,2,3,4}.

c*.,

3,

Pr(X

: t) :

1.

Segn datos censales se ha establecido que en la poblacin ecuatoriana el 52% lo constituyen


Ias mujeres y eJ. 48 % restante los hombres. Si se toma una persona al azar y se quiere conocer
su sexo, se tiene

t,
X- ! 0,
I

Pr(X

0)

:0.48,

si es mujer;
si es hombre

Pr(X

1)

:0.S2.

-pongamos que se reah.za una sucesin de n pruebas de Bernoulli e interesa conocer el nmero de
-ritos>> obtenidos, al margen del orden en que ellos se presenten. EI nirmero de xitos puede ser 0,

'- 2'

"',

n'

:- ilama binomial a la ley de distribucin

' ie xitos en una sucesin de n

de una variable aleatoria discreta

que describe el nmero


pruebas de Bernoulli independientes, en cada una de las cuales la

-:.,babilidad de xito es igual a p.


binomial fue descubierta por James Bernoulli, quien Ia dej escrita en su obra
Conjectandi,, ptblicada en 1713, despus de su muerte ocurrida en 1705.

-'t-';ley de distribucin
-'

probabilidad se calcula mediante

Pr(X
tr-

-a variable aleatoria

k)

: Ckpkq'"-k, k :0,I,...,fr.

que sigue una ley binomial de parmetros n y p se la notar como

3ir(.n,p).
:-

-\ - Bin(n,p),

X-

se tiene que

E(X) : n'P,

Var(X)

nPQ'

,iistribucin
--'-:ra
r

binomial tiene amplia aplicacin en Ia teora de mr.restreo cuando se puede contestar


pregunta rnicamente con dos opciones (por ejemplo SI-NO).

-lculo de ias probabilidades puede ser un proceso difcil porque los factoriales en los coeficientes
rpidamente. Por estas

--- -,rriales crecen muy rpido, mientras que las potencias de p y q decrecen
:-r-)nes se utiliza la siguiente frmula recursiva para su clculo2:

Po :
pk :
-)rane, J. U/. y otros (1994), op. cit

(l-p)"
n-._l-l;
pk,I--------;K

p
l--,
I-P

ff : I. Z)... jll.

Captulo

122

4.

Principales Distribuciones de Probabilidad

Ejemplos

1.

Su>ongamos que en r,rna poblacin existen igual nirmero cle holnbres y de rnqjeres y consideremos

aquellas familias que tienen 4 hi.jos.

a) Formar Ia ley de Ia variable aleatoria que describe el nrmero de hijos varones en dichas
familias.

b) Calcular la probabilidad de que en una de estas familias haya mis de un hijo


c) Cuntos hijos varones se espera que haya en una familia que tiene 4 hijos?
Soluci,n:
aleatoria

1
y el nmero total de hijos es n : 4.
)emos que p :
Sat
t

X:

varn.

Entonces, Ia variable

<<Nmero de hijos varones>>, sigue una ley binomial de parmetros

(4,|f 2); o

sea,

Bin(4,t12).

a) Determinemos la probabilidades correspondientes.


o Si en la familia no hay ningn varn, k : 0:

Pr(x:
o Si hay un varn,

o)

k: I:

Pr(x:1)
o Si hay dos varones,

varones,

/c

:2)

Si hay cuatro varones)

n-'

"1(;)'

(;)

:z

: cl (;)'(;)'-':

le:4:
Pr(X

De manera que

3:

Pr(X:3)
o

: cl (;)'(;)^-':

k:2:
Pr(X

o Si hay tres

: c3 (;)'(;)'-': *

: 4) : ct(;)' (;)*^: *

xl o I r I z ls |
rl4 tto
e Llt6

b) Debemos calcular Pr(X > 1) :

l114l3lB I
|
-f Pr(X:3) +fr(X: a;. Esta probabilidad,

Pr(X :2)

tambin se puede calcular mediante el evento complementario:

Pr(X>1) : 1-Pr(X<1) :1-[Pr(X:0) *Pr(X:1)]

/r

1\

'\to't)-tc'

lfrl

c) EI nmero
ria:

11

esperado de hijos varones se calcula mediante la esperanza de Ia variable aleato

E(X):
/'2 nP:4'1:Z'

De manera que se esperara que en una familia que tiene cuatro hijos, dos sean varones.

4.3. Distribuciones

de Bernoulli

y binornial

L23

esti cornpuesto 1>or tres elementos que traba.jan independientemente. La prolabiliclad cle frlla de crda elemento en Lrrr da es igual a 0.1. Formar la ley de distribucin del
rrmero de elementos qr-re fallan en r-ru da.

Un dispositivo

Solucirt: La variable aieatoria


valoles:

(<nirmero de elernentos que fallan>>) puede tomar los siguientes

: 0 (ningn elemento fall), 12: I (fall un solo elemento), 13 :


fr4:3 (fallaron tres elementos).
z1

2 (fallaron dos elementos),

Las probabilidades de fallo de cada uno de los elementos son iguales entre si, entonces es aplicable

la ley binomial; por lo tanto,

pt :
pz :
ps :
p+ :

X - Bin(3,0.1):

:
Pr(x :
Pr(x :
Pr(X :
Pr(X

:
1) :
2) :
3) :

0)

:
cl(o.t)t(0.9)' :
c3(o.t)'(0.9)t :
c3(0.l)t(0.9)o :
c3(o.t)o(0.9)'

1. (0.1)0. (0.9)' :0.729,

3.0.1. (0.9)2 :0.243,


3. (0.1)2 .0.9 : 0.027,
1. (0.1)3. (0.9)0 :0.001.

Bn resumen,

3.

Un examen consta de ocho preguntas de eleccin mltiple, cada una de ellas ofrece cinco alternativas, de las cuales solo una es correcta. Para aprobar ei examen es necesario contestar
correctamente al menos tres preguntas. Si un estudiante se propone responder a las preguntas
al azar.

a)
b)

Cul es la probabilidad de que conteste correctamente todas las preguntas?;


Cul es la probabilidad de que el estudiante apruebe el examen?

Solucin: La probabilidad de responder correctamente a cualquier pregunta


Sea

Z:

<<nmero de pregurrtas correctamente contestadas>>, con

a) Debemos determinar la probabilidad del evento Z


Pr(Z

:8) :

C3(0.2)t(O.g)t-t

es

p:

Ib :

o.r.

Z -Bin(8,0.2).

:8:

1 . (0.2)8 . 1

0.00000256.

Lo que nos indica que es muy difcil que adivine todas las respuestas.

b) Para aprobar se debe contestar correctamente al menos tres preguntas, por lo tanto Z >

3-

Pr(Z>3): I-P(Z<3)
: r - lPr(Z : 0) * Pr(Z : I) +Pr(Z :2))
: 1 - c3(0.2)o(o.e)t - cA(0.2)1(0.8)' - c!10.2210.s6

0.20308.

Una agencia de turismo ofrece viajes a la amazona. La utilidad mnima que le reporta uno
de estos viajes es 6 dlares por cliente. Ademiis, ofrece dos planes especiales, A y B. Por un
plan de tipo A, obtiene una ganancia adicional de B dlares y por un plan de tipo B, 13 dlares.
Adems, se sabe que el 60% de los clientes que contratan planes especiales prefieren uno de
tipo A. Si una semana, la agencia vendi 25 viajes a la amazona, 20 de los cuales no fueron
especiales, cul es la ganancia esperada?

Solucin: La agencia vendi 25 planes: 20 normales y 5 especiales.

f24

Captulo 4. Principales Distribuciones de Probabilidad

X la irariable <<nrrnero de planes de tipo A venclidosrr, X - Bin(5,0.6).


Lr utilidacl [/ cre le producen los via.jes vendiclos es:
Sea

?5 z

,,
Dado que

E(X) : np :

E(U) :

4.4. Distribuciones

x 0.6

b.t

',1,

.EX. + t3(5 - X).


Pi,, ,t
*;*

3, la utilidad espe'acla

es:

150+E(BX) +13E(5-X)

:215-5E(X)

geomtrica y binomial negativa

Consideremos una secuencia de pruebas de Bernoulli, con probabilidad de xito p, pero en lugar de
contar el nmero de xitos, nos interesa conocer el nmero de intentos hasta obtener el primer xito.
Una sucesin de pruebas de este tipo se dice que forman un erperimento geomtrico.

Una variable aleatoria discreta X que puede tomar un nmero infinito de valores I,2, . .., se dice que
sigue una ley de distribucin geomtrica de parmetro p (0 < p < 1), si la probabilidad de que X
tome el valor k es

Pr(X
A esta variable aleatoria

k)

se la nota como

: p(I - dk-t, k: I,2,. .

X-

A(p). Su esperanza y su varanza son iguales a

E(X) :
Var(X) :

L-p
p2

La distribucin geomtrica se aplica en investigaciones de mercado y en muestreo, para conocer cuntas


compras se han de realizar en una promocin para obtener un premio.

Ejernplos

1.

Si la probabilidad de que un estudiante pase una prueba de ingreso a una universidad es 0.25.
cul es la probabilidad de que el estudiante pase la prueba en el cuarto intento?
Soluc'in: En nuestro caso p : 0.25 y el nmero de intentos es k : 4, por lo que

Pr(X:4) : p(L-p)a-1
: 0.25(1 - 0.25)3 :
2.

0.105.

En una promocin una marca de papas fritas incluye, en cada una de las fr"rndas, una de las
figuras de los tres chiflados. Si un comprador cree que hay igual nmero de figuras cle cada uno
de los personajes en Ia promocin, cuntas fundas ha de esperar comprar para obtener las tres
figuras?

Solu"ci;n: En Ia primera compra) siempre obtiene una figura que no se tena, por Io tanto

E(X1)

:1.

Para la segunda compra se tiene una probabiiidad de p2:

O"

.orrr"*uir rrna figura nueva;

el nirrnero de compras que se debe realizar para obtenerla es E(-Y3;

: 1: I
l)1

as.

4.4. Distribuciones geonttrica y binotttial negativa


Un) r'cz (luo sc ticrrcrr rlos figruirs, la Prolrabilirlad <lc crLr:(rrtr'll

la figrrtzr clrc fallrr

lrlirlrolo rlc <:on)l)ras (1uo sc osl)ett lcalizrr'palir olrtc:rrcllr cs E(-Yr)

El

rrtirrrclc-, tc.rtrl rlc courl)rls qtle sc elsl)e1

E(x)

125
es p.l

I
: -\cl
,)
r)

: l:3.
,P:I

r'lrlizal cs

E(xr) +E(X2) +E(x;r)

I -r- 1.5 +3

5.5.

As,seeSI)erarea]izar.altncrios6cotriprasc1elproc1ttcto])araobte1leI'lacoIeccirrcclrtlpleta.<
-\hora, gclrcr'rlicernos la iclea de lr lev geomtrica )/ nos intcresa cl nrrnero de pnrebtrs cle Bemoulli
:recesarils hast obtencl exactanlente r' xitos.

-ua variable aleatoria cliscreta X que puede tomar nn nrmero infinito de valores r, r]_7,r'12,...,
=: dice que sigue una ley de distribucin binomial ncgativa de parmetros (r, p) (r > 1,0<p<1),si
-r probabilidad de que X tome el valor k es

Pr(X

:l

parmetro

x)

C'r--tpr'(t

- rn-t,

- BN(r,p).

E(X) :

l)r *2,...

y r es la probabilidad de obtener un xito.

es el nirmero de xitos que se desea obtener

-\ esta variable aleatoria se la nota como X

r','t"

Su esperanza

y su varianza son iguales

L
p

l-n
Var(X) : ,;
\

la ley cle distlibucin l;inornial negativtr tamJrin se le llama distr"ibttczn


.:licaciones que la ley georntlica.

Ejemplo. Una mquina. que est


--,lependiente. Se considera que el
::lenas produce el tercer defectuoso:
a)

y tierre las nrisrnas

claacla) ellvasa latrs cle collserva de una en una y de rnauela


5% de lo envasado resulta defectuoso. Si Ia mquina se detiene

Cul es el nirmero de Iatas producidas hasta qlle se detiene Ia mquina?

b) Cul es Ia
c)

d,e Pa,sco,l

probabilidad de que la mquina se detenga en la novena lata producida?

Cul es Ia probabilidad de que se detenga sin producir ninguna lata buena?

: 'l.uci'n: Definimos la variable aleatoria


--rsas>>; X
BN(3,0.05).

X:

<<nmero <le latas producidas hasta que hayan 3 clefec-

a) Calculemos la

esperrnza de

X:

E(X)
Se espcrartr

b)

Calcrrlemos

:l:,1
p 0.05

ploclucir 60 latrs htrsttr quc sr: detenga la mquirra.

Pr(X

9):

Pr'(X

O;

CN I(0.05)3(1

c) Quc ningunl lata ploducidr fuc bLrcna, significa


decir,

A;

--Or-t.

3.

Pr(X

3)

0.Os;0-'r

qr.re las

C3_1(0.05)3(1

0.00257.

3 plirueras lLts fueron defectuosas;

0.OS;:-;t

0.000125.

es

t26

Captulo

4.5.

Principales Distribuciones de P robabilidad

4.

Distribucin de Poisson

Uria r'rriable lertoria <liscret X quc puedc tonrrr rin nrrneLo infinito de valor.<ts 0, 1, 2, .,., sc dice
quc sigue una ley cle Poisson de pirrmetro ) () > 0), si la probabilidd cle qrre X tome el r,lor k es

Pr(X:
A esta variable aleatoria

k)

se Ia nota como

"-

)' sl':

k! , k:0,r,2,...

X - P(^).

Su esperanza y su varianza son, respectivamente, iguales a

E(x)
Var(X)

^,
^.

La distribucin de Poisson se aplica a sucesos que se presentan en el tiempo o en el espacio, tales como
nmero de accidentes de trfico, nmero de llamadas telefnicas a una central, nmero de goles que
marca un equipo en un partido, nmero de bacterias en una placa, entre otros.

El significado del parmetro ,\ es el promedio de aparecimiento del evento en n pruebas.


Esta ley de probabilidad es una bttena aproximacin a la binomial cuando n es relativamete grande
(n > 30) y p pequeo (p < 0.05), poniendo ),:np
Puesto que muchas aplicaciones de esta ley dependen del tiempo, es conveniente ponerla en la siguiente

forma

Pr(X

*)

^-).1r rrk

\-111|,

A;

0,I,2,...,

que se la interpreta como la probabilidad de que sucedan exactamente k eventos en un intervalo


tiempo fijo de duracin .

de

Para la ley de distribucin de Poisson tambin existe una frmula de recurrencia para el clculo
las probabilidades3, dada por

de

PO

Pt

:e

-,\

: P*-t x ^ k:
k'

L,2,.

Ejemplos

1. En la construccin

de ttn edificio el nnlero de accidentes es de tres por mes. Calcular l.


probabilidad de que en un mes: a) hayan dos accidentes; b) hayatr menos de 2 accidentes; c
hayan ms de 3 accidentes.

Solucin: si

es la variable <<nmero de accidentes en un mes>>)

a) La probabilidad solicitada

es:
e-3:12
Pr(X:2):;:0.224.

3Drane,

J. W. y otros (1994), op. cit

x -p(s).

istribucin de Poisson

t27

b) La plobabilidad PL(X < 2) es:


Pr(X <

c) Esta probabilidad
Pr(X > 3)

2)

Pr(X

e-330
0!

0) +

Pr(X

1)

e-331
1!

cs ms crnodo calcularla mediante el evento complementario:

:i

'rii,i I--;;; f :li; "J'";f_:^'].: "''"


t-(
1r
2! * o
"

"

:2) .' Pr(x :

3)l

i:o'352'

El promedio de llamadas que pasan por una central telefnica en un minuto

es igual a dos.
que
b)
menos
de 4 llamadas;
probabilidad
tres
minutos
se
hagan:
a)
4
llamadas;
de
en
Hallar la
c) al menos 4llamadas.

Solucin: En este caso es necesario utilizar la segunda forma de la ley de Poisson con
+
L

--

D.

Pr(X:
a) La probabilidad

"-z's(2.

2y

^ll"-

de que en 3 minutos se hagan 4 llamadas

Pr(X:4) :
b) La probabilidad

a)

)-

3)n

41

.-66a
24

es

:0.1339.

buscada es:

4) :

Pr(X <

Pr(X

3)

63e-6 62e-6 6re-6


:J!-21-I!-u!
: 0.1512.

Lr=

c) Los eventos <<se hicieron

menos de 4 llamadas>
complementarios; por eso, su probabilidad es:

Pr(X > 4) :

+Pr(X :2) +Pr(X

t- Pr(X

< 4)

+Pr(X

:0)

60e-6

<<se

L)

hicieron al menos 4 llamadas>> son

0.1512

0.8488.

Un libro se edita con un tiraje de 1000 ejemplares. La probabilidad de que un libro est encuadernado incorrectamente es igual a 0.01. Hallar la probabilidad de que el tiraje contenga
exactamente cinco libros defectuosos.
Solu,cin: Segn los datos del probleman:1000, p:0.01 y k:5. El nrmero z es grande yp
pequeo, por lo que utilizaremos la distribucin de Poisson. Estimamos ),: np: 1000 x 0.01 :
10.

La probabilidad buscada

es

Pr(X:5) :

"-10195
<

0.000045 . 105

0.0375.

El gerente de una fbrica planea comprar una mquina r.ueva de entre dos tipos A y B. Por
cada da de funcionarniento, el nrmero de reparaciones X que necesita Ia mquina A es una
variable aleatoria de Poisson cuya media es 0.1, siendo el tiempo de funcionamiento diario
(en horas). El nmero de reparaciones diarias Y de la mquina B es una variable aleatoria de
Poisson con media 0.12t. El costo diario de operacin de A es C(t): 10 +30X2 y para B

128

Capitttlo 4. Principales Distribtrciones de Probabilidad

corrsisl

+ 301'2. 'Cul cle las rni'rcluirra,s clr cl rnerror (:osto esPclackr, si iur clr clr: tralrtr.icr
c crL: a) 10 lror'is'/ 1r) 20 Lolas'l

as Cp()

Sol,u,t:irit,:

El costo cspr:raclo pzrlrL;t os

E(C.1())

:
:
:

E(10

+ 30X2) -

10

+ 30E (X2)

+ 30 lvar(x) + (E(-x))'?]
10 + 30 [o u + (0.1)'?]
10

13/

0.3/r.

Igualrnente,

E(cB(t))

a)

Calculemos E(C(10))

:
:
:
:

b)

/,

+ 30 [Var(Y) + (E(Y))'?]
8 + 30 lo.rzr + (0.12)21
11.6 + 0.432*.
8

:
:

13(10)+0.3(10)2:

160

11.6(10)+0.432(10)2 :159.2.

y E(C6(20)):

E(C.4(20))
E(CB(20))

3oE ()'2)

10, el menor costo tiene Ia mquina B.

Ctrlculemos E(C(20))

Si

y E(Cs(t0)):

E(CA(10))
E(CB(10))
Si

E(sr + 3oY2): 8r

20, la mquina

:
:

13(20)

+03(20)2:380

11.6(20) +0.432(20)2

A tiene una operacirr

:404.8.

rns econmic.

4.6. Ejercicios
Ley uniforme discreta
I

IJn leloj automtico registra la hora a la cual llegan los empleados de una oficinzr, err troras 1'
minutos completos. Una persona puede atrasarse irasta 59 minutos luego de la hora prefijada
para entrar, caso contrario se le corrsidera corno falta. Por cada minuto de rtlaso se le colra
trua multa de 50 centavos. Si los tiernpos de atraso se consideran aleatorios:

a) Cunto esperar una persona que se lc ciescuente por un da que se atras?;


b) Si en ia oficina hay 8 persoDas) que se atlasaron 2 r'eces al mes cada nna, .cunto
descuento global esperado
2.

ser' el

estos ernpleados de la oficina?

Pala el sen'icio de transporte entre dos ciudades hay 10 buses, cle los cuales 5 son de tiPo normai
(costo clel ptrsa.le 2 dlares) y 5 sou clc tipo r:spocial (costo clel pasa.je 3 dlales). Una pclsorra
tietre que rir.iar etrtre las dos ciudades (ida y vuelta) durante los 5 das la.borables clc Ir senranr.
y prr'r tLrutsroltalse tonta el primcr lms c-re apalece en esr mtl) sin difelencir' el tilto; .cntinto
(:)Spelzlli gastar esta lrelsona en la semrua?

li.
'

4.6. 4jercicios

t29

Eu ttna escuela prirnaria se registr el nrimero de palabras por minuto que lcan los estucliantes,
cricontr'irrclose qtle lean r-rrr rnnirno de B0 palablasi y Lrrr mximo dc 139. Ba.jo la suposicin cle <rc
la variable aleatoria clrte clcsclibe el nrrnero rlc palabrtrs lec,lls esti uuiformcmente clistribuicla.

a) Halle la probabilidad de qlle un estudiante, seleccionado al azar', 1ea l menos 100 paltrbras;
b) Determine el nrinero de palabras qlre se esperar'a lea nn estudiante selcccionaclo al azlr..

X una varia,trle aleatoria que sigue una ley uniforne


para k : I,2,... ; b) Var (X*)
Sea

sobre

{-1,0,1}.

Calcule: a) E (Xa)

Ley hipergeomtrica
Una variable aleatoria

tiene distribucin hipergeomtrcaH(7,4,5). Calcule:

a) Pr(X:3);
b) la esperanzartllzando la definicin y verifquela empleando la frmula de E(X);
c) la varianza de X.
En una lnea de control de calidad se revisan 10 artculos, determinndose que hay 3 que no
cumplen con las especificaciones. Si se escogen al azar dos artculos, identifique los parmetros
de la ley y halle la esperanza de la variable aleatoria
entre las dos escogidas.

X,

que describe el nmero de piezas correctas

Para llenar 4 vacantes de contador se presentan 10 personas, 7 hombres y 3 mujeres. Salen


seleccionados 3 hombres y 1 mujer. Las mujeres aclrsan a1 empleador de discriminacin sexual,
por lo que le llevan a juicio. Si el juez supone que la eleccin fue al azar, puede decirse que
existi discriminacin al hacer la eleccin?

El examen de graduacin de los abogados consta de 50 temas. La forma de examinar es la


siguiente: por sorteo se eligen 6 temas de los que hay que contestar 3 para aprobar. Si el
estudiante ha estudiado solo 30 temas:

a) Cul es la probabilidad de los 6 temas sepa contestar correctamente a 3?;


b) Cul es J.a probabilidad de aprobar el examen?
Un auditor comprueba la contabilidad de una empresa y toma como muestra 3 cuentas de una
lista de B cuentas por cobrar. Calcule la probabilidad de que el auditor encuentre por Io menos
una cuenta vencida, si hay:

a) 2 cuentas
b) 4 cuentas
c) 7 cuentas

vencidas entre las 8 seleccionadas;


vencidas;
vencidas.

Una empresa renta autos, a los que no les da el mantenimiento clebido, por lo que algunos
funcionan mal. IJn da tiene disponibles B autos para ser rentados, de los cuales 3 funcionan
mal. Ese da se rentaron 4 autos. Calcule la probabilidad de que:

a) ningn cliente haya recibido un auto que funcione mal;


b) por lo menos un cliente reciba un auto que funcione mal;
c) tres clientes reciban autos que funcionen mal.
Leyes de Bernoulli

y binomial

Una variable aleatoria

tiene distribucin binomial Bin(4,0.2). Calcule:

130

Captulo

4.

a) Pr(X :2);
b) PL(X > 2);
t2

13

Principales Distribuciones de Probabilidad

c) Pr(X < 2);


d) E(x);

r.) Var(X).

Urra rnquinr llena las ca.jas cle palillos de fsforo. En una Jrroporcin del 10 % la rnquina no
llena las cajas por completo. Se toman al azar 25 ca.jas de fsforos, calcule Ia probabilidad de
que no haya ms de dos cajas incompletas.
IJna encuesta revela que el 20%o de la poblacin es favorable a un poltico y el lesto es desfavoseis personas al azar, se desea saber:

rable. Si se eligen

a) La probabilidad de que las seis personas sean desfavorables;


b) La probabilidad de que cuatro de las seis personas sean favorables.
t4

Una determinada raza de perros tiene cuatro cachorros en cada camada. Si la probabilidad de
que un cachorro sea macho es de 0.55, se pide calcular:

a) la probabilidad de que en una camada dos exactamente sean

hembras;

b) la probabilidad de que en una camada al menos dos sean hembras.


15.

En una investigacin sobre el <<rating>> de los programas de televisin se detect que se vea una
telenovela en el canal 6 en un 28% de los hogares. En una muestra aleatoria de diez hogares,
halle Ia probabilidad de que:

a) en cinco hogares se vea Ia telenovela del canal 6;

b) ningn hogar est sintonizando la novela.


c) al menos en dos hogares se vea la novela.
16

En una instalacin militar que dispone de 5 radares, Ia probabilidad de que un solo radar descubra
a un avin de combate es de 0.7.

a) Cul es la probabilidad de que sean exactamente 4 radares Ios que descubren al avin?;
b) Cul es la probabilidad de que por lo menos uno lo descubra?;
c) De cuntos radares ha de constar la instalacin para asegurarse en detectar aviones al
menos en un 98 % de las veces?
17

IJna aeronave dispone de 4 motores que funcionan independientemente, la probabilidad de que


falle un motor durante el vuelo es 0.01. Cul es la probabilidad de que en un vuelo dado:

a) no se observen fallas?;
b) no se observe ms de una falla?
c) Si un avin puede seguir volando si al menos 2 motores continran funcionando,

cul es la

probabilidad de que el avin se accidente?


18

Supngase que ia tasa de infeccin de una enfermedad contagiosa es del 25 %. En una oficina
hay 10 personas que se vacunaron contra la enfermedad y ninguna se contagi.

a) Determine la probabilidad de que ninguna pelsona se hubiera contagiado

a pesar de que no

se hubiera vacunado;

b) De este resultado,
19.

deduce usted que la vacuna es efectiva?

La probabilidad de que un estudiante obtenga el ttulo de arquitecto es de 0.3. Calcule Ia


probabilidad de que de un grupo de siete estudiantes matriculados en primer curso:

4.6. Ejercicios
a) los siete finalicen
1.,)

131

la calrera;

l rnenos dos rcaben Ia carlr:r'a;

ha de ccinst-ir nna pronlocin para rsegurarse de qtte al rnenos uno


culmine sll carrera) corr una probabilidact clel 99 %?

c) .De currtos rh.rmnos

En un estudio rnedioarnbiental se deterniin que la plesencia de mercurio en el agua enveneua al


207o de los peces en 24 holas. Para confirmar el resultado se colocaron 20 reces en un tanque
con agua contaminada. Calcule ia probabilidad de que en 24 horas:

a) sobrevivan exactamente 14 peces;


b) sobrevivan por Io menos 10 peces
c) sobrevivan cuando mucho 16 peces;

d)

Calcule el nrmero de peces que se espera que sobrevivan;

e) Calcule la varianza del nmero

de sobrevivientes.

Una compaa petrolera va a perforar 29 pozos, cada uno de ellos tiene una probabilidad de 0.1
de producir petrleo de manera rentable. A la compaa Ie cuesta 100 mil dlares perforar cada
pozo. Un pozo comercial extrae petrleo por un valor de 5 millones de dlares. Calcule:
a) la ganancia que espera obtener Ia compaa

por Ios 29 pozos;

b) la desviacin estndar del valor de Ia ganancia.

Una lnea area, habiendo observado que el 5% de las personas que hacen reservacin no se
presentan para el vuelo, vende 100 boletos para un avin que tiene 95 asientos. Cul es Ia
probabilidad de que, el momento del vuelo, haya un asiento disponible para cada pasajero?
tl
-)

En un examen se plantean 10 preguntas a las que debe responderse verdadero o falso. Un alumno
aprobar el examen si aI menos 7 respuestas son acertadas. Qu probabilidad de aprobar tiene
un estudiante que responde todo al azar? Y uno que sabe el 30 % de la asignatura?

Leyes georntrica y binornial negativa


Cuando se graba un comercial de televisin, la probabilidad de que un actor recite correctamente
0.3. Cul es la probabilidad que el actor recite correctamente su dilogo
en la sexta vez?
el dilogo de su toma es

'l

En un examen el profesor real\za varias preguntas a un estudiante. La probabilidad de que el


estudiante responda correctamente a cualquier pregunta es igual a 0.9. El profesor interrumpe
el examen apenas el estudiante manifi.esta el desconocimiento de la pregunta hecha. Se reqr-riere:

a) formar la Iey de distribucin de la variable aleatoria que describe el nmero de preguntas


que realiza el profesor;

b) hallar el nmero esperado

-'a. La probabilidad

de preguntas que ha de realizar el profesor.

de que un tirador haga blanco en un solo disparo es igual a

0.2. Al tirador

se

le entregan cartuchos hasta tanto no yerre el tiro.


a) Forme

la ley de distribucin que describe el nmero de cartuchos utilizados;

b) Cuntos cartuchos se espera que utilice el tirador?

En un examen, en el que se realizan preguntas sucesivas, para aprobar hay que contestar correctamente a 10 preguntas. Suponiendo que el alumno sepa el 80 % de las respuestas, cul es la
probabilidad de que apruebe en las 12 primeras preguntas?

Captulo 4- Principales Distribuciones de Probabilidad

t32
28

Urra.jr,rgacloladctenisgarracl 33%delosrartidosqucrealiza. Ella.jrrgtrrtienLrntornr:omientlas


rro sea eliminacla por peldel r.rn partido.

a) Halle la probabilidad de quc sca elirninacla en cl segr-rndo particlo;


b) Si para ganar el torneo se deben ganar 5 paltidos consecritivos, ,cul es la probabilidad de
que la.jugadola pierda en la final del tornco?;

c)

.Cuntos partidos se espela que 11egue a

jugar durante cl torneo'?

29

{Jna marca de refrescos tiene impresas, en cada una de las tapas, una de las fi.guras de los 4
jinetes del apocalipsis, y quien retina la coleccin completa ganar' un premio. Si nn comprador'
cree qlre hay igual ntnero de figulas de cada uno de los pelsona,jes en la promocin, cuntos
refrescos ha de esperal comprar para ganar el premio?

30.

Un pjaro de cierta especie come gusanos de una poblacin muy grande. Estos glrsanos pueden
comer) a su vez) de una planta venenosa) de manera que si el pjaro come un gusano envenenado,
deja de comer gusanos ese da. Suponiendo que el 33% de la poblacin de gusanos come de ia
planta venenosa) hallar el nmero medio de gusanos comidos por un pjaro en un da.

31.

Un lepidopterista solo est interesado en los ejemplares de una clase de mariposas, que constituyen el75To de todas las mariposas de la zona. Hallelaprobabilidad de que estapersonatenga
que cazar 8 mariposas de las que no le interesan antes de encontrar:

a) un ejemplar

de la clase deseada;

b) tres

ejemplares de la clase deseada.

32.

En una fbrica, el departamento de contlol de calidad, revisa los lotes de piezas que entran, de
acuerdo con el siguiente criterio: se van extrayendo piezas sucesivamente y el lote es rechazado
si se encuentra Ia primer pieza defectuosa antes de la vigsima extraccin. Si conocemos que el
2% de piezas son defectuosas, cul es la probabilidad de que un lote sea rechazado?

t.f

En una fbrica, se examinan las piezas que salen de una determinada mquina. Supongamos que
si en una hora salen mas de 5 piezas defectuosas, la mquina debe ser recalibrada. Si suponemos
qrre la probabilidad de que una pieza sea defectuosa es 0.2, y es la misma para todas las piezas
fabricadas ; encontrar:

a) la probabilidad

de que se tenga que recalibrar Ia mquina cuando se han inspeccionado

20

piezas;

b) la probabilidad de que se recalibre la mquina sin haber producido ninguna


c) El nmero esperado de piezas que se deben inspeccionar.
QA

pieza buena;

Se sabe que) aproximadamente, el 20 % de los usuarios de Windows no cierran el programa


adecuadamente" Supongamos que el Windows est instalado en una computadora pblica que
es utilizada aleatoriamente por personas que actan independientemente nnas de otras.

a)

Cul es ia probabilidad de que el terccr usuario sea el primero que cierra adecuadamente
el Windows?;

b)

Cul es el nmero medio de personas que usan Ia computadora desde el momento en qlle
se enciende hasta que alguien no cierra el programa adecuadamente?

Ley de Poisson

35.

Sea

Y una variable aleatoria

que sigue una distribucin de Poisson de meda

),:2.

Calcule:

4.6. Ejercicios
a) Pr-(Y :4):
lr) Pr'(\/ 14):

133

c) Pr()' > 4);


d) PL(l' > 4lY >

2),

prornedio cle llrnaclas clue recibe urra ccntlal telcfrrica cn Lur rninuto es cle 1.5. Halle la
plolrabilidad de que en cuatro rninntos se rec:il;rn:

16. El

c)

a) 3 llamadas:
b) rnenos de 3 llarnadas;
J)1.

rro mouos tle crratLo

no rns rle sjclr'.

Snponga quc el nir.rnelo de pilcientes que ingrcsan a Il sala de emergerrcia de trn hospital cn la
noche del viernes tiene una distribucin de Poisson con media igual a 4. Evale las probabilidades
de que:

a) durante una noche haya exactamente 2 pacientes


b) durante la noche hayan ms de 3 personas.
38

en la sala de emergencia;

En un hotel, el promedio de pedidos de servicio a la habitacin es igual a 2 cada media hora.


Halle la probabilidad de que en una hora se reciban:

a)

b)

3 pedidos;

menos de 3 pedidos;

c) no menos de 3 pedidos.

19. Una fbrica de gaseosas recibi

100 botellas vacas. La probabilidad de que al transportarlas


resulte una botella rota es 0.03. Halle la probabilidad de que Ia fbrica reciba rotas:

a)

exactamente dos

botellas; b)

ms de dos;

c) por lo menos una.

El lrromedio de automviles que entran en un trnel en una rnontaa es de un carro cada 2


minrrtos. Si un nrmero excesivo de autos entra al trnel en un perodo corto de tiempo se genera
una situacin peligrosa. Encuentre la probabilidad de que el nrmero de autos que entran al
tirnel en un perodo de 2 minutos exceda de tres.
bacterias por mm3 de agua en un estanque es una variable aleatoria
con distribucin de Poisson de parmetro ) : 0.5.

Se supone que el nrmero de

a) Cul es la probabilidad de que en 1mm3 de agua del estanque no haya ninguna bacteria?;
b) En 40 tubos de ensayo se toman muestras de agua del estanque (1mm3 de agua en cada
tubo) . ,Qu distribticin sigue la variable Y: <<nmero de tubos de ensayo, entre los 40,
qlre no contienen bacterias>>? Calcule Pr(I' > 20);

c) Si sabemos qlre en un tubo hay bacterias,

cul es la probabilidad de que haya menos de

tles?
Urra planta ernbotelladora de refrescos tiene una mquina vieja para llenar botellas. La mquina
produce una ganancia de 100 diares por da de traba.jo; sin embargo, se descompone en promedio
2 r'eces cacla 10 das. Si )' replesentr el nrrnero de descompostur-as clurante el funcionamiento
de la rnquina y es el nrmero de das que traba.j lzr mquina, la ganancia generada por Ia
mqr.rina se expresa por G : 100 -50Y2. Dctermine Ia ganancia esperada en 10 das de trabajo.

En un poblacin el

por ciento de la poblacin sufi'e de daltonismo, cul es Ia probabilidad

de quc entre 100 personas:

a) ninguna

b)

padezca de daltonismo;

2 o ms Io padezcan;

Capitulo 4. Principales Disribciorres de Probabiliclul

134

<:) , CLtiirr grarrrlc <leltt scl lttrl lrrtt<lstlr alertolia (c:orr lecrrrl,lrrzo) lr,rrir (iri,, i,r lrlrrlr;rlrili,l'1, I ,lr,
rlttc al ltren()s turI l)oISorrr tcrrgl <lll rtrrisrrro sor llrirl()r o igrral t ().1.1i'
44

]llt tttt lrosrltte rlc c;eclt'o t:l rrru<:ro rk: ir'l>olcs <;orr plirgrr pol lrcclr'cr )' tj(,rlr, rrrr;r <[istr ilrrr i,,rr
Poissorr 2(10). Los itlolcs c:ort 1.,lir1r'r. se trrtrn con insccticiclt r urL co:jt() (lo 3 rlcilrr(.: l)()r
t'lol; rrlcrns. clr: urt costcl fijo. por rlso del r:quipo y tr'lir,jl)otte. igual r 50 clrilrr<ts. I{rllr,,'l

c-lr:

vaiol cspcrrclo y la dcsi'itciu


45

estrLclrr'<.lel cost,o

hectilcirs rlc lrosrlrrr'.

Para cl control cle calidacl de discos para corrrplrtadora se errrl)le un dispositivo clcctr'rrico <rrc
cltentr cl nirmelo de bytes defectuosos. Una marca de discos de computadora tierie rrrL plouLcr lio
<1e 0.1 bytes defectlLosos pol disco. Calculc el porcenta.je clc <liscos que:

a) rro tienen defectos;


b) tienen algrn defecto;
c) Halle la probabilidad de que ninguno
46

total C de firrnigai'5

de dos discos inspeccionados, rringuno tcnga defcctos.

EI nrmero de automviles que llegan a un estacionamiento, que tiene una capacidad de 12 rLrtos.
es una variable aleatoria que sigue r-rna Iey de Poisson, con Lln promedio de 4 pol hora. Si al
inicio del da el estacionamiento est r'aco,

a)

b)

cul es la probabilidad de que se llene durante la primera hcra?;


Calcule la probabilidad de que lleguen menos de 30 vehculos en un turno de 8 hor-as.

porlo menos 4

47.

Si hay en promedio, un 1 por ciento de zurdos, cul es la probabilidad de tener


zrirclos entre 200 personas?

48.

En una investigacin de mercado se detelmin que el 2 por ciento de Ia pobiacin torna regultrrrnente Llna marca de yogurt. Se escogi una muestra de 300 personas, determine Ia prolrabiii<ltrti
de que:

a) exactamente 5 personas tomen yogurt


b) a Io ms tomen 3 personas;
c) al rnenos tomen 5 personas.
49.

de esa marca;

La tasa mensual de suicidios es de 4 por un milln de personas. En una ciudad cle 500 000
habitantes, halle probabilidad de que:

50

a)

en un mes dado, hayan menos de 5 suicidios;

b)

Ser sorprendente que durante nn ao, al menos en dos meses ocurran ms de 4 suicidios.'

En estudios demogrficos sobre matrimonios que tienen algrn tipo de planificacirr farniliar. c,i
nmero X de hijos por matrimonio es igual a 2, salvo ciertas clesviaciones debidas al azar. St'
ha comprobado que, o bien

X:2-(Y+1),
donde Y es nna variable de Bernoulli de parm etro p

(pues se cr.rmple en el 50% cie ios matlimonios), o bien

X:2*
dorrde

sig:ue

0.3, y sto ocurre con probalriiiclact 'p ::


es

Z,

una distribucirt de Poisson de parmetro ,\; v esto seguudo ocul'r'e <:ou tarnbi(ll-

con probabilidact

p::.

Halle:

a) el valor de ), sabiendo que E(X) : 2;


b) la probabilidad de clue tur matrimonio

terrga Lrno o d.rs hijos.

4.7. Distribucin unifornte

4.7. Distribucin
-,r k)\' rlc <listiilnrc;irirr

135

uniforme

tLut'"'aliablc aleatoliir (:olItllIltt


L irrtcrr''-rlo lr. bl la funcirr rle clensirlad es constaute e igual a
cle Plolralrilitiacl

cler

rl,

I b-"
f(r): 4 =-1.

esta r.rriable aleatoria se la nota como

funcin de distribucin

sirf

[o.]

X -Ula,bl.

es

F(r)

sc llrrrr rr,rtli.fornte si e.t

si z e 1".]

I o,

-i

0,

b-o"'

,-o,

siz<a;
si(r <b;
siz>b.

1,

Figura 4.1: Funciones de densidad y de distribucin de una variable aleatoria uniforme.


a esperanza

y la varianza son iguales

a:

a*

E(x)

2'

(b

Var(X)

- ")'
t2

Esta ley es ei anlogo continuo de la distribucin uniforme discreta, que asigna igual probabilidad a
-da resultado de un experimento. Tiene amplia aplicacin en problemas de simulacin estadstica
-,-en fenmenos que presentan regularidad en su aparecimiento, pero qne no es posible usar variabies
-iscretas, como cuando dependen dei tiempo. Tambin, el error originado por el redondeo de un
---imero se describe satisfactoriamente mediante una ley unifbrme en el

interv.t" [-:,:l
L 2 2l

Ejemplos

i.

Una variable aleatoria

a) Calcular Pr(X

b) Hallar un valor
Solu,cin:

sigue una distribucin uniforme sobre

1),

Pr(X < 1.3), Pr(lXl <

de

tal que Pr(X >

1.
3'

1.5);

[-2,3].

Captulo

136

4.

Principales Distribttciones de ProbabIidacl

Ia funcin cle clensicla<I.


Salrcrnos <rer ./(r:) : 0 si t: ( l-2,31.

a) Estirnernos

a,: -2, :3;

Se ticrren los lnriters

La funcin cle densiclacl

por

1o

11
3-(-2)

c|re,/(z)

| .) .)l
l-:, 'l '

qr-recla as:

,f

pr(X

o Pr(x <

r)

1.g)

.[,'

: I t.sir-2,31;
I 0, sir(l-2,3).

(r)

,rrd.r:0.

porque

es una variable aleatoria continua.

: l'" f (r)d.r:
dr :0.66.
L,'!,
-m
.t

o Pr(lxl < 1.5)

b)

Pr(-1.5 < X <

1.5)

: ['

rtr[(r)dt

: l'
:l : 0.6.
r'rtr^,

Pr(X > ):

Calculemos

,'3

Pr(X

/m

/'oo
'
>L)
tf"ld.*:l)ar+l
I
'
.lt
,lt s
.ls

lrl3

o*

-t

t-l

Lblr.

3- :",corr

bntonces.

2.

lo crr l

r:

3.

Dos amigos, Roberto v Fernando, deben encontrarse en una parada de bus entre las 9:00 r
10:00 h. Cada uno esperar r-rn mximo de 10 minutos. Cul es la probabilidad cie que rro se
encuentren, si Fernando llegar a las 9:30 en punto?
Soluci.n: La variable aleatoria X que describe el tiempo de llegada de Roberto puede tomar
cualqniervalorentrelas9:00y 10:00hoentre0y60minutos. DemaneraqueX -Ula,b] ysu
f'ncin de densidad es
( :, si o ( < 6o;

/(f) :{

t'0

( 0.

caso contrario.

Puesto que Fernando llegar a las 9:30 o a los 30 minutos despus de las 9 y esperar a lo ms
10 minutos, Roberto no se encontrar con Fernando si llega de g:00 a rnenos de 9:20 o si llega
despus de las 9:40.
Entonces, la probabilidad de qne no se encrrentren

Pr[(0 <

<20) o (40 < X < 60)]

es

r -,, fuo d'


: l,l''o 6sdt
- .lno oo
t

11
5+5:o'667'

3. En una empresa falmcutica Lln proceso se detiene cnando deja de funciorrar un esterilizado:
hasta que llegue su repuesto. El tiempo de entrega f est uniformernente distribuido en nrinten'alo de uno a ciuco drs. El costo C de esa falla ' la parada complende un costo fijo d.
200 dlales de Ia refaccin v uri costo valiable que arlr-nenta en ploporcin a T?, de modo que

C :200 + l2T2

4.8. Distribucin exponencial


a) Ctrlculirr la probabilidrcl de qrre el tiempo de espela
b) Calcrrlar el costc esperirclo cle r-rna falla.

sea

cle:

r37
clos <las o rrts.

Soht,ci,<i'n:

a) trl tiempo de entrega

distribnido cle trno a ciuco clas, de rnodo que

est uniforme

o":lyb:5:

si1(<5;

f(t):

caso contrario.

As,

Pr(r > ,):


b) Por las propiedades
(E("))2:

l, f (L)dt: .[r'Lor:1,r - 2):X

de la esperanza,

E(C)

E(r'):
:

200*

I2F,(f\.

Calculemos

E("2)

: Var(?)*

ry.(+)'
(5-1)2-/r+s\':I
r2-r\,

:T

As,

E(c)

: 2oo + t, (+) : 2oo + t24: r24.

EI costo esperado de una falla es de 324 dlares.

{.8.

Distribucin exponencial

una variable aleatoria continua


si su funcin de densidad es

Se dice que
,,

sigue una ley de distribucin erponencial de parrnetro

sir(0;
f(r)-l lo,
)"-^', sir)o;

-rnde

es una constante

a funcin de

positiva. Notaremos como X

- t(,\).

distribucin correspondiente es

F(r):

?'- -\r,
"

sir(0
si r ) 0

Figura 4.2: Frurciones de densidad y de distribucin de urra r'rlirble rlcrtolia expoueucitrl.

138

Captulo 4. Principales Distribuciones de Frobabildad

La esperanza y la'r'arianza son iguales a:

E(x)

: +,

Var(x)

: I.\l'

Esta ley sLlrge en problemas de gentica, duracin de aparatos electrnicos o desintegracin lacliactiva
Tambin, es Ia principal en la teora de los procesos ie Markov.

Relacin entre las distribuciones cxponencial y de Poisson


Sea

X la variable que cuenta el nmero de eventos

que ocurren en el tiempo [0,] , con media ):

entonces,

Pr(X:

k)

:+.

k_ 0,t,2,...

Sea ? eI tiempo que transcurre hasta que sucede el primer evento de Poisson. El rango de
intervalo [0, -[ y su funcin de distribucin es

F7(t)

:Pr(? < t) : t- Pr(? > t) :1 - Pr(X -

0)

es el

: I"-^t,

donde el evento Q > t) indica que el primer evento de Poisson ocurre despus de , o lo que es io
mismo, que no ocurre ningn evento en el intervalo [0,];es decir, (T > t): (X:0).
Tambin, se tiene que

fr(t): F+(t): \.-t, > 0.

Ejemplos

1.

Una variable aleatoria continua Y est distribuida segn una Iey exponencial t(3).

a) Hallar la probabilidad del resultado de la prueba: Y


b) Determinar su esperanza y su desviacin estndar.
Soluc,in: Como Y

- t(3),
/(v)

0,

est en el intervalo (0.13;0.7);

siy<0;

Je-3a, si y )

0.

a) Determinemos Pr(O.13 < Y < 0.7):


PL(0.13

0'7

<Y <U.7) :

3e-3'! ily
.13

.55

b)

Se tiene que

E(v)

"(Y)

11
)

3'

: \;(n:

D ist r ibucin exp onenc

ial

139

El tiernpo dut'ante el cual las bateras para telfono cehrlar trabajan en folma efectir,a hasta que
frllan se distribuye sr:gur un modelo expouencial, cr)n Lrn tiempo promcdio de falla cle 500 holas.

a) Calcular la probabilidad de que una bater'a funcione por rns de 600 horas;
b) Si una batera ha trabajado 350 horas, cul es la probabilidad de que trabaje

ms de 300

horas adicionaies?

Solucin: Consideremos la variable aleatoria X: <<tiempo que dura Ia batera hasta que
Como

E(X) :500:

],

".'to'ces

X
# r -E(#).

):

F(r):
a)

Calculemos

( o,

{,_

"_rlsoo,

falla>>.

Sufuncindedistribucines:

sir<o;
siu )0,

Pr(X > 600):

Pr(x>600) : 1-Pr(X<600) :l-F(600)


: I - ( t- e-6oo/500'\ : 0.301.
\/
b)

Si la batera ya trabaj 350 horas, queremos conocer la probabilidad de que trabaje ms


de 650:

Pr(X>650): 1-F(650)
: :J;-;+
Pr(X>350) 1-F'(350)

Pr(X > 350 + 3001x .---/


> 350)

1-(1

'-650/500\

1-(116:o'54e'

El nmero de clientes que llega a una ventanilla de un banco sigue una distribucin de Poisson
con media de 4 personas por minuto. Cul es Ia probabilidad de que el primer cliente llegue:

a) dentro de los 30 segundos despus de haber abierto Ia ventanilla?


b) mrs de dos minutos despus de abrir la ventanilla?
Soluc'in: Tenemos las siguientes variables aleatorias:

X:

<<nmero de clientes que llegan a

T:

<<tiempo que transcurre hasta que llega el primer cliente>>,

la ventanilla>>,

X - P(4).
T

(4), con funcin de densidad

.fr(t):4"-nt, >0.
a) La probabilidad

de que eI primer cliente llegue en los primeros 30 segundos

Pr(?<0.5)' :

es

,.0.5

|
.lo

+"-n':0.86b.

Obsrvese que tambin se cumple que

Pr(? < 0.5) :

b)

-Pr(T > 0.5) - 1 -Pr(?:

0)

: t -e-4(0'5) :0.865.

Se tiene que

Pr(? >

,): I,

4e-atdt:

o.ooo335.

I4O

Captulo

4.9. Distribucin

4.

Principales Distribuciones de P robabilidad

normal

La ley de probabilidad de una variable aleatoria continua

f
donde

X se llama nortnal si s:.:t funcin

(') : -!'-''-u)212o2 r
'
,/2tro

es un valor real cualquiera

yd

es

e (-oo,

de densiclad

oo)

positivo. A tal variable aleatoria se notar como X

.M(p,o').
La funcin de distribucin correspondiente es la integral

F(r):

t/2""

"-(t-2lzo2

t.

Figura 4.3: Funciones de densidad y de distribucin de una variable aleatoria normal.

La esperanzay la varianza son iguales a

E(X):

p,

Yar(X)

Por esto, se dice que es una ley normal de media t


estndar de X.

:62

varianza

o2.

Observemos que la funcin de densidad de una variable aleatoria


a Ia recta r: IL.

Obviamente o es la desviacil

X - Jt(p,o2) es simtrica

respect,

Esta ley tiene amplia aplicacin en fsica, economa, ingeniera y biologa, pues como una primer,
aproximacin- se asume que los fenmenos siguen una ley normal. Tambin, juega un papel mr-l-.'
importante en toda Ia teora estadstica ya que, bajo amplias suposiciones, el comportamiento de lsumas de magnitudes aleatorias es aproximadamente normal, lo que constituye el Teorema del LmirCentral.

El nombre de normal fue aplicado a esta ley de distribucin por F. Galton en 1889, no sin reparos p-l
otros cientficos, porque este nombre puede hacer pensar a las personas que las otras distribuciont:
son) en uno Ll otro sentido, anormales. En el plano anecdtico, remitmonos a lo que se dice en =libro de Mosteiler, Rourke y Thornas (1970, p. 226) respecto al nombre de esta ley: <Algunas vecr:
la distribucin normal es llamada gaussiana, especialmente en la ingeniera y la fsica. En Francia =-.
llamada laplaciana. Estos nombres son usados, probablemente, porque la distlibucin fue inventac"
por de Moivre.>>
Un caso importante de esta ley de probabilidad se tiene cuando

F:0 y o2 :1,

que se denomi-:

t4t

4.9. Distribucin norrnal


,tttnol. cstti,tdot'(^/(0. 1)), sus funcicues cle clcusidrci y distlibucicilr sorr

^t-.\
7\:'

o(,)

n-"'2.

.1. <
.,
(-co. rc)

,ryi.

[__"

t'/2

cu,

:espcctir,aruente. Obsrvese qlre) en este caso particular, la funcin de densidad se nota mediante
-a ftrncin clc clistribucin por .

cp

Si se ticnc urra variable aleatoria X - N(p,,o2), pr-redeu calcularse los valores de su funcin de dis:rilucin lncdiante el empleo de la ley normal estndar aplicando la trausfolmacin

F(r\

:o l" - P\
\o

distribucin de la ley normal estndar no se puede dar como una funcin explcita, sino
de una integral, por lo que se emplean tablas, como la que se encuentra en la
en
forma
=tlamente
Tabla 1 del Apndice, para calcular los valores de O(z).
li-a funcin de

Si

X - Jt[(p,o'),

-na, dos y

se puede dar la siguiente regla emprica que da el rea bajo Ia curva


tres veces la desviacin estndar (ver Figura 4.4).

limitada por

Figura 4.4: reas bajo la curva de la distribucin normal.

l.

El rea limitada por el intervalo lp - o, p+ ol contiene un rea igual a 0.682.

2.

El rea limitada por el intervalo

lp-2o,tj-2ol

contiene un rea igual a 0.954.

3.

El

lirnitada por el intervalo

lp-3o,p"*3ol

contiene un rea igual a 0.997.

irea

Ejemplos

l.

La esperanza cle una variable aleatoria


ley cle la variable aleatoria y calcular:

b) Pr(X > a);

a) Pr(X < 3);

normal es igual a 6 y su varianza es 16. Escribir la


c) Pr(4.5

. * .r)t
{ ) : 0.9264.
.s 02 :16, por lo que o:4;

d) Encontrar el valor de de manera que se cumpla que Pr(X


SoLu,c'in:

La espelanza es E(X)

r@)

- lL:6 y la valianza

#r""p (

g#) : #".' (-q#)

etttottccs,

L42

4. Principales Distribuciones

Capitulo
a)

Calculenros Pr'(X

< 3):
Pr(X < 3)

b)

Calculernos

de Probabilidad

Pr(X >

F(3)

:. l+)
\4

(D(-0,75) :0.2266.

4):

Pr(X>4) : 1-Pr(X <4):1-F(4)


1-o(4-6) :t-o(-o.b)
,-o.s\aJ:o6er5.
c)

Calculemos Pr(4.5

Pr(4.5 <

< X <7):

X < 7)

F(7) -F(4.5)

(.:,'*) :'{0 ") - o(-0 375)

: ;f/)#
d)

Se tiene que

Pr(x < ):

rl-j)
\4)

:0.e264.

Por otro lado, en la tabla de Ia ley normal, se encuentra que (D(1.45) :0.926q; es decir,
cumple que

Entonces,

2.

t:

1.45

* 6:

11.8.

se

t'nu'

^u

El permetro craneal de los hombres, en una ciudad,

es una variable aleatoria de media 60 cm '

desviacin estndar 2 cm.

a)

b)

Qu porcentaje de los hombres tienen un permetro craneal entre 57 y 64 cm?;


Qu permetro craneal debe tener un hombre para que el 16.6 % de sus paisanos <<tengan
mis cabeza que l>>?;

c)

Y cunto para que el 35.2 To tenga menos?

Solucin: Se tiene la variable aleatoria X: <<permetro craneal de un individuo>> , X

a)

Buscamos Pr(57

N(60,22).

< X <64):

Pr(57<X<64) :

F(64) -^F(57)

:;,*-,);:fr)

:'"'

-o(-1

El9L% de la poblacin tiene un perfmetro craneal entre 57 y 64 cm.


b) Debemos hallar el valor de c de manera que Pr(X > n) - 0.166.

Pr(X

o l"

\2/

>z) : 1-Pr(X (r) - l-f'(r)


F(") : 1-0.166:0.834,

.60\ =

0.8s4.

:0.166,

5)

4.9. Distribucin normal


Por otro lado, eu la tabla de la ley
Entonces,

se observa que Q(0.97)

norm,rl estinclar

r-60 :

143

0.834.

0.97.

De donde, z:61.94cm.

c) Ahora,

hallemos

z tal que Pr(X < z) :0.352.

Pr(X <

o l"

r) : F(r) :0.352,

,60\ :

\2)

En la tabla leemos que O(-0.38)

:0.352.

Entonces,

z-60 :
Por tanto,

0.352.

-0.38.

:59.24cm.

En una fbrica de autos un ingeniero est diseando autobuses pequeos. Sabe que la esta[ura
de la poblacin est normalmente distribuida con media 1.70 m y varianza 02, con o :5cm.
Qu altura mnima debern tener los autobuses para que no ms del l% de las personas golpee
su cabeza con la parte superior del autobs?

Solucin: Sea X la variable aleatoria <<estatura de las personas>, X - N(t.70, (0.05)2). Denominemos h ala altura mnima para que la probabilidad de que una persona golpee su cabeza
con el techo del autobs sea del LTo; es decir,

Pr(X>h) :
Pr(X > h.)

0.01

1- Pr(X < h) : 1-

F(h)

- 1-. (%*p)

donde .F es la funcin de distribucin de la variable aleatoria

1-oln;=t:to)
0.05

\
/
:
oft-1'70\
-\
o.o5
)

Igualando los argumentos de la funcin


h

- r.70 :
0.05
:

X.

Ahora bien,

o.or.

r1-0.01
v'v! :o.ee.

da:
2.33.
1.70

+ (0.05)(2.33)

1.817.

Es decir, el ingeniero deber disear el autobs con una altura de 1.82 m.

En una ciudad habitan 150 mil familias, cuyo ingreso anual sigue distribucin normal con media
de 8000 dlares y desviacin estndar de 1200 dlares.

a) Cuntas familias tendrn ingresos anuales menores a 6600 dlares?;


b) El SRI dice que pagarn sus impuestos aquellas familias que se encuentren en el ltimo
quintil. A partir de qu ralor una familia debe pagar impuestos?
Solucin: Se tiene la variable

/:

<<ingreso

familiar

anual>>,

X -.A/(8000,12002).

l+J

Captulo
a) I)clrr:rlos

4.

Principales Distribuciones de Probabilidad

< 6600).

hrllrl lrr prol-ral-riliclacl Pr'(1

pL(1 6600) :

F(6600)

:*(6otlg---!0t10

o(-1.17) :0.12t.
EI 12.1%

1200 )

clc las faltrilirs tictrc ingresos anuales menores a 6600 cllares. Eso quir,.r'c clccir
x 150 000 : 18150 farnilias.

que sorr 0.121

b) Si buscarnos el riltino quintil de ingreso, qniere decir aquellas farrrilias r,re tienen el 207,
dc los inglesos nrs altos; o sea) tenem s que encontral rrn valor :: de nlancla que Pr(I >

r) :0'2'

>r) : 1-Pr(/ 1r):0.2,


I r) : F(r) : 1- 0.2 : 0.8,
o l" -,99!o) : 0.8.
\ 1200 )
Pr(I
Pr(/

En la tabla de la ley normal, \emos que se velifica que iD(0.84) : 0.8. Por tanto,

8000

1200

0'84'

Al resolver esta ecr.tacin, nos da r : 9008. Consecuentemente, el 20 % de las familias tiene


un ingreso superior a 9008 dlares anuales
Se tomaron <Ios exmencs sobre 100 puntos, crr el .rrimero se obtur,'o r1 :80, ot:4 y en esegundo p2 : 65, 02 : 5. Un cstrrdiante sac 84 en el primer exalnen y 75 en el segrrnclo
Cornparativamcnte, en cul de los exrncnes obtu.r'o rnejor resultado?

Sol'u,cirt: Deterrnincrllos, ptl'a cada examen, el porcentaje cle cornrarleros (lue


nota que 1, sabiendo qr.re

: 80,

Pr(X<8a)

Pr(X < 75)

ot,

: 4, FZ:65,

F,(84)

:t(91#)

F2(75): O (7S
\b/

02

src]r'on

rnclroi

:5.

:.,t,

:0.8413,

- 0S) : .(r) :0.9772.

Conro en el primer exarnen el porcentaje de compaeros que obtuvo menor nota es 84.73%o y e:
el segundo 97.7270, tuvo, comparativamente mejor resultado en el segundo examcn.

Una empresa ernbotella t'efrescos rnediante una mquina que envasa el lquiclo, con un nredia r
desviacin estndar de 10crn3. Calcular el valor de Ia media prra que solo se lebase la cantidade 310cm3 en elSTo cle Ias lrotellas, si se supone que la canliclad de lquido ernl-otellaclo tierr.
distribucirr nonn1.
-.

Sol'ucin: Sea
de r tal que

X:

<<la

cntidad de lquido embotellado>>, corr X

Pr(X >

310)

N(F,(10)2).

Se brrsca el,r,rlc,:

:9.65.

Ahola bien,

Pr(x > 310):

',(+, -#)

:v,(z,

Y)

4.70. Ejercicios
clorrde
que

- N(O,I).

Por la tabla de la ley normal, Pr'(Z

L45

>

1.645)

0.05, debindose cumplir

310-p:1.645.
10

As,

310

10(1.645)

293.55.

ElmarcadorqueindicaIacantidadmediadelquidodebeestarposicionadoen293.5cm3.<
En el Cuadro 4.7 se encuentra un resumen de las leyes de probabilidad analizadas en este captulo.

Uniforme discreta,

Hipergeomtrica

Bernoulli

# #(t-#)

-r
N-1

Ber(p)

Bin(n,p)

Binomial
Geomtrica

Binomial

'lt(N,n,r)

np

r-p

9(p)

negativa

p2

,,,L-p

BN(r,p)

P(^)
Uniforme continua

l/(a,b)
r(r)

Exponencial

(b

L2

;
^2

N(t",o")

Normal

- o)'

Normal estndar

^/(0,1)
Cuadro 4.1: Principales leyes de distribucin de probabilidad

4.10. Ejercicios
Ley uniforme

1.

Una variable aleatoria

tiene distribucin uniforme sobre

a) Pr(X:0);
b) Pr(X < 0);
c) Pr(lxl < 1);
Realice el ejercicio anterior considerando que

[-3,1].

Calcule:

d) Pr(lxl > 0.5)


e) Halle un valor de tal que Pr(X

)):-.

X - U[-3,2].

Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la probabilidad de


que se haya detenido en los primeros 25 minutos luego de sealar Ia hora en punto.

Captulo 4. Principales Distribuciones de Probabilidad

t46
4.

Los utobrrses de cierta lner salcrr c:on holario estricto cada cinco minutos. I{alle la plolrabilicliLrl
ckr cluc 1ul l)asa.jero c1r-rc llcga n lzr pzrraclzr tenga que esperar el rutobris nlclros cle tlcs rrtintrtos.

Al

L,.

cstrrcliu' las ofertas de contlatos cle ern'o, un fablicante de coml>utdoras ve que los cxlrtr'rtr.,clc los intelesados tienen ofertas que se distribuyen ltniformemente entre 20 nril y 25 nlil dlarcs

Calcule lil plobabiliclad de que el siguiente contrato sea:

c) Estime el costo medio de las ofertas

a) menor qre 22 mil dlares;


b) mayor qre 24 mil dlares;
6.

cr

contratos de este tipo.

Sqrngase que Ia velocidad de los autos en un sector de una carretera sigue urta ley uniforntt
entre 60 y 120 kmlh. Cul es la probabilidad de que un auto:

a) tenga una velocidad de 80 kmlh?;


b) tenga una velocidad menor que g5 km/h?;
c) tenga una velocidad menor que 70 km/h o mayor que 100 kmlh?
7.

El dimetro, z de un crculo se mide aproximadamente 5 1 r ( 6 cm. Considerando el dimetrc


como una magnitud aleatoria X distribuida uniformemente en el intervalo (5, 6). Halle:

a) la probabilidad de que el dimetro sea mayor que 5.8 cm;


b) la esperanza matemtica y la varianza del rea del crculo.
8.

Una llamada telefnica lleg a un conmutador en un tiempo, al azar, dentro de un periodo de


un minuto. El conmutador estuvo ocupado durante 15 segundos en ese minuto. Calcule la
probabilidad de que la llamada liaya llegado mientras el conmutador no estuvo ocupado.

9.

A partir de las

12:00 de la noche un centro de cmputo trabaja dos horas y para una. Une
llama al centro Lrn momento aleatorio entre las 12:00 y las 05:00 horas. Cul es Ia
probabilidad de que el centro est trabajando cuando llama la persona?
per-sona

10.

En una prctica de precisin area se deja caer una bomba a lo largo de una Inea de un kilmetrc
de longitud. El blanco se encuentra en el punto medio de la lnea. El blanco se destruir si la
bomba cae a una distancia menor que setenta y cinco metros del centro. Calcule la probabilidad
de que el blanco se destruya si la bomba cae al azar a lo largo de la lnea.

Ley exponencial
11.

Escriba las funciones de densidad y distribucin y los valores de la esperanzay la varianza para
Ias variables aleatorias que siguen una ley exponencial:

a) t(6);

b) r(3);

c) (0.5);

d) t(0.25).

12. Se prueban

dos elementos que trabajan independienternente. El tiempo de trabajo del primer


elemento tiene distribucin (0.02) y el segundo elemento t(0.05). Halle la probabilidad de que
en el tiempo de duracin t :6 horas:

a)
b)

ambos elementos fallen;

c) solo falle un elemento;

ambos elementos no fallen;

d) falle por lo menos un elemento.

13. La duracin (en minutos) de las

llamadas telefnicas de larga distancia desde Quito es una

variable aleatoria con densidad

r(t): {o;-,,,, :l ;:3f


Determine el valor de c y calcule la probabilidad de que una llamada dure:

4.70. Ejercicios

t47

rr) rnenos clc 3 rrrirmtos;

b) rrrs dc 6 rrriuutos:
c) errtre3y6nlinutos.
d) Calcule lzr esperanza de la variable aleatoria e interprete

su significado;

e) Si el ccsto clel minuto de las llarnadas telefnicas es de 40 centavos, cunto esperara un


usuario pagar por una llamada?

14.

La duracin (en aos) de la vida de los individuos de una poblacin humana se puede modelar
mediante una'r,ariable aleatoria con funcin de densidad

f (t)
a) Determine

:{

{oe-.t/ao,

0,

si > o;

si10.

la vida media de la poblacin;

b) Cul es la probabilidad de que un individuo no llegue alos 42 aos?;


c) Cul es la probabilidad de que una persona que tiene ms de 50 aos, supere los 65?
-o

Suponga que la duracin, en minutos, de una conversacin telefnica sigue una ley exponencial
de que Ia duracin de una conversacin telefnica:

eOlS). Encuentre la probabilidad

a) exceda los 5 min;


b) dureentre3y6min;
c) dure menos de 3 min;
d) dure menos de 6 min, dado que ha durado
6

Se prueban tres elementos que

ms de 3 min.

trabajan independientemente entre s. La duracin del tiempo

de trabajo sin fallo est distribuida segn una ley exponencial: para el primer elemento h(t) :
0.1e-0'1, para el segundo elemento fz(t) :9.2"-o'2t, para el tercer elemento /s() : g.3"-0'3t.
Halle la probabilidad de que en el intervalo de tiempo (0,10) horas, fallen:

a) por lo menos un elemento;

b)

no menos de dos elementos.

La escala Richter para medir la magnitud de los terremotos sigue una ley exponencial de media
2.4. Calcule la probabilidad de que un sismo sea:
a) mayor que 3 grados en

b) entre 2

la escala de Richter;

y 3 grados en la

escala de Richter;

c) El sismo producido en Ia India el 30 de septiembre de 1993 tuvo la intensidad de 6.4 grados,


cul es la probabilidad de que un sismo supere esta intensidad?

-5. El tiempo de duracin, en meses. de un tipo de resistencia elctrica


variable aleatoria

se expresa mediante una

que sigue una ley exponencial (0.5).

la probabilidad de que una de tales resistencias elctricas dure ms de 4 meses?


b) Si se prueban 10 resistencias elctricas, cul es la probabilidad de que ninguna dure ms
de 4 meses?
a) Cul es

c)

Cuntas resistencias se probaran para que con probabilidad igual a 0.9 se tenga al menos
una resistencia que dure mis de 4 meses?

4. Principales

Captulo

148

cl) Si el costo de produccin

Distribuciones de Probabilidad

cle una resistencia es

+ (30 - X)' , cul

es el costo espelaclo

de una resistencia?
19

El tiernpo 7 que se demora para completar una reparacin elctrica es una variable aleatoria
distribuida exponencialmente, con media 10 horas. El costo C de llevar a cabo este trabajo se
relaciona con el tiempo empleado mediante la frmula

C:100

+40T' +3T'2.

a) Calcule el costo esperado de la reparacin;


b) Con qu frecuencia el tiempo ser mayor que
20.

20 horas?

La duracin de los neumticos de una marca determinada siguen una ley exponencial cuyo
promedio es 30 (en miles de kilmetros). Calcule la probabilidad de que un neumtico dure:

a)
b)

ms de 30 mil km;
ms de 30 mil km, dado que ha durado 15

mil km.

Ley normal
21. Se tiene una variable aleatoria

con media 5

y varianza

16.

a) Determine su funcin de densidad.


b) Halle las probabilidades: Pr(Y < 6), Pr(Y > 4) y Pr(lYl < 3).

22.

Una variable aleatoria

a) Pr(Z <
23.

0);

est distribuida normalmente,

b) Pr(Z > 3);

^f(1,16).
c) Pr(lZl < 3);

Calcule:

d) Pr(lzl > 2).

cigarrillos es, para los fumadores, de 5 dlares diarios por trmino medio.
es de 0.8 dlares. Suponiendo que el gasto sigue una distribucin
proporcin
de los fumadores gastan entre 4 y 6.2 dlares diarios?
normal, qu
Se sabe que el gasto en

y que la desviacin estndar


24.

un medicamento que produce variacin en el peso de las personas que lo


toman. Pruebas de laboratorio han demostrado que al cabo de un mes la rrariacin del peso
sigue una distribucin gaussiana de media 2 kg y desviacin estndar 1.25 kg. Determine la
probabilidad de que una persona:
Se experimenta con

a) haya aumentado al menos


b) haya rebajado de peso;
25.

kg;

c) haya aumentado

menos de 3 kg.

La compaa area Helios sabe que el tiempo de retraso de sus vuelos sigue una ley normal, con
un retraso medio de 10 minutos y desviacin estndar 5 minutos. Calcule la probabilidad de
que:

a) un vuelo no tenga ietraso;


b) el prximo vuelo llegue con no ms de 12 minutos de retraso;
c) el prximo vuelo llegue con ms de 15 minutos de retraso.
26

La Cruz Roja ha determinado que tiempo necesario para que una de sus ambulancias llegue al
sitio donde hay una emergencia se distribuye segn una variable normal de media 17 minutos y
desviacin estndar 3 minutos.

t49

4.70. Ejercicios
ir)
lr)

(-i;rlr:rrlc lir
rrolral.,ilirlir,Irlc:

<Lrr:

cl tictttpo cle llcgrrcltr est cornplCncliclo cntrc 12 y 21 rnirrntos;

.1:'iLLirrrrrvirloltIr:1 tir:rrr-rri/. Iiiplol-rabi]iclrcl clcrlucIaarnbrriancizrempleerlsclc/rrtitrlrtos


r:rr llr:girr r:t rlcl ir',2 /

Los r:r'r'olcs rlc

clc pcso cle Ltna balanzl obeclccelr a una ley normal con desviacirt
y
cst inclrr' 20 nrg csl)cr irrza 0 rng. Hzrlle Ia probabiiidad cle clue cle tres niediciones iridcpendientcs,
el clrol tlc por lo rncnos una cle ellas no sea mayor) en valor absoluto, que 4 mg.
lr nrcclir:i<irr

Se aplic rrrrzr plueba clc fluiclez ver-bal a 500 alumnos de Educacin Bsica. Se supone que las
rtrrrtnaciones obtcnidas se clistlibr.ryen segrn Lrna rrornlal de media 80 y desviacin estndar 12.

a)
b)
c)
l9

Qu puntuacin separr
.A

partir de qu puntuacin

se enclrentr a el 45 % de los alumnos con mayor fluidez verbal?;

Cuntos alumrros tienen una fluidez menor que 76 puntos?

El per'metro craneal de los hombres, en medido en cm,

a)

b)

es una

variable aleatoria normal /(60, 4) .

Qu permetro craneal debe tener un hombre para que el 16.6% de sus paisanos <<tengan

ms cabeza que

rl.

cl25% de los alumnos con menos fluidez verbal?;

l>>?

Y cunto para que el25.2Vo tenga menos?

(C.I.) al cociente entre la edad mental y la edad real. Se sabe que


Ia ley de distribucin del C.I. es normal con media 0.95 y desviacin estndar 0.22. En nna

Se llama cociente intelectual

poblacin con 2600 personas se desea saber:

l1
JI

a)

.Cuntas tendrn un C.I. superior a

b)

.Crrntas tendrn

1.3'/; c) Cultas tendrn un C.I. entre 0.8 y 1.15?

un C.L inferior a0.77?;

Se va construir nn n)arco para montar una puerta. Qu altura mnima ha de tener el rrrarco
para que el 7%o de Ia poblacin tenga riesgo de chocar su cabeza al atravezarla, si la estatura de

la lroblacin estadistribuiclanormalmente, con media


i2

F:1.72m y varianzao2, con o:12cm?

La cstattrra de la poblacin masculina est normalmente distribuida con F

a)

L67 cm

yo

3 cm.

Cul es la probabilidad de que un hombre tenga una estatura:

(i) mayor que

167

cm?;

b) En una muestra aleatoria

(ii) mayor que 170

cm?;

(iii) entre

161

173 cm?

de cuatro hombres, cul es la probabilidad que:

(i) todos tengan estatura mayor que 170 cm?


(ii) dos tengan estatura menor que la media (y dos mayor que Ia nredia)?
El peso de las fundas de papas fritas producidas por una fbrica sigue una distribucin rrolmal
con media 12.8 onzas y desviacin estndar 0.6 onzas.

a)

.Qu proporcin de las fundas pesan ms de 12 onzas?;

b) .Qu proporcin de las fundas pesan entre 13 y T4onzas?;


c) Determine el peso tal que el 12.5 % de las fundas pesen ms qr-re ese peso;
d) Si el falricante dcsea rnantener la media en 12.8 onzas) pero ajusta la desviaciu
tal que solo el ITo de las fundas
desviacin estndar-?

pese rnerros

de 12 onzas,

estndar
valor
debe
ser
el
cle la
.cul

Capitulo 4. Principales Dstribuciones de Probabilidad

150
34.

OE
Ji,

<:strtr-rr't ct: lzr pobla,cin rnascrrlina y femcnina siguen leyes de distlibucin nclrrnal. La
rtascrtliut tirtnc t,1 - I.67 trl y 01 : 12crn v ]a fcnlr:nina" p2:1.55 In y 612 :10c1r. Se tice
urra 1rarcjir ert lt c:ual cl varlr rnicle 1.70tn y Ia rtru.ler 1.60rn. Cornparil,tir/amente) .cul cle los
dos es rns rlto Li:spccto a los miembros cle su sexo?

La

Los conductoles quc se fabricrn para utilizar en las computadoras deben tenel resistencias clue
varan entre 0.12 y 0.74 ohm. Las medidas de las resistcncias que produce Lrna compaa siguen
una ley de distribucin normal de media 0.13 ohm y desviacin estndar 0.005 ohm.
a) Qu porcentaje de Ia produccin de

la compaa cumple con las especificaciones?;

b) Si se usau cuatro de esos conductores en una computadora, cul es la probabilidad de qne


los cuatro cumplan con las especificaciones?

36.

Los tiempos de Ia primera avera de una mquina de cierta marca tienen distribucin gaussiana
con un promedio de 1500 horas de uso y desviacin estndar de 200 horas.
a) Qu fraccin de esas mquinas

fallarn antes de 1000 horas?;

b) Cul debe ser el tiempo de garanta que deba dar el fabricante si desea que solo se presentr
el \Vo de las averas dentro del tiempo de garanta?
37.

El promedio de las calificaciones de los estudiantes universitarios


media 5.4 y desviacin estndar igual a 0.5 puntos.

se

distribuye normalmente co-

a) Qu porcentaje de los estudiantes tiene un promedio de calificaciones superior a 6?;


b) Si los estudiantes que tienen un promedio inferior o igual a 4.9 abandonan la universidac
qu porcenta.je de alumnos desertar?;

c)
38.

al azar tres estudiantes, cul es la probabilidad de que los tres tengan r-:
promedio de calificaciones superior a 6?
Se seleccionan

En el grupo tnico A, la estatura de las personas (en cm) sigue una distribucin,Af(t6S;25): .,el grupo tnico B sigue una,A/(170;25) y en el grupo C una N(175;25). Los tres grupos tnio-
son muy numerosos.

a)

b)

Si elegimos una persona del grupo A, cul es la probabilidad de que mida ms de 160 cn
Si elegimos 10 personas al azar del grupo tnico A, independientemente unas de otras, ctes la probabilidad de que 5 de ellas midan ms de 160 cm?;

c) En una ciudad, el 50 To de Ia poblacin pertenece a la etnia A, el 20 % pertenece a la E '


el30% r'estante a la C. Si elegimos una persona al azar en esta ciudad y mide ms de ---

d)

39.

cm, cul es la probabilidad de que pertenezca al grupo tnico C?;


Si elegimos 10 pelsonas al azar del grupo B, independientemente unas de otras, icul
probabilidad de que al menos 5 midan ms de 172 cm?

a -"

Una mquina para llenar cajas de cereal tiene una desviacin estndar de 25 gramos sobrt *r
cajas. Qu medida debe indicar el marcador de llenado de las cajas p--.
que permita que ha5,a cajas de 450 gramos o ms durante elI% del tiempo? Se supone qu iiu
cantidad de cereal por caja sigue una ley normal.
peso de llenado de las

40.

La anclrura, en mm, de una poblacin de colepteros sigue una distribrcin N(p,;o2). Se esti
que el 77% de la poblacin mide menos de 12 mm y que el 84% mide ms de 7 mm. Halle
parmetros de Ia ley.

4.77. EI teoretna del Lmite Central

151

4.11. El teorema del Lmite Central


Exantiucrrtos el sigtrierttc teorcrua. clue tielc rrna importaucia fuu<lrmcntal. ya crc constitrrye el nexo
le cornuniclcin entre las teoras dc Ia probabiliclad y la cstac-lstica.

Teorema (del Lmite Central) Sean Xt, X2, .. ., X,,, n r'rriables aleatorias independientes,
,listribuidas con media t y varianzd 02, y que signen una ley de probabilidad cualquiera -no necesariamente la misma-. Se forma Ia variable suma

que tiene esperauza

E(Y)

Y:Xt]-Xz-+..-tX,,,
varianza Var(Y) : no2. Entonces,

aleatoria

-E(Y)

-np
o{n

Jv*@

riende hacia una ley de distribucin normal estndar, cuando

ii

la distribucin de la variable

n tiende al infinito.

teorema implica que si n es grande, se puede aproximar las probabilidades de Y utilizando que

pr(y r)

: pr (t

=';#)

* (T#)

.: la que Z es una variable aleatoria normal estndar.


:" Ia prctica, se asume que la aproximacin es buena si n )
=

25.

formulacin de este teorema es, en su forma ms elemental, debida a P. S. Laplace y fue demostrado
primer lugar, por Liapunov en 1901.

:--a-rlrosamente, en

Ejemplos

-.

Sean X1,

Xz,

...,

X1o, cincuenta variables aleatorias independientes que siguen

r
Pr(X
Calcule la probabilidad Pr (Xr + Xz

: r) rl8

+ .. . * Xso >

3i8

t/2

70).

Solucin: La esperanza y la varianza de las variables aleatorias son

E(X):
Entonces, si

Xt

+, Var(X,) : #

* Xz*.'. *X0,
E(v)

: 50x+:T,

Var(Y) :

31 775
bux6a:E'

la ley

irl

l'tittt it:ri,'.s fij.,l tilttt it;cs rlc l't,!.ltilitl;t'l

I'ri)

i{)

l-,1'

l-l t'osto rlitti,r rlc orcliu llll iullrltis lir,tl,) rurt'rrsto li.irr r[t: ]J0,l,rlalcs v rrn \alol \'uirl]le rlcl 30:.rlr: los ittgl'r's<ls. EI itrglt'so lier<'r ttrr,lisl Iilrrrr i,ilr unilr,r nrc t'r1r'r:5r0 l'250 dlales. a) Cirlt:rr1;r:
la rr,rltr,lrili,la,l rle (luc ('l ('()sto ([r: <lret.;rL rur :rrt()l)ris. rlruarrtr,S[ <lias. sllpele los 2500 cllares
lr) ;.C'rrrrtos rls rle ort'ta<:irirr s<:r'tr no('('s;uios r;tt;r (,lll(\ (()lr llrrir l)tol)l)ilidad cle 0.95. cl c()st,,li,,rlrct';u:ir'll sea .lo it,l Irrclr()s 2.li()

d<'larcs.'

.j,,lut:ittt: l)r.filtltu,'s l;ts sigrtir,ltlls

\':lt';rl,lcs;rlr':rlorrrs:

-\ : ltr;rt'so rli;rtir r rol r )l)('t;r( irlrr .lt:l rutol)rij: .\'

('' f'..1,r

!i;rl

i,,,lt',,)t

't

;t,'iritr,lr,l ;rrl,rlris:

C..'

.i0

/i;(). 2;01

0.:1.\.

Sr: t it'trt' rttc

l-tti,,!tt,'..
E(C:,

:,ll -- l).J :< 150 = iir.


((l .t)r ;< :'r:l:3:J.:J:J : .jlll

Vrrr(Cl;)

ii

;t) Slrr l' : I l',. r'l r'rtsl,r r[t,olrt'l:tci,ilr


r=l

trr,.tisrrrl

1500

Pr'()'>2j00) = i-

= llr)

Sctr

ilcl ittol)tis.

l.

l:,rttctrrccs,

- 31 x 75

\/300\,67
0.964S

- o (r.815)

0.0352.

U cl costo dt: ort'r';t<'irirr eu rr rls: r:rtorr('es.

ll valirlrk: rleatotia

z:ry_^/(o,t).
t/300{u,
.5r:

rL,l,r'rlllr,r rrirrr,r'eI r,;rlot rlc lr. tal (llrc [)l(.i > 2350) :0.95:

|,t({'>.]:l..-l(l)=i,,(z'ffi):'_*(,loo#'',):o.n'.
I'l'I;tttlrl.

3i(l - i l

yf.rt)tttT = -1'645'

i,

'r. rlsrrltil rlil(, ,r

.f:l

;:j. Ls rktcir'. sr: lrcfirsiti\Il 34 clrs.

4.77. El teoretna del Lrnite Central

153

til de uu componertte elcctr'uico se clistribuye exporencirlrnente con rnedia


dc 100 iror'rs. Apenas falla un cornponcrite, sc Io rcemplzrza con otro par:a contiulral'cl trtrbajo.
a) Caicular' la plobabiliclrcl c]e cre clurarrrte 210 clas sc necesiterr ms cle 36 cle esos cou]poncltes;
b) CLrntos de estos cornponeutes se necesitan para (lue duren al menos 4600 holas, con Llna
probabilidad dei 99 %?
StLportga qr.re la vicla

Soluci,n: Definamos las siguientes variables aleatorias:


X: <<Duracindeloscomponenteselectrnicos>>;
Y,r: <Tiempo

a)

total de duracin de n

X-t(llI00) yE(X) :o(X):100.

componentes>>;

Yr: i Xo.
,i:L

Se necesitan ms de 36 componentes durante 210 das, si la

vida til es menor a 5040 horas

(210 das por 24 horas). De manera que


Pr(Y36

< bo4o)

too) :
= r Itot,==tuj
\ 100y'36

:
b)

Se debe encontrar

Q'4)

0.9918.

n tal que P.(% > 4600) :0.99, luego

Pr(Y-<

4600)

Luego,
4600

r (ffi)

100n

o.ot.

-2.33

Lasolucindelaecuacirresn:64.5;esdecir,65componerrtes.<
-{proximacin de la ley binomial por la normal
l.n

caso particular del Teorema del

Lmite Central -conocido como teorema de Moivre-Laplace-, se


::esenta cuando todas las variables X son independientes, idnticamente distribuidas segn una ley
:t Bernoulli con parmetro p. Como sabemos, la variable

,:j*,
i=l

a.e una distribucin Bin(n,p), con media np y varianza npq) corr Q :


- -:cite
Central, la variable

I - p.

Por el Teorema del

Z_ Y-np
J"w

ii:re apl'oximadamente una ley normal estndar, cuando n es suficientemente grande; es decir,

pr()'<)

:pr

(ttffi)

=r (ffi)

la Figura 4.5 se muestra los valores de Ia distribucin binomial para n : 20 y p : 0.5. Para
:s:a distribucin, p:np:20x
0.5: I0y o2: np(l-p):20 x 0.5 x 0.5:5. Sobrepuestaa
; listribtrcin binomial se encueltra una distribucin normal con media F : !0 y varianza o2 : 5.

:r

l'-ramos qne la curva de la normal se aproxima mucho al histograrna de la binomial.

r54

Captulo

4. Principales Distribuciones

de Probabilidad

Figura 4.5: Aproximacin de la ley binomial por la ley normal.

En la siguiente tabla se presenta una relacin entre los parmetros n y p para que la aproximacin
normal a la ley binomial sea vlidaa.

n requerido
22t

0+
0.01
0.05
0.10
0.15
0.20

214
188
757

728
100

Otro criterio para escoger n es que el intervalo (o

\ -

dentro del intervalo (0, 1).

Ejemplo. La Superitendencia de Bancos

n requerido

0.25
0.30
0.35
0.40
0.45
0.50

pq
Z

74
51

32
16
13
13

,Pl2 T)

se encuentre completament

cree que el 32% de los crditos al sector agrcola estn e-

mora. En un estudio se tomo una muestrade2T0 crditos a la agricultura. a) Hallar la probabilidade que ms de 80 de ellos estn en mora; b) Cul es la probabilidad de que exactamente 95 cliente.
estn en mora?

Solucin: Sea X el nmero de clientes con crditos en mora; X

a) La probabilidad de que ms de 80 clientes

estn en mora

pr(X > 80) : pr(x > 81) :

Bin(270,0.32).

es

270

clro(0.32k10.68270-k,

/r:81

cuyo clculo puede ser muy complicado. Aplicando la aproximacin de la ley normal a la l.n
binomial, se tiene

p : np :270x 0.32 :

86.4, o : \MA :1mV

068 :

7.665.

Luego,

pr(x>80):
:

,,(t'

*q-#)

=r-*(tt#3-)

1-0.2033:0.7967.

aUna amplia discusin del tema se encuentra en


Samuels, M. y Lu, T.-F.C. (1992), "sample Size Requirements f
the Back-of-the-Envelope Binomial Confidence Interval," The Americon Statistician, 46, 228-23L, de Ia cual se extre!il
la tabla.

4.72. Ejercicios
b) La probabilidad

buscada es Pr(X

95)

155

C8?0(0.32)e5(0.68)270-e5

Si emplearnos el teorelna de Moivre-Laplace, resulta:

pr(X

:9b) :
:

pr(94.b <
0.8829

< 95.b) =o

- 0.8554 :0.0275.

195!:96a)
\ 7.665 )

Como se observa, la diferencia entre el valor exacto y el aproximado es mnima.

1.L2. Ejercicios
1.

En una caja se empacan 100 latas de conservas. Segn los datos de la fbrica, cada lata tiene
un peso promedio de 1 oz con desviacin estndar de 0.1 oz. Cul es la probabilidad de que
una caja pese ms de I02 oz?

Un borracho camina de forma aleatoria de la siguiente forma: cada minuto da un paso hacia
adelante o hacia atrs con igual probabilidad y con independencia de los pasos anteriores. Cada
paso es de 50 cm. Calcule la probabilidad de que en una hora avance ms de 5 metros.
.).

Los clientes de cierto banco efectan depsitos con media 157.92 dlares y desviacin estndar
30.20 dlares. Aparte de sto no se sabe nada ms acerca de Ia distribucin de estos depsitos.
Como parte de un estudio, se eligieron aI azar e independientemente 75 depsitos. Cul es la
probabilidad de que la suma de estos 75 depsitos sea 12 750 dlares o mayor?
Los vehculos que cruzan un puente tienen pesos cuya media es de 4675 kg y cuya desviacin
estndar es de 345 kg. Si hay 40 vehculos sobre el puente en un instante dado, halla.r el nmero
o tal que la probabilidad (aproximada) de que su peso total no supere a o sea del 99 %.

La empresa Rapid Express enva paquetes de distintos pesos, con una media de 1.5 kg y una
desviacin estndar de 1.0 kg. Teniendo en cuenta que los paquetes provienen de una gran

cantidad de clientes diferentes, es razonable modelizar sus pesos como variables aleatorias independientes. Calcule la probabilidad de que el peso total de 100 paquetes exceda de 170 kg.
6.

nr

El propietario de una copiadora ha determinado que el nmero diario de copias que se realizan
en su local tiene una media de 1250 con una desviacin estndar de 350. Halle Ia probabilidad
de que en un mes de trabajo (25 dfas) el total de copias:

a)

sea menor a 30 000;

b)

se encuentre entre 25000

y 32000.

Una radiloga que trabaja en el servicio de traumatologa de un hospital ha comprobado que el


tiempo, en minutos, que tarda en atender a cada paciente es una variable aleatoria con media
7 y desviacin estndar 2. Durante su jornada laboral trabaja 6 horas atendiendo pacientes
sucesivamente y sin interrupcin. Calcule, aproximadamente, la probabilidad de que durante un
dla pueda atender hasta 55 pacientes dentro del horario de su jornada laboral. Se supone que
todos los pacientes estn en la consulta con suficiente antelacin y que no hay <<tiempos vacos>>
entre dos pacientes consecutivos.

La resistencia de un hilo metlico es una variable aleatoria cuya media es 3 kg y su desviacin


estndar 1 kg. Suponiendo que la resistencia de un cable es igual a la suma de las resistencias
de los hilos que lo forman.

a) Calcule la probabilidad de que un cable de 100 hilos

sostenga 280 kg;

Captulo

156

4.

Principales Distribuciones de Probabilidad

b) Cultos hilos se rrecesital pala qr-re el cable


9.

Utr jugador de baloncesto encesta urr lanzrrniento de 3 puntos con plobal,'ilidacl 0.3.
a)

Aproxime la distribucin del nirmero cle canastas corrseguidas ert 25 lanzamientos;

b) Calcule Ia
10

sosterrga 300 kg corr urr gg% cle seguriclrci/

probabilidad de encestar ms de 10 canastas.

En promedio, de las personas que ingresan a una librera solo el 25o/o realiza una compla. Si
en un da entraron 80 clientes, calcule Ia probabilidad aproximada de que se hagan al menos 28
cornpras.

11.

Se ha encontrado que el 70% de las personas que entran en un centro comercial lealizan cuando
menos una compra. Para una muestra de 50 personas,

a) cul es Ia probabilidad de que cuando menos 40 de ellas realicen una ms compras?;


b) cul es la probabilidad de que menos de 30 de entre 50 personas muestreadas realicen
cuando menos una compra?
12

En una fabrica microcircuitos se ha comprobado que el 4% de estos son defectuosos. Un cliente


compra un paquete de 500 microcircuitos procedentes de la fbrica. Determine:

a) el nmero esperado de microcircuitos no defectuososl


b) la probabilidad de que se encuentre ms de 25 microcircuitos defectuosos;
c) la probabilidad de que el nmero de microcircuitos defectuosos est entre
13.

16

30.

Se conoce, por estudios previos, que Ia proporcin de vacas que enfer-marn despus de suministrarles la vacuna contra la fiebre aftosa es del 2To. Una granja tiene 600 vacas qtre sor
vacunadas. Determine:

a) el nmero esperado de animales

que no enfermarn;

b) Ia probabilidad de que el nirmeio de reses que enferman sea) como mximo, 17;
c) la probabilidad de que el nmero de reses que no enferman seaT como mnimo, 590.
t4. Un

zologo estudia cierta especie de ratones de campo. Para ello captura ejemplares de una
poblacin grande en la que el porcentaje de dicha especie es 100p.

15.

a)

Si p :0.3, halle la probabilidad de que en 6 ejemplares capturados haya al menos 2 de lo.


que le interesan;

b)
c)

Si

Si p

0.05, calcule la probabilidad de que en 200 haya exactamente 6 de los que le interesan:

:0.4,

calcule la probabilidad de que en 200 haya entre 75

110 de Ios que le interesan

el nmero de fracasos que preceden al 45" xito en un proceso de Bernoulli con proba^9a5
bilidad de xito P : 0.36. Sea ,5a5 : Xr * ' ' '* Xu, donde X1 representa el nmero de fracaso.
que preceden al primer xito, X2 es el nmero de fracasos entre el primer y el segundo xito. r
as sucesivamente. Las X son independientes.
Sea

a) D el nombre de la distribucin de una rnica X, obtenga tambin su media y su varianzar


b) Cul es el valor esperado y la varianza de ,9a5?;
c) Aproxime la probabilidad de que Sa5 est a una distancia no superior a 20 de su uredia.

Captulo 5
Distribuciones Multidimensionales de
Probabldad
EI supuesto errneo de que la correlacin irnplica causalidad es probablemente
uno de los dos o tres errores m,s serios g conlunes del pensam'iento humano
Stephen Jay Gould

;-,

muchos casos) un fenmeno aleatorio no depende de una sola variable, sino de dos o mi; por
- =:rplo, algo tan simple como el tiempo que empleamos en trasladarnos desde la casa a la universidad
l':!e61s, entre otras cosas, de Ia velocidad media del carro y del nmero de veces que nos detengamos
: -: los semforos en luz roja. Es decir, el resultado en la prueba descrita depende de, al menos, dos
--=:l ables aleatorias.

;-

.o que sigue, trataremos con conjuntos de varias variables aleatorias que se manifiestan simultnea- --te en un fenmeno y determinaremos si ellas estn o no relacionadas. Para simplificar la exposicin,
-jzaremos eI caso bivariante ya que Ia generalizacin a ms variables es inmediata.

Variables aleatorias bidimensionales


fefinicin (de variable aleatoria bidimensional)

Sean X y Y dos variables aleatorias unidi-=:rsionales deflnidas sobre un mismo espacio muestral f,); entonces, la funcin

r_F

LD

-+
r------

RxR
(X (r) ,y

(r)),

-'--,de w es un evento elemental, es una variable aleatoria bidimensional.

\,-rtacin. ParareferirnosalosoQtalesque X(u):ayY(w):b,simplernenteloharemoscomo


l: cL,Y :b y a Ia probabiidad de este suceso corno Pr(X : a,Y :b).
-e -,rrma anlogase definen y notan las probabilidades Pr(X < a,Y
,LJ I

b) y

Pr(a <

X < c,b <Y < d).

158

Captulo

5. Distribuciones Multidimensionales

5.1.1. Variables bidirnensionales discretas


Definicin (de variable aleatoria bidirrrensional discreta) Sean X y I/
tlis<:r'etrs. La fur,cil dc 1-nobrrbilidaci conjrrrrta de X y Y est clacla por

f @,a): Pr'(x
A Ia variable aleatoria (X,Y)

: r,Y :

clos rrrlialrlcs rlcrtorirs

Y)'

se le denomina bidimensional discreta.

Sea? : {(r, eFr2l @,y) > 0}; es decir, el conjunto de puntos con probabilictad positiva, es finito
o infinito numerable y se cumple que

f (r,a)

L.

(x,v)eT

Supongamos

quezl, 12...y At,Uzr...


Pt

son los valores posibles

:Pt(X : ri,Y :

deX y Y, respectivamente, ysea

Ai)'

La probabilidad del evento (X,Y) .E es igual a la suma de todos los p para los cuales (r,y) E:

Pr(X:ri,Y:yj):

Pr[(X,Y)eE): t

(t,v)eE

Definicin (de funcin de distribucin conjunta) La funcin


variable aleatoria bidimensional (X, Y) se define por

F(*,:

Pr(X

p,j.

(r4,y)eE

de distribucin conjunta de la

I r,Y < a) : | | nti


r1r y1y

La funcin de distribucin conjunta cumple qrru

,IToo rfT."

F(r,a)

0 y q"e

,lgg rlIg

(",

u)

r.

A partir de las p,; se pueden encontrar las funciones de distribucin de X y de Y.

Definicin (de funcin de probabilidad marginal) Las funciones de probabilidad marginal


X y de Y estn dadas por las frmulas

de

fx(r)

: i"r," :r,y:uj) :DPo'


j:r
j:r
oo

fy@) : f erlX:r,y:aj) :DPn'


i:l
i:L
Las fnnciones de distribucin marginal

Fx(t):

Fx y Fv

x,4t

Drnt

j:l

Observacin. Si los espacios muestrales

son

se calculan por

Fy(t) : llnt
A<t i:I

finitos, las series deben reemplazar,je por sumas finita-s

5.7. Variables aleatorias bidimensionales


,l'on

rq,1161

"rlerrtc

cle r'rriallcs ak:torias bicliurcnsiouales se ruecle

r lr autetiot'trlclttc

159

clal uut defrrricin cle iuclependerrcitr

e<1tti-

clrclir:

Definicin (de iudependencia)


Pr'(X

Lrs vrlirbles rleatolias clis<:r'clt,rs

: r.Y :

y)

:Pt'(X : z) x Pr(Y :

X y Y son inclepenclientes si
9;.

Ejemplos

1.

Determine el valor de k para que la funcin

f @,A)

- krA, para r : !,2,3; A :1,2,3,

pueda servir como una funcin conjunta de probabilidad.

Solucin: Sustituyendo los valores de z y de y, encontramos que:

/(t, t : , f (I,2) :2t, /(1,3) :

:2t, (2,27 :4,


(3, t : 3, f (3,2) :6,
"f
f (2,t)

3P,

f (2,3) :6t,
,f (3, a) : 9.

Para que / sea una funcin de probabilidad, la suma de todos los trminos que acabamos de
calcular deben dar 1; es decir,
k

+2k+

3k

+ 2k + 4k + 6k + 3k + 6k*

Resolviendo esta ecuacin, resulta que

/c

94.

1.

: :
36

Pongamos en una tabla la funcin de probabilidad resultante:

X
Y
1

2136 4136
3136 6136

2
3

2.

r/36 2136 3136


6136
e136

Las probabilidades de la distribucin conjunta de las variables aleatorias S y T se dan por

s
T

-1
1

-1

r/8 r/t2

7124

5124 116 Llg

La interseccin de las filas y Ias columnas da la probabilidaA p : Pr(S : i,T : j) (i : -I,


0,l; j - -1, t). u) Calcular Pr(S I 0.5, ? a 0.9); b) Hallar las leyes de las variables aleatorias

svT.

Solucin:

a) De acuerdo a la frmula de la funcin


F(s, )

de distribucin conjunta de

Pr(^9

1 s,,T < t)

:lln,i
i<s j<t

^S

y ?:

5.

Capitulo

160

Distribuciones Multidirnensionales

Entonces,

F(0.b,0.3)

: I tPr(^9:i,T:
j<0,3
<0.5

: Pr(S : -l,T : 115


8-12:i4'
b)

-1) + Pr(S

:0,7 -

Por la frmula de la funcin de probabilidad marginal tenemos: f s(i)

-1)

: !

Pr(S

'i.,7

j):

por lo que

/s(-t) : Pr(.9: -7,7- -1) +Pr(S- -1,7 :l)


151
B' 24 3'
/s(o) : Pr(,s: 0,7 :-1)+Pr(S:0,?: 1)
111
12' 6 4'
/s(t) : Pr(S : l,T :-1) +Pr(,$: I,T :I)
I

7r5
: %E:

De manera anloga, se obtiene la ley de

/r(-t) : Pr(^9: -l,T:


1171

12'

?:

-1) +Pr(^9:0,7: -1) +Pr(^9:1,7: -1)

ll

8-12-24-t
:
: -1,7 :1) + Pr(S :0,7:
Pr(.9
fr!)
5 *1*1:1
: 246- 8- t'

Entonces, las variables aleatorias S

-1

1)

Pr(^9

7,7

:1)

y T siguen las leyes:

l-r
Pr(T: j) I rl2

01

rl2

5.L.2. Variables bidimensionales continuas


Definicin (de variable aleatoria bidimensional continua) Sean X y Y dos variables aleatorias continuas, a la variable aleatoria (X,Y) se le denomina bidimensional continua si para cualquier
punto (r,a) < R2 se cumple
Pr(X : T,Y :9) :0.
A la variable aleatoria (X,Y) est asociada una funcin no negativa
conjunta, que cumple con Ias siguierrtes propiedades:

1. f (",

es no negativa; es decir,

2. .J_-.l_*"
[* l'* I@,y)
' " d,y d.r :
3.

V(z,g) e R', f @,

>_

/,

denominada fu,ncin, de densida,:

0.

t.

La probabilidad del evento ,r(X,Y)

-B>>

se calcula mediante

Pr[(X, Y) e E]:

l.l
E

f @,a)

d,y d,r

5.7. Variables aleatorias

bidrnensionales

161

Definicin (de funcin de distribucin conjunta) La ftrncin de clistribucitt


.-riable aleatoria lidinrerrsioral (X. Y) sc clefine por

F(r.y):

Pr'(X

1.r.Y < s) :

,IToorIT." F(r,y):

-.

funcin de clistribncin conjr,Lnta curnple q.l"

-.

funcin de densidad conjunta puede obtenerse a

tI4

[a, b]

x lc,d),la probabilidad

del evento

(tLd's'

y que

:1.
,ULJIL F(r,u)

partir de la funcin de distribucin mediante

F(r,y)

o2

'tl J -.l \&r Y


-

-.i E

l_*rr',t)

corr.juntr de la

or oa

(X,Y) E

es

igual a

db

Pr(a<X<b,c<Y< o):

Il"f

@,y)d,rdy: J

,o,fid,rd,y

Definicin (de funcin de densidad marginal) Las funciones de densidad marginal de las
-.-ariables aleatorias X y Y estn dadas, respectivamente, por las relaciones
/'oo

fx@):l
.l

-a

v fv(a):l,l

l@,a)da

-*

f@,a)tu.

-\ partir de stas, se calculan las funciones de distribucin marginal Fy y Fy:


toooo

Fx(t):

lon

este

"[

f@,y)dyd.r

tipo de variables aleatorias tambin

Fy(t):

se puede

If@,s)d,rd,y

reformular la definicin de independencia.

Definicin (de independencia) Las variables aleatorias continuas X y Y son independientes


rara todo par de valores (",a) e R2 se cumple

si

F(r, : Fx(r) Fv(a),


r equivalentemente,

f (r,v)

f x(r) fv(v).

Ejemplos

1.

Un crculo de radio o est inscrito dentro de un cuadrado cuyo lado tiene una longitud de 2a
(vase Ia Figura 5.1). Se supone que Ia probabilidad de que un daldo arrojado hacia el cuadrado
es idntica para cualquier punto. a) Calcular la probabilidad de que el dardo impacte dentro
del crculo; b) Encontrar las leyes marginales de X y de Y.

Captulo

L62

5. Distribuciones

Multidirnensionales

Solucin:

a) La probabilidad

de impacto esta definida por la densidad

xv(r,o)

: { *"'' si (r'a) e l-o'o) x l-a'a);


[ 0, si (r,a) (,1-o,o] x l-a,a).

La probabilidad de impacto dentro del crculo *2 + y2 -- a2 se calcula como


Pr(x2 +Y2

b) Por simetra,

f @,a)d,rdy:#:;
ll
,2y2-q2

las funciones de densidad de

f x(d

2.

< o2):

X y de Y

L *'r:
l'"
_o 4az

:,
2a'

son idnticas; calculemos la de

X:

r e l-a,a).

Dada la funcin de densidad conjunta de Ia variable aleatoria bidimensional (X, Y)

(t

fxv(r, : I r\2'

I O,

si

r ) L'Y'- li

caso contrario.

Determinar: a) las funciones de densidad marginal de cada una de las variables; b) la funcin
distribucin asociada.
Solucin:

a) Las funciones

de densidad marginal son

f x(r)

fv(a)

[*t f *r(r,y)

da

: .lt[* +
:
rU' ay 4.

lr* *rlr,e)

dr

lr*

o,

i.

Adicionalmente, podemos deducir que las variables aleatorias son independientes.

b) La funcin

de distribucin

F(*,y)

es

.lr' Ir"

,*r(s,

)ds

: (#) (")

or:

Ir' Ir"

oro,

Consecuentemente, la funcin de distribucin queda como

f (t-Xt-v).
Fxv(x,y)={
ra ' sir)1,
I O,

y2L;

caso contrario.

de

5.2. Dstribucin

5.2. Distribucin

condicionada

163

condicionada

Definicin (de probabilidad condicionada) Sean a y b dos nmeros reales cualesquier a y X


y Y dos variables aleatorias de manera que Pr(Y < b) + 0. La probabilidad condicionada de que
X 1 a, dado que Y < b, se representa mediante Pr(X < alY < b), y se defi.ne mediante la igualdad
Pr(X < alY <

Pr(X < a,Y <b)


Pr(Y < b)

Para variables aleatorias discretas, Ia probabilidad condicionada de


variable y, est dada por

Pr(X

b)

:
: at
,, -P'(I:^!'Y
Pr(Y:Y

rlY
'

u)

r,

para un valor fijo de la

Para variables aleatorias continuas, la funcin de densidad condicionada de


de la variable g, se calcula por

f @la)
Como fv(a)

l*_rr",a)

d,r

,@)',)

r, para un valor

TY\A )

: l_ f (al")f x@) dr; entonces,

f (alr)f x(")

f(,(rga)

f@1

-'x

f (al")f x@) dr

que puede interpretarse como el teorema de Bayes para funciones de densidad.

Ejemplos

1. (Continuacin)

Un vector aleatorio bidimensional sigue la ley:

X
Y
1

Hallar la distribucin condicionada de

1136 2/36 3/36


2136 4136 6136
3/36 6136 s/36

cuando Y

:2"

Y
I t
Ladistribucinmarginalde)e
La distribucin condicionada de X cuando Y :2 ser:

Solucin:

Pr(X

Pr(X

Pr(X

:
:

LIY

2lY

- 36:1
1 - 6'

:2) :

:2 :

Pr(X : 2,Y :2)


Pr(Y :2)

3
4

-361

:3lY :2) : Pr(X :3,Y :2) :


Pr(Y: 2)

3'

3
6
1
-AO.

2'

fijo

Captulo

164

2. La 1ey de densidad

5. Distbuciones Multidimensionales

conjurrta de una variable aieatoria bidirnensional (X, Y)

es

, f 2, si0(r1).,0<y<r,rly<r;

r'\r \ /: I .0,
"fxr'(r,ll)
L

casoconl,r'ario.

Hallar la ley de distribucin condicional de Y

cuando :

20.

Soht,c'in: Se tiene que

:2(I

dr

_ y).

La distribucin condi

, Para0(rlr-ao;

f@lao)

5.3.

caso contrario.

Esperanza y co\arianza de una rariable aleatoria bidimensional

Al igual que en el caso de las variables aleatorias unidimensionales, en las bidimensionales es posible
calcular la esperanza y la varianza, previa la realizacin de una transformacin de variables.
Definicin (de esperanza)

Sean (X,

Y) un vector aleatorio bidimensional y g(r,y) una funcin

real

g iPt2 --J

@,a)

1.

Si (X,Y) es un vector aleatorio discreto, cuya funcin de probabilidad es /(z,g), entonces

E(g(X,

2.

'-

R
g(r,a).

Y)):

ttri

s(ri,yj) f (*,a): tD,s@,,a)p.


ri

aj

yj

Si (X,Y) es un vector aleatorio continuo, cuya funcin de densidad conjunta es /(r, A), entonces

E(g(x,Y))
Observemos que si

XyY

l:l:s@,a)

r@,a)d,vd,r

son independientes, se deduce que

als@)n( )l : E[g(x)]Eth(Y)1.
Para las variables aleatorias bidimensionales se tiene una medida estadstica nueva, ia covarianza) que
permite evaluar la relacin entre Ias variables aleatorias X y Y.

Definicin (de covarianza)

Sean

X y Y dos variables aleatorias, Ia covarianza

calcula por

Cov(x, Y)

E[(x

- E(x))(Y -

Equivalentemente, la covarianza se puede calcular como Cov(

Propiedades.

entre

XyY

E(Y))].

X,Y) : E(XY) - E(X)E(y).

(Solo se demostrar una de ellas, se recomienda al lector verificar las restantes)

se

5.3. Esperanza

1. Cor'(-X. )') - Cor-()', I).


2. Cor'(X,,{) : VaL(X).
jJ. Si rt v (2 sorr dos colrstaltcs

Si

1rs

165

Positiv:rs, cutouccs

Cor'(a1X1

1.

.y covarranza

I^:?,Yr,\')

o,t

Cov(X1,l')

a,2Cov(X2.\/),

r'rriables aleatorirs son independientes, Ia covaliarrza entre elias es igual a cero.

En cfc<;to,

:E(xY) -

Cov(x,Y)
lCov(X,}/)l < 1/Yar(X

-\ contirmacin,

Var

E(X)E(Y)

E(x)E(v)

- E(x)E(v) :

0.

(Y)

se deduce una expresin para la varianza de la suma de dos variables aleatorias

'.ralesquiera.

Var(X

+Y) : E(x+Y)' -[e(X+Y)]2


: E(X') + E(v2) + 2E(XY) - [E2(x) + E2(v) + 2E(x)E(v)]
: [E(x') - E'(x)] + [E(y2) - E'(v)l + 2[E(xv) - E(x)E(v)]
: Var(X) +Var(Y) *2Cov(X, Y).

.is. partr dos variables aleatorirs cualescluiera se tiene que

Var(X +

le

ruarrcrr sinrilar',

var'(Xl') :

y) :

Var(X) + VaL(Y)

2Cor'(X, Y).

la 'n'arianza del producto de dos varialles alertorirs

X y l'

es

pf..Var(X) + pk|X)Var(Y) t2tyt.,..Cor,(X, Y)

+2prD [," - /-x)(l'- tr.)']


-t2r.,-E
[t" - rtt) (X - ui')+ 2E i(x - ttx)2 (\' - r,t-t2] - [co"{ x,Y))2
,

--,trde

r_y: E(X) y Fv: E()').

la covarianzay Ia varianza se define el coeficiente de correlacin, que es una medida


- dependencia entre las variables aleatorias X y Y.

-',.-,n

base en

Definicin (de coeficiente de correlacin)


r: colrelacin entre X y Y se calcula por

p(x,v :
Fropiedades.

-. p(x,\') :

X y Y clos variables

el coeficiente

Cov(X, Y)

(Se lecoinienda que el lectol verifique algunzr cle cllirs)

p(\" X).

l. El r,'rlol clel cocficieute cle con'elciu


-r. Si )'

Sean

de

varr entre

st: cxprcsa lincrlnrenbe err funcin de

crltorICCS lf(X )-)l :

-1

.y 1; cs

X, pol Y :

a,X

clecir', -l < p(X,y) <


, donde

cr,

1.

b son dos constantes,

4.
5.

5. Distribuciones Multidirnensionales

Captulo

166

si lp(X,Y)l
si

X ), \'

:1,

errtottces cxiste clePeudc:ncia lirreal

entlc X y

sorr vr'iablcs rlcrtolir.s irrcleP<tnrlicntes, entou<;us

Y-.

p(X,l') :0.

Observacin. Se debc tener en cucnta cre si clos rraliables aleatolias sorr independientes, cntoncc.
son no correlacrionadas; pero la afirmacin rccrroca no es correcta; es decir', si dos variables aletoriar.
no estn <rorrelacionadas, uo son obligatoriamente inclependientes.
Ejemplos

1.

Las variables aleatorias

,S

y 7 tienen funcin de probabilidad conjunta dada por

s
T

-1
1

-1

r/8 r/12

1
7

/24

5124 116 rl8

Calcular: a) las esperanzas y las varianzas de S y de T; b) el coeficiente de correlacin.


Solucin:

a) Anteriormente habamos calculado las

l-r

leyes marginales de ^9 y de

?,

que son:

-1

Sus correspondientes esperanzas son

:
E(s2) :
E(s)

,-', () * ror (i) *

(i) * (o)' (i)

(-t)'

E(") : (-') (;) * (') (;) :

E(r\ : (-')' (;) * (')'(;)

_1 I.
-

En consecuencia,

Var(s)

E(^9')

-E'(s)

Var(") : E(T') -E'g)b)

:#-(+)' :H,
1

Calculemos, en prirner lugar, la covarianza entre S

E(S")

: ftiip(i,i)
?,J

:
:

-02

1.

y T, para ello determinemos E(^9?):

(i:-r,0,1; ,:-t,t)

(*) . (-1)(,) (;u) . (o)(-') (#)


+(0)(,) () . (1)(-1) (h)* ('x') (*)
(-1)(-1)

157t1
8 24 24'8
--I

4'

5.3. Esperanza y covarianza

1.67

Por Io tiurt,o,

Cov(S',7)

E(sr) -

E(S)E( T)

_'i_

( ;) (o) :-1

Con toCo esto.


Cov(.S,7)

p(s,ll) :

-?
-+:
t/toz

(i#) .'
2.

-0.29.

La funcin de densidad conjunta de las variables aleatorias S y T est definida por

txv\r,
/ Y), : 12, si0(r.-I,0<y<!,r*a<L;
t o, caso contrario.

Hallar la correlacin entre

X y Y.

Soluci,n: Anteriormente determinamos que

f x(")
y varianzas

Sus esperanzas

:2(I - r) y

:2(t - a).

fv(y)

son

E(x) :E(Y)

:* y

Var(X)

:vur(Y):*

Tambin,

E(xY)

Cov(X, Y)

.[ot-'

lo'

Entonces,

E(XY)

2ry

d"y

d,r

: n
1

111
- E(X)E (n : + - 3"3-

36

De manera que

P(S,T)

Cov(^9,

T)

2'

Notemos que estas dos variables no son independientes.


Determine la correlacin entre las variables aleatorias

x,y. (r,
donde lRl

<

X y Y, cuya densidad conjunta

R2D
+u2
: L2"ffie
-L"-G'2 \-'o -2RLa) / QQ- ,

es

.@<r<oo, m(g(m,

1 (a esta ley se le denomina normal biuariante).

Solucin: Calculemos Ias funciones de densidad de cada una de las variables aleatorias.

: l:
2n

1ffi"

-u2/2

l'*

J-*""-@-no)2/eG-R2D

dr.

168

Captulo
IJrr:irtrrrLo

:-. ll

,/

5.

Lt

: t' r/,r' tt: l-./,,\) tt t

't

'

Distribuciones MultidimensionaJes
,/

t - ll.2dz.

I .'tt..2t:., / .: /, ,
I Ct/-,la:-,
- )tT'
.l -^
: j:e

AniiLogarrrente, se clcteluritirqrrc./tt)

A p;rltir

<[e

sto, es ficil I'ctificar que

Encorttlerrros la

Cor'(X.

crtcotttrarLtrs:

v !7t

7
rf-'l-

,,.,.tz.
t :t
-)O<r<

'tt12, -co < r <

\.

oe.

E(X) : E(y) :0 y que Var(X) : Var(]') :1

cor'rlirttzr:

Y) : E(Xi') =

h'[-

E(X)E(Y)

l:l:rurxv (r,y) rlr

o"-o'''(l: J';I _H
1

- r-

Ry)2 I

d'y

Q(1-R2)) ar\ y.

La integral interior es igual a Ry; por lo tanto,


Cov(X,

]-Jr;

\:

Con todo esto,

p(x,Y):

5.4.

d,a:

.[*_r'"-t"/2

Cov(X, Y)

vry"rEtrcn

R.

: R :R.
1.1

Variables aleatorias multidimensionales

Los corrceptos descritos, r'liclos prrra variables aleatorirs biclirnensionales, se pneden generalizar r.
vcctorcs aleatorios de cnalcriel dimcnsirl; por lo tanto, solo vamos a exponer las definicioles d.
mrnerl r-esumida.

Definicin (de variable aleatoria multidimensional) Sobre un mismo espacio muestral l)


estn defrnidas lasl'ariables aleatorias Xt, Xz, ..., Xn, entonces, se dice q.ue Z :(Xt,Xz,...,Xn)
es un vector aleatorio o una variable aleatoria n-dimensional.

Si Xl , Xz, ..., X, son variables rleatorias discretas, el vector aleatorio Z es discreto y su funcin
r'obabilidad es

.fz(r,

"',r,'.) : Pr(Xt : t7.'.,X,, :

ci

r,,).

Si Xl. ... ,X, son r'rriablcs rlcrlolias continttas, el vector aleatorio Z es cotttittuo y la probabilida.dcl cvento u(Xr, ...,X,,) e E C R">> se calcula por

: I
l' .[z(rt,...,r,,) d.r1...dr,,.
'.1.1""'

PL[(X1,... , X,,) E]

La frurcirr ./ se derrotnirta

/crt,st]la,d, co'n,,jn,rtto,

La frrrrr:iu cle distlibrrcirr

<lc. lr r'rrirlle

de X1 , Xz,

.... X,.

aleatotia rnttltivat'iar:te

Z esti definidtr

F7(r:,.,.,0,,) :Pr(Xr ( zt.. ...X,, ( r,,).

por

5.

5. AIguna.'^ distr-i b rrciones rnultidilne-nsior?ales inrportantes

Lrs r.ilirlrlcs rlcrtolirs

X1. X2, ..., X,, se llarll"rr ilclel-lctrrclicrrtes

l''7(,:t, ,
-,

,iLt,,)

: Ff

(:t1)

169

si

" '4x,, (2,,),

'

eqtrivzrlentcntertte,

J'z@,,.. . ):t:t) : .frr(tr) . .' [x,,(L:,,.).


Sea

g urra fitncin clefinicla de R" err R, la espcrtrnza nrrtemticr cle tL(Xt,...,X,,), segrin l:r lc' [s

Z. sc calcrrla por
E((g(Xr, X2,....X,,))

:t
J:7

tn g(rt,...,r,,)fz(rt,...,r,,,);

:rlando Z es discleta, y por

E((g(Xr ,X2,..

.,X,)) :

.l

-Rn

.f

O@r,

,r)f z(rt,.. . ,r,,) dr1 "'dr,,,,

:uando Z es continua.
La covarianza entre dos componentes cualesquiera

Cov(X,, X,n)
..i.rre

ii

: e [( - E(&-))(X," - E(X"'))] : E(X,X, ) -

tambin se la suele lotar colrro

E(X'.)E(X,,),

o,.?,r.

coeficiente de correlacin entre ellas

es

P(X,,X,n):
:.-

X, y Xrn deZes

Cot,(X,,., X,,r)

Var(X,.) Var(X,")

asocia su matriz de varianza-covar-ianza (o siurplernente

:*=
)

la

de

eda como

5.5.
l.i

Algunas distribuciones multidimensionales importantes

igr,rtrl que en el caso unidinrcnsional, lrlr:sentrrlros lrs clistlibucliorres rnnlticlirnensionales cle rnayor
-'-poltancitr; ellzrs son: la multirrornirl, Itr uuifolrne y la nor-ntrl bir,rlirulc.

Captulo

L70

5.

Distribuciones Multiditnensionales

5.5.1. Distribucin multinornial


-k (Xt,...,X*)
(n; pt,...,p), (dond" 0 1pu < 1, D p : 1), si

Se dice que el vector aleatorio

de parmetros

sigue una distribucin rnultinomia-

z:l

Pr(X
para N

k-dinensioual X

: (u,...,n*),

N)

Pr(X t

donde

i:l

no

rlr. . ., Xt"

nk)

*!-r.pT''''

p'1",

: r.

A un vector aleatorio X que sigue una ley multinomial

se lo nota

X - M(n;Pt,

...

,Px).

La esperanza, varianza y covarianza son, respectivamente, iguales a:

E(X) : n(h, "' ,Pk),


Var(X') : nPi(L-Pi), i:1,...,k,
Cov(X,X) : -npps, i,+ j.
La distribucin multinomial es la generalizacin multivariante de la distribucin binomial. La distribucin marginal de cada una de las componentes X es binomial de parmetros (n,p) y cualquier
distribucin condicionada es tambin multinomial.
Esta Iey de distribucin tiene aplicacin en el anlisis estadstico de datos cualitativos.

Ejemplo. En una empresa operadora de tarjetas de crdito se registr

las causas para la renovacirr

de las tarjetas. Se estableci que 60 % es por prdida, el25'/o por vencimiento y el 15 To por deterioro
Un da se recibieron 28 solicitudes de renovacin de tarjetas. Evaluar la probabilidad de que 15 sean
por prdida, 7 por vencimiento y 6 por deterioro.

Solucin: Sean:

Xy :
X2 :
X3 :
Se desea evaluar

nmero de renovaciones por prdida,


nmero de renovaciones por vencimiento,
nmero de renovaciones por deterioro.

la probabilidad para nr

Pr(X1

:15, n2:7,r:,'s:6, (rt+rz-ln3:29'

:15,Xz:7,Xs:6)

ffi

to.u

151o.zs; 710.

rs6

0.021.

5.6.2. Distribucin uniforme


Un vector aleatorio X: (Xr, ...,Xn) tiene distribucin uniformeen
si la funcin de densidad de probabilidad "f("r,. .., r,,) es

S:

[ot,br] x. ..xlan,b,r] C Rn

5.6. Ejercicios

171.

Esta distribucin es el anlogo rnultiva,riante de la distribucirr uniforme. Las distlibuciones marginales


de las valiables aleatolias X (i:1,..,,ri) son uniformes con densidad

{1

.f*,(r) : I bo I o. ^'

si r lo'b);
si "r'I lo,,b,].

5.5.3. Distribucin norrnal bivariante


Un vector aleatorio Z
densidad conjunta es

r@,

(X, Y) tiene distribucin normal bivariante no degenerada si su funcin

;cfu."r{-^l%t

donde p es el coeficiente de correlacin entre

_2p(, - t4@ -

oto2

p)

(y - !2)21
\
---A-)J'

X y Y.

Figura 5.2: Funcin de densidad de la distribucin normal bivariante.


as leyes marginales de

X y de Y

son:

X - N(pr,o?) Vy - N(pz,oZ).

En un ejernplo de la seccin anterior se calcul que el coefi.ciente de correlacin entre

X y Y es p.

trxiste un mayor nmero de variables aleatorias multidimensionales, pero su tratamiento sale fuera del
j,rminio de esta obra.

5.6.
1.

Ejercicios

Si la funcin conjunta de probabilidad de


J

X y Y est dada por

r*u
lr,a) : -30=, para :

0,

I,2,3;

:0,I,2.

Construya una tabla que muestre los valores de la funcin conjunta de probabilidad de las dos
variables aleatorias.

2.

Las variables aleatorias ,9 y


siguiente tabla:

tienen Ia funcin de probabilidad conjunta que se resume en la

s
T

r/20

Encuentre:

rlr2 Llg rl24


114 rl4 tl40
rl8 rl2o

t72

Captulo

5. Distribttciones Multidimensionales

a) Pr(S' :1,7 :2);


lr) Pr(S:0. l<I<:J):
c) Pr(S *T <2):

3. La funcin coljunta

ci) 1'r(5 > ?);

c)

clc plobabiliclad cle

l@,y)

c(:r2

ias clistlilrucion<rs nralgirralcs cic ,9 ), <lc I

X y Y est clacla por

+ ?r2), prra t: -- -7,0,

1,3; !,/ : -r,2,3,

Encuentrc:

4.

>2-Y);

d) Pr(X

a) el valor de c;
b) Pr(X :0,Y < 2);
c) Pr(X l,Y > 2);

e)

las distribuciones marginales de

La distribucin conjunta de las variables aleatorias X1y X2

X y de l-.

es

X1

012

Xz

p12 pl4

0
1

2p

4p

p pl2
2pp

a) Halle el valor de p;
b) Halle las leyes marginales de X1 y de X2. Son independientes?;
c) Sean Y : Xt x X2, calcule la esperanza de Y.

5.

Las variables aleatorias


z

Pr(X

Z)

ente s y sns funciones de probabilidad son

X y Y son independientes
0

.l

03

0.2

0.1

0.15

0.25

Pr(Y

:.i

_V

t/z

0.25

0.67

0.08

Encuentre la funcin conjunta de probabilidad de (X,Y).

6.

Dada la distribucin de probabilidad de una variable aleatoria bivariante discreta

x
Y

4
10
-3
0.15 0.13 0.27
0.10 0.30 0.05

a) Halle

b)
7.

X y de Y;
de correlacin cntrc X

las leyes de distribucin de

Calcule el coeficiente

r,' },

Dada la distlibucin cle 1>robabilidacl clc uur variable aleatoria bidimcnsional cliscreta

X
Y
0
1

l0

0.05 0.1.2 0.08


0.09 0.30 0. r1

a) Detcrmine las le1,ss . distribrrcin cle X y

b)

30

20

Calcule el coeficiente cle corlelrciu r:ntre

40
0.04
0.21

l';

lrs r'rrirblcs alertorirs.

5.6. Ejercicios

3.

173

Sc r:ousicl<trzr 1a sigtLictrtc f\urciri de plolrabili<1acl corrjrLrrta. rlc la,s r'rlirbles rlcrtotiLs

1. , ,
./.\)'('lt:

',

Qr

\ tt.

-,1. .i

I 1.3}.

.r' {0

//

XyY

c {1.?.3}:

(.;rO r.(rull.al.iu.

a) Hallar A; pala qne ./11' sea funcin dc probabiliclacl puutual conjrutta;


b) Halle lrs funciones clc pr:obabiliclad malginal cle X v clc )';
c;) X y )' son inclepenclientes'/ Justificlue 1a resprtesta;
c1)

9.

CalculePr(1

Drcl

<X<3;2<Y <3) vPr(X+y<3).

la funcin de distribucin de ia variable aleatolia bidimensiortal contitrua

nt , f senrser\y1 si 0( r'1
rw'lJ):l
si r(0,
o,

rf2, 0<y<rf2;
y<0.

a) Halle la probabilidad de que el punto aleatorio (X,Y) caiga en el rectngulo limitado pol
las rectas

b) Deterrnine

--

0,, :;,

[,,

tt

las fr-rncioues de densidad marginal de cada una de las variables aleatorias.

,1. Dada la funcin de densidad coniunta


f (r, a)

: !
1T

"-\"

*" Y+5a2) '

_.'x)

12

<

r {N,

-oo(lJ<(n.

Encuentre las funciones de densidad de cada ttna de las conrponentes. ,Son independientcs'/
Lr 'r'ariable

aleatoria bidirnensional (X, Y) tiene funcin cle densidacl


[ ?,u')

zr) Halle la constantc

: (1 +

r;2)

b) Detcrmine si X y Y

c;

La clerrsiclad conjunta dc

:r.y F'.

(t6 + a2)'

X y Y es /(r;

U)

A3ne )(z+e) para

son independientcs.

r > 0 y ;/ > 0.

a) Halle las densidades marginales y demuestre que X y Y son independientes;


b) Haile Pr(X < a;Y 1b) para cualesquiera nrmeros positivos ct y b;
c) Halle Pr(X < o) para a > 0.
En una irrvestigacin sobre la utilizacin clel crciito institucionai pol palte cle los canrpesiuos s('
registra e1 nr'rmero de cultivos que tiene ei campesirro en slr uniclacl proclr-rctiva (variable -X) v cl
nrimero de pr'stamos que ha obtenido en los riltimos aos (variablc I). En 1a siguiente labla
se pleserrt;ru ios resultac-los cle Ja irrvestigacirt:
v

-,\

2150

3/5n

7150
5150

')
3

.l

,)

ls0
12150
e l50

41

50

3ltt)

a) Olrterrga lrs distlibucioucs nrarginales de ,Y y cle )'-;


b) Dctclrnine la cListtibLrcitin probabilsticir dc: crclitos
rIn<:ios:

:t 150

150

olrtenicl<s, r-lado que cultir'r clos plo-

Captulo 5. Distribuciones l\[ulticlinterr.sjorrr/es

174

c) Olrtcrrgir l distribrrr:i<irL plol-ralrilstica cle 1>r'och-rctos.


T4

\::l

(ln(' rlr ticrur prstirrrr<ls.

Uu soc:icikrgo irrvr:stigrr cl c:<lrrrrortirnrietrto <lcliuttrcrr<:irl <[c los irrtcr rros <lc trrr pr.rral. Lr r'rrial
X relltcscutr c-.1 ruirrrcro rle voccs rlue ha cstulo clctcrri<lo v lr r'rriabkr )'- cl uliurclro rlc rlcllc[istitrtcls llor los (rc] ha siclcl s<lrrtcucir.clr. Srrs r1rtos sc reslrrl)clr crr Ia sigrriorrte talrla:
.Y
.)

.)

15/100

e/100

41r00

1/i00

5/100
21r00

1/100
21r00
3/100
5/100
41r00
3/100
21r00

3
4

1/ 100

51700

41t00

7 1100

rlrc}

I
tJ

6
7

3/100
21r00
21r00

1/100
1/100

21r00
211.00

1/100

21t00

a) Obtenga las distr-ibuciorres rnalginales de X y cle )":


b) Determine la distribucin del nrmero de veces que h estado detenido,

si solo ha cometi,:-

un delito.

una variable aleatoria que sigue una ley ul)ifolure sobre {1,2,...,n}. Sea Y la variab-.
aleatoria definida ror Y : (X + l)2. Calcule la cor'rianza entre X y Y .

15.

Sea

16

una lariable aleatoria qne sigue una ley unifornre sobre {-1,0,
de colrelacin cntre Xtn y X'tL.

17,

En nna urriversidad se toma, a los aspirantes, pmebas de ingleso en ciencias y en humanidades. S


X y Y sou, rcspectivamente, Ias ploporciones de rcspuestas correctas que un estudiante alcaui..
en las pruebas r su funcin de densidad conjurta viee dada por'

Sea

r 4r -l6u
,,^
^.t
5
IV,A):- \
[ 0.

1}.

Calcule el coeficiel,:.

caso corrtrario.

.Qu rorcentaje cle estudiantes conseguirn:

a)

nrenos del 40% de respuestas correctas en cada una de las pluebas?;

b)

rrrs del 80% de respuestas correctas en ciencias r,. rnenos de 50% en hurnanidades?

18. La c'arrtidad en rniligramos de dos componentes con[enidos


aleat<ria hrir,ariantc. cuya fttncin de densidad viene dada

r@,:
a) Errcucrrtre el

o<v

< r;

valol cie la constante c;

lr) I{rlle Ia ley condicional


C:)

{ ;:r, ::j:":;:,;''

er] un producto es nrra valial.'-pol Ia expresin

/(zlys):

Ctlt:ule la rrobabilidad de <ue la cntidacl clcl primer componente sea menor que 0.3:
rrritigramos cuando la del segundo cs 0.8 nriligramos;

d) ;.S,ru irr,lrendientes los dos <.:omponentes'?

5.6. Ejercicios
19. Si X cs l;r pr'oilorc:i<itt rlc pcrsonas que I'csl)ontlcrr
la

rtopor< iritr

<lcl

l)0lsorras cllre resl)onclen a

rlcnsirlrrl <:orr.jrurtit <lc

X y )/

otla

L75

ulra cnclrostr lerlizacla por correo y )'' t:s


l)ol correo, y la ftLrrciirn r1<''

errr:rrestr rr:aliz<ll

esti dada por

r| -*'-!,
2ri8t
5
[ 0,

para

.lb,v): I

0(r(1;

0<yl1;

caso colrl r'trio.

Eucueutle:

a) la funcirr cle densidad marginal de X;


b) Ia probabilidad de que aI menos un 30 % de Ias personas responda a la primera
c) Ia probabilidad de que menos de un 40% de las personas responda a la primera

encuesta;

encuesta y

que ms de 50 % de las personas responda a la segunda.


20.

La vida de uso (en horas) de cierta clase de circuitos integrados es una variable aleatoria con
funcin de densidad

I
l@): {

20000

st z ) u;
G+ looF'
caso contrario.
I O,

Si tres de estos circuitos operan independientemente, encuentre:

a) la densidad conjunta de X1, Xz y Xs, que representan la duracin de cada uno de los
circuitos;

b) la probabilidad Pr(X1 < 100,X2 < 100,X3 >


2r

Sean .9

200).

y T dos variables aleatorias cuya funcin de densidad conjunta est dada por

f(",t):{ *'
t 0,

si

o(sl8; o<t<7;

caso contrario.

a) Encuentre el valor de k;

b) Obtenga las densidades marginales de ^9 y de ?;


c) Determine la funcin de distribucin F(s, ).

22.

Una funcin de densidad conjunta est dada por

I l6ryzt' si 0( r1I; 0<y<1;


' t/
f(r,a,-,,
- I 0,
caso contrario.
a) Calcule la probabilidad cle que X

=X,,

,i,

t .;y r >2s,

b) Obtenga la densidad marginal de ?;


c) Son las variables aleatorias X, Y , Z y T mutuamente
La densidad conjunta de (X, Y)

r(*,v):
l.;}]

0l11;

0<z1I;

independientes?

es

{ i:t

- r - u)'

:'-:

;ffi?,I'

a) Halle el valor de k;
b) Obtenga ls densidades marginales de X y deY;

<a<

4;

176

Captulo 5. Distribuciones Multidimensionales


c) l)cterrniue

1a covarianza

24. Sr'r

,2 .2.
r
c^Ye-\r'-+tt- )''r' ) 0;'Y > 0;
.f (r, : I
err otros casos.
L 0.

a) Halle

b)
c)
d)
25.

Sean

X y 7'.

entre

el valol de

c;

Obtenga las densidacles marginales de

X v de Y;

Calcuie las esperanzas dc


,Son independientes

)/'/

1,

X y Y dos variables aleatolias


f

X y de Y:

cuya densidad conjunta

es

. ( !6rr+yr)y,
sio( r1r; o1y< l;
(r,a):1
5
|.

0.

caso contrario.

a) Obtenga las distribuciones marginales de X y de Y;


b) Halle la covarianza entre X y Y;
c) Calcule las esperanzas de X +Y y de X2 +Y2.

26. Sea (X, Y) distribuido


si

(r,y)

uniformemente sobre el sernicrculo del diagrama. Entonces, f


est en cl semicrctilo.

a) Determine las distribuciones marginales


b) Son independientes X y Y?
27

X y de Y

Para la distribucin bivariante

.f

(r, v)

c*rly
(1+Z)4(1 +y)4',

c) .Son independientes

a)

b)

Pala

si r)Q; a>0;
en otros casos.

0,

28.

de

al de

X v Y?

X;

+ YY

si z 0, y>0; conn),2,
caso contlario.

(r,y):

5.6. Ejercicios
a) Determine la constirnte k;
29

,)

a)

30.

lr) Obtenga

Son indepcn<lientes las valiables alcatoritrs

l?,a) :3 a"",
at:-

Dada

La

L77

lr

funcin de distribucin.

y Y, si la frurcin de densidrd conjunta

( r 1y 1 l?;

b)

funcin de densidad dei vectol aleatorio

"f(r,A): (r+r

ta)4

r)

es

0; rr>0?

(X.)')

( 6r, para 01r1Y<1;-.


(r.t):
I
rf \*'Y
[ 0, caso contrario.
Encuentre las funciones de densidad marginal de
.1

l-

X y de Y.

:!6'+ysi 0 < r 1l
(X,Y) es un vector aleatorio con funcin de densidad conjunta rf (r,y)
\ )
y0<y<L(y0enotrocaso).CalculelacovarianzayeIcoeficientedecorrelacindeambas
Si

variables.
.?

r)

Dada la funcin de densidad de (X, Y):

r@,a):
a) Encuentre

b)
c)
d)
e)
')t

'),)

{3:r' :ff"h;,s

Calcule las esperanzas de

,Son

Sca (X,

1;

el valor de k;

Calcule ias funciones de densidad marginal


Calcule

Pr(X < 0.51Y :

XyY

deXydeY;

X y de Y;

0.6);

independientes?

Y) una variablc aleatoria liidirnensional con funcin dc densidad conjunta

0<g<r<1.
Calcule:

a) el valor de la constante k;
b) Ias ftrnciones de densidad rnalgiual
c) la corrarianza entre X y Y;
cl) la funcin clc clensicla<l

e) la csperanza de YIX

'2

ji.

<tc

cle

X y Y.

)''lX : 1;
2'

::.

Si (X, Y) est uniforrnemente distribuido en cl tringulo limitado por las rectas


r + lJ :2, encuentre:

a) iafuncin cie densida"d de (X,Y);


b) las funciones de densiclrd clc X y de Y;

l;.

Son independientes?;

La distribrrcin coljnnta cle las r.ariables alertolirs


en (1, 0), (-1, 0), (0, 1) v (0, -1).

t :0,

:0

c) lacovarianzaentre X yY.

X :,Y

es

uniformc en el cnadrado con vrtices

captulo E. r)istribuciones Multidimensionales

178

tr) Escrilra

l,1 frrrrcirr clc clensicltcl conjrrnta cle X y y;


lr) calcule la firrrc:i<irr clc cle'sicl,rrl nargi'al ck: x y dibtrjela;
r;) Hallc E(X) V Var(X);
<l) Czrlcule E(XY);
e) Caicrrlc la crtr'r.ianza y la corrclacin eutre X y y.

36.

El clellzrrtanlento dc sealizacin clel municipio registr el por.centaje de focos cre tiene

clpt
Ieentrlazar en los scmforos, segt I] el colol que ellos ilnminan. Se detect que
el 45 % so decolor verde,20To del color amarillo y 35% clel color rojo. En una muestra aleatorir
cle 1b focos.
,crrril es Ia probabiLiclad cle que:

a) hayan

10 r'erdes, 1

amarillo-r 4 ro.jos?;

b) havan 5 focos de cada

color?

DN
r) f .

Entre las operaciones qlre se realizan en un banco se ha registraclo que a lo largo del
tiempo se
tienen los siguientes porcentajes <le retiros, depsitos y cambios de cheques,
3l%, 40% y 25;-:
respectivamente. Un ca.jero reali:: 20 operaciones en una hora. Determine la probabilidad
de
que se hayan hecho: a) 5 retiros, 1(ldepsitos y 5 cambios de cheques;
b) 10 r.etiros y 10 depsitos

38

Segrrr el Registro Civil, la poblaciin ecuatoriana entre los 18 y


6b airos cle edacl tiene la siguicnt.
composicin:30Vo son solteros,4ltTo son casados, I5%o son clivorcitrclos y 10%
son viudos. E:una oficina labotan 18 personas, ,cur es Ia probabilidad d.e que haytrn:

a)

b)
39

6 solteros, 6 casados, 3 divor:iados


7 solteros, 8 casados, 2 divor:iados

y 3 viudos;
y 1 viuclos?

De rctterdo a la teora de la here tcia de \4enclel, si plantas con sernilla rmar.illi


lis se cl.Llz-l
con plantas de sernillt t'erde rtl8os, se obtiene los siguientes resultados
con sus r.espectir.;..
prolrabilidades:
Probrl-iiiclrcl

rarilla y iisa
rarilla y lllgosa
'de y lisa

el16
3l16
3l16

'de

1176

y rlrgosa

'Cul es Ia probabilidad de que e rtre 9 plantas as obtenidas, 4 sea cle semillr amarill lisa.
sean de semilla amarilla rugosa, 3 de semilla vercle lisa y ninguna
cle semilla vercle rugosa?

40' Las variallles aleatorias Xt, Xz y X3 siguen las siguientes leyes de probabilidad: X1
Xz - N(20, 1) y X -.A/(30,4). le definen
Zt: XtlX2- X3, Zz: XtlXzlXz, Zs: Xt_Xz- X.

I
^f(10.

Si X1 , Xz, Xs son independietrtes calcule la nlatriz cle covarianzas cle (21,22,2;).

4r'

Las variabies aleatorias

xt,

X2,

. ., Xr, yt, y2, - . ., y, son inclepenclientes. porrgamos


*

,,t:'
Halle la covar.ianza entre

$, y T, ;i

"rlr'

lt(Xk)

Pr(Y:7) :p,

42.

Sea

: ;:;. i',",

: a,

Yar(X,1

Pr(Y-0) : e:l-p,

X - N(I,1), halle la matriz ce covarianza de (X, X2,

6,2,

k
XB).

:I,2,...,T.

Captulo 6
Distribuciones de Muestreo
En c'ierto sentido, Ia estadstica y la probabilidad tratan con problernas inuersos:
si el objetiuo b,sico de la probabi,lidad es calcular las probabi,lidades
de euentos compl'icados que siguen un modelo probabilstico,
Ia estadstica trata de clarificar Ia estntctura de modelos probabilstico-estadst'icos
rnediante la obseraacin de uarios euentos complicados.
A. N. Shiryayev
La ley de distribucin normal es el modelo probabilstico ms empleado en Ia Estadstica, debido a
ia aplicacin del Teorema del Lmite Central; sin embargo, este resultado no es aplicable en todos
-os casos. En el presente captulo examinaremos las leyes de probabilidad que siguen ciertas medidas
,rtadsticas, obtenidas a partir de las muestras, que nos permitirn construir modelos inferenciales
.obre los datos.
n-as

distribuciones de muestreo, constituyen el punto de transicin desde la Probabilidad a Ia Estads-

:ica.

6.1. Resea histrica


La Estadstica actual es el resultado de la unin de dos disciplinas que evolucionaron independien-emente hasta confluir en eI siglo XIX: la primera es el clculo de las probabilidades, la segunda es
- <Estadstica>> (o ciencia del Estado, del latn status), que estudia la descripcin de datos, y tiene
:arces ms antiguas. La integracin de ambas lneas de pensamiento dio lugar a una ciencia que estudia
-'imo obtener conclusiones de la investigacin emprica mediante el uso de modelos matemticos.
de la estadstica se pueden hallar en el antiguo Egipto, cuyos faraones recopilaron,
:acia el ao 3050 antes de Cristo, datos relativos a Ia poblacin y la riqueza del pas. De acuerdo a
lerdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de
I os comienzos

-rs pirmides.

L,c chinos, tambin efectuaron censos hace ms de cuarenta siglos. Los griegos realizaron censos
;eridicamente con fines tributarios, sociales y militares. La investigacin histrica revela que se
:o-alizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
SUerrera.

Fero fueron los romanos quienes mejor supieron emplear los recursos de la estadlstica. Cada cinco
m realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anota
179

1ECI

Cayttulo

6.

Distribucior:es de M-esreo

defnnciolres 1- rna.1 r'iurorrios) sin olviclar los iecurr:ntos peticlictos clcl g;lnarlo
licluezils contcnic,lrs crr lrs tict rrs colctisladas.
nr<:itnicni<-s,

I' de lirs

Durante los rnil aos sigrrientcs a. la cada del impclio Rornaro sc rcilizrron rruy po.irs irn'estigaciones
estrdsticas. E1 primel intento de aplicar un razonamicrrtu propiirmentc cstadstico, en el seul,ido actua.
del tr'mino, a datos clernoglzificos es clebido r John Granrrt, err 1662, quien sc plarrte el problem:r de
estirnar Ja pol-rlacirr inglcsir de la poca.
Goclofredo Achenu'all, prof<:sor de la Universidad dc Gotinga, acu en 1760 la pzrlabra estadstica.
qtre extrajo del trmino italiano sta,t'ista (estadista) . Crea, y oon sobrada razl, que los datos de la
nlre\/a ciencia seran el aliacio ms eficaz de los gobernantes conscientes.

li
I

lp

tt

l',
I
Er

Durante el siglo XVIII y 1a mayor parte del siglo XIX, Ia Estadstica evolucion como ciencia separada
del Clculo de Probabilidades. Una contribucin importante al desarrollo de la Estadstica es debid
a A. Quetelet (1846), quien sostuvo la importancia del clculo de probabilidades para el estudio de
datos humanos. Quetelet demostr que la estatura de los reclutas de un regimiento segua una le'
probabilstica, e introdujo el concepto de <<hombre medio>>.

A finales del siglo XIX, Sir Francis Galton ide el mtoclo conocido por correlacin, que tena por
objeto medir ia influencia relativa de los factores. Sus irrvestigaciones se dirigieron a aplicar mtodos
cuantitativos en el estudio de la herencia humana. La importancia de Galton radic no solamente en
el nuevo enfoquc que introdujo en los problemas de estadstica, sino tambin en su influencia directsobre W. Weldon, K. Pearson y Edgcworth, entre otros. Adems, fund el primer departamento de
Estadstica.
Pero, talvez qu.ien rns ha influido en ei desarrollo de la Estadstica moderna es R. A. Fisher (1890 1962). Fisher se interes plimero por la eugenesia, Io que le condujo, siguiendo ios pasos de Galton, :.
la investigacin estadstica. Sus trabajos culminaron con la publicacin del libro,9listi,cal Method:
t'or Research Workers. En esta obra aparece el cuerpo mctodolgico bsico de la Estadstica actual.

A partir de 1950

se puede considclar que comienza ia poca moderna de la Estadstica. tln aspect,clifercncial respecto a ios periodos rnterioles es La aparicin cle las computadolas) que revolucionalor,
1a metodologa estadstica y abren enormes posibilidades para 1a construccin de modelos complejos

En la actualidad, ia trstadstica es una discipiina que actira como pncnte entre los modelos matemticoy los fenmenos reales. IJn modelo es una abstraccin sirrrpliflcada de una realidad ms compleja siempre existir discrepancia entre lo observado y 1o previsto por el modelo. La Estadstica proporcioniuna metodologa para evrluar y jr.rzgar estas discrepancias entre la realidad y la teora.

6.2. befiniciones bsicas


A

contiuuacin damos varias ilefi,niciones de inter's, qr-rc permitirn entendcr la terminologa c1'r..
emplearemos. Algr-rnas definiciones ya se dio con anterioliclacl, pero las repetiinos para rrna rrra-\'.
claliclad cle los couceptos

Defi.nicin (de poblacin) Una poblacin (o universo)

es una coleccin completa de pelsonas.


anirnalcs, plantas o cosas de las crrales se desea recolectar datos. Es el glr-rpo cutero al que querernos
dr:scribir o del que deseanros sacar conciusiones.

La poblacin debe tener caractersticas medibles o cntables, cle rraturaleza cuarrtitativa o cualitatir'
A la r:aracterstica nredible sc denomina uar-iabl,e estadstica t a los r-rloles ciue tomr se los llal
ol s cr-ur,ciorcs.

'de
po
-En
Por

Iup
Ger

par

Den

ns
por
Los

6.2. Definiciones

bsicas

181

Definicin (de muestra) Es un grupo de unidades seleccionadas de un grupo mayor (la


poblacin) . Por el estudio de la muestra se espera obtener conclusiones sobre Ia poblacin.
Definicin (de parmetro) Un parmetro es un valor, usualmente desconocido (y que por lo
tanto tiene que ser estimado), usado para representar cierta caracterstica de la poblacin.
Entre otros, los parmetros poblacionales son:

La media,

El total, r;

La varianza,

La desviacin estndar, o;

La proporcin,

/_;

o21

7T

o p.

Definicin (de estadstico) Un estadstico es una cantidad que se calcula a partir de una muestra
datos. Se los emplea para dar informacin sobre los valores desconocidos correspondientes a la

de

poblacin.

Por ejemplo, el promedio de Ios datos de una muestra, se usa para dar informacin sobre Ia media de
-a poblacin, de la cual se extrajo Ia muestra.

leneralmente, a los estadsticos se les asigna letras latinas (por ejemplo, m


:armetros poblacionales se les asigna letras griegas (por ejemplo, ,t,y o).

y s); en cambio, a ios

Jentro de una poblacin, un parmetro es un valor fijo que no vara; mientras que es posible extraer
-'s de una muestra de la misma poblacin y eI valor de un estadstico variar de muestra a muestra.
lr ello, un estadstico es una variable aleatoria que sigue una ley de probabilidad.
-..rs

estadsticos ms importantes y sus valores, calculados a

. La media muestal

El total muestral,

partir de una muestra de tamao

i"n

o promedio , T

i:

Nr,

: L;

donde,Ay' es ei tamao de la poblacin;

'ln

La r.arianza mucstral,

s'2

- ---:-

T.@, - )2;
1

. La desviacin estndar muestral. s :

La proporcin rnuestral, f

Lt

n,

, donde

n-I
y

'rL

D@,

i-I

- r)";

es el nmero de xitos entre

n intentos.

?)

son:

182

Capitulo

6.3. Distribuciones

6. Distribuciones

de Muestreo

de muestreo

Si decirnos que un estadstico es Lrna vrlialrlc aleatoria, entonces tendr' una Icv de lrrobabilidad
asociada.

Definicin (de distribucin de muestreo) A la ley de probabilidad que sigue un estadstico

se

Ie denomina distribucin de muestreo.

La derivacin de la distribucin de muestreo es el primer paso en la realizacin de inferencias sobre el


valor del parmetro asociado al estadstico quc se estudia.

6.3.1. Distribucin de muestreo de la media


Supongamos que se obtiene una muestra X1, X2, . . ., Xn de una poblacin que tiene media p,y varianza
o2. A partir de la muestra calculamos el promedio, X. Entonces, se cumple que:

1.

E(x)

2.

Var(X)

X-u,
3. '+
ol\/n

l-L;

o2
-

-1TL

sigue aproximadamente urla ley normal estnclar (por el Teorema clel Lrnite Central).

Es decir,

Pr(x < L) =v,


donde

es

zs +) :o ( ++\
\ -ol'/")
\"11")'

tna variable aleatoria normal estndar.

Tngase en cuenta qlre) para la mayora de aplicaciones, ya se obtiene una buena aproximacin
un tamao de muestra de n:25.

Observacin. La desviacin estndar de la media muestral


oTi

se denomina er"ror est,ndar

cor-

se le not;-

OV

\/n

Ejemplos

1.

Supongamos que se selecciona una muestr a de n

36 observaciones de una poblacin con pt - -

yo:0.9.

a) Hallar Ia probabilidad aproximada de que la media muestral sea menor que 6.9.
b) Obtener la probabilidad aproximada de que el promedio X sea mayor que 6.82.
c) Hallar la probabilidad para que X est en el intervalo (6.8;7.29).
Solucin: La distribucin de la media muestral

o2: (0.9)2es declr' 0


.
varlanza
;
36 ;
,fr:

0.9

,,/g6

u'rc'

sigue una ley normal con media

p:

7:

6.3. Distribuciones
a)

183

As,
6.9

x ,r(t
: 0.2515

Pr(X < 6.9)

b)

de ntuestreo

- 7\

0.15

Tenemos que

Pr(X > 6.82)


a-

c) La probabilidad

1- v, ( z= u?''lt)
0.15)
\: 1-O(-1.2) :l-0,1151

1-Pr(X

0.8849.

<6.82) =

de que la media muestral est entre

Pr(6.8

6.8y 7.29 es

<X <z.zs : e,
'^\(8:J
o.lb <\z\z <7'2e-7)
o,lb )
- o(-1 33) :0 e732 -

i:iffl

0 0e18

El nmero de clientes que ocupan un cajero automtico) en un lapso de 5 minutos,


aleatoria distribuida segn la siguiente ley de probabilidad:
k

PI,

r/tz

2/72

3l12

3lt2

2lt2

r/72

es una

variable

a) Halle la media y la varianza de la variable aleatoria; b) Se escogieron 46 muestras, de 5 minutos


de duracin, y se cont el nmero clientes que utilizaron el cajero. Cul es Ia probabilidad de
que el promedio de clientes est entre 2.2 y 3?
Soluc'in:

a) La media y la varianza

tt

D,,r*:ox
5

son:

i*r"3*r"i*3x i*n"l*r"i

2'

Dt'or- :o " # * 1 x l*n"

o2:

tr2

l*n " i*16 x ,?r*r, " +- (;)'

23

t2'
b)

Sea

la media de clientes que ocupan el cajero en muestras de tamao 46. Se tiene que
23

5oo2111

Entonces,

lt.z:l-t:5 y oi:i::.
. /5 1 \
por lo tanto,
X-N
\;,
^);

:
:

aQ.45)
0.922L.

o(-1.47)

Captulo

184
3.

6.

Distribuciones de Muestreo

En una plania pasteurizadora se ha observado que la mquina que llena las fundas de leche.
envasa el lquido con una media p y una desviacin estndar de o:20cnr3. Si un da se llevarL
a cabo 25 mediciones de la cantidad de leche en cada funda. a) Caicular Ia probabilidad de que
el promedio medido difiera a lo mucho en 8 cm3 de la media terica que debe tener el volumen
de leche envasado; b) cuntas mediciones deben realizarse para que 7 difiera dc r, en menos de
Bcm3, con una probabilidad de 0.99?
Solucn: Como n

a)

25, se puede asumir que la distribucin de

es aprc:,i-:ladamente normal.

Entonces,

Pr(lX-/rl <B)

: Pr(-8<X-p<8)
: /88\

"'|.-rE<zsn/6)

: Pr(-2.2.2),
donde Z

: X -#

olt/n

sigue una distribucin normal estndar. La probabilidad buscada

Pr(-2 < Z <2)

o(2)

- o(-2)

0.9772

b)

Se tiene que

Pr(lX
Como

- pl l8) : P'(-s

0.0228

<X

-p

S 8)

es

0.9544.

0.99.

o:20,

,,

,-1,_
Y)
-olr/n20 ,X
\ -Y
= 20)

:pr(-0.4J
--\ --v < z < 0.4Jn):

o.ee.

Mediante la tabla de la ley normal se encuentra que

Pr(-2.57 < Z < 2.57)

9.99,

por lo que se deduce qne 0.4Jn:2.57, o sea

":(#):40e6'
Se necesitan al menos 41 mediciones para que el promedio de la nuestra est a
rnedia poblacional con probabilidad deI99%.

cm3

de

6.S.2. Distribucidn tle rmlestreo de la proporcin


Supngase que tenemos una muestra alcatoria Xy, X2,

una ley dc Beriroulli,

Ber(p).

..., Xn,

proveniente de una poblacin qne s-:

Definimos

n:irn
i-r
X:7 con probabilid^'r p y X:0 con probabilidad Q: I - p, i : I, 2, ..., n. Entonce.
cuenta el nmero de xitos en . intentos. La proporcin de <<xitos>> en la muestra es
donde

f:Y: li",
TL

7I4;-

La variable aleatoria Y tiene distribucin binomial de parmetros


o2" : npe, y se cumple que:

(n,p). Por lo eu, py:

6.3. Distribuciones de muestreo

E(i)

l.

Var(f) = I Var()')
rL'

n-E(Y)

185

p;

:?3:
n

sigrre aproximadarnente Lrna ley normal cstnclar' (por el Teorema del Lrnite Central)
l. +
\/ pq ln
Es decir.
./
\
/
\
:of
P,(Fsl) =Pr(z1l!)
'-1 )
\ - t/pql" )
\r/pql" )
dorrde

es

tna variable aleatoria normal estndar.

Ejemplos

-.

En un proceso de produccin el 20% de los productos tienen algn defecto. Se selecciona


una muestra de 100 unidades y se cuenta el nmero de artculos defectuosos. Determinar la
probabilidad de que la proporcin de defectuosos se encuentre entre el IS%a y el29%.
Solucin: Tenemos que p
Se desea evaluar

0.2

y on :0

la probabilidad Pr(0.15

Pr(0.15

2-\^=0 B

100

9 rtu.

100'

<0 < 0.29); sto

es,

<0 < 0.29) : P.(0< 0.29) -Pr(p'l

0.15)

o(!zg::2.\-rlors-oz\

\v/0.16/loo/ \v/0.16/1oo/
- O(-1.25) : 0.9878 - 0.1057

aQ.25)
0. BB2 1.

Eu lrna investigacin por muestreo interesaba saber el nivel de sintona, en los hogares, de un
partido de frtbol. Se realiz nna encllcsta en Qr-rito a 213 hogares y se encontr' qr-re el 53% de
los hogares haban visto el nencionaclo partido. Srrpongamos clue la proporcin 7r de hogares
en los que se vio cl partido fue realmente igual a 0.5. ,Cul es la probabilidad de observar una
proporcin muestral f igual o mayor qr.re la observada 0.53?

solucin: Tenemos

n:2r3 v p:0.J;

por lo tarrLo,

T - +#

0.001174.

Por 1o que,

pr(f )0.s3)

- t-pr(f<0.53)' =1-pr (=.9)


\ t/Pql"
= 1-0(0.88) -1-0.8105
: 0.1895.

'/o'oottz+ 1

Es decir, con una muestr' de 213 hogares Ia iirobabilicld de que la proporcin olselvad sea
mayol'o igual a 0.53 es del l8.95o/a.
Hzq qrre totnar Lrr.i nltcstla. alcrt,or'a para estimar Ia proporcirr de artculos defcctnosos p de lur
ploceso de prochrccin. a) Establecer el tanrao mnirnc de ia rnr-restla de modo que la proporcin
observrda difiera de la propolcin velda,clcrr' on irrerios cle 0.1, oon riua 1>robabi iclad c,le al rnenos
eI 957o; b) Realizar el inciso antelior si se conoce qr.re la ploporci<in dc artculos defectuosos es
mcnor clue c1 12 %.
Soht"ci,rin,;

Captulo

186

6. Distribuciones

zr) Deseanros cletermirtar el ta,rnao nruirno cle

de Muestreo

1a mrrestrr clc

tal

moclo quc

0.95:

P'(lp-tl <01) : P'(

0.1

Pr(lp tl < 0.1)

<p-t<01)

o' \
: P,f+ <z<
\r/pql,,-

olq$)
\/psl

r/nul,,1

<,(_otJ) -on,
y

Igualando con los valores de la distribucin normal


simetra,

\ '/ps/-

haciendo uso de su propiedad

0.I{"
,/w
n

En esta ltima expresin, el valor de n depende de p, que a su vez es desconocido. Pa:.


asegurarnos de tener un tamao de muestra confiable, se maximiza el producto pq. T;
producto es mximo cuando p: q:0.5; entonces,

n > (1e.6)2(0.5)(0.5)

e6.

La muestra tiene que ser de al menos 96 artculos.

b) Antes

habamos determinado que

Como p <0.L2, se tiene quepq

>

(I9.6)2pq.

> 0.I2 x 0.BB:0.10b6;


n > (r9.6)2(0.1056)

entonces,

40.57.

EI tamao de la muestra es de al menos 41 artculos.

6.3.3. Distribucin de muestreo de la varianza


En el Teorema del Lmite Central la convergencia de la ley de 7 est asegurada y es independie--"
de la ley que siguen las observaciones. Para otros estadsticos, se necesitan hiptesis adicionales p,:r
asegurar su convergencia hacia una ley de distribucin, este es el caso de Ia varianza muestral.

La ley de distritucin y2
Sean X1 ,

X2,

..

., Xrr., fr variables aleatorias,independientes que siguen una distribucin normal e. . .,.

dar, la variable aleatoria definida por T

: D X? tiene una distribucin X2 (jl-cuadrado)


,i-I

con n gr1-ul

de libertad (g.1.), denotada y2(n).


Su funcin de densidad

es

,(n-2) lz

f(r):

i;

2"trt

"-r

(;)

lz

, siz)Q;
sir(0.

La ley de distribucin y2 fue dada en pprl


rime r lugar, aparentemente, por Abbe (1863) y redescu,
por Helmert (1875) y K. Pearson (1900l).

6.3. Distribuciones de ntuestreo

187

2.

z@)
Figura 6.1: Funciones de densidad de la ley X2.

:sta distribucin est definida para valores mayores que cero y viene tabulada. La Tabla 3 del Apndice
--,ntiene los valores X?qrre cortan un rea a en el extremo derecho de la distribucin (Figura 6.1).
- a lectura de la tabla se realiza de la siguiente manera:

i.

Escoja el nmero n de grados de libertad (margen vertical).

'1.

Considere Ia probabilidad

3.

a en el extremo derecho de la distribucin (margen horizontal).

Proceda a localizar el valor X?@) en el cuerpo de la tabla, donde se cruzan las lneas vertical y
horizontal antes encontradas.

Ejemplo. Se desea conocer


-.ral a 0.025.

el valor de la ley X2 a 4 g.l. para el cual el rea en el extremo superior

-' .lucin: Se busca Xl.ozs(a) : ll.l4. Esto quiere decir que el rea a la derecha del valor t
-= Ia ley y2 cor. 4 g.l. es igual a 0.025: Yr (X2 > 11.14) :0.025.
XLa

ley de distribucin de

es

: II.I4

s2

:;pongamos que se obtiene una muestra Xy, X2, ..., Xn de una poblacin que sigue una ley normal
-'i ri,.t,o2). A partir de la muestra calculamos la varianza muestral, s2 :

'

cumple que:

-i
n-rl-t

(X,

-X)2; entonces,

-. E(s2):oz'
l.

)n4

Var
'*'\"Ls2),,

(n
J # -

1\.s2

n_1,
sigue una ley

2(n

- t;.

=jemplo. Un jugador profesional de dardos decide tratar de mejorar su tcnica de lanzamiento y va


. -stndial la varianza de Ias distarrcias al centro del blanco a las que cae el dardo. Para una cierta
-rrnica de lauzamiento se sabe que esas distancias tienen una distribucin normal cuya desviacin
+ ndar es 4 cm. Realiza 30 lanzamientos y calcula la varianza de Ias distancias entre el sitio de
--pacto del dardo y el centro del blanco. a) Calcular Ia probabilidad de que Ia desviacin estndar
-. los lanzamientos sea myor a 3 cm.; b) Hallar Pr(10 < s2 < 27), aploximadamente; c) Calcular Ia
:--dia y la varianza de s2.

l.lucin:

Sea

: +I,

IJ

x2Qq para n :

30.

Captulo

188

a)

Se quiere buscar

6-

Distribuciones de Muestreo

Pr(s > 3); cs clecir, Pr(s2 > 9):


pr(s2 > 9)

p,

("

\o'

-rt

:
r' r 3r)
Iro)

pr.(t/ > 16.312)

En la tabla de la ley X2 para 29 g.1., se ticne que Pr(t/ > 16.05)


Por lo tanto, Pr(s2 > 9) es algo menor- que 0.975.

b)

Calculemos Pr(10

< s2 <

pr(10 < ,2

0.975

y Pr(U > 17.7f):

0.95

27),

< 2T : v, (!rc <n _ut ,' t}rr\:


o -16 /
\16

:
:
:

pr(18.13 <

u<

48.s4)

Pr(U < 48.94) - Pr(U < 18.13)


[1 - Pr(U > 48.e4)] - [1 - Pr(U > 18.13)]
Pr(U > 18.13) -Pr(U > 48.94).

De acuerdo a Ia tabla y2, para 29 g.l. se tiene:

c Pr(i/ > 17.77):0.95 y Pr(U > 18.85) :0.925.


c Pr(t/ > 45.72): 0.025 y Pr(t/ > 49.59) : 0.01.
Entonces, Pr(10 < s2

<

27)

0.95

0.01

0.94.

Observemos que, por la forma de lectura de Ia tabla, tnvimos clue realizar Lrrla transformaci:para encontrar Pr(18.13 < U < 48.94) y su valor se determina de forma aproximada.

c)

Sal-,emos que

E(s2)

:62 :1ti

y quc Var(s2)

6.4. Otras distribuciones

#:'#

tT.G6.

de muestreo

En csta seccin presentaremos distirrtas distribuciones cle muestrcoT qlre se presentan cuando tratantc,.
con transformaciones adecttadas cle los estadsticos. Estas transformaciones son rlecesarias para oJtene:
leyes clc probabilidad que permitan traba,jar adecuadamente.

6.4.1. Distribucin de muestreo de Ia media, cuando la varianza es desconocida


Se pr-rcde srtponer qrre -ciebido al Teolema del Lmite Central , siempre sc tienc la convergcncia haci .
1a lcy rrolmal; pelo sto no siempre srrcedc; cjomo) por ejemplo, crrando la varirnza poblacional e.

desconocida.

La ley de distribucin

de Student

1908, \ /. S. Gosset, esclibieldo c:on cl nornbre de Studcnt, public en la rcvista Biont,ett"i,ka


dccluccin cle la distribucin e inclrry tlrblas cle probtrbiliclrd acurnr-rlacla de la ley.

trn

s'

trl grfico de la funcin de densidad de la Ie5, / 1i"t n rrna forrna parecida al de la ley rrormal, simtric
rcspecto a 0 y se extiende a Io largo clel eje leal.
Los valores de probabiliclad clue tona vienen tabulclos. La Tabla 2 del Apnclice contienc los vrlole:
dc o qrte coltlrr nn rea igrral a o err cl extlemo clelecho clc la distribucin (FigLrrrr 6.2).

6.4. Otras distribucones de ntuestreo

Figura 6.2: Funcion de densidad de la ley

189

Los valores tabulados dependen de los grados de libertad, porque la ley de probabilidad cambia si n
;ara. Cuando n aumenta, la distribucin se aproxima a la normal estndar.

La lectura de la tabla se realiza de la siguiente manera:

1.
2.
3.

Escoja el nmero n de grados de libertad (margen vertical).


Considere Ia probabilidad

o en el extremo derecho de la distribucin (margen horizontal).

Proceda a localizar el valor to(n) en el cuerpo de la tabla, donde se cruzan las lneas vertical y
horizontal antes encontradas.

Ejemplo. Encontrar

el valor de Ia ley a 6 g.l. para el cual el rea en el extremo superior es igual a

_.t125.

jolucin:
--,Iey

es

:2.447.

Esto quiere decir que el rea a la derecha del valor


igual a 0.025: Pr (? > 2.447) : 0.025.
Se busca fo.ozs(6)

t:2.447

de

La ley de distribucin de X
Srpongamos que se obtiene una muestra X1, X2, . . .,

Xn de una poblacin que sigue una ley normal

-l'(p,,o2), donde o2 es desconocida. Entonces, se cumple que la variable aleatoria


.ra ley

de Student con (n

1) grados de libertad. Es decir,


\
/
t-

Pr(X <

):
'

Pr

(r.\

7: j
s/\/n "igu"

Z- 41
sl'/n)

Ejemplo. IJn fabricante de cigarrillos asegura que el contenido medio de nicotina, en una de sus
-arcas) es de 0.6 mg por cigarrillo. Una organizacin independiente mide el contenido de nicotina
-e 16 cigarrillos de esta marca y enclrentra que el promedio y la desviacin estndar son de 0-744 y
-.i75 mg de nicotina, respectivamente. Si se supone que la cantidad de nicotina de estos cigarrillos
= una variable aleatoria normal, qu tan probable es el resultado obtenido por la organizacin
- Cependiente?

i'.,iucin: Se tiene que p:0.6, s:0.175,


::omedio igual o superior a 0.744.

n: L6. Encontremos la probabilidad de hallar un valor

pr(x > 0.744) : y, ( r ro^'-!j, Y)


\ - 0.175 l,/to 1

Ia lectura de la tabla de la ley con 15 g.1., resulta que Pr


-'Lto proporcionado es muy poco probable.

e, (r > B.2s)

(" > 3.29) :

0.0025. De manera que el

Captulo

190

6. Distribuciones

de Muestreo

6.4.2. Distribucin de muestreo de la diferencia de dos medias, con varianzas


conocidas
de dos pol-rlaciones que tienen rriedias Ft y lrz y varianza, ol v o)r.
respcctivarnente. Sean X1 y X2 ias lreclia muestrales de dos muestras leatorias indepenclientes de
tarrrros TLr y rL2l seleccionadas lesrcctivarnelte de las poblaciones 1 y 2. trntonces, X1 - X2 cunlple
SLrl>orrgtrrnos qLlc se clispone

qr.le:

1. lLrl-,2: E(Xr - Xz):

2. o7r-r:
3.

Var(Xr

-2):

l-tt - llz,

o?-l- oZ
I

TL1

-ln2

Para n1 y n2 suficientemente grandes, Ia variable aleatoria

(Ft -x2) - (pr-

7-

sigr"re

t'z)

aproximadamente una ley normal estndar. Es decir,

Pr(xr -xz < a =e, (z

<

t-(tq-pz)

t-(tq-pz)
):.(

Para la mayora de aplicaciones, ya se obtiene una buena aproximacin si n1

>_

25 y n2

2 25.

Ejemplo. Una

marca de automviles tiene dos plantas que ensamblan el mismo modelo de autos
El rendimiento medio de estos automviles debe ser de 40 km por galn, con una desviacin estndar
de 5 km por galn. La empresa tiene la poltica de regularmente comparar los rendimientos de ios
carros ensamblados, escogiendo muestras aleatorias en las dos plantas. Se tomaron sendas muestras de
tamao 30 y se control el consumo promedio de cada una. Hallar la probabilidad de que la diferencia
entre los promedios sea menor a 2 km por galn.
Soltcin: Se tiene eue

: lL2: 40, o1 -

02

5, ny

nz

30. Por tanto,

<z< 2-(40-40
r:d------'=t
t5'

tl-L-

o(1.55)

o(-1.55)

Vro go

0.9394

- 0.0606

0.8788.

6.4.3. Distribucin de muestreo de la diferencia de dos medias, con varianzas


desconocidas
Supongamos que se dispone de dos poblaciones que siguen una ley normal: la poblacin 1 sigue una le.M (lrr, ol) y la poblacin 2 sigue una ley ,A/( 12, 03) . Sean X 1 y X2 las media muestrales de dos rnuestras
aleatorias independientes de tamaos Uy n2, seleccionadas respectivamente de las poblaciones 1y 2.

6.4. Otras disribuciones de ntuestreo


Caso

1.

Las varianzas poblacionales son igualesz ol

o'3,:

191

o2.

Lr r'r'irbkr alcat<llia

sigue una ley corr

Caso

2.

Las varianzas poblacionales son diferentes: ol

I o|.

La variable aleatoria

sigue una ley con g 9.1., donde

(*.*)'

9-

Cuando g no es un nirmero natural, se redondea al entero ms cercano.

6.4.4. Distribucin de muestreo de la diferencia de dos proporciones


Supongamos que se dispone de dos poblaciones independientes, que siguen distribuciones de Bernoulli
de parmetros p1 y p2, respectivamente. De Ia primera poblacin escogemos una muestra de tamao

n1:Xy,Xzr...rXrrrydelasegundapoblacinescogemosunamuestradetamaorl2iY1,Y2r-..rYnrConstruimos las proporciones muestrales de

<<xitos>>:

1ntlft2

Ft:Lfx,
a
fl,'t
i:l

Entonces, F,

-.-rr
t

\- -.

i:t

Fz cumple que:

p,-Or: E(i'r - fz) : pr -

y Fz:!fy,.
nt- u

1r
,^
'*-\rr

p2;

pt(J-pt).pz1-pz)

^\

va
-Pt-P2

Para n1 y n2 suficientemente grandes, la variable aleatoria

vaLtul

tt)t
r''/

TL1

n2

Captulo

L92

6.

Distbuciones de Muestreo

sigue aproximadamente una Iey normal estndar (por el

Pr(Fr

Fz

lt) =rr( , t

t-(pt-pz)

ffi

del Lmite Central). Es decir,

t-(pt-pz)

U"r-rr"

Un2

Ejemplo. Una-6rma especializada en sondeos polticos afirma que el 30 % de las mujeres y el20%
de los hombres estn a favor de la reeleccin del actual alcalde. Si se hace un sondeo aleatorio a 150
personas de cada sexo, con qu probabilidad la diferencia entre las proporciones muestrales de las
mujeres y de los hombres es, en valor absoluto, menor a 0.19?

Solucin: Tenemos eue Pa : 0.3 y

P^:0.2, rlh: rlm:

n1o

-pt-rn

Buscamos la probabilidad Pr

pt(10

-0^l

(lfn

< 0.19)

- 0.3) , 0.2(1 - 0.2):0'00247'

150

- f^l

'* ff

< 0.19):

Pr(-0.19

(0.3-0.2))
o r0.le\ \/0.00247 /

:
:
6.4.5. Distribucin

0.3(1

150. Ademrs,

o(1.81)

<Fn-A'
o(-1.81)

<

0.19)

(0.3-0.2)\
r/0.00247 )

_* l_0.le-

0'9648

- 0.0352

0.9296.

de muestreo de la razn de dos varianzas

La ley de distribucin F
Sean X1 y X2 dos variables aleatorias independientes que tienen distribucin
de Iibertad, respectivamente; entonces la variable aleatoria

,,

y2

con nL

y n2

grados

xrlnt

' - Vrln,

sigue una distribucin


(Vase la Figura 6.3)

(de Snedecor) con (n 1, n2) grados de libertad, que se Ia notar como

Figura 6.3: Funcion de densidad de la distribucin F

F(n1,n2)

6.4. Otras distribuciones de ntuestreo

193

Su funcin de densid

-??2\ n,/2
-/rt
I (-)n'i"'n,
/

rl-\ _

n2f2

,'nt/2-1(n2

.(?) ,G)

J\.1 )-

I n1r)-('nrtnz)lz,

si z > 0;

sir(0.

0,

La esperanza y la varianza son:

E(Y)

"^,sin2>2
TL2

2n|(n1+ n2 - 2)
y Ya{V1: nt(nz-2)z(n2-4)'

sn2>.4.

(nt,nz) que corresponden a sus grados de libertad del

Ntese que esta ley depende de dos parmetros

numerador y del denominador, respectivamente.


Los valores de las probabilidades vienen tabulados. En la tabla 4 del Apndice se presenta el valor

para el cual la variable aleatoria V

F(n1,n2) es igual a una probabilidad a: Pr(V

) r) :

q.

Para la lectura de los valores porcentuales del extremo inferior de la tabla de la ley -F se emplea la
siguiente relacin:

F1r-,"(u,nil p,()r,nr)
Ejemplos

1.

Determinar el valor de

2.

Hallar el valor de

) r):0.05, donde V - F(6,9). En la tabla de la ley F


correspondiente a a : 0.05, se localiza los valores de n1 - 6 y ,z: 9, para los grados de libertad.
Donde se cruzan la columna y la fila correspondientes se lee el valor z : Fo.os(6,9) : 3.37.
Pr(V < z)

tal que Pr(V

tal que Pr(V { r):0.05, donde V - F(6,9). Aqu, n1


Pr(V > r) : 0.95. Por la relacin anterior,

:6, TL2:9 y si

0.05, entonces

Fo.gs(6,9)

1L :
,. ou.g,

^:0.244.

^2

d" 1
si

La ley de distribucin

rpongamos que se dispone de dos poblaciones que siguen una ley normal: la poblacin 1 sigue una
ol) y Ia poblacin 2 sigue una ley J!'(pr,"}). Sean sl y s2rlas varianzas de dos muestras
ieatorias independientes de tamaos n).y n2t seleccionadas respectivamente de las poblaciones 1y 2.
trntonces, Ia variable aleatoria
S

-.r-,A/(21,

'n- '?1"?
'31"3

:-3-ue

una distribucin

-F'

con

fengamos presente que si

(rt - I,n2 -

o?: o3:

7) g.I.
t

02, entonces f'

: 3 - F(n, D2

!,n2

I).

Ejemplo. Una marca de automviles tiene dos plantas que ensamblan el mismo modelo de autos.
=l rendimiento de estos automviles debe tener la misma media y desviacin estndar. La empresa
--ene Ia

poltica de regularmente comparar los rendimientos de los carros ensamblados, escogiendo

t94

Captulo

6. Distrbuciones de Muestreo

rnrr<lstlas aiertorirs en las clos plarrta.s. Se tonluorr serx.ls mrrestr'lrs cLc tarriro 30 y se controlrj lr
clcsvircicin estirrclar clc:l corrsumo clc c:acla urrr. Hallar' 1zr probabilicLrd clc quc lr clesvircicin cstrrc1-rr
cle una rnucstr] ser al rnenos 1.5 r't:<;es nravor qrtc lir clt: l:r seguncla.

SoLttcin: Se tiette

c-rc:

", (;
Como F

: t: -

")

:.,( p,.r^)

F(29,29); entonces.

/.?

001<r.(
La probabilidad exacta cs Pr

(#a2.25)

> 2.25) <

o.o2b,

:0.01632t

6.5. Ejercicios
Distribucin de la media

1.

Para una prueba de aritmtica se sabe, con base en Ia experiencia, que la puntuacin media es 7[t
puntos con una desviacin estndar de 12.5. Si se aplica la prueba a 90 personas seleccionadas
al azar, aproxime las siguientes probabilidades:

a) Pr(68.5 < X <71..5);


b) Pr(66 < X <74);
2.

o
!).

c) Pr(X > 72);


d) Pr(X < 67.5).

En una ciudad, el peso de los recin nacidos se distribuye segrn una ley de media : 3100 g :
desviacin estndar o : 150 g, Halle los parmetros de la distribucin que siguen las medias de
las muestras de tamao 100.
Un actuario estableci el siguiente modelo probabilstico sobre los sueldos que reciben los trabajadores en el sector de la agroindustria:
Sueldo

200

300

400

500

600

Pr

01

0.2

0.4

0.2

0.1

Si de este sector, se toman 30 sueldos, aI azan,

a) Halle la esperanza y Ia varianza de Ia media muestral;

b)

4.

Calcule la probabilidad cle que la rncdia mnestral se ubique entre 360 y 430 dlares.

Las normas internacionales de calidad indican que los neumticos deben durar al menos 33 m:l
km. Un fabricante de neumticos seala qlre su producto tiene una dulacin promedio de 34 nrkm y desviacin estndar de 4 mil km. En un iaboratorio que controla la calidad de fabricacin s=
probaron 36 llantas de esta marca. .Cul es la probabilidad de que, en promedio, los neumticc'.
probados no cumplan con las normas internacionales?

IEste valor se obtuvo mediante el empleo de r.rn proglama conputacional.


Nosotros) por la lirnitacir-r cle las tabla-.
solo podemos acotar el valor de la probabilidad.

6.5. Ejercicios

195

5. El tierripo

qne los usurios dc nna emplcsl intcrlplovirrcial de transpolte esperan l)ar'r cpre stl
brrs salga clel telrninr1 es rrn r'ariabk: alcatolia con mcclia. rle 8.2 rnin y clesr.'iacin estnclrr cle
5.5 rnin. Sr-rporrga qnc err uri lus se ernl;arc:trorr 49 p:rstr.jeros. Halle lr probabiliclacl cle clue el
tienipo plorneclio quc ellos turrielori cllre esl)elal sel:

a) rnenor a 10 mirr.

b) entre 7 y

10 rnirr;

c) mayor a 7.5 rnirr.

La gente que freclrenta cierto bar tiene una probabilidad de 0.001 de salir y cantar con el grupo
que est actuando. En una noche de fin de semana hay 150 personas en el bar. Cr-rl es la
probarbilidad de que al rnenos una pelsol1a salga y cante con el grr-rpo? (Suponga que cadr
persona en el bar toma la decisin independienternente del resto. Halle el verdadero valor y erl
aproximado)

[1.

El tiempo de permanencia de los automviles en un gran parqueadero es una variable aleatoria de


media 176 minutos y desviacin estndar 40 minutos. Calcule, aproximadamente, la probabilidad
de que el tiempo medio de permanencia en el parqueadero de 100 automviles, elegidos al azar)
sea superior a 180 minutos.

8.

La estatura de los varones de 18 aos de Quito sigue una distribucin normal de media 162 cm
y desviacin estndar 13 cm. Se toma una muestraalazar de 85 de estos chicos encuestados y
se calcula el promedio. Cul es Ia probabilidad de que este promedio se encuentre entre 159 y
164 cm?

9.

EI centro de cmputo de su universidad dispone de un servidor para gestionar las pginas web
personales de profesores y alumnos. Supongamos que la cantidad de memoria ocupada por una
de estas pginas puede considerarse como una variable aleatoria con una media de 1.3 Mb y
una desviacin estndar de 0.3. Si el servidor va a gestionar un total de 500 pginas, calcnle,
aproximadamente, la probabilidad de que la cantidad promedio de memoria necesaria supere los
1.32 Mb.
Se efectu un anlisis sobre Ia duracin de las mquinas impresoras, de una cierta marca) que
tienen las empresas prblicas. Se eligi una rnuestra de 179 mquinas utilizadas en una empresa

10

elegida al azar. La vida media de las impresoras result ser de 3.33 airos y una desviacin
estndar de 2.05 aos. Con una probabilidad del 99.7%o, en qu intervalo de tiempo puede
considerarse que se encnentra la vida media de las impresoras de tal marca?

Con una muestra de 160 entrevistas realizadas a mujeres que trabajan, result que el gasto
promedio mensual en arreglo del cabello fue de 39 dlares y desviacin estndar de 5.2 dlares.
Con una probabilidad del 99.7To, entre qu lmites variar el gasto medio en arreglo del cabello
para las mujeres que trabajan?

Un proceso automtico llena fundas de chifles cuyo peso medio es de 450 g y una desviacin
estndar de 3 g. Pala controlar el proceso, cacla hora se pesan 36 fundas escogidas al azar'; si
el peso neto est entre 449 g y 451 g se continlra con el proceso, en caso contrario se detiene el
proceso para recalibra,r la mquina.

a)

Cul es la probabiliclad de detener el proceso cuando el peso neto medio realmente es 450
b')

b)
_.f

-'f

Cul es la probabilidad de aceptar que el peso neto promedio es 450 g, cuando realmerite
es de 448 g?

La vida til de cierta rarca de llantas


desviacin estndar 3 mil km.

sigr-re unt-r

distribucin normal

con media 38 mil km y

Captulo

196

a)

6.

Disribuciones de Muestreo

Si Ia utilidad Y (en dlares) que produce cada llanta est dada por Ia relacin
100, cul es la probabilidad de que la utilidad sea mayor que 8900 dlares?;

Y :0.2X -f

b) Determine el nmero de tales llantas que debe adquirir una empresa de transporte

para

conseguir una utilidad media de al menos 7547 dlares, con una probabilidad de 0.996.
14.

En Manab, el peso de los esDosos y de las esposas se distribuye segn las leyes
y N(64,69), respectivamente, y son independientes. Si se eligen 25 matrimonios, ^/(80,100)
al azar, de
Manab, calcule la probabilidad de que el promedio de los pesos sea a lo ms 137 kg.

Distribucin de la proporcin

15.

Se extrae una muestra aleatoria de 150 elementos de una poblacin binomial corr pt
es la probabilidad de que Ia proporcin muestral satisfaga

16.

4' cul

*=U= *t

El suceso A tiene una probabilidad de 0.4. Esto significa que esperamos que la frecuencia relativa
de A est cercana a 0.4 en una larga serie de repeticiones del experimento que se est modelando.
Cul es la probabilidad de que en 1000 experimentos, la frecuencia relativa est entre 0.38 y
0.42 (inclusive)?

17.

La FIFA est interesada en conocer si las selecciones nacionales ganan ms de la mitad de


los partidos que juegan en casa. Suponga que se escogen aleatoriamente los resultados de 80
partidos, efectuados en las ms recientes eliminatorias para el Mundial de Ftbol, y se encuentra
que 65% de ellos fueron ganados por el equipo local.

a) Es el 65% un parmetro o un estadstico? Explique;


b) Asumiendo que no hay ventaja de campo, y por lo tanto

que los equipos locales ganan el


juegos,
probabilidad
que
sus
la
los
de
determine
de
equipos
locales hubieran ganado
50 %
el 65% o ms de sus partidos en una muestra de 80 resultados;

c)

el 65%de los juegos fueron ganados por el equipo de casai


provee fuerte evidencia que Ios equipos locales ganan ms de la mitad sus partidos? ExLa informacin muestral (que

plique.
18.

Supongamos que el 80 % de todos los residentes en Guayaquil celebran la fiesta de Navidad (el 25
de diciembre.) Se planea seleccionar una muestra aleatoria de 300 guayaquileos y determinar
la proporcin de ellos que celebran la Navidad.

a)
b)

Es el 80% un parmetro o un estadstico? Qu smbolo usa para representarlo?;

De acuerdo al Teorema del Lmite Central, cmo variar la proporcin de quienes celebrarr
la Navidad, de muestra a muestra?;

c) Determine la probabilidad que menos de las tres cuartas partes de la muestra

celebre la

fiesta;

d) La probabilidad calculada en c) sera mayor, menor o igual si el tamao de la muestra


fuera de 800 personas? (Usted no necesita realizar clculos.) Explique,
19.

En un canal de transmisin de datos Ia probabilidad de que un bits se reciba con un error es


1 x 10-5. Si en una transmisin se envan 16 millones de bits, cul es la probabilidad de que
no ocurran ms de 150 errores?

20.

Segn las estadsticas de trnsito, se ha establecido que en una noche de viernes, en promedio.
1 de cada 10 conductores est ebrio. Si un fin de semana la polica realiza 400 pruebas de
alcolemia, cul es la probabilidad de que el nmero de conductores ebrios detectados:

6.5. Ejercicios
a)
b)
21.

menos de

c) al menos

%?;

L97
10

%, pero menos de 73%?

ms de 12.5Vo?;

Supongamos que el 40% de los votantes est a favor de Ia reeleccin del actual alcalde.

a)

Si se selecciona una muestra de 600 electores de la ciudad, cul es la probabilidad de que


la proporcin muestral de votos a favor del alcalde est entre eI37To y el4570?;

b)

Cul debe ser el tamairo rruestral para terrer una probabilidad det 97 % de que la proporcirr
de votos a favor del alcalde en la muestra no se diferencie de la proporcin supuesta en ms

ie

deI2%?
a_

22.

La mediana de la edad de los habitantes del Ecuador es de 26 aos. Si se seleccionan 100


residentesenEcuador aIazar, calculelaprobabilidaddequeporIomenos el 60% deellostenga
menos de 26 aos.

1.,-,

.tD
Lt)

Se ha estimado que eI 437a de los estudiantes de leyes considera que es

24.

En la segunda vuelta electoral los resultados clan que el candidato ganador obtuvo el 55 % de
los votos. Cul es la probabilidad de que en una encuesta realizada a 169 personas el resultado

muy importante que se


imparta un curso de tica en la abogaca. De una poblacin de 800 estudiantes se tom una
muestra de 80. Calcule la probabilidad de que ms de la mitad de ellos opinen de ese modo.

no muestre una mayora a favor dei candidato?


o

En una encuesta realizada con una muestra de 3000 personas adultas escogidas al azar, ha
resultado que el 35 % toma caf al menos una vez al da. Con una probabilidad del 95.5 %,
entre qu lmites variar esta proporcin para Ia poblacin completa?

26

El tiempo que esperan los peatones para crllzar una va muy transitada se distribuye en forma
exponencial con media de 1 minuto. Si en una hora llegan 95 peatones, calcule la probabilidad
de que por lo menos la tercera parte de ellos tenga que esperar ms de un minuto.

27

IJnajedrecistaexperimentadohaganado eI70% delaspartidasquehajugado. Sienelprximo


mes va a participar en un torneo en el que va a jugar 25 partidas,

<i

-.Lr--

a)
b)
c)

calcule la probabilidad aproximada de que gane por lo menos el 80 % de ellas;


calcule la probabilidad binomial exacrta de que gane por lo menos 20 partidas;
qu hiptesis son necesarias para que sean vlidas Ias respuestas a)

v b)?

Distribucin de la varianza
28

Con el empleo de Ia tabla de la ley X2 Iocalice Ios siguientes valores y represntelos, aproximaclamente:

u) rBss(e);
rr
l.-

xSgg(12);

c) xfrorr(20);

a)

xfrou(to).

29

Si X1 , X2,...,X9 son nueve variables aleatorias independientes y distribuidas segn una ley
It[(t2,32), calcule la probabilidad de que la varianza muestral sea menor o igual que 56.28.

30

Calcule Ia probabilidad de que una muestra de tamao 13 seleccionada de una poblacin normal
con varianza 4 tenga una varianza muestral:

!-

a) menor que

7.01;

b) entre 1.I9 v 2.7.

Captulo

198
31.

6.

Distribuciones de Muestreo

Encuentre la probabilidad de que una muestra aleatoria de 20 observaciones, de una poblacin


normal con varianza o2 :5, tenga nna varianza nuestral s2: a) rrayor a 8.1; b) entre 2.66 y
9.52.

ta

En los ltimos 5 aos, las califlcaciones del exarrren de aptitud para el ingreso a la universidad,
siguen urra distribucin nolmal con variarrza o2 :8. Considerara usted o2 :8 como un valor
vlido de la varianza de las notas de los exmenes que se rindieron este ao, si una muestra
aleatoria de 20 calificaciones arroj un valor de s2 : 16?

J.t.

En una oficina de seieccin de aspiral.tes para optar por una beca se estudia Ia varianza de las
calificaciones para identificar fcilmente a los mejores aspirantes. Para una prueba de matemti
cas se supone que las calificaciones se distril)uyen normalmente con desviacin estndar de 10.
Hay 15 aspirantes a optar por una beca. Calcule Ia probabilidad de que la desviacin estndar
de las calificaciones de clichos aspirantes sea mayor clue 7.

q/
t)1.

En una granja pisccola se mide la varialrilidad en el peso de los peces capturados. Las normas
internacionales indican que el peso est distrilruiclo segn la ley normal con varianza o2 : 225 82
Se pesan 27 peces y se calcula su vatiarrza s2.

L,

a) Estime aproximadamente Pr(s2 >


b) HaIIe Yr(s2 > 362);
o<
JU.

150);

c) Calcule E("') y Var(s2).

El sueldo anual de los ernpleados cle urra iristitucin se supone que sigue una distribucin norrnal
con desviacin estndar de 100 dlares. Si en una inspeccin Ia oficina de irnpuestos toma una
muestra de los sueldos de 17 empleados, determine un intervalo en el que quedarlavarianza,
de los sueldos anuales, con una probabilidad de 0.9.

Otras distribuciones de muestreo


36

Con el empleo de la tabla de Ia ley localice los siguientes valores y represntelos, aproximadamente:

a)

s 1(9);

b)

1(12);

c)

o.ozs

(20)

d)

o05(16).

.)/

Si X1, Xz, ..., X9 son nueve variables aleatorias independientes y distribuidas segn una Iey
/(8, 4), calcule la probabilidad Pr (f ST < 9; 1.09 < t2 < 10.045) . (X v s2 son independientes)

38

En la ciudad capital. el precio rredio de venta de las casas nlrevas es 115mil dlares. Se toma
una rnuestra aleatoria de 10 casas nuevasr resultando una desviacin estndar de 25 rril dlares.
Cul es la probabilidad de que la media muestral de los precios de venta sea:

a) menor de 104mil
39

40

b) mayor de 110500

dlares?;

dIares?

Se tom una muestra de 16 directores de oficinas de una ciudad con el fin de estimar el tiempo
medio diario que emplean en desplazarse hasta su trabajo. Si Ia media cle los tiempos es de 87
minutos y Ia desviacin estndar de 20 minutos, calcule la probabilidad de clue la media muestral
sea menor de 100 minutos.

Con el empleo de la tabla de la ley

localice los siguientes valores y represntelos, aproximada-

mente:

a)

47.

,Fo

r(9,5);

b) ro o1(t2,t2)

c)

'P 025(20,7)r

d) b05(15,4).

Dos muestras aleatorias inclependientes de tamaos 27 y g, respectivamente, se toman de una


misma poblacin normalnente distribuida. Cul es la probabiiidad de que la varianza de la
primera muestra sea r,l menos el cudruplo de la varianza de la segunda?

6.5. Ejercicios
72

199

Dos nruestras alertotias irrclependicntcs cie tanraos 7 y 13, r'cspcc:tivarnente, se totu] dt: ula
rnisrna poblacin rronrrlrnente clistribrriclr. .Cul cs lir probabiliclid cle que la variarrz cle lr
llirnela rnrestla scl rr)r-\/or igrral zrl tliplc clc lr r'rlianza cle lrr strgrrndr mucstra?

1.f
f'J

Sean X1

14

Sean

X2(9)

X1 y X2

, X2

Halle los valores <lc r y b tales

#fr
Pr(o(Y<b):0.925 y Pr(Ylg) :0.05.

Ltna mlrestrr cscogida cle una poblacin

a) Determine la ley

b)

\2(20) ), l':

cle

distribucin de p

Calcule la probabilidad Pr(F

<

/ \,

qr.re

normal cstn<lar.
-. r

: (*f#
)
\Xr - Xz/

'

16).

Una muestra aleatolia de tarnao 16 sc seleccion a partir de una poblacin normal de media 75
y desviacin estndar B. Una segunda muestra alcatoria de tamao 9 se tom a partir de una
pobiacin normal de media 70 y desviacin estndar 12. Sean X1 y X2 dos medias mrrestrales.
Halle:

a) la probabilidad
b) Ia probabilidad
6

Xt - Xz sea mayor
que 3.5 1 Xt - X2 < 5.5.

de que

que 4;

Una firma comercializaclora afi.rma que el peso medio (en gramos) tq y pz de dos marcas de
atrr enlatado, A1 y Az, es el mismo. Para verificar la afirmrcin se escogen dos muestras
independientes de tarnaos 36 de cada marca. Si la rnedia mlrestlal de A1 es mayor que la
media muestral de y'.2, sc rechaza gue Fr : 11,2, e\ caso contrario, se accpta gue Fr : 1tr. Cl'l
es la probabilidad de aceptar eue lr : lt2, cuando realmeute p : ll2 l2? Suponga que las
poblacionales son o?:9 y o2n : 4.
Para comparar la duracin media (en rneses) Ltt y ltz de dos marcas de bateras , A y B, se
tomaron dos muestlas aleatorias independicrrtes de tamarlos 32 y 36, respectivamcnte. Si Ia
duracin promedio (mrrestral) de ,4 es mayor que la de B en ms de dos rneses, se acepta que
ltt ) l-tz; caso contrario, se acepta qlre /t : 1t,r. Calcule la probabilidad de aceptar q:ue 17 ) r"2,
cuando realmente Ft: ltz. Suponga que las varianzas de las duraciones son o2: 16 y o2B: g.

,i

EI administrador dc r-tn edificio quiere decidir la compra de lmparas fluorescentes de mrca 7


o [/. Pala ayudarle a lealizar su decisin) se escogen dos muestras de tamaos 10 y 9 lmparas,
respectivamente, rcsultando las desviaciones estndar de s1 : 200 y sz : 150. Si la diferencia
entre los promedios es rllayor que 173 horas, se acepta eue pt I pz; de 1o contrario se acepta que
l-Lt: llt. Cul es la ltrobabilidad cle aceptar cre /t f -t"2, ctando realmente pr: p2? (Asuma
que Ia vida irtil dc ambas narcas tiene distribucin normal con valianzas iguales.)

Para cornparar los salarios que pagan a sr.rs empleados dos fblicas cle cobijas, San Lucas y
Cebra, se escogen dos muestras aleatorias cle tamaos 16 y 13, respectivamente, de las dos
fblicas. Result que la^s desviaciones estindar filerori sr: I20 dlales y sc : 55 dlares. Si
la difer-encia entre las rnedias rnnestrales no es tr]yor a 65 dlares, sc acepta que ,r,1 - /-2; caso
contrario, se accpta eue /r,1 I Itz. Cul es la probabilidad de aceptar que /1 I p,z, cuando
lealrtretrte Ft : I,tz7 Suporrga que los salarios, cn ambas empresas, siguerr una distlibucin
nornral con valianzas difeleutes.
;c

Dos plogramas de televisin tienen como latings 40% y 20Vo, t'espectivamente. Se tom una
muestra de 300 hogales qne poseen televisor, durante Ia transmisin del programa A y otra
muestra de 100 hogar"es durante Ia transmisin de B. Cul es la probabilidad de que los
resultados muestren qr:e el programa A tiene un rating mayor al de B, en un 70%?

Captulo

51. Un frbricarrte

6. Distribuciones de Muestreo

cl 30% de mrrjcrcs y ei 20% de hornbres prcficren su jabn dc tocador.


a 200 pelsonr^s d<: crda sexo) .colr qrr pr<,rbabilidad ia proporciu
muestrai de mujercs rrelros la propolcirr nrrrestral de valoncs estin en el interrralo (-19 %.
Is%)?
-ifirulr que

Si se realiza lrna crrclresta

52.

Se escoge una mnestra de 600 electores crrc acaban de votar, entre la,s 9:00 h y las 15:00 h, pare,
estimar la propolcin cle votantes a favor de los canclidatos H y M. En una encuesta rerlizada l.
vspera, se estim en 30% y 35% los polccntajes cle apoyo de los dos candidrtos, respectivanielte.
.Cr"rl es la probabilidad cle clue la proporcirr rnuestral de B excecla a la proporcin rnuestral de
A en al menos I0%?

53.

La msica romntica es preferida por el 30% de mujeres y eL25 % de hombres. En una encuesta
realizada a 300 personas de cada-sexo, cul es la probabilidad de qne la proporcin muestral de
mujeres que prefieren la msica romntica, sea mayor a la de los hombres?

Crptulo 7
Estlmacin de Parnnetros

er

Todos ltentos estado lo,cie'rd,r esto,dst'ica, todo, La ui,elo,.


el sentido que cada u"no ha estado octrpado sacando concltsiones
a parti,r de obserua,ciones empr'icas, casi desde el nac'im'icrto

W. Kruskal

:n el Captuio

1 se expusieron varios mtodos qr-re permiten descrilrir un conjurrto de datos de rna-

,-era r'pida, generai y efi.caz; estos mtodos son grtficos y su intelpretacin es fcil, pero tienerr el
:-cortverrieute cte la dcscripci<in cle los datos no es rnica y no sc plcstan para realizar Jrreclicciorres.

:l

rtso clc

la ittforrnacin que se obtiene a partir dc unr muestra pa.la sacar

corrcinsiones soblc

lr

rllacin de la quc ella 1>roviene, se cleuomira itt.ferenci,a esto,d,,stica.

la inferettcia estLdstica que se clescribiln cn ste y los sigrrientes captnlos sc leficlerr


. ia r:stitnrcin de ltarrrtetros, ltr formulacil y verificaciiin c1e hipcitesis soblr: estos ptrlzintctlos 1; l
s rntoclos de

-antearrrierlto cle rnodelos aclecuaclos pzrra krs drtos.

;.1.

Estirnacin

-. teora de 1r estirnacin de parmetros fue clesarrollacla en las primeras dcadas clel siglo XX,
Ilo rurt parte de otra teora (las pruebas de hiptcsis) y sistematizaclir por J. Neyrnarr cu 1934.
-- tualmente, esta teora es la basc de cr-ralquier estudio estadstico.
-"tartclo sr toma ttna nutestra de una poblacirr, e1 olljetivo es tenel un indicio cle los valoles cle los
.-rrnetros descorrocidos de sta. Tal proceso se dc:nomirta est'imarcin y a los valoles crlculrclos
'. inladores.

Definicin (de estimador) IJu cstimador es rlua nieclida estrdsticr qrre permite conocer o
-:,a idea del valol de ttn paliimetro dcsconocido, basndose en la informacin de la mr-rcstra.

- :' ejcrnplo, si disponerrtos cle una


:. rrnedio r conro estirnador clr-. r,.

poblacirr cr-rya rneclia

.r,

es desconocida, es natulal cscogcl el

,:,,selvemos que un estirnar,lol es nna variable aleatolia; rnientras que Llua estirnacirr es nn nrrnct'o.
:--lr.ttrs veces)

los estirnadorcs dc los parzmetros poblacionales se distingr"ren clel verdadero r'rlol


:'--diante el empleo del smbolol Por ejenplo,
20r

Captulo

202
p

verclrclcro rralol clc

f : proltorcin

7.

Estimacin de Parrutetros

la propotciri ltoblaciottal.

poblzrciorral cstirrracla, ir

partir

cle una rnnestr-r.

Las siguientcs secciones lrs declicalenros r cono(icll las plopiecl:rclcs cle los cstinrrdores clc los pnr'metr,,poblacionales, a evaluar su r.aliclez \' r cxporlcr s'.is aplicaciones.

7.2.

Clases de estimadores

Cuando sc obticrre una rnuestra de nua poblacin, el objetivo es tomar una decisiti cu brse de
estadsticos calculaclos a partir de los datos rnuestlales; luego ellos se resumen en frascs como
siguientes:

I..

Ia ciudad se sintonizaba cierto prograrna de televrsrn.

1.

trn 2930 de los

2.

EI nivel dc desocupacin en el pas

t
.).

La mtrestra usando el Material A tiene, en promedio, una fortaleza a la tensin 3.2 unidade.

10 000 hogares de

es

ei

14 % de

la poblacin en edad de trabajar.

mayor que aquella empleando el \4aterial B.

Los estimadores anteriores dan una idea concisa de los resultados de la muestra, pero no inform.:
de su precisin. As, pudiera haber gran diferencia entre tales estimaciones, calculadas a partir C=
una muestra, y Io que uno podra obtener si dispusiera de una cantidad ilimitada de datos. Pr::
ejemplo, 74Vo sera una estimacin razonable (o prediccin) de la desocupacin el prxirno mes; per'(,,
',cun <<buen>> estimador es? Teniendo en cuenta Ia variacin en el mercado laboral, sabemos que e:
improbable que el prximo mes haya un nivel de desocupacin de eractamente el 74%. Sin embargc
podemos esperar que su valor sea <<cercano>> alI4To, y qu tan cercano? Podemos esperar que se:dentro del 10.1% el estimador?, o dentro del tl Vo?, o dentro del +I0%?

A partir de la discusin anterior podemos deducir

que existen dos tipos de estimadores: uno que ci:un valor numrico qlre resume lo observado en la muestra; y otro que, adems, expresa la incertidunrbre debida a Ia variabilidad en los (generalmente limitados) datos. A continuacin definimos m-.
formalmcnte estos tipos.

Definicin (de estirnador puntual)

Sea X1, Xz, ..., X,"Ltrra muestra aleatoria seleccionada de


poblacin con distribucin de parmetro 9. Se denomina estimador puntual del parmefto 0 a
cualquier estadstico que proporciona una estimacirr del verdadero valor de 0.
r.rna

Al estimador puntual

cle d se le

nota d,,.

Por ejemplo, si la media poblacional es p : 6, obtenemos ttna muestra


z : 5.85. sta es una estimacin puntual de 1.

5r

determinamos Lrn promedi,-

Tambin, mencionamos que la estimcin puede realizarse mediante Lrn r-ango de valolcs entre lo.
cuales se encontrar cl verdadero','alor con alta pr-obabilidad.

Definicin (de estimador por intervalo) Un estimador por intervalo

de un parmetro descono-

cido est dado por clos puntos, qne pretenden abarcar el valor leal del parmetro.

Por ejemplo, si la media poblacional es p : 6, obtenemos Lrna muestra y determinamos el intervalc'


: (5.4;6.2), este intervalo es una estimacin de -r,. Posteriormente, indicaremos cmo construir tales
intervalos y evaluaremos su exactitud.

7.3. Estimacin puntual


7

203

"3. Estimacin puntual

No tocio estirnrclor'reliza rrrra Lrnen estirir-cirr clel par'rnr:t,ro Un buerr estimaclor e-q rquel clue est
cerc clcl parmetlo estirnado; para lo crial clebr: cr.rmplil cieltas propiccladcs) clLle \anios a examinarls
a continuacin.

7.3.1. Propiedades de los estirnadores puntuales


Lo irnportante de urr estimaclor es qrie 1 pueda ernplealse de manera confiablc; por cjcrnplo. que no
difiera de manela aprcciable del verdadero valol dcl parmetro poblacional.

Definicin(de estimador insesgado) IJn estirnarlor I

es insesgado para

cstimar

E(6):e
De otra manera ? se llama sesgado.

La Figura 7.1 muestra un estimador insesgado y un estimador sesgado

D-L -_

:-'
i::

Figura 7.1: Estirnadores insesgado y sesgado.

\otemos que la rlistribucin muestral para el estimador sesgado est desplazada hacia la derecha

4. Este estimador
E1 sesgo

de

sesgado, probablemente, sobrestima 0.

de un estimador se mide corno


sesgo(?)

:E(A) -

Ejemplos
l

1.

La media muestral

es r,rn estimador insesgado de ;, ya que

E (X)

,n

El

estaclsti c<

\/ -X2 :

>a

'

,i-t

x?

17

no es un estimador insesgado de r, ya quc E

.'l- disponemos de dos estimadores insesgados de , interesa tener

(t/F) + u

nn criterio para elegir uno de ellos

Definicin(de estirnador eficielte) SeaL?1 y ?2 dos estimadores


que es ms efi.ciente que d1 si Var(d2) < Var(d1). (Ver Ia Figura 7.2.)

insesgados de d; ?2

se

L)ttptrtlo 7. Estitnacin de Partnetros

204

E(0:) = 0

l-igrrla 7.2: Estirnrcloles

insesga<,los corr clistirrti valiarrza: Var(d2)

< Val(91)

lDados dos estimaclores iusesgados de un misnro par'rnetro, es irrcferibl escoger_'el nrs eflciente.

vcces se prcsenfa el problema de elcgir entre dos est.irnaclorcs corr propiedades contrapr-restas: Llno
de cllrs es iusesgado y el otro es sesgado, per-o con nrcnor valianza. En estos ca,sos cs necesario dcfinir
una mcdida qrle Dos pcrmita lcaiizar tal conrl>aracin.

Definicin (de error cuadrtico medio) El error curdrtico medio debido a la estimacin
d nrediante D cs ECM(D) - P lf e -hV].

L'

Pol las propiedades de la esperanza

de

se

tiele

trCM(a)

quc

- val(D) + (.".s-oi0;)'
\/

As, paia los estirn.dores insesgaclos, ECM(?;

Varl?;.

-1r*it*rt-tcr,"rpr'"f erilrt."r....lg",=1.1,r.'t"rrgn ei rnenor ECM.I

Ejemplo. Seir X1 , X2,. .. . X5 Lllta rtmestla alcrtotir cle rrna ltoblar.in


: 02, i,: 1, ?, . . . .5. Se tienen los siguieul,cs cstinrrclores clc -r:

par.il la cr-ral E(X)

Var(X)

v
u]

ir:

14 1,

^t

0t: )(xr
'2- * 2_Y),

Lr

,r(Xr +,Y.r + xr;,

0q:-Y:

F-Y2-r-

r("t

Xtr-Xq-X).

a) Segrn el criterio de la eficiencia, cul es el rnejor?; b) Cornparar los estimaclores0zy ?3 rnecliantc


el ECM.
Sol,ttc'in,: Calcnlemos lzrs esperanzas

E(01)

Var'(?1)
VaL(02)

tar'(0)
Var(?a)

y las variarrzas de <:aclr

.r, n(6r:

Vzrr(X1)

,,,

: *r,,
)'

EqBn

,.

:62.

n(Var(.Yr)I

B(?r)

r.uro de los esl.imadores:

')

Var(X3)

(X) + 4 Var'(Xs))
;(Var
44
,2
VallX,) : --.
r-

Var1X5)
)

DO: a,

:- o'
.1
D

7.3, Estitnacitt tuttLual

205

Elcstinta'<[,r03css.sgirclo,rttictrtt1s.1,,,r?,.i.t:,/,usr.rrrirscsgrtles;

r)

estinlldor

<[e 1,

l,) Crlctrlcrtr<-s los

Entonces, el

lol'rrte ticnr ll nrcrror

(r,s

cl rrriis <rfir:i.rrtc).

sesgo(2)

te.gu(?,r)

31 :ttr.
=: ll(),) - 0 : ,lt-lt

E(0!)-g-.

r,

- t :0.

es

ECM(ar)

ECM(as)

Var(?2) +(r"r_,u102)2

o2
:=-*0

Var(?3) +(."rgu1D3)2

:-Ti

o2

3'

.t

El mejor estimador

aclenrs,04:Xcsel rrc.loI

clc los dos cstiru;r, lorcs

scsg<_ls

ECM

r'rr'irrLzt

".

l') :
/7 \2

i:o'

?2 porq,re tienct <ll nrcuor. er.roL cu;rrh-iti< :o nredio.

7.3.2. Estimacin de la media poblacional


ffiffj::ffii1,1;Tl:::T]emos

que el p|orncclio cs rLlI cstiuraclol iuscsgcto


de la media poblacionz y

Supongamos qr-le se obtiene una muestr a X1,

o2. La merlia nluestral

se clefine

La esperanza de X

La varianza de X

....

x,,

de una poblacin que tiene media

y varia.za

,\,"

pol X - :--t
'tL

es

E(X) :

De manera que

,x2.

es

--E
lt

un estimaclor

_1
?t

ttt'' : !@r')

insesgtrcl r.t <I<: t.

es

Vrrr(,{) :

-;t.'I var (')

Var

:*

:-

var(x)

: \qro,
Tt.

o-,
77

;.3.3.

Estimacin de la varianza poblacional

) _lpongamos (lnc sc oltieue rurr nlrrestl,a


-\-1. .\-2.. . . . .{,, (l() lurr
r<;,lrlerci,iu gut: bit:ue rtredia l y variatLzir
.1. El estimador.

5"*l

--,,,

206
os

Captulo 7. Estinacin de Parntetros

rlll cstirlrrclor'lrrrrrlrral

ci<r

o2. rerro lirtuc cl irLc:orrvclricrrl.c clc s<:r scsgado. pol Jo (rc sc rkrfinc

r-ru _ x)r,
- --1-f
,, - 1/-t--'

s,2

t.-1

clr.re e,s

ulr estimr<.lor irrscsgirclc, par',t rr2

Lt esJrer'lnza de .92 es

D(xu -x)'
rt-7

,i.:t

: -1=e (>.r-,"') : ,_-l-rlir(x,,) \t:1

Corno

E(Xi)

li=I

E(-') : t,' - *,sc t icne


', f "
E(s2)
fr' + o") -,
" - L=l

tL2

+ o2 y

,lI

I.).)r.)1,)
+ no2 -i-(npt
11

:
:
L r'arianza de

-t

,,

r2

(r'- #)l
' )

- o2) : n-l

(n

- l)o:

o2.

,S2 es Vzrr'(52)

2oo

(este resultaclo no se clernostr-ar' ya qLle su complejida,J


TL- a
|

sale del alcarrce dc esta obrz-r) .

7.4.

Mtodos de estimacin puntual

Para detelrniual la cstimacin cle rLn pirrmetro poblacional existen varios nitodos, los dos ms imroltantcs son el de los rnomentos y el de mxinra verosimilitud.

7.4.I. Mtodo

de los rnonr.entos

EI rntoclo de estiniacin de los tnornentos fire dcsarrollado pol K. Pealson en 1880. Es r.rn mtodo
gcller'rl t1c estiulrcirr de uuo o ms pirlzinreltos y se brsa cn lr idea de tornrr conro estimadol cle la
media a la rneclir rnuestlal. colrro estirntclol de It rtaliarrza r Ir valianza rnnestlal, y as succsivmente.
denominrdo el A-simo nn'ntento teri,co clr larrariable
nt,cnett,to nnt,e,stra,L es 1r valirble

Err genelirl, si derrotrrnos

/i;-siro

fr,: E(X'),

rrl

i^ : L,

A,

1.2.3..

X.

EI

rL

Entonces, igualamos los correspondientes momentos terico 1'muestrali


ecuacin resultante para d.

pk:

p. y resolvemos Ia

7.4. Mtodos de estitnacin puntual


El itcorrvcuicnte cl<,r cste rrrtoclo

207

es (lrre los estirrrr,:loles olrtclri<[os, rnnc:hzrs \eces sou sesgt(los.

Ejerrrplo. Disp<trrcrrros <le rrtrt lnllestr'r Xt, X2,.. ., I,,. ixovtrtriculr: clc ttttt irrtblaciu t:orr rlistlilrrr<:itr
Ul-9,l , rlorr<lc d > 0 cs clcsc:ouociclo. Hlirr'li cstirnrcirr clc .
Soluc'i'n: Teuemos
n

Pot r,,tr'olaclo.

X;,

t0')

que/:tr(X) -0y I,b:E(X') :Var'(X) +(E(X))2 :+


3

:1

n,

Si igtralarno s ltz

y p2, obtenem..

Entonces, el estimador de

es d

7.4.2. Mtodo de m:ixirna verosinilitud


El mtodo de estimacin pol mxima velosirnilitud fuc desarrollado por R. A. Fishel en 1920. La
rentaja de este mtodo es que utiliza Ia informacin sobre la Iey de distiibucin de Ia que proviene la
muestra.

X1, Xz, ..., X,, una mnestLa proveniente de una distribr-rcin con par'rnetro 0 y ley
procedimiento a seguir es el sigttiente:
Sea

1.

(r;0).

El

Determinar Ia fn:nc'in de uet-osi'milittt,d de la muestra en sLrs valores lespectivos: Esta fuucin


del parmetro d est dada por

L(0): f (Xt;0) x,f (X2;0) *...x.f (X,,d) :


2.

,f

lI'i,:t f l].;e).

Encontrar la .funcin de log-uerosi,mi,litud tomando el logaritmo de la funcin de r.erosimilitud.


L(0)

3. Hallal el valor cle d que maximiza

:log(l,(d))

Ia

:i
'i:7

ros.f

(x;0).

log-r'erosiniilitud. En este casoT es el valor'?, q.,"

de Ia ecuacirr

cs solucin

dt
d0
-:n

Observacin. Si lr distribucin de probabiiiclad contierre k lrarmetros,


ie rnxirna verosiniilitucl de crda uno ser

ar,

00t

Ir

01. 02, . . ., d., la estinracin


solucin dc las ecuaciones lespcctivas:

_at, _ t)
002

at

/l

0o*

X2, ..., Xr, Llna muestla provenierite de tirra poblacin con distribucirt
Hallar los estimadoles de p. y de o2.

Ejemplo.

Sea X1

SoLuctn: La funcin cle densidad de la ley es

(X=
f)'\
/(X; p,o2) : +"*O-'v (2o2 )
/2tro
\

N(p,o2).

Captulo

208

7. Estimacin de Parutetros

Dc ttrurcrr clrtc la fruiciciu ck: r'clr-silrrilil rr<l cs

r,(r.o2)

(1*, t,,o2))" :

r-g)
(
h"*

: )""*n(-Dry)
La funcin de log-verosimilitud

t(p,o'):

es

Iog(.1(r,

o2)): -|bgQno2) -

1'r

*f(xo-,)'
O'

i_1

Derivando I esta funcin respecto

11,

e igualando a cero da

#:-o* # lrx,de doncle p

p):0,

- x.

Por ctlo laclo.

nI
+;VDtx' - p)2 :o
-t7
i:l
1

0t,

o(ot)

'L

IL

cuya solucin es o2

l.D.
1.

2.

Drxn-X)'

l-1

S*2.

Ejercicios
<El pr-incipio subyacente etr todas las tcuicas de inferencia estadstica es que nllo Llsa estadsticos rnuestrales para aprendel algo (es decir, para inferil algo) acerca de los partirnetros poblacionales>>. Si usted entendi Io qr.re quiere decir esta afir'macin, escriba uu 1>iillafo en el que
describa una situacin en la que se pueda emplear un estadstico muestlal para irrfelir algo sobre
uu palrimetro poblacional. En su ejemplo, identifique claramente Ia rnuestrtr, Ia poblacin, el
estadstico y el patrnetro. Sea trn especfico como sea posible y no use cjelnplos clad<ls en el
Iibro.
Se tomr Lrrta

muestla cle tamairo 4 de una lroblacin de rnedia

t"

varianza

o2.

Sc lrroptnre los

siguientes estimadores de I media:

0,:

Xt -l Xz + 3X4

03: Xt'l

Xz

Xs

Xq

-f
02: Xr Xz + 2XJ

4'
Xt*Xz*X+X+-J
6n:

lndique su orden de prefelettc;ia (clel me.jor al peor)

1,

explic$re los motivos dc su <rlrsificrli,irr.

7.5. Ejercicios
3.

Dos muestras alcatorias independientes se extraen de una poblacin con media p, y varanza o2.
Los tamaos nruestraleS Sor ??,1 y rL2 : ? v tu. meclias muestrales son X1 y X2, respectivamente.

2'

Para estimar a lL se proponen tres estimadores,

\'t
a) Diga si 1os estimadores

: Xt. Tz:X', Tr: Xt !


2

son insesgados;

b) Encrrentre su varianza;
c) ,Cul de los tres estimadores

4.

Si se dispone de una muestra

Xz

es mejor?

Xt , Xz, X3 de observaciones que siguen una ley exponencial

e Q' 1 0)

Considere los siguientes estimadores

0,

*t .
: .yr, 0., : ', :2"2

a,

: IJ:3!2, :x
an

a) Cules estimadores son insesgados para d?;


b) trntre los estimadores insesgados de 0, crl estimador

5.

escogera usted

y por

qu?

Si se dispone de una muestra Xt , Xz, X3, Xs, Xs de observaciones que siguen una ley de Poisson

P(^).

Considere los siguientes estimadores:

a,
0n

Xt -f2Xz * X: *

2Xq -f Xs

:xl+xl.

a) Cules estimadores son insesgados para )?;


b) trscoja el mejor estimador insesgado de ).
A partil de una poblacin que tiene media p, y varianza o2 se tomalon tles muestras de tamao
rtr : 7, n2 : 74 y nz : 9. Sean sl, tS V t:3 las varianzas muestrales calculadas a partir de las
muestras. Compruebe que
t

tsl+usi?r+osl
30

es

un estimador insesgado de o2.

El nmero de clientes que ingresan a una librera en una hora es una variable aleatoria X que
sigue una distribucin de Poisson con media ). Se dispone de una muestra aleatoria Xt, . .., Xn
del nmero de clientes por hora.

a) Determine un estimador inscsgado dc );


b) Las ventas en Lrna hora se da por V : 4X + X2. Demuestre que E(V) : 5) + tr2;
c) Determine un estimador insesgado de E(lz) empleando toda la muestra Xt,. . . , Xr,.

Xl y X2 son dos variables aleatorias independientes


Var(X1) : Var(Xz) : 02 j determine si el estimador.
Si

es

un estimaclor insesgado para o2

tales que

E(Xr) : E(Xz) : p

Capitulo 7. Estirnacin de Parrnetros

2LO
a

estirnaclores insesgados cl<: d y (lue Var(Dr; - o1 y V.Lr(2) :


Se
formr rrn rrLlcvo estirladol cle meclirntc d3 - a?t + (1 - a)02, (0 ( a ( 1). Si ?r v 0'2 Sott
indepenclicntcs,
Suronga q,r,r

a) velifique

b)
10

0r y 0, ,uu

"i

.1.," 03 es insesgado;

Cmo seleccionar cl pal'a reclucir Var(?3) al mnimo?

Suponga qr-re X1 y X2 son dos medias muestrales caLculadas a ptrrtir de dos nurestras dc tarnao
n,r y n2, respectivamente, obtenidas dc una poblacin normal de media r, y varianza o2.
a) Se define un estimador de

b) Halle el valor de

11.

cy

p: Xs

aX

a)X,, (0 < rl

t+(1-

1). Pruebe

que es inscsgado

que minimiza Ia varianza.

Considere una sucesin de variables aleatorias Xr, Xz, ..., X", independientes e idnticamente
distribuidas que siguen Lrna ley uniforme en el intervalo l0 -7;0 +tl, donde I es un parmetro
desconocido. Denotamos por X," el promedio de estas variables.

a) Calcule E(X") y Var(X,,);


b) Construya un estimador 7,, del parmetro d qrre sea consistente e insesgaclo y calcule

su

error cuadrtico medio.

12.

Sea

X1,

..

., X,, una muestra aleatoria de una poblacin con la siguiente distribucin discreta

Pr(x: t):2#,

Pr(X

- 2): 2e'

e (0,1)

Halle el estiniadol de d por el mtodo de los momentos;

r)

b) Halle el estimador de d por mxima verosimilitrrd;


c) Dernuestle que los clos estimadolcs encontrados coinciden.
_1.

Sca X1, ..
r e

.,

X2s una mnestra aleatoria de tamao 25 una poblacin binomial de

(0, 1).

Pr(X: r):

Determine
11 veces

14. Sea

Cp'"(1

estimador de mxinia
valor2ocnrre9veces.

(,):

r2-z

el valor 0 ocurre 5 veces, el valor 1 ocurre

X,, una mr-icstra aleatolia

de

sir)0,
{"n-,'*'

(0e

caso crntrario.

a) Calculc E(X) V obtenga un esl,inrrdor de g meclirnte el rntodo cle los


b) Determine si el estirnrclor cs insesgzrdo;
c) Obtenga el estimaclor de 0 por el mtodo de nrxima verosimilit,.rd:

d)

Cui cle los dos estirladores es ms eficiente?

e) Calcule cl ECM d,eiz.

15. EI tiempo, eu ltoras,

que dura un elemento electlcinjco es Llna vtrriable aleatoria ? que tienc.


distribucin exponencial de 1:irrmetro ). Pala estimrr ) se pruebzrn 30 elemerrtos y sc enclrentLa
que 18 fallan antes de Ias 600 horas de uso.

7.6. Estintacit) pof intervtlo

217

rL) \lr'<li;tLrl,: r'l Lrri'rtr.rr-[<l <l.c rulxiLrlt vctosiurililrr<1. <rstirnar I;r lrLo1>or'{:irjn
rrtt' Irll;ur ;r]l1r' <lc l;ts 0()() lrrlr'rs

lr) tltilir

r:

r'I tt'ru]ttrlo rlt ii)

I)u r ol

rltrrrt'l lul

osl irrrr,-lor

rlr:

<l<r

t<t<los ]os clcrrrclrtos

).

10. A lr.' l;trgo rlc rttL tio, lr ltcnrl rrr rlc tigrillo
Scg-rirr

tllr

('sl

ttrIio

ttrt]iztclr-'

prrctlc tcrrcr rurr o rLos r:r'its. o lr() t<:rrct rrttrgrtrr;r.


I)
pot lllr grrrl)o tl<r zorilogos. lir plopolr:iirr rle lrcnrllrls slll (:llts os -..)
.)

c()II turii t:rrt t-'s l..)

rlicr,tr.rs (lrrc la l)l(rl)olci()rr il<t


rlorrclc cl palrinrctro ?) torll un \'llol'ctrtlr:0 v 1.
lt cl<: Irts

(:rrsoijl-1,,

Irs lLcrnlrr's c:orr clos

r)

t) IJrillc <,'l urirnr:Lo mc<iio csl)cllirclo clr: cr'as pol lrcrnlrrir r lo lalgo clc un rrio:
lr) AI lcllizar un cstrldio de 200 henrlrr's chrlantc nu o, cl ccripo cle cientfir:os

nlcliciorri(lo

cncontr' 55 hembras quc rlo hur tenido crt.rs, 106 quc h.u) telido urra cra y 39 clue han
tcnido <1os. Eshirrrc el par'rnctro p l)or el rntodo cle lrs lnomentos.

L7. EI control tle r.rna paltidzr de loclillos se rcalizr clasificardo las piezas en leqneas, rrormales y
glatrdes. Ltrs propolciones tet'icrs sc stlporel) pr : 0.05; pz : 0.90; ps : 0.05. Pero sc sospeclta
clLte h'r. aumentado la dispersin y, por tanto, las piczas siguen las ploporciones: pr : 0.05 f ;
pz : 0.90 - 3n; ps : 0.05 + 2r. Se anrlizal 5000 riezas obteninclose n1 : 7278; n2 : 2928;
?B : 794 cle cacla clase. Obtenga una estimaciu cle ntxirna verosimilitud cle .

7.6. Estimacin por intervalo


lo cue se indic elr Llna scccin ntelior': Ios intervalos estadsticos exrresru la incerirlLunlrrr: clcbicla r la variabiliclad cle los datos mrrestrrles. Aderns. l)ara c{ue ellos tengarr validez eu

?ccorclerrros

.,r rltlic:acitt Pr'cticrr, ticnett cltte crtrnJllil con alguntrs hiptesis l;risicras, como que la rnuestra se clebr:
irteuct de lrrncta alcatoria, irrdepeudientc y debe estr'iclnticrmerrt<l clistliltuida, lo qne llo siempl'c
.= logla. increnrentanclo ia rncnciorrada incertidumlre.
-is. por ejcrnplo, con base eu ula rl)uestr'r cle hogirres crr los quo se est r'icndo televisin, podemos
Itrstruir urt inten alo qlre coltenga, corl un glado cspecfico de coufirbilidad, la rnedia o la desviaciu
,-.tnclal clel tierrrpo clue ia roirlacir'r consrrltacla vc tclcvisilr
.

-rtltes cle aulliz1r los r-lifclctrtes crsos) cxnrincrnos zrlgrrntrs icletrs irrclirninrlos.

Dcfinicin (de intervalo de coufiatrza) Uu interr'rlo cle r;onfianzl cs nn rango cle valores,
llcttlrclo zr par [it de ios clatos rnuestrarles, el clral 1-rrobablcrnento incluye cl verdadero vrlor cle nn
-,

r irrret,r'o

.-, cadr

lescorrocido.

intcrr,'alo cle confiattzr se Ie

rsocit rrna

-'llratiirnctlo . A tal ptolrabilidarl


tie

i.n,.feri,tt

se lt:

1l'obtrbiliclacl

clclirnitn

Litn'ittt srtltel"ior'<l<t c:<trrfiurza:

(l - o) clc clue corrtenga el veldrrlero

t,tc,l d,e cort,fia,ttzn,

(LIC:.LSC). Esto

r\(LIC<0<LSC',):l
-',- irrtt:tr'rkr

<1ur:

s<:

y a los cxtrernos

r'esLunc cll

ri.

c:rttnllle cstrs c:ottdicioues se <ierLorlinit'i,tttet'uo,l,o d,e co'n,tiarr cle rrivcl

(1-or) xI00(/r.

- :t t<:ucr tr,'sultitclos firlrl<s. ci rrivc] clc r;orrlirnzr <lcbr: ser'rlto, lo rnis cercir.lro a ruro:
., f ornr 0.9. 0.95 o 0.99.
:-

\/alor
cltl irLtelvalcr

gc:trt-.rtrlnrerrtc

rtrcho de tLl iltten'alo clc crttfirrtzr nos da lr icier clc curnta inc;cltidumble existe, alredcdor del
,:iurctlo rlesc:onociclo. Uu inbelvalo muy rncho prrede inclicrr qtre deber'arnos recolectar ms datos
-"-tes clc dt:cil algo tlefinitivo solre el partinretro.

212

Captulo 7. Estitnacin de Parntetros

" Estimacin de ia rnedia cuando la varianza es conocida

7 "7

Supongir (llre se deser estinrar 1r nrcclia r c1e rina irolrltic:irirr crlr.a r.llirrLzr-i o2
tal efecto se dispone cie una rrLueslla clc r, rnecliciones: z1, :L2., ...1 :L:,t1.

vcl

Ulr intervaio cle conlianza para lir mcclia poblacional


o

(t-

ttt/,2

r1r

.;

clel

c-.s

c,o,rcrc:iclrr

y <rc pala

100(1 a) %, cst cla,:,lo por


(7

vn

1)

Dondc:

es el

Ia, desviacin

zo2

tamaio de la rnuestla"
estndar de la pobiacin.

eI valor z que colresponde al .",- I en el extlerno superior de tra distribucirt


2

estrrdar; es decir, 7

:
(z*2)
\ttl.,/2,

Figula

(Figura 7.3).

Intervaio de estimr.cin

Acln se aplicir el Teorerra del Lmite Central

Iln

Xrr

norrnai

es aconsejable tencr un tamro rnucstlal

n)

25.

siguiente tabla se preserrta ios intervalos de confirnza ms corrLrrrtnente usaclos:

Nivel de
cor:fiarlza
0.90
0.95
0.99

0.10 1.6.15
0"05 1.96

0.01

2.58

I.6a5
T.
'-u

/n
1.96 o I yE
oI

2.58 o I

y,

;)
4),
;I

1.645 o l1/n,

t.s6

oI
2.58 o I

l
y.

Observaciones

Si cl tamro de l rnucstrt cs suficicttcmentc gltrrrcLc (rt / 25) 'se <lescorioce 1r r'rri-Lrrza. -.


i)uecle rrtilizar el intervalo 7.1. r'eeuLplazar.Lclo {r }lol'su i:stirnrclor',s) siri piclicla cle cxrctitlLcl

2.

Prresto (llre Para urr valol de znr2:3 sc tierie un rtir.cl cle r:ou{ianza clcl 99.7%- crr las zrPlicacionc..
prcticas sc supone que nrl intelvalo <le conlianz al 99.7% conticne el r'rlol cle lir rnediir, co
I

rttltt ttO'"'''O

'

Estirnacin de la rnedia cuando Ia varianza es conocida

2L3

Ejernplos
Deterrninar un intervakt cle confianza cle nivel 95 % pala

y o2 :3.24.

:3.24, o sea o:
La corrfiabilidad es 7 - a :0.95; entonces) o :
norml Za/2: zO.OZS: 1.96.
Sol'uci,n: Sabemos

cuie

o2

De rnanera que el intervalo

Ir

rneclir

poblacional

p"

n: 36,r :

15

1.8,

0.05 y

ol2:

0.025. De la tabla de Ia distribucicirr

es

/
o=) : /
I.B
^=-=
(r^ o\
go 1.8\
- .. o .o,' 'atz
| ''""
ltt-1.96{;1b+t
'o/2
'''
''rw
lE1"
\n)
\'"
76t
J36)

(L4.4t2;15.588).

En un estudio a trabajadores informales se seleccion una muestra aleatoria de 50 individuos


en una semana dada. Para cada uno, se determin el nmero de horas semanales de trabajo
efectivo y se obtuvo un promedio de 46 horas. Si se asume que la desviacin estndar es 3.64
horas, estimar la media del nmero de horas trabajadas por todos los informales, con un nivel
de confianza del 98 %.

Solucin:
Adems,

Se tiene que

n : 50, r

46

y o :3.64.

1- c:0.98, a:0.02, (lf2:0.01 y zoot:2.33.

EI intervalo resulta:

o
o\ : ( qA
3.6+
z,2J-;T
+ z*2:71
2$:=;46+
*,"
"",.
\
r/r,,
,/
t/n )
\
/-

In

3.64\

2.33"'";
""
JrT

@6-1.2;46+t.2)
(aa.8; a7.2).

Ello significa que, con una probabilidad del gB %, la media del nmero de horas trabajadas
aquella semana se encuentra entre 44.8 y 47.2.
Segn los consumidores, las empresas pasteurizadoras de leche no entregan la cantidad exacta
de producto. Para verificar esta denuncia, se tom una muestra de 45 fundas, cuyo contenido
terico era de 1 litro de leche. Se encontr un promedio de g72cm3 y una desviacin estndar
de 51cm3. Sobre la base de un intervalo de confianza al 99.7 Vo, se puede clecir que Ia denuncia
de los consumidores tiene fundamento?

:45, r:972 y s :
Si 1 - a : 0.997, entonces zo/2 : 3.
Solucin: Tenemos que

z?.

51.

Aunque el valor de Ia varianza es desconocida, podemos emplear el intervalo de confianza,


que el tarnao de la nluestra es suficientemente alto. De manera que el intervalo es

(r -

zolz

s ;r

+ zUz

s\ :
g)

yai

(n',t _3-a, sT2 +39\


'

r/s

,/+s 1

(eae.2; ee4.8).

Como el nivel de confiabilidad es del 99.7%, podemos decir qlre con toda seguridad,),a denuncia
de los consumidores es verdadera.

2t4

Captulo

7. Estimacin de Parutetros

Deterrniuacin del tamao do la muestra

errrtlc str r,rlor vttrclaclclc>

1.r

cstiuracitirr:

17

t-Ll. Sus vrlorr:s rrrr'arr en1

planl<:iunos erl ploblcnra r1e enc:outlal erl trrnro cLe


r:stirrrr:i<in DO sc1 rnayor' <re E.
Pc-,clerrnos

1r

rc 0 y

rtLr<rstla rle

zr,

12!-.

rrrur()I r clrLe

el error

rlr-

El irrterr,rlo de confianzl para ia rneclia pol)lacionrl tierre Ii forrnr @ - n;r + E), cloncle p: lt - L
<rs el cu or err li estimcirr dc 1r rneclia pala el uivci cle confirbilirlad dado. Si el irrtcn'alo tierrr: 1r

Irrnrfa

/
{:r'\

3.

o
/.) -;Ll
Vn

o\
o
f , elt1.e1p5 f'::,r.2--7.
\/n /
\/?l

zo2

Si de esta igualdad despejamos n, obteucmos

za/2o\2
n,: |/ ------

\E/

que es el tamairo de

Lr

7-c..

muestra, necesario para tener un error de estimacin -E a nn nivel de confianza

Ejernplo.

Se desea conocer la distancia media que cor-ren scmanalmente un grlipo de atletas de fonclo.
Por estrrclios anterioles se conoce qr.re la desviacin estndal de esas distancias es cle 3 knr. ;A cunto
atletas habr quc muestrear si la estimacin debe quedar a rnenos de 0.5 km de la media verdadela.
con rur rrivel cle confi.anza deI g5a/a?

Sohtczn: El irrtervalo de confianza es cle Ia forrna (Z

0.S;r + 0.5), entonces E

0.5

y za/2:

1.96

Aplicanclo 1ir fr'nruJ.a,

(1'90 x 3) :,ru.r.
,r: ('n/'o'?\E/
\ 0.5 )
Consecrteutemente, se debe tene un tamao de muestra mnirno de 139 atletas. Si la mnestra c.
demasiado alta, se deber aumentar el error admisible E o disminuir el nivel de confianza 1 - cv.
Se sr-rgiele que el

Iectol a,juste los parrnetlos, para tenel nna rnnestra aproxirnada

cle 50 rtletas,

llrteIi)rete.

7.8.
1.

Ejercicios

Deternine los intervalos de corrfinza al 95 To para t:I media pciblacional desconocid


l

n:45, r:5,
b) n, : 100, r:37,
tt)

2.

:
.,2
D

6.8;
-L<)

c)

q<.

d)

:
o2 :
o2

4.2:

14.

Dctermiue la iongitud del iutervalo dc confiarrza pala la rrreclia poblaciorral si:

1- cv:0.96, n:25, o:0.86;


b) 1 - a:0.99, n:152, o : L2B;

c) 1- o:0.955, n:7I, () _ t
'n: I20, o'2 : 49.
cl) o : 0.03,

rr)

3.

l : 13(). 7 - 1d.5.
n : 169, 7: -22,

si

Obtenga un intervalo de confi.anza de 100(1

a)Tc para la media poblacional

si

tr-

y lo.

7.8. Ejercicios
a)
b)

:
cr :

cv

0.01.

7L:

0.05,

TL:

26, i:120, o:4;


65, r :222, o2 :57;

c) rr : 0.1, r : 90,
rl) cr:0,04, n:55,

2t5

t : 66, s2 :2.5;
:r= 37. o2 : lE.

Dctcrminc rtri intervtlo en el que se pueda dccir que se encuentla el valor de la rncdia con casi
toda seguridad si

n:36. 7:100, o:4.2;


b) n: 44, 7 -- 53, o2 :7I;

7:86. s2 :22.5'.
cI) n:\2I,
T:-37, o2:84.I.

c) rr, - 81.

a)

5.

La cantidad mnirna requerida par que un arrestsico surta efecto en una intcrvencin qr.rirrgica
fue, por trmino medio, de 50 mg, con Lrna desviacin estndar de 10.2 ntg, en una muestra de
60 pacientes. Obtenga un intervalo de confianza para la media, aI g7 Vo, suponiendo que la
muestra se extrajo mediante rnriestreo aleatorio simple sobre una poblacin normal. Interprete
el resultado.

6.

En cierto barrio se seleccion, al azar, una muestra de 100 personas cuyo promedio de ingresos
mensuales es z:460 dlares y una desviacin estndar de o : 200 dlares.

a)

Si se toma un nivel de conflanza del 97To, Lcul es el intervalo de confianza para la media
de los ingresos rnensuales de toda la poblacin?;

b) Si se toma un nivel de confianza del

g9 %o,
cuI es

el tamao muestral necesario para


estimar la media de ingresos mensuales con un error menor a 30 dlares?

Se tom tlna muestra aleatoria de BB individuos a Ios que se midi el nivel de glucosa en la
sangre, obteniendo una media rnuestral de 110mg/cm3. Se sabe que Ia desviacin estndar de

la poblacin es 20 mg/ cm3.

a) Obtenga un intervalo de confianza para el nivel de glucosa en sangre cie Ia poblacin,

al

90% de confianza;

b)
8

Qu error mximo se comete con la estimacin anterior?

La media de edad de los alumnos qne se presentan a las pruebas de acceso a la universidad es
de 18.1 aos y la desviacin estndar 0.6 aos. De los alumnos se elige, aI azar, una muestra de
720"

a) Cul
17.95

b)

es lir probabilidad de que


18.25 airos?;

la media de edad de la muestra est comprendida entre

Qu tamao debe tener rrna muestra de dicha poblacin para que su media est comprendida entre 77.9 y 18.3 ahos, con uua conflanza del99.5%'l

9.

Una fbrica produce varillas de hierro con Lra desriacin estndar de 25 cm. La empresa recibe
tin pedido de rrarillas que inclica que la longitud promcdio debe tener Lrna des\/iacin mxima de
10 cm de la longitud requerida. Cuntas varillas se tendrn que prodncir para cumplir con la,
especificacin, con crsi toda seguridad?

10

Se realizaron 169 mcdiciorres del voltaje de ia recl de alurnbrado prblico y se registr un promedio
de 108 voltios y desviacin estnclar de 5 voitios.

a)

Cules son los lrnites de confianza, a un nivei del 987o, para el voltaje medio de red dc
alumbrado pblico?;

b) A qu nivel de confianza
voltios?

puede decirse que la estimacin de la media incluye el valor 109

Captulo 7. Estimacin de Parntetros

2L6
11.

En una regin geogrfica, la estatura de los individuos varores (en cm) sigue

a) Halle el intervalo

de confianza al nivel 92To para estimar


de tamao 36, cuya estatura promedio es 167.2 crn;

.r,,

r-rna

(U;7.52).

partir de una mnestra aleatoria

b) Para la rnisma poblacin, determire el tamao mnimo de la muestra para estimar


un error inferior a !2 cm con un nivel de confianza de| g4%.
r2

LL

con

A partir de la informacin suministrada por una muestra aleatoria de 90 locales comerciales de la


citrdad se determin el intervalo de confianza aI96%: I :(42,58), para el gasto medio mensual
por familia (en dlares) en electricidad. Determine (justificando las respuestas):

a) La estimacin puntual que daramos para el gasto mensual por familia en electricidad

en

esa ciudad;

b)

Qu nmero de familias tendramos que seleccionar aI azar como mnimo para garantizaros) con una confianza del 96 To, wa estimacin de dicho gasto medio con un error
mximo no superior a 3 dlares?

13.

La vida activa (en das) de cierto frmaco sigue una distribucin A/ (tZOO;402). Se desea enviar
un lote de medicamentos de modo que Ia vida media del lote no sea inferior a 1190 das, con
probabilidad 0.95. Halle el tamao mnimo del lote.

l4

Se desea conocer el nivel de consumo medio con una determinada

tarjeta de crdito con un error


mximo de 15 dlares y un nivel de confranza de 0.97. Cul debe ser el tamao mnimo de la
muestra que se debe tomar, si se ha estimado una desviacin estndar de 45 dlares?

15

Se sabe que el contenido de fructosa de una variedad de manzana sigue una distribucin normal
cuya varianza es conocida teniendo un valor de 0.25. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiendo un error mximo de 0.18.
con Llna confianza del 95.5 %. Cul es el tamao de la muestra?

16

Suponga que se midi la longitud del pie dereciro a 41 estudiantes de su universidad. EI promedio
de todas las mediciones fue de28.4 cm y la desviacin estndar fue 5.1 cm.

a) Encuentre un intervalo

de confianza al96% para la longitud media del pie derecho de todos

los estudiantes de su universidad;

b)

Esperara usted que alrededor del 96% de todos los estudiantes tengan longitudes de pies
en este intervalo? Explique;

c) Si usted hubiera encontrado un intervalo de confranza al 907o, cmo habra diferido

del

intervalo antes obtenido?;

d)

Si Ia muestra hubiera constado de 141 estudiantes (los restantes datos se mantienen iguales),
cmo habra variado el intervalo de confianza?;

e)

Si Ia desviacin estndar hubiera sido de 3.7 cm (sin variar los dems datos), cmo
hubiera visto afectado el intervaio de confi.anza?;

f) Si la media mLrestral hubiera resultado ser de 25.4 cm (sin variar los dems datos),
habra sucedido con el intervalo de confianza?

7.9.

se

qu

Estimacin de la media cuando la varianza es desconocida

Srrpngase qLrc se desea estimar la media p para r.rna poblacin cuya varianza o2 es desconocida
se dispone de una muestra de n mediciones que siguen una ley normal: rt t2 ..., rr..

y que

7.9. Estirnacin de Ia tnedia cuando Ia varianza es desconocida


Un irrtetvalo cle confianza para la media poblacional

(z

r, a

un nivel del 100(1

- a)Ta,

217

est. daclo

por

- t.r1n - r)ft, r-t to12(n- t,#)

Donde:

s es la desviacin estndar muestlal.

tr,/z(n

1) es el valor, de Ia distribucin de Student a (rz

el rea en el extremo superior es igual a

ct

1) grados de libertad, para

e1

cual

Ejemplos

1. La cotizacin diaria de una moneda frente al dlar

sigue una distribucin normal de media y


varianza desconocidas. Se eligieron 9 das aI azar, Ia cotizacin fue:

65.3 66.2 65.8 66.0 66.1 64.5 65.2


a) Determine tln intervalo

b)

67

.r

64.2.

de confianza, al g9 7o, para la cotizacin media de la citada moneda'

Con qu confiabilidad se estima la media en un intervalo cuya longitud es 1.116?

Solu"c'n: De acuerdo a los datos, n


Aclems,

1- a:0.99;

a) trl intelvalo

(z -

de modo que

: 9,T :

65.6y s :

*z :0.005

0.9.

ooos(B)

:3.355.

es

t''1' - 16:T-t

to/z(n

- I )+)
'r/"/

( ur.u -3 bbT:

/9

65 6 + 3

3biry)

,/9/

(64.59;66.61).

b)

Si la longitud del intervalo es 1.116, entonces el en.or.mximo es -E

E : t,"2(n - f)*; entonces, sustituyend.o


\/n
0.558

De donde,

t^pg): *#44

1.116

0.558 y como

valores:

: t,n6)9.
\/9

1.86.

Si examinamos en la tabla de la ley a 8 g.1., verros clue /sos(8) :1.36. De maner.a qnc
a
; : (-).05; por lo tanto, ci:0.1 y I - d:0.9. El nivel de confianza es del 90%.

El tiempo qlle un aparato de televisin perrnanece encendido sigue una ley nolmal. Por meclio
de rtn audmetro se registr este dato en 10 hogares dulante Llna senrana y se calcul el promedio
dialio (en rninutos). Los resultados son los siguientes:
248

r77

a) Deterrnilrar un intet'valo
.

110

200

135

i85

224

155

180

166.

de confialza para el tiempo promedio diario que los hogares rlilarr


televisin, a un nivel del g5 %;

Captulo

218

(lll(,'ol t,:ILol clu la

csl

irLlacitil

7. Estitnacin de Parnreros
lr)clror'L 2[) rrirr

s(rr

,9ol,ttt:irit:

tr) El lrlr>ine<lio v 1r rlcsvirc:in crslilrclrl son igrrakrs ti - I77.(i v s - 39.92. r'r:spr:irtiviurrorrtci


y si I - ci: : 0.95. /o.o:(9) :2.262.

lll

irrterr.alo r cclueri<[o (lllcda cc)nro

(trr.a_

)()2'-143:)77

/10

- . "u2t)[)
,/10 /

:,,4e.0Li;206.14).

b) Aqu

no se puede aplicar dircctrmente la fr'mr-rla del clculo del tamao muestral, ya clu
Ios vrlores de la lev / raran scgrin el nirmcrr cle grados cl< libertad) pcro el plincipio cs enusnlo.
Se -B

: tot(n - l+ y como
\/lt

ste debe sel nrcrtol que 20, se tiene to/z(n

Entonces.

t'o2@

to2(n

- I)

<
- yJ
Vn

ztt

1)

Folmemos una tal:>lr en la que se tenga los dos miernblos de la desigualdad. El tamr
mriirno cle la rnuestra es el corlespondiente al nenol valor cle ? para el cr.ral se cunple I
desigrraldrrd.

n 0.51n
10 1.581
16 2.000
17 2.061
18 2.r2L
n

Se observa qne rala el valor de

trnao rnninro <le la mnestla

es

1,,12(n

L)

2.262

2.\37
2.r20
2.1 10

18 se empieza a cr.rrnplir la desigr-raldad; es decrr'.


1B liogares.

7.LO. Ejercicios
I. Encuentle ul

intervrlcr ctc confianza cle

a) n : 12. i:
lr) rr : 26,

,)

3.1bj,

46.

S'
.)

,5'-

nivel (1

:0.21, a:0.05;
: 4.8.

i1

cr)

pala la rncclia si

r:1S, T:2.5,
11) rt : 9,
-I:32,
c)

: 31.5, cr : 0.Lr
s : 58. cr : 0.05

s2

estucliar cl girsto scrnanrl rlc fotocopiirs, crr cllarcs, clc L.ls eslucli:urtcs ulrivelsitli
eligiti una rnnestr'i <lc 9 cstur,litlrrtcs, elegidos l rzrr'. r'csrLlt,r.rrclo los gastos:

Se d<,.scr
Se

2.0'2.5

0.7 1.I 2.1 :j.0 0.8

0.7.

la r,tliable rrleatolir oll.jeto clc cstuclio siguc rurir clistlibrrcir). rrorlral <tc nrc.,.
Detolrnine el interr'k clc confi.urza clcl 95 % par',r lr rneclia clel grusto semauirl

Se srrpouc que
dcsc;onocicLr,.

1.9

fotocopiirs pol estuclizrnte.

7.70. Ejercicios

2l-9

Err los crrllcrrtrrriorLtos rlc lrn rrar[Lclor sc rrrirk: cl tierLrlr<t <re crrrplr:a elr |ecoller los 10() lrrctr os
lilrl<ts tIirr'rrrtc sttis <lLs r:onst)<]1rfl\.()s. S<r ltarr olrtcrriclo los siglrirtrrt,'s ticrrrl>os pr orrcclio rlc caclr
Luro clc los clrs rlt: lt sclr;ilrr c)lr (fllo rrrrll<)rrri:

Tiernpo I 51.2
Si

ttivcl

51.6

50.4

50.8

50.5

los 1;icrrrpos sr: clistrilrrLyclr liol'rn1lrnrlrrte. etr<rncntre rur interlvalo

scr <:rtnsi<icLir clrrt'

corrfi)nzI. <lc

49.8

91.-)

%,. 1>irlrr

cle

el ti<:nrpo pt'onrr:clio irlvcltickr:

l,) ,Puccle csl)cr'r'sc cre cl la<lrclol leba.jc srr ticrnpo dc 50 s<-.gunclos? ,Por qrr?
4

Lrs

tensiotrr:s dc totur'r (cu

Iip)

clc 5 cables cle acelo fuctolt

660 460 540 580

550.

Suponicndo normalidad para las tcnsioncs, estinre la tcnsin mcdia de lotura rnediante lrn intelvaio c1e confianza al nivel 99 %.
5.

Se desea estimar ei tiernpo medio de e.jccr-rcin de un programa. Para ello sc ejecut dicho
programa B veces utilizando conjuntos clc datos elegidos aleatoriamentc, obtenindose que Ia
media mlrcstral y la desviacin estndar- rnriestr-al son, r'espectivamente, 230 ms y 14 ms. Obtcnga
un intervalo de confianza aI90% para la rncdia. (Suponga normalidad.)

En una entidad de crdito para la rnicroempresa se desea conocer la dcuda media de los clientes
que tienen prstarnos. Los siguientes datos corresponden a la dcuda, en dlares, de 16 clientes
que se seleccionaron de manera aleatoria.

306 508 299 537 404 2r0 347 529


514 255 343 476 536 521 659 438
Si el rnonto de cacla pr'stirrno es nna r.'aliabie aleatoria normal. obtenga los intervalos de confianza
dcl 90 %o, g5% y 997o, para la deuda medir.
I

Al fumigal los rrodr-rctos

agr'colas existe cl riesgo de qr-re se coloque demasiada canticlrcl dc


irgroqunricosi cou cl consignieute riesgo pala el consurniclor. De nl lote se extra.jo una muestra
de 10 tomates y se midi la concentracin (cn g/ kg de producto) cle fosfatos qr-re ellos contenan,
resultanclo:

24.9 23.5 26.7 28.2 26.4 23.8 25.r 25.3 27.7 26.6.
a) Determine Lrn intelvalo de confiarrzr del 95 To pata la concentlacin;
b) Si la concentlacin mxiurr permiticla es cle 24 LLgl kg, puede esperarse que el lote

sea

aceptaclo pirla cl corlslrmo hr,rrrrano'/


8.

Elr una filrrica

cle corrselras se micie ias irrrPulczas cn rrn lotc ck:stinado a la exPortaci<in. En


ur1l nlnestrr do 12 frscos de mernielaclr sc obtr-rvo los siguientes polcelta.jes de inrpr-uezrrs:

2.:3 1.9 2.7 2.8 2.3 3.6 1.4 1.8


a)

Asurnier.rclo
confjurzr

b)

9. El

c1r.Le

tI

2.\ 3.2 2.0 1 L

las medicioncs estn normalrneDte clistliluidas. ertcuerrtle el interr,rlo de

95%,:

Si cl polceuttr.je rrrixinro c1e inrpulczirs peruriticlo


tari cl lote par a scl (lxpoltrclo/

pzt,r'zi

r,ic'rnpo cLe virlr cn c;rrtivelio de B cspecmenc.s cle urr


uu des\il(:in estir.cll cle 7 holas.

la r:xpor-tacirr es c.le 1.5%, .sc,rccp-

tipo

clc insec;to fue cle 228 hot'zrs, con

Captulo 7. Estimacin de Parntetros

220

zr) Estimc ol tiernpo cle viclr promedio l)ara un nivel clel g9 %;


lr) Resporr<ltr Ia pregunia srrponiendo <re ls muestr'rs frreron de 72
10

100 especnicncs.

IJrra mqr-rirra ploduce artr:ulos cuya dirnensin se corrtrclla rnediante Ia torna de unrr rruestr.1
aieatorir. Un cla se obtuvieron las sigrrientcs rnediciou<:s:

:3.7 3.4 3.5 3.5 3.4 3.7 3.9 3.7 3.5 3.7

3.8.

a) Halle el intervalo de corrfianza para ia niedia a un nivcl de confiabilidad de nivel 90 %;


b) Si la meclia terica del proceso es de 3.5 y sin cambiar los otros drtos. Cul es el tamarlo
mnimo de la muestra, para que a un nivel del g0 %, se pueda asegurar que Ia mquina
produce artculos con dimensin igual a la media terica?
11

Los siguientes son los tiempos, rnedidos en das laborables, que demoraron 16 trmites de jubilacin en cl IESS, elegidos al azar:

Das

159 280 362 222


t70 485 250 379

264
779

224 101 2t2


168 260 149

a) Bajo Ia suposicin

de que los tiempos se distribuyen nolmalmente, detelmine urr intervalo


de confianza ai 9970 para el tiempo medio de nn trmite de jubilacin;

b) El director del Instituto ha indicado


razonable suponer que
12

e1

que ios trmites no se demoran ms de 180 das. Es


tiempo meclio verdadero es mayol que lo indicado por cl director'/

La siguiente lista contiene la longitud (rrrmero de letras en las pala)rras) para rrna muestra
26 palabras del libro Rayuela cle Julio Cortzr

clc

102 3 7 2E 4821752
54 '12294252347
a) Calcule el promedio y la clesviacin cstndar cle lr longitud de las palabras;
b) Constmya un interr'lo cle confianza al 99 % para Ia longitud rnedia de las palabras el
Rayueltr;
c)

Si el tamairo muestral fuera mayor' (v el prorneclio


mismos), ,cmo cambir,rr el intervrlo cle confianza?;

y Ia desviacin

d) Si el prornedio fuera mayor (rnantenindose el tamro muestral

e)

estndar fueran los

y la desviacin estndar).

cmo cambiar'a el intervalo de confianza?;


Un intcrvrlo de confianz al g5 % cs (3.655; 6.037). Qu proporcin de las 26 palabras de la
muestra estn dentro clcl intelvalo? ,Su lesPuesta scr siempre ccrclnl aI 95%il Explique.

T.IL Estimacin de Ia varianza (distribucin normal)


Suptrgase que se rlesea estimrr la vr'ianza polrla.ciontrl ;' r|rc
de n ntccliciones crc siguen unzr ley rtolnral: :1, lL2) ..., r.n.

Un intctvalo de confianz

par:r ir

1-rzrrir

el efecto sr: clispone de

urrr ri-ruestra

valianza polrlirciorrirl 02, ,r ,1lr rrivcl del 100(1 - cl) %, cstri dado

por

(rr

- I ).'2

(rr

- 1)s2 \

\,(,,-Df"d-D)

7.77. Estimacin de Ia varianza (distribucin norrnal)


T

s2 es la varianza muestlal.

f)r(n-

1) es el valor, de la clistribucin 2 a

el extremo srrperior cs ig'ral


,'2 u

\?
\j,o/z^,"(n -

(n-

22t

1) graclos de libertacl? para el cuai el r'ea en

(, -

1) es el valor, de la clistribucin X2 a

en el cxrlemo inlerior os igual a

1) grados cle libertacl) para el cual el rea

].

X,-o,,
z,_o,,

Latz

Figtrra 7.4:Localizacin de los valores de la ley

X.2

en el intervalo de confi.anzaparao2

Ejemplos

1.

Hallar un intervalo de confianza para la varianza poblacional, al


tamao n : 10, si s2 : 196.
Sol,ucin:
Xfr

si 1-cv:0.9,

n, correspondientes a n

entonces

- 1.:

a:0.1,

9 g.1. son

90 Yo,

]:o.osy 1- |-o.os.

t) :
\?-,,z(n - r) :
x?.z@'-

:
x|.gs(9) :
xB os(9)

para una muestra de


Los valoles d" x8o y

16.919,
3.325'

El intervalo de confianza es

( (n_ t)s2

(n_ r)s2 \

\q," - tl';-ql" 1) )

:
:

/9x196 9x196\
\ reoro' n% )
Q0a.26; b30.b3).

2. IJn hombre

de negocios est interesado en invertir en un instrumento que piensa le puede dar


altos rendimientos. lrlo obstante, sabe que, en general, a mayor rendimiento se tiene mayor riesgo.
Al considerar instrumentos sirnilares se observaron los siguientes rendimientos porcentuales, que
suponemos siguen una ley normal:

8.7 15.5 21.0 18.9 17.3 22.r

18.6.

El inversionista considera que si se tiene un riesgo mayor-a 10 (desviacin estndar'), no 1e


conviene invertir. Construir el intervalo de confianza del 95 t/a y decir si este hombre har Ia
inversin o no.
Soluci,n: A partir de los datos, se obtiene que s2 :19.67,

n:7 y 7 - a:

En la tabla de la ley X2 a 6 g.1. se lee:

- r) :
x?-.z(n - t) :
x?.z@

x3 oz(6)

:74.45,

x|3zs$) :1.24.

0.95.

Captulo 7. Estimacin de Parntetros

222

El

iLttclr'r.lo <-lc corLfianzt cs:

(t,t

tliJ.

(r-1)s2 \

19.67\
/rlJ.6;6.,
:
('
LrL; ' n4 )
[C,,, - t, -,-,, -r )/

ls

rlecir. o2 e (8.17; 95.18); por lo que o

(8.17;95.18).

e (Vo.1Z, vOSlS) : (2.86;9.76).

Corrro el lrnite srrrcrior clcl intervrlo de confianza es rnenol


inr<l tir.

7.t2.
1.

2.

Ejercicicrs

Halle un intervalo cle confi.anza al 90 To si

a)

a 10, posiblernentc si le corrvicne

n,: 4;

b)

n,

s'2

: 8;

:225

para los siguientes tamaos de muestra:

c)

n: 13;

cI)

n:20.

La valianza de la presiri sangunea es impor-tante

porqr-re ella permite conocet la resruesta


ante el esfuerzo. Se llevaron a cabo 12 rnediciones de la presin de urr iudir.icluo, clue
dieron los siguientes resultrdos:

car'<lirca

116 105

t2r 119 110 105 108 t02 107 t02 104 116.

Detclminc los intcrvalos clc confi.abilidad dcl 90 "/c y cleI95%: para o2.

3. En los rnrrrualcs de fbricr cle un lpar'rto pala cleterrninar- el rrivel de alcohol cn la strugle.
sc irrdica que las niediciones tienen una clcsviacirr estndal de 5 ulidacles. Pala p-t-obar estL
afilruacin, cn la oficina de normas se reaiizarol mediciones clcl contenido de alcoiroi en Ia szrnrc
cle 10 r'oluntarios, con los siguientes resultrdos:

83 75 92 79 60 85 92 77 76.
Basndosc crt LlD ilrtervalo cle confirrrza dc

95

%, cleterminc si Ia afirrnacin <lel fabricarrte

Sc rnliz Llr)t nlalca c1e rnirrgarinr rlietticr pzrlir dcterminar el nivei cle acic,los gl'l,sos ltolisatr-rraclos (en lrorcenta.jc). Un,r ntuestr't de scis paquel;cs ltrovcy ltr siguientc informa<rirln.

16.E 17.). t7.4 16.9 1t'.5

17.1.

Asrrutiendo <lrre los rlirtos sigrren uu'r lev rrrr'nral. hrlle:

a) el intcrr'rlo clc confianza para cl contenido medio de glasa. con rln nirrcl del g9 %;
b) r:l irrtelr'rlo clc <;onfianzr par'r Ir vaLirrrza del conteniclo dc g1 lsa, corr Lrn nivr:l del

5. En nrra mncstra

LL

cs cortecta.

4.

95%.

alcrtoria cle 15 cuentas bancarias que realizaron depsitos la rltirna serrralta sc


que
encontr
la desviacin estndar era de 73.6 dlares. Se supone que los depsitos siguen una
ley normal. Estime Ia varianza y la desviacin estndar de los depsitos mediante un intervalo
de confianza al g5To.

7.72. Ejercicios
Ir

223

Urr httrribre clc nr:gor:ios est, intercsrdo crr ilrutil err bcnos cle un pirs lrrtinorrrnclicauo, qrrc
lticttszr lc rueclcu <lu altos t'euclinientos. No obstiurte, s1be ouo. en gcuerzrl, a nryor rcnclirnicnto
se tietrcr IIl1yot lictsgo. AI cotrsiclctal ptrpcles similarr:s sc obsel'r'alorr los sigrricrit,cs lcndirnicntos
( ')/,t):

9.7 21,5 17.0 16.9 13.4 20.7 24.6

15.8.

El invelsionista corrsiclela que si sc tierre un licsgo ruayol a 10 (desrriacin estrrdar'), no le


comierre invertir. Coustnryir el intclvrlo clc corifianza dei 95 % v cliga si esta persona har' la
inversin o no, .justificariclo su respuesta.
7.

El conteniclo cn nicotini de los cigarlillos de unl nralc) dcterrnirrada sigue uua distriliucirr
N (U;"2). Sc torn urta mucstr:a cle 5 cigarrillos, obtenindose en cstr muestra un ccntenir-lo
medio de 27.2 rng y varianza rmestral 4.2025. Obtenga:

a) el intcrvalo

b)
8.

de confirnza para

con Lln nivel del 90 %;


el intervalo de confiarrza para o2, con un nivel del g5%.
/,)

ptobar ttn nnevo mtodo de embalaje de rnercaderas, para Io cual se registra el tiempo
(en segtindos) quc un misrno tlaba.jador emplea err realizar la tarea:

Se desea

Procedimiento
tradicional

Procedimiento
alternativo

31

36
32

36
34
27

30
26

40

4,f

4I

AA

28

30

33

,t
Jt)

Si el tiempo empleado es similal en los dos casos, entonces se decidir emplear aquel mtodo
qtre presente la menol r'rliacin. Mediante un intervalo de confianza a). 9570, ,cu.l de los dos
mtoclos escogcra, el traclicional o el alternativo?

9.

Se micie el tiempo (en segundos) de duracin de un proceso qumico realizado 20 veces en


condiciones sirnilarcs, obtenindose Ios siguientes resultados:

93 90 97 90 93 91 96 94 91
93 95 91 89 92 87 88 90 86

88
91

Strponiendo que la dnlacin sigue una distribucin noLmal, hallar los intervalos de confianza aI
90 % para la rneciir y Ia r.arianza.

Etr el enibrlajc dc fi'rtta pala ltr cxporttrcin es importante conocer Ia variabilidaci del caliJre
la fruta (que es el clirnetro mxirno de Ia fmta). Una fruta con Lrn calibre bajo se cotiza
a l:a.jo prercio y una con calible alto da ploblemas en el embalaje. Las siguientes mediciones
corlesponderr rl calibr-c plorncclio (en cm) de los rnclones contenidos en 113 ca,jas:
cle

20.8 19.3 19.5 22.4 27.3 19.6

2r.2 2r.4 19.0 19.8 22.2


a) Determine

20.5

20.6

los intervalos de confianza, al g0To, para la media

y la varianza del calibre;

Captulo

224

b)

7.

Estirnacin de Parrnetros

Si el calibre promedio es nlenor que 20 crn o mayor que 21.5 cm, o si Iavatianza es mayor o
igual a 3, se recomienda el cambio de Ia variedad de meln. Cree tisted que ser necesario
hacer tal cambio? Por qu'/

Una ernpresa de venta de cosmticos est interesada en introducir una nueva lnea de artculos.
para ello se examina Ia ganancia (en dlares) que le dejaran cada uno de los productos:

l1

23 38 15 7 t2 10 10 11 18 13 9

10

a) Calcule un intervalo de confi.ar'zapara la ganancia media, a un nivel deIgS%;


b) Calcule un intervalo de confiatzapara la varianza de la ganancia, a un nivel del 90%;
c) La empresa introducir la nueva lnea de productos si la ganancia media es mayor que 20.5 o
si la varianza es menor que 40. En base a los intervalos antes encontrados, se introducirn
al mercado los nuevos productos? Explique por qu.

7.L3. Estimacin de la proporcin (distribucin binomial)


Histricamente, este intervalo de confianza es, con seguridad, el primero propuesto para un parmetro:
en los escritos de Laplace (Thorie Analytique de Probabzlzts, 1872, pp. 283) ya se lo encuentra
analizado.
Strponga que se dispone de una muestra rt 12, ..., rrr., de n observaciones que siguen una ley de
Bernoulli, cuyo parmetro p (la proporcirr poblacional) deseamos estimar.

Un intervalo de confianza aproximado para la proporcin7t, a un nivel de 100(1


por

a)% viene dado

Donde:
,n

. p:- 9 , siendo y : D r el nrmero de xitos en las n pruebas.


i.:1
TL

'

za/2 el valor z que corresponde a,l rea 9 en el extremo superior de la distribucin normal
2

estndar.

Determinacin del tarnao de la muestra


Si notamos como.E

:ll0-

dado; entonces, ,E :

Za12

pl al erlol en Ia cstimacin de Ia proporcin, para el nivel de confiabilidad

0G-0)

EI tamao de la muestra necesaria para tener Lrn error -8, a un nivel de confianza (1 - a)

n: Qo/)'0Q
E2

es

A)

Observacin. Si no se conoce de antemano una estirnacin de p como sucede cuando se realiza una
investigacin por primeravez , se toma fr:0.5, porque este valol permite obtener el tamao mximo
de rnuestra.

7.73. Estimacin de Ia proporcin (distribucin binomial)

225

Ejemplos

1.

Cott cl ob.jcto rle estirrra,t'la Jrroporcin clc televiderrtes qr-re han visto el anuncio de un proclucto,
se enl,rcvist 400 tek:spectacloles y result,ri que 344 de ellos lo habarr visto.

a) Ertcuentrc un intcrvalo de c:onfianza clc g7'% para la proporcin de todos

b)

los espectadores
que harr visto la ltublicidacl r.[el producto;
Obtenga el tanrao cle rrnrestra indispensable para que cl intervalo del inciso a) terr.ga una
Iongitud mxima cle 67a corr la misrna confianza.

lJ:344, n:400, 1- a:0.91 y zoo45:1.695.


La rroporcin de espectadores en la mlrestra es t' !lt :t"11:0.86.
400
a) El intervalo de confi.anza es
Solu,cin,: Por el enrtnciado se tiene:

/
\n

z"rz

(0.86)(0.14)

(o

400

'u

;0.86

b) Si la longitr rd del intervalo es 6 %, quiere


El ta mari.o le la rrmestra
<

'F2
Habr'

qr-rer

(0.8306; 0.8894).

esdecir,E:0.03.

es

("n/.)'2

fr(t

- i)

(r.695)2(0.86)(0.r4)

(obz-

.){, ?(
_ roa'rJU'
-

consuJ.tr a 385 tcle','id<tutes.

2. En unr encuesta piloto, plevitr

1>ara la lcalizrcin cle la encnesta clcfinitiva) se encontr que el


lir poblacin (ircle que el plirrcipal problerna clel pas cs la colrupcin. La ficha tcnica
de la cncuesta definitiva indica cre ci sonclco tendr un 97 % de confirlrilidad y el error estimado
clel 4(%. A cuntos cirrcladanos se debel cousultar si:

630, de

a) se usa el valor estinrrdo de p mediante Ia encnesta piloto;


b) no se enrplea una estimacin previa de p.
Srhtcin:

a)

Segrn los datos: 1

- a:

0.97,

E:

0.04 y

0: 0.63.

Entonces,

r: @#f:@*ffi@
(2.i7)2(0 63) (0.37)
0.0016

b)

686.

La eucnesta deber ser realizda a Lrrr mnirno de 686 personas.


Como no se tiene iriforrnaci<irt previa soble p, se toma 0: 0.5 y el clculo del tarnao queda:

r: @#r:e%l&i#e
:

7:35.77

Sin urr conocirnieuto previo de Ia proporcin, se deber muestrear al menos a 736 pelsonas.

::i el Curdto 7.7 se encnentra un resLrilren de los intervalos


-- este captulo.

de confianza de una muestra analizados

Captulo

226

7.

Estimacin de Parntetros

Hiptesis
Distribucirr
general

Distribucin
normal

o conocido
o desconocido

Distribucin

Parmetro
media

t L -/2--=

r,

Distribucin

r t

media r

proporcron p

binomiai

\/n

vatiat,.- o2

normal

Intervalo

s
Lo

2.1n-y
'\/rL
-

(n-l).s2

(n 1)t2
,2
\n /'2:(n-1) \ | o2,1n t)
1

-.2

f!

rulz

F0-)

Cuadro 7.1: Intervalos de confianza comunmente empleados


7

"L4"
1.

Ejencicios

Determine Ios intervalos de confianza para la proporcin, de una muestra de tamao 200 en la
cual se han obtenido 150 xitos, segn los siguientes niveles:

a) a:5To;

2.

b)

a:12To;

c) a:7To;

d) a:20To.

En esta pregunta no realice clculos, responda mediante una frase que explique su razonamiento

a)

Tres investigadores, Luis, Juan y Edgar, seleccionaron independientemente muestras de una


misma poblacin. Los tamaos de las muestras fueron de 4000 para Luis, 1000 para Juan
y 250 pu.u dgat. Cada uno construy un intervalo de confianza para p a paltir cle sus
datos. Los errores E para los tres intervalos son 0.015, 0.031 y 0.062. Asigne cada uno de
los errores a los investigadores;

b)

Dos investigadoras, Diana y Oliva, seleccionaron dos muestras de tamao 1000 a partir de
diferentes poblaciones y constmyeron los intelvalos de confianza al 95 7o para p. El errol
para el intervalo de Diana fue de 0.030 y el error para el de Oliva fue de 0.025. Dado que las
proporciones muestrales fueron def : 0 2 y F:0.4, asigne a cada una de las investigadoras
su proporcin;

c) Un investigador seleccion aleatoriamente 100 sujetos de una poblacin, observ 50 xitos


y calcul tres intervalos de confianza. Los niveles de confiabilidad son 907a, 95% V 99%.
y los intervalos son A: (0.402; 0.598), B: (0.371; 0.629) y C: (0.418; 0.582). Asigne a cada
intervalo su nivel de confianza;

d) Dos

investigadores) un hombre y una mujer, trabajan .juntos para estudiar una muestra
aleatoria de individuos de una poblacin. Ellos encuentran que la proporcin muestral e,.
de p: 9.6. Cuando ellos construyen el intervalo de confiarrza basado en Ia proporcin, el
varn obtiene (0.532; 0"668), mientras que Ia mujel obtiene (0.552; 0.688). Indique quin
se equivoc.

J.

llna muestra realizada a los clientes de un supermercado dio que

120 de 300 clientes usan

regularmente tarjeta de crdito o cheques para sus compras. Encuentre un intervalo de confi.anza
aI 98% para el porcentaje de personas qlre usan efectivo en sus cornpras.
4

Un partido poltico que concurre a las elecciones mr-rnicipales en la ciudad quiere encargar una
encuesta para estimar su porcentaje de votacin mediante un intervalo de la forma P +1.5%.
cuyo nivel de confianza sea 95 %. Qu tamao muestral debe utilizarse en la encuesta para
alcanzar aproximadamente este objetivo, sabiendo que en una muestra piloto el porcentaje de
votacin estimado fue del 75%?

7.74. Ejercicios

227

5. La efectividad cle tut trtcclictnrcrrto oorrlla cl dolor dc cabez se examirra deterrninando si ste
elirnin o tro r:l sntonra. St: arlrrriuistr'<i <r1 mcclicrurerito a 225 pacientes voluntarios, de los ctLaies
en 170 crns el efr:cto rlr-'scrclo. El rrrcclicLrento se trr:epta l)ara, su u,<jo general si ticnc uur
efectividad en al menos cl 80 % clc los crsori.

6.

a)

Basndose en Ltn intervalo de confianza


mento'/;

b)

Sin variar la propolcin estimacla, .qr-r tan grande deber ser Llna muestra si se clesea tener
una confianza del 96(% de que el error mximo de estimacin es 0.05?

c-lel 98

%, .puede recomendarse el uso dei meclica-

rtn estudio sobre los nios que padecen clolor de pecho, realizado por Selbst, Ruddy y
Clark (Cli,nical Ped'iatrics,1990), se encontl que de 137 nios que tenan dolor de pecho, 100
daban radiografas de trax normales.
Segrrr

a) Obtenga un intervalo de confianza del 957a pata la proporcin p de nios con dolor de
pecho que dieron radiografas normales;

b) Halle el mnimo tamao muestral para que el error cometido en la estimacin de p

sea

inferior a 0.07, al nivel de g5%.

7.

En una poblacin, nadie es indiferente respecto a la iniciativa propuesta por el alcalde de construir
un nuevo parque en el norte de la ciudad. Cada habitante adulto o bien est a favor, o bien en
contra de la iniciativa. Se desea conocer el porcentaj" (P) de las personas que estn en contra.
Entre 250 habitantes adultos elegidos al azar,75 afi.rmaron que estaban en contra (v los 175
restantes a favor).

a) Halle el intervalo de confi.anza al 93 7o para P;


b) Cul es el nmero mnimo de encuestados necesario para que el error cometido en Ia
estimacin sea) como mucho, de 0.05?

S. En una lnea

de control de calidad en un da se examinan 250 piezas de un lote, de las cuales 25


tienen algn tipo de defecto.

a) Construya un intervalo

de confi.anza aI g37o para la proporcin de piezas buenas y de piezas

defectuosas;

b) I-ln lote se acepta si Ia proporcin de piezas

defectuosas es menor

o igual al

5a/a. Ser

aceptado el lote en cuestin?;

c)

Qu tamao deber tener una rnuestra si se desea tener una confianza del g7% de que Ia
estimacin estar dentro del1% del porcentaje real?

9.

Para la introduccin al mercado de una nue\a variedad de semilla de naz la empresa productora
estima que deben germinar al menos eI 73u/o de1 total de semillas sembradas. En una prueba de
laboratorio se sembraron 745 semillas, de 1as cuales germinaron 518. Con base en un intervalo
de confianza de nivel igual a1 97T0, [,poclr la empresa introducir al melcado la nueva variedad?

-0.

Err un sondeo sobre la preferencia deportiva de la poblacin masculina ecuatoriana, realizada a


1000 personas, se determin que eI 72% de 1os encuestados gustaba ver regularmente partidos

de ftbol por televisin. Con una seguridad del g5 a/o, se puede decir que los resultados son
iguales, con Lrn margen de ms o menos 3 puntos porcentuales, a los que se habran obtenido si
se hubiera consultado la opinin de la poblacin masculina completa?

:1. Una noticia de prensa dice que, de 1200 persorras encnestadas

sobre la conveniencia de hacer


reformas a la ley de trnsito, 756 se muestru a favor y 444en contra, y concluye afirmando que
eI 63% de la poblacin se mltestra a favor, con un rnargen de error de t3 %. Cul es el nivel
de confianza de esta afirrnacin?

Captulo

228
72.

7.

Estirnacin de Parmetros

En ttna errtlevista realizrc.la a 130 rnujercs casadas, 113 de ellas indicaron qlle haban sido r.ctirnas
clc zrlgrin tilto de agresi<in ltor parte de su cnyuge.
a)

Asumieudo qtle estas nnrjeles form:ur una nnrestra aleatoria, calcule r,rn intelvalo r-le confi.anza de nivel 95% para la proporcin de las mujeres casadas que han sicio agrediclas;

r) Si se hubiera consultado a 520 mujercs, .cree usted qrre el intervalo hubiera sido rnis ancho,
ms estrecho o de igual ancho? Explique y no realice clculos;
c) El intervalo hubiera sido ms ancho) ms estrecho o de igual ancho si 73 de las 130 mujeres

hubieran respondido afir'mativamente? Explique;


d) Realice una interprctacin del intervaio.

13.

la proporcin de estudiantes universitarios a favor de sustituir el actual himno


nacional por otra cancin.
Se desea estimar

a) Para estimar esta proporcin con una precisin de 0.10 a un nivel de confianza

del 92Vo,
cuntos
estudiantes
preguntar?
se
necesitar
(Para
determinar
el tamao de mnestra
a
necesario, fije su propia proporcirr rnuestral, identificndola claramente.)

Para responder las siguientes preguntas, usted no necesita realizar clculos. Explique sus
respuestas.
b)

Si se deseara estimar la proporcin con nna precisin del 0.05, a un nivel del

To,

es

95 To,

,es

92

necesario muestrear a ms o menos estudiantes que en a)?;


c)

Si se cleseala estirnar Ia proporcin con una precisin del 0.02, a


necesalio muestrcar r mis o trtenos cstudiantes que en a)?

un nivel del

7.15. Intervalos de coyrfranza para dos muestras


Los intervalos de confianza qr.re se presentan a continuacin involucran a clos rnuestlas y, en gcneral,
son utilizados para compalar errtre Ios valores que tierien los parmetros de dos poblaciones o para
determinar si las muestras provienen de la misma poblacin.

7.L.L, Interl'alo de confiarrzapara la diferencia

entre dos medias

nr y rL2 seleccionadas cle dos


poblaciones con medias h y ttz. Nnestro inters es encontrar un intervalo de confianza para la
diferencia de las medias y para ello considerarenlos 3 casos:
Suporrga clue disponemos cle dos mnestras independientes dc tamaos

Caso 1. Las varianzas poblacionales son conocidas


Supondlernos que las varianzas de las poblaciorres 1

son conocidas:

"?

"3.

Unintelvalodeconfianzapat'. ladiferenciadernediaspoblacionalcs11 -1,12,aunniveldel 100(1rv)%, cst dado por

(,t, - r) - .,,/2ffi,r,(;, - zz) r za/2rF-)

7.75. Intervalos de confianza para dos rnuestras


Caso

2.

Las varianzas poblacionales son iguales;

o'l: oZ: o2

Un intervalo de conhan za par a la diferencia de medias poblacionales r,


a)To, est dado por

| (zr

rz)

- t../z(nt -t nz - 2)

@t - rz) +

lE=-;

229

/z(nt

F2, d un nivel del 100(1-

t nz - r

rE=-)

^r_(ra-t)"?+(n2-r)sl
U+n2-2

Caso

3.

Las varianzas poblacionales son diferentes: ol

I ol

Un intervalo de confianza para la diferencia de medias poblacionales p1


a)To, est dado por

(,t' - ,) -t.tz(s)rm *;
Donde g

@t -rz)

p2, a un nivel del 100(1

+t,/z(s)r{-.t)

+ slln2)2
("?1",)' , G3/"r)'
u-L - nr-r
('?1",

Ejemplos

1.

Se pretende comparar

la duracin de dos marcas de pilas alcalinas. Para ello se escogieron dos


una. Los datos se presentan a continuacin.

muestras de cinco piias cada

Marca A
Marca B

100

96

92

96

92

76

80

75

84

82

Si suponemos que las varianzas poblacionales son o2A: II y q2B :15, determine, basndose en
un intervalo de confianza de nivel g5 %, si las dos marcas de pilas tienen igual duracin.

Soluctn: Se tiene que

nl :5,
TL2:

5,

r1
rZ

:95.2; o?: l!,


:79.4; 03: 15.

Entonces,

(,r,-,
- \,,,

"'2)

zat2U

la* o" \r,'- - rz) - ,"/r\,1@:


;

;' _ ):
:

(11.33; 20.27).

Si las dos medias fueran estadsticamente iguales, su diferencia sera igual a cero. Como cero no
se encuentra en el intervalo de confianza, podemos afirmal que las dos marcas no tienen igual

durabilidad.

Captulo 7. Estimacin de Parntetros

230
2.

Lhr irgr:nir:r'o desea cletelrninrl si los automrj.lles a,nrcricrrros ), los japorreses tienen igual consrrmcr

rl<corirrstible. Par'relloescogoliirtrnrrest,rrcle10cr.r'rosarnclicarros), 12,jaPcrresesrlesinrilrlr.:s


crr',rctersticas y rnidi cl ccrisurrro por 100 hrn cle recolrickr, con los siguicirtcs r-csultrclos:
4rnenicanos
Japoneses

60
48

74

58
51

5iJ

85

7{j
{i2

i"r"7

a)o
JL

7.6

()/

6.7

100 9s

t-/

7.2

r')

(;.'.j

5.!l

Estinrar, mediante un intelvalo de confianza a,l 95'%,).a cliferencia eirtle las clos rnedias de consllrllo. ,Se puede decir el conslrilro de cornbustible no depende del oligen clel ruto?
SoLuciu. Supondremos que las poblaciores son norrnales con varianzas desconocidas, supuestas
iguales. Adems, se tienen los siguientes resultados:

:
n2:
nt

El estimador de la vananza
(n1

5:

(,', (,t.uu

rz)

rI :

7.86;

s?:2'2t6

12,

rZ :6.C4;

s3:0.879

es

-1)sl +(n2-I)s2;
n1

Entonces, el intervalo

10,

+n2-2

(10

- r)2.216 + (t2 - 1)0.87e :


10+12-2

1.481.

es

tn/z(nt + nz -

- 6.04) - ts s25(20)

2)

1.481

1.481
*
,o i,

(7.86

- 6.04) + o.ozs(20)

Como el valor cero no se encuentra en el intervalo de la diferencia de medias, deducimos que Ia


media de los consumos no es igual. Entonces, el consumo de combustible si depende del pas de
origen del carro.

7.L5.2. Interralo de confianza para larazn entr dos varianzas


Suponga que disponemos de dos muestras independientes de tamaos TLt y n2. seleccionadas de dos
poblaciones que siguen leyes normales con varianzas o? y o3, respectivarnente. Deseamos construir
un intervalo de confia\zapata la razn de las dos varianzas.

Un intervalo de confianza para la razn de las varianzas poblacionales

o?

i,oi

aun nivel del 100(1-c)%,

est dado por

(#r',-",^u - r,nz - r); #'-,r(n, - L,n2 _,))

7.75. Intervalos de confi.anza para dos muestras

4,,,

231r

4-otz

Figura 7.5:Localizacin de los valores de la ley F en el intervalo de confianza para larazn entre dos
rrarianzas.

Ejemplo. LIn inversionista

quiere comparar, en trminos de las varianzas, los rendimientos de las


acciones de dos compaas del sector servicios. Calcul los rendimientos mensuales del ltimo semestre

de las dos compaas, como se muestra a continuacin.

Compaa A
Compaa B

1.8

2.6

0.3
3.8

2.4
-l

0.1
4.7

1.5

1.9

3.2

D7
d. tJ

Con el empleo de un intervalo de confi.anza de nivel 95To para las varianzas, determine si los rendimientos tienen igual variabilidad.

Solucin: Tenemos que

U:6,

s?

172: $,

sZ:0.278.

0'859,

EI intervalo queda:

/^2

(?rFr-*p(n

\si

\
"?
t,n2- 1) ) :
- r,nz - r); 3F-tr@,
si
/

(3#"-'

ozs(5,

5);

.iz8q!ryFo

oru(5,

5)) :

(0'433; 22'082)'

Si las varianzas son iguales, su cociente es igual a uno. En este caso, el valor 1 se encuentra dentro
iel intervalo; por tanto, las varianzas de los rendimientos de las dos compaas son iguales.

7.15.3. Intervalo de confianza para la diferencia entre dos proporciones


Sean f1 y f2 Ias proporciones de xitos de dos muestras aleatorias independientes, de tamaos rLr y n2,
:rovenientes de dos poblaciones de Bernoulli, Ber(p1) y Ber(p2), respectivamente. Ahora, deseamos
-timar, mediante un intervalo, la diferencia de esas proporciones poblacionales.

:--n intervalo de confi,anza aproximadc-r para


l-r:

-00(1

a)To viene dado por

l,,rnde 0r

y lz

la diferencia de proporciones pr

p21

a \rr

: I _ fz.

Ejemplo. Un fabricante

cree que su marca de yogurt es ms preferida en la Sierra que en la Costa.


?ara probar su sospecha escogo dos muestras aleatorias de 500 consumidores en la Costa y 300 en

Captulo 7. Estirnacin de Parrnetros

232

la Sierra. Las muestras revelaron que 210 consurnidores en la Sierra y 320 en la Costa consumen su
producto. De acuerdo a un intervalo de confianza al 98T0, se puede inferir que el fabricante tiene
razn?
Solucin:

Se tiene que

Costa:

n1

:500, pt :

Sierra: nz:300, Fz:


Por tanto, el intervalo

(,o.un

320
500

:0.64,

2t0
300

0.7.

es

0.64

_ or)-2rJ

0.36

0.7 x 0.3

ComoceroestdentrodeIintervalo'noSepuedeafirmarquelasospechadelfabricanteseacierta.<
En el Cuadrc 7.2 se encuentra un resumen de los intervalos de confianza de dos muestras analizados
en este captulo.
Parmetro

Distribucin
general

Intervalo

(rt -

o7 y o2 conocidas

Distribucin

or y o2 desconocidas

normal

supuestas iguales

Distribucin

ot y 02 desconocidas

normal

(t t

Ft-

distintas

Pz

Distribucin

rz)

2,,

o3

n2
sZ

- iz) tt o/2,(ntrn2-2)l *

(t-r)It,,/2,nrl!
'"

^\,
- P2l L'a/2\l'

binomial

oi
r\

/2

I'O

nt

lPtQt
V TL

'lL2

.9

r2

t2

PzQz

n2

Cuadro 7.2: Intervalos de confi.anza sobre dos muestras comunmente empleados

A lo largo de este captulo

la idea de que los intervalos estaclsticos reflejan la incer-tidumbre debida a la variabilidad de los datos, pero en la mayora de casos prcticos, a ms de
que las hiptesis bsicas sobre la muestra (como aleatoriedad, independcncia y normalidad) son viose ha enfatizado

1adas, influyen otros factoles cuya magrritud es incuantifi.cable,

personas

y los equipos, el medio ambiente,

por ejemplo, el comportamiento de las

etc.

Entonces, en la correcta interpretacin de los intervalos estadsticos habr qlle tomar en cuenta que
ellos no leflejan la incertidumbre total presente en las rnediciones y solo proveer wa cota'inferior de
la verdadera incertidumbre; por lo tanto, son una cruda aproximacin a Ia realidad.

t
7.76. Ejercicios

233

7.16. Ejercicios
1.

El gercrrte de una empresa quc tiene dos locales de ferretera cree cre las venlas en el local del
norte son mayores que en el Iocal del sur. Para verificarlo, tom una muestra de 200 facturrs
en el local del sur v 250 facturas del local del norte, resultando un promedio de 13 y 15 cilares
y desviaciones estndar de 3 y 4 dlares, r'espectivamente. Mediante un intervalo de confianza
de rrivel 95To,

,se

puede concluir que

e1

gerente tiene razn?

Una organizacin de defensa de los derechos civiles afirma que en la industria de Ia construccin
el salario r4edio semanal de los hombres supera en 13 dlares al de las mu.jeres. Una muestra
aleatoria de 20 hombres y otra de 25 mujeres revel promedios de 110 y 100 dlares, respectivamente. Si Ias dos poblaciones de salarios son normales con varianzas de 100 y 64, mediante
un intervalo de confiarrza para la diferencia de medias, de nivel 98 %, se puede decir que la
afi.rmacin es cierta?
Se cree que el precio de arriendo de las casas es mayor en Cuenca que en Ambato. Estudios
anteriores revelan que las dos poblaciones de arriendos tienen distribucin normal con varianza
homognea. Dos muestras aleatorias de tamao 16 revelaron lo siguiente: z1 : 138, sr : 6 y
Tz:135, s2:4. Con el empleo de un intervalo de confianza al 957o, se puede concluir que Ia
suposicin es correcta?

Un inversionista hizo un estudio para determinar en qu ciudad, Manta o Loja, podra abrir un
supermercado. En una muestr a de 2I hogares de la ciudad de Manta hall un ingreso promedio
de 500 dlares y una desviaciri estndar de 120 dlares. En otra muestra de 16 hogares de Ia
ciudad de Loja hall un ingreso promedio de 480 dlares y desviacin estndar de 60 dlares.
Suponiendo poblaciones normales con varianzas diferentes y con el empleo de un intervalo clc
nivel 957o, en cul de Ias ciudades le conviene abrir el supermercado?

El dueo de dos restaurantes que

verrde pollo a

la brasa quiere dcterminar si sus dos locales

venden Ia misma cantidad de pollos diarios. Dos muestras de las ventas de 12 das dieron los
siguientes nmeros de pollos vendidos:

Local A
Local B

12

17

I4

1B

10

20

72

L4

13

11

12

15

21

l5
l4

72

1ti

74

13

14

22

15

Adems, Ias muestras revelaron que las dos poblaciones de muestras son normales con valianzas
Se puede inferir que en los dos locales las ventas diarias de pollos son Ias misrnas?

diferentes.

Una manera de comparar el riesgo de dos inversiones es a travs de sus varianzas. Para una
itrversin en Ia industria electrnica se tom una muestra de 10 datos y result una desvicin
estndar de 52. Para una inversin en la industria siderrgica se tom una muestra de 15 datos
y result ttna desviacin estndar de 31. Si se asume que cada una de las invcrsiones sigucn
leyes normales, cul es su conclusin si utiliza un intervalo de confianza al 90% para la razn
de varianzas?

IJn investigador sospecha que los hombres y las mujeres difieren significativamente en ticmpcr
diario de utilizacin del telfono. Entrevista a 25 sujetos de cada sexo obteniendo ios siguientes
resrrlt ados:

Mujeres:
Ffornbres:

:38; or:6,
: 31; 02:5.

Utilice un nivel de confianza del g5 7o para:

a) construir un intervalo para larazn entre

las varianzas. Se puede decir que son

234

Captulo 7. Dstimacin de Parmtetros

lr) cortstruil utt irttetvalcl

pi-Lla

la difi:r'cncia cle nrcclirs rclccrrrclo.

El ctrtrclaclol clc rtu cqrLipo cle fiitbol quietc (jor]'lprar li r:fcctir,'iclrri cle srrs.jrrgaciolcs al c<tlrlar'
trn tiro pena1. En los cntrenarnicntos, Ios jr-rgaclores n:rcrionalcs, clc 120 tilos intcnta<ftrs, accrta,r'on
91, tnientras que krs extlaqjelos rle 90 tiros lea,lizados, accltaiolt 78. N,Icdiant.: rrn iutelvakr de
corrfiauza de nivel 90 %, se puede infcrir que rro hay diferencia cntle los jrrga<lores ritrciorrirlcs 1'
extran jeros a,l colrar un tiro penal'?

En lur estudio epidemiolgico, se tonr una rnuestra alcatoria de 300 hombres y 27 de ellos
padecicron o padecen Llna determinada variedrd de gripe. Tambin, se torn una rnlrestr:a de
400 rnujeres y a 32 les oculra lo misrno. A la vista dc cstos datos, se pucde consideral que estc
tipo de gripe afecta a hornbres y mujeles por igual? (Usc 1 - cl : 0.96)

10.

Se quiere comprobal la efectividad de una vacuna contra una enfermedad y para ello, tras
contagiar a 200 animales, se Ia suministra a 100 y se compara con otros 100, a los cuales no se les
suministr. De entre los vacunados, mueren 8 a causa de la enfermedad y de los no vacurrados
20. A un nivel de confiabilidad del 93%o, podemos decir que la vacuna es eficaz pala reducir la
tasa de mortalidad?

C*pstulo

Pruebas de Hiptesis
Dudar sobre todo o creer en todo: estas son dos
estrategias'iqual,m,ente conue'ni,entes. Con ambas nos
eui,tamos la neces'idad de refl.erionar
flenry Poncair
En el captulo anterior se vio que se puede realizar inferencias acerca de un parmetro poblacional
estimando su valor, ya sea de manera puntual o como un intervalo de confianza. Pero en muchas
ocasiones no interesa conocer o tener una idea dcl valor del parmetro, sino comprobar (o rechazar)
una afirrnacin sobre el valor que tiene el parmetro, sin mportar la longitud o la localizacin del
intervalo.
Suporrgamos que un investigador desea probar que actualmente, el ingreso mensual de los ecuatorianos
es mayor que el ingreso que tenan 5 aos atrs. Par-a verificarlo, recolecta los datos mediante una

muestra tomada al azar. El investigador podra desear cornprobar la hiptesis de que el aumento del
ingreso es rnayor que un cierto valor prefijado. Un intervalo de confianza de la variacin media del
ingreso proporcionar menor informacin que una prueba de hiptesis sobre la variacin del ingreso.

Las hiptesis son, en general, afirmaciones sobre los parmetros poblacionales, como 1a media y la
tarianza; as, se pudiera desear probar que el ingreso medio actual no es diferente de aquel que los
ecuatorianos tenan hace 5 aos. Una hiptesis tambin puede ser una afirmacin sobre la distribucin
de una caracterstica de inters; por ejemplo, que el ingreso mensual sigue una distribucin normal.
La teora de las pruebas de hiptesis sobre parmetros poblaciont.:.les fue desarrollada en los primeros
aos del siglo XX y sistematizada por R. A. Fisher, E. S. Pearson y J. Ncyman. stos ltimos la
formalizaron e introdujeron el vocabulario actua,lmentc en uso) en una publicacin realizada en 1933.
-\qu se expondrn los casos de mayor uso e importancia.

8.1.

Elementos de una prueba de hiptesis

Para probar una hiptesis estadstica es necesario tcner en cuenta cicrtos elementos que conducirn
a aceptar o rechazar la hiptesis planteada, de manera correcta. Ello 1o ilustraremos con el e.jemplo
anterior.

El investigador cree qLle) en condiciones normales, el aumento dcl ingreso medio d debe ser menor que
un nivel prefijado do :60 dlares. y decide probar esta afirmacin; pero en el curso de Ja investigacin
235

Captulo

236

8.

Pruebas de Hiptesis

conclllir que Ia variacin del ingreso es mayor que 60 dlares. Para tornal cnalquier drcisin
es necesario que el investigador compare cori Lrn valor que le informe de la validez o irn'alidez de su
se podra

liiptesis.
En la terminologa de las pruebas de hiptesis, aquelLa que especifica un valor particuJ.ar del par'metlo
que se estudia se llama hzpteszs nula, que se representa por 11g. trsta hiptesis, usualmente, corresponde al procedimiento de operacin normal de un sistema de especificaciones corrocidas. En el
ejemplo, d < 60 es la hiptesis nula, pues representa Io que debera suceder cuando ha habido un
incremento del ingreso, en condiciones normales; o sea) Hg: 0 < 60.

La hiptesis que especifica aquellos valores de1 parmetro que representan un cambio importante del
procedimiento normal o de las especificaciones conocidas, se llama hiptesis alternatiua y se representa por 111 . En el ejemplo los valores mayores que 60 indicaran un comportamiento anmalo o
extraordinario; as, la hiptesis aiternativa es -111: e > 60.

La cantidad, calculada a partir de la muestra, que permite decidir si la hiptesis nula ser o

no

ser rechazada se denomina estadst'ico de p'rueba. La distribucin de probabilidad del mencionado


estadstico debe ser conocida para poder realizar Ia prueba.

EI conjunto de valores del estadstico de prueba que conduce al rechazo de la hiptesis nula, en favor de
la hiptesis alternativa, se llama regi,n de reclazo o regin crtica de la prueba. La dec,istn consiste
en rechazar la hiptesis nula en favor de la alternativa si el valor del estadstico de prueba cae en la
regin de rechazo; caso contrario no se descarta fIs.
En las pruebas de hiptesis, el resultado se da en trminos de la hiptesis nula. Nosotros o <<rechazamos
Ilo en favor de Ir>> o <(no rechazamos f/s>>; nuncaconcluimos <<rechazamos [t>> o <<aceptamos fI1 >>.
Luego, y en base del anlisis del valor del estadstico de prueba, se podra sacar otras conclusiones
sobre fI1, pero sto depender de cada caso particular.

A continuacin
1.

se resumen los elementos de una prueba de hiptesis:

Hiptesis nula,

.FI6.

Hiptesis alternativa, I11


Estadstico de prueba.
4

Regin de rechazo.

5.

Decisin.

Errores de tipo I y de tipo II

Al tomar una decisin sc puede cometel dos tipos de errores: rechazar Ia hiptesis nula cuanclo
verdadela, lo que se llama error de tipo I; o bien, no rechazar la hiptesis nula cuando en realidad
falsa, lo que se denomina error de tipo II. Ello se resllme en el siguiente cuadro:
Hiptesis Nula

Verdadera

Decisin
Rechazar 1
No rechazar 116

Falsa

I
Decisiu col-recta
Decisin correcta Error tipo II
Error tipo

Entonces, tenemos Ias siguiente defini:iones:

es
es

8.7- Elernentos de una prueba de hiptesis


1. La probabilidad

de cometer Lln error de tipo

se denota

po a y

se

237

fija al

escoger

la regin

de

rechlzo. Este valor se denomina niueL de s'iqnzficacin de la prueba estaclstica:

Pr(error de tipo I)

2.

nivel de significacin

a.

El niuel de signifi.ca,ci,n obseruado o p-valor', es el mnimo valor del nivel cle significacin para
el cual los datos observados irrdican que Ia hiptesis nula debe ser rechazada.
Este valor se utiliza cuando se trabaja con paquctes computacionales para detelrninar si
rechaza Hs. La regla es la siguiente:
Si el valor de p

3.

( a, entonces se rechaza

se

116. Caso contrario, no se rechaza (se acepta).

La probabilidad de cometer un error de tipo

II

se denota por B

alternativa que se escoja:

Pr(error de tipo II)

depende de

la

hiptesis

B.

1. La potenc'io de una prueba

es la probabilidad de tomar la decisin acertada, de rechazar


cuando sta es falsa, y es igual a 7 - P.

Il

Figura 8.1: Probabilidad de cada tipo de error al realizar una prueba.


probabilidades a y B tienen las siguientes propiedades:
Para un tamao de muestra frjo, al aumentar la regin de rechazo (y por lo tanto a), B disminuye.

Al atrmentar el tamao muestral n, las probabilidades a y 13 dccrecen a la vez.


--- error de tipo I es considerado ms serio, por lo tanto
ms importante dc evitar, que un error
v
lipo
II. Consecuentcmente, el proccdimiento de probar una hiptesis se ajusta de manera que se
-.
: -antice una <<baja>> probabilidad de rechazar erroneamente la hiptesis nula.

l:.:ttentemente, se determina el nivel cv de manera arbitlaria, pero si no se lo especifica, habr que


- :ular el p-valor del cotrtraste. Esto permite rechazar 116 para valores pequeos de a. Nosotros
- r:raremos, de preferencia, valores para o de 0.1, 0.05 o 0.01.

s de pruebas de hiptesis
pruebas de hiptesis se clasifican en unilatelales

y bilaterales.

Captulo

238

8.

Pruebas de Hiptesis

Definicin (de prueba estadstica unilateral) Una prueba estadstica urrilateral

es aquella en
Ia que la regin de rechazo se localiza solamerrte en un extrerno cle la distribucin de probabilidad
del estadstico de prueba.

Para detectar si 0 I 0o la regin de rechazo se sitra err el extrerno superior de la distribucin del
estimador d (Figura 8_.2). Para detectar si d ) d6 la regin de rechazo se sita en el extremo inferior
de la distribucin de d.

eo

0o+C
Acentar Hn I Rechazar

Hn

Figura 8.2: Distribucin de ? cuando se cumple Hs: 0 { 0s.

Definicin (de prueba estadstica bilateral) Una prueba estadstica bilateral

es aquella que
sita la regin de rechazo en ambos extremos de la distribucin de probabilidad del estadstico de

prueba.

Las pruebas bilaterales se utilizan para detectar 0 < d6 o bien 0 > 0ol es decir,

aRechazar

Horla

Aceptar

Ho

,laRechazar

Figura 8.3: Distribucin de ? cuando se cumple Hs:0

8.2.

0l0o

(Figura 8.3).

Ho,
gs.

Pruebas de hiptesis sobre la media, cuando la varianzaes conocida

Uno de los casos ms comunes en la realizacin de pruebas de hiptesis es hacerla sobre el valor de
la media poblacional, cuando se dispone de una muestra de dicha poblacin. El parmetro 0 que se
desea probar es LL y el estimador d es la media muestral 7.

continuacin se exponen -de manera sucinta-, las pruebas estadsticas, bilateral

unilaterales,

cuando deseamos probar que el valor de la media poblacional l es igual a un valor prefijado

Prueba bilateral para la media.

1.

Hiptesis Nula. Ho:

p:

po.

-r,s.

8.2. Pruebas de hiptesis sobre Ia ntedia, cuando la varianza es conocida

2.

Hi,ptt:si,s

Al,terrtotduu

Hl

3.

Estadsti,co de P'rureba.

4.

Re.gin de Rechazo. zobs I

Ejemplo. IJna empresa

-L

Zobs

ro.

- lro
IJ
"

x:

-zol2 o Zor, )

z,r2.

farrnacutic ha estatlecido qlre un compriniido dcbc tcncr Ltn peso

nredio igual a lo:0.5g y una desviacin estndar de o:0.11g. Se tom una muestradeT44
comprimidos de un lote de frmacos, cuyo peso promedio fue de Z:0.53g.

a) Para un nivel de significacin de 0.01, ,el peso de los comprimidos en e1 lote

se diferencia

del admisible por Ia empresa'/;

b) Determinar el p-valor

de la prueba.

Solucdn:
a)

La prueba de hiptesis es bilateral:

Nula. Ho: F:

1.

Hiptesi,s

2"

Hiptesis Alternat'ua.

3.

Estad,sti,co d,e Prueba. zobs :

4.
5.

0.5 g.

HI

tt l_0.5

e.

?:+ o I \/n

0'53

- 0'5 :3.273.

0.11 I \/ 144
Ia regin de rechazo es zobs < -2.57 o zo6") 2.57.
Deci,s'in. Como el valor zobs cae en la regin de rechazo, se descarta la hiptesis de que
/ : 0.5. La probabilidad de rechazar -16, suponiendo que sea cierta es solo 0.01; por lo
tanto, en al menos el 99 % de las veces la decisin es la correcta.

Regi,n de Rech,azu Para

a:0.01,

b) Determinemos el nivel de significacin mnimo de la prueba.


Como Zobs:3.273, el valor de probabilidad correspondiente es (D(3.273) :0.9995. Por ser
una prueba bilateral, se cumple que 0.9995** : t, por Io tanto, a:2(l-0.9995) : 0.001;
2 ','
que significa que llegaremos a una conclusin errnea en menos de I de cada 1000 veces, lo
que verifica la conclusin anterior.

b) Prueba unilateral para la media.

1.
2.
3.

Hiptesis Nula. Ho:

4.

Regi,n de Rechazo. Zobs

F: lto.
Hiptesis Alternat'ua. HI F] l-ro (o bien Ht
r - tlo
Estad,stico d.e Prueba. zobs :

"l\,' zo6"

> zo (obien

F < po).

{ -zat cuando HI

< ttd.

Ejemplo.

Si en el ejemplo anterior, el peso mximo admisible para que el medicamento no sea


txico es igual'd LLo:0.52g.

a)

Se desea saber si los comprimidos del lote son aptos para el consumo humano, a

un nivel

de significacin del 5 %;

b) Determinar el nivel de significacin

de la prueba.

Solucin:

a) Los datos son los mismos que

antes se usaron, solo debindose cambiar las hiptesis.

24O

Captulo

8.

Pruebas de Hiptesis

1.
2.
3.

Hiptesis Nula. Ho: F :0.52 g.


Htptesis Alternatiua. HI F > 0.52 g.

4.
5.

Regin

zors:' , F - 0'53-0'52:1.0909.
o.lJt44
" I rt
:
de Rechazo. Para cl 0.05 la regin de rechazo es zob.s > 1.65.

Estadstico

d,e

Prueba.

Dec'isi,n. Como el valor zobs Lo cae en la regin crtica, no existe razn para descartar
la hiptesis nula, de manera que se podra asegurar que el medicamento es apto para el
consumo humano.

b) El nivel de significacin de la prueba es 1- 0(1.0909) - 1-

0.8621

p :0.1379 > 0.05, no se rechaza Hs.

0.1379. Como

es suficientemente grande (n > 25) y se desconoce la


vatianza, es posible utilizar estas pruebas, reemplazando o por su estimador s, sin prdida de exactitud.

Observacin. Si el tamao de la muestra

Clculo de Ia potencia de la prueba


La probabilidad de cometer un error de tipo

II

se nota como B

Pr(error de tipo II)

donde suponemos verdadera la hiptesis

Hl F:

se define por

: ptl""eptar flslr, ),

l-rt.

Errtonces, por el Teorema del Lmite Central, la variable

Ejemplo. En el ejemplo anterior, calcular Ia potencia

7 : !-4

ol\/n

sigue una Iey normal estndar.

de Ia prueba si el verdadero valor de la media

es 0.54 mg.

Solucin: Veamos qu signiflca <<aceptar

-16>>

en trminos de los valores que puede tomar el promedio,

r.
Aceptamos Hs

si+
o

<

\/n -

1.6b; es decir,

,01.?,, < 1.65, o seaz < 0.53b13.


=u-0.rll\/144

Por tanto, la probabilidad B la podemos poner de la siguiente manera:

Pr(aceptar

Holp) :

Pr(z < 0.535131p1 : 0.b4)


("- p, - 0.53513-0.54\

"\"lr/i'

La correspondiente potencia de la prueba es Pot

8.3.

o.lrl\n44 )

Pr(Z < -0.53127) :0.2976.

- 1-

13

:0.7024.

Pruebas de hiptesis sobre la media, cuarido la varianza es desconocida

Cuando la varianza es desconocida, no es posible aplicar el Teorema del Lmite Central; en este caso,
para que sea posible aplicar esta prueba es necesario que la muestra provenga de una poblacin que
sigue una ley normal, de manera que el estadstico de prr"reba sigue una ley de distribucin . Entonces
la prueba estadstica es la siguiente:

8.3. Pruebas de hiptesis sobre la rnedia, cuando Ia varianza es desconocida 24L


a) Prueba bilateral para la media.

1.
2.

Nula. Ho: Lt: l-to.


Hiptess Alternatiua. Hr p I
Hipteszs

p,o.

rd,e Prueba. trrbs :

3.

Estadstrco

4.

Regi,n de Rechazo. tob"

Po

'l'F,

{ -to/z(n -

1) o tob"

t^2(n

I).

Ejemplo.

Segn un estudio del Ministerio de Educacin, el costo medio de la lista de tiles


de los escolares de educacin bsica es 87 dlares. Para verifi.carlo, un investigador tom una
muestra con los siguientes resultados:

Cesto

(ri)

| 68

7b 93 101

r23

Para un nivel de significacin de 0.05, verificar la hiptesis de que la mquina cumple con la
especificacin.

Solucin: Previamente hallamos

eL promedio y la desviacin estndar:


(los clculos se dejan como ejercicio para el lector).

:97.7 y s :

18.728

Con sto planteamos el contraste:

1.
2.
3.

: $1.
Haptesis Alte,rnatiua. H; p,l87.
Estad,stico de Prueba. tobs: !;+

4.

0.05 y por el nmero de grados ile


:
1)
: 2.093. La regin de rechazo es
19
se
encuentra
el
valor
de
s.625(19)
tobs 1-2.093 o to6" ) 2.093.

Hiptesis Nula. Hs: p

Regi'n de Rechazo.

libertad ("

5.

- 87 t|tn@Para el nivel de significacin a :

slfr, --

97'7

o
<,=<
L'')'

Dectsin. Como el valor o6" s encuentra en Ia regin crtica, ya que 2.555 > 2.093, se
rechaza la hiptesis nula; es decir, el precio medio de las listas de tiles es distinto al que
afirma el Ministerio.

b) Prueba unilateral de la media.

1.
2.
3.

Estadstico

4-

Regi'n de Rechazo.

Hiptesis NuIa. Ho: Lt.: l.to.


Hiptesi,s Alterno,tiua. Ht F > po (o bien I11: F
d,e

Prueba.

tobs

< tli.

: " , 4.
"1rfr"

tob,) t.(n.- 1) (o bien tob, 1-to(n - 1), cuando H t <

tto).

Ejernplo.

Segn las previsiones del gobierno, la inflacin para este ao ser de 3.g %. Un
economista, desconfiado de Ia cifra, realiz una investigacin por su cuenta y registr la variacin
de los precios en los 22 artculos que a su juicio tienen la mayor incidencia en Ia economa popular.
Obtu'r'o una variacin de 4.5 7o y una desviacin estndar de 1.3 %. Pruebe si la cifra de inflacirr
del investigadol ser mayor que la del gobierno.

Solucin:

1.
2.

Se tienen los siguientes datos del

p: 3.9.
Alternat,iua. HI H > 3.9.

Hiptesis N'ula. Ho:


Hipteszs

problemai rL:22,

r:4.5

y s: 1.3. La prueba es:

242

apu,Ia
E,lnLlis!i'o d, pr,,"5,,.

8.

-Fruefas de -fipCesis

O' ''t::

1,,t,. +

t.:j/ \/2')

'lJ't

2.lLii.

Si tornarllos Lv : [J 01 y l,o or(21) - 2.518, la legin cr'tica es


2.518; pcto si sc tonta r-v:0.1-J5 y ls5(21) - I"721,1:r reg,in ur'tir-' es ..,,, > 1.72]1.
flegt,ri,

tle

trlec:la,zo.

1.,,,,,, )>

Dec:i,si,n, Prla cr - 0.01 no se rechaza H; cs dccir, no existe evidencia quc indiqu,,rl{'ia


ciflr clacla, pol cl gobierno est subestirrrada. Srn embargo, si sc torna r-v - 0.05, resulta que
Lob., ) ... se rechaza Ho; es decir, 1a infla',n cs inayor que la estimada por el gobici"no.

ltpaltirdelosclosrcsultadossedednce qr-ielaaceptacin orec:hazode-r,:3.9noesconchryente.


puesto qlle con o : 0.05 se rechaza y con ! : 0.01 se acepta. En este caso se debera arrmentar
el nmero de observaciones.

8.4"

Pruebas de hiptesis sobre la varia.nza

Para realizar una prueba de hiptesis sobre la varianza, supondremos que las observaciones provienen
de una distribucin normal) para que el estadsti
grados de

libertad. Bajo

* @#

siga una distribucin

y2

con

(n - t)

este supuesto, las pruebas de hiptesis son las siguientes.

a) Prueba bilateral para la varianza.

: of;.
H o2 I o2r.
(n

1.
2.

Hiptesis NuIa. Hs: o2

3.

Estad,stico

4.

Regi,n de Rechazo. X?"u" > X?.p(n

Hzptesr,s

Alternat'iua.
d,e

Prueba. X3,,":

-])s2

1) o

XZt

"

< Xl .,r(n

- t.

h) Prueba unilateral para la varianza.


Nula. Hs: o2 : of,.
Alternatiua. H o2 >

1.
2.

Hiptesi,s

3.

Estad,sti,co d,e Prueba.

4.

Hiptesr,s

XZu":

Regin de Rechazo. XZu">

"3

(n

@ bien 111:

- !)s2

o' <

oZ).

o2o

x?,(n- 1) (o bienyf;o"<x?_,(n- 1), cuando Ho2 <"2i.

Ejemplo. Un fabricante de cables de cobre afirm que su producto tena una resistencia a la ruptura
relativamente estable y que se ubicara en un rango de 40 kilogramos-fuerza (kgf) . IJna muestra de
16 mediciones arroj una varianza igual a s2

a) Hay evidencia suficiente

b) Encontrar el

p-valor

195.

para rechazar Ia afirmacin del fabricante?;

de la prueba.

Soluci,n: Como el fabricante da el rango de variacin de la resistencia, podemos estimar la desviacin


estndar mediante la relacin aproximada
asumir que o : 10 kgf.

" - ry99

(dada en el Captulo 1), por lo qne se puede

8.5. Pruebas

de hiptesis sobre Ia proporcin

243

a) Lrr prlreba t:s:

1.
2.

Hiqtlr:s'is Nrr,lo. H'. 62

3.

Estadst'ic:o tle Prtrcbo,. X?,.,

4.

R.egir'r de Reclazct. Prra

102

:10C).

Ht'. o2 > 100.

H'i1ttt:srs Altentat,i,ua.

(n,

- t)s'2

(16

1) x 195

:29.25

100

nn rrivel cle significacin

o:0.05 y 15 g.1., fSoo(15) :25.00.

La

regin crtica es Xlo" > 25.

5.

Decisin. Como 29.25 > 25, se conch.r.yc qrre la hiptesis es falsa y qtle la variacin

de la,s

mediciones excede ias especificacioues del fablicante.

b) Para encontrar el nivel de significacin aproximado

de la prueba examinamos) en ia tabla de la


distribucin X2,elrenglncorrespondientea15g.l. Sevequeelvalor d.XZt":29.25 esmayor
eue XZ.ozs :27.49 y menor eue X3.or:30.58. As, el nivel de significacin observado es menor
que 0.025, Io que quiere decir que se rechazar la hiptesis nula para cualquier cr mayor o igual
al2.5%.

El valor exacto, obtenido mediante un programa informtico) es 7.45%.

8.5.

Pruebas de hiptesis sobre la proporcin


n observaciones

provenientes de una poblacin con distribucin de


Bernoulli y deseamos probar que el parmetro p es igual a un valor prefijado ps. Recordemos, tambin,
:1ue si entre las n observaciones hay y xitos, Ia proporcin se estim a por f; : !.
n
Supongamos que se dispone de

Para la realizacin de estas pruebas, utilizaremos la aproximacin de la ley binomial mediante la ley
:rormal.

a) Prueba bilateral para la proporcin.


Nula. Hoi p : po.
Alternatiua. Ht p I

1.

Hi,ptests

2.

Hiptesi,s

J.

Estad,stico

d.e

Pr-ueba.

po.

p-po
-po - --Ft
--F o0
lPoqo

zobs

OonCte

tl-

4.

Regi,n de Rechazo. zobs I

p- -a
n

un

-2.2 o 2o6"

/ zt/2'

b) Prueba unilateral para la proporcin.

p:

1.

Hiptesis NuIa. Ho:

2.

Hiptesis Alternatiua.

3.

Estadstico de Pru,eba.

4.

po.

Hr p > p0 (o bien I11: p < po).


Zobs

Regin de Rechazo. zobs )

f-po
po qo

n
zo (o bien zor, I - Zat cuando

Ht p < po).

:jemplo. Una empresa realiz una investigacin de mercado para determinar el nivel de consumo de
- refi'esco, para lo que consult a200 consumidores, de los cuales 28 expresaron sll preferencia por
.-:roducto. El fabricante, de acuerdo a sus ventas, cree que tiene el 10% del

mercado de refrescos.

244

Captulo 8. Pruebas de Hiptesis

a)

Son los resultados de Ia investigacin consistentes con los datos del fabricante?;

b)

Determinar el nivel de significacin del contraste.


Se tiene Po

Soluczn:

a) La

0.1 Y el estimador de Ia proporclon es p

28

200

:0.14.

prueba queda as:

1.

Hi.ptesis

2.

Hi,ptesis

.J.

4.
5.
b)

Nula. H0: p: Q.1.


Alternatiua. Hr.p +

Estad,stico d,e

0.1.

Prueb
a' Zobs:P - Po
lposo:
tl n

Regin de Rechazo. AI escoget

0.14

0.1

0.1 x 0.9

:1.886.

(r:0.05, 26.s25:1.96, la regin es zobs > 1.96.

Dec'isin. Como zobs Lo cae en la regin de rechazo, no se puede descartar Ilg; entonces,
no hay evidencia de que la proporcin de consumidores sea distinta del 10 %.

Como zobs :1.886, el valor de probabilidad correspondiente es A(1.886) : 0.9706. Por ser una
prueba bilateral, se cumple que 0.9706 +;:1;
por lo tanto, a:0.0588.

Clculo de la potencia de la prueba


La probabilidad de cometer un error de tipo
,6

II

se nota como B

Pr(error de tipo II)

donde suponemos verdadera la hiptesis Ht:

y se define por

prlu"eptar I1slp1),

p: pt.

Entonces, Iavariabl.e

Z:

srgue

una ley normal estndar.

Ejemplo. En el ejemplo anterior, calcular la potencia de Ia prueba si el verdadero


proporcin es 0.12.

valor de la

'

Solucin: Veams qu significa

<<aceptar f/s>> en funcin de p.

<

1.96, o sea 0.05842 <

A<

0.14159.

Por tanto, la probabilidad B la podemos poner de la siguiente manera:


Pr(aceptar fo

br) :

Pr(0.05842 < 0 < 0.I47591p1: 0.12)

0(0.93958)

La correspondiente potencia de la prueba es Pot

O(-2.6799)

- 1-

0.8226.

0 :0.1774. <

En el Cuadro 8.1 se presenta un resurnen de las pruebas de hiptesis col muestra nica.

8.6. Ejercicios
Hiptesis

nula (I{)

3,i,"Ti3:.fi;TH' i
=
grarrcle)
(rrruestra

Distribucin

riorrnal

va'iarrza
clescolocida

Lt,2

i;i
tt,o

: l1,o
lt1. po
y,) l.ro

Hiptesis

alternativa

(,F11 )

t!
,
-ro/\/n

I H,
Fllro
lt 1 fto

,'- i - l"o
slJn(n - 1) g.l.

lt { I,t,o
F

p:

binornial
(rnuestra grande)

P<Po

P>Po

P>

P 1Po

Po

Estadstic<-r
cle prueba

r,lli

Distribucin

po

245

Plpo

Regin de
rechazcr

t4,"'),,,'
4 -zo
lt > t^/,
z

tltu

t { -to

l-l

z-

r
ll 2 zo/2

L\-40

Cuadro 8.1: Pruebas de hiptesis con una sola muestra.

8.6.

Ejercicios

Pruebas sobre la media poblacional (varianza conocida)


Se sospecha que los varones de las nuevas generaciones tienen, en promedio) mayor estatura que

las antiguas. En un estudio realizado hace clos dcadas se determin que la poblacin adulta
masculina tcna una cstatura media de 167 cm, con desviacin estndar de 10 cm.

a)

Si se <lesea verificar Ia suposicin anterior, formule, en smbolos y en palabras) la-s hiptesis


nula v alternal iva;

b) Recientemente se tom una rnuestra de 35 reclutas del servicio militar y se observ una
estatula promedio de 171 cm. Qr.r conclusin se puede sacar con a : 0.01?
Un fabricarrte de fertilizantes afirma que el uso de su producto dar por resultado una cosecha
de por lo rnenos 3.5 toneladas de trigo por hectrea, como media, con una desviacin estndar
de 0.5 toneladas. La aplicacin del fertilizante a un lea de 37 hectreas dio una cosecha de
3.35 toneladas por hectrea.

a) Al nivel de significacin del 5Vo, ,serecltaza la afirmacin del fabricante?;


b) Se rcchaza la afirmacin al nivel del TVo?
Una balanza sc encltcntra descalibracla y no siempre registra el peso rxacto. Cuando se pesan
454 g la desviacin estndar es de 10 g. Para averiguar si es necesario recalibrar 1a balanza se
realiz una scrie de 50 pesajes de cantidades iguales de <<una libra>>, resultanclo un peso promedio
de 451 g.

a) A

b)

urr nivel del 10 %, es necesario lecalibrar la balanza?.

Calcule el nivel de significacin cle la prticba.

Una emplesa qlle elabora plarrchas plsl,icas puso en prctica un nlrevo rntodo de fabricacin
tal que el costo medio por rnetro cuadrado sc distribuye rrormalmente con va,rianza poblaciorral
4. Se obtuvo una muestra aleatoria simple de tamao 100, resultando un costo promedio de 2.4
dlares. Verifique la hiptesis de que el costo medio es dc 3 dlares, con rrn nivel de significacin
del4.5%.

Captulo 8. Prttebas de Hiptests

246
5.

Pol cstudios

(i

LLr lrbor'rtorio frlrrrrcuti<:o asegura qllc rrn nrcdicrriertto crc fal rricr ti<rrre nrr <rolrtenirlo rrreclio
dc 10 000 unidadcs cln ca(la dosis. Para corrl"rol.rrr si c1 lrl-ior'itolio cs de fial se torn<i uua
mur:stla cle 40 dosis, obterricnclo una rucclia <le 9940 uuirirrles ) ulla desvircin ostinclar clc 120

rrrt<:Liorcs, scr srrbc crer lir" rrcrlir dr: I eclrd rle los tlclirrcrrcrrt<:s crr cl pzrs cs rlc 23
aos: sirr cnrl.,argo. crr un estrrclio rer:icnt<r (ioll Llnt unrcstLr rlc: 80 clr:tcrriclos. sc obtrrvo r-rrr 1>rorrrc<1io
clc 21.5 arlos y urrt <lesviar:irirr estirlrlrr' <lc i-J. Crl rrn nivcl rle sigrriic:ir<:irirr cl<:1 '2 %, r:r.,ur1.,nLelrc
ia, hipritcsis clc quo lr rneclir cie ecla,cl cle los clelirrcrrcntes sc hr lc<hrciclo sigrrific:rtivirrle:lr(,c.

unida<les.

a)

.Poclcrnos aceptal la iuclicacin clel Irboratori<.r cou ulr rrivcl cle significacitit r.IeI

b)

Calculc ei nivel de significacin de la prueba.

I%il:

En un restaurante se haia tenido una media de 160 consumiclores diarios y nlla dcsviacirt
estrrclar clc 17.5. Se aumerrrt los precios cle la cornida y el propietalio not que 1os 30 riltimos
das haba un prornedio de 151 clientes diarios. trI propietario pnede pensar que efectivament<:
ha descendido el nmero de clientes o que la variacin es debida aI azatrl

IJna emprcsa exportadora de camarn el ao pasado embarc una media de 10500 c:rjas por'
sernana) corr una desviacin estndar de 1500. Eu los primeros seis rneses (26 sernanas) dc estc
ao export un plornedio cle 11200 cajas cada semana.

a) Puecle asegurarse que ha habido un cambio en la demanda de camarn?;


b) Halle el nivel de significacin de la pmeba

En una fbrica, la produccin por hora dc botones de tagua sigue nrra distribrrcirl nornlll
con desviacin estndar de 16. Se extrae de dicha poblacin Lrna mnestra de tmairo 81, para
contrastar la hiptesis de clue la produccin medir por hora del citado producto es 100, a1 nivel
de significacin del 5 %. Si la hip<itesis alternativr es 105, calcule la prolrabilidacl de ccrrneter urr
error de tipo II.

10

Una sociloga afirma que cl tiempo que los nios cle tres r cinco riros dedican a ver la televisirr
cada semana se distribuye normalmente con media 22 horas y desviacin estndar 6 horas. Frentc
a este estr-rclio, una ernpresa de investigacin de mercados cree que la media es mayor y pala
probar su hiptesis tom una mucstra de 64 observaciones procedentes de la misrna poblacirr.
obtcniendo como resultaclo una meclia dc 25. Si se utiliza un nivel de significacirr del 5 %:

a) Verifique si la afirmacin del investigador es realmente cierta;


b) Determine la potencia de ese contraste, si 1a verdadera media poblacional fuera
11.

24.

Urr rnicroernpresario est considerando la posibilidad de administrar cl bar clc uu colcgio. trl
adrrrinistradol actual del brr afilma quc r:l inglescr diario sigue una distrilrucin nolrnal rle rnedia
87.5 dlares y una desviacirr estndrr di: 7.5 dlares. Para comprobar si decr la verclld) torn(i
Lurr rnlrestra de treinta das y :sta revel<i r-ru ingreso dialio promedio dt: 82.5 dlrres. Utilizarrck

o:

0.1,

a)

,hay evidencir de quc cl iirgreso diario promcdio sel nenor clcl que rfir'ma el clueo actrral'/;

b)

Calcule la potcncia clcl contraste si

lr

verdaclera rncdia fucra pr,:85.

Pruebas sobre la media poblacional (varianza desconocida)

12. Una muestla de n :

11 observaciones de una poblacin distribuida rlolmalmente dio corno


resultado un promedo T : 19.5 y una desviacin estndar s : 2.4. ,Proporcionan los datos
suficiente evidencia para probar que > 18?

t
t
fi

8.6. Ejerci.cios

i.

a) Enuncie las hiptcsis nula

v altelnativr

clc lr pmcl)r;

b) C)lrtcuga la legin clc reclLazo ltrrra la prtrr:lrir si


c) Llcvc

247

a:0.05;

cabo la 1;rneba e interpr:tela.

Se dcsca saber si la cdad promedio a la cual sc clesposan las rlujeres en la ciudacl cle Cuenca es
diferente cle los 26 aos de edad. Sc torn rrna muestraclc24 registros dc rnrtrimoriio, resultandcr
las sigr-ricntcs edades de las novias:

18 28 46 21 29 23 47 43 23 32 20
26 40 19 35 20 18 16 65 22 19 24

56
32

La edad promedio de estas edades es 29.83 aos y ia desviacin estndar es 12.86.

14.

a)

Son ios 29.83

b)
c)
d)

Plantee las hiptesis nula y aiternativa para verificar el argumento arriba indicado;

12.86 parmetros o estadsticos?;

Calcule el estadstico de prueba y la regin de rechazo para esta prueba de hiptesis;


Explique su conclusin sobre si la edad promedio de Ias desposadas en la ciudad de Cuenca
difiere de los 26 aos.

Una compaa de televisin por cable anuncia que el periodo medio de espera desde la solicitud
hasta la conexin a la red de sus nuevos clientes es de ocho das. Una asociacin de consumidores
desea verificar dicha hiptesis, para lo cual tom urra rnuestra del periodo de espera (en das) de
15 clientes con los siguientes resultados:
11

r0138

10

721281011

l07B

Verifique si el periodo medio de espera es igual o diferente a ocho das. (Use a

\5.

0.05.)

La resistencia, en kgf crn2, de Ia fibra de carbono se distribuye normalmente. Se tom una


mnestra de 10 elementos fabricados con este material, obteniendo:

203 229 275 220 223 233 233 208 228

209

Contraste la hiptesis de que la muestra proviene de una poblacin de media 275 kgf cm2.
6

Segrn los datos de una universidad, sus estudiantes obtienan en el examen de evaluacin clel
ingls como segunda lengua una media de 50 puntos. Un profesor de ingls quiso comprobirr
si sus alumnos tenan un promeclio rns alto, para ello seleccion una muestra aleatoria de 20
alumnos y les envi a examinarse. Los resultados dieron una nota promedio de 54 y desviacin
estndar dc 7 puntos. A qu conclusin llegar el profesor, con un nivel de significacin del

f,(Yn

/a:

En una ciudad se quiele hacer un cstr-rdio rpido para'r,'alorar el consunlo de agua en los domicilios
palticulares dulantc los meses de mayor seqntr. Para ello sc seleccionalon, al azar, 15 domicilios y
se midieron slrs consumos (r) en metros crbicos durante el mes de agosto. Los resultados fueron
Dr :280.5, Dr? :5308.35. En vista cle estos clatos, hay suficiente evidencia estadstica, al
nivel 0.05, r favor cle la hiptesis de que el conslrmo medio de los particulares durante el mes de
agosto es llayor clue 18m3 (q,-,e es el consnmc considerado como <sostenible>>)?

El consumo de gasolina (en litros por 100 km) de los automviles de 3 puertas sigue una distribucin normal con rnedia 8. Se introdujo una modificacin en el motor con objeto de disminuir el

Captulo B. Pruebas de Hiptesis

248

corrslrnlo y se probaron 10 rutos corr el motclr modificaclo, obtcrrirrclose los siguierrtes esta,rlsticos
por' 100 krrr:
10

10

,.-r

T,r;i -

",:77'5,

i.-

(i01.33

la modificacin urrntienr: 1a nor-nalidirrl, ,hay suficiente evidr:lrcia csticlsticr


(al nivel clc significacin 0.05) ptrra porlel afirmll cre la rnodifir:rcirin ha reduciclo el colrsllrno

Srrponiendo qr-re
meclio?
19

El ticrripo

al disco drrro cn un c;icrto mocielo dc computarloras es una variable rleatorir


con rnedia 15 milisegundos. Se propuso una modificacin tcnica con objeto de dismirruir cste
ticrnpo de acceso. Se prueba el nuevo sistema crr 10 cornputarloras obtenindose una medir
muestral de 14 ms y una desviacin estndar de 2.286.

a)

<le acceso

Hay suficiente evidencia estadstica, al nivel 0.05, a favor de ia hiptesis de que el rruevo
modelo disminuye el tiempo dc acceso'/;

b) Calcule el p-valor.
c) Indique un par de valores

de 7 y de s que hubiesen llevado a un


decisin se dcbera tomar eri este caso respecto al nucvo rnoclelo?

20

p-valor de 0.005.

Qu

Una muestra de 25 traba.jadores informales, que sc dedican a vender golosinas en los buses.
ganan un promedio de 17.5 dlarcs diarios con una desviar:in estndar de 2.5 dlares.

a) Estime la ganancia pr:ornedio diaria


intervalo

b)

r-le es1,c

tipo

cle trabtrj:rdores informales, usa,ndo nn

de confianza aI g57a;

trs Ia ganarrcia promedio de 17.5 cl<ilares significativmente inferior a los 18.5 dlares qrrc
ganan los vencledores qne tienen un prresto fijo en los cines? (Utilice nn nivel del 5%.)

Pruebas sobre la varianza poblacional


2r.

Unr muestra

de r : 25 observaciones cle una Poblacin distriluida rrormalmente clio corno

rcsrrltaCo una variatrza lullestrIl

indirrre q',r o2

> i5?

dc.s2:23.4. Proporcionan los clatos

srrficiente eviclencia que

22

Urr muestra aleatoria de 14 est,ucliantes de enfcrrnera participan en Lrna plLreba ptrra meclir
su destreza mannal. una vez obtenidas las purrtutrciones, la varianza de lr muestr es cle 7221.
Contrastc con cv : 0.05 que la varianza poblacionirl es de 2500"

t'l

I a lrrecisin del tr"bajo dc una niquntr urtom.tica se nlide por: la r..aLirnza clc-. la cliuiensirr
coutrolaclr clc los productos, que llo debr: ser rrli\yor,,c ofr :0.18. Se torrr<i nna rLruestr;r
ak:lLtclia

cl<r

rrtculos quc hrr daCo la,s sigriicnte-s rledici<tri<ts:

Verilique si la nrqrrinir gartrrrtiza lir prer:isin neer:salia p;rlzr el uivel cle significirr:irin ck: (-).05.

24.

estndar-de un proceso ir.ciustLirl (irrc plo(hlce valillas, <:l concliciones nolrnirles,


es clc 3 crn. Se dispone de una nnestra ck: tarnairo 15, con los sigr-rientes valores:
Lr c{esvia,cicin

12; I i7 115 130 l1;

112

11it

Su1-ronierclo clue las longitudcs sigr-rcrr tlltl

furrciona correct alnente.

0')
:, I

lc_1, r,

121

illr)r'rl

177

116

122

r20 126 115.

. contrastc Ia hiptcsis dc cre

erl

ploccso

8.6. Ejercicios
25.

249

Una mquina de crnpaquetado automtico deposita en cada paquete una ciclta cantidad de papas
fritas. Se scleccionan 20 paquetes, se pesa su contcnido y se obtienen los sigr.rientes resultados:
49

50

49

t10

50

50

49

50

50

50

49

50

50

51

52

48

50

51

51

51

A partir de esta informacin y suponiendo que la variable

a) Verifique si la media de esa variable

b) Verifique si la varianza

es

se

distribuye normalrnente:

es 51, con un nivel de significacin del 1%;

la unidad, con un nivel de significacin clel

5 %.

Prueba sobre la proporcin poblacional

26.

Una muestra de n : 1000 observaciones de una poblacin binomial produjo A :280 xitos. Si
la hiptesis de la investigacin es que la proporcin es menor que 0.3.

a) Es una prueba bilateral o unilateral? Por qu?;


b) Fbrmule las hiptesis nula y alternativa de la prueba;
c) Realice la prueba e interprtela. Utilice a : 0.05.

27.

Una marca de aceite comestible cubre actualmente el 20 % de los rotencialcs clientes. Para
incrementar las ventas se estructura una campaa pubiicitaria intensiva. AI final de la misma se
realizar una investigacin a 400 consumidores potenciales para determinar si tra tenido xito.

a) Enuncie Ho y Ht

en trminos de p, Ia probabilidacl qrre el consumidor prefiera la marca

cle

aceite;

b) La empresa concluir que la campaa tuvo xito si al menos 94 de los 400 entrevistados
prcfieren su prochrcto. Encuentre a;

c)

Realice la plueba e interprtela.

r8

En una encuesta a 300 taxistas, 132 contestaron que utilizan el cinturn de segulidad. {Jtilizanclo
un nivel de significacin del 5 %, podemos concluir que la mitacl de los conductores utilizan el
cinturn?

')9

De acuerdo con sns registros, una clnica ha establecido que la probabilidad de curacin completa
de un enfermo que ha tomado el medicamento A es 0.8. La clnica experiment con un nuevo
medicamento B en 700 pacientes, de los cuales 575 se cllraroll totalmente. Se puede considelar
que el nuevo medicanrento es ms eficaz que el tradicional, al nivel dc significacin de 5To?

Una agencia dedicada a1 cobro de cheques encontr <re el 5 % de toclos los cheques remitidos
a la agencia eran cle cuentas sin fondos. Despus de implantar nn sistema de verificacin, pa,r'a
disminuir sr"rs prdidas, se hallalon solarnente 50 cheques sin fonclos erl Lrna mncstra aleatoria cle
1124 cheques. Existe suficientc evidencir, estadstica para concluil quc el sistema de verificacin
ha reducido la proporcin de cheques sin fondos?
Un proveedor ascgura que los artculos que 1 snnrinistra sorr defectu.osos en un 1% cle los casos.
Se realiz r-rna pmeba r 200 de sus artcnlos y resr-rltaron 3 r-lefectllosos.

a) A un nivel cle significacin del 1 '%, ;t:s falsa o cierta la afir'macin del ploveedor?;
b) Halle el nivel de significacin observado de la plueba.
En una encuesta en Quito se entrevist a 850 adlrltos. A la pregunta de que si ellos estaban a
favor del endurecimiento de las penas por ciertos delitos, eI 52% respondi afi.rmativamente.

Captulo

250
r)

.Sc Pucclc ccttr:lttil ctct


l) ollrs

lir

8.

Pruebas de Hiptesis

rtit\rorr clet

los rdultos estn

favol del

enchrrc<tirrLierrto rle

lrs

?i

l,) l}lcrrcrrl.r'i: cl nivr:l clc sigrrific:acin cle la

y>nrcbzr.

33. Utt ecortornista

clcl Battco Cerrtral est intcreslclo err conrl)ar'rr cl uilice cle arrsentisrno labolal
(.)rrito
crr
con el dcl rcsto del pas, doncle se sitria <n eI 77(%. Corr estc plopsito se:ieccionci, al
azar') urra rnuestra cle 200 tlaba.jaclores de dicha, ciuclad, la cual proporcion rur porcenta.je de
ausentisnro del \6(Vo.

la conclusi,n de que el arrsentisrno es rnayor en Qr-rito qlle cn el lesto


pas, al nivel de significacin a : 0.025?;

a) Se pr-rede sacar

b) Calcule [3,

"i

p:

de1

0.17;

34. Una agencia de publicidad trat de convencel a un industrial para que hiciera

propaganda
televisada de uno de sus productos, asegurndole que el programa en el que se incluira su
aruncio era visto por el 2A% de las familias. trl industrial quiso hacer un experimento por su
cuenta. Llam por telfono, durante Ia hora del programa, a 220 familias y hall que en 33 de
ellas se vea el programa.
a) La diferencia entre la proporcin de la agencia y la obtenida por el industrial es significativa? Es decir, se debe nicamente al azar o es sustancial? Use a:7'7a;

b) Calcule la potencia del contraste, si p

35.

0.15.

En un programa periodstico de opinin se pidi que los televidentes Ilamaran al canal y respondan a la pregunta << ,cree usted que es necesario que se hagan reformas en el sistema educativo
del pas?>> De 812 llamadas recibidas, 790 se expresaron afi.rmativamente.

informacin para realizar Lura prueba de que ms del 95% de los ecnatorianos
adultos cree que se deben hacer reformas en el sistema educativo;

a) Use esta

b) trs el resultado de la prueba estadsticamente significativa al nivel 0.01?;


c)

Liste las hiptesis requeridas para que Ios resultados de Ia prueba sean vlidos en esta
situacin. En este caso, ,se satisfacen tales hiptesis?

Al igual que en el caso de observaciones realizadas sc\bre una misma poblacin, cuanclo

se dispone
de varias muestras provenientes de poblaciones distintas, se podra desear conocer si ellas compalten
irlgurra caracterstica o si son totalmente diferentes. En Io que siguc nos ocuparemos de las pmebas
de hiptesis que involucran dos mllestras.

8.7.

Pruebas de hiptesis para Ia diferencia entre dos medias

Igual a lo que se hizo en la seccin cledicada a las pruebas de hiptesis sobre la rnediir, se deben
considerar los casos en qne es posible aplicar el Teorema del Lmite Central y aquellos erl que no es
posible. Adicionalmente, se deber terrer en cuenta un tercer caso, cuando las muestr-irs provienen de
una misma unidad muestral, mediante mediciones repetidas.

8.7. Pruebas para Ia diferencia entre dos rnedias

8.7.1.

25t

Caso 1: Varianzas supuestas conocidas

Sr-rporrgarnos !1[te sc) clispone r[c clos poblaciorres, rlrri: liLs rrr)rnl-,r'rlcn]os conlo I -y 2, y se clescr 1rrt.r]rzrl si
la difcreucia entre lrs clos rnccUas polrl:rcionales es igual l nrra crnticlad 1); cs clecir, H1: 1 - lLt - Do,
o se clesei lrlobal el caso lrirlticular cLe ltr igualclic.l dc talcs rnedirs, o scA) H'. t1 - ,t,.r.

De la pobltrcin 1 se extrae irnt rnrtestta de tarnao rL y de la pobl:rcit 2 sc extrrc unl mlrestlr (le
tarlao n2. Si lrs colrcsporrdientes r,'arianzas poblaciontrles son corrociclas. las 1>nrebas de hiptcsis
son las signientes:

a) Prueba bilateral para la diferencia de dos rnedias.


Nula. Ho: (g - p,z) _n
- uu.
Hiptesis Alte'rnatiua. Ht (pt -P)lDo.

1.
2.

Htptests

3.

Estadstico de Prueb&. Zobs:

(t1I

:r2)

loi

,i/-t-

4.

Ds
't

''

o.1

n''

n2

Regin de Rechazo. zobs 1 -zryl2 o zobs > za/2.

b) Prueba unilateral para la diferencia de dos rnedias.

1.
2.

(h - F) : Do.
Alte'rnat'iua. Ht (pt - t ) > Do (o

Hipte.sis Nula. Ho:


Hptesis

bien I11: (pr

- p) <

Do).

p,"",.t,^ z.ts: (rt -z) - Do


2
F"r-,r"!in ,lo
de P'rueba.
3. Estadstico
l,
loi o;"

4.

U^--q

Regin de Rechazo. zobs> zo (oltierr

zo,"

-zat

cuarrdo

(t1

pz)

<

Do).

Ejernplo. Una inversionista tiene dos hoteles en la ciudad, uno en el norte y otro en el sur. El
sospecha que el conslrmo medio en el restaurante del norte es menor que en el del sur. Del primer'
-ocal se obtuvo una muestra de 30 facturas, r'esultando un consumo medio de 59 dlares. Del segunclo
-ocal se tom una muestra de 50 facturas, con Lln consunlo medio de 63 dlares. Las varianzas de los
: onsumos en los clos locales son conocidas e iguales a 60 y 80, respectivamente.
a) Para

un nivel de signiflcacin de 0.05, r'erifque si es cierta la sospech.a del duer-ro cle los hoteles;

b) Determine la signifrcacin de la pmeba.

Soluctn: Por el enunciado del problema:

: 59, o2I:60, nt : 30.


Local sur: 72 :63, o'i: 80, nz : 50.
Local norte: Tt

a) Es urra prueba unilatclal con D6

1.
2.

Hiqitesis

Nula. Hs;

14:

Q;

11,2.

Hiptesis Al,tt'tt;,o,ti,ua. H7: [t1 1 [t2.

Captulo

252

8.

Pruebas de HiPtesis

63)

nivel clc significacirt o

0.05, 1a regirlrr cle rechazo es z,',"

"?
-j+i
'tLI

Rechq,zo. Para el

- Do

(59

(r1 -22)

E,stad'st'ico de, Prueba.

-2.I1-.

"3
n2

4.

Ile.qi,n

5.

-7.645.
cl loca1 del nortc
Dccisi,,n. Corno zobsl (:aceu la rcgin cle rechazo; se concluye qlle cn

de

{
e1

conslrmo es menor.

b) Puesto qtLe zobs: -2.17,

entonces

o(-2.11) :0.0174;

es decir', el

p-valor

<:s

7'74o/c''

las
de las muestras es suficientemente grande (n > 25) y se desconocen
estimadot"s, sl y
varianzas, se puede utilizar estas pruebas, sustituyendo o! y o?rpot sus
"!'

observacin. si el tamao

8.7.2.Caso2:Varianzasd'esconocidas'Supuestasiguales
entre stls correspondientes mcdias
Se dispone de dos poblaciones y se desea probar si la diferencia
poblacionales es igual a D0; es decir' 'FIs: ut- Fz- Ds'
poblacionales son desconocidas'
Disponemos de dos muestras de tamaos nt y n2. Si las varianzas
pero supuestas iguaies; entonces, calcuiamos ei estimad.or ponclerado de o2 mediante

, (nr- r)r? - - ls|: it'


s-:qn2

n,.-2

cloncle

'i-,"1'-2'

7t

"
ntln'-2

t? V tZ son las varianzrs rnuestrales de las rnuestras 1 y

2.

Corr toclo esto, las pmebas dc hiptesis son las siguientes:

a) Prueba bilateral para la diferencia de dos rnedias'

1.
2.

Itiptesis Nula. Hot (ttt- Fz) : Da'


Hiptesis Alternati,ua. Ht (pt - tq)

3.

Estadstico de Pr"u,r:btt" tobs :

4.

lieqin, tJe Rechazo.

Lnb"

I Do'
(i.'-rt\-D
",1

^* - 2) ol'r,r) tu2(n1+rLz-2)'

{ -tolz(n. +.n2-

b) Prueba unilateral para la diferencia de dos r1ledias.

1. Hpteszs Nrila. H1: (P1- Fz) : Do'


2" Hiptests Alterrto'tzua- Htt (Pt - t't) > Do (o bicrr f/1: (pt - tt) a Do)'
(i. -Tt\ - Do
3. Estad'sti'co de Pr"ueba' tobs :
^lr-

"V

4.

Regi,n d.e Rechazo.


Hr (h - P) < Do)'

tt
tob, ) t,,(rr1 +

n2
n'2

- 2) (o bicn tot," { -to(U I

nz

2), cuando

8.7. Pruebas para Ia diferencia entre dos medias

253

Observacin. EI supuesto que realizamos de igualdad entre las varianzas

poblaciones--, debe ser


comprobado meclirnte la prueba cle hiptesis cor'r'espondiente, qr.re Ia explica cn la Seccin 8.8.

Ejemplo. Un irrversionista no sabe si invertir en bonos ernitidos por un pas A o por un pas B.
Para realizar Lrna decisin, seleccion dos muestras correspondientes a los rendimientos de los bonos
emitidos por los dos pases, obteniendo los siguientes resultados:

Pas A

Rendimiento (%)

t2.5 r2.B 13.0 13.5

12.3

Frecuencia
Pas B

Rendimiento

(7o)

Flecuencia

12.2 72.3 13.0

rn;

A un nivel de significacin del 0.01, verificar si el rendimiento de los bonos de los dos pases es el
mismo. (Asumir que los rendimientos siguen una distribucin normal y tienen igual varianza.)
Solucin:

Se tiene que
.1,

a-

12.80,
12.35,

s7:0.71, n" :
s?

0.07, nv :

(n,-l)s2,*(na-t)t?

EI estimador de la varianza es s2 :

70,
16.

9 x 0.11+ 15 x 0.07

L0+16-2

l2

nt*nu-2

EI contraste es bilateral:

1.

Hzptests Nttla. Ho:

2.

Hiptesis Alternatiua.

3.

Estadstico de Prueba. tob"

F":

Fa.

Ht p,l

lla.

@-v)

12.80

12.35

3.87.

0.2887

4.

Regin de Rechazo. Como to oos(24)

5.

Decis'in. Como to6" ce en la regin de rechazo) se puede asegurar que los bonos de los dos
pases tienen rendimientos diferentes.

2.797 ,

la regin crtica es o" > 2.797 o to6"

-2.797

Queda como ejercicio para el lector determinar en cules bonos se recomienda invertir.

8.7.3.

Caso 3: Varianzas desconocidas, supuestas distintas

y se desea probar si la diferencia entre sus corresponlientcs medias pobltr,cionales es igr,ral a r0; es decir, 11: h - lrz - Ds. Para ello. admitiremos que
.as poblaciones sorl normales, cuyas varianzas poblacionales sorr desconocidas y distintas.
Sr-rpongamos que se dispone de dos poblaciones

a) Prueba bilateral para la diferencia de dos medias.

1.

Hiptesis Nula. Ho, (tq

Fz)

Do.

Captulo

254
2.

H ip te si s A It ernat'iu a.

3.

Estadstico de Prueba.

4.

Regin de

se calcula pot g

, ,)

/","i\
'

,2

oto,,

) t.lz(g), donde cl nirmero de grados de libcrtad

n.r)

\tt

Pruebas de Hiptesis

1-trtzG)

tob,

RecLo,zo.

8.

Cuando g no es un nmero natural, se redondea al entero ms cercano.

b) Frueba unilateral para la diferencia de dos rnedias.


1.
2.

3.

: Do.
(h- t-r) > lo (o bien f11: (tt, - td a Do)"
12) - D0
Estad,stico d,e Pr.ueba. tobs : @r NuIa. Ho: (pt H'i,ptesi,s Alternatiua. Ht
Hiptesi,s

pz)

l'? ,

4.
Ejemplo.

t"(il

Regin de Rechazo. tob.,)

s]

Y^--

@ bien o6"

< -1.(g),

cuando

Hr (pt- t") < Da).

fro extremo sobre la realizacin de operacioncs manuales.


Fara ello se eligieron al azar 20 voluntarios, clivididos en dos grupos de 10. Al primer grupo se le
expuso a una temperatura de 4oC, rnientras que al otro se le mantuvo a temperatura ambiente. Se
contabiliz el nmero de veces que los voluntarios podan abrir y cerrar Ia mano en un lapso de 15
Se desea conocer el efecto del

segundos, con los siguientes resultados:

No expuestos al fro
Expuestos al f,ro

54
32

tr1

40

29

3B

45
33

48

46

45

(o

49

50

34

tt
r)rJ

36

29

o.)
Lt)

Probar Ia hiptesis que el estar expuesto al fro reduce la capacidad de abrir y cerrar la mano en ms
de 12 veces.

Do: \2 y
rr : 48.0, s? : 16.89, n,t:70,
rz :32.4, s3: 19.16, nz:10.

Soluc'in: Este es un contraste unilateral donde

1.
2.

Hiptests Alternat'iua. Ht: ttt

3.

Estadstico dc Prueba. tobs :

(rt

I{i,ptesis NuLa. H0: [t1

Fz

12.

Fz>

12.

- "z) -

Ds

(48

32.4)

12

16.89 19.16

10 '

4.

1.8961.

10

-I_
es

Reqin de Rechazo. El nmero de grados de libertad

/ L6.Bg

9:

19.16

(ro**)

17,9 v 18.

8.7.
Etrtonces, 0.0b(18)

5.

Pruebas para Ia diferencia entre dos rnedias

:1.734 y la regin crtica

es r"

255

> I.734.

Dec'isi'n. Como Lo6" C'd.e en ia regin de rechzo del contraste se ruede admitir que el fro reduce
la capacidad dc realizar operaciones manuales.

8.7.4.

Caso 4: IJna varianrza conocida

y otra varianza desconocida


y

la diferencia entre sus medias


poblacionales es igual a Ds; es decir, f16: L\ - p,z - Ds. Admitiremos que las pobiaciones son
normales y, sin prdida de generalidad, supondremos que la varianza ol es conocida y que la varianza
Supongamos que se dispone de dos poblaciones

o!

se desea probar si

es desconocida.

a) Prueba bilateral para la diferencia de dos medias.

- t z) : Do.
H'iptesis Alternat'iua. Hr (fq - LL) I Do.
(lt - - no
3. Estad,sti,co d,e Prueba. tob, :
1.
2.

Hipteszs

Nula. Ho: (h

l"? , sl

4.

U^--

Regin de Rechazo. tob"

1-t^tzj) oto6") t,/z(g),

donde el nmero de grados de libertad

nz-l
Cuando g no es un nmero natural, se redondea al entero ms cercano.

b) Prueba unilateral para la diferencia de dos rnedias.

- Fz) : Do.
Hi,ptesis Alternat'iaa. Ht (h- p) > Do (o bien f11: (t"r3. Estad,sti,co d,e Prueba. Lot s :
1.
2.

4.

8.7.5.

Hi.ptesis

Nula. Ho, (l"t

Regin de Rech,azo. tob"

l;*;

,(g) (o bien

o,"

ttz)

a Do).

< -t"(g),cuando Hr (h - p) <

Do).

Caso 5: Diferencia por parejas

Las pruebas para las diferericias de las medias, realizadas anteriormente, se aplican cuando las dos
muestras son independientes, pero existen casos en los que Ia informacin recogida no es independiente
(como cuando se Ia toma de un mismo individuo de manera repetida)
.

Sea (r1,y1), (rz,Az),..., (rn,an) una muestra aleatoria de pares de observaciones; donde (r,y)
representa dos mediciones tomadas de la misma unidad muestral, antes y despus de un tratamiento
o fenmeno que Ia afect. Se desea conocer si Ia poblacin cambi de manera apreciable despus
del fenmeno indicado; para ello se emplea la prueba de diferencias por parejas de la manera que a
continuacin se describe.

Captulo

256

8.

Pruebas de Hiptesis

muestra aleatoria de las diferencias dt, d2, .. ., dn, donde d: r-Ai (i :1,2,. .. ,n),
que las supondremos siguen una ley normal de media p,,1 y varianza o2(1. Para estos parmetros
poblacionales se calculan sus estimadores:
Se construye una

lft1lL

,I: ! r, y

s7.:

i.:1

- )r.
-- . r(n
i.:1

Prueba bilateral para la diferencia por parejas.


NuIa. Ho: Fa - Ds.

1.

Hiptesis

2.

Hiptesis Alternatiua.

3.

Estad.stico

4.

Regin de Rechazo. tob"

d,e

HI F* Do.

Pru,eba. Lob, :

!-,D:
sd/

\/n

I -to/z(n -

1) o tob"

t-2(n

L).

Observacin. Tambin, se pueden realizar los contrastes unilaterales considerando las hiptesis alternativas F 1 Do o F ) Dg; para cada caso se escoger, de Ia manera antes indicada, la correspondiente
regin de rechazo. Se recomienda que el lector formule tales pruebas.

Ejemplo. En una investigacin clnica

se realizaron mediciones de la frecuencia cardiaca a 9 individespus de que ellos se hubieran sometido a un programa de entrenamiento fsico. Los

duos antes y
resultados son los siguientes:

Antes

(r)

Despus

(g)

81

85

82

82

90

83

It)

93

92

76

77

87

79

90

89

t6

75

89

Para un nivel de significacin de 0.05, establecer si el acondicionamiento fsico vari de manera significativa la frecuencia cardiaca, suponiendo una distribucin normal de las diferencias.

Solucin: El promedio y Ia desviacin estndar de las diferencias son:

A:2: :3.22,
r_l

Ademis, Do

sa,:8.2r.

0 y la prueba bilateral queda como sigue:

Hiptesis Nula. Hs: p,:

2.

Hiptesi,s

Estad.sttco de PnL,eba.

4.

Regin

5.

Deci,sin. Como to6" r1o est en la regin crtica, no se rechaza Hg; es decir, no hay por qu
considerar que hubo una variacin apreciable en la frecuencia cardiaca.

Alternatiua.

Q.

p,10.

: ^!=',2 :1.177.
-4-=
sdl{n 8.2I1\/9
=
=
d,e Rechazo. Como o.ozs(B) : 2.306, entonces Ia regin es o," > 2.306 o tor" 1-2.306.
tobs:

8.8.

8.8.

Pruebas de hiptesis para la razn entre dos varianzas

257

Pruebas de hiptesis para Ia razn entre dos varianzas

Supongamos cllre se desea probar la igualclad de las varianzas dc dos poblaciones normalmente distlibuidas, de las que se han extrado dos muestras independientes; es decir, se desea probar Hg: ol : 6/.

Las pruebas de hiptesis son las siguientes:

a) Prueba bilateral para la razn entre dos varianzas.

1.
2.
3.

Hiptesi,s NuIo,. Hs:

4.

Regin de Recltazo. Fob"

ol:

Hlptesi,s Alternatiua.

6f.

H ol I of.
o2

Estadstico de Prueba. Fobs:

l,si

donde sf es Ia mayor varianza muestral.

Fo2(n1- I,n2

L).

b) Prueba unilateral para la razn entre dos varianzas.

1.
2.

Hiptesis Nula. Hs: ol: 61.


Hiptesis Alternatiua. H ol >

o?r.

a?

3.

Estadstico de Prueba.

4.

Regi,n de Rechazo. Fobs

Fobs

: ],
si

donde sf es la mayor varianza muestral.

) Fu(rt - l,n2 - I)

Ejemplo (Continuacin). IJn inversionista no sabe si invertir en bonos emitidos por un pas A o
por un pas B. Para realizar una decisin, seleccion dos mLrestras, correspondientes a los rendimientos
de los bonos emitidos por ios dos pases, obtenierrdo nnas varianzas rnuestrales iguales a

y s:0.07.

sl:9.11

A un nivel de significacirr del 0.05, verificar si las varianzas poblacionales cle los
lendimientos de los bonos de los dos pases son iguales.
Solucin: La prueba es bilaterai:

1.
2.

Hiptesis Altentatzua.

3.

Estad,stico

4.

Regi,n de Reclazc. Segn el nivel de

Hi,ptesis

5.

Nula. Hs:

d,e

o'2,

Prueba.

nz- 1:16 - 1-

62.

H ol I ol.
Fobs:g :
S

: I.57I.

significacil 0.05, y los grados dc libertad TLy-I : 10- 1 :


15, cl punto crtico es F625(9, 15) :3.12 y define Ia regin For")3.I2.

Deciszn. Prtesto que 1.571 < 3.12, no se debe rcchazar la hiptesis de la igualdad cle las
variarrzas. Entonces, fite correcto rsumir que las varianzas elan igrrales, cuando realizamos la
prueba sobre la igualdad de las me<lias.

3.9. . Pruebas de hiptesis para la diferencia entre dos proporciones


:--ipongamos qnc se han scleccionado dos muestras, de rnanera aleatolia e irrdependiente, de dos pobla.-rnes binorniales, cr.tyos tantarios, llr y'r2 sorr sufi.cierrtemente altos palir que las distribuciones rnucs-:ales de Ft y fz sealt aproxirnadanrente norrnales. Se desea probal si Ir difclencia de las proporciones
:'nestrales es igual a un valor D6. Se deben tomar en cuenta dos casos: cr-rndo Do : 0 (igualdad de

-is proporciones) y cuando Do 10.

258

Captulo

8.9.1. Prueba para pr -

pz cuando Do

8.

Pruebas de lliptesis

Etr pt'irner l.ga'se estirnan las proporciones p1 y p2,'a,partir


de ras rn.estras, por p1 v f2, re:spectir,,amente, luego sc calcula el estimad,or ponde,ado de ta proporctn
p por

:: --nt/t

l):

-f nzfz

n1tn2

Prueba bilateral para la diferencia entre dos proporciones.

1.

Hiptesis NuIa. Hot (pt

2.

Hiptesis Alternatiua.

3.

Estadstico de Pr-ueba.

- pz) :0, es clecir Ho, pt: p2: p.


Ht (pt - p 10.
zo6"

pL-p2

.;)
io(!
\nr
4.

Reqin de Rechazo.

Zobs

-zo/z o 2o6" }

zo2.

Observacin' Tarnbin, se pueden realizar las pruebas unilaterales para probar


que 'Fl1: pr <p2, camlliando las regiones de rechazo segn
cacla caso partic.,lar.

que 11r:

pt ) pz o

Ejemplo' El

dueo de un supermercaclo cree que el porcentaje de cheques


pr.otestados, con que
los clientes han pagado stts cueutas, ha aumentad.o con respecto
ar ao anterior. En una rn'estra
corlesporrdiente al primer trimestre del ao pasado, encontr
b cheques protestados de B0 cheques
admitidos; con otra muestra cle 68 cheques, correspondientes
al primer trimestre del presente ao, el
ntmero dc cheques prote'stados fue de 6. Con estos c-latos,
hay evidencia suficiente que indique urr
rnclemento en el porcenta.je de cheques protestados?
SoLuci'r: Sean p1 y p2 las proporciones de cheqlres protestados
en el pr.imer

y del presente. Estimemos las proporciones muestrales:


5
Pt:go :

Fz:

0.0625,

5+6
0: 80+68

6
6B

trimestre del ao anter.ior

0.0882,

:0.0743.

Ya que se desea determinar si existe un aumento en Ia proporcin,


la hiptesis alternativa es
) 0, y la prueba es la siguiente:

pr

l.

Hiptesis Nula. Hs:'p1

2.

Hiptesr,s Al,tern,at,iua.

- pr.
Ht p1 1p2.

3.

Estadstico de Pr-ueba.

Zobs

Pt-Pz

0.0625

a(! +1)

0 '\rrt

71..> J

(00743)(0

0.0882

s25T\(!*a\
'\80 C'8)

p2

-0.594.

4.

Regi,n de Recltazo. Tomemos

5'

Decisin' Como -0'594 >


-1.645' no se puede rechazar la hiptesis nula; o sea) no hay evidencia
que indique un aumento en el t'mero cle cheques protestacios,
con respecto al ao

0.0b; erltonces, ia regin es zobs < _1.64b.

anterior..

U
8.9. Pruebas para la diferencia entre dos proporciones

8.9.2. Prueba para pr - pz cuando

Do

259

l0

En el caso en qlle se desec probar que las dos ploporciorres sorr distintas y qlre su cliferencia es igual
un valor dado, D6, se tiene la siguiente prueba:

Prueba bilateral para la diferencia entre dos proporciones.

- pz) : Do.
Ht (pt - pz) I

1.

Hiptesrs

Nula. Hot (pt

Hi,ptesis

Alternatiua.

3.

Estadsti,co de Prueba.

4.

Regi,n de Rechazo. Zobs

Do.

: (Fr-Fz)-Do

zobs

1 -zolz o zobs > zol2.

Observacin. Tambin, se pueden realizar las pruebas unilaterales para probar que I11 : (pt-pz) > Do
f11 : (pt - pz) < Do, cambiando las regiones de rechazo segn cada caso particular.

o qtre

Ejemplo. En el deporte

del balonmano) en un partido est permitido sustituir al portero solo


para que detenega los tiros penalties. El entrenador de un equipo, al definir su estrategia para un
partido, examina las estadsticas individuales de los porteros titular y suplente. En una muestra de
los registros cle los entrenamientos del ltimo mes, el titular ha detenido 128 de 510 penalties y el
suplente ha detenido 183 cle 480 tiros. El cntrenador decidir sustituir al portero titular, el momento
de parar un penalti, si el suplente ha detenido al menos un 10 Va :ms de tiros que el titular. A un
nivel de significacin del 5 7o, qr decisin tomar el entrenador?
Solu,cin: Calculemos las proporciones correspondientes a cada uno de los porteros:
'Pl

Se realizar

128

=-:=:0.21,
510

la prueba unilateral con D6

Hiptesis Nula. Ho, pz

pr

Hiptesis Alternat'iua. Ht: pz

T)t:-

183
480

:0.381.

0.1.

0.1.

pr >

0.1.

(fz-fr)-D,,

(0.381

-0.251) -0.1
:1.023.
0.749 0.381 x 0.619

3.

Estadstico de Pruteba.

1.

Regi,n de Recha,zo.

5.

Decisir. Conio zobs:1.023, no cae en 1a legin de lechazo, no hay razn para pensa. que la
diferencia es mayor qr-re 0.1; entonces, e1 cntrcnador no debela decidirse a sustituir al portero

Zctbs

0.25I x

AI nivel de significacin 0 05, la regin de rechazo

es zobs

>

1.645.

titular.

in el Cuadro 8.2 se presenta

Lrn resumen de las pruebas de

hiptesis con dos muestras.

Captttlo

260

Hip<itcsis
nrLla (/^I)

Polrlar:in
ccl
r'Lr itr zas igLrales

lrr thz:
t,r- t,,, l

Normal

lrt

C cer'l.l

l1t

8.

anzas desconocidas
srrpuestas iguales

Do
Dct

ltz ) Dt

[L'

Normal
observaciones

empareiadas
Noma1

r'r- Prf

Do

Irt Fz {

Do

t, -

t,2

ut-t-LtlDo
t1,,,-Fz)Do

2
2
2
2

clc pnielra

cle

rec:h ir.zo

.- -/2

t,.,-t,rfDct
t., - r,r) Do
lrt tt, I Do

11't

o I :o
o 21 1o
o 1 )o

Rcgin

Estaclstic<r

(,lr/r )

Ft

Fz: Do
-Fz{Do
LIt - Fz) Do
Fn: F,o,,
llo I Ho,,
ILn ) Fo,,

Norrnal
varianzas desconocidas
supuestas clistintas

iptr:s is

FI

altcnratir.a

: Do
trtt -ttIDo
llt - F') Do

vrri

Pruebas de Hiptesis

z<
(t:r -rz) -

Do

"ffi!n"

n7+fr2 2 sl
\it-rz)-Do

2,,

Itl > t.i't

t)
t<

t.,,

Itl > t,,z

tlto

r.r-t"{D6
H

)
lto {
l-Lo

trtn,,

D-u^

11n,,

sdlJn

"?

<

ur:nr-I,u2-n2-I

"',

^^/ r 1
pql-+\nr n2
uit I niz
u*nz

Binomial

P7:P2
PtlPz
PtlPz

pt I p'z
Pr>P2
Pt 1Pz

Binomial
(Do + o)

Pt-Pz:Do
Pr PzlDo
Pr-Pz:- Ds

Pt-PzlDo
Pt-Pz>.

F:5st

Do

Pt-Pz{Do

t.t"

t>tt<-t^

n-1g1,

11o,,

olo
2,
01)02

Itl >

F,/z

F>T-.

F I Ft-o
t,\- 2 o/2
l
Z}Za

2 .^/2

Prqr

'P2q2

Cuadro 8.2: Pmelras cle hiptesis con dos muestras

8.10. Ejercicios
Pruebas sobre la diferencia de dos medias (varianzas conocidas)

1.

Dos mquinas envasan cereal en ca.ias. De la prirnera rnquina se obtu\o una muestra dc 30
cajas) resrlltando un peso promedio de 130 g y de la segunda mquina se tom Lrna muestla
de 50 cajas) con un peso promedio cle 125 g. Las varianzrs de los pcsos envasados por las dos
rlqlrinas son conoci(las e igr-raIes a 60 y 80, respectivamentc. Para un nivel clc significacirr rle
0.C5, velifiqlle si laij clos mquinas er]\asan iguales canticlirlcs de ccreal.

En

del Minist,erio de SrhLcl se rnicli el conterriclo clc nicotirra c-le clcs rnarcrs
corr 50 cigarrilkrs de la priruer' nralcr se elrr:ontrci que tielre
un corrtenido promeclio de 2.47 nlg corr clesviacin estrrclar de 0.12 rng; mierf,ras quc p1ra 40
cigarrillos de lzr segurrda mrrca el crorrterriclo 1)rorncdio fuc <le 2.39 mg colr clesvii.rcin estinclar rle
0.14 mg. Prr.rcbe la hiptesis rlula //,1 - I,L2 - 0.12 contr1 la tltettatiya /r - l, 10.12, tisarlo
de

cv

unr iuv<:s1,igacirr

cigallillo. Err un experinlento

0.05.

En unt ciuclarl operan 2 elrpresas dc

telerfonr

cclular: Flirius

y Qualli. Por los registros

ltrs

c[]plesrs sal)cn que cl gasto inenslr11 de slrs borrrdos ticrren clcsrriaciorrcs cstilrclar'<lc 6.5 y 5
cllares, iespectivamerlte. Parrr conrpalal ol gasto nreclio dc los c:lientes cle las <los enrplesas, se
tom una rnuestra) aI azar, de 34 clierrtes dc Sirius y otra ullrestrr de 41 clientes de Quark. Los
corresl)ondientes conslrmos mensuales fueron 35 v 38.5 dlares.

26r

8.70. Ejercicios
a) Proporcionan

estos datos evidencia estadstica, al nivel 0.04, a favor de la hiptesis de que


el gasto de los clientes de Sirir-rs es menor que es gasto dc los clicntes de Quark?;

b) Halle
4

el

p-valor

de la prueba.

Los ingresos del primer ernpleo de los ingenieros informticos, egresados de cualquier universidad,
siguen una distribucil normal con desviacin estndar de 3800 dlares. Se tom una muestra

aleatoria de 15 ingenieros procedentes de la Universidad Nacional, resu.ltando que en su plimer


empleo los ingresos medios anuales fueron de 12000 dlares. Otra muestra independiente de
12 ingenieros de Ia Universidad Tcnica dio como resultado unos ingresos medios en el primcr
empleo de 13 200 dlares. Se pide, con un nivel de significacin dei 2'/o, probar Ia hiptesis dc
que las medias son iguales frente a la alternativa de que la media de la Universidad Nacional es
menor que Ia de la Universidad Tcnica.
5.

Una cooperativa agrcola produce cierto atroz con fertilizante natural y con abono qumico. En
las parcelas donde se emplea fertilizante natural se obtienen plantas cuya altura tiene varianza
de 47 cm2. En los terrenos donde se usa abono qumico la altura de las plantas tiene un varianza
igual a 39cm2. Para comprobar las medias se toma aleatoriamente una muestra de 65 plantas,
31 correspondientes al primer tipo de tierras y 34 al segundo; obtenindose en las muestras 92
cm y 86 cm de alturas medias, respectivamente. Para un nivel de significacin del 6 %, contraste
Ia hiptesis de que los fertilizantes son igualmente eficaces, frente a Ia hiptesis alternativa de
que es ms eficaz el natural.
Se quiere comparar el rendimiento acadmico en matemtica de los alumnos de ltimo ao de
dos colegios; A y B. Elegidas dos muestras aleatorias de cada una de estos colegios (30 alumnos
de A y 36 de B), se obtuvieron los siguientes resultados en cuanto a la calificacin obtenida en

dicha asignatura:

Colegio A
Colegio B

Prornedio

Varianza

138
t4.3

1.1

16

Basndose en estos resultados, verifique la hiptesis de igualdad de rendimientos acadmicos de

ambos colegios, con un nivel de significacin del 3 %.

En un proceso qumico para producir oxgeno (O2) se emplea un catalizador. Durante treinta
das se midi Ia cantidad promedio de oxgeno producido luego de haber colocado el catalizador
y cuatro horas despus, resultando que, en el primer caso se producan 1000 litros de 02 en una
hora, con una desviacin estndar de 90 litros y en el segundo caso se producan 880 litros de Oz
con una desviacin estndar de 140 litros. Existe evidencia que indique que el catalizador se
degrada, produciendo una merma de al menos 100 litros de 02, cuando han transcurrido cuatro
horas?
Se efectu un anlisis sobre la duracin de las mquinas computadoras que se utilizan en las
empresas prblicas. Se eligieron dos muestras de computadoras, de marca y de clones, cada una

constituida por 80 mquinas. Para las de marca, result una vida promedio de 4.8 aos y una
desviacin estndar de 1.7 aos. Para las clones, dio una vida promedio de 3.3 aos y desviacin
estndar de 1.2 airos. Puede considerarse que la vida media de las computadoras de marca es
superior en al menos un ao a las que son clones?
La FIFA realiz un cambio en la forma de puntuacin en los partidos de ftbol ganados: se otorg
tres puntos al equipo ganador, en lugar de los dos puntos usuales. Para examinar la efectividad
de la nueva norma) se examin los resultados de los partidos jugados en 1995 y 1996 (ao en
el que entr en vigencia la nueva norma) . En 45 partidos examinados, jugados el ao 1995, se
encontr un promedio de 2.87 goles por partido y una desviacin estndar de 0.21; en los 38
partidos examinados de 1996, se hall que se haban ploducido un promedio de 3.05 goles con

Captula E. .Fruebas de {iptesis


dcsviacirjn estridal cle 0.18. Fuede decirse

c-re irr rrlreva

rrolrrra pelrniti<i unlr:n1,ar t:l prornoclic-r

cl: goles por partido'/


10

Una persona desea comprar un automr'il nr-revo y toma conro factor de decisin el consumo meclio
de cornbustible que tienen dos nlodelos de calactersticas similarcs, uno fabricraclo en Europa v
otro en Corea. Consulta una rerrista especiahzada y encuentra qr.rc e1 auto eulopeo tiene nn
recorrido prornedio de 28.3 krn por gain de cornbustible. con nna desriacin estndar de 6.2
km; para el auto coreano encucntra qr-re el rccorrido es dc 26.7 krn por ga1ll una desviacicirr
"v
estndar de 5.1 km; adems, la revista indica que los datos estadsticos fuerorr tomados a partir
de las mediciones realizadas en 50 autos de cada oligen. Cutr de los dos aritos cieber'i cornl-iral?
o deber tornar en consideracin otras calactersticas, distintas clel renclirniento del combustible.
para tomar su decisin'/

Fruebas sobre la diferencia de dos rnedias (varianzas desconocidas)


11.

Se realizaron pruebas para conocer la cantidad de plomo en la sangre de personas expucstas a


la contaminacin en ia ciudad. Se tomaron muestras aleatorias de 24 nios y 18 adultos que

dieron los siguientes resultados (en ppm):

Adultos

rt :
sr :

Nios

rz:0.028,

0.043,
0.018,

sz

0.007.

Asumiendo que las varianzas poblacionales son iguales, pruebe la hiptesis de que no hay diferencia entre el contenido medio de plomo en la sangre de los nios y de Ios adultos, contra ia
hiptesis de que los adultos tienen mayor cantidad que los nios.

12. En un estudio

sobre un nuevo programa piloto para el aprendizaje a distancia mediante computadora, se eligieron al azar,21 estudiantes de una clase para seguir el nuevo prograna (grupo
piloto) mientras que los 23 restantes seguan el mtodo tradicional (grupo control). Finalizado
el curso, se realiz un examen obtenindose los siguientes resultados:

Grupo
Nota promedio
Desv. estndar

piloto

Grupo control

51.48

47.52
14.15

11.01

Suponiendo igualdad de varianzas, contraste si hay evidencia (a nivel del 5 %) de que el nuevo
mtodo piloto da mejores resultados que el mtodo tradicional.

13. En el Departamento de Gentica

de una universidad se realiz un estudio donde se cont el


nmero de surcos en las huellas dactilares de dos grupos de voluntarios: uno de aborgenes
amaznicos y otro de estudiantes mestizos de Ia universidad. Los promedios y la desviacin
estndar del total de surcos contados se dan a continuacin:

: 17, r :
:
mestizos: ny L7, A :
aborgenes:

TL"

125.9, s2, :
754.3, sl :

(SO.ZO)2,

QS.OI)2

Pruebe la hiptesis de que no existe diferencia entre el total de surcos) contra una triptesis
adecuada a los datos, asumiendo igualdad en las varianzas.

74.

A y B para la eliminacin de los hongos en la piel. En pruebas de


laboratorio se tomaron muestras de Ia cantidad de medicamento requerido para la eliminacin
de un mismo tipo de hongo, obteniendo los siguientes resultados:
Se probaron 2 medicamentos

Medicamento
Tamao
Promedio (g)
Desv. estndar (g)

Medicamento B

13

15

4.5

3.1

1.8

I.7

8.70. Ejercicios

263

tr) Pruebe Ia hiptesis de que los dos medicarnentos tienen igual efecto, contla la hiptesis
que el mec.licamento B es rns efectivo. Qu conclusin saca?;
b) Encuentre el nivel de significacin arroximado de la prueba.
15

de

Dos empresas competidoras (S y T) que venden implementos deportivos han puesto en marcha)
casi simultrreamente, pginas de internet para la venta electrnica. Se eligieron, al azar) ocho
clientes que visitaron la pgina S y, de manera independiente, otros ocho que visitaron la T y sc
midi el tiempo (en minutos) de la duracin de ia visita de cada cliente. Los resnitados fueron
los siguientes:
.)
Pg naS oa c).tr tJ 42 3.2 44 21 16 d"t)

Pe

naT

1t
IJ

z-,1

44

2B

ri.5

/t

3.6

Proporcionan estos datos suficiente evidencia (al nivel 0.05) para afirmar que los tiempos medios
de duracin de las visitas en ambas pginas son diferentes?
16.

Para los tres primeros meses del ao, 15 vendedores de la Costa tuvieron ventas semanales
promedio de 300 dlares con una desviacin estndar de 50 dlares; en tanto, 10 vendedores de
ia Sierra tuvieron ventas semanales promedio de 260 dlares, con una desviacin estndar de 16
dlares. Si consideramos que las desviaciones estndar de las ventas son diferentes, determine
si los vendedores de la Costa tienen mayores ventas semanales.

t7.

compararon los tiempos (en segundos) que realizan atletas escolares, masculinos y femeninos,
al recorrer una distancia de 500 metros. Para el efecto, se registraron las marcas de 9 nios y 7
nias, obteniendo lo siguiente:
Se

Nios
Nias

187

223

248

366

235
223

r92

259

775

206

326

274

369

301

t94

247

Determine si la diferencia en el tiempo medio entre hombres y mujeres es mayor que un minuto.
Use rr : I0'7a.
18.

dixido de carbono es mayor en la capa de aire ms


prxima a la superficie. Para contrastar esta hiptesis se analiz el aire en 20 puntos elegidos
aleatoriamente a un metro de altura del suelo, resultando una media muestral de 580 p.p.m.v.
(partes por milln en volumen) y una desviacin estndar de 60. Tambin, se realizaron 16
mediciones de la concentracin, a una altura de 18 metros, resultando una concentracin de 365
p.p.m.v. y una desviacin estndar de 110. Suponiendo norrnalidad para las mediciones y que
Ias varianzas son diferentes, proporcionan estos datos sufi,ciente evidencia, al nivel 0.01, a favor
de la hiptesis de que la concentracin es mayor cerca del suelo?
Se sospecha que Ia concentracin media de

Pruebas sobre Ia diferencia por parejas


19

Se hizo un estudio para comparar los tiempos de acceso, en diferentes momentos del da, a
internet desde computadoras domsticas con mdem. Para ello, se cargaron 8 pginas web por
la tarde en el periodo de 14 a 15 h. y, con Ia misma mquina, Ias mismas 8 pginas por Ia noche
en el periodo de 22 a 23 h. Los respectivos tiempos de acceso en minutos fueron:

De14a15h
De22a23h
Se puede

20.

2.3

1.5

1.0

2.7

T4

1.9

0.8

1.1

2.9

r.4

t.2

3.4

1.3

2.5

1.6

1.8

concluir, al nivel 0.01, que el acceso es ms lento en el horario nocturno?

Para poner a prueba un nuevo mtodo de estudio, se seleccion a 10 sujetos que fueron sometidos
a una prueba antes y despus de entrenarse con el nuevo mtodo. Las calificaciones fueron:

Antes

19

T4

23

25

18

24

17

19

20

11

Despus

20

15

26

24

t7

26

18

22

26

11

Captulo

264

8.

Pruebas de Hiptesis

A un nivel clc significacin dei 5'%, ,se prrecle decir

2L

<re el nrtevo mtodo es efcctivo'?

Urr glnpo dc invcstigaclores afirma haber dcscrrbiclto un ti1.ro clc alirncnt,acin pzua las gallinas,
ba.jo la cual stas prodricen hnervos que rlo aumcnl,rrr cl c;olcsterol en Li,s personas que los q)nslrrten. Parzr cornprobal dicha teora, sc seleccionaron al azar 36 personas a las <,rte se les rnicli
su nivel de colesterol habitual (z ) . Desprrs sometcr' r estas rnismas pcrsolas a ulla dieta r base
de los huevos en estudio, se micli cn ellas cle nu.cvo dicho nivcl (y). Los resultaclos fiterort:

l Ji
-., :
I =2a3. s -200, ;t1\ 4) . (d,-d)r.-

ls6

Suponiendo normalidad en la variable, contraste la hiptesis de que los huevos modifican el


colesterol, a un nivel de significacin del 1%

22.

la carga elctrica en Ltn circuito. En


un laboratorio se midieron B circuitos, mediante los dos mtodos, obteniendo los siguientes
Se quiere comparar dos mtodos rpidos para estimar
resr-rltados:

Circuito
Mtodo A
Mtodo B

10.7

t7.2
TI.4

i5.3

14.9

13.9

15.0

15.6

L5.7

15.0

l-r. 1

t4.3

15.4

r5.4

16.0

11.1

Contraste si los dos mtodos proporcionan, en media, las mismas estimaciones.


En el artculo <p-trndorphin: A Factor in'Fun Ruu'Collapse>> (British Medical Journal (1987),
294, 1002), se reportan las siguicutes mediciones de Ia concentracin en la sangre <le p-enclorfina,
err picornoles por litro, realizadas a 11 corredores antes y clcspus de haber participado en una
media maratn:

OD

Corredor
Antes de
la carrera
Despus de
la carrera

r)
J

,4D
+rJ

46

29.6

25.r

10

11

tro
L

n6

72

B4

90

r0.4

14.0

17.8

15.5

29.6

24.1

37.8

20.2

2r.9

14.2

34.6

46.2

r_)

Si se sospccha que luego de realizar un esfuerzo prolongaclo, la concentr.acin de la horrlona se


eleva en 25 picomoles. Veriflque) a Lrn nivel de significacin del 5 %, si se curnpie ia hiptcsis.

Pruebas sobre la razn de dos varianzas

24.

Sc selecciorLar"on dos muestras rleitoi'ias 1r-ovenieritcs cle poblaciones normales:

Poblacin Tamao de la mucstra Varianza muestral


X
16
56.7
Y
20
30.5

- a) Ha, suficiente evic,lcncia l)r.ra pertri)r q,re al. :


lr) Encucntre el rtivcl dc siguificacin dc la plr,rebtr,
25.

o?.?,

-r

q nirrcl cle significacirr

cle 0 05;

c inter'lrrete el lcsultaclo.

Unr fbrica cle refrcsctos tiene clos mquirrirs enrbotcllrclorrs qrre eDvasan el lqr-rid<; err las botcllas.
Los expencledores hrtt irrfor-nirdo rl fabticrrrte quc lrr.s botellrs ltrcsentirl clemasirclr yali-Lltiliclad
eu la cantidacl de lquido que cortlienert. llala exanrinar la que.ja se nidiri la var.irza clel vrlmeir
clc 1quido crnbotellado ltol cacla ttna de las maic.rirras, resrrltanclo qrre con rrnr rqcstra c1e 18

botellas cle la mquirta 1, se obtrtvo una varianza clc 700 y ciou una mucstla de 15 botellas clc lr
rrtquirra 2, se obtuvo ttna valinza de 210. L1 vuial)ilidad err los volirmenes crrvasaclos
ser atribuida a una o a las dos r,rquinas? Utilice a : 0.05.
'r-rcclc

8.70. Ejercicios

26.

265

Dos estaciones rneteorolgicas predicen Ia temperatura a medio da en la ciudad con seis horas de
anticipacin. Se tornaron dos muestras independientes de los datos de cacla estacin, resultando:

Estacin
Estacin

1 n1 : $, rt :21.2,
2 n2:19, Tz:19.2,

sl : 1.68,
sl :0.81.

a) Verifique si las varianzas de las temperaturas pronosticadas son

distintas. (Tome

c:0.1);

b) Empleando el resultado anterior, pruebe si las dos estaciones pronostican iguales temperaturas, a un nivel de significacin de 0.1.

27. Se van a probar

dos medicamentos A y B contra una enfermedad. Para sto se trataron 21


ratones enfermos con A y otros 21 con B. EI nmero medio de horas que sobreviven con A es
1200 y el nmero medio con B es L225. Suponiendo normalidad en ambos casos:

a)

Se puede aceptar igualdad de varianzas si se sabe que D@o

3500?

b)

(Tomeo:0.05);

- ,)" :9800

y D(An - y)'

Es ms efectivo el medicamento B? Plantee el contraste adecuado para estudiar esto con


un nivel de significacin del 5 %.

18. Una compaa

petrolera est considerando Ia posibilidad de introducir un aditivo en su gasolina,


esperando incrementar el kilometraje medio por litro. Los ingenieros del gupo de investigacin
probaron 10 autos con la gasolina habitual y otros 10 autos con la gasolina con el aditivo. trl
resumen de los resultados es:

Kilometraje sin aditivo:


Kilornetraje con aditivo:
a) Es razonable suponer que las varianzas son

tr: 14.2, s" :3.24,

a: 15.4, ss :

iguales? Use a

5.56.
0.1;

b) La introduccin del aditivo incrementa el kilometraje medio por litro?

Pruebas sobre la diferencia de dos proporciones


En una investigacin en Guayaqull,264 de 1140 mujeres y 274 de 1200 hombres respondieron
que ellos no ingieren alcohol. Realice la prueba de hiptesis apropiada para asegurar si los datos
muestrales proveen evidencia para afirmar que las mujeres guayaquileas se abstienen de tomar
alcohol en una proporcin mayor que los hombres guayaquileos. En Ia resolucin:
a) Especifique las hiptesis nula

y alternativa, a la vez

err smbolos

y en palabras;

b) Calcule el estadstico de prueba;


c) Compare con el valor de 1a tabla

ll.

y saque su conclusin.

IJn economista del Instituto Nacional de Censos desea conocer si las tasas de desocupacin
urbanas son iguales en las dos principales ciudades del pas. Con base en sendas muestras de
500 personas en cada ttna de las ciudades, el economista encontr 46 personas desocupadas en
una ciudad y 35 en la otra. A un nivel de significacin del 3 %, puede snponerse que las tasas
de desempleo en las dos ciudades son diferentes?

,1.

De una muestra de 300 televidentes escogidos al azar, que tenan sus televisores encendidos en la
hora del noticiero, 50 indicaron que tenan sintonizado el canal 4y 70 que sintonizatotr el canal
8.

a)

Puede afirmarse que los dos canales tienen igual nivel de sintona a Ia hora del noticiero?

(Utilice un

a:2To);

Captulo

266

b) Halle el nivcl de significacin


.Jo

.).)

8.

Pruebas de Hiptesis

de la prueba.

Dos ernpresas encrrestadoras realizan investigaciones para determinar el porcenta.je dc pcrsonas


que votarn a favor de una pregunta en Lrn plebiscito. La primera cnrplesa etrtrevist a 1000
pelsonas de las cuales 367 contestaron afirrnativamente. La segunda empresa entrevist a 300
personas y obtuvo 121 r'espuestas afirmativas.

a)

Puede considerarse que las dos empresas entregan resultados similares respecto del nrmero
de electores que votarn SI a la pregunta. Utilice a : 0.05;

b)

Encuentre el nivel de significacin de Ia prueba.

al azar,500 usuarios de correo electrnico que trabajan en empresas pblicas result que 32 de ellos haban recibido virus informticos a travs del correo en eI ltimo ao.
Se seleccion,

otro muestreo independiente eligiendo, al azar, 300 usuarios que trabajan en empresas
privadas, resultando que 9 de ellos haban tenido este mismo problema.
Se realiz

a)

Proporcionan estos datos sufi.ciente evidencia estadstica, al nivel 0.04, a favor de la hiptesis de que la incidencia de los virus es mayor en las empresas pblicas?;

b) El p-valor del contraste,


34.

es

mayor o menor que 0.01?

Un estudio indicaba que las hijas de madres fumadoras durante el embarazo tienen mayor probabilidad de ser ellas mismas fumadoras. El estudio se Ilev a cabo con nias, preguntndo si ellas
haban fumado el ltimo ao y a la vez se consult a las madres si ellas haba fumado cuando
estaban embarazadas. Solo el 4% de las hijas, de 200 madres que no fumaron cuando estaban
embarazadas, haban fumado el ltimo ao, comparado con el26% de las hijas, de 500 madres
que haban fumado, tambin lo haban hecho. En la investigacin se propone que el hecho que
una madre haya fumado en estado de embarazo, aumenta Ia proporcin de hijas fumadoras en

20To.

a)

Qu hiptesis necesita usted para determinar si Ia diferencia indicada es estadsticamente

significativa?;

b)

Realice una prueba de hiptesis para establecer si la propuesta de la investigacin sobre el


incremento en Ia proporcin es plausible;

c)

Establece el estudio que si una madre embarazada fuma, hay una mayor tendencia a fumar

por parte de las hijas? Explique.


35.

Se desea comparar Ia proporcin de viviendas con servicio de alcantarillado en las reas urbana
Se hizo un muestreo en las dos reas con los siguientes resultados:

y rural de Pastaza.

Zona rural: De 500 viviendas elegidas al azar,230 disponan de alcantarillado.


Zona urbana: De 1000 viviendas elegidas al azar,680 disponan de alcantarillado.

Hay suficiente evidencia para concluir, con un nivel de significacin del 3 %, que en Pastaza,
la proporcin de viviendas con alcantarillado en la zona urbana excede en ms del 15 %o a la
proporcin de viviendas con alcantarillado en la zona rural?

36.

Para estudiar el efecto de una nueva terapia sobre el cncer de seno se tomaron dos muestras,
una de 300 pacientes que no recibieron Ia terapia y otra de 200 que si lo hicieron. De Ias que
no recibieron, L7L pacientes murieron y de las que si recibieron, 66 murieron. Un tratamiento
se considera efectivo si rebaja en ms del 18 % el porcentaje de los pacientes fallecidos. A un
nivel de significacin de 0.05, es efectivo el nuevo tratamiento?

Captulo

Pruebas de Hiptesis No Paramtricas


KISS Keep It Simple,

but Scientific

Emanuel Parzen
En las pruebas de hiptesis que utilizan Ias distribuciones normal, t o F, se supone que la ley de
probabilidad de la poblacin de la cual se extrae la muestra tiene determinada forma y que sus
parmetros verifican ciertas condiciones de manera que el estadstico muestral correspondiente tiene
una distribucin de probabilidad conocida, por lo que se llaman pruebas paramtricas. Por ejemplo,
para la aplicacin de Ia prueba , se debe suponer que Ia poblacin es normal. Adems, para la
aplicacin de las pruebas paramtricas se requiere que el nivel de las mediciones sea al menos de escala
de intervalos.
Sin embargo, existen muchas aplicaciones en las ciencias y Ia ingeniera donde no es posible conocer las
distribuciones de las poblaciones de las que se extraen las muestras o los datos se reportan como valores
en escala ordinal. En estos casos, se utilizan mtodos alternativos equivalentes a los paramtricos,
denominados mtodos no paramtricos o de distribucin li,bre.

Con frecuencia se utilizan las pruebas no paramtricas cuando se tratan de inferencias con muestras
pequeas y distribucin desconocida de la poblacin, ya que en estos casos no se puede utilizar el
Teorema del Lmite Central. La aplicacin de los mtodos no paramtricos no requiere conocimientos
matemticos avanzados, debido a que la tarea matemtica consiste en ordenar por rangos Ios datos
observados.

7)

Si se verifican Ias condiciones exigidas para el uso de una prueba par-amtrica, entonces, es siempre
preferible utilizar sta y no su equivalente no paramtrico. EIlo se debe a que si se utiliza el misrno
nivel de significacin en ambas pruebas, Ia potencia de una prr.reba no paramtrica es siempre menor
a la de su equivalente pararntrico. Por otro lado, con los mtodos no paramtricos se pierde gran
cantidad de informacin al no operar explcitamente con los valores sino con sus rangos.

Ventajas y desventajas de los mtodos no paramtricos


Las pruebas no palamtricas tienen varias ventajas sobre las pruebas paramtricas:

1.
2.

Por lo general, son

de usar y entender.

la necesidad de suposiciones restrictivas de las pruebas paramtricas.


267

Captulo

268

3.
4.

Se

9.

Pruebas de Hiptesis lVo Paramtricas

pueden usar con muestras pequeas.

Sc plreden

usar con datos cualitativos.

Tambin, las pruebas no paramtlicas tienen desventajas:


1.

No son tan eficientes como las paramtricas.

3.

Llevan a una mayor probabilidad de no rechazal una hiptesis nula falsa (error de tipo II).

veces, ignoran, desperdician o pierden informacin.

Las pruebas no paramtricas se dividen en dos grupos: sobre una sola muestra y sobre varias muestras.
Tambin, hay un grupo de pruebas que se basarr en la ley de distribucin ji cuadrado.

En este captulo examinaremos un conjunto bsico de pruebas no paramtricas, que permiten contrastar hiptesis sobre la independencia de variables, el ajuste a una ley de distribucin dada, la
aleatoriedad de las observaciones, entre otras. En la prirnera parte examinaremos aquellas pruebas
que emplean la ley ji-cuadrado, mientras que la segunda parte dedicaremos a otro tipo de pruebas.

9.1.

Pruebas X2 de bondad de ajuste a una ley

En esta seccin analizaremos procedimientos cuyo objetivo es determinar si un conjunto de observaciones sigue cierto esquema probabilstico. Estos constrastes comparan las frecuencias observadas con
las fi'ecuencias tericas de1 modelo probabilstico corr que se cotcja a trar,s de un estadstico cle prueba
qrre sigrre rrna ley 12.

9.1.1. Prueta sobre los parmetros en un experirnento rnultinornial


Srrpongzrmos que en urra investigacin se establecen ciertas categoras en las cuales se dividc la
poblacin; por ejernplo, el nivel socioeconmico, el nivel dc instruccin, etc. Cacla observacin puede
perterrecer solo a una de las k categoras prefijaclas.
Si eu Ia investigacin se realizarr n observaciones: zl1 de cllas estin en la primcra, n2 estn en 1a segunda,
..., n'k estn en la k-:sima cateplora; y se cumple que zt |-n2-1 ..-lnn. Una inrestigacin que

prescnttr esta carrcterstica se dcnornina erperinten,to mttltinom,ial, cuyas particularidades son:

t.

EI experimento consta de n cnsayos idrrticos e indepenclientes unos dc ctros.

E1 resrrltado clc cada ensayo se locaiiza en lrna

')
().

La probabilidrcl de que tin


cirnrple eue p1 -l pz + ---*

ensry'o se

pn:

y solo una de las catcgoras.

localicc en la i-sirna categora es p, (i

1,2,

,k);yse

L.

Esto sc rcsLlnte etr Lut] talila como la siguiente:

Categora
Frecuencia

trrobabilidad

C1 Cz

C*,

Total

'rL1

112

TLl

'n

P2

'pk

Pt

Itrteresa. conocer si el nmero cle cbservaciones clue se ubican en cada categor'a se ajusta a un esqllerna cle probabilidnd <lado; es clccir', si las probabilidadcs dc rertenencia a cada gr,r-rpo tiencn valores
especficos: pr : pro p2: p20, . . ., pk : pk. Entonces la pruebzr queda as:

9.7. Pruebas

de bondad de ajuste a una ley

X'2

: Plot P2:

'Pk:

1.

Hi,yttes'is

2.

Htpteszs Alte'r'no,t'rua,.

3.

Estad'st'ico de Prtt,ebo^

4.

Regi,rr de Reclazo. Se rechaza 11 cuando X?"1,, > XZ@

l{ula.

Ho'.

1,t1

I11

P2o, . . . ,

269

Pko.

: Al rnenos uncl cle los r, es <listirrto

c.Ic.,

p,g,'i

- I,2,...,k.

(rr-ttp)2
,
'\r/r'\ 7-t nPo

- l).

Ejemplo. En un periodo de un ao, se registraron 100 nacimientos de gemelos en la Maternidad


lsidro Ayora de Quito. La distribucin de los recin nacidos, de acuerdo al sexo, es la siguiente:
2

Se supone que los datos esLn

Pt

: P2:
4Y Pt: I2

Soluczn: Se tiene nt

varones

distribuidos segn una ley trinomial de parmetros (100;p1,Pz,Ps)

Probar Ia hiptesis a un nivel de significacin del 5 %.

29, n2

1.

Hrptesis

2.
3.

Hi,ptesis Alte'r'natiua. f11 :

Nula. Ho: pI

Estadstic:o

2 mu.jeres 1 varn, 1 mujer

38, ns

33

Pz:

n,

Pz: ,'

n,

Al

yn

100, con esos valores Ia prueba

es

menos uno de los p es distinto del enunciado

d,e Prueba.

(rn

* ,oo)'
11

1
-4 x l(X)

("-i

r2

x 1oo)

I
-4 x 100

:5.99 y la regin crtica

("-]"'oo)'
lxtoo
2

es XZt" > 5.99.

4.

Regin de Rechazo. Tenemos que XSos(2)

5.

Deciszn. Como 13.18 > 5.99, se rechaza 116, o sea, los nacimientos de los gemelos no siguen Ia
Ley indicada.

Se recomierrda que el

lector cambie las probabilidades de pertenencia a cada grupo) de manera que se

acepte la hiptesis nula.

9.L.2. Prueba de bondad de ajuste a una ley dada


Este caso es una generalizacin del anterior. Ahora, supondremos que no podemos asignar de antemano
1as probabilidades de pertenencia a cada grnpo, silo que se las debe calcular a partir de una ley de

distribucin terica (uniforme, normal, Poisson, etc.), cuyos parmetros son conocidos o deben ser
estimados a partir de las observaciones de la muestra.
Disponemos de un conjunto de n observaciones, que se supone siguen una ley de probabilidad dada y
que estn agrupadas en k clases o categoras.

Por otro lado, sea X una variable aleatora que sigue Ia indicada ley probabilidad, que toma valores
.r:r) tr2). . .; entonces. Pr(Y : r.) : p.

Captulo

270
Por e-.jemplo,

9.

Pruebas de Hiptesis lVo Paramtricas

podr'a seguir una lcy de Poissou,

Pr(X:r):P ="-tr)'"
,l
donde el par'metro

puede estar previamente especificado o debe ser estimado.

A partir de las probabilidades tericas

se

calculan las frecuencias esperadas de cada clase como ei

np,i.

Cuando alguna clase tiene una frecuencia observada menor que 5 se Ia puede unir con alguna clase
adyacente y sumar las probabilidades correspondientes. Luego de agrupar las observaciones que lo
ameriten, se dispondr de una tabla de frecuencias con k clases, como Ia siguiente:

Grupo
clase

FYecuencia

FYecuencia

Observacin

observada (n)

esperada

1
r2

nl

et:
e2:

npr

n2

;r

;*

ek:

nplr

Total

nP2

El estadstico de prueba, para comprobar si los datos siguen una ley especfica,
k

xZu":

es

.o

,"0

(e

L=I

"n",,"

que sigue aproximadamente una distribucin y2 con [(k - I)-(nmero de parmetros esti,mados)]
grados de libertad. As, si se supone una ley de Poisson, de parmetro ,\ conocido, entonces Xlr" sigue
unaley X2(k-1);perosiseestimaelparmetro),elestadsticoXl6"sigueunadistribuciOny2(k-2).
La prueba de hiptesis queda como sigue:

NuIa. fls: Los datos siguen una \ey L(p) dada.

1.

Hi,ptesi,s

2.

Hiptesi,s Alternatiua. I11: Los datos no siguen la ley

.).

Estad,stico

donde
4.

&:

d,e

Prueba. XZn.

: !
i:t

('

ei

")2

4(p) dada.

es el nmero de clases que se forman luego de agrupar los datos.

Regi,n de Rechazo, Se rechaza

Hs si XZt" >

X?"@

estimados a partir de la muestra.

- 1- l), donde I :

nmero de parmetros

Ejemplos

1.

En una agencia bancaria hay cinco cajas para atender a los clientes. Un da, el encargado de la
agencia contabiliz el nmero de clientes que escoga cada una de las cajas, obteniendo:

Caja
FYecuencia

Total

34

54

39

48

45

220

De acuerdo a estos resultados, se puede concluir que ha'preferencia por alguna de las cajas?

9.7.

Pruebas X2 de bondad de ajuste

una ley

27L

Sohtc'in,: La hiptesis nnla es sriponel que no hay l'eferrencia por una caja palticular o, lo que
es 1o rnismo, que los datos siglren Lrna ley uniforrne con

p.:Pr(Y: i) :;,

i__

r,...,5.

Entonces, las frecueucias esperadas son:

ei

npi :220

, !: nn, i: I,. . . ,5.

Notemos que aqu no es necesario estimar parmetro algrrno; de manera qr.re la prueba
1.

Hi,ptesis NuIa. 116: Los datos siguen una ley uniforme.

2. Hiptesi,s
t).

es:

Alternat'ua. Ht: Los clatos no siguen una Iey uniforme.

Estadstico de Prueba.

xza"

:
:

f@t-"t)2
ei
i.:r
(34-4q2 _64-4q2 _Q9-44)2 _gB-4q2
-(+S-+q2

44=44.44=44-44
4. Regi,n rl,e Rechazo. Como X3.os(5 - 1) : 9.49,\a

regin es XZt"> 9.49.


5. Deci.szn Aqu, XZa"no est en la regin de rechazo; de manera que se puede decir que no
hay preferencia por ninguna caja.

En una ensambladora de carros se registr el nmero de defectos por unidad en una muestra de
100 unidades que se inspeccionaron durante una semana dada, dando la siguiente distribucin
de frecuencias:

Nmero de defectos
Nmero de carros

.)

63

20

Contrastar Ia hiptesis de que los datos se ajustan a una distribucin de Poisson.


Soluci,n: El estimador del parmetro .\ de la ley de Poisson es el promedio:

.A-.t/
\ _=_

0 x 63 t-

1x 20f 2 x 8*3 x 5 -14x4

_tt(n

-u.ur.

100

Calculemos las probabilidades de peltenencia a cada grupoT segn la ley 2(0.67):

Po :

Pr(X:Q) :

_0.67(0.67)o

Pt, :

Pr(X:

-0.67(0.67)1

Pz :

Pr(X

P3 :

Pr(X:3) :

e-o

P+ -

Pr'(X:4) :

e-0.67

1)

:2) :

0!
1!

e_o

67

(0.6n2

0.512,

0.343,

:0.115,

2t'
6T

(0.67)3
ol
JI

(0.6n4
4

:0.026,

0.004.

Las frecuencias esperadas son


eo

100

0.512

-- 51.2,
ez:100x0.115-11.5,
et : 100 x 0.004 :0.4.

et: 100 x 0.343 :34.3,


e3: 100x0.026-2.6,

Captulo 9. Pruebas de Hiptesis lVo Paratntricas

272

cl cstrclstico r.l.e pruebir:

Crk:rllcrrros

4,
s- @-e)2

.,

-z
\ rt.s

/_

,i_'_.o ei
(63-51.2)2

5r2

La prueba estadstica

(t0-34.3)2 + (8+
-

11.5)2

lli

34i

0.4)2 _
_6-2.q2
+g- ,J4
!1 7'
-+"L'
2.6 -

es:

1. Hiptesis NuIa. 11: Los datos siguen una ley de Poisson P(0.67).
2. Hi,ptesis Alternatzua. 11r: Los datos no siguen una ley de Poisson P(0.67).
3. Estadsti,co de Prueba. X?ot":4I.72.
4. Regi,n de Rechazo. Como x3.os(5 - 1- 1) :7.81 y la regin es XZu" > 7.81.
5. Deci,si,n Se cumple que 4I.72 > 7.81; entonces, se rechaza Ia hiptesis nula. El nmero
de defectos no siguen la ley de Poisson P(0.67).
Se midi la duracin de trabajo de 200 elementos electrnicos, segn se resume en Ia tabla. La
primera columna muestra los intervalos de tiernpo (en horas) y
la segunda est la cantidad
"tr
de elementos que han trabajado el tiempo entre Ios Imites del correspondiente intervalo.

Tiempo de
duracin (hr)

FYecuencia

0-5

133
45

(rn)

5-10

10

15

Tiernpo de
duracin (hr)
15-20

FYecuencia

20-25
25-30

15

(rt)
4
1

Para el nivel cle sigrrificacin 0.01, 'i'erificar la hiptesis de que el tiempo rnedio de trabajo de Ios
elementos est distlibuido segn una Iey exponencial.
Solu,czn: El parmetro .\, que sigue la ley exponencial, se estima po,

: ! :
T

O.r.

Calculemos las probabilidades de que la variable aleatoria tome valores en cada inten'alo:

pr

Pr(O

< X < 5) :.-o2xo

e-o2x5

p5

0.6321.

Anlogamente, se obtienen
pz

0.2326, pJ :0.0855, p :

0.0315

:0.0116,

po

0.0043.

Con sto, se encuentran Ias frecuencias esperadas, ei: npii

et

: I26.42t e2 :

46.52, es : 17.I0,

e+

: 6.30,

es

: 2.32, eo :

0.86.

Como las tres rltimas frecuencias son pequeiras, se las puede agrlrpar en una sola clase, obtenindose k : 4 clases. De esta manera, se dispone de Ia siguiente tabla que muestra el grupo, la
frecuencia observada y la frecuencia terica.
z

2
D

Total
Por lo tanto, la prueba

es:

133

45
15
7

200

t26.42
46.52

17.10
9.48

9.7. Pruebas X2 de bondad de a.juste a una ley

273

fI'iptcs'is Nrtla. 11: Las obserr,ciorres sigucrr rrrrrr lcy <rxporrcuciul t(0.2).

Htptes'is Altr:tra,ti,tstt,. H1: Los clrtos u<l sigucrr rrrrir Icy r:xponencial ,(0.2).

Estct,dst'i,co de Prtebu.

rl

rlr.,

(rt,
.-:

-,:,

c,)'2

(133

126.4D2

(45

126.42

46.5\2

46.s2

(15

17.10)2

17.70

1.299.

se estim \, I :1 y se debcr examinar la Iey 12


con (4 - 1- I):2 grtrdos de libertad) cuyo valol es Xl.otQ):9.2I, se define la regin de
rechazo XZt" > 9.27.

4. Regin de Rechazo. Como previamente

5. Decisin Puesto que 1.299 <

9.21,,

no hay razn para rechazar la hiptesis de una ley

exponencial (0.2) para los datos.

4.

Se

midi la estatura de un grupo de nios de 12 aos de edad, con los resultados:

Estatura

Nmero de nios

140

745

l8

135
740
145
150

oo

- 150
-

t)!

155

61

155

160

22

160

165

Velificar si los datos de esta mnestr provienen de una distrilrucin nornral.


Soh',ci,n: Err primer lugar se cleben estimar Ios parrnc'tlos de Ia ley nolmai:

fr: r:

150.625,

? :31.425.

probabilidades de pertenencia a cada intervalo, segrin una ley

pt

: 0.026,

p2

: 0.129, ps : 0.298,

son:

^/(150.625;31.425)
0.327, ps : 0.170, pe : 0.042.

ilL

Ias frecuencias esperadas son:

et

: 4.I8,

ez

: 18.55,

et

: 42.88, e+ : 47.06,

es

: 24.77,

ea

6.48.

Entonces, la pmeba es:

l.

NuIo. ,F16: Las observaciones sigueu r-ura ley normai


^/(150.625;31.a25).
2. Hiptesis Altentatiua. 11: Los datos no siguen una ley normal^/(150.625;31.425).
3. Estadstico de Pr"ueba. X|,r":8.349.
4. Regin de Rechazo. Como se estimaron dos parrnetlos, entonces I : 2, el estadstico de
prueba se debe comparar con Xfr.or(6 - 1- 2):7.81. La regin crtica es X?ou, > 7.81.
5. Deci,sin Corno 8.349 > 7.81, se rechrza I1o; por tanto, las estaturas de los nios de la
H'i'ptes'is

muestra no siguen la ley normal enunciada.

-\ cotrtintiacitt se rresenta ttn resurnen de los estirnrdoles


rlentc enipleaclas.

cle los prrr'rnetros de las Ieyes ms comLlrl-

274

Captulo

9.

Pruebas de Hiptesis

-lVo

Paratntricas

Estimador

Ley
Binomial Bin(n,p)

p- -u

TL

p- -rT

Hipergeomtrica 11(N, p, r)
Poisson

2())

A:T
&

a:r-VJs/;

Uniforme U(a,b)

i:r+/3s
1

t())

Exponencial

D:_

Geomtrica Q(p)

A_-

F:r

Normal J{(p,o2)

^t,
o-:s'

9.2.

Pruebas sobre tablas de contingencia

Cuando tenemos la informacin de 2 variables de tipo cualitativo, se la resume en Lrna tabla de cont'ingencia, que es una tabla de frecuencias de doble entrada, donde en las filas se ponen las modalidades
de una variable, y en las columnas las modalidades de la otra; en las celdas resultantes del cruce de
las filas y las columnas se coloca el nmero de elementos que presentan ambas modalidades.
Si se tiene informacin de.l elementos acerca de las variables
c modalidades respectivamente, Ia tabla de contingencia r x c

Ay B, de tal forma que prescntarl r y


(r filas y c columnas)

At

??"TI

Variable B
B,
B.
nli
n C

A,

nil

Ttrzt

Li.c

TLx

A,

frr'l

TL'r

TLra

TLr

Total

n.7

n1

nc

Variable

B1

-4

es de

la forrna:

lbtal
nL

donde,

rL.

: D"o,
j:r

(total de Ia frecuencia de la fila'i),

n : D"n,
i:r

(total de la frecuencia

d.e

la columna 7).

Por ejemplo, los jefes de familia que viven en una ciudad pueden clasificarse en dueos o arrendatarios
de la casa donde residen y segn su nivel de instruccin en primario, secundario y superior; es decir,
se los podra clasificar en una tabla de contingencia 2 x 3.

9.2.L. Prueba de independencia


Considrese las probabilidades p,., de encontralse en Ia fila
p;r Ia probabilidad de encontrarse en Ia celda (i, j).

i; p., de encontrarse en Ia collrmna

j;

9.2. Pruebas sobre tablas de contingencia


Debe ctrrrtplirse que

iO, :f
i:r

i p.j : l,y
j:r

f:
f :

275

pueden ser estimada,s por


ni.

7r. . . ,T,

N'

n.i
J

y''

lr''' ,c'

r
;-

Bajo la hiptesis de independencia entre filas y columnas, se tiene que la frecuencia esperada en la
celda ubicada en la i-sima fila y j-sima columna es

ej: NF.0t:U#
El estadstico que permite probar la hiptesis de independencia es

xZa":iiry,
i:l

"Ll

j:L

que sigue aproximadamente una distribtcin y2 con [(r

1)("

1)] grados de libertad.

Entonces, la prueba para la independencia es la siguiente:

1.

2.

Hiptesis Nula.
Hiptesi.s

Hoipij:pi.p.j

(la variable A es independiente de la variable B).

Alternatiua. Ht: pt * p.p., para al menos una celda de la tabla (la variatlles A y B

no son independientes).
@

e')2

Estad,sti,co d,e Prueba.

4.

Regi,n de Rechazo. La hiptesis de independencia se rechaza si X?"t"> X?"1(,

XZu,:

i
i:t j:r

eii

Ejernplo. En una investigacin se desea revelar si existe relacin entre el consumo

- t)(c-

de combustible y

el origen de los carros que circulan por la ciudad.

Origen

EE.UU. Europa

Consumo
Bajo
Alto

76
160
236

Total

56
t4
70

Japn

Total

70

202

183

79

385

Al rrivel 5%0, verfrcar si las dos variables estn asociadas.


Solucin: Calculemos las frecuencias esperadas) eiji

nt.n.r
N
nt.n.s
etg :
N
en

n2.n.2

202

x 236

385

202

79

385

183

385

70

nL.n.2

!23.82,

:4I.45,

e2l:

:33.27,

(,.r.!

n2.n.l

-----;=/v
n2.n.3

A,/

202

70

:36.72,

385

183

236

385
183 x 79
385

:
:

t)].

112.18,
37.55.

Captulo

276

Clou cllrs forrrrclros lr

t,rblr

9.

Pruebas de Hiptesis lVo Pararntricas

clc frecuerrcirrs csperaclas:

Origen
Constlmo

EE.UU. Europa

Japn

Bajo

723.82 36.72
112.18 33.27

4\.45

Alto

37.55

Entonces, la plueba queda como

1.

H,i;ptesis

2.

Hi,ptesis Alternat'iua. .F1r: EI origen del carro

3.

Estadstico de Prueba.

N,ula. /16: El origen del crlro y el consurno de combustible sou iudependientcs.

(76
xZt

Regi'n de Rech,azo.

tiene que
5.

x|,sQ):

t23.s\2

r23.82
(160 - 112.18)2

"

:
4.

y el consumo de combustible estn relacionados.

112.18

101.51.

El nrmerode grados delibertades u: (2- 1)(3- 1)


5.99. La regin de rechazo es XZu, > 5.99.

Deci,si,rin. Como 101.51 > 5.99, se rechazr ltr hiptesis


el consurno de combttstible y eI origen de los carros.

Tablas de contingencia de 2 x

:2 ysi a:0'05,

se

nula. Coucluinros qtte ltal'relaciIt entre

Para el caso especial de la tabla de contingencia de 2 x 2, se ha desarrollado una frmula de clculo


X'.|u" que no requiere l-r determinacin de las frecuencias esperadas. Supongamos que se dispone
cle ula tabla de contingencia de dos variables, cada una de las cuales solo pueden tomar dos valores,
como la siguiente:

d"

Variable
Variable A
A1

A2

Total

El estadstico de prueba

81 132 Total
a*b
ab
cd
ctd
aic b+d n,

se calcula como

xZt*

clue sigue una

ll

t{ad -

bc)2

= (a b)(c d)(a c)(b d)'


+
+
+
+

ley X2 a 7 glado de libertad.

El resto de Ia prueba de hiptesis queda igual a lo enunciado anteriormente.

Ejemplo. El siguiente cuadlo


clasificaclos por sexo.

muestra la reaccin de los espectadores ante un comercial de televisin

-v

9.2. Pt'uelas sobl'e tablas


R.crccin

,Depencle

cle cotttittg,etrcia.

Sexo
HorrrlrLr-'s \Irrjcles

277

Tolal

Dcsfavorable

1t)

Favolablc
Total

10

13

72

o:

15

,]

la aceplacitin clcl corrcrcial clcl sexo rlcl tclcvirlcnt,c'?

Sol,ttcin: La prueba de ILiptcsis clrrccla clc la siguicrrlc rrrrrela:


1

Iiptesis AluLa. fI6: La lcrcciri rntc el corr,:rrtrirl

')

Hi,ptcs'is

J.

Esto,dsl"ico tle Pt"ucl,ta,. .lt,,

tlltent,otiuo.

111

: l,a rccr:icirr rltr cl

inclcpcrrclicntc clel sero.

c:orrrcr'<:irl

y cl ,5cxo

n(o,rl,-1.'r:')2,

_
,,
- (rr+)(c:1
r|,)(atr:)(1.,*d)

Rngzn de Reclo.zo. Si escogcrrlos

\;i,, >

crs

rr:0.05,

cstitr rclacionacios.

y 3)2
:3.2i].
15 x 10 x 13 x 12

25(10

7-5

lo,(l) :3.34. La legin

\'crrros,1,,e

cle lecliazo cs

3.84.

5. Decis'itl Como 3.23 < 3.81, no sc lechrza

la hiptcsis lula. Se concluye clue hay inclepenclencia


entre el sexo del espectacLol y la accptacirr clel comcrcirl.

Sc srLgiele cre cl

leciot

rerlicc

cl c.jeLcicio niecliante el

r:ilc:rLlo cle

las ficcLrcricias cspeladas

9.2.2. Prueba de homogeneidad


Sr-'clice qLrc lura ntttestLr es lt,ortt.o.tt3,rr:r si lr)rlrs srrs t)bsrrlr'rc:iorrr:s lr.rrr sirlo gcrrelrrclrrs pol cl rnisnrr.r
rtrodrtlo cle ciisl,ribucin dc lrlobr'rl.riliclzrtl o pcltorrtrc(rrrr r, rrLrr rrrisrrrrr poltlzrcitin. La metodologa cle lrs
pLttclt:rs <le iticlependelrcia tarnbirr n.reclc aplicalsc lralii trr.cLigrLu si exisl,c honrogeneidrd eutrc clos o
rr

ris unrcsh as inclepenclicntes.

i\s. la prueba

i.

estaclsticr cs ltr sigrrieutc:

Hi,ptesi,s

Nrtla. Is:

Lts tltLLcstlzts ptttvir-'rrcrL

rlc rrrra rLrisrr:r toltlurcirr (lers

llLlest,tirs sttrr lro-

nrognears).
')

: Las nttlcstras no ptovicncrr

H t'ptes i,s

Alternatiua.
son hetelogneas),

11

Estn,dst'ico dc PrtteLto,

\I\, r/,.r -.r- r1- 1itt

R,

(tt'j
('j

clcl rurr nrisrua ltoblarcin (lars rnucstlz-rs

' ',t)

qin ,le Rcc'l,azo. l.t hipcitesis cie inclepcrrrlcnc:i,r sc

lcc:hrrzr

.i

13,,.,

trjemplo. En uua Facultacl

> X3l(?'-

t)(c- i)].

sc clasific i las rrolas obfr:niclis L)or sus alumnos, luego cle lenclil cl
Fsica. conro )ra.jas. rlcclirs v allrs. 'fanbin. sc rcgislr' cl plofcsol clue clictirba la
rlater-ia. obtenienclo:

luisllo exalren

cle

Cililicrcic'rrr

Plofcsoi

lia.a i\lc<liir,,\ll

lLbral

tl

1,2

23

.12

1)

r7

r!

.16

,)

,l 0

ll

,!8

lirl

rl

Captulo

278
Se puede decir que

9.

Pruebas de Hiptesis No Paranttricas

la diferencia en las notas es debida al profesor?

Sohrcin: La tabla de frecuencias esperaclas

es:

Calificacin
Profesor

Baja \'Iedia

A
t)
l)

La plueba estadstica

.7 19.1
19.3 20.9
t7

AIta
5.3
5.8

es:

1.

Hiptests Nula. 11: Las difer-elcias eu las notrs no son debidas rrl plofesor de la materia.

2.

II'iptesis Alternatiuu,.

.)

Estadsrico

4.

Regin

5.

Deci.si,n. Como 6.12 > 5.99. sc rcchazrr 110: es rlecir, ei profesor de la materia si influye en las
notas obtenidas en su materir.

9.3.

d.e

prueba.

d,e Recho,zo. Se

,F11

Lrs cliferencias

r?.-:
\ o

(12_ rT'7)2

fi .7

tiene.1.,e xfror(2)

crr las notas se debelr al profesor.

(23
-._

:5

--I9'l)2 *...-r- (a -5'B)' :6.12.

lg,I

99 v la regin es,\3"

b.B

> 5.99.

Ejercicios

Pruebas de bondad de ajuste a una ley

1.

En un cluce de carretelas los aulos pueden gir-al a 1a izquierclrr, l Ia derecha o seguir de frentc.
Se supone que la rnitad de los autos scgr-rir'irr de fi-ente, la nna cutrta parte ir a Ia izquielda 1Ia cuarta parte restante a la clclecha. Sc rerliz urr colteo cle los autos segn la direccin quc
ellos siguen:

De

Frecuencia

fi'ente A la izqr-rierda A la derecha


29

149

Pruebe Ia hiptesis indicada a un nir.cl clc significircirr de 0.1.


Cuando el naturalista francs del siglo XVIII Georgcs Louis llrLflbn realiz 4040 lanzamientos
cle una rnoneda observ 2048 calas. Cclncuerrlarrr estos datos coL la hiptesis de que la rlonedr
cs simtrica?

Una zona de \4indo es cl hbitat natur'rl <le tles cspccics dc colibres. Se cree (hiptesis nula)
qlle ulla quinta parte de los colibr'es pcltcrrecc tr la prirrrera cspccie, dos quintas partes a l;r
segunda especie y otlas dos quintas part<rs r la tercera. En una nnestr"a aleatolia de 34 colibr'cs
de la zona, se observalol 12 cle Ia priirrcr-er especle. 15 clc la scgrLnda" y 7 de la telcera. IIav
suficiente evidencia estadstica (al nrvcl 0.05) pala acepterr Ia hiptesis propuesta?
4

Segirn los datos de un estudio c-rhaustivo rle rrrercado qlle se lc;iliz en la ciudad, las ventas clc
irnpresoras para comptltadoras lrersonalcs der uso clomstico sc ciividen entre cuatro marcas (4,
B, C y D) cuyos porcenta,jes dcl total de las vcntas son 18 c/o,22Vu.35% y 25To, respectivamentc.
Un ario despus, se quiere analizal de urrcro lr situacin pcro sc cree qrle no se debe repetir ur
estudio de mercado a gran escalr. Se clccicte obserr.ar Ia narcr adquil-ida por 200 compradores
cle inrpresoras elegidos al azar. obtcnienclo cpre c1e cllos 28 habalr clegido la marca 4,48 LaR,77
Itr C y 47 LaD. Hay suficientc cvidencir. ..1 rrivcl 0.05, para tl[iL'r,-rzrr clue el reparto del mercacio
yr no es el mismo quc el arlo rnl-eriol'/

9.3. Ejercicios

5.

Dos empresas S y T especializadas en lealizar sondeos polticos condujeron dos investigaciones


sobre la intencin de voto a un partido poltico. Tambin. se disponen de Ios resultados de 1a
eleccin lievada a cabo das despus

Partido Emplcsa S

Ernprcsa

Elcccrn

416

1EE

B
C

62
193

83

32.9
5.1
15.9

76
36

12.4
10.6

::

139

\,{

95

151

76

77
?o

14.0

1.)n
I1,J-

508

100.0

Total

6.

279

9.1

a)

Compare los resultados de la eleccin con cada Llna de las investigaciones de las empresas;

b)

Se puede determinar cul de las ernpresas

dio el resultado ms certero? Explique.

Cuando Gregor N4endel realiz sus experinrcrrtos clc cnlzarniento de guisantes, obserr, las frecuencias de varias semillas producidas por hbriclos dc guisantes amarillos Lisos y guisantes verdes
mgosos. Estos datos y sr-rs respectivas probabilida,cles, segirn las predicciones de la teora de la
herencia de Nlendel, se dan en la siguientc tab1a.
Sernillas

Frecuencia Probabilidad

Amarilla v lisa
Amarilla y rugosa
Verde y lisa
Verde y lugosa
Total

r,

.) 1 a

r),Lr)

101

108

3116
3116

31

1l16

116

555

Para un nivel de significacin del 1%, erarline si las frecuencias rle los datos son consistentes
con las probabilidades tericas.

7.

En el desarrollo decimal de z- entle los 10 03E primeros dgitos aparecen 968 ceros, 1062 unos,
1021 dos, 974 tres, 1014 cuatros, 1046 cincos. 1021 seis, 970 sietes. 948 ochos y 1014 nueves.

a)

Se puede considerar clue los dgitos apa,recen nniformementc distribuidos, a

significacin a :

un nivel

de

0.05?;

b) A qu nivel de significacin rechazarii ln hiptesis'/


8.

Entre 2000 familias que tienen 2 hijos. 522 frnulias lienen dos r.alones, 471 dos mujeres y 1007
de los dos sexos. A un nivel de significacirr de 0.05. ,se puecle consiclerar que el nrmero de hijos
\rarones en las familias es rlna variable alcatoria binomial?

9.

En nn estudio a 107 familias qr-re tienen 5 hi.jos. sc coutaliliz el nrmcro de hijas que tienen tales
fanilias, con el siguiente resultado:

Nmero de
hijas
Frecuencia

t)

.)

17

28

to
L

19

Puede afi.rmarse que) para las fanilias estucliaclas. el rrrrler-o cle hijas sigue una ley binonial?
(Use a : 0.05.)

Captu.Io

280

10.

9.

Pluebrs de Hiptesis

No Pararntricas

Para estudiar la delilcueucir ol] Llrr1 r:irrrlacl se rrrotr'on lr-s clcuulcias lol lobo rle automr.iles
recibidas en los riltinros 575 r1as. obttnirrrrlose krs siguicritcs losrrltaclos:

No. denuncias

Frecuencia

23t)

210

90

JiJ

Contraste la liii.rtcsis clc crc los cltos plocorlcrr cic rrna <listribuciu rle Poisson con
(a : 0.05)

i1

Se

registr la cantiriacl cle goles colsegrrirli.rs uu

1,19 p;rr'1 iclos <lisprrbados

por

r-rn

) :

1.

ecluip o profesiottzrl

de fiitbol

No. cler golc.s


en Lur priti(lo

01234
50 64 23 84

Frectterttc,it

Verifique la hiptesis dc que ol uiruero rlcr golcs Pt.,r llarticlcl csti distribuido segrr una ley dc
Poisson. para el nivcl clc sig-nificircin 0.l)5.
12

En el transcurso de
telefnica ftre:

dos

holits, cl nrirlcto dc llaulrrlas pol rrrinuto, solicitadas r una cetittal

No. llarnadas/min
Frecuencia

,Se
13.

puede aceptar que

e1 nrnrelo clc llrrrrrrlrs

tl

t)

JJ

I7

10

')
.)

,)-)

18

,)

pol rrrirnrto signc una distlibucin

clc Poisson'J

En cierta regin sc registr la temperirtur'r ck:l rilc chrrantc 300 clas. Lrs medicioncs se rcsruneu
cn Ia siguiente tabla (en la plinrcla cohurLnr se inrlic:l el intclvalo de tr,.nperatnrr en grados 1'
en la segunda el nrmero de clis cuvr fclrrL)clratLrLa rrrecli,r collcsponclc l cse intervalo). Ver-ifi<.re
clue la tenperatura rrreclir esti clistribuiclr rLrrifolnonrcnte r un livel cle significzrcin dc 0.05.
Rango

cle

iurgo

clc

tetlpelatnlil

Fr'c<;rrerrcia

lerrrpcltt t nrit

Flecrrenc;ia

(-t0) a (-5)

10a15

40

(5) a0

40

15 a 2i)

0a5

30

46
48

5a10

,15

20a25
25a30

26

14. Un estudio

realizado iuclica cre el ticnrpo clc cspera cri lr crola rlc la, ca,ja de un banco se pucclc
rnodelizar con Ltlla distribucin cxporrcrrcirl clc rreclia 3 rninr,rtos. Para cornprobar si este noclclo
sigue siendo r'liclo, sc tom la sigrricrrtcr ntrrcstLa:

3 2 6 ,,t 1 3 2 1 1. 4.
\erifiquc si los drtos Jloccclcn clcl rrroclckr ospecrifir::rrlo cn cl cstrrclio (cr:0.05).

15. Se probaron

450 focos, t-egistlrindose

Tiernpo

e1

ticrtrpo crc <lulitlon enccncliclos hasta que ftrilaron:

Nrirnclo
clc firr:os

0a40u

131

400 a 800
800 a 1200

95

1200 a 160i)

76
5(i

Niunelo

Ticrnpo

clc focos

L6(X) a 20t10
2000 a 24U0

i)

2'100 a 2E00

)1

Pala un nivel de significacin de 0.01. r-clifc1ue la hiptesis


focos est distlibuicla segrn rrrrrr ic). exlrrIttcucirl.

clc clue

3ij

el ticrlpo de dulacin clc los

9.3" Ejercicios

287

16. En la Facultad de Ciencias se quiere averiguar

los conociurientos sobre Fsica que tienen los


alurnnos matriculados por primera \ez en dicha Facultad, para lo cual se realiz el primer da
de clase una prueba genera,l. Los resultados correspondientes a rlna nnestra de 211 alumnos se
recogerl en la siguiente tabla:

Puntuaciones

50.5
55.5

Frecuencia

55.5

60.5

77

b(J.b bli.l)

45

65.5
70.5
75.5 80.5

70.5

67

75.5

dL)

80.5

15

85.5

10

It

Determine la normalidad de la variable qlre representa la puntuacin obtenida. (Use o

0.05)

Pruebas sobre tablas de contingencia

17. En una investigacin

sobre el hbito de fumar por lur grupo de estudiantes universitarios se


obtuvo Ia siguiente tabla, en la cuaL se relaciona el sexo del entrevistado y si l o elia es un
funador.
Fuma?
Sexo
SI NO

Masculino
Femenino

26

10

11

15

Pruebe si existe asociacin entre el hbito de fumar y el sexo del investigado.

18.

En un estudio mdico a 300 pacicntes que fueron opcradas por cncer de ovario, se clasificaron
en quienes han sobrevivido 10 aos despus tl.: la operacin y quienes no lo hicir:i.rn, y el estado
del tumor al momento de la operacin.

Estado del
cncer
Terlprano
Avarrzaclo

Sobrevivi?
No

32
r18

Si

r27
23

La sobrevivencia de Ia paciente es independientc del estado del tumor el momento de Ia operacin?

l9

A firr de probar el supuesto de que una persona desernpleada rcpresenta un alto riesgo crediticio,
en nn banco se realiz un estudio de 100 c:nentas escogidas aleatoriamente con los siguientes
resultados:

Situacin actual
del prstamo
En mora
No en mora
a)

Calcule el vaLor

b) Calcule el valor

Situacin laboral
del cliente
Ernpleado Desempleado

16
55

d. XZa" para estos datos, usando


d"

10
19

Ia frnula usual;

XZt" para esta tabla mediante la fnnula alternativa;

c) Cul es el resultado de esta prueba al uivel de significacin de 5 por ciento?

Captulo

282
20.

9.

Pruebas de Hiptesis lo Pararntricas

Se realiz un anlisis de sangre de un grupo de 1000 habitantes (elegidos al azar) cie una ciudad
con la siguiente distribucin, segn el grupo sanguneo y el factor Rh:

Rh+
Rh

t7-

A
3r7

AB

81

39

82

29

10

96

Segn estos datos. puede aceptarse la liiptesis de inclependencia, del factor Rh de1 grupo sanguneo? (Use cr : 0.05)

2I

un estudio sobre la utilizaciu de ciertas fuentes de financiamiento externas para 1as


pequeas y medianas empresas (PYN'ItrS), Fara e1lo, se seleccion aleatoriamente 500 PYMES a
nivel nacional. Las empresas se clasifi.caron segr1n su tarlao en tres categoras (micros, pequeas
y medianas) I' segn hayan utilizado o rLo a).gr.rna fi.relte de financiacin. Los datos obtenidos
Se ejecut

fueron:

Con financiamiento

Sin financiamiento

115

20

20

15

Nlicros
Pequeas
Medianas

a)

b)

Existe alguna relacin entre el tamao de la empresa y el hecho de recurrir o no a fuentes


de financiacin? Utilice un nivel de significacin del 10%;
,Puede aceptarse. a un nivel. de significacin del 5 %, clue ttn20To de las empresas <<micros>>

utilizan fuentes de financiacin frente a que


22

J.a

proporcin sea mayor?

detenlinal 1as posibles relaciones entre el nivel educativo


(superior, medio o primario) de las persolras y el consumo (bajo, medio o alto) de productos

Se realiz un sondeo en ia ciudad para

electrnicos. Los resultados, para 400 personas seleccionadas al azar, ftteron:

Nivel
Educativo

Consurno
Bajo \'Iedio Alto

Superior

t)1
.)-L

47

4.4
++

\4edio
Primario

2B

79

125

16

17

19

Contraste Ia inclependencia entre el nivcl educatir.o v el consumo de productos electrnicos.

23. En una investigacin

sociolgica a un grupo de pcrsonas casadas, se desea saber si el nivel socioeconmico de los encuestados incide sobre el xito o fracaso de su matrimonio. Los resultados
se dan en la siguiente tabla:

NSE
I

FYacas?

,Se

II

III

IV

Si

28

62

79

181

724

No

t27

230

443

850

582

puede concluir que la diferencia en el ndice de fracaso se debe al nivel socioeconmico de

los matrinonios?'

24. trl

Consejo Directivo cle una universidad cluer'a determinar la opinin de cl.iversos grupos en
relacin con el calendario docente propuesto. LIna muestra aleatoria selecciolada entre 100
estudiantes, 50 empleados y 50 profesores dio 1os siguientcs resultados:
Favorakle

Desfavorable

Estudiantes

Ernpleados

Profesores

63

27

30

JI

z,\

tn

9.4.

Pruebas sobre rna soJa

ntuestra

283

Si se desea saber si hay prucbas dc una difcrr:ucia, rrrr la rctitucl hacia el calendario entre los
diversos grrpos:
es Ia prueba adecuada para la realizacin de este contraste, y especifique las
hiptesis a contrastar

a) Indique cul

b)

25.

Realice el contraste corrcspondiente, con un

livcl

de significacin del

%.

Un estudio sobre tabaquismo cn tres ciuciadcs, rnediante tres muestras aleatorias de tamao 100,
proporcion los siguientes resultados:

Ciudad
Fumadores

13

No furnadores

87

Se pueden considerar homogneas las

Ciudad
n
7'
t),)

Ciudad

18
82

tres poblaciones respecto a sus hbitos fumadores, al nivel

0.05?

Esta parte del captulo la dedicaremos al anlisis de la,s prucbas no paramtricas que involucran una o
dos muestras y cuyo objetivo es probar si los parmetros de los que provienen las muestras adquieren
ciertos valores particulares. EI lector notar la sinilitud con las pruebas desarrolladas en el captulo
anterior.

9.4.

Pruebas sobre una sola muestra

En las pruebas no paramtricas sobre Lrna nuestLa se distinguel dos clases: aquellas que contrastan
el valor de una rnedida estadstica (de localizacin, de clisper-sin, etc.) y las que contrastan una
caracterstica general de los datos (ajuste a una lcy, aleatoriedacl, etc.).
Existe una amplia variedad de estas prnebas, nosotlos solo exarninarenos los contrastes ms comlrnmente utilizados y que generalmente se presentan en los plograrlas estadsticos.

9.4.1. Prueba de los signos


El contraste de los signos es la prueba no pararlltrica ms antigua y en ella se basan muchas otras.
Se utiliza para contrastar hiptesis sobre ei pariirnetro de localizacin y en el anlisis de comparacin
de datos pareados. Consideremos Lrrra mnestra aleatoria dc tamao n tal que sus observaciones estn
o puedan estar clasifi.cadas en dos categoras: 0 v 1, * y -, etc.
Podemos establecer hiptesis acerca de la mediana: sabemos cluc la mediana deja por encima de s el
nrisrno nrmero de valores que por derbajo. Considcrando c.re r- A'Ied > 0, darn signos positivos
(+) y - Med { 0 signos negativos (-), en la poblacirr original tendremos tantos (+) como (-). S"
tratar"ode ver hasta que punto el nrrlero de sigrios (+) esta dentro de Io que cabe esperar que ocurra
por azar si el valor propuesto cono mediana es verdaclerol
.

Teniendo en cuenta que se trabaja con dos clases de valores, Ios que estn por encima y los que estn
por debajo de la mediana, los estadsticos de contraste sigucn ura distribucin binomial Bin(n,0.5),
si se supone independencia y constancia c.e la plobabilidad el el lnuestreo, ya que la probabilidad de
qne Lur valor se encuentre por encirna (o por deba.jo) rle la urediarra es p : 0.5.
ILo

misr-no se puede decil lespecto a los cualtiles, qrrintrles o clecilcs

Captulo

284

9.

Pruebas cle Hiptesis lVo Pararntricas

Si X es la variable aleatoria que cuenta el nrmelo de ocur-rencias del signo menos frecuente; entonces.
su probabilidad se calcula por

Pr(X

k)

Cf,pk(I

-p)"-k,

:;,

:0,I,...,h.

Como nos interesa la ocurrencia de valores tan extrernos o ms extremos que el observado, la probabilidad deseada es Pr(X < k).

Observaciones

1.

Si al determinar los signos de las diferencias, obtenemos un valor cero, a ste no se lo considerar
momento de contabilizar el nmero de signos.

el

2.

Si n

<

30, se utiliza la ley binomial; en carnbio, si

la ley norm al Z

x-n

: --J \/n

30, se utiliza la aproximacin mediante

,A/(0, 1).

3.

Si se desea realizar un contraste para un percentil de orden 100qVo, distinto de la mediana,


carnbiar el valor d" p

A continuacin

-]

se

Ou el valor q correspondiente.

se exponen las pruebas bilateral

y unilateral sobre la mediana.

a) Prueba bilateral para la mediana.

1.
2.

Hiptesis NuIa. Ho:

3.

Estadstico de Praeba.

4.

Cri,teri,o

Qz: po.
Hiptesis Alternatiua. Ht Qz I

po.
k

d,e

pobs

: Pr(X < k) : Dc;o'G-p)n-'dondek<


,'
r:0
TL

Rechazo. 2po6, 1 a.

Ejemplo. En una prueba de aptitud tomada a

12 aspirantes a un puesto en Lrna empresa

se

obtuvieron los siguientes puntajes:

6.6 6.8 4,4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3

4.8.

Determine si la mediana de las notas es 5.

Soluc'in: Tenemos que

p0

5; entonces, si restanos a cada dato el valor de prueba, tenemos

1.6 1.8 - 0.6 2.3 3.5 - 0.5 r.7 1.0 - 1.6 4.7 0.3 _ 0.2.
Lasecuenciadesignos queseobtiene es + + - + +- + +
es ( ), que aparece 4 veces; de manera que la prueba es

1.
2.

Hi.ptesis

3.

Estadstico de Prueba. po6,

Hi,ptesis

-+ + -.

Elsignomenos frecuente

Nula. Hs: Q2:5.


Alternat'iua. H Q215.

Pr(X

<4):*"r,(;)'(;)"-'

0.194.

9.4. Pruebas sobre una sola muestra

4.
5.

285

Crzterto de Rechazo. 2pob" < 0.05.

Decisin. Como 2 x 0.194: 0.388 > 0.05, no se rechaza la hiptesis nula; por Io que
puede asumir que la mediana de las calificaciones es igual a 5.

se

b) Prueba unilateral para Ia mediana.

1.
2.

Hi,ptesis

l{u,la. Ho: Qz:

Hi,ptesi.s

Alternatiua.

Ht

tto.

Qz

,lo

o bien fl1: Qz
k

3.

Estad,sti,co d,e

Prueba.

pobs

: Pr(X < k) : t

t:0

4.

Cri,teri,o de Rechazo.

pobs

lto.

n
C!,,p'(I - p)'"-' donde k < =,2

a.

Ejernplo. En un campeonato de ftbol, en que participan muchos equipos se escogi

una

muestra de 11 equipos. EI nmero de puntos que acumularon estos equipos es el siguiente:

248912147721222426.
AI nivel de significacin del 10 %, probar que Ia mediana de los puntos acumulados por

los

equipos en el campeonato es menor a 22.

Soluczn: Tenemos eue o : 22; entonces hay B signos negativos, 2 positivos y un cero. Por
tanto, n: l0 y k :2; de manera que la prueba queda as:

1.
2.

Nula. Hs: Q2:22.


Hiptesis Alternatiua. H Q2 <
Hi,ptesi,s

22.
2

3. Estad,sttco d,e Prueba. pobs: Pr(X < 2) : tClop'(l -o10-r :0.0547.


r':0

4.
5.

Criterio de Rechazo.

pobs

<

0,1.

Deci,sin. Como 0,0547 < 0.1, se rechaza -FIs. La mediana es menor a 22.

9.4.2. Prueba de los rangos con

signos de Wilcoxon

Esta prueba, tambin conocida como contraste T de Wi,lcoron, se utiliza para comprobar que la
mediana es igual a un valor dado y para su aplicacin es necesario que los datos vengan dados en
escala ordinal o de intervalo. EI procedimielto es el siguiente:
Se determinan las diferencias entre cada uno de los valores observados y el valor hipottico de
la medianai d": r - po.

Si alguna de las diferencias es igual a cero, se elimina la observacin correspondiente. De esta


lrranera se reduce el tamao efectivo de la muestra a ?J el nrmero de diferencias no nulas.
Se ordenan los valores absolutos de las diferencias, de menor a mayor, asignando el rango 1 a la
rnenor diferencia absoluta, 2 a la siguiente diferencia rnenor, y as sucesivamente. Cuando las

diferencias son iguales, se asigna el rango promedio a los valores que son iguales.
Se obtienen,

(7+).

por separado, la suma de los rangos para las diferencias negativas

(T-) y positivas

Captulo

286

5.

Si

20 se

9.

Pruebas de Hiptesis lVo Pararntricas

utiliza la tabla de puntos porcentuales de la prueba de Wilcoxon (Tabla 6); si n > 20

se aprovecha q:ue

Z:

- .A/(0, 1).

n(n -r 1)(2n +

Entonces, el contraste queda as:

a) Prueba bilateral para la rnediana.

1.
2.
3.
4.

Hiptesis Nula. Hs:

Q2: ur.
Ht Qz I po.
de Prueba. Tobs : mn{T-,7+}.

I{iptesis Alternat,iua.
Estadstico
Regin

d,e

Rechazo. Tob" < T"/z(n).

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en una empresa


obtuvieron los siguientes puntajes:

6.6 6.8 4.4 7.3 E.5 4.5 6.7 6.0 3.4 9.1 5.3
Determine si la mediana de las notas es 5, para

Solucin: Para

,r

d: :x -

6.6

4.4

Ho

Rango

-0.6
+2.3

10

6.b

DI
-f o.
L,

11

4.5
6.7
6.0
3.4

-0.5
+r.7

+1.0

9.1
ID
U.J

+4.r

1,2

+0.3

4.8

-0.2

Rango -

6.5

n,
f .L)

Total

65

1.6

63.5

I4,5

es

IIzptesis Nula. Hs:

Q2:5.

Hipteszs Alternatzua. H1:

Q215.

Estad,stico de Prueba. Tobs: mn{14.5,63.5}

14.5.

Regi'n d'e Rechazo. En Ia tabla de los puntos porcentuales de este contraste se observa que

: l!.

La regin de rechazo es [" < 14.


Dect'si'n. Se cumple que 14 14.5; por lo tanto, no se rechaza
calificaciones es igual a 5.
Ts.s25(I2)

5.

a:5To.

+1.6
+1.8

6.8

1.
2.
3.
4'

4.8.

5, la asignacin de rangos se resurne en la siguiente tabla:

Valores

La prueba

se

b) Prueba unilateral para la mediana.

Ho. La mediana

de las

9.4. Pruebas sobre rura sola ntttestra

1.
2.
3.
4.

Qz: l-ro.
Hiptesis Alternatiua. H Qz ) plo o bien -[11 : Q2 I
Estadstico de Pruebo,. Tob" : mfu{T-, T+ }.

287

Hrptests Nula. Ho:

ls.

<7"(n).

Regin de Rechazo. Tobs

Ejemplo. En un campeonato

de firtbol los 11 ecluipos participantes acurnularon el siguiente

nirmero de puntos:

2, 4, 8, g, 12, 14, 77, 2r, 22, 24,


Al nivel de significacin del

10

26.

%, probar qne la nediana de los pu.ntos acumulados es menor a

22.

Sohtci,n: Pongamos

Fo:22 y calculenos
Valores

los valores de

d:iu-l-Lo
-20
-18
-14
-13
-10
-B

Rango -

2t

-5
-1

22

24

26

4
B

I
72
74
77

Con esto elementos, la prueba


Hiptesis Nu,la. Hs:

y de 7+:

Rango

10
q
B

7
6
5

2
J

Total

1.
2.
3.
4.
5.

T-

50

es:

Q2:

22.

Alternatiua. H7: Q2 <22.


Estadstzco de Prueba. Tobs: mn{50,5}
Hi,ptesi,s

S.

:15,

la regin es [," ( 15.


Deczs'n. Se rechaza 1g y deducirlos qr-re la uedia'a es menor a
Regin de Rechazo. Aqu, 7or(10)

22.

9.4.3. Prueba de Kolmogorov-Smirnov de ajuste a una ley de probabilidad


El rntodo de Kolmogorov-Suriruov
qr-re

es un proceclinriento utilizado para comprobar la hiptesis nula de


la nruestra procede de una poblacin que est distribuida segrn una ley de probabilidad especfica.

trl estadstico de prueba,

que se denota por Dorr, se define por

Dob": nx lF6(z)

S,,(")l

donde Fo@) y,S,.(r) son las probabilidades acumuladas esperadas y observadas, respectivarnente.

La prueba estadstica es la siguiente:

l.

Htptesr,s

NuIa.

116:

La poblacin

sigr.re

tura 4(p) dada.

Capitulo

288

2.

Hiptesis Alterno,tiutt.

3.
4.

Estadsti,co

d,e

HLa

Pruebas cle Hiptesis -AIo Paranttricas


poblacin rio siguc urra Ie!'4(p) clada.

Prrteba, Dub": uix lF(:r)

Regin de R,ech,azo. Dob,

Los valores de

9.

Dr(n)

,5,,(r)1.

> D"(n).

se encuentran tabnlados pua cliver-sos valor-es cle

ay

n.

(Tabla 7)

Ejemplos

1.

Tras jugar a los dados, nn apostador conrcnzci a sospechar qlle el casino haca trampa. Decidi.
por tanto, anotar las tiradas del dado corl cre.jugaba,, obteniendo la siguiente tabla:

Nmero
Frecuencia

.)

16

10

l6

11

32

15

puede afirmar que el dado es incorrecto'/

,Se

Solucin: Formemos la tabla de fiecuencias lelati'r.as acumulaclas, adjuntando las colunnas de


Ia probabilidad terica v de la difelencia:
rx

FYecuencia

absoluta (n)

Fl-ec. relativa
acurnulada (,9,,("i))
016
026

FYecuencia

relativa

(./;)

l6

16

0.

10

010
016

l6
1i

011

053

32

0.32

0.85

15

015

100

L)

0.42

Fo(ri)

lFo("r) -,9,.(zr)

0.1667
0.3333
0.5000
0.6667
0.8333
1.000

0.0067
0.0733
0.0800

0.1367
0.0167
0

La prueba de ajuste clueda de Ia siguiente nanera:

I.

Hiptesis NuIa. -I1: Los datos siguerr Llna Iey uniforme discleta coD p: If 6.

2. Hiptesi,s Alternat'iua. 111 : Los datos no sigucn una lcy nniforrne discreta con pt: !f g.
3. Estadstico de Prtteba. Ds : mx lF6(r) - S,,(r)l : 0.1362.
4. Regin de Rechazo. En Ia tabla del contrastc K-S encontramos que D6.65(100) :0.136.
define la regin de rechazo Dor,,,

5. Dectsit. Como Dob,) D,r(n),


)

Se

0.136.

se rcchaza 11

v concluimos clue el dado est

cargado.

En uua ellrpresa) el salario rnerisnal cle los t,raba.ja<lotcs se distribuye segn Ia siguiente tabla:
Desde

flasta

No. ernpleados

150

190

Comprobar si se puedc asegurar


valiable /(306,58).

190

230

l6

230
270

270

47

310

55

310

3510

3B

350

390

19

390

430

L4

430

470

c-re

el

srlr,r'ic,r

ureusul.l err clicha clnpresa puede considerarse LulI,

9,4, Pruebas sobr"e ura soJa rnuestra

289

Sohtcin: Completemos la tabl-L de frccucncirs relrtir'rs acurnuladas, calculando ias dos distribuciones (la muestral v Ia terica) , tcnicnclo en crreuta que para calcular F6(r) deberelros
utilizar la tabla de la lev nornal.
5,, (., )

(ri)

91

0.0205
0.1096
0.3219
0.6233

0.0241
0.1089
0.2976
0.5636

0.0036
0.0007
0.0243
0.0597

30

121

0.E288

0.8001

0.0287

390

I4

390

430

144

0.9247
0.9863

0.9348
0.9826

0.0101

430

470

14ti

1.00t)

0.9935

Desde

FIasta

No. empleados

150

190

r90

230

13

230

270

Jl-

270

310

44

350

310
350

,l

Iri

,J1

De manera que la prtteba

47

')
IJU

lFo(r)

es:

Hiptesis Nula. I{: Los sueldos sigucu rlua 1ey /(306,58).

2.

Hiptesis Alternatiua. f11: Los sttelclos uo siguen ttna ley /(306,58).

J.

Estadstico de Prueba. Dob": mx f 6(r)

4.

Regin

5. Dec,is,in.

,5,,(r)l

0.0592.

Rechazo. En la tabla encorrtrarnos clue D5(1

la regin es

Do6,u

S(")l

0.0037
0.0065

1.

d,e

> 0.1126.

46): +:0.1126;
,/ua

etltonces,

No se rechaza 11; consectrelte[rente. los sa]arios siguen 1a ley,A/(306,58).

9"4.4. Prueba de la aleatoriedad de la muestra


En mrchos estudios experimentales es necesalio corroccl si la.s mnestras obtenidas son aleatorias o.
por el contrario, si ellas mantienen algirn tipo de collelacin o si han sido alteradas. La prueba que
nos permite realizar esta identificacin tambin se colloce corno cotsf raste de rachas. Por extensiu.
ester prr-reba es indicada para probal la indepcndencia entre obserrraciones.

Definicin (de racha). Una racha es nna

sucesin

c1e vrloles

por cncima o por deba.jo de ia

mediana.

La longitud de una racha es el nmero de observaciones consecutivas que tienen esta propiedad.

Fol ejemplo, si las

observaciones son

6.6 6.8 4.4 7.3 E.5 4.5 6"7 6.0 3.4 9.1 5.3

4.8.

ia rnediana es Q2 :6.3, luego de representar por ( ) Ios valolcs infcriorcs a la rnediana y por (+) a los
Existen 8 rachas de longitudes
snperiores, obtenemos la secuencia: +, +. -, *, *, , +. , , *, .

2,7,2, r, r,2,

1,,2.

una sucesicin or-dcrracll <-le observaciones; nr v n eI nmero de obserr.aciones que estn por debajo v por encima cle lr nrecliana cle los datos, r'espectivamente. Con estos
elernentos e1 contraste queda de la siguiente irtattcta:
Scetn rn6" el nrmero de rachas en

l.

Hiptes'is

Nula. //: Las observaciones aprtcccrl do tnartt:ra aleatolia.

2.

H,iptesi.s

Alternatiua.

111

: Las obselrracioucs no al)are(ie)n cle rnartera aleatoria.

9.

Captulo

290

3.
1.

Estaclst'ico d,e Prttebo,.


Reqir tle Rech,o,zo.

Pruebas de Hiptesis lo Paranttricas

't'ob,s.

't'ol.s

1,,

(rrr,

rr) {) ?',,," )

r,,, (lrr. tr ).

Los'r,rlorcs cle compa,racin para, esta pmeba se errcrrentr'ur tatrrlados (Tablzr 5).

Ejemplo. En nna prueba

de aptitr-rd tomacla a 12 aspirautes a un puesto en una elnpresa sc oblnvielor

Ios siguientes punta.jes:

6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3
Determine si los datos aparecen de manera aleatoria, para

cy

4.8.

5To.

Solucin: La mediana de estos datos es 6.3. Si a cada nno de los datos Ie restamos la mediana, queclr
Ia siguiente secuencia de signos: f , *, , +, +, -. +, , , *, )
.

Entonces, el nmero de rachas es robs : B y rL

: n:

6.

1.

Hiptesis NuIa.

2.

Hr,ptesis

3.

Estadstico de Prueba.

4.

Regin de Recho,zo. En la tabla, verfros los valores crticos con

5.

Dectsin. Como robs :8 cae en la regin de aceptacin, podemos afirmar que los valores lpare(ieraleatoriamente.

,116:

Las observaciones aparecen de rnanera aleatoria.

Alternatiua.

111

: Las obselr'rciones

ro,s

ro

aparecen de rranera aleatoria.

8.

9.4,5. Prueba para identificar

cy

:\Tt

ro,"

10.

valores atpicos

Esta prueba permite identificar la presencia de r'rkrres extr-emos cn Lll conjunto de drtos. Par''
la deteccin de valores atpicos, en gelelal, se manejarr cliterios empr'icos; por ejempio, cllre Lu1r,
observacin est alejada una distancia dc nrs de 3 desviacioles estndar de ia media) pero esto:
criterios no tienen fundamento tcnico y descuidan la influcrcia del tamao de la muestra.
Este contraste detecta un valor atpico a la vcz y cada nno clebe letirarse de la rnuestra iterativrrnentchasta que no se dctecten ms valores atpicos. La prr.reba fue desarrollada por Gnrbbs2 y se basa en
ia suposicir qrle los datos sigrten de una lcy normai o qlre prreden ser aproximados razorrablcrncntc

pol

sta;i.

La prueba de hiptcsis es la siguiente:

1.

Hptesis Nula. 19: No hay valores zrtpicos en el conjr.rnto de clatos.

2.

Hiptesis Alterno,tiua. ,1t: Hay al menos un valor-a,tpico en el conjurto de datos.

3.

Est,odsti,co de

1.

Reqin de Recha,zo.

Pruela.

gobs

gobs

rnx{lz

- rl}

> G..(t).

Crrrlrbs, F E (1969), "Ploceclules for Deterctirrg Orrtlyirrg Obscrvatiorrs in Samples," Ter:h.rotnetrics, 11, 1-2i
'-{,.rnc.re ste es uu contraste pulamtlico, se lo inclu,'e en estc captulo polque no se lerliza soblc cl valor cle
narnLetr-o sino sobre una car-acter'stica gencral cle los clatos

ul

9.5. Pruebas sobre dos muestras

291

La tabla de puntos porcentuales para la prueba dc Grubbs se encuentra en el Apndice (Tabla 8).

Ejemplo. En una prueba

de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se obtuvieron

los sigrrientes puntajes:

6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3
Determine si existe algn dato atpico. Use a

4.8.

:504.

Solztc'in: El promedio y Ia desviacin estndar son


alejado del promedio es 9.1.

r:

6,717

.s

1.716

y el dato que est ms

Con estos elementos, Ia prueba queda as:

Nula.

No hay valores atpicos en el conjunto de datos.

1.

Hiptesi,s

2.

H'tptests Alternatzua. I11 : Hay al menos urr valor atpico en el conjunto de datos.

Estadstico de Prueba. gobs:

-EIs:

mx{lz

4.

7}

19.1
l-

- ''
- 6.1171
1.776

1.74.

Regi,ndeRechazo. EnlatabladelapuntosporcentualesseleequeG6.65(12):2.tylaregin
S gobs > 2.4I.

de rechazo
5.

Decis'in. Como 7.74

<

2.29, entonces r

9.1 no es un valor atpico; es decir, la muestra no

contiene valores atpicos.

9.5.

Pruebas sobre dos muestras

Las pruebas no paramtricas sobre dos muestras que examilaremos son anlogas a las paramtricas
para comparar dos medias; es decir, para datos emparejados y para muestras independientes. Tambin
se presentar una versin no paramtrica del coefi.ciente de correlacin.

9.5.1. Prueba de los signos para datos emparejados


Esta prueba se aplica cuando se tienen dos muestras relacionadas y se quiere probar la hiptesis de
que las dos poblaciones tienen medianas iguales, pero no se quieren realizar suposiciones acerca de Ia
normalidad de los datos. Los datos deben presentarse en al rnenos escala ordinal.
Sea (r1,y1), (rz,Az), ..., (rrr,gr,,) una muestra aleatoria de pares de observaciones; donde (r,A)
representa dos mediciones tomadas de la misma ulidad nuestral. antes y despus de un tratamiento o
fennrenoquelaafect. Seconstruyeunamllestradelasdiferenciasdl , c12,..., dr,,,donde d:r-A
(z : 1, 2,. . . ,n) y se aplica la prueba del signo para Lrna muestra; es decir, contamos el nmero de
observaciones negativas y positivas y determinanos cul es el signo que menos aparece y cuntas
veces Io hace (k). Adems, llamaremos Q, ala mediana de la poblacin X y Qy a la rnediana de la
poblacin Y. Con sto, las pruebas son las siguicntes:

a) Prueba bilateral para la diferencia de rnedianas.

1.
2.

H'rpteszs

Nula. Ho, Q":

Hi,ptesis Alternatiuo,.

Ht

Qu.

Q,

Captulo

292

9.

Pruebas de Hiptesis No Paramtricas


li;

3.

Pr(X < A) :

Estorlstzco d,e Pru"eba. ptbs:

C'|,p'(7

p)tl-l j clonde k <

l':0

4.

Crzterio de Rechazo. 2po6"

a.

b) Prueba unilateral para Ia diferencia de medianas.

1.
2.

Hi,ptesi,s
Hi,ptesi,s

l{tr,la. Ho, Qr: Qa.


Alternatiua. HI Q, > Qu o bieu

Hr Q, < Qa.
k

3.

Estadstico

4,

Cri,terio de Rechazo.

rl,e

Prueba,. pobs: Pr(X < k)

: t
r':0

C',,p'(l

p)'tL-r ) donde

<:.2

1 a.

pobs

aceptacin de un tipo de yogurt, se pidi a 8


voluntarios que calificaran a dos versioues (antigua y nueva) del producto. Las calificaciones v
sus diferencias se resumen en la tabla.

Ejemplo. En un estudio para determinar la

Individuo

Versin
antigua

Versin
nueva

r)

ct

-tr
t
-.)

-4

Diferencia

Signo de
la diferencia

-5
+
+

+1
+1

Verificar si hubo incremento en Ia calificacin al presentar la nueva versin.

Solucin: Tenernos qlre

1.
2.

Hi,ptesi,s

Nula. Hot Qr:

Hi,ptesi,s

Alternati,ua.

y k -- 2. Entonces, la prueba queda

as:

Qa.

Ht Q, < Qy.
k

3.
4.
5.

Estadsti,co

d"e

Prueba. pobs: Pr(X < 2) -- >,Cip'0


r':0

Criteri,o de Rechazo.

pobs

p)7-" :0.2266.

< 0.05.

0.0226 > 0.05 y se acepta 11s. No hubo cambio significativo


en la apreciacin de las dos versiones del producto.

Deciszn. Se tiene gue Pobs

Observacin. Tambin

la prueba de Wilcoxon a datos emparejados, mediante la


aplicacin de este contraste a la diferencia entle ios valores de las dos muestras. Se recomienda que
el lector formule esta prueba.
se puede aplicar

9.5.2. Prueba de Mann-Whitney para dos muestras independientes


La prueba U de Mann-Whitney se emplea para probar que dos rnuestras independientes provienen de
Ia misma poblacin o de poblaciones que siguen Ia nisrla ley de probabilidad.
Supongamos que se dispone de dos muestras inclependientes, X y Y, cuyas funciones de distribucin
sori F(r) y Fv(r), respectivamente. Diremos, tambin, que el tarnao de la muestra X es rn y que
e1 tarnao de la muestra Y es n. Entonces, pala realizar el contraste se realizan los siguientes pasos:

Pruebas sobre dos nruesras

293

1.

Sc corlbinarr las dos nruestlas en una sola.

2.

Se asignan rangos a la mucstra conbinrdr clc lrs dos mncstras. Si se prodr,rccn empates,
asignar el promedio de los rarlgos a las obselvaciolr:s cntpataclas.

Se snman los rangos de las dos rnlrestris

- nlrl-

(Jt

se crlcnlan los estadsticos

- !norrsos(.y) .

+{

4+! - !n"r'gos(y).

(J2:t11t.

Con estos elernentos, se realiza la siguiente ptueba

1.
2.
3.
4.

Hiptesi,s Nttl,a.
Hipteszs

: Fl,(")

Hs: F(r)

Alternatiua.

H Fy(r) I

Fy@)

Estctd,stico de Prueba. (Jobs: run{t/1, U2}.

Regin

d,e

Rechazo. Uot," 1Un(nt.rt).

Los valores de comparacin pala esta prueba se encnentlan tabulados (Tabla 10).

Ejemplo. EI dueo de nn ahlacn registr' lrs r.errtas scnranalcs de sus dos erlpleados y quier-e sabet'
si ellos pueden considerarse iguales como verrclcclores. En la siguiente tabla se numeran las'u,cntas cle
cada dependiente.
Empleado A
Ernpleado B
Solttc'in: Los rangos asigrrados

t97

191

188

185

180

1-rt

1/J

169

190

166

175

172

1b/

180

160

r lrs

169

lmestr'ls solr:

Empleado A

Ernpleado B

Rangos A

Rangos B

rg7

190

15

13

194

166

74

188

72

185

t75
t72

11

180

t6T

9.5

ti
J

r73

180

9.5

169

160

4.5

4.5

169

n:E

RLrngos

Rangos

77.5

42.5

Los cstadsticos U1 )' Ur son

(Jt :,,,,,*d!f4
Lrz

:s x z+Lf

: nttt4+! -IRo,,s-'s(B) :8 x -*+

Dc ruanela qrre ia pmeba creclir

1.
2.
3.
1.
5.

-fnu,,s-os(;r)

T7 b

:r4.5,

-42,b:41.5.

zrs:

lLr: lL)
Al,ter"no,tiuu. H q f

Hiptesis Nula. Ho'.


Hipte..sis

t,,2

Estr.d'stico de Pruebo^ UoL,s: mn{t/1 , ti2}


R.egirL d,e Reclo.zo. Par'r

14.5.

cL:0.01, [/ooL(8,7) :8; crtorrccs,

la,

regin cs [/o6"

8.

Deciszn. Corno 14.5> 8. se lcchaza 110: cs rlccir. los clos cnrrleaclos venclen iguales

canticl-rclcs

Captulo

9.

Pruebas de Hiptesis No Paranttricas

9.5.3. Prueba de correlacin de rangos de Spearman


El

coefi,ci,ente de correlaci,n de rangos ordenados de S'pearntan ftre el primer estadstico basado en


rangos que se desarroll. Se lo emplea para determinar la existencia de asociacin entre dos varilbles
de tipo ordinal.

Si disponernos de n parejas de obscrvaciones (r1, At), @2,y2), ,.., (",r,A") de dos variables X y Y
y asignamos rangos a la primeru (Rr.) y a la segunda courponent" (Ru) de las parejas, se define el
coeficiente de correlacin de Spearman como

cSr
-1L

r":1
donde

di:

Rro

R.0,, es

t:l

'

ttltP

1)'

la diferencia entre los raugos asiguados

El procedimiento para su clculo

a.T,

y yi.

es el siguiente:

1.

Se asignan rangos a las observac:iones clc las rrariables

2.

Si hubiera empates, se asigna el promedio de los rangos a los individuos empatados.

3.

Se determina el valor de d para cada

X y Y.

indir.iduo y aplique la frrnula de rr.

El coeficiente de correlacin de Spearman tiene una interpretacin similar al de Pearson:


Toma valores entre

-1 y *1.

Cuando el valor absoluto de este coeficiente e,! cclcuro a 1 inclica que hay asociacin entle las
dos variables.

"

Cttando el valor del coeficiente cs cercarro


las variables.

-r

ciero, inclica qrre hay poca o ninguna asociacin entre

La ventaja de este coeficiente es que no rec,rir:re rca,lizrr srrposicioues clc nolrnalidad.


E1 contraste correspondientc rl cocficicntc clc Spcar'n)ur cs:

1.

Hiptesis Nu"Ia. Hs:

2.

Hiptesis Alternatiua.

3.

Estadstico de Prttebn.

4.

R.egi,n d,e

Rechazo.

p:

l0

t'.s

r, > r'.r(n)

La tabla para realizar este contraste se errcnentrr en la Tabla

Ejemplo.

I dcl Apndice.

alulrnos en las materias de lgebra y Clculo. Las


calificaciones correspondientcs a cada uri(i se r1r en la, siguicntc tabla.
Se examin el regisblo de notrs de 10

Alumno
Algebra

I7

18

l9

72

OD

Clculo

2T

I4

27

18

20

I
i)

it)

6
.)2
.)<

10

26

31

aa

DO

39

,D
JJ

o(
34

.)L

9.6. Ejercicios

295

Verificar si existe asociacin entre las notas en las dos materias.


Soht"cin: Formemos Ia tabla de rangos y su difelencia:

Alurnno

Algebra

17

Clculo
2I

1B

Rangos

(R,,

Rangos C (Rr,)

Diferencia

L4

19

27

-L

12

IB

23

20

5.5

2
c
J

o
L

t)

o,
L

25

55

05

.)

-1

25

,)+

-z

26

32

31

r0

-1

10

39
tt

DD
r)r)

10

t^

r)

:2e.5
Do?
rl:l
Entonces, el coeficiente de correlacin

es
1A

c\-2
",/-*t
r-:7'

La prueba de hiptesis de nulidad de Ia correlacin

1.

Htptesis

Nula. Hs:

p:

6 x 29.5

:l
,i,l
tlQt-l)

1o(100

0.821.

Hiptesis Alternatiua.

rechazo es rs

5.

1)

CS:

H p l0
3. Estadstzco de Prueba. rs : 0.821.
4. Regin de Rechazo. En Ia tabla del corltraste
2.

0.648. La regin de

> 0.648.

Decisin. Se tiene que 0.821


de las dos materias.

9.6.

tenemos que r'6.65(10)

>

0.648 y se rechaza 11s. Entonces, hay asociacin entre las notas

Ejercicios

Pruebas sobre una sola muestra

1.

En una cornisara se registraron el lrmero de denuncias diarias por robos:

17 15 20 20 25 32 28 25 35 12 26

24

Utilice un nivel de significacin del 570 para pr-obal clue la nediana del nrmero de denuncias no
es nayor a 20 por da:

a) mediante la prueba de los signos;

Captulo

296

b)

9.

Pruebas cle Iliptesis -AIo Pan-anttricas

mcdianbe la prucbtr clo Wicoxou.

2. En un estudio

sobre las relDesas enviadas por los parientcs emigrantes a varias fanilias dio los
siguientes resultados (eu miles de dlares):

2.4 2.3 1..7 r.2 2.5 3.6 4.2 2.2 2.3


Con el empleo de o

3.

0.05, pruebe si la trediana de estas lemesas

a) rnediante la prueba

cle los signos;

b) mediante la pruebir

cle

es

3.1

diferente de 2700 dlares:

Wicoxon.

Para ingresar a Lula agencia balcaria se form una cola folmada por H (hornbres) y lVI (mu.jer:es),
que est formada as:

H \4 H N4 II H H N{ H H H N,f N4 H

Determine la aleatorieclrcl en la colfomracirr cie la cola.

4.

Un profesor registr el nirmero de estudiarrtes ausentes a sus clases durante 24das corrsecutivos.

38 31 32 27 28 30 26 33 36 30 28
32 29 35 3i 33 31 28 30 28 25 29

35
33

a) Estudie la aleatoliedad de la muestra con un nivel de significacin de 0.05;

b)

5.

Se puede asegurar clue

la mediana es igual a 27.

Un corredor de bolsa obscrr' Ia siguiente venta de bonos a lo largo de un ao:


Enero
Febrero

19

Julio

22

23
20

Agosto
Septiembre

24

N4arzo

Abril

17

Mayo

18

Junio

20

25

Octubre
Noviemble
Diciembre

28

30
27

a) Aplique una prueba de rachas para decidir si los datos pueden


b) Es posible afirmar que la mediana es igual a 23?
6.

considerarse aleatorios;

la clistr-ibucin cle la canticlad cle corr-eos clectrnicos que recibe el serviclor cle
uDa empresa durante ltu ilterralo de cinco ninntos. Pala 400 intervalos de cinco minutos se
contaron la cantidad dc mensajes recibidos y se obtr-rvierou las siguientes frecuencias:
Se desea ajustar

No. correos

,)

10

Frecuencia

11

47

76

68

74

46

39

15

Los datos pueden considelalse distribuidos con la distribucin de Poisson con


7

):

4.6?

Los siguientes datos collcspondcr a los tienipos clc clulacin (medidos en meses) de lmparas
malca Lucky:

3.33 6.71 2.53


a) Estudie

7:5

16.82 3.56 0.17 2.r5 3.51

si es razottablc suponer cLc los clalos colresponclen a

Lrnr

7.24.

distlibucin exponencia.l;

il
9.6. Ejercicios
b)

8.

Se puede suponer que

297

la mediana de la muestra es igual a cuatro?

Los siguientes datos corresponden a los tiempos de vida (en semanas) de colonias de bacterias
criadas en un laboratorio bajo condiciones estables de temperatura y humedad:

3.31 5.48 7.37 7.44 2.73 4.r9 3.18


En todas las pruebas use el nivel de significacin del

2.23.

10 %:

a) Estudie Ia aleatoriedad de la muestra;

b)

Es razonable suponer que los datos corresponden a una distribucin exponencial?;

c) Existe algn valor atpico

9.

Se registr el caudal promedio

en la muestra?

(en m3/s) que ingres a una central hidroelctrica durante

12

das consecutivos:

99.0 79,8 77.4 87.8 59.0 7r.0 5r.4 92.7 69"4 68.9 70.r
a) Es razonable suponer que los datos son aleatorios?;
b) Es razonable suponer que los datos tienen distribucin normal?;
c) N{ediante la prueba de Wilcoxon, determine si la media de la distribucin
d) Determine si existe algl valor atpico.

10.

Se tiene

la funcin densidad dada por

f(r) :{
r'\-/

t - l"l' si -

L 0,

(r(

90.2.

es 75m3/s;

1;

casocontrario.

Se dispone de una muestra de mediciones de esta variable aleatoria:

0.03 0.01 0.32 0.88 -0.4t

-0.18.

Utilizando las herramientas estadsticas adecuadas responda a las siguientes preguntas:

a)
b)

Es razonable suponer que la muestra es aleatoria?;

Es razonable suponer que Ia distribucin de la muestra corresponde a la densidad dada


anteriormente?;

c) Independientemente del resultado de !a parte anterior,


roviener C_e ,rrr

11.

se puede suponer que los datos

Cistribr:cln rentrada en 0?

Se dispone de una mquina para llenar latas con 10cm3 de aceite (las latas llenadas

al borde
tienen una capacidad de 11cm3). Un operario afirma haberla ajustado de modo que la cantidad
de aceite Uue envla el pico ae laalrina e.nvasadora es de (10+e)cm3, donde es una variable
aleatoria con la distribucin U I

-+,+1.

contenido de 12 ratas out",.'i",')

r"t*;-tl/"."::1J::':"

Para verificar la afirmacin anterior se estudi el

,,

0.098 0.068 -0.004 -0.026 -0.012 0.096 0.050 0.062 0.036 0.04

0.054.

a) Determine si la muestra es aleatoria;

b)

Es razonable suponer que la distribucin de la muest ra es

c) Si la distribucin

d.el

error

experimentales confirman

l,l

(-+,r1) "
la afirmacin anterior?
fuese

l,l (-*

,01)?'

error medio sera 0cm3. Los datos

298

Captulo

9.

Pruebas de Hiptesis

-Ao

Paranttricas

\2. llrr falric:urtc ilc frrsiblcs asegura que) colr una sobrecarga del 207a,los tiernpos dc r.ida dc sri.
fusibles (descle (lue se conectan con sobrccarga hasta que se funden) se clistribuyen unifornenerrtL

15 minutos. Para probar esta afirmacin Lrna mlrestra de B fusiblcs fue


sometida a Llna sobrecarga del 20%. Los tiempos en quc tarclaron en fundirse dichos fusibles
firerorr los siguientes:

cntrc 10 minntos

13,34 10.69 13.37 77.r4 13.87 13.75 10.76


a) Analice

b)

1a

12.63.

aleatoriedad de la muestra;

la distribucin de la muestra es U[10,15]?;


c) Si la distribucin de los tiempos de vida fr.rese U[10,15], el tiempo medio de vida sera
12.5 min. Los clatos experimentales confirman Ia afirmacin anterior'/
,Es razonable suponer que

cl'

13.

En una empresa operadora de tarjetas de crdito se est analizando el historial del ltimo an,,
de1 consumo mensual de un cliente. Se conoce que el promedio de sus conslrrrros es 645 dlares
y desviacin estndar de 148 dlares. Si se encontr' que este mes tuvo un consumo de 320t,
dlares, debe considerarse que el cliente tuvo un comportamiento atpico?

L4

La poblacin ecuatoriana adulta tiene una estatura promedio de 162 cm y desviacin estndal
de 7.5 cm. En una muestra de 25 personas) a partir de qu valores de la estatura podeno.
colsiderar que hay presencia de valores atpicos? (Use cr : 0.05).

Pruebas sobre dos muestras


15

En dos laboratorios se realizaron rnediciones del punto de ebullicin de nn compuesto de silicr,(en "C) de 8 muestras diferentes.

Muestra
Medic n1
Medic n2

99.78

99.17

100.06

100.14

99.43

100.60

100.59

99.98

100.16

100.09

99.91

100.36

99.77

101.09

99.93

100.06

Determine si los dos laboratorios entregan igr-rales resultados, usando a


1b

0.05.

un tratamiento reduce el peso de las personas. Mediante una muestra aleatoli.


se seleccionan 10 personas que siguieron dicho tratarniento durante todo el tiernpo exigido. E:
la siguiente tabla se presenta el peso de cada paciente, antes y despus del tratamiento (rnedid
en kg).
o
o
Persona
1
2
r)
4
10
5
6
7
B
n,
Antes
108
72
r04 69 /d
tl4 86 92 98
B1
Despus 95 76 69 B1
77
56 81
92
B1
97
Se presume que

Verifique si el tratamiento es efectivo. (Use o

I7

:5%)

tienen dos muestras, X y Y, independientes entre s, qne corresponden a mediciones de nivelede contaminacin sonora en las ciudades de Quito y Guayaquil. Se desea saber si arlbas ciudade=
Se

tienen similares niveles de contaminacin o si alguna de ellas presenta niveles significatir.'anert.


rnayores.

l8

70.1

70.4

74.3

74.1

75.8
75.4

76.9

67.5

68.4

67.4

69.3

70.5

I 70.1

I 75.7

77.4

7U.J

72.7

69.E

69.9

68.7

70.3

70.7

7t.7

Para caLcular la velocidad de clculo de dos computadoras A


operaciones. Los tiempos invertidos, en milisegundos, fueron:
A

110

r02

125
120

74r

113

IB2

135

7r4

775

y B, se

74.4

7^1

realizaron en arlbas

Analice si hay diferencias entre las localizaciones de las dos muestras. Use a:570.

9.6. Ejercicios

19.

299

Los siguientes datos son los tiempos de duracin (mcdidos en meses) de 10 lmparas marca

Luckv:

3.33 6"T1 2.bz r.rb 16.82 3.b6 0.r7 2.r5 3.b1 7.24.
muestra, independiente de Ia anterior, de los tiempos de duracin

Se dispone ahora de una nueva

de Imparas de marca Wizard:

5.60 3.03 7.46 r.6.52 0.37 0.58 3.38 9.15 0.90 4.44.
Implernente una prueba de cornparacin de rluestras para concluir si es razonable suponer que
las nuevas imparas tienen la misma duracin que las anteriores.

20.

Los siguientes datos corresponden a los tiernpos de vida (medidos en nanosegundos) de partculas

radioactivas emitidas por cierto material:

20.05 1.30 2.54 1.95 9.20 4.20 1.84 7.02 5.60

1.80.

Para un nivel de significacin del 10%, estudie:

la aleatoriedad de Ia muestra;
b) si es razonable suponer que los datos corresponden a nna ley de Pareto, caracterizada por
la siguiente funcin de distribucin:
a)

rr,--\
\:L): Ilt-! r
|. 0.
c)

si

r>l;

caso conl rario

la anterior correspondiente a los


tiempos de vida de partculas radioactivas emitidas por otro material:
Se dispone ahora de una nueva muestra independiente de

2.60 4.81 12.79 3.82 7.2r 1.68 15.50 12.03 r.70

9.40.

Realice una prueba de comparacin de rnuestras para concluir si es razonable o no suponer


que los nuevos datos tienen la misma distribucin que los anteriores.

2I.

Se tienen dos muestras independientes entre s, correspondientes a los tiempos de duracin (en
aos) de sistemas electrnicos de marcas distintas. Se desea saber si los equipos de arlbas marcas

tienen niveles similares de Curacin o si alg.,rna de ellas presenta una duracin significativamcntc
lnaYor.

Ir'Iuestra X
Muestra Y

2.00

0.67

0.20

r.73

0.58
0.30

Utiiizando un nivel de significacin del

r.46

0"28

0.43

r.02

0.02

0.05

7.57

1.46

0.96
0.14

0.32

0.60

10 %:

a) Aplique La prueba cie rachas a ias muestras para decidir si se pueden suponel aieatolias;
b) Aplique a ambas muestras las pruebas de siglros y de rangos signados de Wilcoxon para
decidir si los valores X^:0.69 y Yrn:A35 son vaLores aceptables para las medianas;
c) Pruebe si la mediana de la muestra X es mayor que Ia de la muestra Y.
22

En una investigacin de mercado se pidi a dos nios que calificaran a 10 juguetes en orden de
preferencia (de 1 a 10), obtenindose la siguiente tabla:

Juguete

Nio
Nio

10

}I

rJ

r0

tr

Determine si las calificaciones estn correlacionadas.

Capitulo

300
at

9.

Pruebas de Hiptesis -h[o Paranttricas

En un estudio sobre cor.ercio internacion.r1. sc orrlcnrron dc rnanerr decreciente a los principai,,socios comerciales sudanericanos de Ecurdor v Algcntina.

Socio
Ecuador

Col.

Per.

Bra.

Ven

,1

Argentina

chi.

Bo1.

Par.

(J

Calculc ei coeficiente de corleiaci<in rle Speannan v verifiqr-rc si hav asociacin entre Ias ordeu.crones.
24.

Las siguientes son las calificaciones obtcuidtrs por 11 jtir.erres cluc se soneticlon a evalllacion.
en destreza rnanual v memoria rrislrrl.

D. manual
M. visual

11

15

l8

l0

11

13

I4

16

j,J

31

39

5ti

45

43

16
an
t) I

R.ealice una prueba para determinar si existe correlacin errtre las calificaciones en las dos er'.--

luaciones.

25. Un grupo de irn,estigadores

desea er.alrlar si un nuevo equipo dc tratamiento aguas residual.


es efectivo para reducir Ios niveles de contaniracin de las agllas vertidas a rrn ro por 1.
curtiembres. A tales efectos se midi el nivel de contaminantes antcs v despns del tratarnient,Ios resultados fnelon los siguientes:

Planta
Antes
Despus

10

4.82

2.72

2.08

2.87

0.33

r.76

t)

1.52

2.92

4.44

4.24

3.64

303

0.80

096

t.72
2.7r

3.70

2.08

2.39

3.07

a) Detenliue si efcctivamcnte se lta proclnciclo


b) Las dos muestras estn cor-relacionadas?

rrna recluccin en los rrivcles cle contaminacic,:

Ca ptu

lo 1

Regnesin Linea N 5mple

Tod,os los 'modelos estrt, eryr:tuocodns, pe'ro o,lqun"os sot, ttiles

G. E. P. Box
Iuchas de las aplicaciones estadsticas requieren la estimacin de las relaciones existentes entre dos
' ms r'rriables; por ejcmplo, puede ser necesario responder a las preguntas cmo vara el prccio
:-,lomedio anual del ma2, segn la produccin a nivel nacional? o cmo vara el consunio de gasolina
le nn rulo. segn su peso y ia potencia del motor? trl inters se centra, entonces, en determinar una
.cnacin clue relacione Llna variable dada con nna o ms variables que contienen informacin sobre
.,i primera. A estos problemas dedicaremos los dos sigtr,ientes captulos; antes reviscmos algo de Ia
--istoria de esta parte dc la estadstica.

lio

exactitud, quin y cundo empez a tratar de expresar algebraicamente las rclaciones


dos o ms vanables, de las cuales solo se dispone de un conjunto de observaciones; pero eu los
-scritos de Leonardo da Vinci, cuando l trata de las proporciones del cuerpo humano, se encuentt'an
.:lpresiones aritmticas que relacionan las medidas de diversas partes del cuerpo.
se conoce) con

.ltre

-,-n

intento, que est bien documentado, data de 1755, cuando Boscovich y Christopher Maire estaban
-lcargados de medir la longitud del arco de meridiano qne pasa por Roma. Boscovich concibi nn
,todo para encontrar nn modelo que relacione los datos correspondientes a dos variablcs, mediante
., empleo de las llarnadas <<regresiones elementales>>. Esta tcnica fue mejorada por su autolen 1760
'' I.L-.esii.:l Lir.a crl,a iris csi,rticl.tir,j.e por Laplace) Linos alos ms tarCe.

rn

1805, Legendre public una obra de astronoma, en la que describi el mtodo de los mnirnos
radrados y 1o aplic ai ajuste de datos observacionales. Tarnbin, hay una serie de artculos pre.-ntados por C. F. Gauss a Ia Sociedad Real de Gotinga en los que describe el mtodo de mnimos
Ladrados. Luego, en 1885, Sir F. Galton present en la rer.'ista IYature el desarrollo complcto de esta
-=cnica. aplicada a lo que l denomin modelos de regresitz. A partir de esta fecha se mejor y se
-,mpiet la tcnica, haciendo que ella sea la de nayor erlpleo en el ajuste de coniuntos clc datos"
-

-,ctualilente, la construccin de modelos lineales es Ia base de todas las tcnicas estadsticas


rtriraleza predictiva y su aplicacin se ha extendido a prcticamente todas las ciencias.

de

10.1-" Vlodelos deterrlinistas y probabilsticos


I,tisten aplicaciones en las que se dispone de un modelo que presenta nna relacin exacta entre las
.riables cie inters; por ejemplo, 1a ley que desclibe el tieilpo que tarda en caer un objeto dcsde nnr,
301

Captulo 70. Regresin Lineal Simple


altura dada, o la frurula que nos indica el inters ganado por un capital, dados la tasa de inters y
periodo de la inversin. Tales modeios se denominan determ'intstas.

e1

Sin embargo, en la vida diaria, tara vez se presentan fenrnenos que reproducen con exactitud una Ie'.
ya sea porque existen errores en la medicin o porque hay otras variables que no son consideradas.
por stl escasa influencia, pero que son sufi.cientes para que el modelo propuesto no sea exacto.

Un modelo en el que una o ms variables es de naturaleza aleatoria se denomina probabi,lsti,co y


Ia determinacin y examen de la calidad del modelo encontrado se llama anIis's de regresr,ru

Figura 10.1: Modelos determinista y probabilstico.


Destaquemos algunas de las ms importantes aplicaciones del anlisis de regresin:

1.
2.
3.

Descripcin cuantitativa de las relaciones entre una variable dada y un conjunto de variables.

Interpolacin entre valores de una funcin.


Prediccin v pronstico de datos.

En lo que sigue, nuestro inters ser determinar una ecuacin clue relacione una variabie dada con otra
variable de respuesta, bajo el supuesto que ellas se vinculan mediante una ecuacin lineal de primer
grado, caso particular conocido como regres'in lineal si,mple.

LO.2. Modelo lineal simple


R,ecordemos que ia ecuacin de Ia recta

es

lJ: l3ol7fl,
donde

es

la intercepcin de Ia recta con el eje y y r es la pendiente de la recta. (Vase Figura

10.2)

Intercepcin

Pendiente:p,

-{

! = fro
Figtrra 10.2: Recta de ecuacin

?J

: 0o-l /tn.

70.2. Modelo lineal sirnple

303

Este rnodelo es determinista porque no considera el error y los valores de g se obtienen, de manera
exacta, al sustituir los valores de r en la ecuacin de Ia recta.
Cuando se desea incorporar al modelo determinista ei efecto aleatorio de las variables se le aade una
componente que corresponde al error y el modelo queda como

a: 0ot Ap I

(10.1)

e,

donde

es

la variable a ser modelada o uariable dependiente.

es

la variable que se Llsa como predictor de g o uariable independiente.

el componente aleatorio del error.

Bg ia ordenada del punto donde la recta interseca al eje y.


B1 la pendiente de la recta.

A Ia variable indepenciiente, tarnbin,

se Ie denomina pred'ictoru

y a Ia variable dependiente

se llarna

respuesta.

Para recoger el efecto aleatorio del error, harenos las siguientes hiptesis sobre e:

distribuye normalmente con media cero y varianza o2'. - A[(0,o21

1.

Se

2.

Los errores, correspondientes a dos observaciones distintas, son independientes entre s: E(e

e)

0.

Ejernplos de modelos de regresin que se presentan en la vida cotidiana son los siguientes:

Presupuesto de gastos
de un hogar

Nmero de miembros
del hogar

Precio de nn
departamento

Area de construccin

Crecirniento anual
de un .r1-.ol

trdad del rbol

Precio de un libro

Nmero de pginas
del libro

Efecto del nivel socioeconmico,


tenencia de la vivienda, servicios
que dispone, etc.
Efecto de la zona de ubicacin,
trpo cie acabados, piso en el que
se encuentra, etc.
Efecto de las variaciones climticas,
variedad del rbol, fertilizacin de
Ia tierra, etc.
Efecto del tipo de papel, la encuadernacin, nmero de ilustraciones, etc.

rn el anlisis de regresin

es necesario tener en cuenta los siguientes pasos que llevan a estimar un


'len modelo) que se ajuste a los datos:

Tener una visin clara de los objetivos del estudio, para determinar cul ha de ser Ia variable
respuesta y qu variables pueden incluirse como variables independientes.
Recopilar los datos correspondientes a las variables identificadas como dependiente e independientes.

304

Captulo 70. Regresin Lineal Sirnple

3.

Postular un modelo, al que se supone se a,justan los datos (en nuestro caso se presume que es Iineal simple).

4.

Determinar la ecuacin de regresin; es decir, estimar los coeficientes del modelo propuesto.

I
L,.

Comprobar estadsticamente la adecuacin del modelo. Esto incluye la realizacin de prueba..


estadsticas sobre los parrnetros, la ejecucin de transformaciones de las variables para obtene:
un mejor ajuste o retirar variables de nna ecuacin si su aporte no es signiflcativo en ia ecuacide prediccin.

6,

Cuando la ecuacin sea satisfactoria, usar el nodelo para efectuar estim.aciones o predicciones.

Una vez que se han curnplido los tres primcros pasos) nuestro objetivo ser estimar los coeficientes de
modelo y comprobar la adecuacin del modelo.

1-0.3. Mtodo de los mnimos cuadrados


Para estimar los coeficientes de la ecuacin de regresin se emplear el mtodo de los mn'imos cnadrodos, consistente en minimizar la suma de los cuadrados de los errores; esto es, que si se nota a l.
ecuacin de prediccin por

i :

bo

I btr,

(10.2

donde bo y h son los estimadores de B y B1, respecti-u'amerrte; ellos deben ser tales que la surla d
los cuadrados de las diferencias entre los valores observados de la variable respuesta y su estimacirpor la ecuacin de regresin sea mnima.

Figura 10.3: Interpretacin del mtodo de los mnimos cuadrados.


Si se dispone de n pares de observaciones de las variables independiente y dependiente
..., (rn;A"") y si fr son los valores de las predicciones de y:

0:

bo

(r1;yt), @z;yzl.

bp.

Entonces, los residuos de la prediccin (errores) se calculan por

e:

i.

Nosotros buscaremos los valores de y b1 eue minimicen la snma de los cuadrados cle los errores.
tarnbin llamada suma d,e los cuadrados de los res'idu,os:

scE

>,"::f,fun-\)2

: Llr, - (bo + lrr)12


i:7

305

70.3. Mtodo de los rnnitnos cuadrados


Dcrivando SCE con resPecto a b6 Y

b1

ecuaciones:
e igualando el resultado a cero se obtienen las

11

a6c E)

: -z\(ur - bo -

0bo

b1r)

:0,

i:r
TL

a6c E)

: -2|u.(s. .i,-1

0bt

bs

b1r)

Q,

clya solucin es
1a

D@ -',)(tt'

i-l

h:

TL

i",

;,1

Y)

gCru

(10.3)

SCr"'

r)

Llr - -rt )-

i:I

b6 :

,iurrclcn-:-j--t'g:

(10.4)

U-bti,

TL

Dv
i:7

sonlospromecliosclclos\aloresdelasvariablesinclependientey

17

?.1

,-Lr:penclietite.

queda establecidr
los sttstituye en Ia ecuacin; de esta manera
u na vcz obtenidos los valores de bs y b1 se
ia recta cle prediccin pol m'nimos cuadrados:

i:bo*b1r'
la incorporacin de elroles
de
se recotrriettcla el empleo de un nrrnero suficiente

Observacin. En Ia estimacin cle los parmetlos


ie lecloncleo en el clculo de

sc", t-

d'e

scrr;

se clebe tener presente

-ifrassigrrificativasalrealizarlosclculosdeforrrrarnanllai.
de los automviles v stl con'sulllo
Ejemplo. En un estudio pala determinar la relacin entre el peso
con los sigttientes resultados:
ie combustible se escogi .,r,,a rl].,estra de 10 caIlos,
Co"s.,mo (l/100 krn)

leterminar Ia ecuacin de regresin lineai simpie'


es
jolu,cin: prirlero, establezcamos que la variable independiente es el peso y la dependiente
, )l I ilLl

]llf)

rrlra tabla:
?ara simplificar los clculos, Iestl]nalnos los componentes eu

z: 996.1;
.L

'9

739

1187

655
729

-257.1

16

190.9

-341.1

-267.r

797 I

108.1
199.1

963 11 -33.1
802 12 - 194.1

1551
1650
Suma

:11.4.

i-r

8BB

?l

18

554.9

20

653.9

-3.4 66100.41
4.6 36 442.8r
-5.4 1t6349.2t
-4.4 71342.4r
-4.4 11 685.61
2.4 39 640.81
-0.4 1095.61
0.6 37 674.87
6.6 307 914.01
8.6 427 585.21
1 115 830.9

874.14
878.14
1841.94

rt75.24
475.64
477.84
1.3.24

116.46
3662.34
5623.54
14 905.6

el

Captulo 70. Regresin Lineal Simple


Sustituyendo los valores de las slrrrras en las frmulas (10.3) y (10.4):

,- :
bbo

sC,,
--*v

14 905.6

:f-).r-1131.
sc,.,- I 115 830.9
A -bt7 :11.4-0.0134 x 996.1 : -I.9477.

Entonces, la recta de ajr.rste por el mtodo de los mnimos cuadrados

es

0:-7.9477+0'0734r.
Ahora se puede, por ejemplo, predecir el consurno de un auto que pesa 1000 kg; esto es, z

i:

-7.9477 +0.0134 x 1000

1000:

Lt.45.

LO.4. Comprobacin de Ia adecuacin del rnodelo


Una vez que se halla una estimacin de la recta de regresin) es necesario determinar si 1 ss11gir-:obtenida es un buen rnodelo para los datos y cuantificar el elror que se cornete cuando se emplea t:.ecuacin. sto se logra mediante el empleo de los coeficientes d.e correlacin y de d.eterminacin, - .,
travs de la realizacin de pruebas estadsticas sobre los parmetros.

10.4.1. El coeficiente de correlacin


Recordemos que si se tienen dos variables aleatorias) una medida de Ia relacin que existe entre ell-.
es el coeficiente de correlacin p. Anlogamente, para determinar si existe una reLacin lineal entre le-
variables predictora y de respuesta se utiliza el coeficiente de correlaczn I'ineal de Pearson, denotad
por r, que se define por
11

L,rA-

nrA

El coeficiente de correlacin tiene las siguientes propiedadcs:

El rango de variacin de r est entre

Un valor de r cercano a cero indica que no existe o hay poca relacin (lineal) entre r y y.

Valores de

4.

Si r : I o r
deterninstico.

cercanos a 1 o a

- -1,

-1

-1 y 1, siendo su signo el mismo que el de br.

indican que existe una fuerte relacin entre Ias dos variables.

todos Ios valores caen exactarnente en la recta

En la Figura 10.4 se rnuestran diversos diagramas de la rclacin entre

se

tiene un model,-

y A, segrn los valores de r.

70.4. Cornprobacin de Ia adecttacin del rnodelo

f*e
*

A%\

307

. * \

*aa
*&- g

Be **s
'd"s

r r.;.ru1 7*

r = [1.7

: tgura 10.4: Diagratnas de dispersin de los datos y valores aproximados del coeficiente de correlacin.

:-empre debemos tener en cuenta que el coeficiente r solo aporta informacin cuando existe tura
-.-acin lineal entre las variables. Pudiera suceder que se tenga un valor de r cercano a 0 v, sin
.:.rbargo, haya una relacin no-lineal entre las variables.

Captulo 70. Regresin Lineal Sirnple

308

Como el coeficiente r es un estimador de p, se pueden efectuar pruebas sobre la significacin de


coeficiente de correlacin muestral.

Prueba de hiptesis sobre p

p:

1.
2.

Hipteszs

Nula. Hs:

Hiptesi,s

Alternatiua. H1: p 10.

3.

Estadstico de Prueba. tobs :

4.

Regi,n de Rechazo. Se rechaza I1s

Q.

rJn=2
JT

-7
si

tob"

1 -tolz(n - 2) o tob" ) t.2(n -

2)

Tarnbin, se pueden conducir pruebas unilaterales sobre p, pero ellas solo tienen un valor estadsticy su valor prctico es restringido.

Ejemplo (Continuacin). Para los datos del consumo de gasolina de los automviles: a) caicr-rla-el coeficiente de correlacin de Pearson; b) realizar una prueba para probar si p : 0 al nivel o=
significacin de 0.05.

Soluc'in: Los componentes de

a) trl coeficiente

son: ,SC""

de correlacin

1115 830.9, SCaa

es

$cw
Como

es

14 905.6

:0.94197.

muy cercano a 1, existe una fuerte relacin lineal entre las variables.

b) Para la prueba bilateral

1.
2.

Htptesis

3.

Estadsti,co

4.
5.

:224.4, $Cxu :14905.6.

Hi,ptesi,s

consideremos un nivel de significacin del

Nula. Hs: p: Q.
Alternatiua. HI p +
d,e

prueba.

tobs

5 %,

0.

:'F=
JT

-F

Q'9419n\n0
v/T

-?:

-@.s're

7.g4.

:2.306 y Ia regin es lr"1 > 2.306.


Decisin. Corno 7.94> 2.306, se rechaza llo; es decir, hay evidencia que indica que existcorrelacin entre el consumo de combustible y el peso del carro.
Regr,n de Rechazo. Tenemos que s.25(8)

LO.4.2. El coeficiente de deterrninacin


Otra medida de la relacin entre las variables es eI coeficiente de deterrn'inacin, 12. Su empleo st
debe a que da mayor frterza de interpretacin a la relacin entre las variables. Tenemos que
n

er1
DUay

:D@o i:).

y)2

:Dr? - ne2,
i:7

que se le conoce como surna de los cuadrados alrededor de la media de y o suma de cuadrados corregzd
de y.

Si denotamos por:

70.4. Contprobacin de la adecuacin del rnodelo


SCE -- D(ao
i:I

309

se denomina como sttma, de uro,drados de los erT'ores. Este trmino

fr)2, que

tambin se puede calcular mediante la relacin

SCE

i@o " SCR: i:r

2,se designa

SCr,

como

b1SC,y

: SCo,
W

suma tle los c'uo,dlrod,os d,ebid,o a la reqres'ir.

Se puede demostrar que

SCE + SCR,

SCro
l7

l,(uo
i:1

1L

-il'

fi:I

17

tvo -0)2 +L(9, -il2

i:1

Entonces, tenemos que

(5C,,,)2

^2

sc,, sclu

scua - scE
SC,,

: r- SCE
sc,
Tambin, se puede expresar como

' _-

^,

Interpretacin. El coeficiente

1.

scr, - scg _ scR

sciu -sc*

12 tor.ra valores entr-e 0

;,

y se puede interpretal de vrrias maneras:

total. Cuando SC E : 0, 12 : 1 y cutrndo SClt : 0,


Luego, 12 r"pte.er.ta la reduccin lclativa en la suma de ,SC, cuando se lia ajustaclcr
nna recta de regresin.
Como medida de reduccin el error

12 : 0

Por ejemplo, un valor de 12 -- 0.7 significa que el 70% de la variacin total es explicada por Ia
recra qrle ajrrsta los datos y el 30% restantc es atribnible al error de a.juste.

2.

Como rnedida de bondad de a.iuste. Clrando el ajuste


ajuste, 12

es perfecto, t-2

:I

y cuanclo no hery

0.

Cuanto rnayor sea el valor de 12, mejor ser el a.juste y mayor utilidad tendr corno instrumento
de prediccin.

3.

Como rnedida de la linealidad de los puntos. Cualdo 12 se aproxima a 1, el gr:ifico de los


datos se acerca a una lnea recta. Si la relacin entre dos variables no es lineal, 12 : 0.

Ejernplo (Continuacin). Para los datos dei consllmo de gasolina de los automviles, calcttlal
:oeficiente de determinacin.
Solu,c'itt,: Se tiene que

SCE

scau-W
25.287.

_ r-ta4 A

t,

14 905.6)2

1115830.9

el

310

Captulo

Regresir Lineal Simple

70.

De rnodo que
25.287

t'2:l-

224.4

0.8873.

Es decir. el 88.73 % de ia variabilidad de ios datos es recogida por la recta cle regresin

10.4.3. Estimacin de la variayrza de la regresin


Al ploponer el modelo probabilstico

a:00-lp.rlt
error aleatorio est distribuido segirn una ley normal de media cero y varianza o2.
Entonces, cada valor obseru'ado de g est influido por tal error. Aderns, a los errores asociados con
distintas observaciones se los considerar mutuamcnte inclepcndientes.

se estableci que el

La varianza o2 del error es desconocida y su estimador insesgado

es

SCE

r-2'
A s. que es la desviacin estndar de Ia regresin muestr-al, tarnbin

se

la denonina error est"nd,ar dt

estim.o,cin.

Ejemplo (Continuacin). Calcular Ia estimacin de o2 para los datos del conslrrno de combustible
de los carros.

Solucir: Anteriormente se obtuvo que ,SCE

,,:

's'

:25.287. De rnodo

E
1:
"
SC

25.287

10

:3

qr,re

161'

Auuque s2 se puede considerar una medida de 1a calidad cle ajr.rste, su principal utilidad se encuentL.
en la determinacin de la bondad de ajr-rste, ya sea mecliante un intervalo de conflar^za o con Lrnprueba dc hiptesis.

LO.4.4, Inferencias acerca de Ia pendiente de Ia recta, Pr


En primer lugar se desea estudiar si existe o no existe relacin entre las variables r y A. Se desecoutestar a la preguuta aporta r informacin pala predccir 17? Esta pregr-rnta se refiere a Br, pues
afirmar que y no se lelaciona linealmente con z equivale a decir que B, : 6.
Eutonces, se desea probar la hiptesis nula <<r no contribuye con ilformacin para predecir y>>; contr:^
la hiptesis altelnativa, <<las valiables estn rclacionadas de forrna lineal con una pendiente distint
de ccro>>; es decir,

Ho, 0t:0,

Hr 0tlo.
Para efectuar Ia prueba habr que encontrar

lr

distribucil de lnuestreo de

1,1 .

70.4. Cornprobacin de la adecuacin del rnodelo

,i

311

[,

Distribucin de muestreo de b1

1{,

Si los componentes del error son variables aleatorias independientes normalmente distribuidas con
nredia cero y varianza o2, la distribucin de muestreo del estimador b1 es norrnal con media B1 y
desviacin estndar

ubt

JSe;

sto quiere decir que b1 es un estimador insesgado para p1, pucs E(b1)
estndar de b1 puede estimarse pol

: 0t y que la desviacin

q,

"ut

\/ /.d7'-,
JV, ,.

donde s es el error estndar de la estimacin.


Entonces. la variable aleatoria

:b'- Sbr A' sigue una ley a (n-2)

grados de libertacl.

Prueba de hiptesis acerca de Ft

a) Prueba unilateral.

: g.
Hr 0t < 0 (o bien .11: , > 0).

1.
2.

Hi,ptesis

Nula. H6: B,

Hi,ptesi,s

Alternati,ua.

3.

Estad,st'ico d,e Prtteba.

4.

Regin de Rechazo. Se rechaza 116 si tob"

tobs:

--L
slt/Se

-,'

1-to(n-2)

(o bien

I -t,,lz(n -

2)

o6"

) Lo,(n-2) cuando 111:

r > o')

b) Plueba bilateral.

1.
2.
3.

Hzptesis

4.

Regi,n de Rechazo. Se rechaza

Nula. Hs: Br: g.


Hiptesr,s Alternat'iua. HI 0t

Estad,stico

d.e

Prueba. tobs:

0.

--L
sl\/Se;,'
,116

si

'tob,

Intervalo de confianza de 100(1 - o)% para


Lin intervalo de confianzapar'" Ia pendierite

0t,

'\tl'\ - 2)-+;
y - r^n(n
'JSC,
(0,

"

tobs

t.2(n

2).

p1

a nivel 100(1
b1

ct)7o es

t L.2(n
u/L\ - 2)-:-)
',r/sc,; )

Ejernplo (Continuacin). Para los datos del consumo de cornbustible de varios carros: a) probar
.i Br :0, a ttn nivel de significacin de 0.05; b) obtener el intervalo de confianza algSTo.
Solu,cin,: Antes se haba determinado los valores de s

"
a)

r/3J61

Realizaremos una prueba bilateral:

y de SCrr:

r.TTTS, sc",", :1

11b 830.g.

3I2

Captulo 70. Regresin Lineal Sirnple

1.
2.
3.

Hiptr:sis Nu,la. Hs: i3, : g.


Hzpte.sis Altuno,ti.t,a.. Ht: Br

l0.

0'0134
^j
- -:=1/se"., l.TTT\-1,rtr1r5i.yag : -7 9615'
I
4. Regin, tle Rechozo. Como tob" ) ioot(E) : 2.306 v la r-egin es lo,"1 > 2.306
5. Dectsi,n, Se lcchaza la hiptesis nnla.: es dccir, el consurno de combustible
Estodstico

d,r;

P,uelu,.

1,,b"

aument-

meclicla qlle se inclcrnrent-L el pcso de los carros.

b) trl intervalo cle confiarrzr


/rs\
(Lr - r"

es:

t't i i,, .{tt 2))

"rr, :t ,r-:

(.,.,,,,-r.30b-]j.I1::{l'(}13.lr.30+):(0.0095l0.0l73,).
\
vr11iE30.9
/rlr530.9/
L0.4.5. Inferencias

acerca de la intercepcin de Ia reca, p,

Sr.rpongarnos c.lc se clesei rr-crigrral si {)s r$ ual.


prucba rle hiptesis o colr un intervalo cie r:olfi A\Z
Se pttcrlc clentosl

rar qlre la

cLr-.svir<:irr

(l,o iloil Se;

ncra sirnilar

la rlescrita para

lJoo.

f{i.ptesis lfu"l.o,. Hs: Bs

3.

Este,d,.stir:o tle

4.

Hi,ptesis Alterno,ti,t:o,.

Ptuclt,t.

Regi,n r|,e Rech,azo.

S..

lo[,.,

sigrro rrrra clist'ribucin

I 0ou.
b iJao

rcclLr,za

con

rt

(n,

2) grados de libertad.

5C,,,
IL

\),,i
H si

t,,1,"

-Lr,

12(n.

2) o tub, )> to2(rt

lntervalo de confianza de 100(1 a)% para Bs

t.,,

[,-

i2(rt,

o\

Prueba de hiptesis acerca de o

1.
2.

p1

est i.rtclrl cle

O[.o:

El cstaclsti c,o l, -

1or cspecfico: ello se logra efectuando

2')

:lt!f ,,/:(n -

2).

70.5. Anlisis de la vartanza

313

Ejemplo (Continuacin). Para los datos del consurno de combustible de varios carros: a) probar
si

Bo:0,

a un nivel de significacin de 0.05; b) obtener el intervalo de confi.anza al957a.

Soluc't,n:

a)

Realizamos una prueba bilateral.

1.
2.
3.

Hi,ptesr,s
Hi,ptesi.s

B.: g.
Alternat'iua. HI Bs 10.

Nula. Ho:

Estadstico de Prueba.
n

SC,,

-L9477

4.
5.

Regin de Rechazo. La regin crtica es

Decisin. Como

|-

b) El intervalo de confianza

-, .rrr',-

1.1011

10

1.7779

11

lo6"1

>

1115830.9

11 037 983

o.oz(B)

-1.101.

:2.306.

< 2.306, no se rechaza Hs; es decir,

B6 pudieraser igual a cero.

es

t roul3l@)
r.rouL]Zg./ffi
:
v I 115830.9
x 1115830 9 -r.()J77/10

J10

(-6.025; 2.130).

10.5. Anlisis de la varianza


El procedimiento del

anIzsis de Ia ua,rianzc, (ANOVA) es una metodologa estadstica que permite


1a comparacin de dos o ms rnedias poblacionales midiendo la variacin dentro de las muestras.
En nuestro caso emplearemos el anlisis de la rraria\za para efectuar pruebas sobre los parmetros
estimados del modelo y as conocer su exactitud.

Anteriormente establecimos que se cumple Ia siguiente igualdad:

: Ljr, -0)' +\(0' - 2


i:\
i:I

l(ao -'
i:t

SC,o

(10.5)

SCE+SCR,

Significa que la suma de los cuadrados corregida es igual a la suma de cuadrados de los errores ms la
snrna de cuadrados debida a la regresin.

La suma de los cuadrados corregida tiene (n - 1) grados de libertad, Ia suma de cuadrados de los
errores tiene (n - 2) grados de libertad y Ia surna de cuadrados debida a la regresin tiene 1 grado de
libertad. Es decir, la igualdad correspondiente a los grados de libertad de la ecuacin (10.5) es

n-t:(n-2)+I

(10.6)

Captulo 70. Regresin Lineal Sirnple

314
De las ecnaciones (10.5)
a continuacin.

v (10.6) se tiene la tabla de anlisis de Ia varianza) como la que se presen:

Tabla de Anlisis de la Varianza


Grados de
Suma de
Cuadrado
litrertad (9.1.)
cuadrados (.9C)
medio (I[C)

Fuente de
variacin
R.egresin

SCR

AnCR.: SCRII

Elror o residi-rrl

r-2

SCE

Totirl corregido

n-I

s2: SCEI("-2)

SC

F
p,

Lobs-

,
D

uu

La colnmna dcl <<cuadrado rnedio> (htC) se obtiene al dividir cada una de las suma de ios cuadrad,,
entre sus correspondientes grados de libertad.

El valor de 4a" r-esu.lta de la divisin del cnadrado medio de la regresin para el cuadrado
AIC R
resld.rtal: tobo:
a
5'

med-

Una vez elaborada la tabla de anlisis de varianza, el valor de Fo" se emplea para conducir una pruet
de hiptesis sobre la razn de dos varianzas) qrre sirve para probar si r : 0. La prueba es Ia siguientt

l{tila. Ho: p, :

1.
2.

Hiptesis

3.

Estadsttco de Prueba.

4.

Regin de Rechazo. Se rechaza H6 si f ,,-

Hiptesi,s Alternat'iuo,.

g.

Ht

0t 10.

Fobs

ATCR

> 4,(1,

rr

- 2).

Ejernplo (Continuacin). Para

los datos del consumo de combustible de varios calros: a) realiza:


la tabla de anlisis de la varianza: b) probar si p, : 0, a nn nivel de significacin de 0.05.
Soltci,n,: Las sumas de los cuadrados colrespondientes son
SC,oo

a) La tabla

- 224,4, SC E : 25.287. SC R :

de anlisis de Ia varianza queda como sigue:


t-uente de
variacin

Tabla de Anlisis de la Varianza


Grados de
Suma de
Cuadrado
libertad (g.1.) cuadrados (,5C) medio (I[C)

Regresir'r

Error

'lotal corregido

b)

199.113.

1
8

199.113
25.287

199.113

F
62.99

3.1609

224.4

Realizamos la prueba de hiptesis:

1.
2.
3.
4.
5.

Nula. H6: Br: g.


Hiptesis Alternetiua. H p110.
Estadstico de Prueba. Fobs :62.99.
Htptes"ts

Regin de Rechazo. Corro Fo"

Foos(1,8)

:5.32, Ia regin es Foa" > 5.32.

Deczsi,n,. Se rechaza 1a hiptesis nula. Es nrs, por la magnitud del estadstico de prr-reba.
se declttce que el nivel de significacin del contraste es sumamente bajo.

70.6. Uso del ntodelo para estintacin y prediccin

10.6.

315

IJso del modelo para estimacin y prediccin

LIna vez que el modelo es satisfactorio habr que emplearlo para reafizar estimaciones y predicciones
que servirn para analizar el comportamiento de la variable respuesta ante condiciones que no fueron
probadas empricamente.

Previarnente establezcamos Ias diferencia entre intervalos de estimacin y de prediccin:

1.

2.

Un intervalo de estimacin se utiliza para estimar la media de Y, dado un valor de z; es decir,


estimar el valor lrro mediante un intervalo, cuando :[ : :x0. Un investigador puede desear
conocer el consumo medio, para un peso dado del auto.

Un intervalo de prediccin se utiiiza para estimar ur valor particular de Y, cuando n : ro;


es decir, estimar el valor Y0 mediante un intervalo de confianza. El investigador puede desear
conocer el consumo de un auto que tiene un peso dado.

Ntese que Ios valores de estimacin y de prediccin de Y son idnticos en los dos casos, la diferencia
radica en la precisin relativa de cada unar que se ven refleiadas en sus varianzas e intervalos de
confianza.

10.6.1. Intervalo de confianza para la estirnacin, E(Y), cuando X:

Xp

En el caso de la estimacin se trata de calcular

E(Yr): Bst Bp,p,


donde

r,

es el valor

particular de

para el cual se est haciendo Ia estimacin. El estimador

0p:
por tanto, las fuentes de error para estimar
La varianza

es

bo

E(f)

b1rp,

son b6

b1

("rr-;r2\
-2 -r(I,
ol:
o'(; - -ffi)

La varianza estimada correspondiente a f emplea s2 en lugar de o2 en la expresin anterior.


Lin intervalo de confianza aL100(1

(t

t.;2, -

2)s

- a)7o

para la estimacin, E(Yr), en el punto

(rp-r)2.-

;-E::!r+t^2(n-2)s

10.6.2. Intervalo de confianza para Ia prediccin, y, cuando


ln

x,

el caso de la prediccin el objetivo es calcular

Ap: l3ol l31ry,l

p,

Xp

es

es

31-6

Captulo 70. Regresin Lineal Simple

el valor pronosticado cuando

ro

es el

valor particular de

r.

EI estimador

es

0p:bo!b:rp,
pero las fuentes del error de prediccin son bo, b1 y

La varianza

t).

es

oL-st:o'(t+1+Q--u)'\
\' "' sc,, )
y en su estimacin se emplea

s2 en lugar de o2 en la expresin anterior.

EI intervalo de confianza de nivel 100(1

a)Tc para Ia prediccin) Ap) es:

Ejemplo (Continuacin). Para los datos del consumo de combustible de los carros, obtener
intervalos de estimacin y de prediccin para un carro cuyo peso es 1000 kg.

Solucin: Como se indic los valores estimado v pronosticado son los mismos:

ip
La varianza o?v

bo

b1r,

-7.9477 + 0.0134 x 1000

71.45.

es

3161(++

(1000

)
-

996.1)2

1 115 830.9

0.316.

es
"v la varianza o?
\u-a^.
)

r (r^-T)2\
"/
o'(t+;.ffi)
z.rct

(t+

EI intervalo de estimacin correspondiente

-1
1o-

(1ooo

- ee6'l )2\

1r1b830.e

):t'n"'

es

te
-\/ : (tt.+s- 2.306v6]16;r1.45+ 2.306/0i16)
:
El intervalo de prediccin
Ie

(10.lb;12.75).

es

(rr.+s

2s06\E.4TT ; 11.45 + z.zoe/z.+n)

(7.15; 15.75).

Comoseve,elintervalodeprediccinesmsanchoqtreeldeestinracin.<

Ic=

70.7. Formulacin rnatricial de Ia regresin lineal

3t7

Ia precaucin de no usar el modelo obtenido para estimar el valor medio de g o


predecir un valor particular de g, con valores de r que se encuentren fuera del rango de la variable
Se deber tener

independiente que sirvi para su elaboracin.


E1 modelo podra ajustarse perfectamente

a los datos recogidos para hallar la ecuacin, pero nada


garantiza que el mismo comportamiento se consiga fuera de tales lmites, pudiendo darse un ajuste
bastante malo. (Figura 10.5.)

-v

Recta de
minimos

t')Error

- \-

de

',-Jnrediccin

\
Relacin verdadera
entre y y

Lmites

de

Figura 10.5: Uso errado de un modelo para realizar predicciones fuera del rango de definicin de r.

7O.7. Formulacin matricial de la regresin lineal


Si se tiene n observaciones de las variables independiente
.' la ecuacin lineal que las relaciona es

y dependiente: (r1;at), (rz;Uz),

..., (*n;yn)

a:0olPple.
=ntonces, se tienen las siguientes igualdades:

at : B0 + Bp1+ e1,
az : BslBP2*e2,
:-:
An : 0o-1 0p,, le,.

x-

es

es Lrna rnatriz

un vector n x

p:

(10.7)

(i: )

de las observaciones.

n x 2 de los valores de Ia variable independiente, cuya primera columna tiene la


particularidad que todos sus componentes son iguales a 1.
es un vector 2

xI

de los parmetros de Ia ecuacin.

Captulo 70. Regresin Lineal Simple

318

es un vector

n x 1 de los errores aleatorios.

EI sistema de ecuaciones (10.7) es equivalente a la igualdad

Y:Xte.
Y si

se

nota como b al vector de los estimadores de Ios parmetros de regresin

u:f

/L

0o

\01

: Y-

),

9:

se tiene el sistema de estimacin de los parmetros

EI vector de errores es igual a e

Xb.

Xb.

Con ello se tienel

ete : (y-Xb)(y-Xb)
YY-2bxY+bxxb.
Derivando esta ltima igualdad respecto a b, e igualando el resultado a cero

\et e

ab

:-2xtY+2xxb:o'

cuyo resultado es el sistema de ecuaciones

xxb:

XY.

(10.:

Las matrices XX y XY son:


/n/tt\

XrX:l
Si la matriz XX

es

l"D,,ll)ao\
n
n
t'n
D"?
I\ t:l i:t

y:l

h-

t\ :lt,,a,

inversible, se llega a la ecuacin de estimacin de los parmetros

b:
La matriz (XX)-1

(xx)-1xY,

es

(XX;_l

/ n

\2

"l)*?-(D",)
i:r
\=l /
Con sto, Ios valores ajustados

se obtienen evaluando

9:
tEn

1o

Xb.

que sigue se emplear la notacin A para indicar 1a matriz o vector transpuesto de

70.7. Forrnulacin tnatricial de la regresin lineal

319

;. la ecuacin de prediccin de un valor gp correspondiente a un rralor zo dado es

-- xlrb,

Up

Con los
gresin

consnnro de combustible de varios carros) plantear la


contrar Ia ecuacin de regresin.

entes m

p-(;:) ,:(1)

)
, : / 1
x/x
(tin

t\

1187

1650

/
(
11 15830e

rxlxl-I :

/ t
(to

--,-x'Y:

/ to

-\
I

9961

ooor 11037983 )

037 983

-9961

( ttt
\ 128 461 )

1\

rc50

1187

As,

qxtx-1xty

b:
:

/ 11037983 -9961
11 158 309 \
-9961 10 )(

_t

." g - -1 906+0

Por ianto, ia ecuacin de regresin'

LO.7.l. Matriz de covarianza entre

-1.906 \

714
L2B 467

o.o34

):(

0134 r.

bo y br

Recordemos que
TL

Var(b1)

n2 \- -2

o2

TL

D@,

i.-1

")2

Var(b)

'i-1
,)L

nl(n
rl

r)2

2La diferencia en el valor del trmino independiente entle 1as formuiaciones algebraica y matricial, se debe al nrero
utilizados en el clculo de la formulacin algebrarca,

.le decimales

32O

Captulo 70. Regresin Lineal Sirnple

Adems, la covarianza entre b6

b1 es

Cov(bs, br)

Covl(!

-D
-ro'

lr'r), br] -

IL

D@

l.:l

Entonces. Ia matriz de varianza-covarianza del vector

- ")2

es
l

"2Dr?
L-

var(b,

: ( .J,1,1,j..1,, .i.",,0,1', :

-o
-no"

TL

't t,

r?
\

14

L\r - r)'

e\2
-'O

i:1

,i-7

_o

-ro'
t7

t
o-

rL

D@

i.-1.

-r)2

D@

i:I

-r)2

Si sacamos fuera de la matriz el factor o2, resulta que

Var(b)

: o'(X'X)-t

La varianza a2 se estima rnediante


2

i:

}\-_btX\.

-2

tO.7.2. Forrnulacin matricial del anlisis de la varianza


Con el empleo de la formulacin rnatricial dc los componentes de la regresin se puede poner las sumas
de los cuadrados como

SCE:

scR

YY-brxY,
/ n

b1x/Y

\2

lrv,)
t" /
n

,,

SCoo :

YtY -

\2
/
(Iu')
\r -l
'/

'rL

As. el coeficicnte de determinacin, en formulacin matricial, es igual

T-

sCro

Tarrrbin, se puede reconstruir Ia tabla de anlisis de la va,rianza en su forma matricial:

32t

7O.8. a)ansforrnacin de modelos no-Iineales a lineales

Anlisis de la Varianza
libertad

medio

(g.1.)

scR:bf xY -

n-2

; ( r,)

SCE:YfY-bXY

Total corregido

SCao

Ejemplo

(ll[C

Con los

IL

:"'t

- *

La

da

truir la tabla

de anlisis

de la vari

no de los t

Soluc'n:

YY

((t -l

(s

I,

Drn :

r14.

;_1

Entonces,

- !10 Q1q2: 199.11,

SCR : bx

l4gg.n

SCE : YY

4ggjr:2529,

SCro

: YrY

Ccrr tc.lo lo anterior, se tiene la.

z+

- fi@al 2 :224.4.

t
Tabla de anlisis de la varianza

Fuente de

Grados de

variacin

libertad (g.i.)

Regresin
Error
Total corregido

Suma de
cuadrados (SC)

199.11
25.29

Cuadrado

nedio (I4C)

199.11

F
62.99

3.16

224.40

Obviamente, la tabla coincide con Ia elaborada rnediante la formulacin algebraica.

10.8. Transformacin de modelos

no-lineales a lineales

En rnuchas ocasiones los modelos no lineales pueden ser tratados corno lineales si se efectan algunas
trattsformaciones a las variables, ya sea a la predictora, a la respuesta o a ambas.

Captulo 70. Regresin Lineal Sirnple

322

ernplear tales transformaciones se deber tener la precaucin de verificar que el modelo modificad
cr"rnple con la hiptesis sobre Ia distribucin que siguen los errores.

A.1

1. Modelo exponencial

(Figura 10.6.)

Figtrra 10.6: \'Iocielo erponerrcial g

EI m.odelo

"i3g+0'tr+e

es

'g

- gSoI0tt:+e

'

Tomarido logaritmos cn ambos rrrielrbros,

Ini/:3oilttIe.
Si poncmos z

?:

bo

* hr,

In;r7

qucda z

: Aoi 0fl *

2. Modelo recproco o inverso

e. cre es utt rnodelo lineal simple, que se estirna

(Figur-a 10.7.)

Figr.rra 10.7: \'Iodclo recproco

17

Ac)

El modelo recproco o iriverso

es
1
U

D)-.
Jg-f

l)1:t

Tonando los inversos en ambos micmbros.


1

Poniendo

l)
-ft uQ I.r... t t cJO

Ia ltima igualdad qr-rcda corno

a
-.)'1..-r':90iLll.t.

qlre es un modelo lineal usual.

-l

pp -l e

70.8. hansforrnacin de rnodelos no-Iineales a lineales

3, Modelo multiplicativo

o potencial (Figura

323

10.8.)

Figura 10.8: Modelo multiplicativo y

er,\.

El rrodelo multiplicativo, tambin conocido como potencial, es


Y

o,r\'

Tomando logaritmos en ambos miembros de la igualdad:

InY:lna*)lnr*lns'
Haciendo z

:lna, :

ln

r, 0o :lno y 0t : \,

el modelo se escribe como

z:Jo_3rt+t.
que se estima por ei modelo lineal

2:

bo

b.

Otros modelos no iineales comunmente utilizados son Ios siguientes:


4.

Logartmico. a: a* 01nr,

D.

Compuesto.

o.

Curva S. y - a-lg/t,

A: aB", qre se linealiza

Se recomienda que el

: lnr.
mediante Ing: lna*lnBr.

en el que se utiliza Ia transformacin

que se transforma en

lng

a,

I pt,

con

t: !.
T

lector realice las operaciones necesarias para linealizar estos modelos.

Ejemplo. En el desarrollo

de un algoritmo de computacin, para ser usado con una gran cantidad de


-rformacin, se desea conocer Ia relacin que existe entre el nmero de datos y el tiempo que emplea

',na computadora en entregar resultados. Para cada una de las distintas cantidades de datos, se
;icieron 10 mediciones del tiempo empleado y Iuego se calcul el tiempo promedio, segn se resumen

-l

Ia tabla:

No. de datos (millones)


Tiempo promedio (""S.)
ijustar

1.0

1.5

20

25

3.0

3.5

4.0

5.0

10

0.8

2.r

3.0

4.4

6.8

9.7

i3.6

22.3

40.3

72.4

los datos a un modelo multiplicativo.

icl,-tc'in: El modelo propuesto es de la forma A : c,r\.. Para transformarlo en uno lineal se deber
- mar logarit mos:

InY: lna * )lnr *

lne'

i- suponemos que se cumplen las hiptesis bsicas, que permiten tener un modelo de regresin lineal
.-.rple, entonces se tiene la siguiente ecuacin de prediccin lnf : lna * blnr.

Captulo 70. Regresin LineaI Simple

324

Por tanto, se deber reaTzar una regresin lineal de 1ny respecto a

lnr.

Tomando logaritmos en las dos variables:

lnr

0.0000

lna

0.223r

0.4055
0.4719

0.6931

0.9163

1.0986

1.2528

1.0986

r.48 16

1.9169

2.2727

1.3863
2.6101

1.6094

3.1046

2.0749
3.6964

2.3026
4.2822

Efectuando la regresin lineal propuesta resulta la ecuacin

Ini : -i'866 *
A continuacin, si tomamos antilogaritmos

en

1'956 in

r'

la igualdad obtenida, da como resultado:

-1"0

:
'u:

e 1,866+1 956ln z
e I 866e1 956In
0.829 21

e56.

Adems, se obtiene un coeficiente de determinacin muy alto, del 99 Y,t, para la ecuacin transformada.

A partir de la ecuacin

se podra proponer que e1 tiempo de ejecucin de1 algoritmo es proporcional


al cuadrado del nmero de datos: A:0.8312. Para verificarlo es necesario realizar las pruebas de
hiptesis sobre los parmetros. Esta tarea se deja a1 lector.

10.9. Ejercicios
Modelos lineales

1.

Se desea estudiar

la relacin entre la intensidad de regado (r) y

productividud (y) de un

1a

cierto cultivo. Se obtuvieron los siguientes resultados:


trL

10

13

l5

18

13

At

36

44

4B

63

70

45

Ajuste un modelo lineal simple y calcule el coeficiente de correlacin lineal entre las variables.
2.

un experimento pa,ra medir la velocidad del sonido en el aire a diferentes temperaturas.


Los resultados obtenidos se indican en la siguiente tabla:
Se realiz

Tcmperatura cn 'C (r)


Velocidad en m/s (y)

a) Estime la funcin

b)

Calcule

e1

2qo

tDt

tr.)J

r)r)tJ

de regresin lineal de g sobre

r.

20

.).f

50

346

tro
L

365

Interprtelos;

coeficiente de correLacin lineal entre las variables;

c) Pruebe si fr : 6'
d) Encuentre los intervalos
a

1.)
1L)

de estimacin

y de prediccin cuando

J.a

temperatura es 15'C.

Para detelminar Ia relacirr entre el nrmero cle vendedores y 1as ventas anuaies (en rniles de
dlares) que tiene una empresa, se obtuvieron los siguientes datos:
Ventas
Se postul que los datos se

ajustan a un modelo

20 27 33
1inea1 simple.

47

70.9. Ejercicios
a) Determine

b)
c)
d)

las estimaciones de los parmetros

325

0oy 0t y escriba el modelo de regresin;

Grafique los puntos y la recta de ajuste;


Construya la tabla de anlisis de la varianza y pruebe si Bt
Se ajustan bien los datos a la recta?

g'

En un estudio para describir la relacin entre la exposicin al ruido y la hipertensin se realizaron


ias siguientes mediciones:

a) Realice

r"rn

grfico de los datos

y diga si es recorrrendable ajustarlos a un modelo

lineal

simple;

b) Halle la ecuacin de regresin simple que ajusta los datos;


c) Realice un anlisis de varianza y pruebe la significacin del ajuste;
d) Halle el coeficiente de determinacin del modelo. Interprete su valor.
e) Hay alguna manera de simplificar el modelo?
En una investigacin de las propiedades de un pegamento de secado rpido se midi el tiernpo
que se demora en cristalizarse en funcin de la cantidad de pega depositada sobre uria superficie
de material cermico de prueba.
Cantidad (g)
Tiempo (seg)

a) Ajuste

26.2 27.9 29.4 30.5 31.0

34.3

los datos a un modelo lineal simple;

b) Realice un anlisis de varianza y pruebe la significacin del ajuste;


c) Construya los intervalos de confianza para los parmetros de regresin.
En una agencia bancaria se registr el nrmero de depsitos realizados y el monto total de estas
transacciones. en una hora de trabajo, con 1os siguientes resultados.

Monto total (en cientos de dlares)


Nmero de depsitos

10

1t)

7
,-)

l9
25

11

AD

l,)

a)

Realice Ia formulacin matricial del problema


prete ios coeficrentes;

b)

Calcule s y obtenga un intervalo de confianza, al 95 %, para los coeficientes de regresin;

y ajr-rste los datos a un modelo lineal. Inter-

c) Evale 12 e interprete su valor. Pruebe si p : g'


d) Realice una prediccin para cuando el nrmero de depsitos es 12;
e) Obtenga la tabla ANOVA y realice la prueba F' correspondiente.
En el mercado inmobiliario se realza el. avalo de una propiedad para luego efectuar su venta,
la diferencia constituye la ganancia del vendedor. En la tabla se dan los valores (en rniles de
dlares) de avalo y precio de venta de doce propiedades en Quito.

Avalo Venta

Avalo Venta

59.0

108.0

46.5
43.5
52.2
62.5
85.7

56.5
65.2

74.0
109.0

67.4
70.7
74.0
57.4

103.8

95.0
84.0
106.0
154.0

Captulo 70. Regresin Lineal Sirnp.le

326

a) Grafique las variabics en

un diagrania de dispersin;

b) Realice Ia formulacin rnatricial del problerna y encuentre los estimadores de los parrnetros
del modelo;
c)

Aporta el valor de avalo

informacin para conocer el precio de venta y?;

12. Amerit:r realizar una prueba de hiptesis para probar si p: [?'

d) Calcule

tur interr.alo dc confianza de 95 % par:a el precio rnedio de una propiedad con un


mil clcilares. Interprete el intervalo;

e) Obterrga

avalo de 72

f) Encuentre un intervalo de confi.anza al 95 % para el precio de venta de una propiedad


arraluada en 65 mil dlares. Interprete el intervalo.

8. El nna entidad

finarrciera se desea tenel nn mtodo que permita realizar pronsticos de las


ganancias obtenidas en base a inforrrracin cre pueda estar disponible de ulanera rpicla. trl
gerente de crdito plantea uu modelo qr-re relaciorra el lrrnero de prstamos realizados en Lln lres
v la ganancia obtcnida en el misrno perocio. Prr trl efecto recoge la siguiente informacin de
los 8 rltimos meses:
No. prstanos
Ganancia

L25

131

r42

127

140

121

136

133

44

54

77

35

BO

47

66

ti5

Los valores de las ganancias estn en cientos de dlares.

a) Encuentle la ecnacicln

de reglesiu linerl sirnplc que relaciona'el nrmero de prstamos y la

ganancia;
b) Es saiisfactorio el urodelo
c) Realice

obteniclo'l Por cr'/;

un anlisis de la varianza;

d) Haga una prediccin para

un nles en el clue se otorgaron 123 prstamos y constrrlya un


intervalo aI95% para tal prediccin;

e) Cree que

podra mejorarse el ntoclcio propuesto? 7,Cmo?

9. La siguiente tabla muestra la captr-rra

de anchoas (captnra, en millones cle toneladas mtricas)

v el precio de la harina de pescado (precio, en dlares por tonelada) para los rltimos 10 aos:
Ao

,)

i_)

10

Precic

190

160

134

129

172

239

542

245

454

410

Captura

(.,1

E,53

982

10.26

8.96

4.45

1.78

D'
t).r)

08

05

Construlra ios rnodelos lineales que lelacionen las variables ("


a)

- y) e interprete los coeficientes:

Precio 1' ao;

b) Captura
c) Precio

ario;

y captura;

Con el modelo que tenga 1a mxima correlacin:


d) Realice la tabla ANfOVA e interprtcla;
e)

Construya los interr.aios de confiallza para los coeficientes de regresin;

f) Realice la estimrcin de y

cnrndo

r:

5.5.

70.9. Ejercicios
_1.

327

Los siguientes datos corresponden al ritmo cardiaco en reposo (Y) v el peso

(X, en kg) de 6

personas.
90
86

62
45

67

40

89

55

81

64
53

75

Dr:

Dr?

Dg:319'

488,

40092, Drnan : 26784, Dy? :17

399.

a) Grafique los datos y examine si parece que hay una relacin lineal entre las dos variables;
b) Calcule los estimadores de los parmetros de regresin;
c) Obtenga la estimacin por intervalo de Ia media cuando r : 88, al nivel 95 %;
d) Obtenga el intervalo de prediccin de Ia media cuando z : 88, al nivel g5 %;
e) Calcule los coeficientes de determinacin y de correlacin entre las dos variables.
En un laboratorio de prueba de automviles se mide la distancia de frenado en relacin ctrn la
velocidad que lleva el auto, dando los siguientes resultados de 20 observa,ciones.

7: 50,
a

:30,

rL

D@n -z)2

i:7

rL

D(ao
i:7

1600, D@n -r)(y

e)

800,

- 2 :832.

a) Calcule Ia ecuacin de ajuste para el modelo de regresin lineal simple;


b) Realice una tabla de anlisis de la varianza;
c) Determine los intervalos de confianza de la estirnacin y de la prediccin al 95%o, para
valor de Ia distancia de frenado, cuando la velocidad es ro : 69.

el

Se realiz un estudio para determinar el efectc que tiene la temperatura (r) sobre la crntitlad
de gas residual generado (y)
un proceso qumico. Se analizaron 12 unidades nrnt:stlales y se

"r.
midieron las siguientes cantidades.

n:12,

72

Dr?

i:l

a) Encuentre la ecuacin

r:7.5,
y:55.7,
12
42s0, Da? :279360, Droao: -23707.5.
i:r
i:7
72

de regresin lineal que explica la cantidad de gas por Ia ternperatura

del proceso;

b)

Calcule el coefi,ciente de determinacin;

c)

Realice un anlisis de varianza. Interprtelo.

Uua teora financiera sostiene que hay uua relacin directa entre el riesgo de una inversil y el
rendimiento que promete. El riesgo de una accin se mide por su valor, Ilamado p. En Ia tabla
se muestran los rendimientos y valores de 12 acciones:

Rendimiento
Valor Beta

1.5

89

.)

1.9

1.0

15
05

,) /
15

82
18

53
13

05
-0.5

13
05

59

IB

68
19

72
19

328

Captulo 70. Regresin Litteal Simple


Al

a.justar un modelo de regr-esin a cstos clrtos. se obtuvo las siguientes salidas:

Predictor

Coef.

Error Est.

toh"

Intercepciiru
Pendientc

0.44

0.r22

3.62

0 L9

0.022

8.56

Fuente de variacin
R

g.l. SC MC F

cgrcsirt

Residrrrl
Total

11

0.439
3.649

a) Pruebe si los coefi.cientes del ruocleio son siguificativos. Escriba


sus valores y las regiones de rechazo;

b)
c)

14.

las pruebas .r, liruls

Complete la tabla ANOVA e intcrpr'tela;


Calcule cl coeficielte de deterniinrciri e irrterprtelo.

Suponga qlre se ha ajustado trna lnea r(x'ta a uu conjunto de 9 pare.jas de observaciones, dand,
a-

x |l- -r '.L'

lJ -

Adems, se obtnrrieron las siguientcs clcsr.iaciorres: (r;,


tabla de anlisis de la valianza:

- r): -4, -3, -2, -1, 0, I,2,3,

variacin g.l. SC IIC

Fuente de

4 5"-

Rcgtt'sititt
R cs it

lrrtl

3il0

Totrl

a) Complete ia tabla AI{OVA;


b) R.ealicc rlna prueba cle adccuacin del modelo.
Modelos no lineales
15

A continuacin

sc presentan 7 mediciories dc clos variables


:L

05
06

10
27

15

20

25

3.0

3.5

12.2

54.6

244.7

1096.6

4914.8

Encuentre 1a ecuacirr de regresin cluc a.justa los datos, segn un modelo exponencial y calcul.
el coeficiente de determinacin.

16. En la siguiente tabla se encuerrtra el nrnrero de aos para el vencimiento y el rendimiento d=


unos bonos.

Aos para el vencimiento


Rendimiento
a)

l0

15

1B

23

25

0.067

0.072

0.076

0.079

0.081

0.077

0.082

0.07E

Ajustc un modelo rnultiplicativo a los datos;

b) Ajrrsle un tnoclelo

j :_uu
l,n r
-\t t.

c) ,Cul de los dos modelos cree cs

mcjor? Por

qu?

70.9. Ejercicios

17. Un ingeniero

est investigando la relacin eritrc


generada. Luego de 10 nediciones obtttr.o:

Velocidad del viento


Corriente generada

a) Ajuste

b)
18.

ti0

60

.)

l.58

t82

1.06

los datos a un modclo de

329
clcl r.iento y la cantidad de electridad

lr veloc:irl'rd

61

10.0

97

96

3.1

B2

6.2

1.93

2.24

2.39

2.29

0.56

2.17

1.87

/1

tipo lt -lr:

/r

+';r (.

t-t

Calcule e interprete el coeficiente de deter-miuacin del modelo transformado.

la evoluci<iu

El gerente de una

ernpresa desea lelacional


segrn los datos que aparecen en el cuadro:

Ventas (9)
Gasto (z)

L(l

15

18

i9

22

4),

de Ias ventas

o.)

.a

25

72

9B

y el gasto publicitario,

a) Realice un ajuste de tipo rlultiplicativo y encuentre la calidad del ajuste;

b) Ajuste
c)
19

los datos mediante urra funcirr lirreal sinrle y compare con el ajuste anterior;

Cul de los dos modelos es mejor? Expliquc.

Considrese los datos que se presentan a corrtiuurc:il


f

a) Grafique

b)

T4

77

i1

10

0.34

0.26

0.18

0.30

0.40

0.27

0.48

0.42

los datos;

Suponga que las variables r,

yy

se vinculan mediante

la relacin y :

cuentre los coeficientes de regresin.

c) El modelo es adecuado para


20

A continuacin

los datos'/ Por:

Ps 1- {3rr

En-

c1u'/

se presenta la evoluciri anual clcl srlario mnirno

vital en nn

pas con alto ndice

de inflacin.

Ao
S.M.V.

a) Grafique

b) Ajuste

l0

11

I2

66

95

720

r20

I45

190

220

320

320

400

600

600

los datos;

los datos mediante un modelo cxponencial;

c) Qu se puede ciecir de la calidad de a.jrrstc de 1os datos a la cnrva de regresin?;


d) Realice una estimacin del valor del S.N'f .V. en julio de 1994;
e) Si el S.M.V. en el ao 13 ascendi a 900,
21.

.es

bueua la predicciu r-ealizada'? Explique.

En astronoma se denomina ao sideral al niulero de arios tcrrestrcs qlre un plancta se demora


en completar nna revolucin alrededor del Sol y rlepencle de la distancia entre Ios dos astros.
En ia tabia se muestra la distancia promeclio ;' el arlo sideral para los planetas del Sistema
Solar. Emplear los datos para detelninal nrr modelo de legr-esin que relacione las dos variables,

Captulo 70. Regresin Lineal Sirnple

330

tomando com.o variable dependiente al rrio sideral. (Pala lealizar la transformacin adecuadr
refirase a la tercera ley de Kepler).

Praneta

r,.t*fililli"Tl",

Mercurio
Venus

Tierra
Marte
Jpiter
Saturno
Urano
Neptuno
Plutn

22.

Duracin del ao sideral


(7: aos terrestres)
0.24r

58
108

0.615

150

1.000
1.880

228
778

11.862

7428

29.458
84.018
764.780

2877
4500
5913

248.400

Los siguientes datos corresponden al precio de venta (en cientos de dlares) de un modelo de
automvil, segn los aos de uso

Aos de uso
Precio

r0.2

B3

69

5.5

4.0

3.5

3.3

Ajuste a los datos un modelo recproco y calcule el coeficiente de deterrninacin.


23

IJna empresa de telefona celular ha registrado la siguiente evolucin en el nmero de abonados


a su servicio en sus primeros 8 aos de operacin:

Ao

Abonados

32 000

37 500

41 000

58 000

107 000

6
7

138 000
175 000

321 500

a) Grafique los datos;


b) Se plante que el modelo lineal simple. Realice Ia estimacin de los coeficientes;
c) Qu se puede decir de la calidad de ajuste de los datos?,
d) Efectue las pruebas de hiptesis sobre los coeficientes del rnodelo. Si es posible excluir
alguno de ellos, cmo quedara el nodelo finai?;
e) Los datos sugieren una relacin del tipo exponencial, Realice un ajuste de los datos al
modelo propuesto;

f)

Encuentre el coeficiente de determinacin y comprelo con el del rnodelo anterior. Cul


es mejor? Por qu?

Captulo 11
Regresin Mltiple

lf

The Ballade of Multiple Regression


you want to deal best with your questions,
Use rnulti-regression technicres;
A computer can do in a minute
What, otherwise done, would take weeks.
For'predictor selection' procedures
Will pick just ones best for you

And provide the best-fitting equation


For the data you've fitted it to.

Tom Corlett, 1963

En el captulo anterior estudiamos el caso en el cual la variable de respuesta g depende de una sola
i-ariable predictora z, estableciendo el modelo de regresin lineal simple. Pero, podra suceder que
este modelo sea insuficiente y que sea necesario incorporar nlle\as variables explicativas del fenmeno
rnvestigado.

-\nalicemos el siguiente caso: el gerente de una empresa desea incrementar las ventas, para lo cual
lecide realizar gastos en publicidad y medir la variacin ell slrs ventas, Inicialmente, decide poner
rublicidad en televisin, pero posteriormente decidc tambin ponerla en la radio y los peridicos.

En la primera etapa la variable de respuesta, qlle es el incremento en las ventas, depende de una
.ola variable predictora (los gastos en televisin) y para realizar un anlisis es suficiente ernplear un
:lodelo de regresin lineal simple. Mas en la segunda etapa, la variable de respuesta depende de
--arias variables predictoras (los gastos en televisin, radio y prensa), consecuentemente para realizar
'rn anlisis ya no es suficiente la regresin lineal simpl.e.
Fu general, aunque hay rnuchos problemas prcticos clue ataen a variables predictoras rnicas, es
--tucho ms frecuente que la variable respuesta dependa de un conjunto de variables predictoras o de
:ausfolrnaciones de las mismas. De la estimacin de tales modelos y de su calidad de ajuste nos
cnparemos en el presente captulo.
331

Captulo 77. Regr"esin Mltiple

332

11.1. Modelo de regresin mItiple


Definicin (de modelo de regresin lineal rnItiple) El

urodelo dc regresin cre liga a una


valiable dependiente y con k variablcs indeperrrlientes urecliante la ecuacin

g:[Jo*,1111 li'Jttt +"'+i'ir'*e


se llama modelo de regresin lineal

Los parmetros 3, j

(11.i)

nrltiple corr A; variables reglesoras.

:0,1,..., k se denominau ctleficit:trtcs

de regr-esil'

Al igual qlre en cl caso de una sola varirblc. se cor.sidera qr-le cl crror s tiene esperanza igual a cero v
rrarianza a2 y qne los errores ei) col-respondientcrs a cacli obserr'tcin. son no correlacionados.
Un modelo plausible para el ejentplo exatlinaclo
lJ

clonde

do -F,6111

cs

-l /zt:z | $3t:;11 e.

y denota el incremento en las ventas. u1 los gastos en tclevisin) 12 los gastos crr radio y z

Ios gastos en prensa. Los coefi,cientes p6, 0t, A' 1'.83 son parnctros que defineu cL moclelo, eLlos son
desconocidos y el problema inicial es detcrminat estos croeficicntcs'

La ccuacin (11.1), geomtricanrente lepresenta un hipcrplano cn un cspacio de k dirnensiortes. El


c:oeficicnte lj 0 : 0, 1, . . . , k) evidencia la r.arircirin rrnitaria dc la respttesta y cuando vi , v las
restantes variables permanecen constantes.

Nlediante la tcnica de regresin Lineal mrltiple sc puccle rnalizar uua serie de modelos particulares
como el polinonial de ttna'r'ariable

o de dos o ms variables: por cjcrnplo. cl dc scgrrnclo grnclo con clos r.ariables


1t

0o

t \pt I

\zt,

lSzrll

i+r3*

B5rp2

e.

Otros nodelos nis complejos pr-reden rcclucilse a rrn rrroclelo clc regresin linerl mrltiple necliaute
cambios de variable adecuados.

1L.2. Estimacin de los parrnetros


Al

igr-ral que en el mtodo de regresin

lincal simple, para

ler

estinracin de los parmetros se aplica el

mtodo de mnimos cuadrados.


Snponga que disponemos de n ) k obscr'\'aciones. 1' si se cletrota como r al valor de la i-sima
obser-r'acin de la variable rj, como se obsclva cll la siguiente tabla:

:2
9 t:t
'!jt r rr :L 12
A2 r2t- :t:22
;,,

't'n t

't t,2

2rA

u 1A

r2k

77.2. Estimacin de los parntetros


Si

333

es la prediccin de y, la ecuacin de regrcsirr <rcclrr c:orncr

i:

bo

b1r7

i' " *

b2:rl2

bt:..

(11.2)

donde bo , br , , . . , b* son tales que la sttrna cle los cuach-rclos cle lrs difcrerrcias entre los valores observados
cle la r,ariable respuesta y su estirlacil por la ecuaciu cle r-cgresirr sea mnima.

Esclibarnos la igualdad (11.2) para cada urra de las clbsen'ac:iorrcs:

: bsIblr !1ry:t:121... lbr.


0z : bo i btt:zt I b'2:r22 l "' *lL.:t:2'+

bo+br",,r Ib2r',,.2+'

,,,:

bk'r,,,k',

o en forma abreviada
c

i:
Se

bo

i,:l.).....n.

+\brti,,
j:t

minimizar la surna de los cuadrados de los errores

scE

:irr, - i)2
i:I

:i

1,,

Derivarrdo SCE con respecto a cada

b,

(-. ,,',,)]'

e igual.auclo el resultado a cjero se obtienen las ecuaciones


tt

a(scE)

k:

-z\(ui-

0bo

bo

i-t
rA

o(scE)

-I

o,

i-l

-2Drs(y-

0bt

brr;;r)

bo

i:l

- lbiri) :

0,

t-I
li

a6c E)

-A^
-2D:,ik,(u,i. -00i-l

0b*

\-i..-.\-n
) ojxij):v.
j-1

Ltrego de simplificar las igualdades, se obtiene \as ecu,a,ci,oncs norma,l,es de rnnimos cuadrados:

nbo*r rttbzi,r,rr+"'+
i:l
17

boDr,, -

bt-.J

i:1
TL

ri:1
tL

TL

rl,r + b2f
t,rr',, '/-J

.'

* bu I ).ir:xik

1'

uoi,nr a ot f rkLta ar I rit t-i2+ "'


i:I

ooir,r : ir,
'i-).

i-I

i-

: D',rro

1L

+ b*D,r?r
i:\

TL

D*orro'
i-1

Entonces, se dispone de uu sistema de k * 1 ecuaciones normales quc invoh-rcran a los coeficientes desconocidos. Su solucin permite conocel los estimaclorcs cle los parrnetlos del modelo lineal mrltiple.
alrnque debe observarse que tal tarea. en general, suele sel rrruy laboliosa.

Captulo 77. Regresin Mltiple

334

Formulacin matricial
De manera similar a Ia realizada cn el moclelo lineal sinrple, el linea,l mrltiple es factible ponerlo en
forma matricial. Por la cantidad de variables irn'olucradas csta formulacin es ms fcil de manipulal
que la forma algebraica. El proceso es idrttico a1 explicado en el captulo anterior; sin embargo, lo
repetiremos de manera simplificada.
Si se ponen las matrices

1 rtr rI2
,' ,':,

Y-

I rnt

se obtiene Ia ecuacin

Tn2

rnatricial del modelo

Y:X0+e.
Los miembros de esta ecuacin se forman de

es un vector n, x 1 de las observaciones.

es

es un vector (k

siguiente lranera:

una matriz rtx (k+1) de los rralores cle la varirble inclcpendientc, cuya primera colunna tiene
la particularidad de que todos sus componerrtes son igr-r:rles a 1.

e es

1a,

+ 1) x

un vector n x

1 de los parmetros cle la ecuacin.

I de los errores

aleatorios.

es el vector de los estimadores de los parr

el sistema de estimacin de los parmetros cs

El'r,ector

d,e errores es

igual a 6 : Y

Y : Xb.

-?: Y-

Xb.

Por lo tanto,

SCE

: (y -

YY

Xb)

(y - Xb)

2bxY+b'x'xb.

Derivando ,9CE respecto a b, e igualando el resultado a ccro da

xxb -XY

( 1 1.3)

77,2. Estintacin de Jos parntetros

335

Esta explesin es la forrna rnatricial cle las ccurtcioncs lolrlalcs clc regresin antcs deducidas.
Si la rnatriz XX es invcrsiblc se obticne cl estirnidor b c:omo Ia solrrcin del sistcrna (11.3):

b: (xx) lxrY

(11.4)

Desan olleuros la ecuacirr (11.3):


tt

rL

tt

i:1. "t

\-2
/r *iI

r,

i-I

:1
rL

D rn^ D
_1
i.:1

1L

\-

rL

rL

11

D,or,o,

)- J;r.1.;.
i:1

i-I

1I

D rnrz
i-1

rrun

i:T
TL

')

5- z;r.u,

i:r

i.:1

Observemos la estructura especial de ta natrices

u'

i-I

i1

rL

rnnro,

17

-..
T
1' ''tk

Drn
i-l

X'Y y XX; sta riitima

es

simtrica de orden k *

1.

Ejernplo. Una compaa, con objeto

de progranrar la produccin para e1 resto del ao, necesita un


plonstico de las ventas totales. En sus registros ticne las r.crrtas realizadas (en miles de dlares) v
los gastos en publicidad e insumos para sus productos en los irltirnos 10 meses como se muestra en la
sigr-riente tabla.

Ventas Publicidad Insumos

333
310
311
290
342

55
59
69
65
71

Ventas Publicidad Insurnos

96
84

348

67

)qn

/t)

78

74

_alo
t11
r)-11

59
77

bt)

66
91

298

64

67
nt
I t)

Encontrar la ecuacin de regresin que relacione las vcntas con los gastos en publicidad y en insunos.

Soluc'in: Nombremos la variable ventas cono y) los ga^stos en publicidad como ,r1 y los gastos en
12. El modelo de regresin es

insumos como

I,.
r J,.y,,-A tJO- u1r
I -r u).t 2
-

La matriz

X y el vector Y

son

X-

l.Xes

.
c.

15596
15984
16974
16566
I7191
I67E6
77678
15966
77767
I 64 7l,t

111

tt.)

J J.)

310
311

Y-

290
342
348
.)

-a

275
311

298

11

59 69 65 71 67
84 74 66 91 86

76

78

111

59 77 64,
66 67 75 )

Captulo 77. Regresin MItipIe

336

La matriz XX resulta:

XX:

662

783

44304

51 636

636

62 335

51

Su inversa

(XX-t

".

(x'x)-' :(
Y el clculo de

XY

27.07764 -0.18441 -0.11200


-0 18441 0.002266 0.000438
-0.11200 0.000438 0.001059

da

zr4s \
zog oog I

XiY : f
\

zas 055

Finalmente, multiplicando los dos ltimos resultados llegamos aquebes

1x''':(i:,\ :(
Yu,
Con todo sto, la ecuacin de regresin
0

37.30

1.717

2.088

es

37.30

+ 7.717

rt *

2.088r2.

Propiedades de b
El estimador de mnimos cuadrados b tiene las siguientes propiedades:

1.

Es insesgado para p.

Puesto que E(e)

y (X'X)-1 X,X : I

se tiene:

E(b) : El(x'x)-1 x'y]

:
2.

:n[{x'x) 'x'tx+e)]

n [x'x-'
x;
\-- --l
/ x,xp'- + (xi
L\

-t

x,rl
--l

p.
r'

La matriz de covarianza de b viene dada por


Cov(b)

La matz Cov(b)

: o'(X'X)-t.

es simtrica; adems, el valor de o2 suele ser clesconocido, debiendo ser esti-

mado.

Estimacin de o2
Consideremos ahora Ia suma de los cuadrados de los errores

scE

:irr,
i:l

- io)2 :

et,

oon

77.2. Estintacin clc los palrnrer'os

JJ

que despus de sustituir el valol cle e se llega a


SC

quc tieue 'n - k

E -- YY_bXY.

1 grados de libertad.

As, el cllol cuadr'tico meclio! cllre cs nn estimaclor- irrsesgaclo

cIc

o2, sc caicula pol

SCE
ItCE:.s2 : n-k'-I'

Ejernplo. (Continuacin) Estin'Lal la r'rrianzr clel errol o2 \,


covaliauzr de b.

",r.o,'{,rrl

Sohtcin: Utilizando el vectol cle estitlacin clc los


bxY

( 37.30 r.7t7
YY :

la nratriz de r.aritrtza-

btiene

2.08E

093 566.63

ili)0.37.

l0

D, r? :

993 957.

'i:l

Pol lo t:tnto,

SC

es

SC

CorrLo n.

- A; - 1 :

10

: YY-I)/XIY :

- 2- 7:

993 566.63

7, cl clrol crrrclr'rrlo lreclio


2
.5

Lr

993 fI57

: llCE -

39()'37
I

cs

55.7666.

matriz cle covarianza

clGr

IL.2.L,

-0.18441 -0.11200
0 002266 0 000438
0.000438 0.001059

Coeficientes de regresin estandarizados


clc ureclicirr u.o sol
las i'irri;ilrlr:s irr<lcpurrclit:rics. cle ltrrLrcLt qrrc los coe-

Crrando se realiza un mocielo de le-qrcsirr rtrrltirlc, gerrclirlrrrt:utc. las

rLricli-Lrles

las ruislnas pala la valirblc cleperrclicrrlo l I)ar'1,


lir:icntcs dc regresin no se prrcclcn colnl)lr'\r dilcc:tun'rcutc. Pi'Lla srrrultl cstr clificultad. sc cnlk:an
Ios coc.fici,cntc,s de reqrcsi.n cstrnt,d,a't i,zrdo.s betr.
rruiclrdes clc lnedic:in clc l"o<lrs 1;ts i'iliablcs sc lLirtsfrrrtnatt
:rlividicnclo cada variablc 1rcl str dcsvi.,tcin cstittdar'.

il,as

Pol clcrrrplo, cn la ccrra<:in

ck: r'cglcsirirr

i:bo*brl

*b.:-..

cst irrclrr'.

Captulo 71. R.egresin Atltiltiple

338
se tiene

r-

5tt

:le,\1 - (u,-),,
('r-=),,
,q.' t,/,/
5,7
/

Los coeficientcs

.{

'sr.z

..

beta - Itt:'-!
sll
sou los coeficientes de regrcsin parcral estinclar v srr intcr'prctrci<in es liL siguieutc: si hay uni r,uircirr
de ltna desviacin estinclat en ui) habr una clesr.ircin cle beta; dcsviaciones estndar en y.

Ejemplo. (Continuacin) Encontrar los

cocficientes clc reglesin cstandarizaclos de los clatos clel

ejerlplo.

Sol'ucin: Se tiene que


o

:37.30,

b1

:1.717.

:2.088.

r2

Las desrriaciorres estnc1ar clc las variables son

s, : 23.22. sr, : 7.30,


Los c:ocficierrtes belr

s,"z

10.68,

sor.l:

betal

. s,.
i,r-

beta2

.
- uSs^^ b,-:-'
-'l
'3.22
5t1

7.30

_.
;);)
;.::

l.7l;-_^
')J

s,,

10.68

0.53C3,

0.9604.

11.3. Intervalos de confianza


En la t'egresin nrltiple se pr-teclen folmulrl cstimacioncs pol inlclralo par'\ los valoles de los coe