Vous êtes sur la page 1sur 189

Instituto Profesorado Concordia D-54

Seccin Matemtica

Probabilidad y Estadstica 2
(tercer ao)

Material de estudio
Carrera: Profesorado de Matemtica para la
escuela secundaria
Carcter: anual
Docente: Lic. Mario Alvarez

Estructura del cuadernillo y bibliografa base de referencia:


Unidad 1: Algunas relaciones entre distribuciones de probabilidad discretas y
continuas
Bibliografa:
Walpole R., Myers R y Myers S (2012). Probabilidad y estadstica para ingenieros. Captulo 6, secciones 6.5 (binomial y
normal) y 6.6 (gamma y exponencial): pginas 187 a 200, y Captulo 5 (Binomial con Poisson): pginas 161 a 166. Mxico:
Prentice Hall Hispanoamericana, S. A.
Prctico de clase 1

Unidad 2: Variables aleatorias: Funcin generatriz de momentos.


Bibliografa:
Canavos G. (1988). Probabilidad y Estadstica: aplicaciones y mtodos. Captulo 3. Mxico: Mc Graw Hill
Prctico de clase 2

Unidad 3: Tipos de muestreos


Bibliografa:
Diez Stella M. (2005). Estadstica aplicada a los negocios utilizando Microsoft Excel. Cap. 1. MP Ediciones S.A.
Kilmansky D. (2009). Estadstica para todos. Cap. 6. Buenos Aires: Ministerio de Educacin.
Prctico de clase 3

Unidad 4: Distribuciones en el muestreo


Bibliografa:
Canavos G. (1988). Probabilidad y Estadstica: aplicaciones y mtodos. Captulo 7. Mxico: Mc Graw Hill
Prctico de clase 4
Prctico de clase 5

Unidad 5: Estimacin puntual y por intervalos: propiedades deseables de los


estimadores. Test de hiptesis
Bibliografa:
Canavos G. (1988). Probabilidad y Estadstica: aplicaciones y mtodos. Captulo 8. Mxico: Mc Graw Hill
Hispanoamericana, S. A.
Prctico de clase 6
Prctico de clase 7

Unidad 6: Introduccin al anlisis de regresin lineal


Walpole R., Myers R y Myers S (2012). Probabilidad y estadstica para ingenieros. Captulo 11: pg. 389 a 399. Mxico:
Prentice Hall.

5.5 Distribucin de Poisson y proceso de Poisson

161

Aplicaciones de las distribuciones binomial negativa y geomtrica


Las reas de aplicacin de las distribuciones binomial negativa y geomtrica sern evidentes cuando nos enfoquemos en los ejemplos de esta seccin y en los ejercicios que
se dedican a tales distribuciones al final de la seccin 5.5. En el caso de la distribucin
geomtrica, el ejemplo 5.16 describe una situacin en que los ingenieros o administradores intentan determinar cun ineficiente es un sistema de conmutacin telefnica
durante periodos ajetreados. En este caso es evidente que los ensayos que ocurren antes
de un xito representan un costo. Si hay una alta probabilidad de que se requieran varios
intentos antes de lograr conectarse, entonces se debera redisear el sistema.
Las aplicaciones de la distribucin binomial negativa son similares por naturaleza.
Supongamos que los intentos son costosos en algn sentido y que ocurren en secuencia.
La alta probabilidad de que se requiera un nmero grande de intentos para experimentar un nmero fijo de xitos no es benfica ni para el cientfico ni para el ingeniero.
Considere los escenarios de los ejercicios de repaso 5.90 y 5.91. En el ejercicio 5.91 el
perforador define cierto nivel de xitos perforando diferentes sitios en secuencia para
encontrar petrleo. Si slo se han hecho 6 intentos en el momento en que se experimenta
el segundo xito, parecera que las utilidades superan de forma considerable la inversin
en que se incurre para la perforacin.

5.5

Distribucin de Poisson y proceso de Poisson


Los experimentos que producen valores numricos de una variable aleatoria X, el nmero de resultados que ocurren durante un intervalo de tiempo determinado o en una
regin especfica, se denominan experimentos de Poisson. El intervalo de tiempo puede
ser de cualquier duracin, como un minuto, un da, una semana, un mes o incluso un ao.
Por ejemplo, un experimento de Poisson podra generar observaciones para la variable
aleatoria X que representa el nmero de llamadas telefnicas por hora que recibe una
oficina, el nmero de das que una escuela permanece cerrada debido a la nieve durante
el invierno o el nmero de juegos suspendidos debido a la lluvia durante la temporada
de bisbol. La regin especfica podra ser un segmento de recta, una rea, un volumen
o quiz una pieza de material. En tales casos X podra representar el nmero de ratas de
campo por acre, el nmero de bacterias en un cultivo dado o el nmero de errores mecanogrficos por pgina. Un experimento de Poisson se deriva del proceso de Poisson y
tiene las siguientes propiedades:

Propiedades del proceso de Poisson


1. El nmero de resultados que ocurren en un intervalo o regin especfica es independiente del nmero que ocurre en cualquier otro intervalo de tiempo o regin del
espacio disjunto. De esta forma vemos que el proceso de Poisson no tiene memoria.
2. La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo
muy corto o en una regin pequea es proporcional a la longitud del intervalo o al
tamao de la regin, y no depende del nmero de resultados que ocurren fuera de
este intervalo de tiempo o regin.
3. La probabilidad de que ocurra ms de un resultado en tal intervalo de tiempo corto
o que caiga en tal regin pequea es insignificante.
El nmero X de resultados que ocurren durante un experimento de Poisson se llama
variable aleatoria de Poisson y su distribucin de probabilidad se llama distribu-

162

Captulo 5 Algunas distribuciones de probabilidad discreta

cin de Poisson. El nmero medio de resultados se calcula a partir de = t, donde t


es el tiempo, la distancia, el rea o el volumen especficos de inters. Como las
probabilidades dependen de , denotaremos la tasa de ocurrencia de los resultados con
p(x; t). La derivacin de la frmula para p(x; t), que se basa en las tres propiedades
de un proceso de Poisson que se listaron antes, est fuera del alcance de este texto. La
siguiente frmula se utiliza para calcular probabilidades de Poisson.
Distribucin La distribucin de probabilidad de la variable aleatoria de Poisson X, la cual representa
de Poisson el nmero de resultados que ocurren en un intervalo de tiempo dado o regin especficos
y se denota con t, es
et (t) x
p(x ; t) =
, x = 0, 1, 2, . . . ,
x!
donde es el nmero promedio de resultados por unidad de tiempo, distancia, rea o
volumen y e = 2.71828
La tabla A.2 contiene las sumatorias de la probabilidad de Poisson
r

p(x ; t),

P (r; t) =
x =0

para valores selectos de t que van de 0.1 a 18.0 Ilustramos el uso de esta tabla con los
siguientes dos ejemplos.
Ejemplo 5.17: Durante un experimento de laboratorio el nmero promedio de partculas radiactivas que
pasan a travs de un contador en un milisegundo es 4. Cul es la probabilidad de
que entren 6 partculas al contador en un milisegundo dado?
Solucin: Al usar la distribucin de Poisson con x = 6 y t = 4, y al remitirnos a la tabla A.2, tenemos que
6

e4 46
p(x ; 4)
p(x ; 4) = 0.8893 0.7851 = 0.1042.
p(6; 4) =
=
6!
x =0
x =0
Ejemplo 5.18: El nmero promedio de camiones-tanque que llega cada da a cierta ciudad portuaria es
10. Las instalaciones en el puerto pueden alojar a lo sumo 15 camiones-tanque por da.
Cul es la probabilidad de que en un da determinado lleguen ms de 15 camiones y se
tenga que rechazar algunos?
Solucin: Sea X el nmero de camiones-tanque que llegan cada da. Entonces, usando la tabla A.2,
tenemos
15

p(x ; 10) = 1 0.9513 = 0.0487.

P (X > 15) = 1 P (X 15) = 1


x =0

Como la distribucin binomial, la distribucin de Poisson se utiliza para control de


calidad, aseguramiento de calidad y muestreo de aceptacin. Adems, ciertas distribuciones continuas importantes que se usan en la teora de confiabilidad y en la teora de colas
dependen del proceso de Poisson. Algunas de estas distribuciones se analizan y desarrollan en el captulo 6. El siguiente teorema acerca de la variable aleatoria de Poisson se
presenta en el apndice A.25.
Teorema 5.4: Tanto la media como la varianza de la distribucin de Poisson p(x; t) son t.

5.5 Distribucin de Poisson y proceso de Poisson

163

Naturaleza de la funcin de probabilidad de Poisson


Al igual que muchas distribuciones discretas y continuas, la forma de la distribucin de
Poisson se vuelve cada vez ms simtrica, incluso con forma de campana, a medida
que la media se hace ms grande. Una ilustracin de esto son las grficas de la funcin
de probabilidad para = 0.1, = 2 y finalmente = 5 que se muestran en la figura 5.1.
Observe cmo se acercan a la simetra cuando se vuelve tan grande como 5. Con la
distribucin binomial ocurre algo parecido, como se ilustrar ms adelante en este texto.
1.0

0.30

0.30

= 0.1

= 2

=5

0.75

0.5

f (x)

0.20

f (x)

f (x)

0.20

0.10

0.10

0.25

10

10

10

Figura 5.1: Funciones de densidad de Poisson para diferentes medias.

Aproximacin de una distribucin binomial por medio


de una distribucin de Poisson
A partir de los tres principios del proceso de Poisson debera ser evidente que la distribucin de Poisson se relaciona con la distribucin binomial. Aunque la de Poisson por
lo general se aplica en problemas de espacio y tiempo, como se ilustra con los ejemplos
5.17 y 5.18, se podra considerar como una forma limitante de la distribucin binomial.
En el caso de la distribucin binomial, si n es bastante grande y p es pequea, las condiciones comienzan a simular las implicaciones de espacio o tiempo continuos del proceso
de Poisson. La independencia entre las pruebas de Bernoulli en el caso binomial es consistente con la segunda propiedad del proceso de Poisson. Permitir que el parmetro p se
acerque a cero se relaciona con la tercera propiedad del proceso de Poisson. De hecho,
si n es grande y p es cercana a 0, se puede usar la distribucin de Poisson, con = np,
para aproximar probabilidades binomiales. Si p es cercana a 1, an podemos utilizar la
distribucin de Poisson para aproximar probabilidades binomiales intercambiando lo
que definimos como xito y fracaso, por lo tanto, cambiando p a un valor cercano a 0.
Teorema 5.5: Sea X una variable aleatoria binomial con distribucin de probabilidad b(x; n, p). Cuan
permanece constante,
do n , p 0, y np n
n

b(x; n, p) p(x; ).

164

Captulo 5 Algunas distribuciones de probabilidad discreta

Ejemplo 5.19: En cierta fbrica los accidentes ocurren con muy poca frecuencia. Se sabe que la probabilidad de un accidente en cualquier da dado es de 0.005, y que los accidentes son independientes entre s.
a) Cul es la probabilidad de que en un da de cualquier periodo determinado de 400
das ocurra un accidente?
b) Cul es la probabilidad de que ocurra un accidente a lo sumo en tres das de tal periodo?
Solucin: Sea X una variable aleatoria binomial con n = 400 y p = 0.005. Por consiguiente, np =
2. Si utilizamos la aproximacin de Poisson,
a) P (X = 1) = e2 21 = 0.271 y
b) P (X 3) =

3
x =0

e 2 2x /x! = 0.857.

Ejemplo 5.20: En un proceso de fabricacin donde se manufacturan productos de vidrio ocurren defectos o burbujas, lo cual ocasionalmente hace que la pieza ya no se pueda vender. Se sabe
que, en promedio, 1 de cada 1000 artculos producidos tiene una o ms burbujas. Cul
es la probabilidad de que una muestra aleatoria de 8000 tenga menos de 7 artculos con
burbujas?
Solucin: Se trata bsicamente de un experimento binomial con n = 8000 y p = 0.001. Como p es
muy cercana a cero y n es bastante grande, haremos la aproximacin con la distribucin
de Poisson utilizando
= (8000)(0.001) = 8.
Por lo tanto, si X representa el nmero de burbujas, tenemos
6

b(x ; 8000, 0.001) p(x ; 8) = 0.3134.

P (X < 7) =
x =0

Ejercicios
5.49 La probabilidad de que una persona que vive en
cierta ciudad tenga un perro es de 0.3. Calcule la probabilidad de que la dcima persona entrevistada al azar en
esa ciudad sea la quinta que tiene un perro.
5.50 Calcule la probabilidad de que una persona que
lanza una moneda obtenga
a) la tercera cara en el sptimo lanzamiento;
b) la primera cara en el cuarto lanzamiento.
5.51 Tres personas lanzan una moneda legal y el
disparejo paga los cafs. Si todas las monedas tienen
el mismo resultado, se lanzan de nuevo. Calcule la
probabilidad de que se necesiten menos de 4 lanzamientos.
5.52 Un cientfico inocula a varios ratones, uno a
la vez, el virus que produce una enfermedad, hasta que
encuentra a 2 que contraen la enfermedad. Si la proba-

bilidad de contraer la enfermedad es de 1/6, cul es


la probabilidad de que tenga que inocular a 8 ratones?
5.53 Un estudio de un inventario determina que, en
promedio, el nmero de veces al da que se solicita un
artculo especfico en un almacn es 5. Cul es la probabilidad de que en un da determinado este artculo se pida
a) ms de 5 veces?
b) ninguna vez?
5.54 De acuerdo con un estudio publicado por un
grupo de socilogos de la Universidad de Massachusetts,
Estados Unidos, casi dos terceras partes de los 20 millones de personas que consumen Valium son mujeres.
Suponga que esta cifra es una estimacin vlida y calcule la probabilidad de que en un determinado da la
quinta prescripcin de Valium que da un mdico sea
a) la primera prescripcin de Valium para una mujer;
b) la tercera prescripcin de Valium para una mujer.

Ejercicios

5.55 La probabilidad de que una persona que estudia


la carrera de piloto privado apruebe el examen escrito
para obtener la licencia es de 0.7. Calcule la probabilidad de que cierto estudiante apruebe el examen
a) en el tercer intento;
b) antes del cuarto intento.
5.56 En cierto crucero ocurren, en promedio, 3 accidentes de trnsito al mes. Cul es la probabilidad de
que en cualquier determinado mes en este crucero
a) ocurran exactamente 5 accidentes?
b) ocurran menos de 3 accidentes?
c) ocurran al menos 2 accidentes?
5.57 Un escritor de libros comete, en promedio, dos
errores de procesamiento de texto por pgina en el primer borrador de su libro. Cul es la probabilidad de
que en la siguiente pgina cometa
a) 4 o ms errores?
b) ningn error?
5.58 Cierta rea del este de Estados Unidos resulta
afectada, en promedio, por 6 huracanes al ao. Calcule
la probabilidad de que para cierto ao esta rea resulte
afectada por
a) menos de 4 huracanes;
b) cualquier cantidad entre 6 y 8 huracanes.
5.59 Suponga que la probabilidad de que una determinada persona crea un rumor acerca de las transgresiones de cierta actriz famosa es de 0.8. Cul es la
probabilidad de que
a) la sexta persona que escuche este rumor sea la
cuarta en creerlo?
b) la tercera persona que escuche este rumor sea la
primera en creerlo?
5.60 Se estima que el nmero promedio de ratas de
campo por acre, en un campo de 5 acres de trigo, es 12.
Calcule la probabilidad de que se encuentren menos de
7 ratas de campo
a) en un acre dado;
b) en 2 de los siguientes 3 acres que se inspeccionen.
5.61 Suponga que, en promedio, una persona en 1000
comete un error numrico al preparar su declaracin de
impuestos. Si se seleccionan 10,000 formas al azar y se
examinan, calcule la probabilidad de que 6, 7 u 8 de las
formas contengan un error.
5.62 Se sabe que la probabilidad de que un estudiante
de preparatoria no pase la prueba de escoliosis (curvatura de la espina dorsal) es de 0.004. De los siguientes
1875 estudiantes que se revisan en bsqueda de escoliosis, calcule la probabilidad de que
a) menos de 5 no pasen la prueba;
b) 8, 9 o 10 no pasen la prueba.

165

5.63 Calcule la media y la varianza de la variable aleatoria X del ejercicio 5.58, que representa el nmero de
huracanes que afectan cada ao a cierta rea del este
de Estados Unidos.
5.64 Calcule la media y la varianza de la variable
aleatoria X del ejercicio 5.61, que representa el nmero
de personas, de cada 10,000, que comete un error al
preparar su declaracin de impuestos.
5.65 Un fabricante de automviles se preocupa por
una falla en el mecanismo de freno de un modelo especfico. En raras ocasiones la falla puede causar una
catstrofe al manejarlo a alta velocidad. La distribucin
del nmero de automviles por ao que experimentar
la catstrofe es una variable aleatoria de Poisson con
= 5.
a) Cul es la probabilidad de que, a lo sumo, 3 automviles por ao de ese modelo especfico sufran
una catstrofe?
b) Cul es la probabilidad de que ms de un automvil por ao experimente una catstrofe?
5.66 Los cambios en los procedimientos de los aeropuertos requieren una planeacin considerable. Los
ndices de llegadas de los aviones son factores importantes que deben tomarse en cuenta. Suponga que los
aviones pequeos llegan a cierto aeropuerto, de acuerdo
con un proceso de Poisson, con una frecuencia de 6 por
hora. De esta manera, el parmetro de Poisson para las
llegadas en un periodo de horas es = 6t.
a) Cul es la probabilidad de que lleguen exactamente 4 aviones pequeos durante un periodo de
una hora?
b) Cul es la probabilidad de que lleguen al menos 4
durante un periodo de una hora?
c) Si definimos un da laboral como de 12 horas,
cul es la probabilidad de que al menos 75 aviones pequeos lleguen durante un da laboral?
5.67 Se supone que el nmero de clientes que llegan
por hora a ciertas instalaciones de servicio automotriz
sigue una distribucin de Poisson con media = 7.
a) Calcule la probabilidad de que lleguen ms de 10
clientes en un periodo de dos horas.
b) Cul es el nmero medio de llegadas durante un
periodo de 2 horas?
5.68 Considere el ejercicio 5.62. Cul es el nmero
promedio de estudiantes que no pasan la prueba?
5.69 La probabilidad de que una persona muera al
contraer una infeccin viral es de 0.001. De los siguientes 4000 infectados con el virus, cul es el nmero promedio que morir?

166

Captulo 5 Algunas distribuciones de probabilidad discreta

5.70 Una empresa compra lotes grandes de cierta


clase de dispositivo electrnico. Utiliza un mtodo que
rechaza el lote completo si en una muestra aleatoria de
100 unidades se encuentran 2 o ms unidades defectuosas.
a) Cul es el nmero promedio de unidades defectuosas que se encuentran en una muestra de 100
unidades si el lote tiene 1% de unidades defectuosas?
b) Cul es la varianza?
5.71 Se sabe que para cierto tipo de alambre de cobre
ocurren, en promedio, 1.5 fallas por milmetro. Si se
supone que el nmero de fallas es una variable aleatoria
de Poisson, cul es la probabilidad de que no ocurran
fallas en cierta parte de un alambre que tiene 5 milmetros de longitud? Cul es el nmero promedio de
fallas en alguna parte de un alambre que tiene 5 milmetros de longitud?
5.72 Los baches en ciertas carreteras pueden ser
un problema grave y requieren reparacin constantemente. Con un tipo especfico de terreno y mezcla de
concreto la experiencia sugiere que hay, en promedio, 2
baches por milla despus de cierta cantidad de uso. Se
supone que el proceso de Poisson se aplica a la variable
aleatoria nmero de baches.
a) Cul es la probabilidad de que no aparezca ms de
un bache en un tramo de una milla?
b) Cul es la probabilidad de que no aparezcan ms
de 4 baches en un tramo determinado de 5 millas?
5.73 En ciudades grandes los administradores de los
hospitales se preocupan por el flujo de personas en las
salas de urgencias. En un hospital especfico de una

ciudad grande el personal disponible no puede alojar


el flujo de pacientes cuando hay ms de 10 casos de
emergencia en una hora determinada. Se supone que la
llegada de los pacientes sigue un proceso de Poisson y
los datos histricos sugieren que, en promedio, llegan
5 emergencias cada hora.
a) Cul es la probabilidad de que en una hora determinada el personal no pueda alojar el flujo de
pacientes?
b) Cul es la probabilidad de que, durante un turno
de 3 horas, lleguen ms de 20 emergencias?
5.74 Se sabe que 3% de las personas a las que se les
revisa el equipaje en un aeropuerto lleva objetos cuestionables. Cul es la probabilidad de que una serie de
15 personas cruce sin problemas antes de que se atrape
a una con un objeto cuestionable? Cul es el nmero
esperado de personas que pasarn antes de que se detenga a una?
5.75 La tecnologa ciberntica ha generado un ambiente donde los robots funcionan con el uso de microprocesadores. La probabilidad de que un robot falle
durante cualquier turno de 6 horas es de 0.10. Cul es
la probabilidad de que un robot funcione a lo sumo 5
turnos antes de fallar?
5.76 Se sabe que la tasa de rechazo en las encuestas
telefnicas es de aproximadamente 20%. Un reportaje
del peridico indica que 50 personas respondieron a
una encuesta antes de que una se rehusara a participar.
a) Comente acerca de la validez del reportaje. Utilice
una probabilidad en su argumento.
b) Cul es el nmero esperado de personas encuestadas antes de que una se rehse a responder?

Ejercicios de repaso
5.77 Durante un proceso de produccin, cada da se
seleccionan al azar 15 unidades de la lnea de ensamble
para verificar el porcentaje de artculos defectuosos. A
partir de informacin histrica se sabe que la probabilidad de tener una unidad defectuosa es de 0.05. Cada
vez que se encuentran dos o ms unidades defectuosas
en la muestra de 15, el proceso se detiene. Este procedimiento se utiliza para proporcionar una seal en
caso de que aumente la probabilidad de unidades defectuosas.
a) Cul es la probabilidad de que en un da determinado se detenga el proceso de produccin? (Suponga 5% de unidades defectuosas).
b) Suponga que la probabilidad de una unidad defectuosa aumenta a 0.07. Cul es la probabilidad de
que en cualquier da no se detenga el proceso
de produccin?

5.78 Se considera utilizar una mquina automtica


de soldadura para un proceso de produccin. Antes de
comprarla se probar para verificar si tiene xito en
99% de sus soldaduras. Si no es as, se considerar que
no es eficiente. La prueba se llevar a cabo con un prototipo que requiere hacer 100 soldaduras. La mquina
se aceptar para la produccin slo si no falla en ms
de 3 soldaduras.
a) Cul es la probabilidad de que se rechace una
buena mquina?
b) Cul es la probabilidad de que se acepte una mquina ineficiente que solde bien el 95% de las veces?
5.79 Una agencia de renta de automviles en un aeropuerto local tiene 5 Ford, 7 Chevrolet, 4 Dodge, 3
Honda y 4 Toyota disponibles. Si la agencia selecciona
al azar 9 de estos automviles para transportar delega-

6.5 Aproximacin normal a la binomial

c) Si sale de su casa a las 8:35 a.m. y el caf se sirve en


la oficina de 8:50 a.m. a 9:00 a.m., cul es la probabilidad de que se pierda el caf?
d ) Calcule la duracin mayor en la que se encuentra
el 15% de los viajes ms lentos.
e) Calcule la probabilidad de que 2 de los siguientes
3 viajes tomen al menos 1/2 hora.
6.16 En el ejemplar de noviembre de 1990 de Chemical Engineering Progress, un estudio analiza el porcentaje de pureza del oxgeno de cierto proveedor. Suponga
que la media fue de 99.61, con una desviacin estndar
de 0.08. Suponga que la distribucin del porcentaje de
pureza fue aproximadamente normal.
a) Qu porcentaje de los valores de pureza esperara
que estuvieran entre 99.5 y 99.7?
b) Qu valor de pureza esperara que excediera
exactamente 5% de la poblacin?
6.17 La vida promedio de cierto tipo de motor pequeo es de 10 aos, con una desviacin estndar de
2 aos. El fabricante reemplaza gratis todos los motores que fallen dentro del periodo de garanta. Si estuviera dispuesto a reemplazar slo 3% de los motores
que fallan, cunto tiempo de garanta debera ofrecer?
Suponga que la duracin de un motor sigue una distribucin normal.
6.18 La estatura de 1000 estudiantes se distribuye
normalmente con una media de 174.5 centmetros y
una desviacin estndar de 6.9 centmetros. Si se supone que las estaturas se redondean al medio centmetro
ms cercano, cuntos de estos estudiantes esperara
que tuvieran una estatura
a) menor que 160.0 centmetros?
b) de entre 171.5 y 182.0 centmetros inclusive?
c) igual a 175.0 centmetros?
d ) mayor o igual que 188.0 centmetros?
6.19 Una empresa paga a sus empleados un salario
promedio de $15.90 por hora, con una desviacin estndar de $1.50. Si los salarios se distribuyen aproximadamente de forma normal y se redondean al centavo
ms cercano,

187

a) qu porcentaje de los trabajadores recibe salarios


de entre $13.75 y $16.22 por hora?
b) el 5% de los salarios ms altos por hora de los
empleados es mayor a qu cantidad?
6.20 Los pesos de un gran nmero de poodle miniatura
se distribuyen aproximadamente de forma normal con
una media de 8 kilogramos y una desviacin estndar de 0.9 kilogramos. Si las mediciones se redondean
al dcimo de kilogramo ms cercano, calcule la fraccin de estos poodle con pesos
a) por arriba de 9.5 kilogramos;
b) a lo sumo 8.6 kilogramos;
c) entre 7.3 y 9.1 kilogramos.
6.21 La resistencia a la tensin de cierto componente
de metal se distribuye normalmente con una media de
10,000 kilogramos por centmetro cuadrado y una desviacin estndar de 100 kilogramos por centmetro
cuadrado. Las mediciones se redondean a los 50 kilogramos por centmetro cuadrado ms cercanos.
a) Qu proporcin de estos componentes excede a
10,150 kilogramos por centmetro cuadrado de resistencia a la tensin?
b) Si las especificaciones requieren que todos los
componentes tengan una resistencia a la tensin
de entre 9800 y 10,200 kilogramos por centmetro
cuadrado, qu proporcin de piezas esperara que
se descartara?
6.22 Si un conjunto de observaciones se distribuye de
manera normal, qu porcentaje de stas difieren de la
media en
a) ms de 1.3?
b) menos de 0.52?
6.23 El coeficiente intelectual (CI) de 600 aspirantes
a cierta universidad se distribuye aproximadamente de
forma normal con una media de 115 y una desviacin
estndar de 12. Si la universidad requiere un CI de al
menos 95, cuntos de estos estudiantes sern rechazados con base en ste sin importar sus otras calificaciones? Tome en cuenta que el CI de los aspirantes se
redondea al entero ms cercano.

6.5 Aproximacin normal a la binomial


Las probabilidades asociadas con experimentos binomiales se obtienen fcilmente a
partir de la frmula b(x; n, p) de la distribucin binomial o de la tabla A.1 cuando n es
pequea. Adems, las probabilidades binomiales estn disponibles en muchos paquetes
de software. Sin embargo, resulta aleccionador conocer la relacin entre la distribucin
binomial y la normal. En la seccin 5.5 explicamos cmo se puede utilizar la distribucin de Poisson para aproximar probabilidades binomiales cuando n es muy grande y
p se acerca mucho a 0 o a 1. Tanto la distribucin binomial como la de Poisson son

188

Captulo 6 Algunas distribuciones continuas de probabilidad

discretas. La primera aplicacin de una distribucin continua de probabilidad para


aproximar probabilidades sobre un espacio muestral discreto se demostr en el ejemplo 6.12, donde se utiliz la curva normal. La distribucin normal a menudo es una
buena aproximacin a una distribucin discreta cuando la ltima adquiere una forma de
campana simtrica. Desde un punto de vista terico, algunas distribuciones convergen
a la normal a medida que sus parmetros se aproximan a ciertos lmites. La distribucin
normal es una distribucin de aproximacin conveniente, ya que la funcin de distribucin acumulativa se tabula con mucha facilidad. La distribucin binomial se aproxima
bien por medio de la normal en problemas prcticos cuando se trabaja con la funcin de
distribucin acumulativa. Ahora plantearemos un teorema que nos permitir utilizar
reas bajo la curva normal para aproximar propiedades binomiales cuando n es suficientemente grande.
Teorema 6.3: Si X es una variable aleatoria binomial con media = np y varianza 2 = npq, entonces la forma limitante de la distribucin de
Z =

X np
,
npq

conforme n , es la distribucin normal estndar n(z; 0, 1).


Resulta que la distribucin normal con = np y 2 = np(1 p) no slo ofrece una
aproximacin muy precisa a la distribucin binomial cuando n es grande y p no est
extremadamente cerca de 0 o de 1, sino que tambin brinda una aproximacin bastante
buena aun cuando n es pequea y p est razonablemente cerca de 1/2.
Para ilustrar la aproximacin normal a la distribucin binomial primero dibujamos
el histograma para b(x; 15, 0.4) y despus superponemos la curva normal particular con
la misma media y varianza que la variable binomial X. En consecuencia, dibujamos una
curva normal con
= np = (15)(0.4) = 6 y 2 = npq = (15)(0.4)(0 .6) = 3.6.
El histograma de b(x; 15, 0.4) y la curva normal superpuesta correspondiente, que est
determinada por completo por su media y su varianza, se ilustran en la figura 6.22.

0 1 2 3 4 5 6 7 8 9

11

13

15

Figura 6.22: Aproximacin normal de b(x; 15, 0.4).

6.5 Aproximacin normal a la binomial

189

La probabilidad exacta de que la variable aleatoria binomial X tome un valor determinado x es igual al rea de la barra cuya base se centra en x. Por ejemplo, la probabilidad exacta de que X tome el valor 4 es igual al rea del rectngulo con base centrada en
x = 4. Si usamos la tabla A.1, encontramos que esta rea es
P (X = 4) = b(4; 15, 0.4) = 0.1268,
que es aproximadamente igual al rea de la regin sombreada bajo la curva normal entre
las dos ordenadas x1 = 3.5 y x2 = 4.5 en la figura 6.23. Al convertir a valores z, tenemos
z1 =

3.5 6
= 1.32
1.897

0 1 2 3 4 5 6 7 8 9

z2 =

4.5 6
= 0.79.
1.897

11

13

15

Figura 6.23: Aproximacin normal de b(x; 15, 0.4) y

x =7

b(x; 15, 0.4).

Si X es una variable aleatoria binomial y Z una variable normal estndar, entonces,


P (X = 4 ) = b(4; 15, 0.4) P (1.32 < Z < 0.79)
= P (Z < 0.79) P (Z < 1.32) = 0.2148 0.0934 = 0.1214.
Esto se aproxima bastante al valor exacto de 0.1268.
La aproximacin normal es ms til en el clculo de sumatorias binomiales para
valores grandes de n. Si nos remitimos a la figura 6.23, nos podramos interesar en la
probabilidad de que X tome un valor de 7 a 9. La probabilidad exacta es dada por
9

P (7 X 9) =

b(x ; 15, 0.4)


x =0

b(x ; 15, 0.4)


x =0

= 0.9662 0.6098 = 0.3564,


que es igual a la sumatoria de las reas de los rectngulos cuyas bases estn centradas en
x = 7, 8 y 9. Para la aproximacin normal calculamos el rea de la regin sombreada
bajo la curva entre las ordenadas x1 = 6.5 y x2 = 9.5 de la figura 6.23. Los valores z correspondientes son
z1 =

6.5 6
9.5 6
= 0.26 y z 2 =
= 1.85.
1.897
1.897

190

Captulo 6 Algunas distribuciones continuas de probabilidad

Ahora,
P (7 X 9) P ( 0.26 < Z < 1.85) = P (Z < 1.85) P (Z < 0.26)
= 0.9678 0.6026 = 0.3652.
Una vez ms, la aproximacin de la curva normal ofrece un valor que se acerca al
valor exacto de 0.3564. El grado de exactitud, que depende de qu tan bien se ajuste la
curva al histograma, se incrementa a medida que aumenta n. Esto es particularmente cierto
cuando p no est muy cerca de 1/2 y el histograma ya no es simtrico. Las figuras 6.24 y
6.25 muestran los histogramas para b(x; 6, 0.2) y b(x; 15, 0.2), respectivamente. Es evidente que una curva normal se ajustar mucho mejor al histograma cuando n = 15 que cuando
n = 6.

Figura 6.24: Histograma para b(x; 6, 0.2).

0 1 2 3 4 5 6 7 8 9

11

13

15

Figura 6.25: Histograma para b(x; 15, 0.2).

En las ilustraciones de la aproximacin normal a la binomial se hizo evidente que si


buscamos el rea bajo la curva normal hacia la izquierda de, digamos x, es ms preciso
utilizar x + 0.5. Esto es una correccin para dar cabida al hecho de que una distribucin
discreta se aproxima mediante una distribucin continua. La correccin +0.5 se llama
correccin de continuidad. La explicacin anterior conduce a la siguiente aproximacin normal formal a la binomial.
Aproximacin Sea X una variable aleatoria binomial con parmetros n y p. Para una n grande, X tiene
normal a la aproximadamente una distribucin normal con = np y 2 = npq = np(1 p) y
x
distribucin
b(k ; n, p)
P(X x) =
binomial
k =0

rea bajo la curva normal a la izquierda de x + 0.5


=P Z

x + 0.5 np
npq

y la aproximacin ser buena si np y n(1 p) son mayores que o iguales a 5.


Como indicamos antes, la calidad de la aproximacin es muy buena para n grande.
Si p est cerca de 1/2, un tamao de la muestra moderado o pequeo ser suficiente para
una aproximacin razonable. Ofrecemos la tabla 6.1 como una indicacin de la calidad

6.5 Aproximacin normal a la binomial

191

de la aproximacin. Se presentan tanto la aproximacin normal como las probabilidades


binomiales acumulativas reales. Observe que en p = 0.05 y p = 0.10 la aproximacin es
muy burda para n = 10. Sin embargo, incluso para n = 10, observe la mejora para
p = 0.50. Por otro lado, cuando p es fija en p = 0.05, observe cmo mejora la aproximacin conforme vamos de n = 20 a n = 100.
Tabla 6.1: Aproximacin normal y probabilidades binomiales acumulativas reales
r
0
1
2
3
4
5
6
7
8
9
10

r
0
1
2
3
4
5
6
7
8
9
10

p = 0.05, n = 10
Binomial
Normal
0.5987
0.5000
0.9139
0.9265
0.9885
0.9981
0.9990
1.0000
1.0000
1.0000

n = 20
Binomial
Normal
0.3585
0.3015
0.7358
0.6985
0.9245
0.9382
0.9841
0.9948
0.9974
0.9998
0.9997
1.0000
1.0000
1.0000

p = 0.10, n = 10
Binomial
Normal
0.3487
0.2981
0.7361
0.7019
0.9298
0.9429
0.9872
0.9959
0.9984
0.9999
1.0000
1.0000

p = 0.05
n = 50
Binomial
Normal
0.0769
0.0968
0.2794
0.2578
0.5405
0.5000
0.7604
0.7422
0.8964
0.9032
0.9622
0.9744
0.9882
0.9953
0.9968
0.9994
0.9992
0.9999
0.9998
1.0000
1.0000
1.0000

p = 0.50, n = 10
Binomial
Normal
0.0010
0.0022
0.0107
0.0136
0.0547
0.0571
0.1719
0.1711
0.3770
0.3745
0.6230
0.6255
0.8281
0.8289
0.9453
0.9429
0.9893
0.9864
0.9990
0.9978
1.0000
0.9997
n = 100
Binomial
Normal
0.0059
0.0197
0.0371
0.0537
0.1183
0.1251
0.2578
0.2451
0.4360
0.4090
0.6160
0.5910
0.7660
0.7549
0.8720
0.8749
0.9369
0.9463
0.9718
0.9803
0.9885
0.9941

Ejemplo 6.15: Un paciente que padece una rara enfermedad de la sangre tiene 0.4 de probabilidad de
recuperarse. Si se sabe que 100 personas contrajeron esta enfermedad, cul es la probabilidad de que sobrevivan menos de 30?
Solucin: Representemos con la variable binomial X el nmero de pacientes que sobreviven. Como
n = 100, deberamos obtener resultados muy precisos usando la aproximacin de la
curva normal con
= np = (100)(0.4) = 40 y = npq =

(100)(0.4)(0.6)= 4.899.

Para obtener la probabilidad que se desea, tenemos que calcular el rea a la izquierda de x = 29.5.

192

Captulo 6 Algunas distribuciones continuas de probabilidad

El valor z que corresponde a 29.5 es


29.5 40
z=
= 2.14,
4.899
y la probabilidad de que menos de 30 de los 100 pacientes sobrevivan est dada por la
regin sombreada en la figura 6.26. Por lo tanto,
P (X < 30) P (Z <2.14) = 0.0162.

=1

=1

-2.14

Figura 6.26: rea para el ejemplo 6.15.

1.16

2.71

Figura 6.27: rea para el ejemplo 6.16.

Ejemplo 6.16: Un examen de opcin mltiple tiene 200 preguntas, cada una con 4 respuestas posibles,
de las que slo una es la correcta. Cul es la probabilidad de que solamente adivinando
se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas sobre los que
el estudiante no tiene conocimientos?
Solucin: La probabilidad de adivinar una respuesta correcta para cada una de las 80 preguntas es
p = 1/4. Si X representa el nmero de respuestas correctas slo porque se adivinaron,
entonces,
30
P (25 X 30) =

b(x ; 80, 1/4).


x =25

Al usar la aproximacin de la curva normal con


= np =(80)

1
4

= 20

y
= npq =

(80)(1 /4)(3 /4) = 3.873,

necesitamos el rea entre x1 = 24.5 y x2 = 30.5. Los valores z correspondientes son


z1 =

24.5 20
30.5 20
= 1.16 y z 2 =
= 2.71.
3.873
3.873

La probabilidad de adivinar correctamente de 25 a 30 preguntas es dada por la regin


sombreada de la figura 6.27. En la tabla A.3 encontramos que
30

b(x ; 80, 0.25) P (1.16 < Z < 2.71)

P (25 X 30) =
x =25

= P (Z < 2.71) P (Z < 1.16) = 0.9966 0.8770 = 0.1196.

Ejercicios

193

Ejercicios
6.24 Se lanza una moneda 400 veces. Utilice la
aproximacin a la curva normal para calcular la probabilidad de obtener
a) entre 185 y 210 caras;
b) exactamente 205 caras;
c) menos de 176 o ms de 227 caras.
6.25 En un proceso para fabricar un componente
electrnico, 1% de los artculos resultan defectuosos.
Un plan de control de calidad consiste en seleccionar
100 artculos de un proceso de produccin y detenerlo
o continuar con l si ninguno est defectuoso. Use la
aproximacin normal a la binomial para calcular
a) la probabilidad de que el proceso contine con el
plan de muestreo descrito;
b) la probabilidad de que el proceso contine aun si
ste va mal (es decir, si la frecuencia de componentes defectuosos cambi a 5.0% de defectuosos).
6.26 Un proceso produce 10% de artculos defectuosos. Si se seleccionan al azar 100 artculos del proceso, cul es la probabilidad de que el nmero de
defectuosos
a) exceda los 13?
b) sea menor que 8?
6.27 Un paciente tiene 0.9 de probabilidad de recuperarse de una operacin de corazn delicada. De los siguientes 100 pacientes que se someten a esta operacin,
cul es la probabilidad de que
a) sobrevivan entre 84 y 95 inclusive?
b) sobrevivan menos de 86?
6.28 Investigadores de la Universidad George Washington y del Instituto Nacional de Salud informan
que aproximadamente 75% de las personas cree que
los tranquilizantes funcionan muy bien para lograr
que una persona est ms tranquila y relajada. De las
siguientes 80 personas entrevistadas, cul es la probabilidad de que
a) al menos 50 tengan esta opinin?
b) a lo sumo 56 tengan esta opinin?
6.29 Si 20% de los residentes de una ciudad de Estados Unidos prefieren un telfono blanco sobre cualquier otro color disponible, cul es la probabilidad de
que, de los siguientes 1000 telfonos que se instalen en
esa ciudad,
a) entre 170 y 185 sean blancos?
b) al menos 210 pero no ms de 225 sean blancos?
6.30 Un fabricante de medicamentos sostiene que
cierto medicamento cura una enfermedad de la sangre,
en promedio, 80% de las veces. Para verificar la aseveracin, inspectores gubernamentales utilizan el medi-

camento en una muestra de 100 individuos y deciden


aceptar la afirmacin si se curan 75 o ms.
a) Cul es la probabilidad de que los inspectores gubernamentales rechacen la aseveracin si la probabilidad de curacin es, de hecho, de 0.8?
b) Cul es la probabilidad de que el gobierno acepte
la afirmacin si la probabilidad de curacin resulta
tan baja como 0.7?
6.31 Una sexta parte de los estudiantes de primer ao
que entran a una escuela estatal grande provienen de
otros estados. Si son asignados al azar a los 180 dormitorios de un edificio, cul es la probabilidad de que en
un determinado dormitorio al menos una quinta parte
de los estudiantes provenga de otro estado?
6.32 Una empresa farmacutica sabe que aproximadamente 5% de sus pldoras anticonceptivas no contiene
la cantidad suficiente de un ingrediente, lo que las vuelve ineficaces. Cul es la probabilidad de que menos de
10 pldoras en una muestra de 200 sean ineficaces?
6.33 Estadsticas publicadas por la National Highway
Traffic Safety Administration y el National Safety
Council revelan que en una noche promedio de fin de
semana, uno de cada 10 conductores est ebrio. Si la
siguiente noche de sbado se revisan 400 conductores
al azar, cul es la probabilidad de que el nmero de
conductores ebrios sea
a) menor que 32?
b) mayor que 49?
c) al menos 35 pero menos que 47?
6.34 Un par de dados se lanza 180 veces. Cul es la
probabilidad de que ocurra un total de 7
a) al menos 25 veces?
b) entre 33 y 41 veces?
c) exactamente 30 veces?
6.35 Una empresa produce partes componentes para
un motor. Las especificaciones de las partes sugieren
que slo 95% de los artculos las cumplen. Las partes
para los clientes se embarcan en lotes de 100.
a) Cul es la probabilidad de que ms de 2 artculos estn defectuosos en un lote determinado?
b) Cul es la probabilidad de que ms de 10 artculos de un lote estn defectuosos?
6.36 Una prctica comn por parte de las aerolneas
consiste en vender ms boletos que el nmero real de
asientos para un vuelo especfico porque los clientes
que compran boletos no siempre se presentan a abordar
el avin. Suponga que el porcentaje de pasajeros que
no se presentan a la hora del vuelo es de 2%. Para un
vuelo particular con 197 asientos, se vendieron un total

194

Captulo 6 Algunas distribuciones continuas de probabilidad

6.38 Una empresa de telemarketing tiene una mquina especial para abrir cartas que abre y extrae el contenido de los sobres. Si un sobre se colocara de forma
incorrecta en la mquina, no se podra extraer su contenido, o incluso se podra daar. En este caso se dice que
fall la mquina.
a) Si la probabilidad de que falle la mquina es de
0.01, cul es la probabilidad de que ocurra ms
de una falla en un lote de 20 sobres?
b) Si la probabilidad de que falle la mquina es de
0.01 y se abrir un lote de 500 sobres, cul es la
probabilidad de que ocurran ms de 8 fallas?

de 200 boletos. Cul es la probabilidad de que la aerolnea haya sobrevendido el vuelo?


6.37 El nivel X de colesterol en la sangre en muchachos de 14 aos tiene aproximadamente una distribucin normal, con una media de 170 y una desviacin
estndar de 30.
a) Determine la probabilidad de que el nivel de colesterol en la sangre de un muchacho de 14 aos elegido al azar exceda 230.
b) En una escuela secundaria hay 300 muchachos de
14 aos. Determine la probabilidad de que por lo
menos 8 de ellos tengan un nivel de colesterol superior a 230.

6.6

Distribucin gamma y distribucin exponencial


Aunque la distribucin normal se puede utilizar para resolver muchos problemas de ingeniera y ciencias, an hay numerosas situaciones que requieren diferentes tipos de
funciones de densidad. En esta seccin se estudiarn dos de estas funciones de densidad,
la distribucin gamma y la distribucin exponencial.
Resulta que la distribucin exponencial es un caso especial de la distribucin gamma,
y ambas tienen un gran nmero de aplicaciones. La distribucin exponencial y la distribucin gamma desempean un papel importante en la teora de colas y en problemas de
confiabilidad. Los tiempos entre llegadas en instalaciones de servicio y los tiempos de operacin antes de que partes componentes y sistemas elctricos empiecen a fallar a menudo
se representan bien mediante la distribucin exponencial. La relacin entre la distribucin gamma y la exponencial permite que la gamma se utilice en problemas similares.
En la siguiente seccin se presentarn ms detalles y ejemplos.
La distribucin gamma deriva su nombre de la bien conocida funcin gamma, que
se estudia en muchas reas de las matemticas. Antes de estudiar la distribucin gamma
repasaremos esta funcin y algunas de sus propiedades importantes.

Denicin 6.2: La funcin gamma se define como

() =

x 1 ex dx, para > 0.

Las siguientes son algunas propiedades sencillas de la funcin gamma.


a) (n) = (n 1)(n 2) (1) (1) para una integral positiva n.
Para ver la demostracin, al integrar por partes con u = x 1 y dv = ex dx , obtenemos
() = ex x 1

ex ( 1)x 2 dx = ( 1)

x 2 ex dx ,

para > 1, que produce la frmula recursiva


() = ( 1)( 1).
El resultado proviene de la aplicacin repetida de la frmula recursiva. Si utilizamos este
resultado, podemos demostrar con facilidad las siguientes dos propiedades.

6.6 Distribucin gamma y distribucin exponencial

195

b) (n) = (n 1)! para una integral positiva n.


c) (1) = 1.
Asimismo, tenemos la siguiente propiedad de (), que el lector deber verificar (vase
el ejercicio 6.39 de la pgina 206).
d ) (1/2) = .
A continuacin se define la distribucin gamma.
Distribucin La variable aleatoria continua X tiene una distribucin gamma, con parmetros y ,
gamma si su funcin de densidad est dada por
f (x ; , ) =

1
1 x/
e
,
( ) x

x > 0,

0,

en otro caso,

donde > 0 y > 0.


En la figura 6.28 se muestran grficas de varias distribuciones gamma para ciertos
valores especficos de los parmetros y . La distribucin gamma especial para la que
= 1 se llama distribucin exponencial.
f(x)
1.0

=1
=1
0.5

=2
=1

=4
=1

Figura 6.28: Distribuciones gamma.


Distribucin La variable aleatoria continua X tiene una distribucin exponencial, con parmetro ,
exponencial si su funcin de densidad es dada por
f (x ; ) =
donde > 0.

1 x/
,
e

0,

x > 0,
en otro caso,

196

Captulo 6 Algunas distribuciones continuas de probabilidad

El siguiente teorema y corolario proporcionan la media y la varianza de la distribucin


gamma y la exponencial.
Teorema 6.4: La media y la varianza de la distribucin gamma son
= y 2 = 2 .
La demostracin de este teorema se encuentra en el apndice A.26.
Corolario 6.1: La media y la varianza de la distribucin exponencial son
= y 2 = 2 .

Relacin con el proceso de Poisson


Continuaremos con las aplicaciones de la distribucin exponencial y despus regresaremos a la distribucin gamma. Las aplicaciones ms importantes de la distribucin exponencial son situaciones donde se aplica el proceso de Poisson (vase la seccin 5.5). El
lector debera recordar que el proceso de Poisson permite utilizar la distribucin discreta
llamada distribucin de Poisson. Recuerde que la distribucin de Poisson se utiliza para
calcular la probabilidad de nmeros especficos de eventos durante un periodo o espacio particulares. En muchas aplicaciones la variable aleatoria es el tiempo o la cantidad
de espacio. Por ejemplo, un ingeniero industrial se podra interesar en un modelo de
tiempo T entre las llegadas en una interseccin congestionada durante las horas de mayor afluencia en una ciudad grande. Una llegada representa el evento de Poisson.
La relacin entre la distribucin exponencial (a menudo denominada exponencial
negativa) y el proceso de Poisson es muy simple. En el captulo 5 la distribucin de
Poisson se desarroll como una distribucin de un solo parmetro con parmetro ,
donde se interpreta como el nmero medio de eventos por unidad de tiempo. Considere ahora la variable aleatoria descrita por el tiempo que se requiere para que ocurra
el primer evento. Si utilizamos la distribucin de Poisson, vemos que la probabilidad de
que no ocurra algn evento, en el periodo hasta el tiempo t, es dada por
p(0; t ) =

et ( t ) 0
= et .
0!

Ahora podemos utilizar lo anterior y hacer que X sea el tiempo para el primer evento de
Poisson. La probabilidad de que la duracin del tiempo hasta el primer evento exceda x
es la misma que la probabilidad de que no ocurra algn evento de Poisson en x. Esto
ltimo, por supuesto, es dado por e x. Como resultado,
P (X > x ) = ex .
As, la funcin de distribucin acumulativa para X es dada por
P (0 X x ) = 1 ex .
Ahora, para poder reconocer la presencia de la distribucin exponencial, podemos diferenciar la funcin de distribucin acumulativa anterior con el fin de obtener la funcin de
densidad

6.6 Distribucin gamma y distribucin exponencial

197

f (x ) = ex ,
que es la funcin de densidad de la distribucin exponencial con = 1/.

Aplicaciones de la distribucin exponencial y la distribucin gamma


En la explicacin anterior establecimos las bases para la aplicacin de la distribucin
exponencial en el tiempo de llegada o tiempo para problemas con eventos de Poisson.
Aqu ilustraremos algunas aplicaciones de modelado y despus procederemos a analizar
el papel que la distribucin gamma desempea en ellas. Observe que la media de la
distribucin exponencial es el parmetro , el recproco del parmetro en la distribucin
de Poisson. El lector debera recordar que con frecuencia se dice que la distribucin de
Poisson no tiene memoria, lo cual implica que las ocurrencias en periodos sucesivos son
independientes. El importante parmetro es el tiempo promedio entre eventos. En la
teora de confiabilidad, donde la falla de equipo con frecuencia se ajusta a este proceso
de Poisson, se denomina tiempo medio entre fallas. Muchas descomposturas de equipo siguen el proceso de Poisson y por ello se aplica la distribucin exponencial. Otras
aplicaciones incluyen tiempos de supervivencia en experimentos biomdicos y tiempo
de respuesta de computadoras.
En el siguiente ejemplo mostramos una aplicacin simple de la distribucin exponencial a un problema de confiabilidad. La distribucin binomial tambin desempea un
papel en la solucin.
Ejemplo 6.17: Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de operacin
antes de fallar, en aos, est dado por T. La variable aleatoria T se modela bien mediante
la distribucin exponencial con tiempo medio de operacin antes de fallar = 5. Si
se instalan 5 de estos componentes en diferentes sistemas, cul es la probabilidad de
que al final de 8 aos al menos dos an funcionen?
Solucin: La probabilidad de que un componente determinado siga funcionando despus de 8 aos
es dada por
P (T > 8) =

1
5

et/ 5 dt = e8/5 0.2.

Representemos con X el nmero de componentes que todava funcionan despus de


8 aos. Entonces, utilizando la distribucin binomial tenemos
5

b(x ; 5, 0.2) =1 0.7373 = 0.2627.

b(x ; 5, 0.2) =1

P (X 2) =
x =2

x =0

En el captulo 3 se incluyen ejercicios y ejemplos en los que el lector ya se enfrent


a la distribucin exponencial. Otros que implican problemas de tiempo de espera y de
confiabilidad se pueden encontrar en el ejemplo 6.24 y en los ejercicios y ejercicios
de repaso al final de este captulo.

La propiedad de falta de memoria y su efecto


en la distribucin exponencial
En los tipos de aplicacin de la distribucin exponencial en los problemas de confiabilidad y de tiempo de vida de una mquina o de un componente influye la propiedad de

198

Captulo 6 Algunas distribuciones continuas de probabilidad

falta de memoria de la distribucin exponencial. Por ejemplo, en el caso de, digamos,


un componente electrnico, en el que la distribucin del tiempo de vida es exponencial,
la probabilidad de que el componente dure, por ejemplo, t horas, es decir, P(X > t), es
igual que la probabilidad condicional
P (X t 0 + t | X t 0 ).
Entonces, si el componente alcanza las t0 horas, la probabilidad de que dure otras
t horas es igual que la probabilidad de que dure t horas. No hay castigo a travs del
desgaste como resultado de durar las primeras t0 horas. Por lo tanto, cuando la propiedad
de falta de memoria es justificada es ms adecuada la distribucin exponencial. Pero si
la falla del componente es resultado del desgaste lento o gradual (como en el caso del
desgaste mecnico), entonces la distribucin exponencial no es aplicable y seran ms
adecuadas la distribucin gamma o la de Weibull (seccin 6.10).
La importancia de la distribucin gamma radica en el hecho de que define una familia en la cual otras distribuciones son casos especiales. Pero la propia distribucin gamma
tiene aplicaciones importantes en tiempo de espera y teora de confiabilidad. Mientras
que la distribucin exponencial describe el tiempo que transcurre hasta la ocurrencia de
un evento de Poisson (o el tiempo entre eventos de Poisson), el tiempo (o espacio) que
transcurre hasta que ocurre un nmero especfico de eventos de Poisson es una variable
aleatoria, cuya funcin de densidad es descrita por la distribucin gamma. Este nmero
especfico de eventos es el parmetro en la funcin de densidad gamma. De esta manera se facilita comprender que cuando = 1, ocurre el caso especial de la distribucin
exponencial. La densidad gamma se puede desarrollar a partir de su relacin con el proceso de Poisson de la misma manera en que lo hicimos con la densidad exponencial. Los
detalles se dejan al lector. El siguiente es un ejemplo numrico de cmo se utiliza la
distribucin gamma en una aplicacin de tiempo de espera.
Ejemplo 6.18: Suponga que las llamadas telefnicas que llegan a un conmutador particular siguen un
proceso de Poisson con un promedio de 5 llamadas entrantes por minuto. Cul es la
probabilidad de que transcurra hasta un minuto en el momento en que han entrado 2
llamadas al conmutador?
Solucin: Se aplica el proceso de Poisson, con un lapso de tiempo hasta que ocurren 2 eventos de
Poisson que sigue una distribucin gamma con = 1/5 y = 2. Denote con X el tiempo en minutos que transcurre antes de que lleguen 2 llamadas. La probabilidad que se
requiere est dada por
1

P (X 1) =
0

1 x/
xe
dx = 25
2

xe 5x dx = 1 e5 (1 + 5) = 0.96.

Mientras el origen de la distribucin gamma trata con el tiempo (o espacio) hasta la


ocurrencia de eventos de Poisson, hay muchos ejemplos donde una distribucin gamma
funciona muy bien aunque no exista una estructura de Poisson clara. Esto es particularmente cierto para problemas de tiempo de supervivencia en aplicaciones de ingeniera y biomdicas.
Ejemplo 6.19: En un estudio biomdico con ratas se utiliza una investigacin de respuesta a la dosis para
determinar el efecto de la dosis de un txico en su tiempo de supervivencia. El txico es
producido por el combustible que utilizan los aviones y, en consecuencia, descargan con
frecuencia a la atmsfera. Para cierta dosis del txico, el estudio determina que el tiempo
de supervivencia de las ratas, en semanas, tiene una distribucin gamma con = 5 y = 10.
Cul es la probabilidad de que una rata no sobreviva ms de 60 semanas?

6.6 Distribucin gamma y distribucin exponencial

199

Solucin: Sea la variable aleatoria X el tiempo de supervivencia (tiempo hasta la muerte). La probabilidad que se requiere es
60 1 x/
1
x
e
P (X 60) = 5
dx .
0
(5)
La integral anterior se puede resolver mediante la funcin gamma incompleta, que se
convierte en la funcin de distribucin acumulativa para la distribucin gamma. Esta
funcin se escribe como
x 1 y
y
e
dy.
F (x ; ) =
()
0
Si permitimos que y = x/, de modo que x = y, tenemos
6

P (X 60) =
0

y 4 ey
dy,
(5)

que se denota como F(6; 5) en la tabla de la funcin gamma incompleta del apndice
A.23. Observe que esto permite un clculo rpido de las probabilidades para la distribucin gamma. De hecho, para este problema la probabilidad de que la rata no sobreviva
ms de 60 das es dada por
P (X 60) = F (6; 5) = 0.715.
Ejemplo 6.20: A partir de datos previos se sabe que la longitud de tiempo, en meses, entre las quejas de
los clientes sobre cierto producto es una distribucin gamma con = 2 y = 4. Se
realizaron cambios para hacer ms estrictos los requerimientos del control de calidad
despus de los cuales pasaron 20 meses antes de la primera queja. Parecera que los
cambios realizados en el control de calidad resultaron eficaces?
Solucin: Sea X el tiempo para que se presente la primera queja, el cual, en las condiciones anteriores a los cambios, segua una distribucin gamma con = 2 y = 4. La pregunta se
centra alrededor de qu tan raro es X 20 dado que y permanecen con los valores 2
y 4, repectivamente. En otras palabras, en las condiciones anteriores es razonable un
tiempo para la queja tan grande como 20 meses? Por consiguiente, si seguimos la solucin del ejemplo 6.19,
20 1 x/
x
e
1
P (X 20) = 1
dx .
0
()
De nuevo, usando y = x/ tenemos
5

P (X 20) = 1
0

ye y
dy = 1 F (5; 2) = 1 0.96 = 0.04,
(2)

donde F(5; 2) = 0.96 se obtiene de la tabla A.23.


Como resultado, podramos concluir que las condiciones de la distribucin gamma
con = 2 y = 4 no son sustentadas por los datos de que un tiempo observado para la
queja sea tan extenso como 20 meses. Entonces, es razonable concluir que el trabajo de
control de calidad result eficaz.
Ejemplo 6.21: Considere el ejercicio 3.31 de la pgina 94. Con base en abundantes pruebas se determin que el tiempo Y en aos antes de que se requiera una reparacin mayor para cierta
lavadora se caracteriza por la funcin de densidad
f (y) =

1 y/ 4
,
4e

0,

y 0,
en otro caso.

200

Captulo 6 Algunas distribuciones continuas de probabilidad

Observe que Y es una variable aleatoria exponencial con = 4 aos. Se considera que la
lavadora es una ganga si no hay probabilidades de que requiera una reparacin mayor
antes de cumplir 6 aos de haber sido comprada. Cul es la probabilidad de P(Y > 6)?
Cul es la probabilidad de que la lavadora requiera una reparacin mayor durante el
primer ao?
Solucin: Considere la funcin de distribucin acumulativa F(y) para la distribucin exponencial,
F (y) =

et/ dt = 1 ey/ .

De manera que
P (Y > 6) = 1 F (6) = e3/2 = 0.2231.
Por lo tanto, la probabilidad de que la lavadora requiera una reparacin mayor despus
de seis aos es de 0.223. Desde luego, la probabilidad de que requiera reparacin antes del
sexto ao es de 0.777. As, se podra concluir que la lavadora no es realmente una ganga.
La probabilidad de que se requiera una reparacin mayor durante el primer ao es
P (Y < 1) = 1 e1/4 = 1 0.779 = 0.221.

6.7

Distribucin chi cuadrada


Otro caso especial muy importante de la distribucin gamma se obtiene al permitir que
= v/2 y = 2, donde v es un entero positivo. Este resultado se conoce como distribucin chi cuadrada. La distribucin tiene un solo parmetro, v, denominado grados
de libertad.
Distribucin La variable aleatoria continua X tiene una distribucin chi cuadrada, con v grados de
chi cuadrada libertad, si su funcin de densidad es dada por
f (x ; v) =

1
2 v/ 2 ( v/ 2)

x v/ 21 ex/ 2 ,

0,

x > 0,
en otro caso,

donde v es un entero positivo.


La distribucin chi cuadrada desempea un papel fundamental en la inferencia estadstica. Tiene una aplicacin considerable tanto en la metodologa como en la teora.
Aunque no estudiaremos con detalle sus aplicaciones en este captulo, es importante
tener en cuenta que los captulos 8, 9 y 16 contienen aplicaciones importantes. La distribucin chi cuadrada es un componente importante de la prueba estadstica de hiptesis
y de la estimacin estadstica.
Los temas en los que se trata con distribuciones de muestreo, anlisis de varianza y
estadstica no paramtrica implican el uso extenso de la distribucin chi cuadrada.
Teorema 6.5: La media y la varianza de la distribucin chi cuadrada son
= v y 2 = 2v.

Pr
actico 1: Distribuciones continuas.
Ejercicio 1. Se consideran las siguientes funciones reales
(
c1 x
f1 (x) =
0

si x (0, 1)
si x
6 (0, 1)

c x2
2
f2 (x) =

c2 x

si
si
si
si

x<1
x [1, 2]
x (2, 3)
x3

1. Hallar las constantes para que f1 y f2 sean funciones de densidad.


2. Sean X1 , X2 v.a. con dendidades f1 y f2 respectivamente. Hallar las distribuciones de X1 y X2 .
Hallar P (0, 3 < X1 < 0, 6) y P (X2 > 2).

Ejercicio 2. En pruebas de medicion de distancia de frenado de automoviles, los vehculos que viajan
a determinada velocidad tienden a recorrer distancias de frenado que estan distribudas uniformemente
entre dos puntos a y b. Calcular la probabilidad de que uno de estos automoviles:
1. se detenga m
as cerca de a que de b.
2. se detenga de tal modo que la distancia a a sea por lo menos tres veces mayor que la distancia a b.

Ejercicio 3.

1. Sea Z una v.a. con distribucion normal estandar. Hallar la probabilidad de que Z
sea mayor a 1, 84 y de que Z este entre 1, 97 y 0, 86.

2. Sea Z una v.a. con distribuci


on normal estandar. Hallar k tal que P (Z > k) = 0, 3015 y P (k <
Z < 0, 18) = 0, 4197.
3. Sea X N (40, 36). Hallar el valor de x que deja el 45 % del area a su izquierda, hallar el valor de
x que deja el 14 % del
area a su derecha.

Ejercicio 4. En un proceso industrial, el diametro de un balero es parte importante de un componente.


El comprador establece en sus especificaciones que el diametro debe ser de 3, 0 0, 01cm. Por lo tanto,
no se acepta ning
un balero que se salga de dicha especificacion. Se sabe que en el proceso de producci
on,
dicho di
ametro tiene distribuci
on normal con media = 3, 0cm y desvo estandar de = 0, 005cm. En
pronedio que porcentaje de baleros fabricados se descartaran?

Ejercicio 5. El tiempo de vida en anos, T , de cierto aparato electronico se distribuye exponencialmente


con tasa = 0, 01. Si el fabricante quiere garantizar que la duracion de dichos aparatos superara los t0
a
nos con probabilidad 0, 9:
1. determinar t0 .
2. si se tienen cinco de estos aparatos funcionando independientemente, cual es la probabilidad de
que al menos dos de ellos contin
uen funcionando despues de t0 a
nos?
3. Hallar la distribuci
on de Y := mn{T, t0 }, Que tipo de v.a. es Y ?

Ejercicio 6. Sea T una v.a. con distribucion exp().


1. Probar que P (T > s + t | T > s) = P (T > t) para todos s, t > 0. Esta propiedad se conoce como
perdida de memoria.

IPC - Matematica - PyE II - 2014

Pr
actico 2: Momentos y F.G.M.
Ejercicio 1. Considere una variable aleatoria discreta X tal que P (X = 2k ) =

1
,
2k+1

k N. Pruebe que

su momento absoluto de primer orden no existe.

Ejercicio 2. Sea X una v.a. discreta con P (X = 2) = P (X = 0) = 1/5; P (X = 1) = 1/6;


P (X = 1) = 1/15; P (X = 2) = 11/30. Hallar la esperanza y varianza de las variables:
1. Y = 2X + 1

2. Y = X 2

3. Y = X 3

Ejercicio 3. Hallar la esperanza y varianza de la v.a. X por definicion y a partir de la funcion generatriz
de momentos:
1. X Ber(p).

2. X exp().

3. X N (, )

Ejercicio 4. Hallar la funcion generatriz de momentos de la variable aleatoria X de Poisson. Utilizarla


para verificar que E(X) = y que V ar(X) = .

Ejercicio 5. Sean X1 , X2 , . . . , Xn v.a.i.i.d. con f.g.m. M (t).


1. Sea Sn = X1 + + Xn . Probar que MSn (t) = (M (t))n .
2. Si se tiene n variables aleatorias normales N (0, 2 ): que distribucion tiene la variable suma de
ellas? (la suma de variables normales es otra variable normal?).
3. Si se tiene n variables aleatorias normales N (, 2 ): que distribucion tiene la variable suma de
ellas?
4. Probar que, en general, toda combinacion lineal de v.a. normales independientes es una v.a. normal.
Determinar los par
ametros.
5. Probar que una suma de v.a. de Poisson independientes es una v.a. de Poisson.

Ejercicio 6. Supongase que la duracion en minutos de una llamada de negocios, es una variable aleatoria
cuya funci
on de densidad de probabilidad esta determinada por:
(
1 x/4
e
si x > 0
f (x) = 4
0
otro caso
Determinar E(X) y V ar(X) utilizando la definicion y mediante la funcion generatriz de momentos.

01_Estadistica.qxd

2/17/05

16:06

Page 13

ESTADSTICA APLICADA A LOS NEGOCIOS


UTILIZANDO MICROSOFT EXCEL

Captulo

Introduccin
a la Estadstica
Recopilar, describir, organizar
e interpretar datos para transformarlos
en informacin, nos permite tomar
decisiones de una manera ms
eficiente. En este captulo veremos
cules son las formas de recopilar
datos, distintos tipos de estudios
estadsticos y mtodos de anlisis.

SERVICIO DE ATENCIN AL LECTOR: lectores@tectimes.com

Qu es la Estadstica?
Recopilacin de datos
Estudios y mtodos estadsticos
Algunas definiciones
Inicio de una investigacin
Resumen
Actividades

14
15
16
18
21
22
24

01_Estadistica.qxd

2/17/05

16:06

Page 14

ESTADSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL

QU ES LA ESTADSTICA?
Con el objetivo de introducirnos en el estudio de la Estadstica, le proponemos que lea las siguientes definiciones:
El contenido de la estadstica moderna incluye la recopilacin, presentacin y caracterizacin de la informacin a fin de que auxilie tanto en
el anlisis de datos como en el proceso de toma de decisiones.(1)
La estadstica, como campo de estudio, es el arte y la ciencia de dar sentido a los datos numricos.(2)
La estadstica se define a menudo como un conjunto de mtodos para
la toma de decisiones en condiciones de incertidumbre.(3)
La estadstica estudia el comportamiento de los fenmenos llamados de
colectivo. Est caracterizada por una informacin acerca de un colectivo
o universo, lo que constituye su objeto material; un modo propio de razonamiento, el mtodo estadstico, lo que constituye su objeto formal, y
unas previsiones de cara al futuro, lo que implica un ambiente de incertidumbre, que constituyen su objeto o causa final.(4)
La estadstica es el estudio de los fenmenos aleatorios. [] El aspecto
ms importante de la estadstica es la obtencin de conclusiones basadas
en los datos experimentales.(5)
Qu palabras clave resaltara de estas citas?
Aportamos algunas: experimento, fenmeno, datos, informacin, mtodos, tcnicas, toma de decisiones, incertidumbre.
(1) Berenson, M y Levine, D. Estadstica bsica en administracin. Prentince-Hall Hispanoamericana,
4ta. Ed., 1992.
(2) Hildebrand, D. y Ott, L. Estadstica Aplicada a la Administracin y a la Economa.
Addison-Wesley Iberoamerica, 3ra. Ed., 1997.
(3) Harnett, D. y Murphy, J. Introduccin al Anlisis Estadstico. Addison-Wesley Iberoamerica, 1987.
(4) Cabri, 1994, en Didctica de la Estadstica, Batanero, P. 2001.
(5) Canavos, G. Probabilidad y Estadstica. McGraw Hill, 1988.

14

01_Estadistica.qxd

2/17/05

16:06

Page 15

Recopilacin de datos
Si bien la recopilacin de datos es un tema que merece un prrafo aparte sobre
el que haremos algunas consideraciones en el Captulo 6, podemos anticipar
que stos pueden ser generados por el propio interesado, o bien haber sido recopilados por un tercero, ya sea un individuo o una organizacin. En el primer caso, la fuente de datos se denomina primaria, y en el segundo caso, secundaria.
En ambas situaciones, los datos pueden ser generados bsicamente de tres
maneras (Figura 1):
1. A travs de la realizacin de un censo.
2. Tomando una muestra.
3. Diseando un experimento.
Contar con datos censales implica que el interesado logr observar o medir
todas las unidades o sujetos de interes existentes. Sin embargo, en muchas situaciones prcticas, no es posible acceder a todas las unidades existentes, por
ser una tarea costosa, ardua y en ocasiones hasta imposible, o bien porque la
medicin destruira a la unidad o sujeto en estudio.
Imagina por ejemplo un censo sobre los insectos de cierta especie? En tal caso ser ms conveniente cuando no, el nico camino obtener los datos a
travs de la medicin u observacin de una porcin de las unidades existentes, es decir, tomando una muestra.
El tamao de la poblacin a estudiar juega un papel crucial al momento de
decidir de qu manera se han de recopilar datos: si la poblacin es infinita o
finita pero de gran tamao, la muestra ser la manera ms razonable y eficiente de recopilar datos. O, cmo controlara la calidad de los envases de vidrio
salidos de la produccin de una pequea fbrica? Si se trata del aspecto esttico, podra contar las burbujas de cada envase para clasificar cada pieza pro15

Introduccin a la estadstica

Estas claves nos guiarn a travs de las prximas pginas, en las que profundizaremos en temas tales como la obtencin de datos y los mtodos estadsticos que permiten la interpretacin de los datos recopilados, haciendo hincapi en el hecho de que habitualmente nos enfrentamos a situaciones en las
que debemos tomar decisiones, tanto en el mbito laboral o profesional como en la vida cotidiana, y contamos slo con informacin parcial, lo que nos
coloca en un escenario de incertidumbre.

Qu es la Estadstica?

01_Estadistica.qxd

2/17/05

16:06

Page 16

ESTADSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL

ducida. Si, en cambio, deseara estudiar la resistencia de la materia prima, intentara usted romper cada pieza fabricada? Ya sea por ahorro de tiempo o
bien por pruebas destructivas una muestra de piezas para control de calidad
es la forma de recopilacin ms razonable en muchos casos.
En otros casos es necesario que el investigador genere sus propios datos interviniendo directamente, por lo que ser preciso que disee un experimento a
la medida de sus necesidades.

Figura 1. Cmo reunir datos?

Antes de seguir adelante, le sugerimos que realice la Actividad 1 que encontrar


al final del captulo, con la que podr aplicar los conceptos hasta aqu expuestos.

Estudios y mtodos estadsticos


Ya sea que los datos se hayan generado a partir de un censo o una muestra,
podemos realizar estudios observacionales, midiendo u observando las unidades o sujetos y registrando las caractersticas de inters.
Los estudios observacionales pueden ser retrospectivos o prospectivos, segn evalen situaciones pasadas en busca de una explicacin en acontecimientos actua16

01_Estadistica.qxd

2/17/05

16:06

Page 17

Por otra parte, el objetivo perseguido por el analista puede dar lugar a otra tipologa de estudios estadsticos. Ellos son los estudios exploratorios y los
confirmatorios (Figura 2). Los primeros se aplican cuando se desea buscar un
modelo que explique o describa convenientemente el comportamiento de alguna variable, la relacin entre variables o grupos de sujetos, etc. En cambio,
los estudios confirmatorios se orientan a la verificacin de la compatibilidad
de un conjunto de datos con respecto a un modelo supuesto previamente.

Figura 2. Qu variedad de estudios estadsticos hay?

17

Introduccin a la estadstica

les, o bien realicen un seguimiento en el futuro de los efectos de alguna circunstancia observada en el presente o en el pasado. Un ejemplo de estudio retrospectivo es la recopilacin de informacin sobre la capacitacin y estilo de liderazgo
de ejecutivos que, actualmente, se reconocen como exitosos. Un ejemplo de estudio prospectivo es el registro sistemtico de informacin sobre la capacitacin
y estilo de liderazgo de actuales profesionales novatos con el fin de establecer el
grado de xito profesional que alcanzan en el momento de su retiro.
Si, en cambio, el investigador disea un experimento a medida, que consiste
en aplicar uno o ms tratamientos a las unidades o sujetos, y observa la respuesta, se encaminar hacia un tipo de estudio experimental.

Qu es la Estadstica?

01_Estadistica.qxd

2/17/05

16:06

Page 18

ESTADSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL

Para llevar adelante alguno de los estudios mencionados, la Estadstica nos


provee de una variedad de mtodos que podramos clasificar en univariados
y multivariados, dependiendo de la cantidad de variables que se analizan simultneamente (Figura 3).
Si nos ocupa el anlisis de uno o varios conjuntos de datos de la misma variable,
contamos con mtodos grficos y numricos que rene la rama de la Estadstica
que se conoce como estadstica descriptiva (que trataremos en el Captulo 2),
o bien aquella rama conocida como estadstica inferencial, que facilita la toma
de decisiones bajo condiciones de incertidumbre a travs de las pruebas de hiptesis y las estimaciones (esta ltima ser desarrollada en el Captulo 6).
Si nos ocupa el anlisis de dos conjuntos de variables denominadas explicativas y explicadas, nos sern de utilidad los mtodos de regresin (alguno de los
cuales se podr consultar en el Captulo 3); mientras que los mtodos factoriales nos permiten analizar un nico conjunto de variables explicativas como
el anlisis de clusters, de componentes principales y anlisis discriminante,
entre otros (tcnicas que estn fuera del alcance de este texto).

Figura 3. Qu mtodos de anlisis de datos ofrece la Estadstica?

La Actividad 2 propuesta al final del captulo est diseada para que aplique
los temas tratados en este pargrafo.

ALGUNAS DEFINICIONES
En las pginas previas hemos utilizado algunos vocablos que, si bien pueden resultar familiares, es conveniente definir con una mayor precisin.
18

01_Estadistica.qxd

2/17/05

16:06

Page 19

Por su parte, una unidad elemental es cada objeto o sujeto que observamos de
la poblacin. En nuestro ejemplo, una unidad elemental es cada individuo que
se atendi en el saln de belleza dos veces o ms en los ltimos doce meses.
Si a cada persona que requiri los servicios del saln de belleza se le completa una ficha donde consta la fecha de cada visita, podremos fcilmente identificar a aquellos que forman parte de la poblacin. Concretamente observaremos la cantidad de veces que cada cliente tom algn servicio en el ao: si
es 1 o menos, lo descartaremos; si es 2 o ms, ser considerado con atencin
a los fines del estudio, porque forma parte de la poblacin bajo anlisis.
Aquella caracterstica que se observa o se mide sobre las unidades elementales se denomina variable.
Por supuesto, podramos reunir datos sobre otras variables relacionadas con
los clientes del saln de belleza. Contando con un fichero actualizado, podramos recopilar informacin relevante como, por ejemplo, qu servicios tom
cada cliente en cada visita o el gasto que efectu.
Observe que las variables del ejemplo son bastante diferentes entre s; en realidad son de distinto tipo y se miden en diferente escala.
El tipo de servicio tomado por cada cliente se clasifica como variable cualitativa o categrica; no toma valores numricos, sino que asume categoras
como podran ser tratamiento capilar, tratamiento dermatolgico, manicura, etc. La variable de este ejemplo en particular est medida en escala nominal, por cuanto cada unidad de la escala representa una categora diferente y entre ellas no guardan una relacin de magnitud. En otras palabras, pa19

Introduccin a la estadstica

Con este objetivo, repasemos los procedimientos bsicos de recopilacin de


datos. Mencionamos oportunamente que tales procedimientos eran tres: los
censos, las muestras y los experimentos. Una pregunta bsica que hemos de
hacernos antes de decidir entre ellos es cul es la poblacin de inters? Una
de las acepciones de la palabra poblacin se refiere al conjunto de unidades elementales con caractersticas comunes observables.
Si, por ejemplo, nos proponemos conocer la frecuencia con que los clientes
de un saln de belleza demandan algn servicio, razonamos que la poblacin
en estudio se compone de todos los clientes actuales del negocio, que quiz representen para nosotros el conjunto de sujetos que se atendieron en el saln de belleza al menos dos veces en el ltimo ao. Por supuesto, una muestra es un subconjunto de unidades elementales tomadas de la poblacin.

Algunas definiciones

01_Estadistica.qxd

2/17/05

16:06

Page 20

ESTADSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL

ra la variable tipo de servicio tomado por cada cliente, la categora tratamiento capilar no es ms ni menos importante que la categora tratamiento dermatolgico. Otros ejemplos de variables medidas en escala nominal
son las distintas marcas de gaseosa o las nacionalidades.
Si, en cambio, las categoras de una variable guardan un cierto orden de importancia, como tratamiento sencillo, tratamiento vip, tal variable est
medida en escala ordinal. En esta escala de medicin es posible establecer relaciones del tipo A>B, A=B o A<B, aunque no informa acerca de la magnitud
de las diferencias entre categoras. No podramos afirmar que el tratamiento
vip es el doble de importante que el sencillo, o bien que un alumno excelente es el triple de bueno que un alumno regular.
Debemos saber que aquellas variables que se midan en escala nominal u ordinal no nos permitirn realizar clculos matemticos y que, a lo sumo, contaremos con el nmero de individuos que se clasifican en una u otra categora.
Por otra parte, si consideramos la variable cantidad de veces que cada
cliente se atendi en el saln de belleza en el ltimo ao, observamos que
puede asumir valores numricos, aunque no cualquier valor. Se trata de una
variable cuantitativa, que a su vez se subclasifica como discreta para el
ejemplo. Se define como aquella variable que no puede ser particionada infinitamente dentro de un intervalo. Si es nuestro inters analizar el monto
pagado en cada visita al saln de belleza, tambin clasificaremos la variable
como cuantitativa; sin embargo, razonamos que dentro de un rango, en realidad hay infinitos valores posibles, por lo tanto se trata de una variable
cuantitativa continua. Este tipo de variables puede ser particionado infinitamente dentro de un intervalo.
Las variables cuantitativas pueden estar medidas en escala de intervalos o en escala de razn. La escala de intervalos representa un nivel superior de medicin con
respecto al de la escala ordinal. Adems de permitir relaciones del tipo A>B, A=B, o
A<B, es posible comparar intervalos de valores debido a que a lo largo de toda la
escala, dos valores adyacentes representan siempre la misma diferencia de magnitud, por lo que es posible realizar comparaciones del tipo A-B=C-D, A-B < C-D, o
A-B > C-D. Una particularidad de esta escala es que el valor cero es arbitrario. Un
ejemplo de aplicacin de esta escala lo representan los horarios de llegada de los
empleados de una compaa. Entre las 8 y las 9 am existe la misma diferencia que
entre las 4 y las 5 pm, pero no puede afirmarse que quien lleg a las 8 pm haya
arribado el doble de tarde que el que ingres a las 8 am. Incluso la hora cero no indica especialmente nada, como ausencia del empleado.
20

01_Estadistica.qxd

2/17/05

16:06

Page 21

Le proponemos realizar la Actividad 3, con la que usted podr poner en prctica los conceptos del presente captulo.

Inicio de una investigacin


El xito de una investigacin radica en buena parte en el cuidadoso diseo previo al trabajo de campo orientado a la obtencin de datos. Para ello el investigador debe tener respuestas claras a cuestiones trascendentes como las que siguen:
Cul o cules son los objetivos de la investigacin?
Resolver un problema? Se tienen soluciones provisorias?
Tomar decisiones? Cules son los caminos de accin posibles?
Incrementar el conocimiento sobre algn tema de inters?
Adhiere el investigador a alguna teora conocida?
Hay un objetivo general y uno o ms objetivos especficos?
21

Introduccin a la estadstica

El nivel ms alto de medicin es la escala de razn. Adems de tener las propiedades de las otras escalas, tiene un cero absoluto, por lo tanto es posible calcular proporciones entre los valores de la escala. As puede establecerse que, por
ejemplo, un individuo de 40 aos tiene el doble de edad de uno de 20 aos,
que entre 20 y 21 aos existe la misma diferencia etaria que entre 40 y 41 aos,
y tambin que un sujeto de 40 aos es mayor que uno de 20. De manera que
sobre esta escala es posible realizar todas las operaciones matemticas asociadas
a los nmeros (suma, resta, multiplicacin y divisin). Relaciones similares podran realizarse sobre variables como la remuneracin, la estatura o el precio de
cierto artculo, que siendo variables cuantitativas, en ocasiones y por cuestiones prcticas, pueden discretizarse y hasta categorizarse modifcando
su escala de medicin original. La correcta clasificacin de las variables en estudio, as como la definicin de la escala de medicin, orientar al investigador
sobre las tcnicas estadsticas ms adecuadas para analizarlas.
En pginas anteriores anticipamos que la palabra poblacin tiene dos acepciones. Mencionamos una de ellas para la que poblacin representa el conjunto completo de objetos o sujetos bajo anlisis. La otra acepcin del vocablo se relaciona con el conjunto completo de valores que toma una variable
en un universo. Tal conjunto puede ser descrito y resumido con una serie de
medidas descriptivas denominadas parmetros, mientras que a las medidas
descriptivas de datos muestrales se las llama estimadores o estadgrafos.

Algunas definiciones

01_Estadistica.qxd

2/17/05

16:06

Page 22

ESTADSTICA APLICADA A LOS NEGOCIOS UTILIZANDO MICROSOFT EXCEL

Qu tipo de estudio se llevar a cabo?


Cul es la poblacin de inters?
O bien se trata de comparar dos o ms poblaciones?
Cules son las unidades elementales?
La poblacin es infinita o finita? Es accesible?
Qu variables pueden proveer la informacin para satisfacer el objetivo?
Qu instrumento de medicin es ms adecuado para medir las variables?
En qu escala sern medidas?
Cmo se recopilar la informacin?
Hay informacin disponible, accesible y actualizada, o bien se la debe recoger o generar?
La accesibilidad y los recursos disponibles son suficientes para hacer un censo?
Qu mtodo de seleccin de muestras es ms apropiado?
De qu tamao ser la muestra?
Qu diseo de experimento se adecua ms a los recursos disponibles?
Qu herramientas estadsticas son aplicables al caso?
Se estudia una o ms variables? Cmo se clasifican?
Se estudia una o ms poblaciones?
Habr notado el lector que al iniciar una investigacin en cualquier campo
cientfico, comercial, acadmico, etc. resulta imprescindible contar con ciertos conceptos elementales: como mnimo, los que presentamos en este captulo.
Podramos continuar la lista, pero apostamos a que, a medida que el lector
avance en la lectura, sea capaz de enriquecerla por s mismo.

RESUMEN
Seguramente usted tenga la habilidad de integrar los conceptos que abordamos en este
captulo. Por nuestra parte le facilitamos un diagrama, que se encuentra en la pgina siguiente, que tiene el objetivo de resumir los puntos tratados de manera esquemtica.

22

16:06

Page 23

2/17/05

Introduccin a la estadstica

01_Estadistica.qxd

23

01_Estadistica.qxd

2/17/05

16:06

Page 24

ACTIVIDADES
1 Para las siguientes propuestas, decida de qu manera recopilara los datos y a qu tipo de fuente recurrira:
a. Objetivo: estudiar la evolucin de la cotizacin de las acciones de cierta fbrica automotriz en el ltimo ao.
b. Objetivo: conocer la frecuencia de compra de los clientes de su propio negocio.
c. Objetivo: analizar los efectos de un nuevo analgsico.
2 Para las siguientes propuestas, decida qu tipo de estudio estadstico efectuara y qu
mtodo/s podra aplicar para el anlisis de datos:
a. Usted es un comerciante y desea estudiar el comportamiento de las ventas en su
negocio en funcin de su inversin en publicidad y la cotizacin del dlar.
b. En una investigacin sobre tabaquismo se desea analizar los efectos a largo plazo
de tal hbito sobre el sistema respiratorio.
c. Un fabricante de ropa deportiva desea conocer el perfil de sus clientes.
3 Lea las siguientes variables e intente identificar la poblacin en estudio, las unidades
elementales, su unidad de medida y su escala de medicin:
a. Lugar de origen de los pasajeros de cierta empresa de aviacin arribados en el ltimo vuelo al aeropuerto internacional de Barajas.
b. Nmero de canciones de un CD.
c. Temperatura mxima diaria en Caracas durante el ltimo mes.

24

6. Muestreo
La forma en que se realiza la seleccin puede hacer la diferencia. Es ms fcil obtener muestras malas que buenas.
No todo es tan simple como tomar sopa.
En la Seccin 5.3 consideramos un estudio, realizado por un profesor universitario entre sus alumnos, para evaluar si los jvenes que practican deportes consumen menos
alcohol. Este es un ejemplo de participacin voluntaria en un estudio, la muestra no es
representativa de la poblacin de inters.
Recordemos un ejemplo de la Seccin 3.1. Interesaba conocer las
opiniones respecto a si el correo electrnico debe responderse lo
ms rpido posible o no. Si la encuesta fue realizada va el correo
electrnico, las opiniones representan nicamente a los que tienen
correo electrnico y les interes responder la encuesta.

La prxima vez que se encuentre con un


resultado de un estudio, averige qu composicin tena la muestra y pregntese si la
muestra representa a la poblacin que interesa o a un subgrupo ms restringido.

6.1 Muestreo aleatorio simple


Es bueno que la muestra se seleccione en forma aleatoria; esto signica que:
Cada uno de los individuos de la poblacin tiene la misma oportunidad de ser seleccionado.

Se utiliza algn mecanismo probabilstico para elegirlos.


La gente no se selecciona a s misma para participar.
Nadie en la poblacin es favorecido en el proceso de seleccin.
Muestra aleatoria simple: Una muestra aleatoria simple es la que se obtiene a partir de un mecanismo que le da a cada una de las unidades muestrales la misma probabilidad de ser elegida.

El muestreo aleatorio (el proceso por el cual se obtiene una muestra aleatoria) comienza
con una lista de unidades muestrales de la que se extraer la muestra. Esta lista se llama
marco muestral. Idealmente, el marco muestral debera contener la lista de la totalidad
de las unidades muestrales.
El muestreo aleatorio simple tiene dos propiedades que lo convierten en el procedimiento por excelencia de obtencin de muestras.
Muestreo

29

Todas las unidades tienen la misma oportunidad de ser elegidas (es insesgado).
La eleccin de una unidad no inuye sobre la eleccin de otra (independencia).
El Instituto Nacional de Estadsticas y
Censos - INDEC - realiza peridicamente censos para registrar las caractersticas bsicas sobre poblacin y vivienda,
actividad econmica y agropecuaria de
nuestro pas. Las unidades relevadas en
los censos proveen el marco muestral
para las encuestas que realiza durante
los perodos intercensales.

Se espera que el muestreo aleatorio provea muestras representativas


de la poblacin.
Mediante un censo se intenta registrar todas las unidades muestrales
de la poblacin para proveer el marco muestral. Si se trata de un
censo de poblacin, debern localizarse todas las personas. Si se trata
de un censo econmico, se registrarn todos los locales comerciales
y productivos. Una vez que se dispone del marco muestral se abre la
oportunidad de seleccionar la muestra.

Por otra parte, es necesario aclarar que una unidad muestral puede contener muchos individuos. Una escuela, con sus alumnos, puede ser una unidad muestral. El
objetivo del estudio pueden ser las escuelas (por ej. interesa conocer la supercie cubierta por
alumno) o ser los alumnos (por ej. interesa conocer el rendimiento en educacin fsica).

Mm!

Aj!

Cmo? Una unidad muestral puede estar constituida por muchos individuos?
Volvamos al ejemplo de la encuesta sobre la preferencia del candidato a presidente
del Club Grande de Ftbol. Utilicemos la lista actualizada de todos los socios como
marco muestral con los nmeros de socio para identicarlos. Si se decide que 1 de
cada 6 socios entrarn en la muestra podemos arrojar un dado tantas veces como
socios tenemos en la lista y si sale 1 el socio es seleccionado.

30

Estadstica para todos

TABLA 6.1

Socio
Nmero
1495
1496
1497

Nmero
aleatorio
4
8
8

Socio
Nmero
1.501
1.502
1.503

Nmero
aleatorio
1
6
3

Socio
Nmero
1.507
1.508
1.509

Nmero
aleatorio
4
4
3

Socio
Nmero
1.513
1.514
1.515

Nmero
aleatorio
4
7
8

1498

1.504

1.510

1.516

1499
1500

9
5

1.505
1.506

1
7

1.511
1.512

1
7

1.517
1.518

1
3

Con este procedimiento, seleccionamos los socios no: 1.501, 1.505, 1.511 y 1.517 mediante
un muestreo aleatorio simple.
Tambin podramos utilizar un programa de computadora para generar nmeros entre
1 y 6 en forma aleatoria, sin necesidad de arrojar un dado.
Muestra aleatoria simple en dos pasos :
Paso 1. Se asigna una etiqueta numrica a cada individuo de la poblacin.
Paso 2: Se utilizan nmeros aleatorios para seleccionar las etiquetas al azar.

En la prctica, el primer paso del procedimiento es el ms difcil. Esta dicultad da lugar a


muestreos alternativos que no son vlidos desde el punto de vista del anlisis estadstico.
Veremos algunos en la prxima seccin.

6.2 Muestras malas


Todos los das encontramos ejemplos de muestras malas:

Cuando se pide a los oyentes de un programa de radio que vo-

ten por tal o cual cantante, llamando por telfono o enviando un


mensaje de correo electrnico, se trata de muestras de respuesta
voluntaria. Las encuestas de opinin en las que se llama, o se escribe, por propia iniciativa son ejemplos de muestras de respuesta
voluntaria, poco satisfactorias desde un punto de vista estadstico.

Cada vez que mire los resultados de un


estudio, busque la frase muestra aleatoria. Si la encuentra, hile ms no para
averiguar cmo fue obtenida y si en realidad fue elegida en forma aleatoria.

Otro tipo de muestra mala es la muestra de conveniencia. Si una pedagoga elige a sus propios alumnos, del ltimo ao de la escuela secundaria en la que trabaja, para evaluar un cambio en el mtodo de enseanza, los resultados no se podrn extender ms all de ese grupo.

Muestreo

31

6.3 Sesgo
Alguna vez escuchamos el sesgo es malo. Pero, qu es el sesgo? Es un favoritismo de
alguna etapa del proceso de recoleccin de datos beneciando algunos resultados, perjudicando otros y desviando las conclusiones en direcciones equivocadas.
Cuando alguna etapa del proceso de recoleccin de datos est sesgada, utilizar una muestra grande no corrige el error, simplemente lo repite.

Los datos en un estudio pueden estar sesgados por muchos motivos. A continuacin,
veremos algunos de ellos.

6.3.1 Sesgo por eleccin de la muestra


6.3.1.1 Muestras por conveniencia
Exprimir las naranjas que se encuentran a la vista, en la parte de arriba del cajn, es un
ejemplo de muestra de conveniencia. Las entrevistas en los centros comerciales (shopping)
son otro ejemplo, porque los fabricantes y las agencias de publicidad suelen recolectar informacin respecto a los hbitos de compras de la poblacin y el efecto de sus publicidades
en grandes centros de compras. Obtener una muestra de esta manera es rpido y econmico, pero la gente que contactan no es representativa de la mayora de la poblacin.

6.3.1.2 Muestras con sesgo personal


Por simpata, gusto o inters, quien est realizando la encuesta puede preferir encuestar
a cierto tipo de personas y no a otras. Por ejemplo, es posible que un encuestador joven
tienda a buscar chicas bonitas para preguntarles.

6.3.1.3 Muestras de respuesta voluntaria


Surgen a partir de los individuos que se ofrecen voluntariamente a participar. Se trata,
por ejemplo, de las que alimentan las votaciones organizadas por programas de radio,
televisin o de algn sitio de Internet. No producen resultados que tengan algn signicado en relacin a la opinin de la poblacin en general. Los participantes voluntarios,
que por algn motivo decidieron participar, suelen tener opiniones ms polarizadas.

32

Estadstica para todos

6.3.2 Sesgo de respuesta

Muestreo

33

6.3.2.1 Debido a la presentacin de las preguntas


Las diferentes palabras con las que se puede presentar una misma pregunta suele ser una
fuente importante de sesgo en las respuestas.
En un curso de manejo organizado por un automvil club se proyect una pelcula sobre
un accidente de trnsito a dos grupos de alumnos. Ambos grupos eran similares respecto
de la edad y el gnero. Al nalizar la proyeccin se pregunt:

Al primer grupo: a qu velocidad piensa que los dos autos chocaron? El promedio de las
respuestas fue de 50,9 km/h.

Al segundo grupo: a qu velocidad piensa que los dos autos se colisionaron? El promedio
de las respuestas fue de 65,9 km/h.

Ambos grupos vieron la misma pelcula. El uso de la palabra colisionaron aument las
estimaciones de la velocidad del accidente en 15 km/h, esto es un aumento del 29,5 %
El sesgo debido a la forma en que se presenta una pregunta puede ser intencional o
no intencional.
Las preguntas No est usted harto de pagar impuestos para que todo siga igual de
mal? y Le parece importante que se paguen impuestos para mejorar la educacin, los
servicios de salud y la seguridad?, que apuntan al pago de impuestos, seguramente tendrn resultados muy diferentes. Ambas preguntas conllevan un sesgo intencional.
Una encuesta dirigida a alumnos de 7mo. grado que pregunte: Cules son las 5 personas grandes que le gustaran conocer personalmente? tendr diferentes lecturas. Algunos de los alumnos podrn interpretar que se trata de personas mayores de edad, otros
que son altos, otros que se reere a gordos o tal vez a grandes estrellas de cine, de rock,
polticos o deportistas, generando un sesgo no intencional.

6.3.2.2 Para tratar de agradar


A la gente no le gusta mostrarse con ideas que no estn bien vistas socialmente. Por ejemplo, cuando est cara a cara con un encuestador o llenando un formulario no annimo,
un varn evitar una respuesta que parezca machista, o una mujer responder tratando
de ocultar algn prejuicio.

6.3.2.3 Por recuerdo


Si la pregunta est referida a un acontecimiento ocurrido algn tiempo atrs, la respuesta tendr un sesgo por recuerdo. Por ejemplo, si se le pregunta a una madre a qu edad comenzaron
a caminar sus hijos, la veracidad y precisin de la respuesta depender de las caractersticas
personales de la madre.
34

Estadstica para todos

6.3.2.4 Por no respuesta


Algunas veces las personas que han sido seleccionadas para una encuesta son muy
difciles de localizar o simplemente se niegan a responder. Los individuos que no
responden pueden ser muy diferentes de los que s lo hacen. Este tipo de sesgo se
puede reducir sustituyendo a los se niegan a responder por
otros individuos con las mismas caractersticas de los que
Cuando mire los resultados de una encuesta que
no responden, pero suele ser difcil.

6.3.2.5 Por subcubrimiento


Una encuesta telefnica ignora a todos los sujetos que no
tienen telfono. Una encuesta que realiza las entrevistas en
hogares ignora a los que viven en la calle.

le interesa especialmente, antes de sacar sus propias conclusiones averige qu se pregunt, cmo
fueron redactadas las preguntas, si las respuestas
fueron dadas en forma annima o no y cuntos se
negaron a responder.
Es ms fcil obtener muestras malas que buenas.

6.4 Otros tipos de muestreos


6.4.1 Muestreo sistemtico
Veamos un ejemplo de la utilidad de este mtodo. Si nos interesa la opinin de las alumnas de una escuela respecto del aumento de las horas destinadas a la prctica de deportes,
podramos entrevistar a las alumnas a la salida y elegir una de cada diez (suponiendo que
salgan de a una) hasta que hayan salido todas. De esta manera, si la escuela tiene 227
alumnas, la muestra tendr 22 alumnas.
Muestreo sistemtico: El muestreo comienza con una unidad elegida al azar y a partir de all contina cada k unidades. Si n es el tamao muestral y N es el tamao de la poblacin entonces k es
aproximadamente N/n.

Este tipo de muestreo permite evitar el sesgo personal y es ms sencillo que el muestreo
aleatorio. Es til cuando la poblacin est ordenada naturalmente (si no lo est, para
utilizar este tipo de muestreo es necesario ordenarla, pero al ordenarla, se pierden las
ventajas que tiene).
Por su simplicidad, se suele utilizar para control de calidad durante, o al nalizar, la
fabricacin de diversos productos.
En una produccin continua de tubos de pasta dentfrica, se elige un tubo por hora y se
lo analiza para vericar que cumple con las especicaciones.

Muestreo

35

Advertencia: Este muestreo no es adecuado cuando el perodo de la seleccin est


relacionado con alguna caracterstica que nos interesa evaluar.

Podra ocurrir que cada hora (una hora es el perodo de la seleccin) se produzca una leve
cada de tensin que hace que los tubos de pasta dentfrica se llenen ms o menos. No
detectaramos esa variacin con el muestreo cada hora.
Al realizar un muestreo sistemtico es importante estar alerta para identicar los factores
que puedan estar invalidando los resultados.

6.4.2 Muestreo aleatorio estraticado


En un muestreo estraticado la poblacin se divide en grupos homogneos llamados estratos.
Luego se realiza un muestreo aleatorio simple de unidades muestrales dentro de cada estrato.

Los estratos se eligen de acuerdo con los valores conocidos de algunas variables,
de manera que haya poca variabilidad dentro del estrato (los valores de dichas
variables para las unidades de un estrato particular dieren poco), pero que haya
mucha variabilidad entre estratos (los valores de dichas variables para las unidades
de distintos estratos dieren mucho).
Ejemplo 1:
La poblacin de una ciudad podra estraticarse por

grupo de edad: menos de 6 aos, entre 6 y 12 aos, entre 13 y 18 aos y


mayores de 18 aos.

gnero: femenino, masculino.


As obtenemos 8 estratos, dentro de los cuales los individuos tienen 2 caractersticas
similares: grupo de edad y gnero. Podramos realizar un muestreo proporcional a la
cantidad de individuos que tiene cada estrato, de manera que el tamao de la muestra
dentro de cada estrato dependa de la proporcin de la poblacin total que dicho estrato
representa.
Ejemplo 2:
En una encuesta diseada para conocer la situacin de la industria en una provincia podran
utilizarse estratos por tamao y actividad. Para cada actividad industrial podran incluirse todos los locales industriales con 500 ms obreros ocupados (inclusin forzosa - la muestra
los contiene a todos), la mitad de los que tuvieran entre 499 y 200, la cuarta parte entre 199
a 50 y 1 de cada 20 para los de menos de 50. Tendramos as 4 estratos:
36

Estadstica para todos

Estrato 1: Locales con 500 ms obreros


Estrato 2: Locales con 499-200 obreros
Estrato 3: Locales con 199-50 obreros
Estrato 4: Locales con 50-0 obreros

Si adems se dividiera la actividad industrial en dos: 1) industria alimenticia, 2) industria no alimenticia, cuntos estratos tendra la muestra? Tendra 8 estratos, dos por cada
uno de los 4 estratos anteriores.
Tres pasos de un muestreo aleatorio estraticado:

Paso 1: las unidades se agrupan en estratos. Los estratos se eligen teniendo en cuen-

ta que estos grupos tienen un inters especial dentro de la poblacin, o porque los
individuos en el estrato se parecen mucho.
Paso 2: se establece la proporcin de unidades, o fraccin de muestreo, que se incluir
para cada estrato
Paso 3: dentro de cada estrato se realiza un muestreo aleatorio simple y la proporcin de individuos que se incluye en la muestra es la establecida en el paso 2. La
unin de las muestras de cada estrato constituye la muestra completa.

6.4.3 Muestreo por conglomerados


En un muestro por conglomerados la poblacin se divide en grupos heterogneos llamados conglomerados. Luego se realiza un muestreo aleatorio simple en el que las unidades muestrales
son los conglomerados.

La idea del agrupamiento para un muestreo aleatorio por conglomerados (tambin llamados aglomerados) es opuesta a la del muestreo estraticado. Interesa que los individuos
que componen cada grupo sean lo ms heterogneos posibles y se espera que cada conglomerado sea representativo de la poblacin. Los conglomerados son las unidades del
muestreo, pero las unidades de inters son los individuos dentro de los conglomerados. Se
selecciona una muestra aleatoria de conglomerados, y se observan todos los individuos
dentro de cada conglomerado se selecciona una muestra aleatoria simple dentro del
conglomerado. Este tipo de muestreo puede tener mejor rendimiento costo-efectividad
que un muestreo aleatorio simple, en especial si los costos de traslado son altos.
Ejemplo 1:
Una encuesta de viviendas. Se divide la ciudad en manzanas, se seleccionan las manzanas mediante un muestreo aleatorio simple y se visitan todas las casas de cada manzana seleccionada.

Muestreo

37

Ejemplo 2:
En un estudio interesa evaluar la capacidad de lectoescritura de alumnos de 7mo grado.
Se seleccionarn al azar las escuelas y luego se realizar la prueba en todos los alumnos
de 7mo. grado de las escuelas seleccionadas.
Tres pasos de un muestreo aleatorio por conglomerados:

Paso 1: Los individuos se agrupan en conglomerados. Los conglomerados general-

mente tienen una proximidad fsica, pero dentro de cada conglomerado las unidades son heterogneas.
Paso 2: Los conglomerados son las unidades muestrales. Se establece la proporcin
de unidades que se incluir.
Paso 3: Se realiza un muestreo aleatorio simple de conglomerados y se estudian todos
los individuos de cada conglomerado seleccionado. El tamao nal de la muestra es
la cantidad de individuos que componen todos los conglomerados seleccionados.

6.4.4 Muestreo multietpico


Un muestreo multietpico tiene dos o ms pasos y, en cada uno de ellos se aplica cualquiera de los procedimientos de seleccin anteriores.
Ejemplo 1:
Una encuesta de viviendas. En la primera etapa se divide la ciudad en barrios, se toma
una muestra aleatoria simple de barrios. En la segunda etapa, cada barrio seleccionado en
la primera etapa se divide en manzanas, se seleccionan las manzanas mediante un muestreo
aleatorio simple, y se visitan todas las casas de cada manzana seleccionada.
Ejemplo 2:
Estudio para evaluar la capacidad de lectoescritura de alumnos de 7mo. grado. En la primera etapa se seleccionan al azar las escuelas, y en la segunda etapa se selecciona dentro
de cada escuela un cierto nmero de cursos de 7mo. grado. La prueba se realiza en todos
los alumnos de 7mo. grado de los cursos seleccionados en la segunda etapa.

38

Estadstica para todos

6.5 Actividades y ejercicios


1. Cul es la Poblacin? Cul es la muestra?

Para cada uno de los siguientes estudios indicar la poblacin lo ms detalladamente posible,
es decir describir a los individuos que la componen. Si la informacin es insuciente, completarla de la forma que se considere ms adecuada. Tambin indicar cul es la muestra.

Una encuesta de opinin contacta a 1.243 adultos y les pregunta, ha comprado


un billete de lotera en los ltimos 12 meses?

Durante la reunin anual del colegio de abogados, todos los presentes (2.500),
llenaron una encuesta referida al tipo de seguro que prefera para su automvil.

En 1968 se realiz en Holanda un test de inteligencia a todos los varones de 18 aos que
estaban realizando el Servicio Militar Obligatorio.

El INDEC lleva a cabo la Encuesta Permanente de Hogares (EPH) en la que se


encuestan 25.000 hogares para captar informacin sobre la realidad econmicosocial de la Repblica Argentina.

2. Voto secreto y obligatorio.


Qu tipos de sesgos se pueden producir cuando una eleccin para presidente se
realiza en forma voluntaria?

Qu tipos de sesgos se pueden producir si el voto en la Comisin Directiva de un


club o en la Cmara de Diputados no es secreto?

3. Se quiere realizar una encuesta entre los alumnos de una escuela secundaria, de 2.500

alumnos (500 alumnos por cada ao, de 1ro. a 5to.), utilizando una muestra de tamao
100. El propsito de la encuesta es determinar si a los/as alumno/as les interesa discutir
el siguiente tema: Debe reducirse la edad de imputabilidad penal para los menores
de edad, que establece la ley nacional 22.278, a diecisis aos de edad; como respuesta
al incremento en la cantidad de delitos graves cometidos por jvenes y adolescentes.

4. Indicar cul es el tipo de muestreo realizado en cada caso.


Cada alumno escribe su nombre en un papel, lo pone en una bolsa y el director
elige 100 papeles.

A cada alumno se le asigna un nmero entre 1 y 2.500 y se seleccionan generando


100 nmeros al azar de cuatro dgitos utilizando algn programa de computacin.

Para cada ao se asigna a cada alumno un nmero entre 1 y 500, y se elige 1 de


cada 25 alumnos.

Se eligen al azar una divisin de cada uno de los aos y se seleccionan 20 alumnos
de cada divisin.

Se eligen al azar 60 alumnos de los primeros 3 aos y 40 alumnos de los ltimos dos aos

Muestreo

39

Se eligen al azar 60 alumnos de los primeros 3 aos y 40 alumnos de los ltimos


dos aos. Se seleccionan en forma separada los varones y las mujeres de acuerdo
con la proporcin de mujeres y varones que tiene la escuela.

5. En un programa de radio se invit a las/los oyentes a contestar la siguiente pregunta: Si pudiera volver el tiempo atrs volvera a tener hijos? De ms de 10.000
respuestas el 70% dijo no. Qu muestra esto?

Elegir, entre las cinco siguientes, la respuesta que mejor responde a esta ltima pregunta.
a.
b.
c.
d.

La encuesta no dice nada porque arrastra el sesgo por respuesta voluntaria.


No se puede decir nada sin saber las caractersticas de los oyentes.
Para sacar una conclusin, es necesario separar las respuestas entre hombres y mujeres.
Hubiese tenido ms sentido tomar una muestra aleatoria de las 10.000 respuestas
para sacar conclusiones.
e. Es una muestra legtima elegida al azar entre todos los que escuchan ese programa
y tiene un tamao suciente como para concluir que la mayora de los oyentes lo
pensaran dos veces antes de tener ms hijos.

6. Indicar cul o cules de las siguientes armaciones son vlidas.


a. Las respuestas que se obtienen al utilizar un cuestionario expresado en trminos no
neutrales tendrn sesgo por respuestas.
b. Las encuestas de respuesta voluntaria subestiman a la gente con opiniones muy rmes.
c. Las encuestas de respuesta voluntaria generalmente sobre representan las respuestas negativas.
d. En general, es posible reducir el sesgo tomando muestras muy grandes, cuanto ms
grande es el tamao de la muestra mejor.
e. El tamao de la muestra no tiene nada que ver con el sesgo.
f. Los resultados que se obtienen de un censo son siempre ms precisos que los que se obtienen de una muestra, sin que importe cun cuidadoso haya sido el diseo y su aplicacin.

40

Estadstica para todos

Instituto Profesorado Concordia


Profesorado de Matemtica

Probabilidad y Estadstica II

Prctico 3 Tipos de muestreo

1.- En la pgina 14 del material de Diez S. (2005), la autora propone diferentes concepciones para
definir Estadstica (que se diferencian en acentuar determinado aspecto). Se pide argumentar a
favor de alguna de ellas e ilustrar con algn posible ejemplo.
2.- Recopilacin de datos
Hacer una breve referencia acerca de las formas de recopilar datos para un estudio estadstico
segn el tipo de fuente y segn la forma de la recoleccin.
3.- Estudios estadsticos
En su carrera elegida: considerara ms usuales los estudios estadsticos observacionales o
estudios experimentales? Justificar.
Dar un ejemplo de un estudio observacional y clasificarlo como prospectivo o retrospectivo.
Dar un ejemplo de un estudio experimental exploratorio.
4.- Hacer un cuadro resumen respecto a los tipos de muestreos probabilsticos y no
probabilsticos. A continuacin hacer una breve sntesis de cada uno de ellos.
5.- Tipos de muestreo no probabilsticos
Proponer algn ejemplo para el cual considere, justificando con algn argumento (aun
siendo un argumento ficticio), que debe hacer un muestreo no probabilstico. Indicar cul de ellos
segn la bibliografa propuesta y comentar cmo tomara la muestra en dicho contexto.
Caracterizarlo como un estudio observacional (retrospectivo o prospectivo) o como un
experimento.
6.- dem punto anterior para un tipo de muestreo probabilstico.

Observaciones:
Todos los ejemplos pedidos deben tener estricta relacin a la carrera en estudio.
La extensin mxima del trabajo incluyendo la cartula es de 5 pginas.

Prctico 4 Distribucin de estimadores (Primera parte)


Suma de variables aleatorias normales Distribucin de la media muestral para poblaciones normales y/o
muestras grandes (TCL)
1.- Se sabe que en el examen de admisin a las universidades, a nivel nacional, la media poblacional de las puntuaciones
que se obtienen es = 1020. Suponga que el desvo poblacional es = 100.
a. Cul es la probabilidad de que en una muestra de 75 estudiantes la media muestral de las
puntuaciones no difiera en ms de 10 puntos de la media poblacional?
b. Cul es la probabilidad de que en una muestra de 75 estudiantes la media muestral de las
puntuaciones no difiera en ms de 20 puntos de la media poblacional?
2.- Una compaa telefnica sabe por experiencia que la duracin de una llamada de larga distancia sigue una distribucin
normal con media 4 minutos y desvo estndar de 45 segundos.
a. Qu tan probable es que la duracin promedio de una muestra aleatoria de 25 llamadas de larga distancia supere los
4,25 minutos? (R: 0.0475)
b. Cuntas llamadas de larga distancia se necesitan muestrear para que la duracin promedio de la muestra d un valor
inferior a 4,50 minutos el 99% de las veces? (R: n~12)
3.- Cuando se prepara un lote de cierto producto qumico, la cantidad de una impureza en particular del mismo es una
variable aleatoria con valor medio de 4.0 gramos y desviacin estndar de 1.5 gramos. Si se preparan 50 lotes de manera
independiente, cul es la probabilidad (aproximada) de que la cantidad promedio de la muestra de impureza est entre
3.5 y 3.8 g? (R:
0.1645)
4.- El dimetro interior de un anillo de pistn seleccionado al azar es una variable aleatoria con valor medio de 12 cm y
desviacin estndar de 0.04 cm. Suponiendo que la distribucin del dimetro es normal:
a. Calcule la probabilidad de que la media est entre 11.99 cm y 12.01 cm cuando la muestra es de tamao 16. (R: 0.6826)
b. Cul es la probabilidad de que el dimetro medio muestral exceda de 12.01 cuando n =
25? (R: 0.1056)
5.- Al recibir materia prima para utilizar en la produccin, sabemos por experiencias anteriores que la resistencia a la
traccin de cierto tipo de fibra plstica no puede suponerse que siga una distribucin normal, pero tiene una resistencia
media de 2 kg/mm2 y un desvo de 0.40 kg/mm2.
El lote recibido consta de 500 unidades y se decide tomar una muestra de tamao 64 para su inspeccin. Cul es la
probabilidad de que la resistencia media de una unidad en la muestra se desve de la resistencia media poblacional en a lo
sumo 0.12 kg/mm2? (R: 0.9898)
6.- En el depsito de stock de una empresa hay una estantera que tiene una resistencia de carga mxima de c kilos. Se
usa para almacenar cierto producto que tiene un peso promedio de 10 kilos con un desvo de 1 kilo. No puede suponerse
que el peso del producto se distribuya normalmente. Cul ser el valor de c si se sabe que el peso total de una muestra
de 49 unidades del producto excede c el 1% de las veces? (R: 505.98 kg)
7.- Un ascensor limita el peso de sus cuatro ocupantes a 300 kg. Si el peso de un individuo sigue
una distribucin normal con media 71 kg y desvo 7 kg, calcular la probabilidad de que el peso de
4 individuos supere los 300 kg. (R: 0.1265)
8.- El tiempo de atencin por cliente de un cajero de un Banco es normal con media 6 minutos y desviacin estndar 2.5
minutos.
a. Cul es la probabilidad de que el tiempo promedio de atencin para una muestra de 15 clientes sea menor de 7
minutos? (R: 0.9395)
b. Cul es la probabilidad de que el tiempo de atencin a un grupo de 15 clientes sea ms de una hora y 15 minutos? (R:
0.9395)
c) Si el tiempo en que el cajero atiende a un grupo de 15 clientes excede las dos horas, entonces ste es despedido. Cul
es la probabilidad de que esto ocurra? (R: 0.001)

Prctico 5 Distribucin de estimadores (Segunda parte)


Distribucin Chi cuadrada Distribucin T
1.- Un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de sus marcas, es de 0.6 mg por
cigarrillo. Una organizacin independiente mide el contenido de nicotina de 16 cigarrillos al azar de esta marca y
encuentra que el promedio y la desviacin estndar es de 0.75 y 0.175 mg, respectivamente, de nicotina. Si se supone
que la cantidad de nicotina en estos cigarrillos es una variable aleatoria normal, qu tan probable es el resultado
muestral dado al dato proporcionado por el fabricante? (Rta.
2.- Durante los 12 meses pasados el volumen diario de ventas de un restaurant de cierto men4 fue de $2000. El gerente
piensa que los prximos 25 das sern tpicos con respecto al volumen de ventas normal. Al finalizar los 25 das, el
volumen de ventas promedio y su desviacin estndar fueron de $1800 y $200 respectivamente. Supngase que el
volumen de ventas diario es una variable aleatoria normal. Si usted fuese el gerente: tendra alguna razn para creer,
con base en este resultado, que hubo una disminucin en el volumen de ventas promedio diario?
3.- La vida media de una mquina para elaborar pan es de 7 aos, con una desviacin estndar de 1 ao. Suponga que la
vida de estas mquinas sigue aproximadamente una distribucin normal y calcule:
a) la probabilidad de que la vida media de una muestra aleatoria de 9 de estas mquinas caiga entre 6.4 y 7.2 aos
b) el valor de a la derecha del cual caeria 15% de las medias calculadas de muestras aleatorias de tamao 9.
4.- Un fabricante de bateras para automvil garantiza que su producto durar, en promedio, 3 aos con una desviacin
estndar de 1 ao. Si cinco de estas bateras tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 aos, el fabricante continuar
convencido de que sus bateras tienen una desviacin estndar de 1 ao? Suponga que las duraciones de las bateras
siguen una distribucin normal.
5.- Un ingeniero qumico afirma que el rendimiento medio de la poblacin de un cierto proceso de lotes es 500 gramos
por mililitro de materia prima. Para verificar dicha afirmacin muestrea 25 lotes cada mes. Si el valor t calculado cae entre
t0.05 y t0.95 queda satisfecho con su afirmacin. Que conclusin debera sacar de una muestra que tiene una media de
518 gramos por mililitro y una desviacin estndar muestral de 40 gramos?
Suponga que la distribucin de rendimientos es aproximadamente normal.
6.- Suponga que los tiempos requeridos por un cierto autobs para alcanzar uno de sus destinos en una ciudad grande se
distribuyen normalmente con una desviacin estndar = 1 minuto. Si se elige al azar una muestra de 17 tiempos,
encuentre la probabilidad de que la varianza muestral sea mayor que 2. (R: 0.01)
7.- Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin normal con varianza
= 6, tenga una varianza muestral:
a) Mayor que 9.1 (R: 0.05)
b) Entre 3.462 y 10.745 (R: 0.94)
8.- El propietario de una cadena de establecimientos donde se venden hamburguesas tiene inters en la variabilidad de la
cantidad de carne vacuna que contienen sus hamburguesas. La experiencia demuestra que la cantidad de carne vacuna
por hamburguesa se ajusta muy bien a una distribucin normal con una varianza de 10 gramos.
a) Qu tan probable es obtener una varianza de por lo menos 20 gramos en una muestra aleatoria de 20 hamburguesas?
(R: 0.005)
b) Hallar un valor c tal que haya un 90% de probabilidad de que la varianza de una muestra de 20 hamburguesas sea
inferior al valor de c. (R: c = 14.32 g)

IPC Seccin Matemtica

PyE II

IPC - Matematica - PyE II


Pr
actico 6: Propiedades de estimadores: Insesgamiento y
consistencia

Ejercicio 1. Sea X Bin(n, p). Se proponen los siguientes estimadores T1 y T2 para el parametro
poblacional p:
T1 =

X
n

T2 =

X +1
n+2

Se pide verificar:
a) si son insesgados
b) si son consistentes
c) cu
al de los dos tiene menor variabilidad

Ejercicio 2. Sean X1 , X2 , X3 yX4 una muestra aleatoria de tamano cuatro de una poblacion cuya distribuci
on es exponencial con par
ametro desconocido. De las siguientes estadsticas: cuales son estimadores
insesgados de ? cu
al de ellos tiene menor varianza?
1
1
(X1 + X2 ) + (X3 + X4 )
6
3
X1 + 2X2 + 3X3 + 4X4
T2 =
5
X1 + X2 + X3 + X4
T3 =
4

T1 =

Ejercicio 3. Sea X1 , X2 , X3 , X4 , X5 una muestra aleatoria de una poblacion cuya distribucion es normal
con media y varianza 2 . Probar que los siguientes estimadores de son insesgados, cual es el de menor
varianza?
"
#
5
5
X
1X
1
T1 =
Xk , T2 =
2X1 +
Xk .
5
6
k=1

k=2

Ejercicio 4. Sean b1 y b2 estimadores insesgados independientes de un parametro con igual varianza


2 , y sea el estimador = k1 b1 + k2 b2 siendo k1 y k2 constantes. Se pide encontrar los valores de dichas
constantes de manera tal que sea un estimador insesgados de y tenga la mnima varianza posible.

Prctico 7 Test de hiptesis e Intervalos de confianza

1.- Se desarrolla una nueva cura para cierto tipo de cemento que tiene como resultado un coeficiente de
compresin de 5000 kilogramos por centmetro cuadrado y una desviacin estndar de 120. Para probar la
hiptesis de que la media es 5000 contra la alternativa de que es menor a 5000, se prueba una muestra
aleatoria de 50 piezas de cemento. La regin crtica se define a la izquierda de 4970 para la media muestral.
a) Encontrar la probabilidad de cometer un error tipo I cuando H0 es verdadera.
b) Evaluar el error de tipo II para las alternativas para la media de 4970 y 4960. Calcular las potencias
correspondientes y graficar la curva de potencia del test.
2.- Un fabricante de bateras para auto afirma que la duracin de sus bateras se ditribuye de forma
aproximadamente normal con una desviacin estndar igual a 0.9 aos. Si una muestra aleatoria de 10 de
tales bateras tiene una desviacin estndar de 1.2 aos se puede considerar que el desvo estndar
poblacional es mayor a 0.9 aos? Utilizar un nivel de significacin de 0.05.
3.- Se comparan dos tipos de instrumentos para medir la cantidad de monxido de azufre en la atmsfera en
un experimento de contaminacin del aire. Se desea determinar si los dos tipos de instrumentos dan
mediciones que tengan la misma variabilidad. Se registran las siguientes lecturas para los dos instrumentos:
Instrumento A: 0.86
0.82 0.75 0.61 0.89 0.64 0.81 0.68 0.65
Instrumento B: 0.87
0.74 0.63 0.55 0.76 0.7
0.69 0.57 0.53
Suponga que las poblaciones de mediciones se distribuyen de forma aproximadamente normal, pruebe la
hiptesis de que las varianzas poblacionales son iguales contra la alternativa de que sean diferentes.
4.- Probar la hiptesis de que el contenido promedio de los envases de un lubricante particular es de 10 litros
si los contenidos de una muestra aleatoria de 10 envases son
10.2 9.7
10.1 10.3 10.1 9.8
9.9
10.4 10.3 9.8.
Utilizar un nivel de significacin de 0.01. Hay algn supuesto de trabajo para realizar esta prueba?
5.- Una medicina que se prescribe comnmente para aliviar la tensin nerviosa se considera que es efectiva en
60%. Resultados experimentales con una nueva medicina que se administra a una muestra aleatoria de 100
adultos que padecen de tensin nerviosa muestran que 70 tuvieron alivio. Es esto evidencia suficiente para
concluir que la nueva medicina es superior a la que se prescribe actualmente? Utilizar un nivel de significacin
de 0.05 y calcular el p-value (valor p).
6.- Un fabricante de equipo deportivo desarrolla un nuevo sedal sinttico que afirma tiene una resistencia
media a la tensin de ocho kilogramos con una desviacin estndar de 0.5 kilogramos. Pruebe la hiptesis que
la media es 8 kg contra la alternativa que es distinta de 8, si se prueba una muestra aleatoria de 50 sedales y se
encuentra que tiene una resistencia media a la tensin de 7.8. Utilizar un nivel de significacin de 0.01.
Calcular y decidir tambin sobre el valor p calculado. Calcular la potencia del test si el valor real de la media es
8.5, si es 9, si es 7 y si es 5. Representar la curva de potencia.
7.- Comparar, de ser posible, las soluciones obtenidas para los problemas dados con la metodologa de los
intervalos de confianza.

IPC Seccin Matemtica

PyE II

Captulo 11

Regresin lineal simple


y correlacin
11.1

Introduccin a la regresin lineal


En la prctica a menudo se requiere resolver problemas que implican conjuntos de variables de las cuales se sabe que tienen alguna relacin inherente entre s. Por ejemplo, en
una situacin industrial quiz se sepa que el contenido de alquitrn en el flujo de salida
de un proceso qumico est relacionado con la temperatura en la entrada. Podra ser de
inters desarrollar un mtodo de pronstico, es decir, un procedimiento que permita estimar el contenido de alquitrn para varios niveles de temperatura de entrada a partir de
informacin experimental. Desde luego, es muy probable que para muchos ejemplos
concretos en los que la temperatura de entrada sea la misma, por ejemplo 130C, el contenido de alquitrn de salida no sea el mismo. Esto es muy similar a lo que ocurre cuando
se estudian varios automviles con un motor del mismo volumen; no todos tienen el
mismo rendimiento de combustible. No todas las casas ubicadas en la misma zona
del pas, con la misma superficie de construccin, se venden al mismo precio. El contenido de alquitrn, el rendimiento del combustible (en millas por galn) y el precio de las
casas (en miles de dlares) son variables dependientes naturales o respuestas en los tres
escenarios. La temperatura en la entrada, el volumen del motor (pies cbicos) y los metros cuadrados de superficie de construccin son, respectivamente, variables independientes naturales o regresores. Una forma razonable de relacin entre la respuesta Y y
el regresor x es la relacin lineal,
Y = 0 + 1 x,
en la que, por supuesto, 0 es la interseccin y 1 es la pendiente. Esta relacin se ilustra en la figura 11.1.
Si la relacin es exacta y no contiene ningn componente aleatorio o probabilstico,
entonces se trata de una relacin determinista entre dos variables cientficas. Sin embargo,
en los ejemplos que se mencionaron, as como en muchos otros fenmenos cientficos y
de ingeniera, la relacin no es determinista, es decir, una x dada no siempre produce el
mismo valor de Y. Como resultado, los problemas importantes en este caso son de naturaleza probabilstica, toda vez que la relacin anterior no puede considerarse exacta. El
concepto de anlisis de regresin se refiere a encontrar la mejor relacin entre Y y x
389

390

Captulo 11 Regresin lineal simple y correlacin


Y

Y=

x
1
+
0

} 0

Figura 11.1: Una relacin lineal; 0: interseccin; 1: pendiente.


cuantificando la fuerza de esa relacin, y empleando mtodos que permitan predecir los
valores de la respuesta dados los valores del regresor x.
En muchas aplicaciones habr ms de un regresor, es decir, ms de una variable
independiente que ayude a explicar a Y. Por ejemplo, si se tratara de explicar las razones para el precio de una casa, se esperara que una de ellas fuera su antigedad, en cuyo
caso la estructura mltiple de la regresin se podra escribir como
Y = 0 + 1 x 1 + 2 x 2 ,
donde Y es el precio, x1 son los metros cuadrados y x2 es la antigedad de la casa en aos.
En el captulo siguiente se estudiarn problemas con regresores mltiples. El anlisis
resultante se denomina regresin mltiple; en tanto que el anlisis del caso con un solo
regresor recibe el nombre de regresin simple. En un segundo ejemplo de la regresin
mltiple, un ingeniero qumico podra estar interesado en la cantidad de hidrgeno que
se ha perdido en las muestras de un metal especfico que se tiene almacenado. En este
caso habra dos entradas, x1, el tiempo de almacenamiento en horas, y x2, la temperatura
de almacenamiento en grados centgrados. De modo que la respuesta sera Y, la prdida de
hidrgeno en partes por milln.
En este captulo estudiaremos el tema de la regresin lineal simple, que trata el
caso de una sola variable regresora, en el que la relacin entre x y y es lineal. Para el caso
en el que hay ms de una variable regresora el lector debe consultar el captulo 12. Denotemos una muestra aleatoria de tamao n mediante el conjunto {(xi, yi); i = 1, 2,..., n}.
Si se tomaran muestras adicionales utilizando exactamente los mismos valores de x, se
esperara que los valores de y variaran. As, el valor yi en el par ordenado (xi, yi) es el
valor de cierta variable aleatoria Yi.

11.2

El modelo de regresin lineal simple (RLS)


Hemos limitado el uso del trmino anlisis de regresin a los casos en los que las relaciones entre las variables no son deterministas, es decir, no son exactas. En otras palabras, debe existir un componente aleatorio en la ecuacin que relaciona las variables.
Este componente aleatorio toma en cuenta consideraciones que no son medibles o, de

11.2 El modelo de regresin lineal simple (RLS)

391

hecho, que los cientficos o los ingenieros no comprenden. En realidad, en la mayora


de aplicaciones de la regresin, la ecuacin lineal, digamos, Y = 0 + 1x es una aproximacin que representa de manera simplificada algo desconocido y mucho ms complicado. Por ejemplo, en el caso que implica la respuesta Y = contenido de alquitrn y x =
temperatura de entrada es probable que Y = 0 + 1x sea una aproximacin razonable
que podra funcionar dentro de un rango limitado de x. La mayora de las veces los modelos que son simplificaciones de estructuras ms complicadas y desconocidas son de
naturaleza lineal, es decir, lineales en los parmetros 0 y 1 o, en el caso del modelo
que implica el precio, el tamao y la antigedad de la casa, lineal en los parmetros 0,
1 y 2. Estas estructuras lineales son sencillas y de naturaleza emprica, por lo que se
denominan modelos empricos.
Un anlisis de la relacin entre x y Y requiere el planteamiento de un modelo estadstico. Con frecuencia un estadstico utiliza un modelo como representacin de un
ideal que, en esencia, define cmo percibimos que el sistema en cuestin gener los
datos. El modelo debe incluir al conjunto {(xi, yi); i = 1, 2,..., n} de datos que implica n
pares de valores (x, y). No debemos olvidar que el valor de yi depende de xi por medio de
una estructura lineal que tambin incluye el componente aleatorio. La base para el uso
de un modelo estadstico se relaciona con la manera en que la variable aleatoria Y cambia
con x y el componente aleatorio. El modelo tambin incluye lo que se asume acerca de
las propiedades estadsticas del componente aleatorio. A continuacin se presenta el
modelo estadstico para la regresin lineal simple. La respuesta Y se relaciona con la
variable independiente x a travs de la ecuacin
Modelo de
regresin lineal
simple

Y = 0 + 1 x +
en la cual 0 y 1 son los parmetros desconocidos de la interseccin y la pendiente,
respectivamente, y  es una variable aleatoria que se supone est distribuida con E() = 0
y Var() = 2. Es frecuente que a la cantidad 2 se le denomine varianza del error o
varianza residual.
En el modelo anterior hay varias cuestiones evidentes. La cantidad Y es una variable
aleatoria, ya que  es aleatoria. El valor x de la variable regresora no es aleatorio y, de
hecho, se mide con un error despreciable. La cantidad , que a menudo recibe el nombre
de error aleatorio o alteracin aleatoria, tiene varianza constante. Es comn que a esta
parte se le denomine suposicin de varianza homognea. La presencia de este error
aleatorio  evita que el modelo se convierta tan slo en una ecuacin determinista. Ahora, el hecho de que E() = 0 implica que para una x especfica, los valores de y se distribuyen alrededor de la recta verdadera o recta de regresin de la poblacin y = 0 +
1x. Si se elige bien el modelo, es decir, si no hay otros regresores de importancia y la
aproximacin lineal es buena dentro de los rangos de los datos, entonces son razonables
los errores positivos y negativos que rodean a la regresin verdadera. Debe recordarse
que en la prctica 0 y 1 se desconocen y que deben estimarse a partir de los datos.
Adems, el modelo que se acaba de describir es de naturaleza conceptual. Como resultado, en la prctica nunca se observan los valores  reales, por lo que nunca se puede
trazar la verdadera recta de regresin, aunque suponemos que ah est. Slo es posible
dibujar una recta estimada. En la figura 11.2 se ilustra la naturaleza de los datos (x, y)
hipotticos dispersos alrededor de la verdadera recta de regresin para un caso en que
slo se dispone de n = 5 observaciones. Debemos destacar que lo que observamos en la
figura 11.2 no es la recta que utilizan el cientfico o ingeniero. En vez de esa recta, lo

392

Captulo 11 Regresin lineal simple y correlacin

que describe la ilustracin es el significado de las suposiciones! Ahora describiremos la


regresin que el usuario tiene a su disposicin.
y

1
Verdadera recta de regresin
E(Y) = 0 + 1 x
x

Figura 11.2: Datos (x, y) hipotticos dispersos alrededor de la verdadera recta de


regresin para n = 5.

La recta de regresin ajustada


Un aspecto importante del anlisis de regresin es, en trminos sencillos, estimar los
parmetros 0 y 1, es decir, estimar los llamados coeficientes de regresin. En la seccin siguiente se estudiar el mtodo para estimarlos. Suponga que denotamos los estimados b0 para 0 y b1 para 1. Entonces, la recta de regresin ajustada, o estimada, es
dada por
y = b 0 + b1 x,
donde y es el valor pronosticado o ajustado. Es evidente que la recta ajustada es un estimado de la verdadera recta de regresin. Se espera que la recta ajustada est ms cerca
de la verdadera lnea de regresin cuando se dispone de una gran cantidad de datos. En
el ejemplo siguiente se ilustra la recta ajustada para un estudio sobre contaminacin
en la vida real.
Uno de los problemas ms desafiantes que enfrenta el campo del control de la contaminacin del agua lo representa la industria de la peletera, ya que sus desechos son
qumicamente complejos; se caracterizan por valores elevados de la demanda de oxgeno qumico, slidos voltiles y otras medidas de contaminacin. Considere los datos
experimentales de la tabla 11.1, que se obtuvieron de 33 muestras de desechos tratados
qumicamente en un estudio realizado en Virginia Tech. Se registraron los valores de x,
la reduccin porcentual de los slidos totales, y de y, el porcentaje de disminucin de la
demanda de oxgeno qumico.
Los datos de la tabla 11.1 aparecen graficados en un diagrama de dispersin en la
figura 11.3. Al inspeccionar dicho diagrama se observa que los puntos se acercan mucho
a una lnea recta, lo cual indica que la suposicin de linealidad entre las dos variables
parece ser razonable.

11.2 El modelo de regresin lineal simple (RLS)

393

Tabla 11.1: Medidas de la reduccin de los slidos y de la demanda de oxgeno qumico


Reduccin
Reduccin de la demanda
de slidos, x (%)
de oxgeno, y (%)
3
5
7
11
11
21
15
16
18
16
27
28
29
27
30
25
30
35
31
30
31
40
32
32
33
34
33
32
34
34
36
37
36
38

Reduccin
Reduccin de la demanda
de slidos, x (%)
de oxgeno, y (%)
36
34
37
36
38
38
39
37
39
36
39
45
40
39
41
41
42
40
42
44
43
37
44
44
45
46
46
46
47
49
50
51

y
b0
^y =

55
50

=0
|x

+b

x
+ 1

45
40
35
30
25
20
15
10
5
0

9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54

Figura 11.3: Diagrama de dispersin con rectas de regresin.

En el diagrama de dispersin de la figura 11.3 se ilustra la recta de regresin ajustada y una recta hipottica de regresin verdadera. Ms adelante, en la seccin 11.3, en la
cual estudiaremos el mtodo de estimacin, revisaremos este ejemplo.

394

Captulo 11 Regresin lineal simple y correlacin

Otra mirada a las suposiciones del modelo


Resulta aleccionador repasar el modelo de regresin lineal simple que se present con
anterioridad y analizar de forma grfica la manera en que se relaciona con la denominada regresin verdadera. Daremos ms detalles en la figura 11.2, cuando ilustremos no
slo el lugar en que los i se localizan en la grfica, sino tambin lo que implica la suposicin de normalidad para los i.
Suponga que tenemos una regresin lineal simple con n = 6, valores de x equidistantes y un valor nico de y para cada x. Considere la grfica de la figura 11.4, la cual
debera proporcionar al lector una representacin clara del modelo y de las suposiciones
implicadas. La recta que aparece en la grfica es la recta de regresin verdadera. Los
puntos graficados ( y, x) son puntos reales dispersos alrededor de la recta. Cada punto se
ubica en su propia distribucin normal, donde el centro de la distribucin, es decir, la
media de y, cae sobre la recta. Ciertamente esto es lo esperado, ya que E(Y) = 0 + 1x.
Como resultado, la verdadera recta de regresin pasa a travs de las medias de la respuesta y las observaciones reales se encuentran sobre la distribucin, alrededor de las
medias. Observe tambin que todas las distribuciones tienen la misma varianza, que se
denota con 2. Desde luego, la desviacin entre una y individual y el punto sobre la
recta ser su valor individual . Esto queda claro porque
y i E (Yi ) = y i (0 + 1 x i ) =

i.

As, con una x dada, tanto Y como el  correspondiente tienen varianza 2.


Y

x1

x2

x3

x4

x5

x6

Y/ x

+
= 0

1x

Figura 11.4: Observaciones individuales alrededor de la verdadera recta de regresin.


Note tambin que aqu escribimos la verdadera recta de regresin como Y x = 0 +1 x
con el fin de reafirmar que la recta pasa a travs de la media de la variable aleatoria Y.

11.3

Mnimos cuadrados y el modelo ajustado


En esta seccin se estudia el mtodo para ajustar una recta de regresin estimada a los
datos, lo cual equivale a determinar los estimados b0 para 0 y b1 para 1. Por supuesto,

11.3 Mnimos cuadrados y el modelo ajustado

395

esto permite el clculo de los valores pronosticados a partir de la recta ajustada y = b0


+ b1x, y otros tipos de anlisis y de informacin diagnstica que determinarn la fuerza
de la relacin, as como la adecuacin y el ajuste del modelo. Antes de analizar el mtodo de estimacin de los mnimos cuadrados es importante presentar el concepto de
residual. En esencia, un residual es un error en el ajuste del modelo y = b0 + b1x.
Residual: Error Dado un conjunto de datos de regresin {(xi, yi); i = 1, 2,..., n} y un modelo ajustado
en el ajuste y i = b0 + b1x, el i-simo residual ei es dado por
ei = y i yi ,

i = 1, 2,. . . , n .

Es evidente que si un conjunto de n residuales es grande, entonces el ajuste del modelo no es bueno. Los residuales pequeos son indicadores de un ajuste adecuado. Otra
relacin interesante, y que a veces es til, es la siguiente:
y i = b 0 + b 1 x i + ei .
El uso de la ecuacin anterior debera aclarar la diferencia entre los residuales ei y los
errores del modelo conceptual i. No debemos olvidar que, mientras que los i no se
observan, los ei no slo se observan sino que desempean un papel importante en el
anlisis total.
La figura 11.5 ilustra el ajuste de la recta a este conjunto de datos: a saber y = b0 +
b1x, y la recta que refleja el modelo Y x = 0 +1 x. Desde luego, 0 y 1 son parmetros
desconocidos. La recta ajustada es un estimado de la recta que genera el modelo estadstico. Hay que tener presente que la recta Y x = 0 +1 x es desconocida.
y
( xi , y i )

{}

y^ = b 0 + b1 x

ei

Y | x = 0 + 1 x

Figura 11.5: Comparacin de i con el residual ei.

Mtodo de mnimos cuadrados


Debemos calcular b0 y b1, los estimados de 0 y 1, de manera que la suma de los cuadrados de los residuales sea mnima. La suma residual de los cuadrados con frecuencia
se denomina suma de los cuadrados del error respecto de la recta de regresin y se
denota como SCE. Este procedimiento de minimizacin para estimar los parmetros

396

Captulo 11 Regresin lineal simple y correlacin

se denomina mtodo de mnimos cuadrados. Por lo tanto, debemos calcular a y b para


minimizar
n

SCE =

e2i

i =1

(y i yi ) =

(y i b0 b1 x i ) 2 .

i =1

i =1

Al diferenciar la SCE con respecto a b0 y b1, se obtiene


n

(SCE)
= 2
(y i b0 b1 x i ),
b0
i =1

(SCE)
= 2
(y i b0 b1 x i )x i .
b1
i =1

Al igualar a cero las derivadas parciales y reacomodar los trminos, obtenemos las ecuaciones siguientes (llamadas ecuaciones normales)
n

nb0 + b1

xi =
i =1

yi ,
i =1

x i + b1

b0
i =1

x 2i =
i =1

x i yi ,
i =1

que se resuelven simultneamente para obtener frmulas de clculo para b0 y b1.


Estimacin de los Dada la muestra {(xi, yi)}; i = 1, 2, ... , n}, los estimados b0 y b1 de los mnimos cuadracoeficientes dos de los coeficientes de regresin 0 y 1 se calculan mediante las frmulas
de regresin
n
n
n
n
x i yi
xi
yi
(x i x )( y i y )
n
i =1
i =1
i =1
b 1 = i =1
=
y
n
2
n
n
2
2
(x

)
i
n
x
xi
i =1

b0 =

i =1

y i b1
n

i =1

i =1

n
i =1

xi
= y b1 x .

En el ejemplo siguiente se ilustra el clculo de b0 y b1 usando los datos de la tabla 11.1.


Ejemplo 11.1: Estime la recta de regresin para los datos de contaminacin de la tabla 11.1.
Solucin:

33

33

x i = 1104,
i =1

33

y i = 1124,
i =1

33

x i y i = 41,355,
i =1

x 2i = 41,086
i =1

Por lo tanto,
(33)(41,355) (1104)(1124)
= 0.903643 y
(33)(41,086)(1104)2
1124 (0.903643)(1104)
b0 =
= 3.829633.
33

b1 =

Por consiguiente, la recta de regresin estimada es dada por


y = 3.8296 + 0.9036x.
Si utilizramos la recta de regresin del ejemplo 11.1, podramos pronosticar una
reduccin de 31% en la demanda de oxgeno qumico si los slidos totales se redujeran

11.3 Mnimos cuadrados y el modelo ajustado

397

un 30%. La reduccin de 31% en la demanda de oxgeno qumico se puede interpretar


como un estimado de la media de la poblacin Y|30, o como un estimado de una observacin nueva si la reduccin de slidos totales es de 30%. Sin embargo, dichas estimaciones estn sujetas a error. Incluso si el experimento estuviera controlado para que la
reduccin de los slidos totales fuera de 30%, es improbable que la reduccin en la demanda de oxgeno qumico que se midiera fuera exactamente igual a 31%. De hecho, los
datos originales registrados en la tabla 11.1 indican que se registraron medidas de 25%
y de 35% en la reduccin de la demanda de oxgeno, cuando la disminucin de los slidos totales se mantuvo en 30%.

Qu es lo bueno de los mnimos cuadrados?


Debemos sealar que el criterio de los mnimos cuadrados est diseado para brindar
una recta ajustada que resulte en la cercana entre la recta y los puntos graficados.
Existen muchas formas de medir dicha cercana. Por ejemplo, quiz desearamos den

terminar los valores de b0 y b1 para los que se minimiza


n

minimiza

i=1

|y i yi | o para los que se

|y i yi | . Ambos mtodos son viables y razonables. Observe que los dos,


1.5

i=1

as como el procedimiento de mnimos cuadrados, obligan a que los residuales sean pequeos en cierto sentido. Debemos recordar que los residuales son el equivalente emprico de los valores de . La figura 11.6 ilustra un conjunto de residuales. Observe que la
lnea ajustada tiene valores predichos como puntos sobre la recta y, en consecuencia, los
residuales son desviaciones verticales desde los puntos hasta la recta. Como resultado, el
procedimiento de mnimos cuadrados genera una recta que minimiza la suma de los
cuadrados de las desviaciones verticales desde los puntos hasta la recta.
y

+b 1
^y = b 0

Figura 11.6: Los residuales como desviaciones verticales.

398

Captulo 11 Regresin lineal simple y correlacin

Ejercicios
11.1 Se realiz un estudio en Virginia Tech para determinar si ciertas medidas de la fuerza esttica del brazo influyen en las caractersticas de levantamiento
dinmico de un individuo. Veinticinco individuos se
sometieron a pruebas de fuerza y luego se les pidi que
hicieran una prueba de levantamiento de peso, en el
que el peso se elevaba en forma dinmica por encima
de la cabeza. A continuacin se presentan los datos.
Fuerza
Levantamiento
Individual
del brazo, x
dinmico, y
1
17.3
71.7
2
19.3
48.3
3
19.5
88.3
4
19.7
75.0
22.9
91.7
5
23.1
100.0
6
7
26.4
73.3
8
26.8
65.0
9
27.6
75.0
28.1
88.3
10
11
28.2
68.3
12
28.7
96.7
13
29.0
76.7
14
29.6
78.3
15
29.9
60.0
16
29.9
71.7
17
30.3
85.0
18
31.3
85.0
19
36.0
88.3
20
39.5
100.0
21
40.4
100.0
22
44.3
100.0
23
44.6
91.7
24
50.4
100.0
25
55.9
71.7
a) Estime los valores de 0 y 1 para la curva de regresin lineal Y x = 0 +1 x.
b) Calcule un estimado puntual de Y|30.
c) Grafique los residuales en comparacin con las x
(fuerza del brazo). Comente los resultados.
11.2 Las siguientes son las calificaciones de un grupo
de 9 estudiantes en un informe de medio semestre (x) y
en el examen final (y):
x 77 50 71 72 81 94 96 99 67
y 82 66 78 34 47 85 99 99 68
a) Estime la recta de regresin lineal.
b) Calcule la calificacin final de un estudiante que
obtuvo 85 de calificacin en el informe de medio
semestre.
11.3 Se registraron las cantidades de un compuesto
qumico y que se disuelve en 100 gramos de agua a
distintas temperaturas x:

x ( C)
y (gramos)
0
8
6
8
15
12
10
14
30
25
21
24
45
31
33
28
60
44
39
42
75
48
51
44
a) Calcule la ecuacin de la recta de regresin.
b) Grafique la recta en un diagrama de dispersin.
c) Estime la cantidad de producto qumico que se disolver en 100 gramos de agua a 50C.
11.4 Para fines de calibracin se recabaron los siguientes datos, los cuales permitiran determinar la relacin entre la presin y la lectura correspondiente en
la escala.
Presin, x (lb/pulg2)
Lectura en la escala, y
10
13
10
18
10
16
10
15
10
20
50
86
50
90
50
88
50
88
50
92
a) Calcule la ecuacin de la recta de regresin.
b) En esta aplicacin el propsito de la calibracin es
estimar la presin a partir de una lectura observada
en la escala. Estime la presin para una lectura en
la escala de 54, usando x = (54 b0)/b1.
11.5 Se realiz un estudio sobre la cantidad de azcar
convertida en cierto proceso a distintas temperaturas.
Los datos se codificaron y registraron como sigue:
Temperatura, x
Azcar convertida, y
1.0
8.1
1.1
7.8
1.2
8.5
1.3
9.8
1.4
9.5
1.5
8.9
1.6
8.6
1.7
10.2
1.8
9.3
1.9
9.2
2.0
10.5
a) Estime la recta de regresin lineal.
b) Calcule la cantidad media de azcar convertida
que se produce cuando se registra una temperatura
codificada de 1.75.
c) Grafique los residuales en comparacin con la
temperatura. Comente sus resultados.

Ejercicios

11.6 En cierto tipo de espcimen de prueba metlico


se sabe que la tensin normal sobre un espcimen se
relaciona funcionalmente con la resistencia al corte. El
siguiente es un conjunto de datos experimentales codificados para las dos variables:
Tensin normal, x
Resistencia al corte, y
26.8
26.5
25.4
27.3
28.9
24.2
23.6
27.1
27.7
23.6
23.9
25.9
24.7
26.3
28.1
22.5
26.9
21.7
27.4
21.4
22.6
25.8
25.6
24.9
a) Estime la recta de regresin Y|x = 0 + 1x.
b) Estime la resistencia al corte para una tensin normal de 24.5.
11.7 Los siguientes son algunos de los datos contenidos en un conjunto clsico denominado datos piloto
de graficacin que aparecen en Fitting Equations to
Data, de Daniel y Wood, publicado en 1971. La respuesta y es el contenido de cido del material determinado por anlisis volumtrico; mientras que el regresor
x es el contenido de cido orgnico determinado por
extraccin y ponderacin.
y
x
y
x
76
123
70
109
62
55
37
48
66
82
100
138
58
88
75
164
88
159
43
28
a) Grafique los datos; la regresin lineal simple parece un modelo adecuado?
b) Haga un ajuste de regresin lineal simple; calcule
la pendiente y la interseccin.
c) Grafique la recta de regresin en la grfica del inciso a.
11.8 Se aplica un examen de colocacin de matemticas a todos los estudiantes de nuevo ingreso en una
universidad pequea. Se negar la inscripcin al curso
regular de matemticas a los estudiantes que obtengan
menos de 35 puntos y se les enviar a clases de regularizacin. Se registraron los resultados del examen de
colocacin y las calificaciones finales de 20 estudiantes
que tomaron el curso regular:
a) Elabore un diagrama de dispersin.
b) Calcule la ecuacin de la recta de regresin para
predecir las calificaciones en el curso a partir de
las del examen de colocacin.
c) Grafique la recta en el diagrama de dispersin.

399

d ) Si la calificacin aprobatoria mnima fuera 60


puntos, qu calificacin en el examen de colocacin se debera usar en el futuro como criterio para
negar a los estudiantes el derecho de admisin a
ese curso?
Examen
Calificacin
de colocacin
en el curso
50
53
35
41
35
61
40
56
55
68
65
36
35
11
60
70
90
79
35
59
90
54
80
91
60
48
60
71
60
71
40
47
55
53
50
68
65
57
50
79
11.9 Un comerciante minorista realiz un estudio
para determinar la relacin que hay entre los gastos semanales de publicidad y las ventas.
Costos de publicidad ($) Ventas ($)
40
385
20
400
25
395
20
365
30
475
50
440
40
490
20
420
50
560
40
525
25
480
50
510
a) Elabore un diagrama de dispersin.
b) Calcule la ecuacin de la recta de regresin para
pronosticar las ventas semanales a partir de los
gastos de publicidad.
c) Estime las ventas semanales si los costos de publicidad son de $35.
d ) Grafique los residuales en comparacin con los
costos de publicidad. Comente sus resultados.
11.10 Los siguientes datos son los precios de venta z
de cierta marca y modelo de automvil usado con w
aos de antigedad. Ajuste una curva de la forma
z w = w mediante la ecuacin de regresin muestral
no lineal z = cdw [Sugerencia: Escriba ln z = ln c +
(ln d)w = b0 + b1w].

Vous aimerez peut-être aussi