Académique Documents
Professionnel Documents
Culture Documents
Seccin Matemtica
Probabilidad y Estadstica 2
(tercer ao)
Material de estudio
Carrera: Profesorado de Matemtica para la
escuela secundaria
Carcter: anual
Docente: Lic. Mario Alvarez
161
5.5
162
p(x ; t),
P (r; t) =
x =0
para valores selectos de t que van de 0.1 a 18.0 Ilustramos el uso de esta tabla con los
siguientes dos ejemplos.
Ejemplo 5.17: Durante un experimento de laboratorio el nmero promedio de partculas radiactivas que
pasan a travs de un contador en un milisegundo es 4. Cul es la probabilidad de
que entren 6 partculas al contador en un milisegundo dado?
Solucin: Al usar la distribucin de Poisson con x = 6 y t = 4, y al remitirnos a la tabla A.2, tenemos que
6
e4 46
p(x ; 4)
p(x ; 4) = 0.8893 0.7851 = 0.1042.
p(6; 4) =
=
6!
x =0
x =0
Ejemplo 5.18: El nmero promedio de camiones-tanque que llega cada da a cierta ciudad portuaria es
10. Las instalaciones en el puerto pueden alojar a lo sumo 15 camiones-tanque por da.
Cul es la probabilidad de que en un da determinado lleguen ms de 15 camiones y se
tenga que rechazar algunos?
Solucin: Sea X el nmero de camiones-tanque que llegan cada da. Entonces, usando la tabla A.2,
tenemos
15
163
0.30
0.30
= 0.1
= 2
=5
0.75
0.5
f (x)
0.20
f (x)
f (x)
0.20
0.10
0.10
0.25
10
10
10
b(x; n, p) p(x; ).
164
Ejemplo 5.19: En cierta fbrica los accidentes ocurren con muy poca frecuencia. Se sabe que la probabilidad de un accidente en cualquier da dado es de 0.005, y que los accidentes son independientes entre s.
a) Cul es la probabilidad de que en un da de cualquier periodo determinado de 400
das ocurra un accidente?
b) Cul es la probabilidad de que ocurra un accidente a lo sumo en tres das de tal periodo?
Solucin: Sea X una variable aleatoria binomial con n = 400 y p = 0.005. Por consiguiente, np =
2. Si utilizamos la aproximacin de Poisson,
a) P (X = 1) = e2 21 = 0.271 y
b) P (X 3) =
3
x =0
e 2 2x /x! = 0.857.
Ejemplo 5.20: En un proceso de fabricacin donde se manufacturan productos de vidrio ocurren defectos o burbujas, lo cual ocasionalmente hace que la pieza ya no se pueda vender. Se sabe
que, en promedio, 1 de cada 1000 artculos producidos tiene una o ms burbujas. Cul
es la probabilidad de que una muestra aleatoria de 8000 tenga menos de 7 artculos con
burbujas?
Solucin: Se trata bsicamente de un experimento binomial con n = 8000 y p = 0.001. Como p es
muy cercana a cero y n es bastante grande, haremos la aproximacin con la distribucin
de Poisson utilizando
= (8000)(0.001) = 8.
Por lo tanto, si X representa el nmero de burbujas, tenemos
6
P (X < 7) =
x =0
Ejercicios
5.49 La probabilidad de que una persona que vive en
cierta ciudad tenga un perro es de 0.3. Calcule la probabilidad de que la dcima persona entrevistada al azar en
esa ciudad sea la quinta que tiene un perro.
5.50 Calcule la probabilidad de que una persona que
lanza una moneda obtenga
a) la tercera cara en el sptimo lanzamiento;
b) la primera cara en el cuarto lanzamiento.
5.51 Tres personas lanzan una moneda legal y el
disparejo paga los cafs. Si todas las monedas tienen
el mismo resultado, se lanzan de nuevo. Calcule la
probabilidad de que se necesiten menos de 4 lanzamientos.
5.52 Un cientfico inocula a varios ratones, uno a
la vez, el virus que produce una enfermedad, hasta que
encuentra a 2 que contraen la enfermedad. Si la proba-
Ejercicios
165
5.63 Calcule la media y la varianza de la variable aleatoria X del ejercicio 5.58, que representa el nmero de
huracanes que afectan cada ao a cierta rea del este
de Estados Unidos.
5.64 Calcule la media y la varianza de la variable
aleatoria X del ejercicio 5.61, que representa el nmero
de personas, de cada 10,000, que comete un error al
preparar su declaracin de impuestos.
5.65 Un fabricante de automviles se preocupa por
una falla en el mecanismo de freno de un modelo especfico. En raras ocasiones la falla puede causar una
catstrofe al manejarlo a alta velocidad. La distribucin
del nmero de automviles por ao que experimentar
la catstrofe es una variable aleatoria de Poisson con
= 5.
a) Cul es la probabilidad de que, a lo sumo, 3 automviles por ao de ese modelo especfico sufran
una catstrofe?
b) Cul es la probabilidad de que ms de un automvil por ao experimente una catstrofe?
5.66 Los cambios en los procedimientos de los aeropuertos requieren una planeacin considerable. Los
ndices de llegadas de los aviones son factores importantes que deben tomarse en cuenta. Suponga que los
aviones pequeos llegan a cierto aeropuerto, de acuerdo
con un proceso de Poisson, con una frecuencia de 6 por
hora. De esta manera, el parmetro de Poisson para las
llegadas en un periodo de horas es = 6t.
a) Cul es la probabilidad de que lleguen exactamente 4 aviones pequeos durante un periodo de
una hora?
b) Cul es la probabilidad de que lleguen al menos 4
durante un periodo de una hora?
c) Si definimos un da laboral como de 12 horas,
cul es la probabilidad de que al menos 75 aviones pequeos lleguen durante un da laboral?
5.67 Se supone que el nmero de clientes que llegan
por hora a ciertas instalaciones de servicio automotriz
sigue una distribucin de Poisson con media = 7.
a) Calcule la probabilidad de que lleguen ms de 10
clientes en un periodo de dos horas.
b) Cul es el nmero medio de llegadas durante un
periodo de 2 horas?
5.68 Considere el ejercicio 5.62. Cul es el nmero
promedio de estudiantes que no pasan la prueba?
5.69 La probabilidad de que una persona muera al
contraer una infeccin viral es de 0.001. De los siguientes 4000 infectados con el virus, cul es el nmero promedio que morir?
166
Ejercicios de repaso
5.77 Durante un proceso de produccin, cada da se
seleccionan al azar 15 unidades de la lnea de ensamble
para verificar el porcentaje de artculos defectuosos. A
partir de informacin histrica se sabe que la probabilidad de tener una unidad defectuosa es de 0.05. Cada
vez que se encuentran dos o ms unidades defectuosas
en la muestra de 15, el proceso se detiene. Este procedimiento se utiliza para proporcionar una seal en
caso de que aumente la probabilidad de unidades defectuosas.
a) Cul es la probabilidad de que en un da determinado se detenga el proceso de produccin? (Suponga 5% de unidades defectuosas).
b) Suponga que la probabilidad de una unidad defectuosa aumenta a 0.07. Cul es la probabilidad de
que en cualquier da no se detenga el proceso
de produccin?
187
188
X np
,
npq
0 1 2 3 4 5 6 7 8 9
11
13
15
189
La probabilidad exacta de que la variable aleatoria binomial X tome un valor determinado x es igual al rea de la barra cuya base se centra en x. Por ejemplo, la probabilidad exacta de que X tome el valor 4 es igual al rea del rectngulo con base centrada en
x = 4. Si usamos la tabla A.1, encontramos que esta rea es
P (X = 4) = b(4; 15, 0.4) = 0.1268,
que es aproximadamente igual al rea de la regin sombreada bajo la curva normal entre
las dos ordenadas x1 = 3.5 y x2 = 4.5 en la figura 6.23. Al convertir a valores z, tenemos
z1 =
3.5 6
= 1.32
1.897
0 1 2 3 4 5 6 7 8 9
z2 =
4.5 6
= 0.79.
1.897
11
13
15
x =7
P (7 X 9) =
6.5 6
9.5 6
= 0.26 y z 2 =
= 1.85.
1.897
1.897
190
Ahora,
P (7 X 9) P ( 0.26 < Z < 1.85) = P (Z < 1.85) P (Z < 0.26)
= 0.9678 0.6026 = 0.3652.
Una vez ms, la aproximacin de la curva normal ofrece un valor que se acerca al
valor exacto de 0.3564. El grado de exactitud, que depende de qu tan bien se ajuste la
curva al histograma, se incrementa a medida que aumenta n. Esto es particularmente cierto
cuando p no est muy cerca de 1/2 y el histograma ya no es simtrico. Las figuras 6.24 y
6.25 muestran los histogramas para b(x; 6, 0.2) y b(x; 15, 0.2), respectivamente. Es evidente que una curva normal se ajustar mucho mejor al histograma cuando n = 15 que cuando
n = 6.
0 1 2 3 4 5 6 7 8 9
11
13
15
x + 0.5 np
npq
191
r
0
1
2
3
4
5
6
7
8
9
10
p = 0.05, n = 10
Binomial
Normal
0.5987
0.5000
0.9139
0.9265
0.9885
0.9981
0.9990
1.0000
1.0000
1.0000
n = 20
Binomial
Normal
0.3585
0.3015
0.7358
0.6985
0.9245
0.9382
0.9841
0.9948
0.9974
0.9998
0.9997
1.0000
1.0000
1.0000
p = 0.10, n = 10
Binomial
Normal
0.3487
0.2981
0.7361
0.7019
0.9298
0.9429
0.9872
0.9959
0.9984
0.9999
1.0000
1.0000
p = 0.05
n = 50
Binomial
Normal
0.0769
0.0968
0.2794
0.2578
0.5405
0.5000
0.7604
0.7422
0.8964
0.9032
0.9622
0.9744
0.9882
0.9953
0.9968
0.9994
0.9992
0.9999
0.9998
1.0000
1.0000
1.0000
p = 0.50, n = 10
Binomial
Normal
0.0010
0.0022
0.0107
0.0136
0.0547
0.0571
0.1719
0.1711
0.3770
0.3745
0.6230
0.6255
0.8281
0.8289
0.9453
0.9429
0.9893
0.9864
0.9990
0.9978
1.0000
0.9997
n = 100
Binomial
Normal
0.0059
0.0197
0.0371
0.0537
0.1183
0.1251
0.2578
0.2451
0.4360
0.4090
0.6160
0.5910
0.7660
0.7549
0.8720
0.8749
0.9369
0.9463
0.9718
0.9803
0.9885
0.9941
Ejemplo 6.15: Un paciente que padece una rara enfermedad de la sangre tiene 0.4 de probabilidad de
recuperarse. Si se sabe que 100 personas contrajeron esta enfermedad, cul es la probabilidad de que sobrevivan menos de 30?
Solucin: Representemos con la variable binomial X el nmero de pacientes que sobreviven. Como
n = 100, deberamos obtener resultados muy precisos usando la aproximacin de la
curva normal con
= np = (100)(0.4) = 40 y = npq =
(100)(0.4)(0.6)= 4.899.
Para obtener la probabilidad que se desea, tenemos que calcular el rea a la izquierda de x = 29.5.
192
=1
=1
-2.14
1.16
2.71
Ejemplo 6.16: Un examen de opcin mltiple tiene 200 preguntas, cada una con 4 respuestas posibles,
de las que slo una es la correcta. Cul es la probabilidad de que solamente adivinando
se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas sobre los que
el estudiante no tiene conocimientos?
Solucin: La probabilidad de adivinar una respuesta correcta para cada una de las 80 preguntas es
p = 1/4. Si X representa el nmero de respuestas correctas slo porque se adivinaron,
entonces,
30
P (25 X 30) =
1
4
= 20
y
= npq =
24.5 20
30.5 20
= 1.16 y z 2 =
= 2.71.
3.873
3.873
P (25 X 30) =
x =25
Ejercicios
193
Ejercicios
6.24 Se lanza una moneda 400 veces. Utilice la
aproximacin a la curva normal para calcular la probabilidad de obtener
a) entre 185 y 210 caras;
b) exactamente 205 caras;
c) menos de 176 o ms de 227 caras.
6.25 En un proceso para fabricar un componente
electrnico, 1% de los artculos resultan defectuosos.
Un plan de control de calidad consiste en seleccionar
100 artculos de un proceso de produccin y detenerlo
o continuar con l si ninguno est defectuoso. Use la
aproximacin normal a la binomial para calcular
a) la probabilidad de que el proceso contine con el
plan de muestreo descrito;
b) la probabilidad de que el proceso contine aun si
ste va mal (es decir, si la frecuencia de componentes defectuosos cambi a 5.0% de defectuosos).
6.26 Un proceso produce 10% de artculos defectuosos. Si se seleccionan al azar 100 artculos del proceso, cul es la probabilidad de que el nmero de
defectuosos
a) exceda los 13?
b) sea menor que 8?
6.27 Un paciente tiene 0.9 de probabilidad de recuperarse de una operacin de corazn delicada. De los siguientes 100 pacientes que se someten a esta operacin,
cul es la probabilidad de que
a) sobrevivan entre 84 y 95 inclusive?
b) sobrevivan menos de 86?
6.28 Investigadores de la Universidad George Washington y del Instituto Nacional de Salud informan
que aproximadamente 75% de las personas cree que
los tranquilizantes funcionan muy bien para lograr
que una persona est ms tranquila y relajada. De las
siguientes 80 personas entrevistadas, cul es la probabilidad de que
a) al menos 50 tengan esta opinin?
b) a lo sumo 56 tengan esta opinin?
6.29 Si 20% de los residentes de una ciudad de Estados Unidos prefieren un telfono blanco sobre cualquier otro color disponible, cul es la probabilidad de
que, de los siguientes 1000 telfonos que se instalen en
esa ciudad,
a) entre 170 y 185 sean blancos?
b) al menos 210 pero no ms de 225 sean blancos?
6.30 Un fabricante de medicamentos sostiene que
cierto medicamento cura una enfermedad de la sangre,
en promedio, 80% de las veces. Para verificar la aseveracin, inspectores gubernamentales utilizan el medi-
194
6.38 Una empresa de telemarketing tiene una mquina especial para abrir cartas que abre y extrae el contenido de los sobres. Si un sobre se colocara de forma
incorrecta en la mquina, no se podra extraer su contenido, o incluso se podra daar. En este caso se dice que
fall la mquina.
a) Si la probabilidad de que falle la mquina es de
0.01, cul es la probabilidad de que ocurra ms
de una falla en un lote de 20 sobres?
b) Si la probabilidad de que falle la mquina es de
0.01 y se abrir un lote de 500 sobres, cul es la
probabilidad de que ocurran ms de 8 fallas?
6.6
() =
ex ( 1)x 2 dx = ( 1)
x 2 ex dx ,
195
1
1 x/
e
,
( ) x
x > 0,
0,
en otro caso,
=1
=1
0.5
=2
=1
=4
=1
1 x/
,
e
0,
x > 0,
en otro caso,
196
et ( t ) 0
= et .
0!
Ahora podemos utilizar lo anterior y hacer que X sea el tiempo para el primer evento de
Poisson. La probabilidad de que la duracin del tiempo hasta el primer evento exceda x
es la misma que la probabilidad de que no ocurra algn evento de Poisson en x. Esto
ltimo, por supuesto, es dado por e x. Como resultado,
P (X > x ) = ex .
As, la funcin de distribucin acumulativa para X es dada por
P (0 X x ) = 1 ex .
Ahora, para poder reconocer la presencia de la distribucin exponencial, podemos diferenciar la funcin de distribucin acumulativa anterior con el fin de obtener la funcin de
densidad
197
f (x ) = ex ,
que es la funcin de densidad de la distribucin exponencial con = 1/.
1
5
b(x ; 5, 0.2) =1
P (X 2) =
x =2
x =0
198
P (X 1) =
0
1 x/
xe
dx = 25
2
xe 5x dx = 1 e5 (1 + 5) = 0.96.
199
Solucin: Sea la variable aleatoria X el tiempo de supervivencia (tiempo hasta la muerte). La probabilidad que se requiere es
60 1 x/
1
x
e
P (X 60) = 5
dx .
0
(5)
La integral anterior se puede resolver mediante la funcin gamma incompleta, que se
convierte en la funcin de distribucin acumulativa para la distribucin gamma. Esta
funcin se escribe como
x 1 y
y
e
dy.
F (x ; ) =
()
0
Si permitimos que y = x/, de modo que x = y, tenemos
6
P (X 60) =
0
y 4 ey
dy,
(5)
que se denota como F(6; 5) en la tabla de la funcin gamma incompleta del apndice
A.23. Observe que esto permite un clculo rpido de las probabilidades para la distribucin gamma. De hecho, para este problema la probabilidad de que la rata no sobreviva
ms de 60 das es dada por
P (X 60) = F (6; 5) = 0.715.
Ejemplo 6.20: A partir de datos previos se sabe que la longitud de tiempo, en meses, entre las quejas de
los clientes sobre cierto producto es una distribucin gamma con = 2 y = 4. Se
realizaron cambios para hacer ms estrictos los requerimientos del control de calidad
despus de los cuales pasaron 20 meses antes de la primera queja. Parecera que los
cambios realizados en el control de calidad resultaron eficaces?
Solucin: Sea X el tiempo para que se presente la primera queja, el cual, en las condiciones anteriores a los cambios, segua una distribucin gamma con = 2 y = 4. La pregunta se
centra alrededor de qu tan raro es X 20 dado que y permanecen con los valores 2
y 4, repectivamente. En otras palabras, en las condiciones anteriores es razonable un
tiempo para la queja tan grande como 20 meses? Por consiguiente, si seguimos la solucin del ejemplo 6.19,
20 1 x/
x
e
1
P (X 20) = 1
dx .
0
()
De nuevo, usando y = x/ tenemos
5
P (X 20) = 1
0
ye y
dy = 1 F (5; 2) = 1 0.96 = 0.04,
(2)
1 y/ 4
,
4e
0,
y 0,
en otro caso.
200
Observe que Y es una variable aleatoria exponencial con = 4 aos. Se considera que la
lavadora es una ganga si no hay probabilidades de que requiera una reparacin mayor
antes de cumplir 6 aos de haber sido comprada. Cul es la probabilidad de P(Y > 6)?
Cul es la probabilidad de que la lavadora requiera una reparacin mayor durante el
primer ao?
Solucin: Considere la funcin de distribucin acumulativa F(y) para la distribucin exponencial,
F (y) =
et/ dt = 1 ey/ .
De manera que
P (Y > 6) = 1 F (6) = e3/2 = 0.2231.
Por lo tanto, la probabilidad de que la lavadora requiera una reparacin mayor despus
de seis aos es de 0.223. Desde luego, la probabilidad de que requiera reparacin antes del
sexto ao es de 0.777. As, se podra concluir que la lavadora no es realmente una ganga.
La probabilidad de que se requiera una reparacin mayor durante el primer ao es
P (Y < 1) = 1 e1/4 = 1 0.779 = 0.221.
6.7
1
2 v/ 2 ( v/ 2)
x v/ 21 ex/ 2 ,
0,
x > 0,
en otro caso,
Pr
actico 1: Distribuciones continuas.
Ejercicio 1. Se consideran las siguientes funciones reales
(
c1 x
f1 (x) =
0
si x (0, 1)
si x
6 (0, 1)
c x2
2
f2 (x) =
c2 x
si
si
si
si
x<1
x [1, 2]
x (2, 3)
x3
Ejercicio 2. En pruebas de medicion de distancia de frenado de automoviles, los vehculos que viajan
a determinada velocidad tienden a recorrer distancias de frenado que estan distribudas uniformemente
entre dos puntos a y b. Calcular la probabilidad de que uno de estos automoviles:
1. se detenga m
as cerca de a que de b.
2. se detenga de tal modo que la distancia a a sea por lo menos tres veces mayor que la distancia a b.
Ejercicio 3.
1. Sea Z una v.a. con distribucion normal estandar. Hallar la probabilidad de que Z
sea mayor a 1, 84 y de que Z este entre 1, 97 y 0, 86.
Pr
actico 2: Momentos y F.G.M.
Ejercicio 1. Considere una variable aleatoria discreta X tal que P (X = 2k ) =
1
,
2k+1
k N. Pruebe que
2. Y = X 2
3. Y = X 3
Ejercicio 3. Hallar la esperanza y varianza de la v.a. X por definicion y a partir de la funcion generatriz
de momentos:
1. X Ber(p).
2. X exp().
3. X N (, )
Ejercicio 6. Supongase que la duracion en minutos de una llamada de negocios, es una variable aleatoria
cuya funci
on de densidad de probabilidad esta determinada por:
(
1 x/4
e
si x > 0
f (x) = 4
0
otro caso
Determinar E(X) y V ar(X) utilizando la definicion y mediante la funcion generatriz de momentos.
01_Estadistica.qxd
2/17/05
16:06
Page 13
Captulo
Introduccin
a la Estadstica
Recopilar, describir, organizar
e interpretar datos para transformarlos
en informacin, nos permite tomar
decisiones de una manera ms
eficiente. En este captulo veremos
cules son las formas de recopilar
datos, distintos tipos de estudios
estadsticos y mtodos de anlisis.
Qu es la Estadstica?
Recopilacin de datos
Estudios y mtodos estadsticos
Algunas definiciones
Inicio de una investigacin
Resumen
Actividades
14
15
16
18
21
22
24
01_Estadistica.qxd
2/17/05
16:06
Page 14
QU ES LA ESTADSTICA?
Con el objetivo de introducirnos en el estudio de la Estadstica, le proponemos que lea las siguientes definiciones:
El contenido de la estadstica moderna incluye la recopilacin, presentacin y caracterizacin de la informacin a fin de que auxilie tanto en
el anlisis de datos como en el proceso de toma de decisiones.(1)
La estadstica, como campo de estudio, es el arte y la ciencia de dar sentido a los datos numricos.(2)
La estadstica se define a menudo como un conjunto de mtodos para
la toma de decisiones en condiciones de incertidumbre.(3)
La estadstica estudia el comportamiento de los fenmenos llamados de
colectivo. Est caracterizada por una informacin acerca de un colectivo
o universo, lo que constituye su objeto material; un modo propio de razonamiento, el mtodo estadstico, lo que constituye su objeto formal, y
unas previsiones de cara al futuro, lo que implica un ambiente de incertidumbre, que constituyen su objeto o causa final.(4)
La estadstica es el estudio de los fenmenos aleatorios. [] El aspecto
ms importante de la estadstica es la obtencin de conclusiones basadas
en los datos experimentales.(5)
Qu palabras clave resaltara de estas citas?
Aportamos algunas: experimento, fenmeno, datos, informacin, mtodos, tcnicas, toma de decisiones, incertidumbre.
(1) Berenson, M y Levine, D. Estadstica bsica en administracin. Prentince-Hall Hispanoamericana,
4ta. Ed., 1992.
(2) Hildebrand, D. y Ott, L. Estadstica Aplicada a la Administracin y a la Economa.
Addison-Wesley Iberoamerica, 3ra. Ed., 1997.
(3) Harnett, D. y Murphy, J. Introduccin al Anlisis Estadstico. Addison-Wesley Iberoamerica, 1987.
(4) Cabri, 1994, en Didctica de la Estadstica, Batanero, P. 2001.
(5) Canavos, G. Probabilidad y Estadstica. McGraw Hill, 1988.
14
01_Estadistica.qxd
2/17/05
16:06
Page 15
Recopilacin de datos
Si bien la recopilacin de datos es un tema que merece un prrafo aparte sobre
el que haremos algunas consideraciones en el Captulo 6, podemos anticipar
que stos pueden ser generados por el propio interesado, o bien haber sido recopilados por un tercero, ya sea un individuo o una organizacin. En el primer caso, la fuente de datos se denomina primaria, y en el segundo caso, secundaria.
En ambas situaciones, los datos pueden ser generados bsicamente de tres
maneras (Figura 1):
1. A travs de la realizacin de un censo.
2. Tomando una muestra.
3. Diseando un experimento.
Contar con datos censales implica que el interesado logr observar o medir
todas las unidades o sujetos de interes existentes. Sin embargo, en muchas situaciones prcticas, no es posible acceder a todas las unidades existentes, por
ser una tarea costosa, ardua y en ocasiones hasta imposible, o bien porque la
medicin destruira a la unidad o sujeto en estudio.
Imagina por ejemplo un censo sobre los insectos de cierta especie? En tal caso ser ms conveniente cuando no, el nico camino obtener los datos a
travs de la medicin u observacin de una porcin de las unidades existentes, es decir, tomando una muestra.
El tamao de la poblacin a estudiar juega un papel crucial al momento de
decidir de qu manera se han de recopilar datos: si la poblacin es infinita o
finita pero de gran tamao, la muestra ser la manera ms razonable y eficiente de recopilar datos. O, cmo controlara la calidad de los envases de vidrio
salidos de la produccin de una pequea fbrica? Si se trata del aspecto esttico, podra contar las burbujas de cada envase para clasificar cada pieza pro15
Introduccin a la estadstica
Estas claves nos guiarn a travs de las prximas pginas, en las que profundizaremos en temas tales como la obtencin de datos y los mtodos estadsticos que permiten la interpretacin de los datos recopilados, haciendo hincapi en el hecho de que habitualmente nos enfrentamos a situaciones en las
que debemos tomar decisiones, tanto en el mbito laboral o profesional como en la vida cotidiana, y contamos slo con informacin parcial, lo que nos
coloca en un escenario de incertidumbre.
Qu es la Estadstica?
01_Estadistica.qxd
2/17/05
16:06
Page 16
ducida. Si, en cambio, deseara estudiar la resistencia de la materia prima, intentara usted romper cada pieza fabricada? Ya sea por ahorro de tiempo o
bien por pruebas destructivas una muestra de piezas para control de calidad
es la forma de recopilacin ms razonable en muchos casos.
En otros casos es necesario que el investigador genere sus propios datos interviniendo directamente, por lo que ser preciso que disee un experimento a
la medida de sus necesidades.
01_Estadistica.qxd
2/17/05
16:06
Page 17
Por otra parte, el objetivo perseguido por el analista puede dar lugar a otra tipologa de estudios estadsticos. Ellos son los estudios exploratorios y los
confirmatorios (Figura 2). Los primeros se aplican cuando se desea buscar un
modelo que explique o describa convenientemente el comportamiento de alguna variable, la relacin entre variables o grupos de sujetos, etc. En cambio,
los estudios confirmatorios se orientan a la verificacin de la compatibilidad
de un conjunto de datos con respecto a un modelo supuesto previamente.
17
Introduccin a la estadstica
les, o bien realicen un seguimiento en el futuro de los efectos de alguna circunstancia observada en el presente o en el pasado. Un ejemplo de estudio retrospectivo es la recopilacin de informacin sobre la capacitacin y estilo de liderazgo
de ejecutivos que, actualmente, se reconocen como exitosos. Un ejemplo de estudio prospectivo es el registro sistemtico de informacin sobre la capacitacin
y estilo de liderazgo de actuales profesionales novatos con el fin de establecer el
grado de xito profesional que alcanzan en el momento de su retiro.
Si, en cambio, el investigador disea un experimento a medida, que consiste
en aplicar uno o ms tratamientos a las unidades o sujetos, y observa la respuesta, se encaminar hacia un tipo de estudio experimental.
Qu es la Estadstica?
01_Estadistica.qxd
2/17/05
16:06
Page 18
La Actividad 2 propuesta al final del captulo est diseada para que aplique
los temas tratados en este pargrafo.
ALGUNAS DEFINICIONES
En las pginas previas hemos utilizado algunos vocablos que, si bien pueden resultar familiares, es conveniente definir con una mayor precisin.
18
01_Estadistica.qxd
2/17/05
16:06
Page 19
Por su parte, una unidad elemental es cada objeto o sujeto que observamos de
la poblacin. En nuestro ejemplo, una unidad elemental es cada individuo que
se atendi en el saln de belleza dos veces o ms en los ltimos doce meses.
Si a cada persona que requiri los servicios del saln de belleza se le completa una ficha donde consta la fecha de cada visita, podremos fcilmente identificar a aquellos que forman parte de la poblacin. Concretamente observaremos la cantidad de veces que cada cliente tom algn servicio en el ao: si
es 1 o menos, lo descartaremos; si es 2 o ms, ser considerado con atencin
a los fines del estudio, porque forma parte de la poblacin bajo anlisis.
Aquella caracterstica que se observa o se mide sobre las unidades elementales se denomina variable.
Por supuesto, podramos reunir datos sobre otras variables relacionadas con
los clientes del saln de belleza. Contando con un fichero actualizado, podramos recopilar informacin relevante como, por ejemplo, qu servicios tom
cada cliente en cada visita o el gasto que efectu.
Observe que las variables del ejemplo son bastante diferentes entre s; en realidad son de distinto tipo y se miden en diferente escala.
El tipo de servicio tomado por cada cliente se clasifica como variable cualitativa o categrica; no toma valores numricos, sino que asume categoras
como podran ser tratamiento capilar, tratamiento dermatolgico, manicura, etc. La variable de este ejemplo en particular est medida en escala nominal, por cuanto cada unidad de la escala representa una categora diferente y entre ellas no guardan una relacin de magnitud. En otras palabras, pa19
Introduccin a la estadstica
Algunas definiciones
01_Estadistica.qxd
2/17/05
16:06
Page 20
ra la variable tipo de servicio tomado por cada cliente, la categora tratamiento capilar no es ms ni menos importante que la categora tratamiento dermatolgico. Otros ejemplos de variables medidas en escala nominal
son las distintas marcas de gaseosa o las nacionalidades.
Si, en cambio, las categoras de una variable guardan un cierto orden de importancia, como tratamiento sencillo, tratamiento vip, tal variable est
medida en escala ordinal. En esta escala de medicin es posible establecer relaciones del tipo A>B, A=B o A<B, aunque no informa acerca de la magnitud
de las diferencias entre categoras. No podramos afirmar que el tratamiento
vip es el doble de importante que el sencillo, o bien que un alumno excelente es el triple de bueno que un alumno regular.
Debemos saber que aquellas variables que se midan en escala nominal u ordinal no nos permitirn realizar clculos matemticos y que, a lo sumo, contaremos con el nmero de individuos que se clasifican en una u otra categora.
Por otra parte, si consideramos la variable cantidad de veces que cada
cliente se atendi en el saln de belleza en el ltimo ao, observamos que
puede asumir valores numricos, aunque no cualquier valor. Se trata de una
variable cuantitativa, que a su vez se subclasifica como discreta para el
ejemplo. Se define como aquella variable que no puede ser particionada infinitamente dentro de un intervalo. Si es nuestro inters analizar el monto
pagado en cada visita al saln de belleza, tambin clasificaremos la variable
como cuantitativa; sin embargo, razonamos que dentro de un rango, en realidad hay infinitos valores posibles, por lo tanto se trata de una variable
cuantitativa continua. Este tipo de variables puede ser particionado infinitamente dentro de un intervalo.
Las variables cuantitativas pueden estar medidas en escala de intervalos o en escala de razn. La escala de intervalos representa un nivel superior de medicin con
respecto al de la escala ordinal. Adems de permitir relaciones del tipo A>B, A=B, o
A<B, es posible comparar intervalos de valores debido a que a lo largo de toda la
escala, dos valores adyacentes representan siempre la misma diferencia de magnitud, por lo que es posible realizar comparaciones del tipo A-B=C-D, A-B < C-D, o
A-B > C-D. Una particularidad de esta escala es que el valor cero es arbitrario. Un
ejemplo de aplicacin de esta escala lo representan los horarios de llegada de los
empleados de una compaa. Entre las 8 y las 9 am existe la misma diferencia que
entre las 4 y las 5 pm, pero no puede afirmarse que quien lleg a las 8 pm haya
arribado el doble de tarde que el que ingres a las 8 am. Incluso la hora cero no indica especialmente nada, como ausencia del empleado.
20
01_Estadistica.qxd
2/17/05
16:06
Page 21
Le proponemos realizar la Actividad 3, con la que usted podr poner en prctica los conceptos del presente captulo.
Introduccin a la estadstica
El nivel ms alto de medicin es la escala de razn. Adems de tener las propiedades de las otras escalas, tiene un cero absoluto, por lo tanto es posible calcular proporciones entre los valores de la escala. As puede establecerse que, por
ejemplo, un individuo de 40 aos tiene el doble de edad de uno de 20 aos,
que entre 20 y 21 aos existe la misma diferencia etaria que entre 40 y 41 aos,
y tambin que un sujeto de 40 aos es mayor que uno de 20. De manera que
sobre esta escala es posible realizar todas las operaciones matemticas asociadas
a los nmeros (suma, resta, multiplicacin y divisin). Relaciones similares podran realizarse sobre variables como la remuneracin, la estatura o el precio de
cierto artculo, que siendo variables cuantitativas, en ocasiones y por cuestiones prcticas, pueden discretizarse y hasta categorizarse modifcando
su escala de medicin original. La correcta clasificacin de las variables en estudio, as como la definicin de la escala de medicin, orientar al investigador
sobre las tcnicas estadsticas ms adecuadas para analizarlas.
En pginas anteriores anticipamos que la palabra poblacin tiene dos acepciones. Mencionamos una de ellas para la que poblacin representa el conjunto completo de objetos o sujetos bajo anlisis. La otra acepcin del vocablo se relaciona con el conjunto completo de valores que toma una variable
en un universo. Tal conjunto puede ser descrito y resumido con una serie de
medidas descriptivas denominadas parmetros, mientras que a las medidas
descriptivas de datos muestrales se las llama estimadores o estadgrafos.
Algunas definiciones
01_Estadistica.qxd
2/17/05
16:06
Page 22
RESUMEN
Seguramente usted tenga la habilidad de integrar los conceptos que abordamos en este
captulo. Por nuestra parte le facilitamos un diagrama, que se encuentra en la pgina siguiente, que tiene el objetivo de resumir los puntos tratados de manera esquemtica.
22
16:06
Page 23
2/17/05
Introduccin a la estadstica
01_Estadistica.qxd
23
01_Estadistica.qxd
2/17/05
16:06
Page 24
ACTIVIDADES
1 Para las siguientes propuestas, decida de qu manera recopilara los datos y a qu tipo de fuente recurrira:
a. Objetivo: estudiar la evolucin de la cotizacin de las acciones de cierta fbrica automotriz en el ltimo ao.
b. Objetivo: conocer la frecuencia de compra de los clientes de su propio negocio.
c. Objetivo: analizar los efectos de un nuevo analgsico.
2 Para las siguientes propuestas, decida qu tipo de estudio estadstico efectuara y qu
mtodo/s podra aplicar para el anlisis de datos:
a. Usted es un comerciante y desea estudiar el comportamiento de las ventas en su
negocio en funcin de su inversin en publicidad y la cotizacin del dlar.
b. En una investigacin sobre tabaquismo se desea analizar los efectos a largo plazo
de tal hbito sobre el sistema respiratorio.
c. Un fabricante de ropa deportiva desea conocer el perfil de sus clientes.
3 Lea las siguientes variables e intente identificar la poblacin en estudio, las unidades
elementales, su unidad de medida y su escala de medicin:
a. Lugar de origen de los pasajeros de cierta empresa de aviacin arribados en el ltimo vuelo al aeropuerto internacional de Barajas.
b. Nmero de canciones de un CD.
c. Temperatura mxima diaria en Caracas durante el ltimo mes.
24
6. Muestreo
La forma en que se realiza la seleccin puede hacer la diferencia. Es ms fcil obtener muestras malas que buenas.
No todo es tan simple como tomar sopa.
En la Seccin 5.3 consideramos un estudio, realizado por un profesor universitario entre sus alumnos, para evaluar si los jvenes que practican deportes consumen menos
alcohol. Este es un ejemplo de participacin voluntaria en un estudio, la muestra no es
representativa de la poblacin de inters.
Recordemos un ejemplo de la Seccin 3.1. Interesaba conocer las
opiniones respecto a si el correo electrnico debe responderse lo
ms rpido posible o no. Si la encuesta fue realizada va el correo
electrnico, las opiniones representan nicamente a los que tienen
correo electrnico y les interes responder la encuesta.
El muestreo aleatorio (el proceso por el cual se obtiene una muestra aleatoria) comienza
con una lista de unidades muestrales de la que se extraer la muestra. Esta lista se llama
marco muestral. Idealmente, el marco muestral debera contener la lista de la totalidad
de las unidades muestrales.
El muestreo aleatorio simple tiene dos propiedades que lo convierten en el procedimiento por excelencia de obtencin de muestras.
Muestreo
29
Todas las unidades tienen la misma oportunidad de ser elegidas (es insesgado).
La eleccin de una unidad no inuye sobre la eleccin de otra (independencia).
El Instituto Nacional de Estadsticas y
Censos - INDEC - realiza peridicamente censos para registrar las caractersticas bsicas sobre poblacin y vivienda,
actividad econmica y agropecuaria de
nuestro pas. Las unidades relevadas en
los censos proveen el marco muestral
para las encuestas que realiza durante
los perodos intercensales.
Por otra parte, es necesario aclarar que una unidad muestral puede contener muchos individuos. Una escuela, con sus alumnos, puede ser una unidad muestral. El
objetivo del estudio pueden ser las escuelas (por ej. interesa conocer la supercie cubierta por
alumno) o ser los alumnos (por ej. interesa conocer el rendimiento en educacin fsica).
Mm!
Aj!
Cmo? Una unidad muestral puede estar constituida por muchos individuos?
Volvamos al ejemplo de la encuesta sobre la preferencia del candidato a presidente
del Club Grande de Ftbol. Utilicemos la lista actualizada de todos los socios como
marco muestral con los nmeros de socio para identicarlos. Si se decide que 1 de
cada 6 socios entrarn en la muestra podemos arrojar un dado tantas veces como
socios tenemos en la lista y si sale 1 el socio es seleccionado.
30
TABLA 6.1
Socio
Nmero
1495
1496
1497
Nmero
aleatorio
4
8
8
Socio
Nmero
1.501
1.502
1.503
Nmero
aleatorio
1
6
3
Socio
Nmero
1.507
1.508
1.509
Nmero
aleatorio
4
4
3
Socio
Nmero
1.513
1.514
1.515
Nmero
aleatorio
4
7
8
1498
1.504
1.510
1.516
1499
1500
9
5
1.505
1.506
1
7
1.511
1.512
1
7
1.517
1.518
1
3
Con este procedimiento, seleccionamos los socios no: 1.501, 1.505, 1.511 y 1.517 mediante
un muestreo aleatorio simple.
Tambin podramos utilizar un programa de computadora para generar nmeros entre
1 y 6 en forma aleatoria, sin necesidad de arrojar un dado.
Muestra aleatoria simple en dos pasos :
Paso 1. Se asigna una etiqueta numrica a cada individuo de la poblacin.
Paso 2: Se utilizan nmeros aleatorios para seleccionar las etiquetas al azar.
Otro tipo de muestra mala es la muestra de conveniencia. Si una pedagoga elige a sus propios alumnos, del ltimo ao de la escuela secundaria en la que trabaja, para evaluar un cambio en el mtodo de enseanza, los resultados no se podrn extender ms all de ese grupo.
Muestreo
31
6.3 Sesgo
Alguna vez escuchamos el sesgo es malo. Pero, qu es el sesgo? Es un favoritismo de
alguna etapa del proceso de recoleccin de datos beneciando algunos resultados, perjudicando otros y desviando las conclusiones en direcciones equivocadas.
Cuando alguna etapa del proceso de recoleccin de datos est sesgada, utilizar una muestra grande no corrige el error, simplemente lo repite.
Los datos en un estudio pueden estar sesgados por muchos motivos. A continuacin,
veremos algunos de ellos.
32
Muestreo
33
Al primer grupo: a qu velocidad piensa que los dos autos chocaron? El promedio de las
respuestas fue de 50,9 km/h.
Al segundo grupo: a qu velocidad piensa que los dos autos se colisionaron? El promedio
de las respuestas fue de 65,9 km/h.
Ambos grupos vieron la misma pelcula. El uso de la palabra colisionaron aument las
estimaciones de la velocidad del accidente en 15 km/h, esto es un aumento del 29,5 %
El sesgo debido a la forma en que se presenta una pregunta puede ser intencional o
no intencional.
Las preguntas No est usted harto de pagar impuestos para que todo siga igual de
mal? y Le parece importante que se paguen impuestos para mejorar la educacin, los
servicios de salud y la seguridad?, que apuntan al pago de impuestos, seguramente tendrn resultados muy diferentes. Ambas preguntas conllevan un sesgo intencional.
Una encuesta dirigida a alumnos de 7mo. grado que pregunte: Cules son las 5 personas grandes que le gustaran conocer personalmente? tendr diferentes lecturas. Algunos de los alumnos podrn interpretar que se trata de personas mayores de edad, otros
que son altos, otros que se reere a gordos o tal vez a grandes estrellas de cine, de rock,
polticos o deportistas, generando un sesgo no intencional.
le interesa especialmente, antes de sacar sus propias conclusiones averige qu se pregunt, cmo
fueron redactadas las preguntas, si las respuestas
fueron dadas en forma annima o no y cuntos se
negaron a responder.
Es ms fcil obtener muestras malas que buenas.
Este tipo de muestreo permite evitar el sesgo personal y es ms sencillo que el muestreo
aleatorio. Es til cuando la poblacin est ordenada naturalmente (si no lo est, para
utilizar este tipo de muestreo es necesario ordenarla, pero al ordenarla, se pierden las
ventajas que tiene).
Por su simplicidad, se suele utilizar para control de calidad durante, o al nalizar, la
fabricacin de diversos productos.
En una produccin continua de tubos de pasta dentfrica, se elige un tubo por hora y se
lo analiza para vericar que cumple con las especicaciones.
Muestreo
35
Podra ocurrir que cada hora (una hora es el perodo de la seleccin) se produzca una leve
cada de tensin que hace que los tubos de pasta dentfrica se llenen ms o menos. No
detectaramos esa variacin con el muestreo cada hora.
Al realizar un muestreo sistemtico es importante estar alerta para identicar los factores
que puedan estar invalidando los resultados.
Los estratos se eligen de acuerdo con los valores conocidos de algunas variables,
de manera que haya poca variabilidad dentro del estrato (los valores de dichas
variables para las unidades de un estrato particular dieren poco), pero que haya
mucha variabilidad entre estratos (los valores de dichas variables para las unidades
de distintos estratos dieren mucho).
Ejemplo 1:
La poblacin de una ciudad podra estraticarse por
Si adems se dividiera la actividad industrial en dos: 1) industria alimenticia, 2) industria no alimenticia, cuntos estratos tendra la muestra? Tendra 8 estratos, dos por cada
uno de los 4 estratos anteriores.
Tres pasos de un muestreo aleatorio estraticado:
Paso 1: las unidades se agrupan en estratos. Los estratos se eligen teniendo en cuen-
ta que estos grupos tienen un inters especial dentro de la poblacin, o porque los
individuos en el estrato se parecen mucho.
Paso 2: se establece la proporcin de unidades, o fraccin de muestreo, que se incluir
para cada estrato
Paso 3: dentro de cada estrato se realiza un muestreo aleatorio simple y la proporcin de individuos que se incluye en la muestra es la establecida en el paso 2. La
unin de las muestras de cada estrato constituye la muestra completa.
La idea del agrupamiento para un muestreo aleatorio por conglomerados (tambin llamados aglomerados) es opuesta a la del muestreo estraticado. Interesa que los individuos
que componen cada grupo sean lo ms heterogneos posibles y se espera que cada conglomerado sea representativo de la poblacin. Los conglomerados son las unidades del
muestreo, pero las unidades de inters son los individuos dentro de los conglomerados. Se
selecciona una muestra aleatoria de conglomerados, y se observan todos los individuos
dentro de cada conglomerado se selecciona una muestra aleatoria simple dentro del
conglomerado. Este tipo de muestreo puede tener mejor rendimiento costo-efectividad
que un muestreo aleatorio simple, en especial si los costos de traslado son altos.
Ejemplo 1:
Una encuesta de viviendas. Se divide la ciudad en manzanas, se seleccionan las manzanas mediante un muestreo aleatorio simple y se visitan todas las casas de cada manzana seleccionada.
Muestreo
37
Ejemplo 2:
En un estudio interesa evaluar la capacidad de lectoescritura de alumnos de 7mo grado.
Se seleccionarn al azar las escuelas y luego se realizar la prueba en todos los alumnos
de 7mo. grado de las escuelas seleccionadas.
Tres pasos de un muestreo aleatorio por conglomerados:
mente tienen una proximidad fsica, pero dentro de cada conglomerado las unidades son heterogneas.
Paso 2: Los conglomerados son las unidades muestrales. Se establece la proporcin
de unidades que se incluir.
Paso 3: Se realiza un muestreo aleatorio simple de conglomerados y se estudian todos
los individuos de cada conglomerado seleccionado. El tamao nal de la muestra es
la cantidad de individuos que componen todos los conglomerados seleccionados.
38
Para cada uno de los siguientes estudios indicar la poblacin lo ms detalladamente posible,
es decir describir a los individuos que la componen. Si la informacin es insuciente, completarla de la forma que se considere ms adecuada. Tambin indicar cul es la muestra.
Durante la reunin anual del colegio de abogados, todos los presentes (2.500),
llenaron una encuesta referida al tipo de seguro que prefera para su automvil.
En 1968 se realiz en Holanda un test de inteligencia a todos los varones de 18 aos que
estaban realizando el Servicio Militar Obligatorio.
3. Se quiere realizar una encuesta entre los alumnos de una escuela secundaria, de 2.500
alumnos (500 alumnos por cada ao, de 1ro. a 5to.), utilizando una muestra de tamao
100. El propsito de la encuesta es determinar si a los/as alumno/as les interesa discutir
el siguiente tema: Debe reducirse la edad de imputabilidad penal para los menores
de edad, que establece la ley nacional 22.278, a diecisis aos de edad; como respuesta
al incremento en la cantidad de delitos graves cometidos por jvenes y adolescentes.
Se eligen al azar una divisin de cada uno de los aos y se seleccionan 20 alumnos
de cada divisin.
Se eligen al azar 60 alumnos de los primeros 3 aos y 40 alumnos de los ltimos dos aos
Muestreo
39
5. En un programa de radio se invit a las/los oyentes a contestar la siguiente pregunta: Si pudiera volver el tiempo atrs volvera a tener hijos? De ms de 10.000
respuestas el 70% dijo no. Qu muestra esto?
Elegir, entre las cinco siguientes, la respuesta que mejor responde a esta ltima pregunta.
a.
b.
c.
d.
40
Probabilidad y Estadstica II
1.- En la pgina 14 del material de Diez S. (2005), la autora propone diferentes concepciones para
definir Estadstica (que se diferencian en acentuar determinado aspecto). Se pide argumentar a
favor de alguna de ellas e ilustrar con algn posible ejemplo.
2.- Recopilacin de datos
Hacer una breve referencia acerca de las formas de recopilar datos para un estudio estadstico
segn el tipo de fuente y segn la forma de la recoleccin.
3.- Estudios estadsticos
En su carrera elegida: considerara ms usuales los estudios estadsticos observacionales o
estudios experimentales? Justificar.
Dar un ejemplo de un estudio observacional y clasificarlo como prospectivo o retrospectivo.
Dar un ejemplo de un estudio experimental exploratorio.
4.- Hacer un cuadro resumen respecto a los tipos de muestreos probabilsticos y no
probabilsticos. A continuacin hacer una breve sntesis de cada uno de ellos.
5.- Tipos de muestreo no probabilsticos
Proponer algn ejemplo para el cual considere, justificando con algn argumento (aun
siendo un argumento ficticio), que debe hacer un muestreo no probabilstico. Indicar cul de ellos
segn la bibliografa propuesta y comentar cmo tomara la muestra en dicho contexto.
Caracterizarlo como un estudio observacional (retrospectivo o prospectivo) o como un
experimento.
6.- dem punto anterior para un tipo de muestreo probabilstico.
Observaciones:
Todos los ejemplos pedidos deben tener estricta relacin a la carrera en estudio.
La extensin mxima del trabajo incluyendo la cartula es de 5 pginas.
PyE II
Ejercicio 1. Sea X Bin(n, p). Se proponen los siguientes estimadores T1 y T2 para el parametro
poblacional p:
T1 =
X
n
T2 =
X +1
n+2
Se pide verificar:
a) si son insesgados
b) si son consistentes
c) cu
al de los dos tiene menor variabilidad
Ejercicio 2. Sean X1 , X2 , X3 yX4 una muestra aleatoria de tamano cuatro de una poblacion cuya distribuci
on es exponencial con par
ametro desconocido. De las siguientes estadsticas: cuales son estimadores
insesgados de ? cu
al de ellos tiene menor varianza?
1
1
(X1 + X2 ) + (X3 + X4 )
6
3
X1 + 2X2 + 3X3 + 4X4
T2 =
5
X1 + X2 + X3 + X4
T3 =
4
T1 =
Ejercicio 3. Sea X1 , X2 , X3 , X4 , X5 una muestra aleatoria de una poblacion cuya distribucion es normal
con media y varianza 2 . Probar que los siguientes estimadores de son insesgados, cual es el de menor
varianza?
"
#
5
5
X
1X
1
T1 =
Xk , T2 =
2X1 +
Xk .
5
6
k=1
k=2
1.- Se desarrolla una nueva cura para cierto tipo de cemento que tiene como resultado un coeficiente de
compresin de 5000 kilogramos por centmetro cuadrado y una desviacin estndar de 120. Para probar la
hiptesis de que la media es 5000 contra la alternativa de que es menor a 5000, se prueba una muestra
aleatoria de 50 piezas de cemento. La regin crtica se define a la izquierda de 4970 para la media muestral.
a) Encontrar la probabilidad de cometer un error tipo I cuando H0 es verdadera.
b) Evaluar el error de tipo II para las alternativas para la media de 4970 y 4960. Calcular las potencias
correspondientes y graficar la curva de potencia del test.
2.- Un fabricante de bateras para auto afirma que la duracin de sus bateras se ditribuye de forma
aproximadamente normal con una desviacin estndar igual a 0.9 aos. Si una muestra aleatoria de 10 de
tales bateras tiene una desviacin estndar de 1.2 aos se puede considerar que el desvo estndar
poblacional es mayor a 0.9 aos? Utilizar un nivel de significacin de 0.05.
3.- Se comparan dos tipos de instrumentos para medir la cantidad de monxido de azufre en la atmsfera en
un experimento de contaminacin del aire. Se desea determinar si los dos tipos de instrumentos dan
mediciones que tengan la misma variabilidad. Se registran las siguientes lecturas para los dos instrumentos:
Instrumento A: 0.86
0.82 0.75 0.61 0.89 0.64 0.81 0.68 0.65
Instrumento B: 0.87
0.74 0.63 0.55 0.76 0.7
0.69 0.57 0.53
Suponga que las poblaciones de mediciones se distribuyen de forma aproximadamente normal, pruebe la
hiptesis de que las varianzas poblacionales son iguales contra la alternativa de que sean diferentes.
4.- Probar la hiptesis de que el contenido promedio de los envases de un lubricante particular es de 10 litros
si los contenidos de una muestra aleatoria de 10 envases son
10.2 9.7
10.1 10.3 10.1 9.8
9.9
10.4 10.3 9.8.
Utilizar un nivel de significacin de 0.01. Hay algn supuesto de trabajo para realizar esta prueba?
5.- Una medicina que se prescribe comnmente para aliviar la tensin nerviosa se considera que es efectiva en
60%. Resultados experimentales con una nueva medicina que se administra a una muestra aleatoria de 100
adultos que padecen de tensin nerviosa muestran que 70 tuvieron alivio. Es esto evidencia suficiente para
concluir que la nueva medicina es superior a la que se prescribe actualmente? Utilizar un nivel de significacin
de 0.05 y calcular el p-value (valor p).
6.- Un fabricante de equipo deportivo desarrolla un nuevo sedal sinttico que afirma tiene una resistencia
media a la tensin de ocho kilogramos con una desviacin estndar de 0.5 kilogramos. Pruebe la hiptesis que
la media es 8 kg contra la alternativa que es distinta de 8, si se prueba una muestra aleatoria de 50 sedales y se
encuentra que tiene una resistencia media a la tensin de 7.8. Utilizar un nivel de significacin de 0.01.
Calcular y decidir tambin sobre el valor p calculado. Calcular la potencia del test si el valor real de la media es
8.5, si es 9, si es 7 y si es 5. Representar la curva de potencia.
7.- Comparar, de ser posible, las soluciones obtenidas para los problemas dados con la metodologa de los
intervalos de confianza.
PyE II
Captulo 11
390
Y=
x
1
+
0
} 0
11.2
391
Y = 0 + 1 x +
en la cual 0 y 1 son los parmetros desconocidos de la interseccin y la pendiente,
respectivamente, y es una variable aleatoria que se supone est distribuida con E() = 0
y Var() = 2. Es frecuente que a la cantidad 2 se le denomine varianza del error o
varianza residual.
En el modelo anterior hay varias cuestiones evidentes. La cantidad Y es una variable
aleatoria, ya que es aleatoria. El valor x de la variable regresora no es aleatorio y, de
hecho, se mide con un error despreciable. La cantidad , que a menudo recibe el nombre
de error aleatorio o alteracin aleatoria, tiene varianza constante. Es comn que a esta
parte se le denomine suposicin de varianza homognea. La presencia de este error
aleatorio evita que el modelo se convierta tan slo en una ecuacin determinista. Ahora, el hecho de que E() = 0 implica que para una x especfica, los valores de y se distribuyen alrededor de la recta verdadera o recta de regresin de la poblacin y = 0 +
1x. Si se elige bien el modelo, es decir, si no hay otros regresores de importancia y la
aproximacin lineal es buena dentro de los rangos de los datos, entonces son razonables
los errores positivos y negativos que rodean a la regresin verdadera. Debe recordarse
que en la prctica 0 y 1 se desconocen y que deben estimarse a partir de los datos.
Adems, el modelo que se acaba de describir es de naturaleza conceptual. Como resultado, en la prctica nunca se observan los valores reales, por lo que nunca se puede
trazar la verdadera recta de regresin, aunque suponemos que ah est. Slo es posible
dibujar una recta estimada. En la figura 11.2 se ilustra la naturaleza de los datos (x, y)
hipotticos dispersos alrededor de la verdadera recta de regresin para un caso en que
slo se dispone de n = 5 observaciones. Debemos destacar que lo que observamos en la
figura 11.2 no es la recta que utilizan el cientfico o ingeniero. En vez de esa recta, lo
392
1
Verdadera recta de regresin
E(Y) = 0 + 1 x
x
393
Reduccin
Reduccin de la demanda
de slidos, x (%)
de oxgeno, y (%)
36
34
37
36
38
38
39
37
39
36
39
45
40
39
41
41
42
40
42
44
43
37
44
44
45
46
46
46
47
49
50
51
y
b0
^y =
55
50
=0
|x
+b
x
+ 1
45
40
35
30
25
20
15
10
5
0
9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54
En el diagrama de dispersin de la figura 11.3 se ilustra la recta de regresin ajustada y una recta hipottica de regresin verdadera. Ms adelante, en la seccin 11.3, en la
cual estudiaremos el mtodo de estimacin, revisaremos este ejemplo.
394
i.
x1
x2
x3
x4
x5
x6
Y/ x
+
= 0
1x
11.3
395
i = 1, 2,. . . , n .
Es evidente que si un conjunto de n residuales es grande, entonces el ajuste del modelo no es bueno. Los residuales pequeos son indicadores de un ajuste adecuado. Otra
relacin interesante, y que a veces es til, es la siguiente:
y i = b 0 + b 1 x i + ei .
El uso de la ecuacin anterior debera aclarar la diferencia entre los residuales ei y los
errores del modelo conceptual i. No debemos olvidar que, mientras que los i no se
observan, los ei no slo se observan sino que desempean un papel importante en el
anlisis total.
La figura 11.5 ilustra el ajuste de la recta a este conjunto de datos: a saber y = b0 +
b1x, y la recta que refleja el modelo Y x = 0 +1 x. Desde luego, 0 y 1 son parmetros
desconocidos. La recta ajustada es un estimado de la recta que genera el modelo estadstico. Hay que tener presente que la recta Y x = 0 +1 x es desconocida.
y
( xi , y i )
{}
y^ = b 0 + b1 x
ei
Y | x = 0 + 1 x
396
SCE =
e2i
i =1
(y i yi ) =
(y i b0 b1 x i ) 2 .
i =1
i =1
(SCE)
= 2
(y i b0 b1 x i ),
b0
i =1
(SCE)
= 2
(y i b0 b1 x i )x i .
b1
i =1
Al igualar a cero las derivadas parciales y reacomodar los trminos, obtenemos las ecuaciones siguientes (llamadas ecuaciones normales)
n
nb0 + b1
xi =
i =1
yi ,
i =1
x i + b1
b0
i =1
x 2i =
i =1
x i yi ,
i =1
)
i
n
x
xi
i =1
b0 =
i =1
y i b1
n
i =1
i =1
n
i =1
xi
= y b1 x .
33
33
x i = 1104,
i =1
33
y i = 1124,
i =1
33
x i y i = 41,355,
i =1
x 2i = 41,086
i =1
Por lo tanto,
(33)(41,355) (1104)(1124)
= 0.903643 y
(33)(41,086)(1104)2
1124 (0.903643)(1104)
b0 =
= 3.829633.
33
b1 =
397
minimiza
i=1
i=1
as como el procedimiento de mnimos cuadrados, obligan a que los residuales sean pequeos en cierto sentido. Debemos recordar que los residuales son el equivalente emprico de los valores de . La figura 11.6 ilustra un conjunto de residuales. Observe que la
lnea ajustada tiene valores predichos como puntos sobre la recta y, en consecuencia, los
residuales son desviaciones verticales desde los puntos hasta la recta. Como resultado, el
procedimiento de mnimos cuadrados genera una recta que minimiza la suma de los
cuadrados de las desviaciones verticales desde los puntos hasta la recta.
y
+b 1
^y = b 0
398
Ejercicios
11.1 Se realiz un estudio en Virginia Tech para determinar si ciertas medidas de la fuerza esttica del brazo influyen en las caractersticas de levantamiento
dinmico de un individuo. Veinticinco individuos se
sometieron a pruebas de fuerza y luego se les pidi que
hicieran una prueba de levantamiento de peso, en el
que el peso se elevaba en forma dinmica por encima
de la cabeza. A continuacin se presentan los datos.
Fuerza
Levantamiento
Individual
del brazo, x
dinmico, y
1
17.3
71.7
2
19.3
48.3
3
19.5
88.3
4
19.7
75.0
22.9
91.7
5
23.1
100.0
6
7
26.4
73.3
8
26.8
65.0
9
27.6
75.0
28.1
88.3
10
11
28.2
68.3
12
28.7
96.7
13
29.0
76.7
14
29.6
78.3
15
29.9
60.0
16
29.9
71.7
17
30.3
85.0
18
31.3
85.0
19
36.0
88.3
20
39.5
100.0
21
40.4
100.0
22
44.3
100.0
23
44.6
91.7
24
50.4
100.0
25
55.9
71.7
a) Estime los valores de 0 y 1 para la curva de regresin lineal Y x = 0 +1 x.
b) Calcule un estimado puntual de Y|30.
c) Grafique los residuales en comparacin con las x
(fuerza del brazo). Comente los resultados.
11.2 Las siguientes son las calificaciones de un grupo
de 9 estudiantes en un informe de medio semestre (x) y
en el examen final (y):
x 77 50 71 72 81 94 96 99 67
y 82 66 78 34 47 85 99 99 68
a) Estime la recta de regresin lineal.
b) Calcule la calificacin final de un estudiante que
obtuvo 85 de calificacin en el informe de medio
semestre.
11.3 Se registraron las cantidades de un compuesto
qumico y que se disuelve en 100 gramos de agua a
distintas temperaturas x:
x ( C)
y (gramos)
0
8
6
8
15
12
10
14
30
25
21
24
45
31
33
28
60
44
39
42
75
48
51
44
a) Calcule la ecuacin de la recta de regresin.
b) Grafique la recta en un diagrama de dispersin.
c) Estime la cantidad de producto qumico que se disolver en 100 gramos de agua a 50C.
11.4 Para fines de calibracin se recabaron los siguientes datos, los cuales permitiran determinar la relacin entre la presin y la lectura correspondiente en
la escala.
Presin, x (lb/pulg2)
Lectura en la escala, y
10
13
10
18
10
16
10
15
10
20
50
86
50
90
50
88
50
88
50
92
a) Calcule la ecuacin de la recta de regresin.
b) En esta aplicacin el propsito de la calibracin es
estimar la presin a partir de una lectura observada
en la escala. Estime la presin para una lectura en
la escala de 54, usando x = (54 b0)/b1.
11.5 Se realiz un estudio sobre la cantidad de azcar
convertida en cierto proceso a distintas temperaturas.
Los datos se codificaron y registraron como sigue:
Temperatura, x
Azcar convertida, y
1.0
8.1
1.1
7.8
1.2
8.5
1.3
9.8
1.4
9.5
1.5
8.9
1.6
8.6
1.7
10.2
1.8
9.3
1.9
9.2
2.0
10.5
a) Estime la recta de regresin lineal.
b) Calcule la cantidad media de azcar convertida
que se produce cuando se registra una temperatura
codificada de 1.75.
c) Grafique los residuales en comparacin con la
temperatura. Comente sus resultados.
Ejercicios
399