Vous êtes sur la page 1sur 37

Av.

Bolívar 2086 - Pueblo Libre


Estd
Telf. 7872348 / 4622447 Ex2 2015-II
E-mail: tetrix2086@yahoo.com

VARIABLE ALEATORIA

VARIABLE ALEATORIA (v.a.)


Una variable aleatoria X es una función definida en el espacio muestral (  ) tal que a cada elemento del
espacio muestral se le asocia un número real. El dominio de la variable aleatoria X es el espacio muestral y el
rango es un subconjunto de los números reales que denotaremos por R X .

Nota:
Se utilizan letras mayúsculas X, Y, … para designar variables aleatorias. y las respectivas letras minúsculas x, y,
… para designar valores concretos de la misma.

La variable aleatoria puedes ser: discretas o continuas

1. VARIABLE ALEATORIA DISCRETA

Si el rango de la v.a. X, es un conjunto finito o infinito numerable, se le llama v.a. discreta.


Si un experimento aleatorio con especio muestral, tiene asociado la v.a. discreta X, es natural que se
planteen preguntas como: ¿Cuál es la probabilidad de que tome un determinado valor?, para indicar
esto, se utiliza las siguiente notación:

• (X=x): “La v.a. discreta X toma el valor x”


P X  x  : ”representa la probabilidad de que la v.a. discreta X tome el valor de x”

• X  x : ”La v.a.discreta X toma un valor menor o igual a x”


P X  x  : ”representa la probabilidad de que la v.a.discreta X tome un valor menor o igual
a x”

FUNCION DE PROBABILIDAD (f(x))


La función de probabilidad f(x) de la v.a. es la función que asigna a cada x i de la v.a. su correspondiente
probabilidad p i .
f : R   0 ;1
xi  f ( x i )  P X  x i   p ( x i )  p i
Para que f(x) sea una función de probabilidad debe satisfacer las siguientes condiciones:

i) f ( xi )  0;  xi  R X

ii)  f (x )  1
xi  R X
i

La colección de pares ( x ; f ( xi )) ;  x  R X se llama distribución de probabilidad de X. La distribución


de probabilidad se representa usualmente en una tabla:

También se representa gráficamente, como se muestra:

Prof: Juan Carlos Zelaya Castro Pág.1


VALOR ESPERADO O ESPARANZA MATEMATICA
El valor esperado de una variable aleatoria discreta X, con función de probabilidad f(x), se calcula así:

E( X )  x
xi  R X
i f ( xi )

El valor esperado es una media teórica o ideal. No es que esperemos efectivamente que X tome su valor
esperado en una experimento determinado.
2. VARIABLE ALEATORIA CONTINUA

Si el rango de la v.a. X es un intervalo sobre la recta de los números reales, se llama v.a. continua.
FUNCION DE DENSIDAD DE PROBABILIDAD
Sea X una v.a. continua con rango . La función de densidad de probabilidad asociada a la v.a., es una
función integrable que satisface las siguientes condiciones:

1.

2.

Esta definición indica, la existencia de una función real definida sobre . La condición (1) establece
que la grafica de la función de densidad esta “arriba” del eje x . La condición (2) indica que el área
acotada por la curva , el eje x y las rectas verticales que pasan por los puntos extremos de es 1.

Supongamos ahora que estamos interesados en calcular la probabilidad de que la variable aleatoria
tome los valores entre y , donde el intervalo . Es decir, queremos calcular la
; puesto que todo área vale 1, se puede definir esta probabilidad como el área acotado por la grafica de
, las rectas , y el eje x. Por lo tanto:

Prof: Juan Carlos Zelaya Castro Pág.2


OBSERVACIONES:

1. Es importante darse cuenta que no representa la probabilidad de algo y que solamente cuando la

función se integra entre dos puntos produce la probabilidad.

2. Una consecuencia de la definición de probabilidad es que para cualquier valor especifico de X, digamos

, P[X= ]=0, puesto que:

3. Una consecuencia inmediata de (2) es el siguiente resultado:

cuando es una v.a. continua.

NOTAS:

 Esperanza de x ó valor esperado de x ó media de x ó promedio de x:

E(X)   X   x . P X
x RX
 x  , si X es discreta

 Varianza de X:
V(X)   X2  E ( X 2 )   E ( X )
2

donde:
E( X 2 )  x 2
. P X  x  , si X es discreta
x  RX

Propiedades:
• E(c)  0 ;  c  R
• E(cX)  cE ( X ) ;  c  R
• V(c)  0 ;  c  R
• V(cX)  c 2V ( X ) ;  c  R

Prof: Juan Carlos Zelaya Castro Pág.3


DISTRIBUCIONES DE PROBABILIDAD

Hay ciertas v.a. que surgen con frecuencia en las aplicaciones. A continuación daremos un panorama de algunas
discretas y continuas comúnmente utilizadas.

1. DISTRIBUCIONES DISCRETAS

1.1. DISTRIBUCION BINOMIAL


Supongamos que se realizan “n” ensayos independientes, cada uno de los cuales produce un “éxito” con
probabilidad “p”.
Si X representa el número de éxitos que ocurren en los “n” ensayos, entonces X es una v.a. binomial
con parámetros (n, p).

Su función de probabilidad está dada por: P ( X  k )  C kn p k q n  k ;


k=0,1,2,3,…,n ; q=1-p

Esta distribución se resume con la notación: X ~ B ( n, p )


E ( x)  np y V ( x )  npq

1.2. DISTRIBUCION GEOMÉTRICA


Consideremos varios ensayos independientes, de los que cada uno es un éxito con probabilidad “p”.
Si X representa el número del primer ensayo que es un éxito, entonces X es una v.a. geométrica con
parámetro “p”.

n 1
Su función de probabilidad está dada por: P[ X  n]  p (1  p ) ; n  1, 2, 3, ...
Esta distribución se resume con la notación: X ~ G ( p)
1 1 p
E( X )  y V (X ) 
p p2

1.3. DISTRIBUCION BINOMIAL NEGATIVA


Si X denota el número de ensayos necesarios para acumular un total de “r” éxitos cuando cada ensayo
es, de manera independiente, un éxito con probabilidad “p”, entonces X es una v.a. binomial negativa,
también llamada Pascal, con parámetros p y r.

Su función de probabilidad está dada por:


P[ X  n] C nr 11 p r (1  p) n  r , n  r , r  1, r  2, ...
Esta distribución se resume con la notación: X ~ BN ( r , p )
r r (1  p )
E( X )  y V ( x) 
p p2

1.4. DISTRIBUCION HIPERGEOMÉTRICA


A la v.a. X definida como el numero de éxitos en una muestra de tamaño “n” que se escoge al azar uno
por uno sin reposición de N elementos o resultados posibles, de los cuales “r” son clasificados como
éxitos y los N-r como fracasos, se la denomina v.a. hipergeometrica.
C kr . C nNkr
La función de probabilidad está dada por: P[ X  k ]  , k  0,1, 2, 3, ...
C nN
Esta distribución se resume con la notación: X ~ H ( N , n, r )

Prof: Juan Carlos Zelaya Castro Pág.4


 N n
E ( X )  np y V ( X )  npq 
 N 1 
r
donde : p  y q  1 p
N

1.5. DISTRIBUCION POISSON


La v.a. de Poisson se define como el número de veces X que ocurre un evento particular durante una
unidad dada de tiempo y tiene las siguientes características: la probabilidad de que ocurra un evento en
una unidad dada de tiempo es la misma para todas las unidades de tiempo, el numero de eventos que
ocurre en una unidad de tiempo es independiente del numero de los que ocurren en otras unidades y el
numero medio de eventos en cada unidad se denomina “tasa de ocurrencias” y se denota por  .
La distribución de probabilidad de una v.a. de Poisson con tasa de ocurrencia  está dada
e   ( ) x
por: P[ X  x]  , x  0,1, 2, 3, ...
x!
Esta distribución se resume con la notación: X ~ P ( )
E( X )   y V ( X )  

2. DISTRIBUCIONES CONTINUAS

2.1. DISTRIBUCION UNIFORME


La v.a. continua X, tiene distribución uniforme ( o rectangular) en el intervalo a ; b  , a < b , si su
1
función de densidad de está dada por: f ( x )  ; a  x b
ba
La notación que resume la distribución uniforme: X ~ U  a ; b
ab (b  a ) 2
E( X )  y V (X ) 
2 12

2.2. DISTRIBUCION NORMAL


Una v.a. X está distribuida normalmente con media  y varianza  2 si su función de densidad de
( x )2
1
está dada por: f ( x)  e 2 2
,   x  
2 
La notación que resume la distribución normal: X ~ N ( , 2 )

Notas:
 Si X tiene distribución normal o sea X ~ N (  ,  2 )
x
Entonces Z  ; Z ~ N (0,1) ( distribución normal estándar)

 P ( Z  k )  F (k ) , esto se busca en la tabla normal estándar.
 P (a  Z  b)  F (b)  F (a )
 P ( a  Z  a)  2.F (a )  1
 F ( a)  1  F ( a)

2.3. DISTRIBUCION EXPONENCIAL


Una v.a. continúa con función de densidad: f ( x)   e   x , 0  x  
La función de distribución acumulada es: F ( x)  1  e   x
La notación que resume la distribución exponencial: X ~ Exp (  )
1 1
E( X )  y V (X )  2
 

2.4. DISTRIBUCION LOG- NORMAL


Si X ~ log normal (  ,  ) entonces LnX ~ N (  ,  )
2 2

Prof: Juan Carlos Zelaya Castro Pág.5


Podemos decir que:
LnX  
~ N (0,1)

APROXIMACIONES

A. Discreta a Discreta

X ~ B ( n, p )

�" n " es grande (n � 30)


pero: �
�"p" es pequeño (p  0,1)

 x  
 Poisson ( = np)
aprox.

�e np . ( n .p )
x

� , x  0, 1, 2, ..... , n
f (x) @ � x !

� 0 , en otros casos

B. De discreta a continua
X ~ B (n, p )  pero “n” es grande (n  30)

 X  
 N(u ,  2 ), donde: µ = np y
aprox. x x x x  npq

x  u x x  np
z  @ N ( 0,1)
 x n pq

Pero previamente uso el factor de corrección = 0.5 (cuando va de discreta a continua)

PROPIEDAD REPRODUCTIVA DE LA NORMAL

Sean X 1 , X 2 , X 3 ,..., X n , n variables aleatorias independientes, donde, cada X i ~ N (  i ,  i ) .


2

n
Si Yn   ci X i  c1 X 1  c 2 X 2  c3 X 3  ...  c n X n
i 1

Entonces: Yn ~ N (  Yn ,  Yn )
2

Donde:
c1 , c 2 , c3 ,..., c n son constantes reales.

Yn  E (Yn )  E (c1 X 1  c2 X 2  c3 X 3  ...  cn X n )


n
Yn  c1 E ( X 1 )  c2 E ( X 2 )  c3 E ( X 3 )  ...  cn E ( X n )   ci i
         i 1
1 2 3 n
n
 Yn   ci i
i 1

También:

Prof: Juan Carlos Zelaya Castro Pág.6


 Y2n  Var (Yn )  Var (c1 X 1  c2 X 2  c3 X 3  ...  cn X n ) 
n
 Y2n  (c1 ) 2 Var ( X 1 )  (c2 ) 2 Var ( X 2 )  (c3 ) 2 Var ( X 3 )  ...  (cn ) 2 Var ( X n )   (ci ) 2 i2
              i 1
 12  22  32  n2
n
 Y2n   (ci ) 2 i2
i 1

Por lo tanto, la variable estándar:

Yn   Yn
Z ~ N (0,1)
Y n

En particular:

Si cada X i ~ N (  ,  )
2

Además:

n
Si Yn   X i  X 1  X 2  X 3  ...  X n
i 1

Entonces: Yn ~ N (  Yn ,  Yn )
2

Yn  E (Yn )  E ( X 1  X 2  X 3  ...  X n )


Yn  E ( X 1 )  E ( X 2 )  E ( X 3 )  ...  E ( X n )
         
1 2 3 n

Yn  
    ...
  
"n" sumandos

 Yn  n

 Y2n  Var (Yn )  Var ( X 1  X 2  X 3  ...  X n )


 Y2n  Var ( X 1 )  Var ( X 2 )  Var ( X 3 )  ...  Var ( X n )
            
 12  22  32  n2

 Y2n  
  
2
   ... 
2 2 2

"n" sumandos

 Y2n  n 2
Es decir: Yn ~ N ( n , n )
2

Yn   Yn Yn  n Yn  n
Por lo tanto: Z   ~ N (0,1)
 Yn n 2  n

TEOREMA DEL LÍMITE CENTRAL

Sean X 1 , X 2 , X 3 ,..., X n , n variables aleatorias independientes con idéntica distribución de media  y


varianza  .
2
Si n es suficientemente grande, la variable estandarizadora de
n
Yn   X i  X 1  X 2  X 3  ...  X n , se distribuye aproximadamente como una normal estándar. Esto es:
i 1

Prof: Juan Carlos Zelaya Castro Pág.7


n n

Yn   Yn  X i  n X i  n
~ N (0,1)
Z  i 1
 i 1

 Yn n 2
 n

Nota: La aproximación es buena si n  30

RECUERDA que si vas a aplicar el TLC cuando estas pasando de una variable discreta a una continua, antes de
estandarizar debes considerar el factor  0.5

Veamos los siguientes ejemplos:

Si X es una v.a. discreta y vas a aplicar el TLC toma en cuenta que si tienes:

 deberás cambiar por:


 P(X  3) lo deberás cambiar por: P(2.5 �X �3.5)
 P(a �X �b) lo deberás cambiar por: P(a  0.5 �X �b  0.5)

Después de esto procedes a estandarizar

DISTRIBUCION DE PROBABILIDAD CHI-CUADRADO

Definición:
Se dice que la variable aleatoria continua X tiene distribución chi-cuadrado con r grados de libertad, y se
denota por X ~  2 ( r ) , si su función de densidad es:
�r �
2 r / 2 � 1�
f ( x)  x �2 �e  x / 2 , x �0
G(r / 2)
Donde:
 r es un número entero positivo.

 t a 1e  t dt (función gamma)


G(a )  �
0

Observación:

Si a es un número entero positivo:


G(a )  (a  1)!

Nota:
Si X ~  2 ( r ) , entonces:

a) Su media es   r y
b) Su varianza es  2  2r

Propiedades de la distribución chi – cuadrado

1. Si Z ~ N (0,1) , entonces, Z 2 ~  2 (1)


2. Si Z 1 ; Z 2 ; Z 3 ;...; Z r sonr variables aleatorias independientes tales que Z i ~ N (0,1) , para cada
i  1;2;3;...; r , entonces:
n

z
i 1
2
i ~  2 (r )

Con frecuencia,  2 ( r ) se define como la suma de los cuadrados de r variables aleatorias


independientes distribuidas cada uno como N (0,1)

3. Propiedad reproductiva de la distribución chi – cuadrado

Prof: Juan Carlos Zelaya Castro Pág.8


Si X 1 ; X 2 ; X 3 ;...; X k son k variables aleatorias independientes tales que X i ~  ( ri ) , para cada
2

i  1;2;3;...; k , entonces:
k

X
i 1
i ~  (r1  r2  r3  ...  rk )
2

Ejemplo:
X ~  2 (26) , obtenga:
a) P X  17,29
b) P X  38,89
c) P13,84  X  45,64
d) P X  40

DISTRIBUCION DE PROBABILIDAD t DE STUDENT

Definición:
Se dice que la variable aleatoria continua T se distribuye según el modelo de probabilidad t-Student (más
brevemente según la t ) con r
grados de libertad, y se denota por T ~ t (r ) , si su función de densidad es:

G (r  1) / 2 
 ( r 1) / 2
t2 
f (t )  1   ,  t  
G(r / 2) r ( )  r 

Donde:
r es un número entero positivo.
Nota:
Su grafica tiene forma de campana simétrica en cero.

“Si Z y V son dos variables aleatorias independientes tales que Z ~ N (0,1) y V ~  2 (r ) , entonces, la
variable aleatoria:

Z
T 
V /r

Tiene distribución t-Student con r grados de libertad”. Se describe por T ~ t (r )


Propiedades de la distribución t-Student

1. Si T ~ t (r ) ,entonces, su media y su varianza son respectivamente:


a) Su media es   0 y
r
b) Su varianza es  
2
,r > 2
r2

2. Su grafica tiene forma de campana, simétrica en cero.

3. La varianza de la distribución t-Student es mayor que la de la distribución N (0,1) . Pero tiende ser
igual a 1 cuando el numero de grados de libertad r   .

4. La distribución t-Student se aproxima a una distribución N (0,1) cuando r   . La aproximación es


buena, si r  30 .

Ejemplo:

Si X tiene distribución t-Student con 18 grados de libertad, halle:


a) P X  2,101

Prof: Juan Carlos Zelaya Castro Pág.9


b) P X  1,734
c) P X  2,878
d) P  1,330  X  2,552
e) P X  2 

DISTRIBUCION DE PROBABILIDAD F

Definición:
Se dice que la variable aleatoria continua X se distribuye según el modelo de probabilidad F con r1 y r2
grados de libertad, y se denota por X ~ F ( r1 ; r2 ) , si su función de densidad es:
r /2
 r1  r  r 
1

  G 1 2 
2  2 . x ( r1 / 2 )1
f ( x)    ( r1  r2 ) / 2 , 0  x  
 r1   r2   r x 
G   G  1  1

2  2  r2 

Donde:

“Si U y V son dos variables aleatorias independientes tales que U ~  2 ( r1 ) y V ~  2 ( r2 ) , entonces, la


variable aleatoria:

U / r1
X
V / r2

Tiene distribución F con r1 y r2 grados de libertad, y se denota por X ~ F ( r1 ; r2 ) .


r1 y r2 son números enteros positivos.

Teorema:
Si X tiene distribución F con grados de libertad r1 y r2 , entonces, 1 / X tiene distribución F con grados de
libertad r2 y r1 , esto es:
1
F1a ; r1 ; r2 
Fa ; r2 ; r1

Ejemplo:

Si X ~ F(4, 5), obtenga las siguientes probabilidades


a) P X  7,39
b) P X > 11,4
c) P X  8
d) P X  0,0645

ALGUNAS DEFINICIONES IMPORTANTES

1. Población:
Es un conjunto de elementos (que consiste de personas, objetos, etc.) que contienen una o más características
medibles. La característica medible es una variable estadística cuyo valor numérico o no numérico, es una
observación. Si los elementos de la población se definen en forma aleatoria, entonces, la variable estadística
cuantitativa es una variable aleatoria cuyos valores constituyen la población.

Si la v.a. X tiene distribución f(x), se puede referir a la población f(x). Por ejemplo: si X esta normalmente
distribuida se dice que la población esta normalmente distribuida.

Prof: Juan Carlos Zelaya Castro Pág.10


2. Parámetro
Es una medida descriptiva que resume una característica cuantitativa de la distribución de la población.
Ejemplos:

 Media: 
 Proporción:  o p
 Varianza:  2
 Desviación Estándar: 

En diversas aplicaciones estadísticas al estudiar una población, la v.a. que la define puede tener distribución
conocida o no. La distribución de la población es conocida, si se conocen sus parámetros y su forma, es decir si
se conoce su distribución de probabilidad.

3. Muestra aleatoria
En vez de examinar la población entera, puede examinarse una muestra de la población con el propósito de
inferir resultados. Existen dos tipos de muestras: Las no probabilísticas (basadas en el criterio de expertos) y las
probabilísticas. A las muestras probabilísticas se las denomina también “muestras aleatoria”. Se llama muestreo
aleatorio a todo proceso que asegure en cualquier momento igual probabilidad (distinta de cero) de ser incluidos
en la muestra a todos los elementos que pertenezcan a la población.

Muestra aleatoria Simple

Se denomina muestra aleatoria de tamaño n de una población X con distribución f(x) de media  y varianza
 2 , a un conjunto de n v.a. X 1 , X 2 , X 3 ,..., X n tales que:

 Son independientes (implica que la distribución de probabilidad conjunta de la muestra aleatoria


X 1 , X 2 , X 3 ,..., X n es la expresión:
f ( x1 , x 2 , x3 ,..., x n )  f ( x1 ) f ( x 2 ) f ( x3 )... f ( x n )

 Cada una de ellas está distribuida en forma idéntica a f(x) (significa que:
E ( X i )   y Var ( X i )   2 y f ( xi )  f ( x)

4. Estadísticas
Es una función de las variables aleatorias que constituyen la muestra. La estadística es una v.a.
Y  H ( X 1 , X 2 , X 3 ,..., X n ) , cuyo valor es el número real y  H ( x1 , x 2 , x3 ,..., x n ) .La estadística
entendida como número es una medida descriptiva que caracteriza a la muestra. Ejemplos:
1 n
 Media muestral : X   Xi
n i 1
1 n
 Varianza muestral : S 
2

n  1 i 1
(X i  X )2

 Desviación Estándar muestral: S  S2

Notas:

 El “Error de muestreo” es la diferencia entre una estadística de la muestra y el parámetro


correspondiente de la población. Por ejemplo, el error de muestreo de la media es   X .

 El “Error Estándar” es la desviación estándar de una estadística. Por ejemplo: el error



estándar de la media muestral es:  X 
n

DISTRIBUCIONES MUESTRALES

Prof: Juan Carlos Zelaya Castro Pág.11


Se denomina distribución muestral de una estadística a la distribución de probabilidad de esa v.a.

1. DISTRIBUCION DE LA MEDIA MUESTRAL


Si X es la media de la muestra aleatoria X 1 , X 2 , X 3 ,..., X n escogida de una población descrita por
la v.a. X de media  y varianza  2 , entonces, para n suficientemente grande, la estadística X se
 2
distribuye aproximadamente normal con media y , esto es:
n

X  X 
Z 
 2  ~ N (0,1)
n n

Notas:

 La aproximación normal es buena si n  30 (muestra grandes), sin importar si la población de


la cual se obtiene la muestra, es discreta o continua.

 Si la muestra es obtenida uno por uno sin reemplazo de una población finita de tamaño N,
  N n N n
entonces, el error estándar es, X    . El coeficiente es denominado
n  N 1  N 1
factor de corrección para población finita.

2. DISTRIBUCION DE LA PROPORCION MUESTRAL


Sea X 1 , X 2 , X 3 ,..., X n una muestra aleatoria de tamaño n escogida de la población de Bernoulli
X
B(1,p), donde p es el porcentaje de éxitos en la población y sea P  la proporción de éxitos en
n
la muestra, donde, X  X 1  X 2  X 3  ...  X n ~B(n,p). Entonces, si n es grande, la v.a.

estandarizadora de P tiene distribución aproximadamente normal de media p y varianza p (1  p ) ,


n
esto es:
P p
Z
p (1  p ) ~ N (0,1)
n

Nota:
Aproximaciones satisfactorias se obtienen si se introduce el factor de corrección por continuidad
1
. Luego,
2n
  1 
 c   p
P P  c   P  Z   2 n 
 P 
 
 
( n  1) S 2
3. DISTRIBUCION MUESTRAL DE
2
Sea S 2 la varianza de la muestra X 1 , X 2 , X 3 ,..., X n escogida de la población descrita por una v.a.
X de media  y de varianza  2 , entonces:

a) E ( S )  
2 2

( n  1) S 2
~  ( n  1) , siempre que, X ~ N (  ,  )
2 2
b)
 2

Prof: Juan Carlos Zelaya Castro Pág.12


ESTIMACION DE PARAMETROS

Al realizar una investigación estadística a menudo se sabe se supone que la población de la cual se selecciona
una muestra aleatoria, tiene una forma funcional especifica f(x) cuyo o cuyos parámetro o parámetros se intenta
determinar. Si el parámetro a determinar es denotado  , entonces, la distribución de la población será
denotada por f ( x,  ) .

Los métodos de inferencia estadística básicamente consisten en seleccionar una m.a. de la población, de manera
que utilizando la información que se obtenga de la muestra se pueda:

 Determinar el valor del parámetro desconocido  (denominada estimación del parámetro  , este a su
vez puede ser puntual o por intervalo. En el primer caso, la estimación del parámetro  es un número.
Mientras que el segundo caso la estimación incluye un intervalo en el que están comprendidos los
valores del parámetro).

 Decidir si  , o alguna función de  , es igual a algún valor preconcebido  0 de  (conocido como


prueba de hipótesis del parámetro  ).

ESTIMADOR PUNTUAL
Sea X 1 , X 2 , X 3 ,..., X n una muestra aleatoria de tamaño n seleccionada de una población cuya distribución es
f ( x,  ) , siendo  el parámetro. Se denomina estimador puntual del parámetro  a cualquier estadística
 

  H(X , X 1 2 , X 3 ,..., X n ) , cuyo valor   H ( x , x , x ,..., x ) es


1 2 3 n
una estimación puntual del

parámetro en cuestión.

Un estimador puntual del parámetro  es una v.a.
 , mientras que una estimación puntual es el valor

 
numérico
 del estimador
.
Por ejemplo:

Un estimador puntual de la media poblacional    es la estadística media muestral
 X (v.a.), cuyo


valor numérico
  x es la estimación del parámetro  .
Nota:
No toda función de la muestra es un buen estimador del parámetro que se estima, un buen estimador, es aquel
que está más cerca del parámetro.

PROPIEDADES DE LOS ESTIMADORES PUNTUALES

1. Estimador insesgado

Se dice que la estadística
  H (X , X 1 2 , X 3 ,..., X n ) es un estimador insesgado del parámetro 

 

    . En caso contrario, se dice que es estimador sesgado.
si E 
 
Nota:
 

El sesgo es la diferencia: E    
 
2. Estimador eficiente
Si hay dos o más estimadores puntuales insesgados de un parámetro  , se denomina estimador más
eficiente a aquel estimador que tenga menor varianza.

Prof: Juan Carlos Zelaya Castro Pág.13


INTERVALOS DE CONFIANZA

A. PARA LA MEDIA POBLACIONAL

I .C.(  x )  x e ; e = error de estimación

 x
Z 1 a   (i)

   2
 n
 S
e  Z  a  ;  x (ii )
  1 2  n
 Sx
 a 

 1 ;n 1 n (iii )
T
  2 

Si se conoce la  x
2
(i)
(ii) Si no se conoce la  2
x pero n  30

(iii) Si no se conoce la  2 2
x , si se conoce la Sx y n <30 (la distribución de los datos es normal)

Nota:

 Si la población es finita de tamaño N y la muestra de tamaño n es escogida sin reemplazo


de esta población, entonces, el error estándar de la media muestral es:
  N n N n
ES   . Recordar que el término es denominado factor de
n  N  1  N 1
corrección para poblaciones finitas.

X   Z a  . ES
      1 
2
 El error de 
estimacion
no sup era a
ese valor

B. PARA LA PROPORCIÓN POBLACIONAL

I.C.(P)  p e

p (1  p)
e  Z a
 1 
 2
n

Nota:
p (1  p )  N n
Si la población es finita de tamaño N , ES   .
n  N  1 

C. PARA LA VARIANZA POBLACIONAL

Prof: Juan Carlos Zelaya Castro Pág.14


(n  1) S x2 (n  1) S x2
I .C.( x2 )    2

 2 tab  2 tab
 
 a  a 
 1 ; n 1   ; n 1 
 2  2 

Se deberá buscar 2 valores para  tab ; uno


2

para "1  a / 2 " y el otro para "a / 2 " en


ambos casos con "n-1" grados de libertad

D. INTERVALO DE CONFIANZA PARA LA RAZON DE VARIANZAS DE DOS POBLACIONES


2 2
Si S1 y S 2 las varianzas de dos muestras aleatorias independientes de tamaños n1 y n2
seleccionadas respectivamente de dos poblaciones normales, entonces, el intervalo de estimación de
 12
con nivel de confianza del (1  a ).100% es:
 22

S12  12 S12
x f a   x f a
S 22 ( ; r2 ; r1 )
2
 22 S 22 (1 ; r2 ; r1 )
2

E. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES CON


VARIANZAS CONOCIDAS
Si x1 y x 2 son las medias que resultan de dos muestras independientes de tamaños n1 y n2
escogidas respectivamente de dos poblaciones normales (o no normales siempre que las muestras sean
grandes) con varianzas  1 y  2 conocidas, entonces, el intervalo de estimación de 1   2 con nivel
2 2

de confianza del (1  a ).100% es:

( x1  x 2 )  Z a . ET  1   2  ( x 1  x 2 )  Z a . ET
(1 ) (1 )
2 2

Donde:

 12  22
ET   es el error típico de X 1 - X 2 . Si se desconocen las varianzas, entonces se hace:
n1 n2
 12  S12 y  22  S 22 siempre que cada muestra sea de tamaño grande.

F. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES CON


VARIANZAS DESCONOCIDAS
2 2
Si X 1 y X 2 las medias y S1 y S 2 las varianzas de dos muestras aleatorias independientes de
tamaños n1 y n2 respectivamente seleccionadas de dos poblaciones normales con varianzas  12 y
 22 desconocidas.

F.1. DOS POBLACIONES NORMALES, CON VARIANZAS DESCONOCIDAS SUPUESTAS


IGUALES
Si x1 y x 2 son las medias que resultan de dos muestras independientes de tamaños n1 y n2
escogidas respectivamente de dos poblaciones normales con varianzas  12 y  22 desconocidas

Prof: Juan Carlos Zelaya Castro Pág.15


supuestas iguales, entonces, el intervalo de estimación de 1   2 con nivel de confianza del
(1  a ).100% es:

( x1  x 2 )  t a . ET  1   2  ( x 1  x 2 )  t a . ET
(1 ; n1  n2  2 ) (1 ; n1  n2  2 )
2 2

Donde:
1 1  (n  1) S12  (n2  1) S 22
S c2 .   , S c  1
2
ET 
 n1 n2  n1  n 2  2

F.2. DOS POBLACIONES NORMALES, CON VARIANZAS DESCONOCIDAS SUPUESTAS


DISTINTAS
Si x1 y x 2 son las medias que resultan de dos muestras independientes de tamaños n1 y n2
escogidas respectivamente de dos poblaciones normales con varianzas  12 y  22 desconocidas
supuestas distintas, entonces, el intervalo de confianza de 1   2 con nivel de confianza del
(1  a ).100% es:

( x1  x 2 )  t a . ET  1   2  ( x1  x 2 )  t a . ET
(1 ; r) (1 ; r)
2 2

Donde:
2
 S12 S 22 
  
r  n1 n2 
S12 S 22
ET   ,  S12 
2
 S 22 
2
n1 n2
   
 n1    n2 
n1  1 n2  1

Dado que r rara vez es un entero, se redondea al entero más cercano.

PRUEBAS DE HIPOTESIS

Hipótesis estadísticas

• Una hipótesis estadística es cualquier suposición hecha acerca de la población o la distribución de una
variable aleatoria.
• También se pueden formular hipótesis acerca de la forma de la distribución o acerca de sus
parámetros.
• La suposición es probada frente a los resultados de una muestra aleatoria (si ésta la contradice o no)

Objetivos de las pruebas de hipótesis

• Formular suposiciones acerca de la distribución poblacional de cualquier variable aleatoria.


• Probar la suposición planteada, con los resultados que se obtienen de una muestra aleatoria.
• Tomar la decisión de aceptar o rechazar la suposición planteada, de acuerdo a una regla de decisión.

Hipótesis nula y alternativa

Hipótesis Nula (Ho):


Es la que se acepta como verdadera y cuya validez será sometida a la comprobación experimental.

Hipótesis alternativa (H1):


Es la negación de la hipótesis nula. Es la hipótesis que se acepta en caso se rechace Ho

Pasos de la prueba de hipótesis

• Formular Ho y H1

Prof: Juan Carlos Zelaya Castro Pág.16


• Especificar α (o sea el nivel de significación)
• Seleccionar la estadística a usar.
• Determinar la región crítica de la prueba gracias a los valores que aparecen en las tablas estadísticas.
• Calcular el estadístico
• Rechazar o aceptar Ho

ERROR TIPO I Y ERROR TIPO II

Ver el siguiente cuadro:

Ho Verdadero Falso
Rechazar error tipo 1
Aceptar error tipo II

Error tipo I
• Es rechazar la hipótesis nula cuando esta es verdadera
• a  probabilidad de rechazar Ho cuando es Verdadera
• a es el nivel de significación de la prueba
• a se fija previamente y generalmente es 5% o 1%

Error tipo II
• Es aceptar Ho cuando es falsa
•   Probabilidad de aceptar Ho cuando es falsa.
• La curva característica de operación o CO de una prueba de hipótesis es la gráfica de β en función del
parámetro  ; es decir se hace:
 ( )  prob(aceptar Ho / cuando Ho es falsa) ;
entonces deberás asignar valores a  para hallar valores para  y así graficar
• La potencia de la prueba es 1  

PRUEBAS ESTADISTICA PARA UN SOLO PARAMETRO

1. PRUEBAS PARA LA MEDIA DE UNA POBLACION


Se trata de contrastar la hipótesis nula H 0 :   0 contra cualquiera de las siguientes tres alternativas:
H1 :   0 o H1 :   0 o H1 :   0

A. POBLACION NORMAL CON  CONOCIDA


Si la hipótesis nula es supuesta verdadera, la estadística de la prueba es la variable normal
estándar:
X  o
Z
 ~ N (0,1)
n
( válida para todo n  2 )

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


 Z  z1a si H 1 :    o , prueba unilateral cola derecha
 Z   z1a si H 1 :    o , prueba unilateral cola izquierda

 Z z a si H 1 :    o , prueba bilateral
1
2

B. POBLACION NORMAL CON  DESCONOCIDA


Si la población es normal y la hipótesis nula es supuesta verdadera, la estadística de la prueba
es variable t-Student con n-1 grados de libertad

Prof: Juan Carlos Zelaya Castro Pág.17


X  o
T
s ~ t ( n  1)
n
( válida para todo n  2 )

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


 T  t1a si H 1 :    o , prueba unilateral cola derecha
 T   t1a si H 1 :    o , prueba unilateral cola izquierda

 T t a si H 1 :    o , prueba bilateral
1
2

C. FORMA DE POBLACION DESCONOCIDA Y  CONOCIDA


Si la hipótesis nula es supuesta verdadera, en este caso, sólo si el tamaño de la muestra es
grande n  30 , la estadística de la prueba es:
X  o
Z
 ~ N (0,1)
n
La región de rechazo de H o de la prueba en los tres tipos de alternativas es:
 Z  z1a si H 1 :    o , prueba unilateral cola derecha
 Z   z1a si H 1 :    o , prueba unilateral cola izquierda

 Z z a si H 1 :    o , prueba bilateral
1
2

D. FORMA DE POBLACION DESCONOCIDA Y  DESCONOCIDA


En este caso se convierte en el caso C, haciendo   s . El método es válido sólo si el tamaño
de la muestra es grande, n  30 .

Notas:
1. La prueba bilateral de la hipótesis nula H 0 :   0 contra H 1 :    0 a un nivel de
significación dado a , equivale a calcular el intervalo de confianza (I.C.) de (1- a )x100% para
el parámetro  y luego rechazar la hipótesis nula si es que  o  I .C .
2. Otra forma de tomar decisión de rechazar o no rechazar la hipótesis nula es calcular el valor de
la probabilidad P , aplicando el valor absoluto de z calculado (la estandarización de la media
muestral), de la siguiente manera:
o P=P[Z> z calculado ] (prueba unilateral cola a la derecha o cola a la izquierda)
o P=2P[Z> z calculado ] (prueba bilateral)
La regla de decisión con la probabilidad P es:
Se rechazara la hipótesis nula, si P< a .No se rechazara la hipótesis nula en caso
contrario.

2. PRUEBA DE LA VARIANZA DE UNA POBLACION


Prueba de la varianza  2 de una población X normal
Se trata de probar la hipótesis nula H 0 :    0 contra una cualquiera de las siguientes hipótesis
2 2

alternativas H 1 :    0 o H 1 :    0 o H 1 :    0 . La estadística de la prueba (si la población


2 2 2 2 2 2

es normal y la hipótesis nula es verdadera) es la variable chi-cuadrada con n-1 grados de libertad.
(n  1) s 2
  2
~  ( n  1)
2

02

2
Donde: n es el tamaño de la muestra, s es la varianza muestral

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


  2   12a si H 1 :  2   02 , prueba unilateral cola derecha
  2   a2 si H 1 :  2   02 , prueba unilateral cola izquierda

Prof: Juan Carlos Zelaya Castro Pág.18


  2   a2 o  2   2 a si H 1 :  2   02 , prueba bilateral
1
2 2

3. PRUEBA DE LA PROPORCION DE UNA POBLACION


Sea X el numero de éxitos en una muestra de tamaño “n” escogida de una población Bernoulli B(1, p),
donde , el parámetro p es la proporción de éxito de un elemento cualquiera de la población.

Se trata de contrastar la hipótesis nula H 0 : p  p 0 contra una cualquiera de las siguientes alternativas:
H 1 : p  p0 o H 1 : p  p0 o H 1 : p  p0
X
La proporción de éxitos en la muestra es P  , donde, X ~ B ( n, p )
n
Si el tamaño de la muestra es grande ( n  30 ) y la hipótesis nula es supuesta verdadera, la estadística
de la prueba es:

X  n p0 P  po
Z 
n p0 (1  p0 ) p 0 (1  p0 ) ~ N (0,1)
n

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


 Z  z1a si H 1 : p  po , prueba unilateral cola derecha
 Z   z1a si H 1 : p  p o , prueba unilateral cola izquierda

 Z z a si H 1 : p  p o , prueba bilateral
1
2

PRUEBAS ESTADISTICAS PARA DOS PARAMETROS

1. PRUEBA DE LA RAZON DE LAS VARIANZAS DE DOS POBLACIONES


2 2
Sean S1 y S 2 las varianzas de dos muestras aleatorias independientes de tamaños n1 y n 2
escogidas de las poblaciones normales 1 y 2 respectivamente, cuyas varianzas  12 y  22 se
desconocen.

Para docimar la hipótesis nula H 0 :  12   22 contra una de las tres hipótesis alternativas
H 1 :  12   22 o H 1 :  12   22 o H 1 :  12   22 se utiliza la estadística F con grados de libertad
n1  1 y n 2  1 , dada por:
S12
2
F  12 ~ F ( n1  1, n 2  1)
S2
 22
Si la hipótesis nula es supuesta verdadera, entonces:

S12
F ~ F ( n1  1, n 2  1)
S 22
La región de rechazo de H o de la prueba en los tres tipos de alternativas es:
 F  f1a , n1 1, n2 1 si H 1 :  2   02 , prueba unilateral cola derecha
 F  f a , n1 1, n2 1 si H 1 :  2   02 , prueba unilateral cola izquierda

 F  fa o F f a si H 1 :  2   02 , prueba bilateral
, n1 1, n2 1 1 , n1 1, n2 1
2 2
Nota:

Prof: Juan Carlos Zelaya Castro Pág.19


1
f a , n1 1, n2 1 
f 1a , n2 1, n1 1

2. PRUEBA DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES: MUESTRAS


INDEPENDIENTES
Sean X 1 y X 2 las medias de dos muestras independientes de tamaños n1 y n 2 escogidas de dos
poblaciones 1 y 2 con medias 1 y  2 y varianzas  12 y  22 respectivamente.

Se trata de probar la hipótesis nula H 0 : 1   2 contra una de las tres hipótesis alternativas
H 1 : 1   2 o H 1 : 1   2 o H 1 : 1   2

A. VARIANZAS  12 y  22 CONOCIDAS
En este caso, si cada población tiene distribución no normal pero n1 y n 2 son grandes (
n1  30 y n2  30 ), por el teorema central del límite, la estadística de la prueba, cuando la
hipótesis nula es verdadera, es la variable:
X1  X 2
Z
 12  22 ~ N (0,1)

n1 n2
Si las dos poblaciones son normales, la estadística Z es exactamente N(0, 1) para todo
n1  2 y n 2  2

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


 Z  z1a si H 1 : 1   2 , prueba unilateral cola derecha
 Z   z1a si H 1 : 1   2 , prueba unilateral cola izquierda

 Z z a si H 1 : 1   2 , prueba bilateral
1
2
Nota:

Cuando la hipótesis nula y alternativa son de la forma:

1) H 0 : 1   2  d 0 contra H 1 : 1   2  d 0
2) H 0 : 1   2  d 0 contra H 1 : 1   2  d 0
3) H 0 : 1   2  d 0 contra H 1 : 1   2  d 0

La estadística de la prueba es la variable Z dada por:

Z
( X 1  X 2 )  d0
 12  22 ~ N (0,1)

n1 n2

B. VARIANZAS  1 y  2 DESCONOCIDAS SUPUESTAS IGUALES Y CADA POBLACION


2 2

NORMAL
La estadística de la prueba, si la hipótesis nula es verdadera, es la variable:
X1  X 2
T
S c2 S c2 ~ t ( n1  n2  2)

n1 n2
( n1  1) S12  (n 2  1) S 22
donde, la varianza común (o varianza promedio) S C 
2
es un estimador
n1  n2  2
insesgado de la varianza  2

Prof: Juan Carlos Zelaya Castro Pág.20


La región de rechazo de H o de la prueba en los tres tipos de alternativas es:
 T  t1a si H 1 : 1   2 , prueba unilateral cola derecha

 T   t1a si H 1 : 1   2 , prueba unilateral cola izquierda

 T t a si H 1 : 1   2 , prueba bilateral
1
2

C. VARIANZAS  1 y  2 DESCONOCIDAS SUPUESTAS DIFERENTES Y CADA POBLACION


2 2

NORMAL
La estadística de la prueba, cuando la hipótesis nula es verdadera, es la variable t-Student con “r”
grados de libertad.

X1  X 2
T
S12 S 22 ~ t (r )

n1 n 2
donde:
2
 S12 S 22 
  
r  n1 n2 
2 2
 S12  S 22 
   
 n1  n2
 
n1  1 n2  1

Si “r” no es entero, se redondea al entero más cercano.

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


 T  t1a si H 1 : 1   2 , prueba unilateral cola derecha
 T   t1a si H 1 : 1   2 , prueba unilateral cola izquierda

 T t a si H 1 : 1   2 , prueba bilateral
1
2

D. VARIANZAS  12 y  22 DESCONOCIDAS Y CADA POBLACION ES NO NORMAL


En este caso, sólo si los tamaños de muestra n1 y n 2 son suficientemente grandes (
n1  30 y n2  30 ), se hace  1  S1 y  2  S 2 y se usa el método de prueba del caso A.

3. PRUEBA DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS POBLACIONES


Sea X 1 y X 2 el número de éxitos de dos muestras aleatorias independientes de tamaños n1 y n 2
seleccionadas respectivamente de dos poblaciones de Bernoulli B(1, p1 ) y B(1, p 2 ), donde , los
parámetros desconocidos p1 y p 2 son las proporciones de éxitos poblacionales respectivos.

Las proporciones de éxitos muéstrales respectivas son:


X1 X2
P1  y P2 
n1 n2

Se trata de contrastar la hipótesis nula H 0 : p1  p 2 contra una cualquiera de las siguientes


alternativas: H 1 : p1  p 2 o H 1 : p1  p 2 o H 1 : p1  p 2

Si los tamaños muestra n1 y n 2 son grande ( n1  30 y n 2  30 ) y si la hipótesis nula es supuesta


verdadera, la estadística de la prueba es:

Prof: Juan Carlos Zelaya Castro Pág.21


P1  P 2
Z
1 1  ~ N (0,1)
pˆ (1  pˆ )  
 n1 n2 
x1  x 2 n1 p 1  n2 p 2
Donde: pˆ   es un estimador insesgado del parámetro
n1  n2 n1  n2

La región de rechazo de H o de la prueba en los tres tipos de alternativas es:


 Z  z1a si H 1 : p1  p 2 , prueba unilateral cola derecha
 Z   z1a si H 1 : p1  p 2 , prueba unilateral cola izquierda

 Z z a si H 1 : p1  p 2 , prueba bilateral
1
2

PROBLEMAS

1. Una muestra aleatoria de 100 hogares de una ciudad, revela que el promedio de los ingresos mensuales es
de $500. Obtenga un intervalo de confianza del 95% para la media de la población de los ingresos de todos
los hogares de esa ciudad. Asuma que   $100 .

2. Un analista de investigación de mercados escogió una muestra aleatoria de 100 clientes de una lista de 500
clientes de una tienda exclusiva, cuyos ingresos mensuales son mayores a $5000 y encontró que gastaron
por mes, un promedio de $2500 con una desviación estándar de $300. Si con estos valores de la muestra el
analista estima que el gasto promedio de la población va de $2446 a $2554, ¿qué nivel de confianza utilizo?.

3. Para estimar el tiempo promedio que los niños de primer grado se demoran en armar un rompecabezas, un
investigador social desarrollo la tarea con 9 de tales niños escogidos al azar de la población indicada. Los
tiempos en minutos observados son:

28 25 32 30 35 33 29 28 36

Obtenga el intervalo de estimación del promedio de la población de todos los tiempos que demoraran en
armar el rompecabezas con nivel de confianza del 95%. Asuma que la población tiene distribución normal.

4. Se va a estimar la proporción p de consumidores potenciales de un nuevo producto.


a) Si una muestra de 385 consumidores revelo que 154 comprarían el nuevo producto, estime el verdadero
porcentaje de consumidores del producto nuevo, utilizando un intervalo de confianza del 95%.
Interprete el resultado.
b) Si con una muestra de 550 consumidores escogida de la población de 3000 se encontró que 165
comprarían el nuevo producto, y si además, se estimó de 785 a 1015 el total de consumidores que
comprarían el producto nuevo, ¿qué nivel de confianza se utilizó?.

5. Para estimar la variabilidad de los contenidos de un producto que una empresa comercializa en bolsas de
150 gramos, un analista de métodos cuantitativos escogió una muestra aleatoria de 10 unidades del
producto resultando los siguientes pesos en gramos:

150,5 150,7 149 150,4 149,6 151 150,9 149,2 150,3 149,3

Obtenga el intervalo de confianza del 95% para la varianza de los contenidos de todas las unidades del
producto en mención. Suponga que la población de estos contenidos se distribuye según el modelo de la
probabilidad normal.

6. Un fabricante va a instalar una nueva máquina N solo si hay prueba de que es menos variante en los
tiempos de producción que la actual maquina A. Con este fin ha escogido una muestra aleatoria de tamaño
n1  8 de A y otra de tamaño n2  6 de N, de los tiempos en segundos, que emplearon para producir
cada unidad en un experimento de prueba. Los resultados son:

Muestra de A 2,17 2,23 2,21 2,18 2,22 2,20 2,21 2,19

Prof: Juan Carlos Zelaya Castro Pág.22


Muestra de N 2,13 2,16 2,14 2,12 2,15 2,14
 12
Aplicando un intervalo de confianza del 95% para el cociente de varianzas y el criterio para decidir,
 22
¿cree usted que el fabricante debería cambiar su máquina actual?. Se sabe que los tiempos de producción
por unidad del bien en este rubro siempre se distribuyen según el modelo de probabilidad normal.

7. Un consumidor de cierto producto quiere aplicar la técnica de estimación estadística para decidir si compra
la marca A o la marca B del producto. Para esto va a estimar la diferencia entre los tiempos de vida
promedio de las dos marcas del producto. Si dos muestras aleatorias independientes de 10 unidades de
cada marca llevados a un laboratorio han dado las medias de vida útil respectivas de 1230 horas y 1190
horas, ¿es acertada la decisión del consumidor si decide adquirir la marca A?. Aplique el nivel de confianza
del 95% y suponga que las dos poblaciones tienen distribución normal con desviaciones estándar
respectivas de 120 y 60 horas.

8. El agente de compras de una cadena de restaurantes va a decidir adquirir entre dos variedades de arroz A y
B. Para tomar la decisión estadística comparando la calidad, se escogieron dos muestras aleatorias
independientes de 10 bolsas de arroz de un kilo de cada uno de las dos variedades de arroz y se observaron
los siguiente porcentajes de granos quebrados por kilo:
Variedad A 6 5 6 7 4 7 6 4 3 6
Variedad B 7 6 7 9 5 8 7 6 10 8
Obtenga el intervalo de confianza del 95% de la diferencia de los promedios de porcentajes de granos
quebrados por kilos de arroz de las dos variedades. ¿Es válido concluir que no hay diferencias significativas
entre las dos medias poblacionales?. Suponga que las poblaciones de los porcentajes de granos quebrados
por kilo de A y B se distribuyen normalmente con la misma varianza.

9. Se lleva a cabo un estudio para comparar los montos de los préstamos personales realizadas por dos
entidades financieras A y B. Con este fin se tomaron 9 y 8 préstamos al azar de cada banco resultando los
siguientes montos en miles de soles:

Banco A 12 28 10 25 24 19 22 33 17

Banco B 16 20 16 20 16 17 15 21

Aplicando un intervalo de estimación del 95% para la verdadera diferencia de los montos promedios, ¿es
validos inferior que en promedio el monto de los préstamos del banco A es mayor a los del banco B?. Datos
históricos indican que la distribución de estos en cada banco, es normal con varianzas diferentes.

10. El nivel de colesterol es un factor de alto riesgo de enfermedades al corazón. Para comparar el nivel de
colesterol de adultos divididos en dos grupos A de 25 a 40 años y B más de 40 años, se escogió una
muestra aleatoria de 200 adultos de A y otra de 250 de B encontrándose que 120 y 175 respectivamente
tenían niveles de colesterol alto (más de 230 mg/dl). Aplicando un intervalo de confianza del 95% para la
verdadera diferencia de proporciones de colesterol alto, ¿se puede concluir que el riesgo de sufrir tal
enfermedad es la misma para los dos grupos?

11. Para comparar dos métodos de la enseñanza de las matemáticas, el tradicional y el nuevo, se tiene las
siguientes estadísticas al final del semestre:

Métodos Tradicional Nuevo


Medias 13 15
Varianzas 9 16
Tamaño de 64 60
muestras

Aplicando el método del intervalo de confianza del 95% para la diferencia de las medias, ¿cree usted que no
hay diferencias en los resultados promedios de los dos métodos?. Si los hay, ¿con cuál de los dos métodos
se obtiene mayor rendimiento?

12. Una agencia de publicidad realizo un estudio para comparar la efectividad de un anuncio en la radio en dos
distritos. Después de difundir el aviso, realizo un sondeo a 900 personas seleccionadas al azar, en cada uno
de los distritos, resultando que 180 y 162 de ellos escucharon el anuncio. Si con los datos de las dos

Prof: Juan Carlos Zelaya Castro Pág.23


muestras se obtuvo el intervalo   0,0162 ; 0,0562 como estimación de la diferencia de las dos
proporciones reales de las personas que escucharon el anuncio, ¿qué nivel de confianza aplico?

13. Para comprobar si está controlando el proceso de producción de un producto que sale al mercado en bolsas
de 400 gramos se ha observado los pesos de una muestra al azar de 16 bolsas del producto, resultando una
media de 395 gramos. Si el criterio es concluir que el proceso de empaquetado no está controlado cuando el
peso promedio real del producto es diferente de 400 gramos, ¿es válido inferir con el resultado de la
muestra y al nivel de significación del 5% que el proceso está fuera de control?. Asuma que los pesos del
producto tienen distribución normal con una desviación estándar de 8 gramos.

14. Al estudiar si conviene tener o no una sucursal en la ciudad de Tarapoto, la gerencia de una cadena de
mercados de Lima, establece el siguiente criterio para tomar una decisión: Abrirá la sucursal solo si se
comprueba que el ingreso promedio familiar mensual en dicha ciudad es de al menos de $500. Si una
muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una media de $480 y una desviación
estándar de $80,
a) ¿Cuál es la decisión de la gerencia con un riesgo del 5% de cometer el error tipo I?
b) Calcule la probabilidad de cometer el error tipo II si el verdadero valor de la media de ingresos es
$464. ¿Cuánto es la potencia de la prueba en este caso?
c) ¿Con que probabilidad esta prueba de hipótesis detecta una diferencia de $30 en el promedio de
ingresos por debajo de lo que especifica la hipótesis nula?

15. Se sembró en forma experimental una nueva variedad de uvas en el viñedo San Pedro de San Martin. El
empresario agroindustrial dueño del viñedo afirma que el peso promedio por racimo es de al menos 160
gramos. Sin embargo una muestra de 10 racimos de la uva de la reciente cosecha ha dado los siguientes
pesos en gramos:
157 157 163 158 161 159 162 159 158 156

a) ¿Cree usted que el empresario tiene la razón?. Utilice un nivel de significación del 5% y asuma que la
población de pesos de los racimos tiene distribución normal.
b) ¿Cuáles son los limites inferior y superior donde se ubica el verdadero peso medio de los racimos de
uvas con un riesgo a  0,05 ?

16. Un fabricante remplazaría su sistema actual de producción que tiene una media de 4,5 segundos y una
varianza de 0,06 segundos, solo si el nuevo sistema resulta más estable en variabilidad que el actual. Para
tomar la decisión escogió una muestra al azar de 10 tiempos del nuevo sistema de producción y obtuvo las
siguiente mediciones en segundos:

4,55 4,30 4,45 4,48 4,59 4,53 4,36 5,10 4,40 4,38

¿Debería el fabricante reemplazar sus sistema de producción actual por el nuevo?. Use el nivel de
significación a  0,05 y asuma que el tiempo que emplea el nuevo sistema se distribuye según el modelo
de la probabilidad normal.

17. Una compañía diseña un nuevo proceso de moldeo con el fin de reducir la variabilidad en el diámetro que
actualmente tienen las piezas producidas. Para comprobar la variabilidad de los dos procesos se escogió una
muestra al azar de 8 piezas del proceso actual y otra de 6 piezas del proceso nuevo resultando los
siguientes diámetros en milímetros:

Muestra 1 17 23 21 18 22 20 21 19

Muestra 2 13 16 14 12 15 14

¿Confirman estos datos que es menor la variabilidad de los diámetros de las piezas con el nuevo proceso?.
Asuma poblaciones de diámetros normales en cada caso y use la probabilidad de error tipo I, a  0,05 .

18. Una medicina A fue aplicada a una muestra de 10 pacientes aquejados de cierta enfermedad. Otra medicina
B fue aplicada a otra de 9 pacientes aquejados de la misma enfermedad. Los tiempos en días de
recuperación de los pacientes fueron los siguientes:

Medicina A 6 5 6 7 4 7 6 4 3 6

Prof: Juan Carlos Zelaya Castro Pág.24


Medicina B 7 6 7 9 5 8 7 6 8

Utilizando un nivel de significación del 5% y suponiendo poblaciones normales, ¿es válido inferir que no hay
diferencias significativas en las medias de los tiempos de tratamiento de las dos medicinas?. Si hay
diferencias, ¿cuál de las medicinas es más eficaz?

19. El agente de compras de una empresa quiere decidir la adquisición de una de dos marcas de máquinas para
procesar cierto producto. Por cuestiones de precio él está pensando en comprar la marca A, a no ser que
haya evidencias de que la maquina B es más veloz. Se le permitió operar los dos tipos de máquinas durante
un periodo de prueba observando los tiempos (en segundos) por unidad producida, luego, escogió al azar
una muestra de 10 tiempos por máquina. Las muestras son:

Maquina A: 55, 56, 57, 56, 58, 53, 54, 59, 60, 57
Maquina B: 50, 51, 42, 50, 40, 60, 53, 44, 48, 58

¿Cree usted que el agente debería elegir la maquina B?. Aplique tanto el método de prueba de hipótesis
como el de intervalo de confianza, asumiendo a  0,05 y las poblaciones de tiempos empleados,
normales.

20. Un productor afirma que al menos el 30% de todos los consumidores prefiere su producto. Al parecer esta
afirmación es exagerada. Con el fin de comprobar la afirmación del productor, se tomó una muestra
aleatoria de 400 consumidores y se encontró que 100 de ellos prefieren su producto. ¿Existe suficiente
evidencia para inferir que el productor no tiene la razón?. Utilice el nivel de significación del 1%.

21. Con el fin de conocer el nivel de aceptación de un producto un analista cuantitativo realizo un estudio de
opinión en dos ciudades del interior del país. En Chiclayo 120 consumidores de una muestra al azar de 300
opinaron aceptando el producto, mientras que, en Arequipa 120 consumidores de una muestra al azar de
400 opinaron estar de acuerdo con el producto. ¿Puede considerarse significativa la diferencia de las dos
proporciones muéstrales con una probabilidad de error tipo I al nivel del 5%?

EXÁMENES FINALES

1. (EX2:14-1)
Un ingeniero que controla la calidad del llenado de un producto en pequeñas botellas, sabe que si la
variabilidad de la cantidad llenada es grande, algunas botellas van a tener muy poco y otras demasiado
contenido. Para controlar la variabilidad de los pesos del contenido por botella tomó una muestra aleatoria
de 10 botellas y observó los siguientes pesos (en gramos) de la cantidad llenada:

9,8 9,9 10,1 10,3 9,9 10,1 9,7 10,3 10,4 9,9

Asumiendo que la cantidad llenada por botella de toda la producción se distribuye según la ley de
probabilidad normal:
a) (2 puntos) Construya un intervalo de confianza del 90% para la media de los pesos de los contenidos
de toda la producción.
b) (2 puntos) Construya un intervalo de confianza del 95% para la varianza de los pesos de los contenidos
de toda la producción.

2. (EX2:14-1)
En una planta de producción de tornillos se ha llevado a cabo un estudio en el que se quiere comprobar si
las unidades fabricadas tienen un diámetro ajustado a las tolerancias solicitadas. Para ello se tomó una
muestra de 35 tornillos, obteniéndose para las longitudes de los diámetros una media de 15,80 mm y una
desviación estándar de 0,40 mm.
a) (2 puntos) Probar la hipótesis de que la media de las longitudes de los diámetros de la producción está
actualmente por encima del límite inferior de tolerancia que es de 15,70 mm.
b) (2 puntos) Calcule el nivel crítico de la prueba.

3. (EX2:14-1)
(3 puntos) La aceituna es una drupa carnosa que al madurar cambia su color de verde a morado o negro.
Existen más de 600 variedades de aceitunas en todo el mundo. La variedad picual tiene un peso medio de
4,8 gramos con una desviación estándar de 0,5 gramos. La variedad lechín tiene un peso medio de 3,5

Prof: Juan Carlos Zelaya Castro Pág.25


gramos con una desviación estándar de 0,6 gramos. El peso de las aceitunas sigue una distribución Normal.
Si en un tonel hay 70% de aceitunas de variedad picual y el resto de variedad lechín, calcule la probabilidad
de que una aceituna elegida al azar pese entre 3,6 y 4,0 gramos

4. (EX2:14-1)
a) (3 puntos) Según una investigación, la actividad que más realizan las personas a la hora de revisar su
celular es leer y responder a los correos electrónicos con un número promedio de 1,4 veces por hora
con una desviación estándar de 0,4 veces por hora. Si una clase consta de dos horas y hay 60 alumnos.
Calcule la probabilidad de que el total de veces que los 60 alumnos revisan su celular para leer o
responder correos sea superior a 170 veces en las dos horas de clase.
b) (2 puntos) En cierto banco se quiere estimar el porcentaje de sus clientes que estarían interesados en
usar el servicio de Banca Móvil que permite realizar operaciones bancarias mediante una aplicación para
teléfonos celulares. ¿Cuál sería el tamaño de muestra necesario para realizar esta estimación a un nivel
de confianza del 94% y con un margen de error de máximo 2,5%?

5. (EX2:14-0)
(3 puntos) Un servidor de correo electrónico envía 17000 mensajes electrónicos en una hora, de los cuales
el 0,009% no llegarán a su destino por fallas en el servidor. ¿Cuál es la probabilidad de que por lo menos 35
correos no lleguen a su destinatario en un día?

6. (EX2:14-0)
(3 puntos) El peso de una variedad de naranjas puede modelarse por una variable aleatoria normal con una
desviación estándar de 12.5 gramos. Se sabe que el 88.49% de las naranjas pesan menos de 190 gramos.
Calcule la probabilidad de que seis naranjas pesen más de un kilo

7. (EX2:14-0)
(3 puntos) La dureza Rockwell de un tipo se puede modelar por una variable aleatoria continua con una
media de 50 y una desviación estándar de 1.2. Calcule la probabilidad de que la dureza media de una
muestra aleatoria de 40 pernos sea por lo menos de 51

8. (EX2:14-0)
(3 puntos) Considere una muestra aleatoria X 1, X 2,..., X n de una variable X con función de densidad de
1
probabilidad: f (x ) (1   x ), 1 � x � 1
2
Encuentre un estimador insesgado de θ

9. (EX2:14-0)
Se seleccionó una muestra de 12 bodegas y se registró el precio, en soles, del kilo de azúcar rubia,
encontrándose los siguientes precios.

3.2 2.8 3.0 3.4 3.15 2.9 2.9 3.1 3.1 3.2 2.95 3.2

Suponiendo que el precio del azúcar rubia sigue una distribución normal
a) (2 puntos) ¿Sugieren estos datos que el precio promedio del azúcar rubia es mayor a 3 soles? Use un
nivel de significación del 5%.
b) (2 puntos) Calcule e interprete un intervalo de confianza para la desviación estándar del precio del
azúcar rubia. Use un nivel de confianza del 95%.

10. (EX2:14-0)
a) (2 puntos) A los fabricantes del cereal “Choco” les gustaría determinar, con una diferencia no mayor a
dos puntos porcentuales y con una confianza del 95%, el porcentaje de niños menores de 10 años de
cierta ciudad que consumen este cereal al menos una vez por semana. ¿Cuál sería el tamaño de
muestra adecuado?
b) (2 puntos) En una muestra, de 35 farmacias, el intervalo con una confianza del 90% para la media del
precio (en soles) de un determinado medicamento es [29.78, 34.22]. Encuentre la desviación estándar
muestral del precio de dicho medicamento.

11. (EX2:13-II)

Prof: Juan Carlos Zelaya Castro Pág.26


(3 puntos) El tiempo de vida de cierto dispositivo electrónico se modela exponencial con media de 2500
horas. Si en un taller se ha adquirido quince de estos dispositivos, calcule la probabilidad de que menos de
cuatro de ellos duren más de 2700 horas.

12. (EX2:13-II)
(3 puntos) El gasto mensual de una persona se modela con una variable normal. El percentil 10 de dicho
gasto es 266,8 nuevos soles y el percentil 90 es 933,2 nuevos soles. Calcule la probabilidad de que el gasto
mensual de una persona selecciona al azar sea mayor a 750 nuevos soles.

13. (EX2:13-II)
(3 puntos) El tiempo que se tarda en hacer cualquier punto en un partido de voleibol se modela con una
variable aleatoria uniforme entre 30 y 90 segundos. El 29 de noviembre, la selección peruana de voleibol
derrotó por tres sets a cero a Venezuela y alcanzó la presea dorada en los Juegos Bolivarianos 2013. El
sexteto dirigido por Natalia Málaga se impuso por 25-21, 25-17 y 25-10. Calcule la probabilidad de que el
tiempo total transcurrido en hacer los puntos haya sido mayor a dos horas.

14. (EX2:13-II)
a) (2 puntos) El gerente de un hotel quiere estimar la media del número de huéspedes diarios. Los
siguientes datos muestran el número diario de huéspedes registrados en 10 días seleccionados al azar:
62, 69, 61, 60, 58, 63, 70, 76, 74 y 80. Suponga distribución normal y estime la media requerida con un
nivel de confianza del 95%.
b) (2 puntos) Se desea estudiar el gasto semanal de fotocopias, de los estudiantes de cierto instituto
técnico. Para ello, se ha elegido una muestra aleatoria de 9 estudiantes, resultando los gastos (en
nuevos soles):
1,00 1,50 0,90 0,70 1,05 2,00 1,20 0,80 0,75

Se supone que la variable aleatoria objeto de estudio sigue una distribución normal. Estime usando un
nivel de confianza del 95% la varianza poblacional del gasto semanal en fotocopias por estudiante.
15. (EX2:13-II)
(4 puntos) El director de responsabilidad social de cierta empresa minera recibe la siguiente información:
“En la última encuesta realizada a 40 pobladores seleccionados al azar de la comunidad vecina, 32 de ellos
señalaron a la empresa como principal responsable de la contaminación del río que abastece de agua a la
comunidad”. En un estudio similar realizado un año antes se estimó que el 85% de los habitantes de la
comunidad señalaban a esta empresa minera como principal responsable de la contaminación del río.
a) A un nivel de significación de 0,1 ¿ofrece la última encuesta evidencia suficiente de que el referido
porcentaje ha disminuido respecto al estudio anterior?
b) Calcule el nivel crítico de la prueba.

16. (EX2:13-II)
Sea X una variable aleatoria con media μ y varianza  2 .Dadas dos muestras aleatorias independientes de
tamaño n1 y n 2 , con medias muestrales X 1 y X 2
ˆ
a) (1 puntos) Demuestre que   a X 1  (1  a )X 2
es un estimador insesgado de μ.
b) (2 puntos) Si X 1 y X 2 son independientes, calcule el error estándar de ˆ y el valor de a que hace
mínimo dicho error estándar

17. (EX2:13-I)
(3 puntos) El número de taxis por hora que pasan por un paradero sigue una distribución de Poisson. Si la
probabilidad de que en un lapso de 5 minutos no hayan pasado taxis por el paradero es: e 0.8 halle la
probabilidad de que en un lapso de 20, minutos pasen por el paradero por lo menos tres taxis.

18. (EX2:13-I)
(3 puntos) Una pareja de esposos decide ahorrar el 10% de sus ingresos cada mes. El ingreso mensual del
esposo, se modela por una variable normal con media de S/.3000 y desviación estándar de S/.150, mientras
el ingreso mensual de la esposa se modela por una variable normal con media de S/.2800 y desviación
estándar de S/.100. Si la pareja ahorra durante un año, calcule la probabilidad de que el ahorro total sea
mayor a 7000 nuevos soles.

19. (EX2:13-I)

Prof: Juan Carlos Zelaya Castro Pág.27


a) (2 puntos) Los agricultores cafetaleros de cierta comunidad están muy preocupados por la plaga de la
roya que está atacando las plantaciones de café en el Perú y necesitan estimar el porcentaje de sus
plantones que han sido atacados por esta plaga. Para realizar esta estimación se tomó una muestra
aleatoria de 60 plantones de café y se detectaron 38 infectados por la roya. Realiza la estimación
requerida a un nivel de confianza del 95%. Interprete.
b) (2 puntos) Por estudios realizados anteriormente se sabe que la desviación estándar del ingreso anual
de los trabajadores de la rama textil es de 3000 nuevos soles. ¿Cuántos trabajadores de la rama textil
tendrían que ser seleccionados si se quisiera estimar la media poblacional del ingreso anual con un error
máximo de 500 nuevos soles, con nivel de confianza del 97%.

20. (EX2:13-I)
Según una normativa sobre contaminación atmosférica, los motores de los automóviles cumplen las normas
si la emisión media es a lo más de 5 ppm (partes por millón) de CO 2 .Dentro de sus procesos de control de
calidad, un fabricante ha medido la emisión de CO 2 , en una muestra de 36 motores tipo A, obteniendo una
media de 5,5 ppm y una desviación estándar de 0,6 ppm.
a) (2 puntos) ¿Hay evidencia de que los motores tipo A no están cumpliendo la normativa sobre
contaminación atmosférica? Use un nivel de significación del 5%.
b) (2 puntos) Calcule la probabilidad de cometer el error tipo II, si la emisión media de CO 2 de los
motores tipo A es 5,3 ppm.

21. (EX2:13-I)
(3 puntos) La resistencia de cierto tipo de cilindros de concreto se modela normal con media de 240
kg / cm 2 y una desviación estándar de 30 kg / cm 2 .Calcule la probabilidad de que en una muestra
aleatoria de diez de estos cilindros, al menos tres tengan una resistencia superior a 265 kg / cm 2

22. (EX2:13-0)
(5 puntos) En el año 2004 se evaluó la urgencia de iniciar una campaña de concientización acerca de los
riesgos que comporta el sobrepeso en los hombres adultos de 41 a 50 años. Para ello se contrató una
empresa para la toma de datos en una muestra y envió la siguiente información:

Porcentaje frecuencia
de grasa absoluta
[3,7[ 6
[7 , 11[ 17
[11,15[ 29
[15,19[ 26
[19,23[ 15
[23,27] 8

Si la distribución del porcentaje de grasa es aproximadamente normal, estime la media y la desviación


estándar del porcentaje de grasa con una confianza del 98%.

23. (EX2:13-0)
En marzo de este año se tomó una muestra aleatoria de 200 estudiantes universitarios y se encontró que el
porcentaje de los que afirmaron estar a favor de la norma que prohíbe el consumo de tabaco y alcohol
dentro del campus universitario fue 47%. Luego de una campaña de concientización organizada por las
autoridades universitarias, en octubre se realizó un estudio similar, con otra muestra aleatoria de 200
estudiantes, y se encontró que el 51% estaba a favor de la referida norma.
a) (2 puntos) A un nivel de significación del 5%, ¿hay evidencia muestral suficiente para aceptar que el
porcentaje de estudiantes a favor de la norma ha aumentado?
b) (3 puntos) Calcule e interprete la probabilidad de cometer el error tipo II para el caso en el que el
porcentaje de estudiantes a favor de la norma sea realmente 49%.

24. (EX2:13-0)
(5 puntos) Sea X 1, X 2,..., X n una muestra aleatoria tomada de una población con media  y desviación
estándar  .

Prof: Juan Carlos Zelaya Castro Pág.28


n

Sea � ci Xi
donde c 1,c 2,...,c n es un conjunto de constantes reales.
ˆ  i
1

n
n
Determine el valor de �
i
ci
1
para que ̂ sea un estimador insesgado de ̂ y encuentre la varianza de ̂

25. (EX2:13-0)
(5 puntos) La comisión que recibe un vendedor de computadoras es 5% del precio de venta del producto y
la de su jefe es la quinta parte de la comisión del vendedor. Las ventas mensuales que realiza cada
vendedor puede modelarse por una variable aleatoria con una media de 50 mil nuevos soles y una
desviación estándar de 5 mil nuevos soles. Si un jefe tiene a su cargo a 40 vendedores que trabajan de
manera independiente, calcular la probabilidad que la comisión mensual del jefe supere los 16 mil nuevos
soles.

26. (EX2:13-0)
El tiempo que tarda un alumno en resolver una pregunta tipo A puede modelarse con una variable
exponencial de media dos minutos, mientras que el tiempo que tarda para resolver una pregunta tipo B con
una variable normal de media de cuatro minutos y desviación estándar de 30 segundos. Si una prueba
consta de dos partes: la primera de 40 preguntas tipo A y la segunda de 20 preguntas tipo B. Asuma que los
tiempos para resolver las preguntas de la prueba son independientes entre sí.
a) (2 puntos) Calcule la probabilidad de que un alumno demore más de una hora y media en resolver las
preguntas de la primera parte.
b) (3 puntos) Calcule la probabilidad de que un alumno demore más dos horas y media en responder las
preguntas de la prueba.

27. (EX2:12-II)
El tiempo que un paciente permanece hospitalizado en cierta clínica se modela con una variable normal con
una media de 6,2 días y una desviación estándar de 2,1 días.
a) (2 puntos) Se toma una muestra aleatoria de ocho pacientes que han sido hospitalizados durante el fin
de semana pasado, calcule la probabilidad de que el tiempo total de hospitalización de estos pacientes
exceda los 50 días.
b) (3 puntos) Si se tiene 100 pacientes hospitalizados, calcule la probabilidad de que al menos 40 de ellos
2. estén más de una semana hospitalizados.

28. (EX2:12-II)
a) (3 puntos) Sea X1, X2,…, X30 una muestra aleatoria de una población que tiene media µ y varianza σ².
Considere los siguientes estimadores de µ:
Y1=(X1+…+X8)/8 y Y2=(4X1-5X2+3X3)/2
Analizar si Y1 es más eficiente que Y2
b) (2 puntos) Una operadora de una empresa de telemarketing dispone de un listado de clientes
potenciales de un determinado producto. Si la probabilidad de que dicha operadora haga una venta al
hacer una llamada es del 25%, determine la probabilidad de que en la décima llamada se realice la
tercera venta.

29. (EX2:12-II)
a) (3 puntos) La vida, en horas, de un tipo de transistores se representa por una variable aleatoria
continua con función de distribución acumulada: F(x) = 1- 100/x ; x>=100
¿Cuál es la probabilidad de que en un aparato de radio que lleva cuatro de estos transistores, al menos
tres deban ser sustituidas durante las primeras 250 horas?
b) (2 puntos) El tiempo en minutos que demora una llamada telefónica en una oficina es una variable
aleatoria con distribución exponencial. Si la probabilidad de que una llamada demore más de cinco
minutos es de 0,4, calcule la probabilidad de que una llamada dure más de cuatro minutos.

30. (EX2:12-II)
a) (3 puntos) Un padre desea regalar a su hija una tablet por Navidad, para lo cual ha preguntado, a una
muestra aleatoria de 13 tiendas de la ciudad, el precio de la misma tablet encontrando los siguientes
valores (en nuevos soles):

1499 1460 1507 1538 1536


1552 1434 1490 1530 1469

Prof: Juan Carlos Zelaya Castro Pág.29


1479 1449 1440

Si el precio de la tablet se puede modelar con una variable normal, estime el precio medio de la tablet a
un nivel de confianza del 90%. Interprete.

b) (2 puntos) Según una investigación realizada por la compañía Kantar World Panel, publicada el 31 de
octubre del 2012, el éxito temprano del iPhone 5 ayudó a Apple a superar al Android de Google en
Estados Unidos. Según la investigación, la participación de Apple en el mercado estadounidense se
ubicó en un 48,1%. Para probar dicha afirmación se tomó una muestra aleatoria de 1000 personas con
smartphone de las cuales 470 tenían un IPhone. Realice una prueba de hipótesis para evaluar la
afirmación de la compañía Kantar World Panel, a un nivel de significación del 5%.

31. (EX2:12-II)
a) (2 puntos) Se requiere estimar el espesor medio de ciertos lentes utilizados para anteojos. En una
muestra aleatoria de 50 de estos lentes se observó un espesor medio de 3,05 mm y una varianza de
0.1024 mm2. Defina el parámetro de interés y realice la estimación requerida a un nivel de confianza
del 90%. Interprete.
b) (3 puntos) Durante los últimos años, la producción diaria media de cierto producto en una planta
química local ha sido de al menos 880 toneladas. Al gerente de control de calidad de la planta le
interesa saber si este promedio ha disminuido en los últimos meses y para esto selecciona al azar una
muestra de 40 días. Con los datos de la muestra se calcula una producción diaria media de 871
toneladas y una desviación estándar de 21 toneladas. A un nivel de significación del 5%, ¿cuál sería la
conclusión del gerente?

32. (EX2:12-I)
Un camión cuya capacidad de carga es de 8 toneladas, transporta bolsas de fertilizante cuyo peso tiene una
media de 50 kilogramos y una desviación estándar de 3580 gramos.
a) Calcule la probabilidad de que el peso de 159 bolsas de fertilizante escogidas al azar exceda la
capacidad de carga del camión.
b) ¿Cuántas bolsas pueden ser transportadas para que con una probabilidad de al menos 0,98 no se
exceda la capacidad de carga del camión?

33. (EX2:12-I)
a) Con fines de auditoría a las 22 empresas de transporte de pasajeros que funcionan en cierta ciudad se
selecciona una muestra aleatoria de 8 de ellas. Por registros históricos se sabe que 15 de estas
empresas de transporte han sido multadas anteriormente por incumplimiento de la revisión técnica
obligatoria de sus unidades. Determine la probabilidad de que menos de cinco de las empresas de la
muestra hayan sido multadas anteriormente por incumplir con la revisión técnica obligatoria de sus
unidades.
b) La utilidad anual de una mina en cierto país se modela con una variable normal con una media de 10
millones de dólares y con una desviación estándar de 1 millón de dólares. La oficina encargada de la
recaudación tributaria requiere establecer un valor mínimo de las utilidades anuales de las minas de tal
manera que le permita cobrar un nuevo impuesto sólo al 20% de las minas con mayores utilidades
anuales. ¿Cuál sería ese valor?

34. (EX2:12-I)
Un peligro para la salud es la exposición prolongada a fibras de asbesto. Los datos corresponden a los
resultados de un estudio basado en una muestra de trabajadores de construcción que estuvieron expuestos
al asbesto durante un periodo prolongado. Se midió la distensibilidad pulmonar, la cual es una medida de la
elasticidad de los pulmones, es decir, la eficiencia de inhalar y exhalar. La distensibilidad se mide en
(cm3/cm H2O) y se la midió para 16 trabajadores ocho meses después del periodo de exposición. Asuma
que la variable en estudio sigue una distribución normal.

167,9 180,8 184,8 189,8


207,2 208,4 226,3 227,7
194,8 200,2 201,9 206,9
228,5 232,4 239,8 258,6

a) Calcule e intérprete un intervalo de confianza al 95% para la distensibilidad pulmonar promedio


poblacional después de una exposición prolongada al asbesto.

Prof: Juan Carlos Zelaya Castro Pág.30


b) Calcule e intérprete un intervalo de confianza para la desviación estándar de la distensibilidad pulmonar
después de una exposición prolongada al asbesto.

35. (EX2:12-I)
En la evaluación censal de estudiantes del año 2011, realizada por el Ministerio de Educación, se estimo que
a nivel nacional el 86,3% de los alumnos de segundo de primaria, no lograron alcanzar los aprendizajes
esperados para el grado en Matemáticas. El director de Calidad Educativa de un consorcio de colegios
selecciona una muestra aleatoria de 80 de las evaluaciones realizadas por alumnos de segundo grado del
consorcio y determina que 15 de ellos lograron alcanzar el aprendizaje esperado en Matemáticas. Basado en
este dato, afirma que el resultado de la evaluación en el consorcio fue mejor que el resultado nacional. A un
nivel de significación del 5%
a) ¿Hay evidencia suficiente para respaldar la afirmación del director? Justifique claramente su respuesta.
b) Calcule e interprete el nivel crítico de la prueba.

36. (EX2:12-I)
Un investigador repite un experimento en las mismas condiciones y de manera independiente un número
dado de veces. El valor esperado del número de experimentos cuyo resultado es éxito es igual a 20 y su
varianza es igual a 15.
a) Calcule la probabilidad de lograr 22 éxitos.
b) Calcule la probabilidad de lograr por lo menos 18 éxitos.

37. (EX2:12-I)
Sean p1 y p2 las probabilidades poblacionales de que un hombre y una mujer voten por el candidato A,
respectivamente. De n1 votantes varones seleccionados al azar, X1 votan por el candidato A, mientras que
de n2 votantes mujeres seleccionadas al azar, X2 votan por el candidato A.
a) Demuestre que: Y1 = X1/n1 - X2/n2 es un estimador insesgado de p1-p2.
b) Calcule la desviación estándar de Y1.

38. (EX2:11-II)
El peso del equipaje de los pasajeros que viajan de Lima a Cajamarca en cierta línea aérea se modela con
una distribución normal de media 18 kilos y varianza 16 kilos 2. Si en uno de estos vuelos viajan 15
pasajeros:
a) Calcule la probabilidad de que el peso total del equipaje de los pasajeros esté entre 300 y 350 kilos.
b) Calcule la probabilidad de que más del 80% de los pasajeros de ese vuelo porten equipajes de menos
de 20 kilos.

39. (EX2:11-II)
En un estudio, el tiempo que duermen las personas adultas sanas se modeló con una variable aleatoria
normal. Según esta modelación, el 30% de los adultos sanos duermen menos de 7,2 horas diarias, mientras
que el 60% duermen más de 7,5 horas.
a) Calcule la probabilidad de que una muestra aleatoria de cinco adultos sanos tenga una media de tiempo
de dormir entre 7,6 y 7,8 horas.
b) Se toma una muestra aleatoria de 50 adultos sanos, calcule la probabilidad de que menos del 65% de
ellos duerman más de 7,5 horas.

40. (EX2:11-II)
En un estudio realizado hace dos años en cierta clínica se estimó que el tiempo de hospitalización de
pacientes tenía una distribución aproximadamente normal con media de 4 días y desviación estándar de 2,5
días. El nuevo director de la clínica, luego de conversar con un auditor, cree que la media y la varianza del
tiempo de hospitalización han variado. Para verificar sus sospechas decide tomar una muestra aleatoria de
25 registros de pacientes que fueron hospitalizados en la última semana y con esos datos calcula un tiempo
medio de hospitalización de 3.2 días y una desviación estándar de 3.1 días.
a) Estime a un nivel de confianza del 95%, el tiempo medio de hospitalización de los pacientes de la
clínica. Con base en el resultado anterior, ¿diría usted que tiene fundamento la sospecha del director
respecto al tiempo medio de hospitalización? Justifique su repuesta. Interprete.
b) Estime a un nivel de confianza del 95% la varianza de los tiempos de hospitalización. Interprete.

41. (EX2:11-II)

a) Un fabricante de motores de bombeo de agua afirma que cuando estos motores realizan la tarea A, el
consumo medio de gasolina es de a lo más 4 galones por tarea. Sin embargo, los usuarios manifiestan

Prof: Juan Carlos Zelaya Castro Pág.31


no estar de acuerdo con la afirmación. Para resolver esta controversia se escogió una muestra aleatoria
de 15 de estos motores observándose los siguientes consumos (en galones) para realizar la tarea A:

4,25 3,75 4,05 3,86 3,52 3,76 3,94 3,20


4,00 3,75 3,10 6,12 4,25 5,10 5,00

Con el nivel de significación de 5% y asumiendo distribución normal para los consumos, plantee las
hipótesis adecuadas, describa la región crítica y tome la decisión correspondiente.

b) Aprovechando los datos de la muestra de la parte a., se desea verificar, con un nivel de significación del
10%, si la desviación estándar del consumo de gasolina de estos motores, cuando realizan la tarea A,
es menor a un galón por tarea.

42. (EX2:11-II)
El número de llamadas atendidas durante un programa radial se puede modelar con una variable Poisson
con una media de tres llamadas cada cinco minutos.
a) Calcule la probabilidad de que en un minuto se atienda más de una llamada.
b) Calcule la probabilidad de que entre una llamada atendida y la siguiente transcurran más de dos
minutos.
43. (EX2:11-II)
El tiempo que tarda un alumno en resolver una pregunta tipo A puede modelarse con una variable
exponencial de media dos minutos, mientras que el tiempo que tarda para resolver una pregunta tipo B con
una variable normal de media de cuatro minutos y desviación estándar de 30 segundos. Si una prueba
consta de dos partes: la primera de 40 preguntas tipo A y la segunda de 20 preguntas tipo B. Asuma que los
tiempos para resolver las preguntas de la prueba son independientes entre sí.
a) Calcule la probabilidad de que un alumno demore más de una hora y media en resolver las preguntas
de la primera parte.
b) Calcule la probabilidad de que un alumno demore más dos horas y media en responder las preguntas de
la prueba.

44. (EX2:11-I)
En el año 2004 se evaluó la urgencia de iniciar una campaña de comercialización acerca de los riesgos que
comporta el sobrepeso en los hombres adultos de 41 a 50 años. Para ello se contrató una empresa para la
toma de datos en una muestra y envió la siguiente información:

Porcentaje de Frecuencia
grasa absoluta
[3;7[ 6
[ 7 ; 11[ 17
[11 ; 15[ 29
[15 ; 19[ 26
[19 ; 23[ 15
[23 ; 27] 8

Si la distribución del porcentaje de grasa es aproximadamente normal, estime la media y la desviación


estándar del porcentaje de grasa con una confianza del 98%.

45. (EX2:11-I)
(3 puntos) Se extrae una muestra aleatoria de tamaño “n” de una variable aleatoria “X” con función de
densidad: f(x) = 1,   x    1 . Encontrar un estimador insesgado de “” y halle la desviación estándar de
este estimador.

46. (EX2:11-I)
(3 puntos) En la ficha técnica de una encuesta realizada por Pisos Apoyo Opinión y Mercado S.A. y publicada
en mayo de 2011 en el diario El Comercio se afirma que el margen de error fue de 4,5% con un nivel de
confianza del 96%. ¿Qué tamaño mínimo de muestra se debió usar para cumplir con dichas
especificaciones?

47. (EX2:11-I)

Prof: Juan Carlos Zelaya Castro Pág.32


Una aerolínea afirma que a lo sumo el 6% de todos los equipajes perdidos no se encuentran. En un muestra
aleatoria, 17 de 200 artículos de equipaje no son encontrados.
a) (2 puntos) Pruebe la hipótesis de que la proporción de equipaje perdido es superior al 6% con un nivel
de significación de 0,05.
b) (2 puntos) Si la proporción de equipaje perdido es de 7%, halle la probabilidad del error tipo II.

48. (EX2:11-I)
(3 puntos) El tiempo de vida en años, de cierto tipo de balanza electrónica se distribuye exponencialmente
con una desviación estándar de 5 años. Los fabricantes, que por la venta de cada balanza ganan S/.150, se
comprometen a devolver al comprador S/.100 si la balanza se malogra antes del primer año y S/.60 si se
malogra entre el primer y el tercer año. si la balanza se malogra después, no se devuelve nada de dinero.
Calcule la ganancia media obtenida por la balanza

49. (EX2:11-I)
En una empresa se escoge un muestra aleatoria de 100 empleados para una encuesta sobre condiciones
laborales. Si se estima que el porcentaje de empleados en la empresa que están a favor de las condiciones
laborales es del 80%:
a) (2 puntos) ¿Cuál es la probabilidad de que la proporción muestral a favor de las condiciones laborales
esté entre 0,76 y 0,84?.
b) (2 puntos) Hallar la probabilidad de que se tenga que tomar más de diez muestras de tamaño 100 hasta
encontrar la primera muestra donde la proporción muestral a favor de las condiciones laborales no esté
entre 0,76 y 0,84.

50. (EX2:11-I)
Según una asociación de protección ambiental, el cloroformo, el cual se sospecha que en forma gaseosa es
un agente causante de cáncer, está presente en pequeñas cantidades en todas las fuentes de agua públicas.
Suponga que la media y la desviación estándar de las cantidades de cloroformo presente en las fuentes de
agua son de 34 y 5 microgramos por litro, respectivamente. Si se toman 50 muestras de agua, ¿cuántas se
esperan que tengan entre 33 y 37 microgramos de cloroformo por litro?

51. (EX2:11-0)
Los pesos de los posibles usuarios de un ascensor constituyen una población cuya distribución es normal con
media de 70kg y desviación estándar de 10kg
a) (2 puntos) ¿Qué peso máximo debería poder soportar el ascensor de modo que sólo el 1% de las
ocasiones el peso de 4 personas supere ese peso máximo?.
b) (2 puntos) Si el ascensor admite como peso máximo 585kg, ¿cuántas personas a la vez pueden entrar
al ascensor de manera que sea 0,0668 la probabilidad de que el peso no supere el máximo permitido?.

52. (EX2:11-0)
El Metropolitano cuenta con 38 estaciones y una flota de 300 buses sólo para las vías troncales.
Supongamos que se quiere estudiar el tiempo que le toma a un bus en una vía troncal para llegar de una
estación a otra. Se sabe que la tasa promedio de buses que llegan a una estación en una vía troncal es de 4
por cada 10 minutos.
a) (2 puntos) Calcule la probabilidad de que le tome entre 3 y 4 minutos a un bus llegar de una estación a
otra.
b) (2 puntos) Calcule la probabilidad de que el tiempo total que le toma a un bus en todo el recorrido de
ida sea mayor que 1 hora y 45 minutos.

53. (EX2:11-0)
(2 puntos) Una compañía tiene dos proveedores “A” y “B” de tuercas. El diámetro interno de las tuercas que
se usarán en el armado de cierto artefacto debe estar en el intervalo expresado como 0,3 0,005 pulgadas.
El diámetro interno de las tuercas ofrecidas por cada proveedor puede considerarse una variable aleatoria
con distribución normal con: media igual a 0,302 y desviación estándar igual a 0,003 pulgadas para el
proveedor “A” y media igual a 0,303 y desviación estándar igual a 0,002 pulgadas para el proveedor “B”. Si
los lotes se juntan y se elige una tuerca al azar y esta sale defectuosa ¿qué proveedor es más probable que
la haya producido?.

54. (EX2:11-0)
(3 puntos) Supóngase que las alturas de las antenas de telefonía celular se distribuyen normalmente con
media 40 metros y desviación estándar 9 metros. Si se toman 50 muestras de 36 antenas cada una,
encontrar el número esperado de muestras que tienen una media entre 38 y 41 metros.

Prof: Juan Carlos Zelaya Castro Pág.33


55. (EX2:11-0)
(2 puntos) Al tomar una muestra de 100 televidentes, el intervalo de la confianza para la proporción que ve
el programa “A” fue [0,19 ; 0,35]. Encontrar el nivel de confianza del intervalo.

56. (EX2:11-0)
Con el fin de estimar el tiempo promedio de duración de las llamadas telefónicas en cierta oficina, se tomó
una muestra aleatoria de 36 llamadas y se encontró que el tiempo medio de duración era de 9 minutos con
una desviación estándar de 3 minutos. En el último recibo de la oficina, la compañía de teléfonos afirma que
el tiempo medio de duración de las llamadas es de 11 minutos. Usando un nivel de significación del 5%.
a) (2 puntos) Pruebe la hipótesis de que la media es menor de lo que afirma la compañía.
b) (2 puntos) Si realmente el tiempo medio de duración de las llamadas es de 10 minutos, encuentre la
probabilidad del error tipo II.

57. (EX2:10-II)
a) ¿Cuál es la probabilidad de que en una muestra de 80 alumnos existan más de 10 con enfermedad “E”,
si se sabe que en toda la población el 70% son hombres, el 30% son mujeres, el 5% de los hombres
padecen la enfermedad “E” y el 2% de las mujeres padecen la enfermedad “E”?
b) La dureza Rockwell de un tipo se puede modelar por una variable aleatoria con una media de 50 y una
desviación estándar de 1,2. Calcule la probabilidad de que la dureza media de una muestra aleatoria de
40 pernos sea por lo menos de 51.

58. (EX2:10-II)
a) Un mecanismo de aire acondicionado funciona con base en cinco componentes independientes, y la vida
útil de cada uno sigue una distribución exponencial con una media de 5 años. Para que el mecanismo
pueda funcionar se requiere que, por lo menos, dos de sus componentes aún sirvan. Calcule la
probabilidad de que el mecanismo funcione por lo menos ocho años.
b) El peso de una variedad de naranjas puede modelarse por una variable aleatoria normal con una
desviación estándar de 12,5 gramos. Se sabe que el 88,49% de las naranjas pesan menos de 190
gramos. Calcule la probabilidad de que seis naranjas pesen más de un kilo.

59. (EX2:10-II)
Sea: X1, X2, ….., X40 una muestra aleatoria de una población uniforme [0 ; b].
a) Se desea estimar el parámetro desconocido “b” y para ello se define el siguiente estimador:

3X 1  5 X 2  6 X 3
ˆ

4
Determine si ̂ es un estimador insesgado de “b”. Si no lo fuera, proponga un estimador insesgado
para el parámetro desconocido “b”.
b) Se usa el estadístico 2. X como estimador insesgado de “b”. determine si: 2. X es un estimador más
eficiente que el estimador insesgado propuesto en la parte (a).

60. (EX2:10-II)
a) En una muestra, de 35 farmacias, el intervalo con una confianza del 90% para la media del precio (en
soles) de un determinado medicamento es [29,78 ; 34,22]. Encuentre la desviación estándar muestral
del precio de dicho medicamento.
b) En una investigación de mercado se desea estimar la proporción de personas que compran actualmente
un determinado detergente. ¿Qué tamaño de muestra debemos usar para que con probabilidad 0,92, la
estimación no se desvíe del verdadero valor en más de 3%?

61. (EX2:10-II)
En marzo de este año se tomó una muestra aleatoria de 200 estudiantes universitarios y se encontró que el
porcentaje de los que afirmaron estar a favor de la norma que prohíbe el consumo de tabaco y alcohol
dentro del campus universitario fue 47%. Luego de una campaña de comercialización organizada por las
autoridades universitarias, en octubre se realizó un estudio similar, con otra muestra aleatoria de 200
estudiantes, y se encontró que el 51% estaba a favor de la referida norma.
a) a un nivel de significación del 5%, ¿ hay evidencia muestral suficiente para aceptar que el porcentaje de
estudiantes a favor de la norma ha aumentado?
b) Calcule e interprete la probabilidad de cometer el error tipo II para el caso en el que el porcentaje de
estudiantes a favor de la norma sea realmente 49%.

Prof: Juan Carlos Zelaya Castro Pág.34


62. (EX2:10-I)
Un fabricante de sistemas rociadores utilizados como protección contra incendios en edificios de oficinas
afirma que la temperatura media de activación del sistema es de 130ºF. en una muestra aleatoria de nueve
de estos sistemas se observa una temperatura media de activación de 131,08ºF y una desviación estándar
de 1,5ºF. Suponga que la temperatura de activación de estos sistemas se distribuye normal.
a) A un nivel de significación de 0,01 ¿sugieren los datos que la temperatura media de activación de los
sistemas es mayor que la señalada por el fabricante?
b) Determine e interprete la probabilidad de cometer el error tipo II si la temperatura media real de
activación fuera 132ºF.

63. (EX2:10-I)
En la avenida Abancay se llevaron a cabo estudios para determinar la concentración de monóxido de
carbono. La técnica usada consistió en tomar muestras de aire en bolsas especiales y después determinar la
concentración de monóxido de carbono mediante un espectrofotómetro. Las concentraciones en ppm
(partes por millón) en las veinte mediciones realizadas fueron:

102,2 98,4 104,1 101 102,2


100,4 98,6 88,2 78,8 83
84,7 94,8 105,1 106,2 111,2
108,3 105,2 103,2 99 98,8

Asuma que la concentración de monóxido de carbono puede modelarse por una variable normal.
a) Estime e interprete la concentración media de monóxido de carbono con una confianza del 95%.
b) Estime e interprete la desviación estándar de la concentración de monóxido de carbono con una
confianza del 95%

64. (EX2:10-I)
El gerente financiero de una gran cadena de tiendas por departamentos seleccionó una muestra de 200 de
sus clientes que pagan con tarjeta de crédito y encontró que 136 de ellos habían incurrido en pago de
intereses durante el año previo a causa de saldos vencidos.
a) Calcule el intervalo de confianza al 90% para la proporción verdadera de clientes de tarjeta de crédito
que incurrieron en pago de intereses durante el año previo.
b) Si el ancho deseado del intervalo de 90% es de 0,05 ¿qué tamaño de muestra se requeriría para
garantizar esto?

65. (EX2:10-I)
Sea X1, X2, ……. Xn una muestra aleatoria tomada de una población con media “” y desviación estándar “”.
n
( Xi  )
2

a) Determinar si: � , es un estimador insesgado de “2”.


ˆ2  i
1

n
n

b) Sea: � c i .X i
, donde: c1, c2, ….., cn, es un conjunto de constantes reales.
ˆ  i1

n
n
Determinar el valor de: �
i
ci
1
, para que: ̂ , sea un estimador insesgado de “” y encuentre la varianza

de: ̂

66. (EX2:10-I)
(2 puntos) El tiempo en terminar de construir una casa puede modelarse por una variable normal con una
media de 90 días y una desviación estándar de 5 días. Si la casa se termina en menos de 95 días, el capataz
recibirá un premio de obra de 1500 nuevos soles. Si el capataz participa en la construcción de muchas casas,
calcule el valor esperado del premio de obra por casa. Asuma independencia en la construcción de cada
casa.

67. (EX2:10-I)

Prof: Juan Carlos Zelaya Castro Pág.35


La fabricación de cierto tipo de componente requiere tres operaciones de maquinado diferentes. El tiempo
de maquinado de cada operación se modela con una distribución normal y los tres tiempos de maquinado
son independientes entre sí. Los tiempos medios de las operaciones de maquinado son 15, 28 y 20 minutos
respectivamente y las desviaciones estándar son de 1; 2 y 1,5 minutos respectivamente.
a) ¿Cuál es la probabilidad de que el tiempo total de maquinado necesario para fabricar diez de estos
componentes sea mayor que 10,3 horas?
b) Si se seleccionan al azar ocho de estos componentes, ¿cuál es la probabilidad de que el tiempo de
maquinado para la fabricación de menos de siete de ellos haya sido más de una horas?

68. (EX2:10-I)
(2 puntos) El diámetro interno de un anillo de pistón varía uniformemente entre 11,90 y 12,10 centímetros.
Se selecciona una muestra aleatoria de 36 de anillos de pistón, calcule la probabilidad de que el diámetro
interno medio de los anillos de la muestra esté entre 11,98 cm. y 12,04 cm.

69. (EX2: 10–0)


(2 puntos) El número de ingresos a Internet que ocurre diariamente en determinada computadora, es una
variable “X” con distribución de probabilidad dada por:

X 0 2 4
F(x) 0,2 0,5 0,3

Calcule aproximadamente la probabilidad de en un periodo de 45 días ocurran entre 90 y 100 ingresos a


internet en tal computadora.

70. (EX2:10-0)
(2 puntos) Un sistema electrónico está formado por 100 componentes que funcionan independientemente.
La probabilidad de que cualquier componente falle durante el periodo de operación es 0,08. si el sistema
funciona cuando al menos 85 componentes funcionan, calcule aproximadamente la probabilidad de que el
sistema funcione durante el periodo de operación.

71. (EX2:10-0)
(2 puntos) En una fábrica de juguetes de madera, se estima que el 28% de los rompecabezas producidos el
mes pasado se contaminaron con cierto químico que podía resultar nocivo para la salud de los niños. Los
responsables de la fábrica enviaron una alerta a los medios de comunicación ofreciendo cambiar los juguetes
o rembolsar el monto pagado si así era solicitado por los clientes que devolvían los rompecabezas. Calcule la
probabilidad de que en una muestra aleatoria de 80 rompecabezas producidos el mes pasado, el porcentaje
de juguetes contaminados esté entre el 25% y 30%.

72. (EX2:10-0)
(2 puntos) Para estimar el porcentaje de todos los electores a favor de un candidato, una encuestadora
debe determinar el tamaño “n” de la muestra aleatoria, ¿qué tan grande debería ser la muestra si se quiere
tener una confianza del 96% que el error de estimación no sea superior al 3%?.

73. (EX2:10-0)
(2 puntos) Considere una muestra aleatoria X1, X2, ……., Xn de una variable “X” con función de densidad de
1   .x
probabilidad: f( x)  ,  1 �x �1 .
2
Encuentre un estimador insesgado de “” y hallar la varianza del estimador.

74. (EX2:10-0)
El tiempo, en meses, de permanencia en el primer empleo de los ingenieros egresados de cierta universidad
se modela con una distribución normal de media y varianza desconocidas. En una muestra de 36 ingenieros
egresados de la universidad, el tiempo de permanencia en el primer empleo presentó una media de 13
meses y una desviación estándar de 3 meses.
a) (2 puntos) Estime usando un intervalo de confianza al 99% la media del tiempo permanencia en el
primer empleo de los ingenieros egresados de la universidad.

Prof: Juan Carlos Zelaya Castro Pág.36


b) (2 puntos) Estime usando un intervalo de confianza al 90% la desviación estándar del tiempo de
permanencia en el primer empleo de los ingenieros egresados de la universidad.

75. (EX2:10-0)
(2 puntos) Anteriormente la desviación estándar de los pesos de los contenidos de cierto envase era 0,25
onzas, se trata de averiguar si ha habido aumento de dicha variabilidad. Para esto se toma una muestra
aleatoria de los contenidos de 20 envases encontrándose una desviación estándar de 0,30 onzas. Al nivel de
significación del 5%, ¿proporcionan los datos indicios suficientes que indique un aumento significativo de tal
variabilidad?
Suponga que dichos pesos están normalmente distribuidos.

Prof: Juan Carlos Zelaya Castro Pág.37