Vous êtes sur la page 1sur 10

UNIVERSIDAD NACIONAL DE SAN CRISTÓBAL DE HUAMANGA

FACULTAD DE INGENIERIA DE MINAS, GEOLOGIA Y CIVIL

ESCUELA DE FORMACIÓN PROFESIONAL DE INGENIERIA DE MINAS

CICLO ACADÉMICO: 2017-II

TRABAJO ENCARGADO N° 02

CURSO: ESTADÍSTICA Y PROBABILIDADES (ES-142)

PROFESOR: Ing. CIP Guillermo B. TAPIA CALDERÓN * Ing. Estadístico

e Informático (UNALM); ** Maestría en ciencias,

Planificación y Gestión Urbana y Regional (Posgrado FAUA-UNI)

ALUMNO:

CÓDIGO:

FECHA DE ENTREGA: 02 de enero 2018

AYACUCHO-PERÚ
PARTE A : REGRESION Y CORRELACION LINEAL SIMPLE

Las lecturas de temperatura (Y) a intervalos regulares de tiempo (X) fueron como
sigue:

Tiempo(minutos) 0 1 2 3 4 5 6
temperatura 60 67 82 108 126 134 145

i Xi Yi xi=(Xi-X) yi=(Yi-Y) xi2 yi2 xi.yi


1 0 60 -3 -43.14286 9 1861.3061 129.42857
2 1 67 -2 -36.14286 4 1306.3061 72.285714
3 2 82 -1 -21.14286 1 446.02041 21.142857
4 3 108 0 4.8571429 0 23.591837 0
5 4 126 1 22.857143 1 522.44898 22.857143
6 5 134 2 30.857143 4 952.16327 61.714286
7 6 145 3 41.857143 9 1752.0204 125.57143
21 722 0 0 28 6864.8571 433
Promedios:

X 3
Y 103.14286

A.1 determinar los estimadores mininos- cuadráticos de la regresión lineal simple


(RLS), o sea calcular ALFA y BETA estimadas.

∑7𝑖=1 𝑥𝑖 𝑦𝑖
̂ = 𝑆𝑃(𝑋𝑌) =
𝛃 =
433
= 15.464285
𝑆𝐶(𝑋) ∑7𝑖=1 𝑥 2 28

̂ (X) = 103.14286 – 15.464285 (3) = 56.75


̂ = Y-𝛃
𝛂
A.2 graficar el dispersograma en el plano cartesiano.

Y = 15.464285X+ 56.75

180
160
140
120
temperatura

100
80
60
40
20
0
0 1 2 3 4 5 6 7
tiempo(minutos)

Escriba aquí la ecuación.

A.3 hallar la ecuación estimada de la Regresión Lineal Simple (RLS).

̂x
Y = 𝛂̂ + 𝛃

Y = 15.464285X+ 56.75

A.4 graficar la recta estimada en el plano cartesiano e interpretarla


estadísticamente.

120

100

80
temperatura

60

40

20

0
0 0.5 1 1.5 2 2.5 3 3.5
tiempo(minutos)
A.5 pronosticar la temperatura para X= 9 minutos

̂x
Y = 𝛂̂ + 𝛃

Y = 15.464285X+ 56.75 =15.464285 (9)+ 56.75

Y= 195.928565

A.6 hallar el coeficiente de Regresión Lineal Simple. Interpretarlo


estadísticamente.

∑7𝑖=1 𝑥𝑖 𝑦𝑖
̂ = 𝑆𝑃(𝑋𝑌) =
𝛃 =
433
= 15.464285
𝑆𝐶(𝑋) ∑7𝑖=1 𝑥 2 28

A.7 hallar el coeficiente de correlación lineal simple. Interpretarlo estadísticamente.


𝑆𝑃(𝑥,𝑦) ∑𝑚
𝑙=1 𝑥𝑖𝑦𝑖
𝑟 = 𝜌̂ = (𝑥).𝑆𝐶(𝑦)
=
√𝑆𝐶 √∑7𝑖=1 𝑥𝑖 2 .∑7𝑖=1 𝑦𝑖 2

433 433
𝜌̂ = =438.4244505 = 0.9876273997
√28×6864.8571

I.E: El Coeficiente de Correlación Lineal Simple (𝜌) es 0.9876273997, el valor


indica una dependencia positiva directa, ya que la covariancia nos da también
el signo de la relación.

A.8 hallar el coeficiente de determinación. Interpretarlo estadísticamente.

𝑟 2 = 𝜌̂2 = 0.98762739972 = 0.9754078806

I.E: El Coeficiente de Determinación (𝜌2 ) es 0.9754078806, cuyo valor es el


cuadrado del Coeficiente de Correlación Lineal Simple (𝜌). También cercano a
uno (+1), y se interpreta estadísticamente como la explicación de la variable x
sobre el comportamiento de la respuesta y (9.754078806%)

A.9 hallar el coeficiente de alejamiento e interpretarlo estadísticamente.

√(1 − 𝑟 2 ) × 100% =√(1 − 0.9754078806) × 100% =1.56818747%

I.E: El Coeficiente de alejamiento √(1 − 𝑝̂ 2 ) es 1.56818747%, cuyo valor es la


raiz cuadrada de la diferencia entra la unidad y el coefeciente de
determinacion expresado en porcentaje (%).
A.10 ¿existirá la regresión no –lineal en este caso? Fundamente.
podemos encontrar una progresión no-lineal, por ejemplo potencial por cuanto los
datosson pocas y su grado de asociativa es alto.
PARTE B. SIMBOLIZACION DE DATOS. Dado el siguiente cuadro B; donde cada
valor corresponde a un Xij, desarrolle y calcule su VALOR NUMERICO:

CUADRO B : datos originales

j 1 2 3 4
i
1 2 4 3 2
2 5 -1 -4 8
3 3 7 1 -2
4 1 2 0 6

a) ∑𝑛=4
𝑖=1 𝑋𝑖1 = ∑𝑛=4
𝑖=1 𝑋𝑖1 = 𝑋11 + 𝑋21 + 𝑋31 + 𝑋41 = 2 + 5 + 3 + 1 = 11

b) ∑𝑛=4
𝑖=1 𝑋𝑖2 = ∑𝑛=4
𝑖=1 𝑋𝑖2 = 𝑋12 + 𝑋22 + 𝑋32 + 𝑋42 = 4 + (−1) + 7 + 2 = |2

c) ∑𝑛=4
𝑖=1 𝑋𝑖3 = ∑𝑛=4
𝑖=1 𝑋𝑖3 = 𝑋13 + 𝑋23 + 𝑋33 + 𝑋43 = 3 + 0(−4) + 1 + 0 = 0

d) ∑𝑛=4
𝑖=1 𝑋𝑖4 = ∑𝑛=4
𝑖=1 𝑋𝑖4 = 𝑋14 + 𝑋24 + 𝑋34 + 𝑋44 = 2 + 8 + (−2) + 6 = 14

e) ∑𝑛=4
𝑖=1 𝑋1𝑗 = ∑𝑛=4
𝑗=1 𝑋1𝑗 = 𝑋11 + 𝑋12 + 𝑋13 + 𝑋14 = 2 + 4 + 3 + 2 = 11

f) ∑𝑛=4
𝑖=1 𝑋2𝑗 = ∑𝑛=4
𝑗=1 𝑋2𝑗 = 𝑋21 + 222 + 𝑋23 + 𝑋24 = 5 + (−1) + (−4) + 8 = 8

g) ∑𝑛=4
𝑖=1 𝑋3𝑗 = ∑𝑛=4
𝑗=1 𝑋3𝑗 = 𝑋31 + 232 + 𝑋33 + 𝑋34 = 3 + 7 + 1 + (−2) = 9

h) ∑𝑛=4
𝑖=1 𝑋4𝑗 = ∑𝑛=4
𝑗=1 𝑋4𝑗 = 𝑋41 + 𝑋42 + 𝑋43 + 𝑋44 = 1 + 2 + 0 + 6 = 9

i) X.4= ∑𝑛=4
𝑖=1 𝑋𝑖4 = ∑𝑛=4
𝑖=1 𝑋𝑖4 = 𝑋14 + 𝑋24 + 𝑋34 + 𝑋44 = 2 + 8 + (−2) + 6 = 14

j) X2.= ∑𝑛=4
𝑖=1 𝑋2𝑗 = ∑𝑛=4
𝑗=1 𝑋2𝑗 = 𝑋21 + 222 + 𝑋23 + 𝑋24 = 5 + (−1) + (−4) + 8 = 8

k) X.. = ∑𝑚=4 𝑛=4


𝑗=1 (∑𝑖=1 𝑋𝑖𝑗 ) = 𝑋1𝑗 + 22𝑗 + 𝑋3𝑗 + 𝑋4𝑗
= (𝑋11 + 𝑋21 + 𝑋31 + 𝑋41 ) + ( 𝑋12 + 𝑋22 + 𝑋32 + 𝑋42 )
+ (𝑋13 + 𝑋23 + 𝑋33 + 𝑋43 ) + (𝑋14 + 𝑋24 + 𝑋34 + 𝑋44 )

= (2 + 5 + 3 + 1) + (4 + (−1) + 7 + 2) + (3 + (−4) + 1 + 0) + (2 + 8 + (−2) + 6) = 37


l) ∑ ∑ 𝑋𝑖𝑗 = ∑𝑚=4 𝑛=4
𝑗=1 (∑𝑖=1 𝑋𝑖𝑗 ) = 𝑋1𝑗 + 22𝑗 + 𝑋3𝑗 + 𝑋4𝑗

= (𝑋11 + 𝑋21 + 𝑋31 + 𝑋41 ) + ( 𝑋12 + 𝑋22 + 𝑋32 + 𝑋42 )


+ (𝑋13 + 𝑋23 + 𝑋33 + 𝑋43 ) + (𝑋14 + 𝑋24 + 𝑋34 + 𝑋44 )

= (2 + 5 + 3 + 1) + (4 + (−1) + 7 + 2) + (3 + (−4) + 1 + 0) + (2 + 8 + (−2) + 6) = 37

PARTE C: DEMOSTRARCIONES CON SIMBOLIZACION DE DATOS


Dada la media de datos originales, x =∑ 𝑋𝑖 ∕ 𝑛 denostrar que:


a )   X i ( X i  x)  ( x  X i )   X i  ( X i ) 2 / n  2

  [ X i ( X i  x)  ( X i  x)]
n n n n
  Xi   Xi x   x   Xi
2

i 1 i 1 i 1 i 1
n n n
  X i  x(n x)  x1   X i
2

i 1 i 1 i 1
n n
  X i  x n  xn   X i
2 2

i 1 i 1
n n n
  Xi  x n   Xi   Xi
2 2

i 1 i 1 i 1
n 2

n X i
  X i  ( i 1
2
) n
i 1 n
n 2

n X i
  X i  ( i 1
2
) n
i 1 n
n 2

n
( X i )
  Xi  i 1
2

i 1 n

b)   X i ( X i  x)  x   X i
2
 2

  [ X i ( X i  x)  x ]
2

  [ X i ( X i  x)]   x
2

  X i   X i x  x
2 2

  X i  x X i  x
2 2

  X i  x( xn)  x (n)
2 2

  Xi
2

c)  (Y i.)(W i)( Z i )  Y iW i Z i

 (Y i.)(W i)( Z i)


 (Y1.W1.Z1 ).(Y2 .W2 .Z 2 ).(Y3 .W3 .Z 3 )(Y4 .W4 .Z 4 )......(Yn .Wn .Z n )
agrupamos :
 (Y1Y2Y3 ...Yn )( X 1 X 2 X 3 ... X n )( Z1Z 2 Z 3 ...Z n )
  Yi Wi  Z i

d) ∑[(𝑋𝑖 − 𝑥)2 + 1 ∕ 𝑛] = ∑ 𝑋𝑖 2 − 𝑛𝑥 2 + 1
1
=∑(𝑋𝑖 2 − 2𝑋𝑖𝑥 + 𝑥 2 ) + 𝑛
1
=∑ 𝑋𝑖 2 − ∑ 2𝑋𝑖𝑥 + ∑ 𝑥 2 + ∑ 𝑛
=∑ 𝑋𝑖 2 − 2𝑛𝑥 2 + 𝑛𝑥 2 + 1

∑[(𝑋𝑖 − 𝑥)2 + 1 ∕ 𝑛] =∑ 𝑋𝑖 2 − 𝑛𝑥 2 + 1

PARTE D. CONCEPTOS BASICOS DE ESTADISTICA.la editorial “sigma” desea


lanzar al mercado un texto universitario: ingenieria de calidad metodos de
TAGUCHI(guillermo TAPIA CALDERON ,2008);para elloseleciono cincuenta
librerias de la ciudad de lima para determinar el tiempo de permanencia del texto
en la librería. Los datos fueron observados cada mes, habiendose obtenido los
siguientes resultados: 10 meses en 5 librerias, 3 meses en 3 librerias. 5 meses en
10 librerias, 4 meses en 7 librerias, 6 meses en 16 librerias y 8 mese en 9 librerias.
Se pregunta:
a) ¿Cual es la poblacion en estudio y su tamaño?
La poblacion: todos las librerias de la ciudad de lima
Tamaño:indefinido

b) ¿Cuál es la muestra y el tamaño de la muestra?


Muestra: librerias de la ciudad de lima
Tamaño de la muestra: 50

c) ¿Cuál es la unidad de analisis?


Un mes

d) ¿Cuál es la variable estadistica de interes?


Variable cuantitativa discreta

e) Elaborar la tabla estadistica respictiva, con los datos.

tiempo Numeros de
librerias
3 meses 3
4 meses 7
5 meses 10
6 meses 16
8 meses 9
10 meses 5

PARTE E. TIPO DE VARIABLES O DE OBSERVACIONES.- dadas las


siguientes propuestas, determinar a que tipologia y sub-tipo de variable estadistica
o de observacion pertenecen las siguientes propociones:

a) Presupuesto institucional 2018 de la UNSCH.(V.C.C)


b) Escuelas profesionales de la UNI.(V.C.D)
c) Numero de libros de estadistica de la Biblioteca Especializada de la
FIMGC-UNSCH.(V.C.D)
d) Total de capital social de la Empresa Minera NEWMAN.(V.C.C)
e) Tipologia de huacos retratos de la cultura chimu.(V.C.N)
f) Ordenes religiosas de la iglesia catolica.(V.C.N.)
g) La temperatura promedio diario de Cajamarca el 25 noviembre
2017.(V.C.C)
h) Grados de cultura de una persona.(V.C.D.)
i) Modelos de autos coreanos del sur 2018.(V.C.D)
j) Numero de facultad de la UNSCH.(V.C.D)
k) Registro de pesos de alumnos( as) de ingenieria de minas de series 100 a
500.(V.C.C)
l) Razas de perros en la ciudad de Ayacucho.(V.C.N.)
m) Karina tiene ojos verdes.(V.C.N.)
n) El numero de bacterias desarrolladas en un medio de cultivo.(V.C.D.)
o) El numero de acidentes de transito en la via los libertadores.(V.C.D)
p) El contenido de colesterol en la sangre.(V.C.N.)
q) Jerarquia militar del ejercito del Peru.(V.C.O.)
r) Clasificacion de centros Minero, según tamaño.(V.C.O.)
s) Sexo de nacidos en el Hospital Regional de Ayacucho.(V.C.N.)
t) Sistema digital basado en ceros y unos.(V.C.D.)

PARTE F. ORGANIZACIÓN DE DATOS. Una compañía publica de


servicios condujo una encuesta usando una muestra para determinar las
actitudes de los clientes hacia la compañía y para estudiar los factores que
afectanban esas actitudes. Las respuestas a un cuestionario de opiniones
sobre el servicio de la compañía fueron los que se muestran en la siguiente
tabla cruzada.
Ubicación del cliente
Opinion Centro de la ciudad Fuera de la ciudad
satisfecho 864 448
insatisfecho 371 252

F-1) ¿existe alguna evidencia de relacion estadistica entre la opinion sobre los
servicios y la ubicaion del cliente? Explique que implicaciones podrian tener los
efectos del azar sobre su respuesta.
Aparententemente vemos que los clientes en la mayoria son satisfecho dentro de
la ciudad, habria que realizar un prueba de correlecion para no fallar en la
respuesta.

F-2) al agregar una tercera variable: tipo de cliente , se construyo una nueva tabla
cruzada de tres variables. Convierta la tabla en tal forma que puedan estudiarse
facilmente las relaciones entre la variable independiente y la variable dependiente.

Ubicación del cliente


opinion Centro de Fuera de la Centro de Fuera de la
ciudad ciudad ciudad ciudad
residencial residencial comercial comercial
satisfecho 414 344 450 104 1312
insatifescho 286 232 85 20 623
700 576 535 124 1935

Cuando se agrega la nueva variable ¿existen nuevas indicaciones sobre los


factores que afectan la actitud del cliente?explique.

Es obvio que la zona residencial tiene una gran cantidad de insatisfechos,


dándose a entender que este déficit podría deberse a la calidad de los servicios
brindados por la empresa. Entonces la zona comercial; sólo requiere de cantidad
de servicios, cuanto menos la mayoría de casos, y no da calidad, como se puede
ver en la tabla. Pues, los clientes de la zona comercial no presentan un gran
número de insatisfacciones.

F-3) ¿es posible que los efectos del azar afecten su conclusion basada en la
introduccion de la tercera variable? Explique cual es a este respecto, el valor de
conocer el tamaño de la base de cada porcentaje de la tabla.

Sin duda, la parcialización propia a cada individuo, haría posible que por suerte
cometamos errores de distorsión; mas no errores de cálculo. Por lo tanto la
conclusión matemática (Estadística) será correcta. Tomando como punto de
partida los porcentajes, podríamos percatarnos de aspectos de poca importancia,
en la segunda tabla, pues observaríamos el desbalance existente entre tipos del
cliente y nivel de satisfacción.

Vous aimerez peut-être aussi