Académique Documents
Professionnel Documents
Culture Documents
CURSO DE TITULACION
ESCUELA PROFESIONAL DE INGENIERIA QUIMICA
MODULO II
Grafico de control R.
8
LCS=6.46
6
Rango, R
4
LC= 2.83
2
0 LCI=0.00
0 5 10 15 20 25
N de muestra
INTRODUCCIN
El presente curso responde a la necesidad de superar el nivel de anlisis y uso adecuado de la
informacin en la toma de decisiones empresariales.
Este gran problema se hace continuo por la falta capacitacin y formacin constante en el
rea y adems por no existir un sistema estadstico de informacin gerencial que facilite el anlisis y
uso de la informacin.
Los mtodos estadsticos son herramientas eficaces para mejorar el proceso de produccin, y
reducir sus defectos. Sin embargo, se debe tener en cuenta que las herramientas estadsticas son
precisamente herramientas: no servirn si se usan inadecuadamente.
En gran medida, la abundante informacin que se dispone sobre los diseos de productos,
procesos y el control de calidad en las empresas, no es usada para tomar decisiones y efectuar
ajustes correctivos; de otro lado, existe escasa disposicin de instrumentos para detectar las
necesidades de control de un proceso y las decisiones de la poblacin acerca de la buena utilizacin
de las herramientas de estadsticas.
En los procesos industriales, el anlisis de datos por lo regular entraa el empleo de tcnicas
estadsticas para organizar y reducir masas de datos a trminos descriptivos cmodos, y extraer
inferencias de ellos. El anlisis estadstico genera informacin precisa y definida respecto a las
caractersticas de los datos, en una forma que pueda ser comunicada con facilidad de un investigador
a otro.
2
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
OBJETIVOS
resultados de investigaciones.
3
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
CAPITULO I
CONCEPTOS IMPORTANTES
ESTADSTICA.
Es la Ciencia que nos proporciona un conjunto mtodos cientficos para recolectar, organizar, resumir y
analizar datos, para obtener conclusiones vlidas para la toma de decisiones razonables basadas con tal
anlisis. La estadstica se divide en:
ESTADSTICA DESCRIPTIVA.
La estadstica descriptiva, es la estadstica que slo se ocupa de describir y analizar un grupo de datos,
sin sacar conclusiones sobre un grupo mayor.
ESTADSTICA INFERENCIAL.
La estadstica inferencial, es un conjunto de procedimientos que nos permiten efectuar generalizaciones
de la muestra a la poblacin. Se utiliza para probar hiptesis y estimar parmetros, se basa en el concepto
de distribucin muestral.
POBLACIN.
Es el conjunto de unidades de observacin o elementos de la misma especie que se pretende estudiar en
una investigacin cientfica y de la cual se obtiene una muestra.
PARMETRO.
Es una medida de resumen que nos describe alguna caracterstica de la poblacin. Para calcular dicho
valor es necesario utilizar todo los valores de la poblacin completa.
Algunos parmetros conocidos y que usaremos en este curso son:
La media poblacional denotado por
La varianza poblacional denotado por 2
La proporcin poblacional denotado por P
El total poblacional denotado por X
El coeficiente de correlacin poblacional denotado por
MUESTRA.
Es un subconjunto de la poblacin sobre quienes se va estudiar, la cual debe haberse elegido al azar
(aleatorio) y ser representativa de la poblacin a la cual pertenece, esto quiere decir sin sesgos. En
general la muestra es toda parte representativa y adecuada de la poblacin. A partir del anlisis de la
4
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
muestra obtenida correctamente y al azar , se puede hallar conclusiones que sean extrapolables a la
poblacin de origen. Para elegir la muestra debe apelarse a un determinado mtodo de muestreo.
ESTADSTICO.
Es una medida de resumen que nos describe algunas caractersticas de inters y cuyo valor es calculado
usando slo los valores de los elementos o unidades de una muestra.
Algunos estadsticos conocidos y mas usados son:
La media muestral denotado por X
La varianza muestral denotado por S2
La proporcin muestral denotado por p
El total muestral denotado por x
El coeficiente de correlacin muestral denotado por r
VARIABLES.
Es una caracterstica o propiedad determinada de las unidades de anlisis, sea medible o no. Esta
propiedad hace que las unidades de anlisis de un grupo pueden diferir de las de otro grupo en la muestra
o poblacin de estudio.
CLASIFICACIN DE VARIABLES.
1.- Por Su Naturaleza. Se dividen.
Variable Cuantitativa: Es la que se puede medir. Habitualmente es llamada variable numrica o
mtrica, estas se clasifican en:
Variables Cuantitativas Discretas: Tienen un recorrido finito o a lo mas numerable.
Ejemplos: Nmero de latas de conserva que ingresan A una autoclave, Nmero de alumnos
matriculados en el Diplomado de Supervisin y Control, Nmero de plantas Agroindustriales
del departamento, Nmero de dientes con caries, Nmero de hijos por familia. etc.
5
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Variable Interviniente: Son aquellas que coparticipan con la variable independiente condicionando a
la variable dependiente.
Ejemplo: Material de trabajo, medios de publicidad, etc.
ESCALAS DE MEDICION
Variables categricas nominales: Son variables cualitativas que no permiten establecer un orden.
Ejemplo: raza ( negra, blanca, trigueo, etc.), grupos sanguneos (A,B,AB,O). Tambin son
excluyentes entre si, o sea que cada individuo pertenece a una u otra categora pero no a las dos al
mismo tiempo.
Variables categricas ordinales: Estas si permiten establecer un orden determinado, por Ejemplo:
grado de instruccin de un paciente (inicial, primaria, secundaria, superior), nivel socioeconmico
(bajo, medio, alto). etc. Tambin son excluyentes entre si.
Escala Intervlica. Es una escala ordinal, que se usa en mediciones de variables continuas que
adems de tener un orden tienen mantienen una equidistancia entre s y para lo cual pueden iniciar
con un cero relativo o arbitrario y mantener un intervalo de separacin.
Ejemplo 1.- Temperatura, Presin de vapor, Brix, Acidez, Grado Alcholico, Las calificaciones de un test
o de un examen de conocimientos. Estas tienen un cero elegido arbitrariamente, por ejemplo si un
alumno obtuvo un calificativo de cero en un examen de matemticas I, esto significa que no sabe
nada de la materia pues con otra prueba ms fcil podra tener otra calificacin.
Ejemplo 2.- Si tres alumnos A, B,C han obtenido los puntajes 2, 4, 16 respectivamente, no solo se
verifica las relaciones 2 y 2<4<16, sino que 16-4 = 6 (4-2) donde se puede inferir que C y B es igual a
seis veces la diferencia entre los puntajes de B y A.
Escala de Razn o Cociente. la escala de razn es una escala de intervalo en donde adems
podemos comprobar cuantas veces un valor de la escala es mayor o menor que otro valor de la
escala. la escala de razn tiene cero absoluto
Ejemplo 1: Peso, talla, nmero de alumnos; en las que el cero representa la nulidad o ausencia de
lo que se estudia. Se dice que un peso de 50 libras es el doble que uno de 25 libras, o que uno de
100 libras es 4 veces mayor que uno de 25 libras.
6
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Despus de la recoleccin de los datos, es necesario resumirlos y presentarlos de tal forma en forma
tal, que faciliten la comprensin, anlisis, utilizacin y aplicaciones de los mismos. Hay dos formas de
presentar ordenadamente los datos estadsticos.
1) En forma tabular, como son los cuadros y tablas estadsticas.
2) Mediante grficos y diagramas.
Tablas Estadsticas. Las tablas estadsticas presentan ordenadamente los datos estadsticos en filas
y columnas, clasificados y agrupados de acuerdo a un criterio especfico. En las tablas
metodolgicamente, conviene distinguir las " tablas de frecuencia o de distribucin" y los "cuadros
estadsticos o de anlisis".
Frecuencia Absoluta (fi).- Es el nmero de datos observados en cada categora o modalidad. La Suma
de todas las frecuencias absolutas es igual al total de n datos observados.
7
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
fi 1
i n
k
cien. Esto es, P 100
i 1
i
A D A E D A E B E B
B A B B B E A E B A
C C B A E B E A D B
B B D E A E B B A A
D E B E B A A B B E
A D A B D B B B B B
C A B D B B B A A E
B B B A A A E B E B
8
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Frecuencia Frecuencia
CAUSA DE FALLO Absoluta Relativa Porcentaje
Color (B) 37 0.4625 46,25
Viscosidad (A) 21 0.2625 26,25
Contaminacin (E) 14 0.1750 17,50
Hermeticidad (D) 5 0.625 6,25
Peso por galn(C) 3 0.375 3,75
Total 80 100,00
Ejemplo 2 : En una entrevista a una muestra de 20 Ingenieros afiliados al CIP, en la que respondieron
pertenecer a los siguientes captulos siendo los resultados siguientes: C ( Ing. Civil) , A (Ing. Agrcola) ,
M( Ing. Mecnica), obteniendo los siguiente resultados: A, C,C, A, M, C,C, A, A,C, A, C, C,M, A, C, M, A, C,
A
9
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
GRAFICO DE BARRAS
GRAFICO N 1: DISTRIBUCIN DE INGENIEROS AFILIADOS AL CIP SEGUN CAPITULO
0.5 0.45
0.40
0.4
0.3
0.15
0.2
0.1
0
Ing. Civil Ing. Agricola Ing. Mecnica
Ing. Mecnica
15%
Ing. Civil
45%
Ing. Agricola
40%
Ejemplo 3: La nacionalidad de los ponentes del IX Congreso Nacional de Ingeniera Qumica, realizado
en Agosto del 2003, en la Universidad Nacional Pedro Ruiz Gallo fueron los siguientes:
X1 = C X2 = BX3 = P X4 = E X5 = P
X6 = P X7 = V X 8 = C X9 = B X10 = P
X11 = PX12 = C X13 = E X14 = P X15 = B
X16 = P X17 = C X 18 = V X19 = P X20 = V
B= Bolivia C= Colombia E= Ecuatoriano P= PeruanoV= Venezolano
10
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
C=5 n = 20 1.00
TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS DE VARIABLES CUANTITATIVAS
Para construir una tabla de frecuencias de una variable discreta, tambin se puede construir con intervalos
siempre y cuando el rango de la variable sea muy amplio y se construyen los intervalos tan igual que para
la variable continua que se detalla en la siguiente parte con la nica diferencia de que se trabaja con los
intervalos cerrados.
Ejemplo: En una poblacin formada por 100 lotes de 50 artculos cada uno, se consider
la variable cuantitativa discreta X= Nmero de artculos defectuosos en cada lote. Los
resultados fueron:
1 5 4 2 3 4 5 3 5 4 2 4 5 6 4 5 2 5 3 2
4 6 3 4 5 1 6 3 2 5 4 3 6 3 5 7 2 5 4 2
7 4 6 5 2 8 3 3 6 4 2 4 3 4 8 1 5 3 7 3
7 2 4 1 3 5 3 8 4 6 5 4 5 4 5 4 5 2 6 3
4 3 5 2 3 4 3 1 4 5 4 4 7 4 6 2 6 2 4 5
11
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
6 10 92 0.10 10 0.92
7 5 97 0.05 5 0.97
8 3 100 0.03 3 1.00
Total 100 1.00 100
Grfico N3: GRFICO DE BASTONES DE LA DISTRIBUCIN DE 100 LOTES DE ACUERDO AL
NUMERO DE ARTICULOS DEFECTUOSOS.
fi N Familias h
26
24
22
20
18
16 - -
14 - -
12 - -
10 - -
8- -
6- -
4- -
2- -
0 1 2 3 4 5 6 7 8 X : Artculos Defectuoso
2) VARIABLE CUANTITATIVA CONTINUA.
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
La distribucin de frecuencia por intervalos o clases se usan cuando la variable estadstica es continua o
cuando el nmero de valores distintos de una variable discreta es muy grande.
Para la distribucin de frecuencias por intervalo se recomienda elegir no ms de 20 intervalos ni menos
de 5, ya que muchos intervalos pueden implicar innecesariamente los clculos de las medidas
descriptivas, y pocos intervalos podran omitir caractersticas importantes de los datos. En este curso se
eligen intervalos de igual amplitud (A); pero en la realidad no siempre se trabaja con intervalos de igual
amplitud ya que muchas veces las instituciones tienen estndares de trabajo como por ejemplo en salud
y otras instituciones.
Para construir la distribucin de frecuencias, se debe tener en cuenta los siguientes pasos:
1.- Determinar el Rango ( R ) de variacin de los datos que se define por: R= Xmax - Xmin
Donde : Xmax= Es el dato mayor; Xmin= = Es el dato menor
2.- Determinar el nmero de intervalos ( K ); un valor aproximado del nmero de intervalos, K, nos
proporciona la Regla de Sturges, donde: K= 1+ 3.3 Log(n) ; n 10 : n es el nmero de datos
Redondeando al entero inmediato superior.
Por ejemplo si se tiene n = 45 datos sin decimales, entonces: K=1+3.3Log(45)=6.4556. luego, K podr
elegirse como 6,7,8 o cualquier nmero entero; tambin puede usarse K= 2.54 4 n
3.- Determinar la Amplitud ( A ) del intervalo se obtiene, dividiendo el Rango entre el nmero de
R
intervalos esto es: A =
K
R
S la divisin de A= no es exacta en el nmero de decimales de los datos, entonces el valor de A se
K
aproxima por exceso de manera que se cubra todo el rango, esto es: KA R.
Cada intervalo o clase Ii, lo tomamos cerrado por la izquierda y abierto por la derecha esto es: I i=[Li,Ui[,
siendo Li el lmite o extremo inferior y U i el lmite o extremo superior del intervalo. El ltimo intervalo se
tomar como extremos cerrados, esto es, Ik= [Ik, Uk
Para construir la distribucin de frecuencia de intervalos hay varios procedimientos.
De manera que KA R; Los intervalos se forman de la siguiente manera:
12
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
I1 = [Xmin, Xmin + A[
I2 = [Xmin, Xmin + 2A[
I3 = [Xmin, Xmin + 3A[
.
Ik = [Xmin, Xmin + KA]
Marca de Clase.- Es el punto medio del intervalo de clase. Se obtiene sumando los lmites inferior y
superior de cada clase y dividindolo entre dos. As la marca de clase del intervalo 50-54 ser (50 + 54)/2
= 52. La marca es, en definitiva, el valor que representa a la informacin contenida en el intervalo de clase.
Ejemplo. Los sueldos mensuales (en dlares) de 60 empleados de la Empresa CAMPOSOL Trujillo en el
ao 2004 fueron los siguientes
440 560 335 587 613 400 424 466 565 393 574 480
453 650 407 376 470 560 320 500 528 526 500 625
570 475 618 537 409 600 550 432 591 428 462 507
440 340 558 460 560 607 382 669 512 492 380 645
450 530 501 471 660 470 364 634 580 450 518 382
Construir una tabla de distribucin de frecuencias.
1.-Rango: R= Xmax - Xmin = 669 - 320 = 349
2.- Nmero de Intervalos: K = 1+ 3.3 Log(60) = 6.9; K = 7 intervalos
669 320 349
3.- Amplitud. A = 49.9 50
7 7
13
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Interpretacin:
f2 :8 ; 8 empleados de la empresa CAMPOSOL de Trujillo tienen sueldo mayor o igual que 370 pero
menor que 420 dlares.
F3 : 35 ; 35 empleados de la empresa CAMPOSOL de Trujillo tienen sueldos menores que 520
dlares.
h4 % : 20%; El 20% de los empleados de la Empresa CAMPOSOL de Trujillo tienen sueldo mayor o igual
que 470 pero menor que 520 dlares.
H5% : 0.75; El 75% de los empleados de la Empresa CAMPOSOL de Trujillo tienen sueldos menores
que 570 dlares.
12 fi
11
10
9
8
7
6
5
4
3
2
1
14
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
b) Si la variable est agrupada en intervalo de clase, el polgono de frecuencia se obtiene uniendo los
puntos medios de las bases superiores de cada rectngulo.
15
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Frecuencia Freciencia
Frecuencia. Absoluta. Absoluta
Absoluta Acumulada Acumulada
fi Menor Fi Mayor Fi
320- 370 4 4 60
370- 420 8 12 56
420- 470 11 23 48
470- 520 12 35 37
520- 570 10 45 25
570 620 9 54 15
620- 670 6 60 6
Total Total
60 f
55
i
50
Ojiva Menor f
45 60 Ojiva Mayor
40 55 i
50
35 45
30 40
25 35
20 30
15 25
10 20
5 15
10
320 370 420 470 520 570 620 670 5
Dlares
Ejercicio 320 370 420 470 520 570 620 670
2.1 Durante una semana, se ha medido diariamente el contenido de humedad correspondiente a 24
Dlares
paquetes de un determinado producto alimenticio, tomados al azar a la salida de una lnea de
envasado. Los resultados obtenidos son:
Lunes 8.20 8.05 8.53 8.48 8.15 8.79 Jueves 8.97 9.21 8.86 8.76 9.55 9.38
8.36 8.76 8.64 8.34 8.15 8.91 9.02 9.53 8.75 9.21 9.50 9.58
8.37 8.51 8.83 8.51 8.68 8.32 9.61 9.28 9.64 8.76 9.48 9.09
8.52 8.18 8.35 8.08 8.79 8.49 9.15 9.28 9.05 9.40 9.58 9.46
Martes 8.61 9.30 8.59 8.32 9.08 8.43 Viernes 8.46 8.17 8.97 8.64 8.40 8.17
9.14 8.58 8.66 8.33 9.13 8.66 8.00 8.60 8.20 8.81 8.60 8.11
8.52 8.81 8.70 8.41 8.69 9.17 8.32 8.48 8.33 8.73 8.47 8.05
9.20 8.68 9.08 9.07 8.46 8.56 8.91 8.65 8.26 8.73 8.10 8.89
Mircol 9.43 9.28 9.59 8.86 9.19 9.22
8.85 9.14 9.15 9.28 9.12 8.85
8.66 9.41 8.75 8.50 9.20 8.56
8.89 9.34 9.18 9.19 8.80 9.46
Elaborar una tabla de frecuencias, histograma de frecuencias, polgonos de frecuencias y ojivas menor y
mayor. Interpretar: f2 , F3, h 4 %, H5 %.
16
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
CAPITULO II
MEDIDAS DE POSICION.
x1 x 2 x 3 ... x n
( X) = =
n
Nmero de valores
n
X =
xi
i 1
n
donde n es el tamao de la muestra o nmero de elementos del conjunto de observaciones.
Ejemplo. 1: Encuentre la media aritmtica del peso (g) de 5 mangos seleccionados al azar para su
control del peso que a continuacin se presentan: 250, 300, 350 ,250 , 280.
Solucin: Sustituyendo las observaciones en la frmula se tiene:
n
X =
xi =
i 1
250 300 350 250 280
5
n
Interpretacin: El peso promedio de los 5 magos es de 286 gramos .
Ejemplo. 2: Encuentre la media aritmtica de las edades de 5 estudiantes del Diplomado en Supervisin
en la Industria Alimentaria que a continuacin se detalla: 20, 23, 25 ,24 , 26.
Solucin: Sustituyendo las observaciones en la frmula se tiene:
n
X =
xi =
i 1
20 23 25 24 26
= 118/5 = 23.6
5
n
17
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
X =
xi =
i 1
63 89 ... 63 60
=
2682
59.6
45 45
n
Interpretacin: El ingreso promedio de los 45 obreros de la Empresa Pirmide encuestados es de $ 59.6
b .- Media Aritmtica de datos Tabulados o Agrupados. Para calcular la media aritmtica para datos
tabulados se debe tener en cuenta el tipo de dato cuantitativo que puede ser discreto o continuo.
Xi * fi
N de fi
Artc.Defec
Xi
1 5 5
2 14 28
3 18 54
4 25 100
5 20 100
6 10 60
7 5 35
8 3 24
Total 100 406
18
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo: Calcular la media aritmtica de los sueldos de los empleados de la Empresa CAMPOSOL de
Trujillo ( datos tabulados )
k 6
Y =
f i yi
= fi yi = 30050 / 60 = 500.83
i 1 i 1
n 60
II.- MODA ( MO ) .- Es el valor que con mayor frecuencia se presenta o se repite en un conjunto de
datos. La moda no siempre existe y no siempre es nica.
Para calcular la moda se tiene en cuenta dos casos:
19
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
de Industrias Alimentarias:
68, 75, 74, 70, 82, 75, 72, 75, 81, 83, 75, 69, 63, 67, 75
0, 1, 2, 3, 4, 5, 1, 2, 3, 3, 4, 2, 3, 2
b) Para Datos Agrupados. Para calcular la moda en datos agrupados se calcula con la siguiente
frmula
f j 1
M0= Lj+ A
f j 1 f j 1
Mo
Calculo de la Moda:
f j 1 10 10
M0= Lj+ A = 470 + 50 = 470 + 50 = 494
f j 1 f j 1 11 10 21
Mo = 494
Intervalos Fi
0, 1 3
1, 2 10
2, 3 17
3 4 8
4, 5 5
Total 43
21
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo: Supongamos que el nmero de casos de cierta molestia en los meses de Julio de
los ltimos 7 aos fueron: 52, 41 , 37 , 82, 24, 63, 68 (n=7).
Solucin:
Ordenando estos valores de acuerdo a su magnitud se:
1ero 2do. 3ero 4to 5to 6to 7mo
24 , 37 , 41 52 , 63 , 68, 82 .
50 % 50 %
mediana
Como n = 7 entonces.
El valor que ocupa la mediana es : ( n + 1)/2 = ( 7 + 1 )/2 = 4to. lugar; luego la mediana es el
valor que ocupa el 4to dato ordenado que divide a la serie en 2 grupos de 3 datos cada uno.
siendo este: Me = 52
Interpretacin: El 50% de los casos de molestia durante los ltimos 7 aos en el mes de
julio son menores que 52 casos y el 50% restante de los casos de molestia son mayores que
52 casos.
24 , 41 , 63 , 24 , 68 , 82, 37
Ordenando estos valores en orden creciente tenemos.
1er 2do 3ero 4to 5to 6to
24 , 37, 41 , 63 , 68, 82
n n
valores ordenados que ocupan las posiciones y 1 , esto es:
2 2
n n
= 6/2 = 3ero y 1 = ( 6/2 + 1) = 4to.
2 2
La mediana en este caso es el valor entre 41 y 63 , el cual es
X n / 2 X (n / 2 1) 41 63
Me = 52
2 2
Interpretacin: El 50% de las observaciones muestrales son menores que 52 y el 50%
restantes son mayores que 52.
B) Mediana de datos tabulados. Para calcular la mediana para datos agrupados se calcula
con la siguiente formula.
22
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
n
2 F j 1
Me = Lj + A
fj
n = nmero total de datos.
Fj =Es una Fi inmediata superior a n/2
Fj-1 = Es una Fi inmediata inferior a n/2
Li = Extremo inferior al intervalo mediano ( IME)
IME= Es el intervalo que corresponde a Fj.
A= amplitud del intervalo mediano.
Ejemplo:
CUADRO N 9: DISTRIBUCION DE 60 EMPLEDOS DE LA EMPRESA CAMPOSOL DE TRUJILLO
SEGN INGRESO (EN DOLARES) EN EL AO DE 2003
yi fi Fi
J=1 320 - 370 345 4 4
J=2 370 - 420 395 8 12
J=3 420 - 470 445 11 23 Fj-1
J=4 470 - 520 495 12 fj 35 Fj
J=5 520 - 570 545 10 45 Fj+1
J=6 570 - 620 595 9 54
J=7 620 - 670 645 6 60
Total 60 Me
n 60
2 F j 1 2 23 7
Me = Lj + A = 470 + 50 = 470 + 50 = 470 + 29.17
fj 12 12
Me = 499.17
1.- Si la distribucin de frecuencias es simtrica, entonces, la media, la mediana y la moda tienen el mismo
valor, esto es X = Me = Mo ( Figura N 01).
2.- Si la distribucin es asimtrica de cola a la derecha, entonces, la moda es menor que la mediana y esta
a su vez es menor que la media ( Figura N02); esto es
Mo Me X
23
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
X = Me = Mo Mo Me X X MeMo
Cuartil ( Qi ).- Son medidas de posicin que divide en cuatro partes iguales a un conjunto de
observaciones o datos ordenados, o una distribucin de frecuencias. Se denota con la letra Q.
La primera cuarta parte o el 25% de una distribucin, recibe el nombre de primer cuartil (Q1).
La segunda cuarta parte o el 50% de una distribucin, recibe el nombre de segundo cuartil (Q2).
La tercera cuarta parte o el 75% de una distribucin, recibe el nombre de tercel cuartil (Q3).
PERCENTILES.
Los percentiles se encargan de dividir a una distribucin de frecuencias en 100 partes iguales y cada
punto determina el1% del total de datos. Su notacin es P.
1% 2% 3% 4% 5% . . . .... 99%
P1 P2 P3 P4 P5 ............ P99
Para calcular los percentiles se utiliza la siguiente frmula.
n(k / 100) F j 1
Pk = Lj + A
fi
OTRAS MEDIAS.
24
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
n
n
X H= 1
x
i 1 i
CAPITULO III
MEDIDADAS DE VARIABILIDAD O DISPERSION.
Las medidas de variabilidad o dispersin, son aquellas que miden el grado de dispersin o concentracin
de los valores de datos, alrededor de alguna de las medidas de tendencia central.
Entre las medidas de dispersin ms utilizadas se tiene:
25
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejercicio. Observado las edades en aos de un grupo de 4 nios atendidos en el Hospital Beln de
Lambayeque: 1, 3, 5, 7. Calcular la Varianza.
Solucin:
4
X =
xi = 1 3 5 7 =4
i 1 4
4
4
S2 = i
X X 2 2 2 2 2
= (1 4) (3 4) (5 4) (7 4) = S2= 5
i 1 4
4
26
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
k
2
S = yi y 2 f i
i 1
n
2 2 2 445458.33
S2 = (345 500.83) (4) (395 500.83) (8) .... (645 500.83) (6) = =
60 60
7424.31
B) Datos Agrupados
y i y 2 f i
k k
S= S2 = V(X) = S =
2 y 2i f i
i 1
n
i 1
n
y 2
S= 7427.64 = 86.16
27
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
0.12%
Interpretacin: El coeficiente de variacin del termmetro A es 0.0022 ( 0.22%), mientras que para el
termmetro B este coeficiente es 0.0012 ( 0.12%), por lo tanto el termmetro B es ms consistente.
3(Y Me)
Asimetria: As =
S
Si AS = 0: La distribucin es simtrica ( Fig. A)
Si As > 0 : La distribucin es Asimtrica Positiva ( Fig. B)
Si As < 0 : La distribucin es Asimtrica Negativa ( FIG. C)
X = Me = Mo Mo Me X X MeMo
FIG: A FIG: B FIG. C
28
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Q3 Q1
K=
2( P90 P10 )
Si K tiende a 0.25. la distribucin es normal. ( Mesocurtica)
Si K tiende a 0.5, la distribucin es (leptocurtica)
Si K tiende a 0 la distribucin es (platicurtica).
Este tipo de grfico es una representacin simple de la informacin obtenida que nos permite conocer:
La localizacin del centro de los datos( con la mediana).
La dispersin. ( con el rango intercuartil P75- P25).
La Simetra ( Observando la posicin de la mediana)
La extensin de los extremos( Con los segmentos que parten de los lados laterales.
La existencia de los valores aberrantes ( datos outliers en el idioma ingles que puede ser
dato incorrecto introducido al computador, puede ser una observacin diferente de la poblacin de la
cual viene el resto de las observaciones etc.)
La caja se construye graficando un rectngulo cuyos lmites son los cuartiles inferior (percentil 25) y
superior ( percentil 75), marcando la mediana con una lnea horizontal. Desde la caja se dibujan los
bigotes cuyos extremos son los lmites inferior y superior. Por fuera de los lmites se dibujan los puntos que
representan a los valores aberrantes, fuera del contexto o outliers.
L Q1 Me= Q2 Q3 U
Donde:
Q1= P25, Q2=P50, Q3= P50, son los cuartiles o percentiles respectivamente. En el rectngulo se indica la
mediana, con un segmento vertical resaltado. De los datos que representan a los percentiles 25 y 75
parten, respectivamente, un segmento hasta el valor L=P25 1.5d, en donde d es el rango intercuartil y un
segmento hasta el valor U=P75+1.5d.
29
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
0 20
Ejercicio: Se obtuvieron los siguientes datos del nivel de glucosa en sangre medidos a 50 pacientes
2.6 2.5 1.3 2.4 2.0 3.0 2.4 2.3 2.6 3.0
3.2 4.4 3.6 4.3 3.7 4.3 3.7 5.0 3.8 4.4
3.7 5.0 3.8 4.4 4.4 4.5 5.0 6.2 6.3 6.2
7.0 8.0 9.5 7.9 9.0 10.2 11.1 8.7 12.5 15.0
14.9 10.0 10.2 17.5 6.0 8.8 12.5 12.5 14.0 6.3
30
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
CAPITULO III
INTRODUCCION
ESTIMACION DE PARAMETROS
Los Mtodos de Inferencia Estadstica consisten en seleccionar una muestra aleatoria de la Poblacin, de
manera que a partir de la informacin que se obtenga de la muestra.
1) Determinar el valor del parmetro desconocido q,
2) Decidir si q, alguna funcin de q, es igual a algn valor preconcebido q 0 de q
ESTIMACION PUNTUAL.
Un estimador puntual del parmetro q es pues la funcin de la muestra variable aleatoria) Q, mientras que
una estimacin puntual es el valor Numrico del estimador.
Ejemplo
Suponga que la variable aleatoria X tiene un distribucin normal con media desconocida . La media
muestral es un estimador puntual de la media poblacional desconocida .
31
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Estimado
Ejemplo.
El promedio de las longitudes de cierto artculo es de 12 0.2m ([1.2 - 0.2, 1.2+0.2]) o que el candidato
obtendr el 64 3%(0.64 0.003) de las preferencias del electorado
El intervalo de confianza cuando n30, se calcula de la siguiente manera :
X ( z1 / 2 ) n , X ( z1 / 2 ) n
32
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Tabla de valores de Z
Coeficiente de confianza (1-) Z/2
0.90 0.1 1.645
0.95 0.05 1.96
0.99 0.01 2.58
Ejemplo.
Una mquina de empaquetar bolsas de caf, esta calibrada para embalar bolsas cuyos pesos se
distribuyen normalmente con media 500g y desviacin estndar de 10g.
La maquina sufri un desperfecto y se desea calibrarla, para lo cual se desea saber el nuevo promedio
.Se toma una muestra aleatoria de 36 paquetes arrojando una media de 485g. Hallar un intervalo de
confianza de 95% de confianza para .
x 485g 10 g g 1 - 0.95
0.05 0.025
2
Luego P Z z /2 0.025
El valor de z/2 que deja a su derecha un rea que representa una probabilidad igual a 0.025 es de z/2
=1.96
Por lo tanto el intervalo de confianza para con coeficiente de confianza es de g=95% es
2.5%
33
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
10 10
I 485 - 1.96 , 485 1.96
36 36
I 481.73, 488.26
2 El intervalo de confianza cuando n<30, para una media se calcula de la siguiente manera
X t1 2 n , X t1 2 n
S
Ejemplo
A continuacin se dan los pesos (g) de un pdto lcteo instantneo:
42.7 42.78 42.76 43.39 41.60
n 15 x 42.88 0.01
El valor de s es :
1 15
s ( xi x ) 2 0.5406
14 i 1
El valor de t1-/2, corresponde al cuartil en la distribucin estndar con 15-1 grados de libertad para lo cual
P t1 / 2 t t1 / 2 1 0.99
s s
x t1 / 2 n , x t1 / 2 n 42.46 , 43.29
PRUEBA DE HIPOTESIS
Esta es otra parte de la estadstica inductiva o inferencial, llamada prueba de hiptesis,
significancia o procedimientos de toma de decisiones. La prueba de hiptesis, es otra manera de
abordar el problema de hacer una afirmacin acerca de un parmetro desconocido asociado con
una distribucin de probabilidades, basndose en una muestra aleatoria en lugar de hallar un
estimador para el parmetro a menudo es conveniente formular una hiptesis sobre el valor del
parmetro y luego usar la informacin de la muestra para confirmar o rechazar el valor de la
hiptesis con un nivel particular de confianza o seguridad.
34
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
El objetivo es brindar algunos mtodos que se usan para tomar decisiones sobre
poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa poblacin. Para
llegar a tomar decisiones estadsticas se debe partir de afirmaciones o conjeturas con respecto a
la poblacin en el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una
conjetura hecha sobre una poblacin o sobre sus parmetros deber ser sometida a
comprobacin experimental con el propsito de saber si los resultados de una muestra aleatoria
extrada de esa poblacin, contradicen o no tal conjetura
Hiptesis estadsticas
Es cualquier afirmacin o conjetura que se hace acerca de la distribucin de una o ms
poblaciones.
La afirmacin o conjetura puede referirse bien a la forma o tipo de distribucin de probabilidad de
la poblacin o bien al valor o valores de uno o ms parmetros de la distribucin de la poblacin.
En este caso las hiptesis estadsticas consiste en suponer que los parmetros que definen a la
Poblacin toman determinados valores numricos.
Ejemplos:
1. El promedio poblacional de la altura de los Peruanos es 1.6m. esto es:
1.60
2. La varianza poblacional de los salarios de los obreros de la Industria Textil es:
S/. (500)2 esto es:
2 = (500)2 = 250,000
3. La proporcin de unidades defectuosas de produccin por cierto proceso es menor o
igual a 8 por ciento, esto es:
P 0,08
Hiptesis alternativa ( H1 )
Es la suposicin contraria a la hiptesis nula, se representa por H 1 y se acepta en el caso que la
hiptesis nula sea rechazada.
Ejemplo: Si se asume que q 0 es un valor del parmetro desconocido q de una poblacin cuya
distribucin se supone conocida, entonces son hiptesis nulas y alternativas respectivamente las
siguientes afirmaciones:
1. H0: q =q0 y H1: q q 0
35
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
La hiptesis nula H0 es la primera hiptesis que se plantea y debe ser establecida de manera que
se especifique un valor q 0 del parmetro q en estudio. Por esta razn, algunos autores plantean
la hiptesis nula
H0 : q = q 0 an para los casos 2) y 3) del ejemplo anterior.
Tambin se puede definir como un ensayo de hiptesis o dcima de hiptesis, son procedimientos
que se usan para determinar, si es razonable o correcto, aceptar que el estadstico obtenido en la
muestra, puede provenir de la poblacin que tiene como parmetro, el formulado en H0.
La experiencia indica que al tomar una decisin se puede cometer dos tipos de errores:
36
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
H0 ES H0 ES FALSA
DECISIN VERDADERA
Rechazar Ho Error de tipo I Decisin correcta
Aceptar H0 Decisin Correcta Error tipo II
Error de tipo I
Es el error que se comete al rechazar una Hiptesis nula H0 cuando sta es verdadera.
La Probabilidad de cometer un error de Tipo I se denota por :
=P[error tipo I] = P[rechazar H0 cuando H0 es verdadera]
Error de tipo II
Es el error que se comete al aceptar una hiptesis nula H0 cuando en realidad es falsa.
La probabilidad de cometer un error tipo II se denota por entonces:
P[error tipo II]=P[aceptar H0 cuando H0 es falsa]
37
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Cuando la hiptesis Nula( Ho) se rechaza con =0.05, diremos que el resultado es Significativo.
Cuando la hiptesis Nula( Ho) se rechaza con =0.01, afirmaremos que el resultado es
Significativo.
X
Z=
n
Cuya distribucin es aproximadamente normal estndar N(0,1), segn sea la poblacin normal
o no.
En consecuencia dado el nivel de significancia , o la probabilidad de error de tipo I, o la
probabilidad de rechazar Ho : = 0 cuando se supone que esta es verdadera, se puede utilizar
la distribucin de
38
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
X
Z= ( ) para determinar una regin crtica.
n
Ejemplo N1.
Un determinado proceso de empaquetar un producto est controlado, si el peso medio del
producto empaquetado es de 400 gramos. Si en una muestra de 100 paquetes del producto se
ha encontrado que el peso medio es de 395 gramos, Se podra concluir que el proceso est
fuera de control a un nivel de significacin del 5%?. Suponga que el peso de los productos
empaquetados se distribuye normalmente con desviacin estndar de 20 gramos.
Solucin
X
3.-Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es Z=
n
4.- Regin Crtica: Para = 0.05; y una prueba bilateral con dos colas; en la tabla normal
N( 0,1) se encuentra el valor crtico
Z/2 =Z0.05/2 = Z0.025 = -1.96 Tambin es lo mismo:
Z1-/2 =Z1-0.05/2 = Z0.975 = 1.96
X 395 400
5
Z= = 20 = 2.5
n 100 2
39
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo N2
Una mquina para enlatar conservas de pescado ha sido regulada para que el contenido de
cada lata sea de 16 onzas. Usando = 0.05, dira Ud. que la mquina ha sido
adecuadamente regulada, si una muestra de 36 latas dio un peso medio de 16.05 onzas y una
desviacin tpica de 1.5 onzas?
Ejemplo N3
De la experiencia de muchos exmenes de admisin a la Universidad Nacional Pedro Ruz
Gallo, se obtiene una calificacin media de 64 puntos, con una desviacin estndar de 8
puntos. De una muestra de 81 estudiantes que rindieron el ltimo examen. Se obtuvo una
calificacin media de 68 puntos. Utilizando = 0.01, puede asegurarse que los estudiantes
han elevado su rendimiento?
Solucin
4. Regin Crtica: Para = 0.01 y una prueba unilateral con cola a la derecha , en la tabla
normal N( 0,1) se encuentra el valor crtico
Z =Z0.01 = 2.33
0.99
40
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
X 68 64
Z= n
= 8 = 4.4
81
Ejemplo N4.
El gerente de la Empresa empresa de transportes E&S desconfa de la afirmacin de que la
vida til promedio de ciertos neumticos es de almenos 28 000 millas. Para verificar ese
argumento, la empresa instala 40 de esos neumticos en sus camiones y obtiene un ciclo de
vida medio de 27463 millas con una desviacin estndar de 1348 millas. Qu puede concluir
el gerente de ese dato, si la probabilidad de un error I se fija en cuando ms 0.05?
Solucin:
1.- Formulacin de las Hiptesis
H0 : 28 000 millas
H1 : 28 000 millas
2. Nivel de significacin: = 0.05
4. Regin Crtica: Para = 0.05 y una prueba unilateral con cola a la izquierda , en la tabla
normal N( 0,1) se encuentra el valor crtico
Z =Z0.05 = -1.645
X 27463 28000
Z= = 1348 = -2,52
n 40
41
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo N5.
Una mquina llenadora de botellas de gaseosa; se supone que el volumen medio de gaseosa
en cada botella es de 32 onzas, con una desviacin estndar de 0.06 de onza. En una
comprobacin sistemtica para verificar que si la mquina funciona adecuadamente, se toman
aleatoriamente 36 botellas llenas y se advierte que contiene una media de 32.1 onzas. A un
nivel de significacin de 0.05, La mquina funciona adecuadamente ( o est bajo control)?
Solucin
0.95
-1.96 1.96
X
32.1 32
Z= n
= 0.06 = 10
36
42
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
6.- Decisin: Como Zc =10 > Zt =1,96, entonces rechazamos la H0 a un nivel de significancia
de 0.05 y afirmamos que la mquina no funciona adecuadamente, por lo tanto, necesita un
ajuste.
A) Poblacin no normal.
Si la poblacin no tiene distribucin normal, pero si el tamao de la muestra es grande ( n
X
30 ), se suele utilizar la estadstica Z=
n
Donde la desviacin estndar se estima puntualmente por S.
Ejemplo.
En la investigacin de varias denuncias respecto al aviso "Peso Neto 300gr"que aparece en
los frascos de caf molido" El Morenito", el comit de Defensa del Consumidor seleccion
una muestra de 36 frascos, la muestra arroj un peso neto medio de 298 g y una
desviacin estndar de 7.5 gr. Utilizando un nivel de significancia de 0.01, Qu
conclusin debe sacar el comit de Defensa acerca de la operacin de la compaa
envasadora de caf?
Solucin.
1.- Formulacin de las Hiptesis
H0: =300 gr
H1: 300 gr
2. Nivel de significacin: = 0.01
4. Regin Crtica: Para = 0.01 y una prueba unilateral con cola a la izquierda , en la
tabla normal N( 0,1) se encuentra el valor crtico
Z =Z0.05 = -2.33
=1% 0.99
-2.33
43
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
6.- Decisin: Como -1,60 -2.33; no se rechaza H0 ( se acepta H0), luego se puede
concluir que la compaa envasadora est cumpliendo con el peso neto enunciado.
B) Poblacin normal.
Sean X y S2 la media y la varianza de una muestra aleatoria de tamao n, seleccionada
de una poblacin con distribucin normal N ( ,2), donde y 2 son desconocidas.
X
Entonces, la estadstica. t = S , tiene distribucin t-Student con n-1 grados de libertad:
n
Donde: t0 = t(1-) (n-1)
Ejemplo 1.
Las cajas de un cereal producidas en una fbrica, deben tener un contenido de 16 onzas.
Un inspector tom una muestra que arroj los siguientes pesos en onzas:
15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8, 15.6.
Indicar si es razonable que el inspector, usando un nivel de significacin del 5%, ordene se
multe al fabricante.
Solucin.
3.- Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.
X
t= , tiene distribucin t-Student con 9 grados de libertad.
s n
4.- Regin Crtica: Para = 0.05 y una prueba de una cola a la izquierda, en la tabla
de probabilidades t-Student se encuentra t0= t() (n-1) = t(0.05)(9) = -1.833.
Observacin.
Si la cola estuviera hacia la derecha, entonces el valor de t se toma de la siguiente
manera: t(1-) (n-1) = t(0.95)(n-1)
-1.83
44
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
X 15.9 16
tc = S = 0.231 = -1.368
n 10
Ejemplo 2.
Se sabe que los ingresos quincenales de un gran nmero de individuos se distribuyen
normalmente con una media de S/ 152. En un estudio estadstico reciente una muestra aleatoria
de 9 individuos de esa poblacin ha dado los siguientes ingresos quincenales ( en soles):
158; 154; 152; 156; 151; 150; 153; 155; 157.
A nivel de significancia del 5% Ha cambiado el ingreso medio quincenal de tal poblacin?.
Solucin.
3.- Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.
X
t= , tiene distribucin t-Student con 8 grados de libertad.
s n
4.- Regin Crtica: Para = 0.05 y una prueba bilateral con dos colas, en la tabla de
probabilidades t-Student se encuentra t0 = t(1-/2) (n-1) = t(0.975,8) = 2.306.
Zona de aceptacin
X 154 152
t= S = 2.74 = 2.19
n 9
45
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
12
2
N(1, 2 - 2 ) . Luego, la estadstica.
n1 n2
X Y - ( 1 - 2)
Z=
12 / n1 22 / n 2
Ejemplo1: Dos grupos de trabajadores de una empresa Agroindustrial, han sido sometidos a
un entrenamiento por dos mtodos diferentes, que llamaremos A y B. Una vez terminada la
instruccin, para verificar la eficacia de los mtodos, se aplic un examen arrojando los
siguientes resultados:
Mtodo A Mtodo B
x = 73.4 y = 70.3
S1 = 8 S2 = 10
n1 = 50 n2 = 50
Utilizando un nivel de significancia de 0.05 puede asegurarse que las medias de ambos
mtodos no son iguales?
Solucin.
Como n1 30 y n2 30 entonces los datos se aproximan a una distribucin normal y por lo
tanto se puede aproximar a S1 1 y S2 2
1. - Formula de hiptesis.
H0: 1 = 2 , (1 -2= 0)
H1: 2
2.- Clculo del punto crtico"z0". Por ser una prueba de dos colas, con =0.05,
entonces:
P(Z z0 ) = 0.975
F(z0 ) = 0.975
z0 = 1.96
46
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
0.95
5.- Toma de decisin. Como 1.71 no es mayor que 1.96, no se rechaza H 0 ( se acepta
H0) luego se puede concluir que las medias de ambos mtodos son iguales.
Solucin.
1.- Formula de hiptesis.
H0: 1 = 2 , (1 -2= 0)
H1: 1 2 , ( 1 - 2 0 )
2.- Clculo del punto crtico"z0". Por ser una prueba de dos colas, con =0.01, pero
como es una prueba de dos colas se tiene /2=0.005 entonces:
P(Z z0 ) = 0.995
F(z0 ) = 0.995
z0 = -2.58
3.- Estadstica.
x y
Z= 12
2 =
2
n1 n2
0.99
47
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
12 12.2
Z= 0.9950
(3 / 100) (3.12 / 300)
6.- Toma de Decisin: Como el valor de -0.9950 no cae en la regin de rechazo; podemos
considerar que la diferencia hallada entre las medias muestrales no es significativa al
nivel de 0.01.
CAPITULO IV
ANALISIS DE REGRESION LINEAL Y CORRELACION
Y
Y
48
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Es una tcnica estadstica que analiza si los valores de una variable dependiente e independiente puede
predecirse mediante un modelo lineal.
Las variables implicadas en el modelo deben ser cuantitativas y continuas.
Para ajustar una lnea recta de Regresin, se considera la ecuacin de la recta:
Y = b0 + b1Xi; que tiene dos parmetros b0 y b1
Y Y = b0 + b1x i
b1
Unidad de X
b0
X
49
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Si los pares ( Xi , Yi ) se encuentran aproximadamente alineados, lo que indica que se puede ajustar una
lnea recta a los puntos; esto es, se puede hacer pasar una recta que est lo mas cerca de ellos. La
eleccin de tal recta puede hacerse por diversos mtodos, el ms simple es el que se realiza a mano
alzada. Este mtodo no es tan riguroso pues depende de la persona que lo ejecuta. Otro mtodo es el
que considera la recta que une los puntos ms extremos del grupo. Uno de los ms usados y que
describiremos a continuacin, es el mtodo de mnimos cuadrados.
Una tarea principal en el anlisis de regresin lineal, es estimar los parmetros b 0 y b1, cuyos valores
se determinan a partir de los datos bidimensionales. El mtodo de los mnimos cuadrados consiste en
hacer mnima la suma de los cuadrados de la diferencia entre los valores observados (y i), y los valores
estimados ( Y ) es decir:
SCD (Y
I Y ) 2 Sea mnima
El clculo de los estimadores de los coeficientes de regresin a partir de los datos muestrales, viene dado
por la siguiente expresin.
n XY ( Xi )( Yi )
b1
n( X i2 ) ( Xi ) 2
b0 Y b1 ( X )
Ejemplo de Aplicacin.
50
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Solucin.
a) Al trazar el diagrama de dispersin, se observa que existe una relacin lineal positiva entre el nmero
de artculos vendidos y el tiempo de publicidad semanal por radio.
b) Para determinar la recta de regresin por el mtodo de mnimos cuadrados a partir de los datos, es
decir para calcular b0 y b1 se requiere realizar los siguientes clculos que se tienen a continuacin.
180
N de Artculos vendidos
160
140
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90
Minutos de Publicidad
X Y xy x2 Y 2
51
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
n n 500 1100
xi2 28400 yi2 134660 , x
10
50 , y
10
110
i 1 i 1
Estimando el parmetro b1:
n XY ( Xi )( Yi )
10(61800) (500)(1100 )
b1 = = =2
10(28400) (500) 2
n( X i2 ) ( Xi ) 2
Estimando el parmetro b0 :
b0 = y b ( x ) = 110 - ( 2 )(50 ) = b0 = 10
y 9 = 10 + 2 ( 70 ) = 150 artculos
1.- Los siguientes datos corresponden al ingreso mensual ( X) y egreso mensual ( Y ) de 10 profesores
estatales.
x 450 630 500 750 750 600 650 800 1000 850
y 420 600 500 730 720 580 600 750 850 800
CORRELACIN LNEAL
52
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Es una parte de la Estadstica Descriptiva que tiene por objetivo investigar la relacin que hay entre dos o
ms variables estadsticas, determinar el sentido de relacin y cuantificar el grado de nivel de correlacin
entre las variables con respecto a sus coeficientes.
Coeficiente de correlacin
Es el valor numrico que da a conocer el grado de relacin que existe entre dos o ms variables. Se
n xy ( x )( y )
r
representa por la letra r.
n x ( x ) n y ( x)
2 2 2 2
Propiedades
1 r 1
a) Si r > 0 Correlacin Directa
b) Si r < 0 Se trata de una Correlacin Inverso Negativo.
c) Si r2 = 1 los datos forman una lnea recta.
d) Si r = +1 hay una correlacin perfecta (+)
e) Si r = -1 hay una correlacin perfecta (-)
f) Si r = 0 Los datos son incorrelacionados
Ejemplo: Calcular el coeficiente de correlacin con los datos del ejemplo anterior para lo cual se
requiere realizar los siguientes clculos que se tienen a continuacin.
X y xy X2 Y 2
53
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
(Y Y ) 2
R2 1
(Y Y ) 2
Error de Estimacin (Se).- Es una medida de la cantidad media en que las observaciones reales Y varan
en torno a la recta de regresin. Y (regresin de Y/X ) viene dada por :
Se = S Y/X =
(Y Y ) 2
n2
1.- Estimacin de Intervalo para el Valor Medio Y dado un valor de X. Se calcula de la siguiente
manera:
1 ( X i X )2
I:C: para y/x = Y tSy = Y t(1-/2)Se ; t con ( n-2)g.l.
n ( X i X )2
Donde Y es el estimador puntual hallado a partir de la ecuacin de regresin original y el valor de t se
basa en un nivel de confianza elegido con n-2 grados de libertad. Hay n-2 grados de libertad porque
tenemos que calcular dos valores b 0 y b1 a partir de los datos maestrales. Perderemos dos grados de
libertad. Se es el error de estimacin.
54
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
1 ( X i X )2
I:C: para y/x = Y tSy = Y t(1-/2)Se 1 ; t con ( n-2)g.l.
n ( X i X )2
REGRESIN MULTIPLE
En la regresin simple, se investiga la relacin entre las variables independiente y dependiente. A menudo,
la relacin entre dos variables permite a una persona predecir con precisin la variable dependiente a
partir del conocimiento de la variable independiente. Por desgracia, muchas de las situaciones de la vida
real no son tan simples. Por lo regular, se necesita ms de una variable independiente para pronosticar
con precisin la variable dependiente . Cuando se emplea ms de una variable independiente o de
prediccin, el problema se convierte en uno para el anlisis de regresin mltiple. Los conceptos bsicos
siguen siendo los mismos, slo se utiliza mas de una variable independiente para pronosticar la variable
dependiente.
La Regresin mltiple comprende el uso de ms de una variable independiente para pronosticar una
variable dependiente.
En el anlisis de regresin mltiple se utilizan X con subndices para representar a las variables
independientes ( X2,, X3, X4, . . . Xn. La variable dependiente se continua representando con Y. Teniendo la
siguiente ecuacin:
Y = bo + b2 X2 + b3 x3 + . . . + bn Xn Ecuacin de regresin mltiple
Ecuaciones normales cuando de tienen dos variables independientes y una variable dependiente.
Y = nb0 + b2 X 2 +b3 X 3
X 2 Y = b0 X 2 +b2 X 2
2 + b3 X 2 X 3
X 3 Y = b0 X 3 + b2 X 2 X 3 + b3 X 2
3
Ejemplo:
Jaimito observa el gasto en publicidad, precio y volumen de venta de galones de leche de 10 semanas
elegidas en forma aleatoria. Los datos obtenidos se presentan en la siguiente tabla.
55
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
8 12 1.40 10
9 17 1.00 15
10 20 1.10 21
a) Calcular la ecuacin de Regresin
b) Calcular e interpretar el Coeficiente de Regresin, determinacin, y error estandar
Solucin
Semana Y X2 X3 X2Y X3Y X2X3 Y2 X 22 X3
2
Interpretacin: El 93.2% de la varianza del volumen de ventas, estn influenciados por el precio por
galn de leche y los gastos de publicidad.
Error Estndar de Estimacin. Mide la cantidad estndar en que los valores reales (Y) difiere de los
valores estimados ( Y ). Es una medida de la cantidad media en que varan las observaciones reales
alrededor del plano de regresin y se calcula de la siguiente manera.
56
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Sy..x2 x3 = (Y Y ) 2
= Sy..x2 x3 =
15.901493
= 2.27 = 1.51
nk 10 3
Interpretacin. La cantidad tpica en que el valor real de volumen de leche vendido difiere de lo
pronosticado mediante la ecuacin de regresin mltiple es de 1.510 galones.
57
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
CAPITULO V
Diseos Experimentales
INTRODUCCIN
Los experimentos son conducidos por los investigadores en todas las reas de estudio tanto para
descubrir algo sobre un proceso particular como para comparar el efecto de varias condiciones sobre
algn fenmeno. Por ejemplo, un analista de mercados podra estar interesado en saber si es que el tipo
de envoltura es un factor importante como criterio de seleccin de los consumidores, o un pedagogo
podra tener la intuicin de que los colegios con un nmero pequeo de alumnos por aula favorece la
educacin de ellos. Lo intuitivamente razonable para dilucidar estas interrogantes puede ser tomar
medias por tipo de envoltura o cantidad de alumnos por aula, para luego compararlas. Esto sin embargo
nos conduce a muchas interrogantes adicionales, por citar: Qu nmero de consumidores o alumnos
debern encuestar? Cuantos diseos o que cantidades de alumnos por aula se van a comparar?,
cuantos y cuales factores se van a controlar?, qu tipo de muestreo debe ser utilizado para tomar
las encuestas?, qu otros factores (aparte del tipo de envoltura o nmero de alumnos por aula) puede
afectar tanto a la demanda del producto o el nivel educativo?, qu tipo de anlisis efectuar?. Qu
diferencias de medidas sern consideradas importantes?, etc.
DISEO DE UN EXPERIMENTO
El diseo de un experimento es, la secuencia completa de pasos tomados de antemano para asegurar
que los datos apropiados se obtendrn de modo que permitan un anlisis objetivo que conduzca a
deducciones vlidas con respecto al problema establecido. Tal definicin de diseo de un experimento
implica, por supuesto, que la persona que formule el diseo entienda claramente los objetivos de la
investigacin propuesta.
58
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
ERROR EXPERIMENTAL
El error experimental viene a constituir la variabilidad motivada por las diferencias que se producen
en los resultados de unidades experimentales tratadas en forma similar.
Las principales fuentes de error experimental son:
a. La variabilidad inherente al material experimental (unidades experimentales).
b. Falta de homogeneidad en la tcnica experimental.
c. Errores de experimentacin.
d. Errores de observacin y medicin.
e. Efectos combinados de todos los factores extraos que puedan influir sobre los resultados del
experimento.
TESTIGO
El testigo es el tratamiento de comparacin adicional, que no debe faltar en un experimento; por
ejemplo, si se usan cinco tratamientos con fertilizante, el testigo puede ser aquel tratamiento que no
incluye fertilizante. La eleccin del tratamiento testigo es de gran importancia en cualquier investigacin,
este se constituye como referencial del experimento y sirve para la comparacin de los tratamientos en
prueba.
UNIDAD EXPERIMENTAL
La unidad experimental, es el objeto o espacio al cual se aplica el tratamiento en donde se mide y
analiza la variable que se investiga. En los experimentos pecuarios la unidad experimental por lo general
esta conformada por un animal (cuy, cerdo, pato, etc.), en los experimentos forestales la unidad
experimental en la mayora de los casos esta conformada por un rbol y en la mayor parte de las pruebas
de campo agrcolas, la unidad experimental es una parcela de tierra en lugar de una planta individual; es
en este ltimo caso que con frecuencia se presenta lo que se llama efecto de borde.
ANALISIS DE LA VARIANZA
Es una tcnica estadstica que sirve para analizar la variacin total de los resultados experimentales
de un diseo en particular, descomponindolo en fuentes de variacin independientes atribuibles a cada
uno de los efectos en que se constituye el diseo experimental.
Est tcnica tiene como objetivo identificar la importancia de los diferentes factores tratamientos
en estudio y determinar como interactan entre s.
59
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ventajas:
Fcil de planear y analizar; adems es flexible en el empleo del nmero de tratamientos y repeticiones.
Finalmente, permite tener dentro del anlisis de varianza el mximo nmero de grados de libertad para la
suma de cuadrados del error.
Desventaja:
La principal desventaja que presenta este diseo est relacionado a la homogeneidad del material
experimental; el cual es difcil de encontrar en experimentos de campo, por lo que su uso se restringe con
mucha frecuencia a experimentos de laboratorio, all donde se pueda tener control de los efectos no
considerados en el estudio (ambiente, temperatura, luz, etc.)
Aleatorizacion.-En este diseo, la aleatorizacin de los tratamientos se realiza en forma irrestricta sobre
las unidades experimentales, as pues si tenemos 3 tratamientos T1, T2, T3, una posible distribucin
podra ser:
Modelo Estadstico
Modelo: Yij = i + i + eij
Suma de Y 2
= Myy + Tyy + Eyy
Cuadrados
El efecto del -simo tratamiento esta dado por i, siendo la expresin: i = i = , donde i es la media del
-simo tratamiento y la media general.
60
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo
En una determinada fbrica de galletas, se desea saber si las harinas de sus tres proveedores producen
la misma viscosidad de masa. Para ello produce durante un da nueve masas, tres de cada tipo de harina,
y se mide su viscosidad. Los resultados obtenidos son
Proveedor A Proveedor B Proveedor C
19 17 22
23 18 21
21 21 24
63 56 67
Solucin
Paso N 1.- Planteamiento de Hiptesis.
Y = y
2
i 1 j 1
2
ij : ( 19 )2 + (23 )2 + ... + (21)2 +(24)2 = 3886
SCT = Tyy = T
i 1
i
2
- Myy =
(63) 2 (56) 2 (67) 2
3844 =
11594
3844
3 3
r
Tyy = 3864.66 - 3844 = 20,667
61
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Paso N 5.- Decisin: Como Fcal = 2.90 < Ftab = 5.14, entonces no se rechaza Ho, y Concluimos que no
existen diferencias significativas en las viscosidades de la harina a un nivel del 5% de error.
Tarea
Para verificar si nuestra conclusin cambia sobre la influencia del proveedor en la viscosidad obtenida
despus de los 15 das, se debe realizar la prueba con los nuevos datos.
Ejemplo
Un investigador desea indicar los efectos relativos de 4 tratamientos respecto a la vida activa de un tipo
particular de bateras trmicas. Para el experimento se dispone de 20 bateras relativamente
homogneas, las bateras se asignaron aleatoriamente a los 4 tratamientos; con la restriccin de que a
cada tratamiento le corresponde 5 bateras.
Niveles o Tratamientos
I II III IV
73 74 68 71
Observacin 73 74 69 71
73 74 69 72
75 74 69 72
75 75 70 73
Total 369 371 345 359
Solucin
Paso N 1.- Planteamiento de Hiptesis.
t nt
i 1 j 1
2
ij
2 2 2
+(73)2 = 104352
62
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
t
T 2 T2 (1444) 2
Myy = = i 1
i
= = = 104 256.8
tr tr (4)(5)
SCT = Tyy = Ti 1
i
2
- Myy =
r
(369) 2 (371) 2 ... (359)
= - 104 256.8
5
521708
= 104256.8
5
Tyy = 104 341.6 - 104 256.8 = 84 .8
Paso N 5.- Decisin: Como Fcal = 43.49 Ftab = 3.24, entonces se rechaza Ho, y Concluimos con un nivel
de 5% que existe diferencias significativa en la vida activa del tipo particular de bateras trmicas.
Y 2
= Suma total de Cuadrados
63
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
t nt
nt : N de observaciones.
r
i 1
i
r
t
i
i 1
Tyy = T
i 1
i
2
- Myy =
t
r (y Y)
i i
2
i 1
ri
Eyy = Y 2
- Myy Tyy
Tyy T
t-1 Tyy T= R= =
Entre Tratamiento t 1 E
t Eyy
Error Experimental (ri 1)
t
Eyy
E= RF
(r 1)
i 1
i
i 1
t
ri 1
i
Total
Ejemplo:
Se realiz un experimento para estudiar el efecto de la condicin de almacenamiento sobre el contenido
de humedad en madera blanca de pino, se investigaron 5 mtodos de almacenamiento con varios
nmeros de unidades experimentales, obtenindose los resultados que se presentan a condicin:
a) Se puede afirmar que la variabilidad de las condiciones de almacenamiento es la misma para cada
nivel?. Use =0.01
b) La evidencia estadstica nos permite afirmar que almenos una de las condiciones de almacenamiento
difiere de los dems. Use =0.05
64
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Tratamientos ( Condiciones de
Humedad)
M1 M2 M3 M4 M5
7.3 5.4 8.1 7.9 7.1
Observacin 8.3 7.4 6.4 9.5
7.6 7.1 10.0
8.4
8.3
39.9 19.9 14.5 27.4 7.1
Solucin
= 9: ( F0.95; 4 , 9 )=3.63 grados de libertad, donde F debe determinarse por medio de un anlisis de
varianza; si no, acptala.
Y 2
= Suma total de cuadrados
t nt
Myy = =
T = T 2 =
i
2
(108.8) 2
= 845.53
i 1
r rii
(14)
SCT= Tyy = T
i 1
i
2
- Myy =
(39.9) 2 (19.9) 2
+ + ... +
(7.1) 2
- 845.53
r
5 3 1
65
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
521708
= 104256.8
5
S.C.E = Eyy = Y 2
- Myy Tyy
= 863.36 - 845.53 - 10.66 = 7.17
Eyy = 7.17
5.- Decisin: Como Fc= 3.34 Ft =3.63, el valor de F 0.95 para 4 y 9 grados de libertad, la hiptesis nula no
se rechazarse: en otras palabras los efectos medios de los tratamientos en lo que se refiere a humedad
no son significativos ( o sea que los tratamientos o efectos medios de los tratamientos son iguales). (no
vara un tratamiento uno de otro) ( no hay significancia estadstica).
II. DISEO EN BLOQUES COMPLETAMENTE ALEATORIZADO (D.B.C.A)
Es aqul en el que:
1.- Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades
experimentales dentro de un bloque sean relativamente homogneas y que el nmero de unidades
experimentales dentro de un bloque sea igual al nmero de tratamientos por investigar, y
2.- Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque. En lo
anterior, la formacin de los bloques refleja el criterio del investigador respecto a las respuestas
diferenciales potenciales de las diversas unidades experimentales, mientras que el procedimiento de
aleatorizacin acta como una justificacin de la suposicin de independencia.
Modelo Estadstico
66
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Suma de Y 2
= Myy + Byy + Tyy + Eyy
Cuadrados
El efecto del j-esimo tratamiento esta dado por j , siendo la expresin: j = j = , donde j es la
media del j-esimo tratamiento y la media general.
Entre Tyy T
Tratamiento t-1 Tyy T= R1= =
t 1 E
(Columnas)
Entre Byy
Bloques b-1 Byy B=
b 1
B
R2=
(filas) E
Eyy
Error (t-1) (b-1) Eyy E=
(b 1)(t 1)
Experimental R F
Total tb-1
Ejemplo: Se diseo un experimento para estudiar el desempeo de cuatro detergentes diferentes para
limpiar inyectores de combustible. Las siguientes lecturas de limpieza se obtuvieron con un equipo
especialmente diseado para 12 tanques de gas distribuidos en tres diferentes modelos de motores:
Considerando a los detergentes como tratamiento y los motores como bloques, obtenga la tabla apropiada
de anlisis de varianza y pruebe en el nivel de significancia de 0.01 si hay diferencias en los detergentes
en los motores
Solucin
Tratamiento
Deterg Deterg Deterg Deterg Total Promedio
Bloque A B C D Ti. Y i.
Motor 1 45 47 48 42 182 45.5
Motor 2 43 46 50 37 176 44
Motor 3 51 52 55 49 207 51.75
Total T. j 139 145 153 128 565
67
Promedio Y . j 46.33 48.33 51 42.67
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
a) Tratamientos
H OT : j = 0 = (Todos los tratamientos tienen el mismo efecto sobre la variable en estudio) .
j = 1,2, ..., t
: j = 0
T
H 1 : j 0 ( No todos los tratamientos tienen el mismo efecto sobre la variable en estudio)
b) Bloques.
H OB : Bi = 0 = ( Todos los Bloques tienen el mismo efecto sobre la variable en estudio) . j = 1,2, ..., t
: i = 0
B
H : Bj 0 ( No todos los Bloques tienen el mismo efecto sobre la variable en estudio)
1
Y = y
2
i 1 j 1
2
ij = (45)2 + (47)2 + ... + (49)2 = 26867
Myy = 26602.083
S.C.B. = Byy = T i 1
j
2
- Myy =
t
(182) 2 (176) 2 ( 207) 106949
= -26602.083 = - 26602.083 =
4 4
Byy = 135.167.
T i
2
139 2 (145) 2 ... (128) 2
S.C.T=Tyy = i 1 -Myy = -26602.08
3
b
= 267136 26602.083 = 110.917
68
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Entre
Bloques 2 135.167 67.584 RB= 21.530
(filas)
PASO N 5 : Conclusin :
T T
i) Si FCal Ftab = F ( t 1, ( t-1)( b 1)), se rechaza H 0 y se concluye con un riesgo de =0.01 de
que existe diferencia entre las medias de tratamientos y consecuentemente existe influencia del tipo de
detergente en el desempeo de la limpieza de inyectores.
B B
ii) Si FCal Ftab = F ( b 1, ( t-1)( b 1)), se rechaza H 0 y se concluye con un riesgo de =0.01 de
que existe diferencia entre las medias de bloques y consecuentemente hay influencia o diferencia
significativa en el en el tipo de motor al cual se esta haciendo la limpieza
69
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
En el modelo de clasificacin de dos factores, las dos variables son independientes, es decir no hay
interaccin entre los dos factores. Slo hay interaccin si se toman las observaciones mltiples en las
diversas combinaciones de los dos factores.
En el modelo de clasificacin de dos factores con replicas los tratamientos no son independientes. En este
caso si hay interaccin de los factores.
H 1B : No todos las medias de los bloques son iguales (al menos uno de los efectos i no es igual a cero).
Y con respecto a las interaccin:
70
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
H 1I : Existe interaccin entre los tratamientos y bloques (al menos uno de los efectos gIj no es igual a
cero).
a) Variacin Total.
c r n
T 2 ...
SCT=
i 1 j 1
X ijk2 C
k 1
, donde C
f *c*r
,
d) Variacin Residual
i r n r
1
SCE =
i 1 j 1 k 1
2
X ijk
r T
j 1
2
ij .
71
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
CMF=
SCBL CMF
f 1 FB=
Debido a la CME
interaccin (c-1)(f-1) SCI
SCI
CMI=
(c 1)( f 1) CMI
Error Residual FI =
CME
cf(r-1) SCE SCE
CME=
cf (r 1)
Total n-1 SCT
PASO N 5 : Conclusin :
T T
i) Si FCal Ftab = F ( c 1, cf( r 1)), se rechaza H 0 y se concluye de que hay diferencia entre las
medias de tratamientos (columnas ) y consecuentemente hay influencia del factor A sobre la variable
T
analizada; en caso contrario no se rechaza H 0 y se concluye con un riesgo de de que el factor A no
causa efecto en la variable dependiente o respuesta.
B B
ii) Si FCal F ( f 1, cf(r 1)), se rechaza H 0 y se concluye de que hay diferencia entre las medias de
bloques ( filas) y consecuentemente hay influencia del factor B sobre la variable respuesta; en caso
B
contrario no se rechaza H 0 . y se concluye con un riesgo de que el factor B no causa efecto en la
variable dependiente o respuesta.
I I
iii) Si F F (( c 1), (f-1), cf(r 1)), se rechaza H 0 y se concluye de que hay interaccin entre las filas
I
y columnas; en caso contrario no se rechaza H 0 y se concluye con un riesgo de que la interaccin no es
significativa.
Ejercicio. Se comparan cuatro mtodos de dieta para determinar su eficacia en trminos del peso perdido
en kilos. Con este fin se disea un modelo de anlisis de varianza de dos factores considerando el mtodo
de dieta como el factor A con 4 niveles (A :Mtodo i, i =- 1. 2, 3, 4) y el peso inicial como el factor B con
tres niveles (Bi = moderadamente pesado B2:=pesado. B3=muy pesado). Se eligen al azar a dos personas
de B, para A1. dos para A2. etc Despus de un mes la prdida de peso en kilogramos de las 24 personas
que se someten a las dietas se registran en la tabla siguiente. Utilice un nivel de significacin de 0.05.
Peso Tipos de Dieta Total
Inicial A1 A2 A3 A4 T.j.
B1 8 6 7 5
7 5 7 6
Total Ai 15 11 14 11 51
B2 4 5 3 4
3 4 4 4
72
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Total Ai 7 9 7 8 31
7 6 5 7
B3 6 7 6 6
Total Ai 13 13 11 13 50
Total Ti.. 35 33 32 32 T= 132
Solucin
4 3 2
SCT = X
i 1 j 1 k 1
2
ijk - C = (8)2 + (4)2 + +(3)2 726 = 772 -726 =46
c
1 1
SCC =
f *r T
i 1
2
i.. -C=
3 2
(35)2 + (32)2 + (32)2 - 726 =1
r
1 1
SCF =
c* f T
j 1
2
. j. -C=
4 2
(51)2 + (31)2 + (50)2 - 726 = 31.75
4 3 2 r
1 1
SCE = X
i 1 j 1 k 1
2
ijk -
r T
j 1
2
ij . = 772 -
2
(15)2 + (11)++(13)2 = 5
Error de 12 5 0.417
Muestreo
Total 23 46
0.333 C
FC = = 0.799 < 3.49, se acepta H 0
0.417
15 .875
FF = 38.1 > 3.89 , se rechaza H 0F
0.417
1.375
FI = 3.3 > 3.00, se rechaza H 0I
0.417
Ejercicio.
73
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Para producir cierto bien una firma dispone de 4 mquinas de marcas distintas(A i) que produce con igual
velocidad y de tres fuentes distintas de materia prima (B j )de igual calidad. No se sabe si el nmero de
unidades defectuosas producidas es la misma para las mquinas y para las materias primas. Se hace
operar cada de mquina con cada tipo de material durante 2 horas y se registra el siguiente nmero de
unidades defectuosas por hora.
Utilice un nivel de significacin de 0.05 para verificar:
a) Si hay diferencias significativas entre las mquinas Ai
b) ) Si hay diferencias significativas entre las materas primas Bj
c) Si hay efecto de interaccin AxB
Materias Mquinas
Primas A1 A2 A3 A4
B1 6 4 5 3
5 3 5 4
B2 2 3 1 2
1 2 2 2
B3 5 3 3 4
4 4 4 3
74
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
PRACTICA DE LABORATORIO
75
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
INTRODUCCION
Hoy en da, los mtodos cuantitativos, han dado un gran desarrollo con la ayuda de las tecnologas
de la informacin y los software estadsticos que se encuentran en el mercado tales como Minitab,
SAS, Spss entre otros, es por eso que incluso la clases de Mtodos cuantitativos se desarrollan en
laboratorio de computacin haciendo uso de Software que es el SPSS V20.
OBJETIVOS:
El SPSS.
Es un software estadstico y de gestin de datos, se maneja mediante instrucciones que se
agrupan en mdulos. Contiene programas capaces de realizar desde un simple anlisis
descriptivo hasta diferentes tipos de anlisis multivariante de datos.
76
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Definicin
Ingreso de variables
de datos
77
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
78
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
SESIN BSICA.
Como se puede observar en la siguiente pantalla, la definicin de las variables se hacen en forma de
lneas lo que esta en columnas en la tabla de datos hipotticos. Adems hay que considerar el tipo de
variable, n de decimales , etiqueta etc.
79
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Una vez definida las variables ingresamos a la ventana de ingreso de datos que se muestran
en la tabla anterior.
Como se observa en la pantalla anterior solo se muestran nmeros en las variables como sexo, lugar
de procedencia etc, por lo que falta codificar las variables, tal como se muestra en la siguiente tabla.
80
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Estando lista la base de datos, se procede a encontrar los diferentes estadsticos necesarios.
81
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo N1
Analizar/Estadsticos Descriptivos/Frecuencias
Ejemplo N02
Analizar/ Estadsticos Descriptivos /Explorar/. Cuadro de dilogo: dependient List: Peso, Lista
de Factores: sexo, Mostrar Statistic: En el cuadro dialogo: Descriptivos. Continuar / Mostrar
Plots : Boxplot : factor levels; Descriptive : Stem and leat / Continuar / OK
82
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejemplo N 3
Cambiar en el ejemplo anterior, en lista de factores Estado Civil por Sexo
83
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Ejercicio N 02
Supongamos que se tiene la siguiente encuesta:
Se quiere realizar un anlisis del comportamiento de los consumidores que realizaron sus
compras semanales en un supermercado, realizndose la siguiente encuesta.
CODIFICACIN DE LA ENCUESTA:
84
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Como paso ltimo se realizar el llenado de la base de datos representado por la muestra de 30
personas que realizaron sus compras en un supermercado. Los datos se pueden llenar directamente
del cuestionario (Encuesta). Las columnas nos indican las variables que tenemos y las filas los
casos o encuestados.
Encuestad X1 X2 X3 X4 X5 X6 X7 X8 X9
o
1 0 0 3 2 0 2,0 17,0 34,5 6
2 2 0 4 1 2 3,0 20,0 40,0 6
3 2 0 2 3 2 0,3 10,0 31,6 6
4 1 0 2 4 1 3,3 9,0 35,4 6
5 2 0 3 4 2 1,3 23,0 30,0 6
6 2 0 4 4 2 0,4 13,0 32,9 6
7 1 0 2 2 0 1,5 12,0 33,2 6
8 0 0 3 2 0 4,5 19,0 33,1 6
9 2 1 4 3 2 2,5 18,0 35,6 6
10 1 1 2 2 1 0,3 24,0 33,0 6
11 2 1 4 1 2 1,0 7,0 34,5 6
12 2 0 3 2 2 6,0 10,0 33,2 6
13 2 0 4 4 2 5,6 5,0 31,5 6
14 2 1 4 4 2 6,0 14,0 36,2 1
15 1 0 1 1 1 1,2 15,0 36,8 1
16 2 0 1 2 2 0,2 12,0 35,4 2
17 2 0 1 3 2 6,0 14,0 33,2 2
18 2 0 2 2 2 5,5 6,0 35,9 2
85
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
Nombre Apellido:
PRACTICA N3 DE LABORATORIO
BASE DE DATOS
86
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
INGRESO MENSUAL
TAMAO FAMILIAR
PROCEDENCIA
ESTADO CIVIL
ENFERMEDAD
PROFESION
ACTIVIDAD
SEGURO
N ENC.
EDAD
SEXO
1 4 28 FEMENINO EDUCACION INICIAL SOLTERO TRUJILLO NO NINGUNA 350 CUIDA NIOS
2 4 19 MASCULINO INFORMATICA SOLTERO TRUJILLO NO NINGUNA 400 VIGILANCIA
3 1 42 MASCULINO ESTILISTA SOLTERO TRUJILLO NO NINGUNA 460 ESTILISTA
4 7 47 MASCULINO ESTILISTA SOLTERO HUARAL NO NINGUNA 460 ESTILISTA
5 4 73 MASCULINO CATEDRTICO CASADO AREQUIPA SI NINGUNA 4000 INVERSIONISTA
6 3 18 MASCULINO ING. SISTEMAS SOLTERO PIURA SI NINGUNA 1200 COMERCIANTE
7 4 26 FEMENINO CONTADORA CASADO TRUJILLO NO NINGUNA 450 NINGUNO
8 5 21 MASCULINO ESTUDIANTE SOLTERO TRUJILLO NO NINGUNA 420 NINGUNO
9 9 25 MASCULINO COMERCIANTE SOLTERO TRUJILLO NO NINGUNA 420 COMERCIANTE
10 3 35 MASCULINO COMERCIANTE CASADO TRUJILLO NO NINGUNA 500 NEGOCIO
11 4 21 MASCULINO ESTUDIANTE SOLTERO TALARA SI NINGUNA 600 COMERCIANTE
12 5 45 FEMENINO COMERCIANTE CASADO HUANUCO NO NINGUNA 500 NEGOCIO
13 6 29 MASCULINO D. TECNICO SOLTERO TRUJILLO NO NINGUNA 1200 ACADEMIA
14 3 20 MASCULINO ESTUDIANTE SOLTERO TRUJILLO SI NINGUNA 800 ESTUDIANTE
15 4 21 MASCULINO ESTUDIANTE SOLTERO TRUJILLO NO NINGUNA 460 DOCENTE
16 1 20 MASCULINO ESTUDIANTE SOLTERO CAJAMARCA NO NINGUNA 300 ESTUDIANTE
17 6 32 MASCULINO COMERCIANTE CASADO TRUJILLO NO NINGUNA 500 COMERCIANTE
18 3 30 MASCULINO COMERCIANTE CASADO TRUJILLO NO NINGUNA 500 COMERCIANTE
19 4 23 FEMENINO VENDEDORA SOLTERO TRUJILLO NO NINGUNA 400 VENDEDORA
20 5 45 FEMENINO COMERCIANTE CASADO CAJAMARCA NO NINGUNA 600 COMERCIANTE
21 6 33 MASCULINO ECONOMISTA SOLTERO TRUJILLO SI NINGUNA 700 ECONOMISTA
22 6 32 MASCULINO COMERCIANTE SOLTERO CHICLAYO NO NINGUNA 500 COMERCIANTE
23 7 37 MASCULINO ING. QUIMICO CASADO TRUJILLO SI NINGUNA 1200 ING. QUIMICO
24 5 80 MASCULINO PROFESOR CASADO CAJAMARCA SI BRONQUITIS 800 COMERCIANTE
25 6 40 FEMENINO AMA DE CASA CASADO TRUJILLO SI ALERGIAS 2000 NINGUNO
26 3 32 MASCULINO COMERCIANTE SOLTERO VIRU NO NINGUNA 600 COMERCIANTE
27 2 81 MASCULINO AGENTE VIAJERO CASADO SAN PEDRO SI ESTEOPOR 500 NINGUNO
28 4 50 MASCULINO TOPOGRAFO CASADO TRUJILLO NO BRONQUITIS 1000 NINGUNO
29 4 21 MASCULINO DOCENTE SOLTERO TRUJILLO NO NINGUNA 460 DOCENTE
30 6 75 MASCULINO CHEFF VIUDO OTUZCO SI NINGUNA 700 COMERCIANTE
31 6 40 FEMENINO AMA DE CASA SOLTERO TRUJILLO SI NINGUNA 415 NINGUNO
32 5 31 FEMENINO INGENIERA CASADO CHICLAYO NO NINGUNA 1300 INGENIERO
33 4 52 MASCULINO ING. CIVIL CASADO TRUJILLO NO LA GOTA 1000 COMERCIANTE
34 4 31 MASCULINO ADMINISTRADOR SOLTERO TRUJILLO SI NINGUNA 1500 ADMINISTRADOR
35 3 46 MASCULINO CONTADOR CASADO CARTAVIO SI NINGUNA 2500 CONTADOR
36 12 81 FEMENINO AMA DE CASA CASADO TRUJILLO NO PRESION 700 AMA DE CASA
37 4 80 MASCULINO DOCENTE VIUDO AMAZONAS SI ARTROSIS 900 CESANTE
38 5 32 MASCULINO TECNICO SOLTERO TRUJILLO SI NINGUNA 1200 TECNICO
39 7 68 FEMENINO DOCENTE SOLTERO ANCASH SI NINGUNA 800 CESANTE
40 4 36 FEMENINO SECRETARIA CASADO TRUJILLO SI NINGUNA 1500 DOCENTE
41 4 63 MASCULINO ARQUITECTO CASADO PIURA SI NINGUNA 7200 ARQUITECTURA
42 3 41 FEMENINO CONTADORA CASADO GUADALUPE SI NINGUNA 4000 CONTADOR
DIVORCIAD
43 3 62 MASCULINO ABOGADO O LAMBAYEQUE SI NINGUNA 5800 ABOGACIA
44 3 49 FEMENINO OBSTETRIZ CASADO LAMBAYEQUE SI NINGUNA 3000 OBSTETRIZ
45 3 46 MASCULINO ABOGADO CASADO SAN PEDRO SI NINGUNA 7000 ABOGACIA
46 3 46 MASCULINO DOCTOR CASADO TRUJILLO SI NINGUNA 6500 ODONTOLOGO
47 2 56 MASCULINO CONTADOR CASADO CHICLAYO SI NINGUNA 5600 CONTADOR
48 4 39 FEMENINO ENFERMERA SOLTERO TRUJILLO SI NINGUNA 3200 ENFERMERIA
49 3 42 FEMENINO PROFESORA SOLTERO LIMA SI NINGUNA 4300 DOCENTE
50 4 21 MASCULINO ESTUDIANTE SOLTERO TRUJILLO NO NINGUNA 460 DOCENTE
87
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
NOMBRE Y APELLIDOS:
PRACTICA N4 DE LABORATORIA
Lori Muller llama al estadstico a su oficina y le dice: "Estoy encantada de tener un estadstico
que nos ayude. No estamos an listos a desarrollar un modelo estadstico acabado de lo que
constituye una buena contratacin, pero es tiempo de empezar a evaluar algunas de las
variables de que tenemos informacin. El gran nmero de personas que contratamos, el alto
88
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
costo de adiestrarlas y el hecho de que no podemos evaluar realmente los rendimientos, hasta
fines del segundo ao, significan que cualquier mejora en nuestra eficacia de contratacin
tendr por resultado ahorros sustanciales para la firma. Para comenzar a tratar el tema,
Podras dar respuesta a las siguientes preguntas?
1. Necesitamos un resumen de la edad del personal al contratarse, del promedio de
calificaciones de grado y de la evaluacin del rendimiento en el segundo ao, para tener
una apreciacin general del grupo en adiestramiento financiero. Cul es el perfil de este
personal?
2. Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de
mujeres? Y en la evaluacin del rendimiento?
3. Un criterio inicial en Wells era mantener la calificacin promedio de grado de los
contratados por encima de 14.00. Se sigue manteniendo este criterio?
4. Otro criterio era mantener por lo menos un tercio de los contratados que provengan de
escuelas de categora 2. Se sigue manteniendo este criterio?
5. Son diferentes los rendimientos en la prueba de entrada para las diferentes calidades de
escuelas de donde provienen los candidatos? Y en la Evaluacin del rendimiento del
segundo ao?
Si Ud. fuera el estadstico que conclusiones le dara a Lori respecto al anlisis que
realiz.
Calidad
No. Genero Edad Calificacin ndice xito Rendimiento 2
Universitaria
1 1 22 15.41 3 62 72
2 1 26 15.71 1 60 71
3 1 22 12.45 2 80 66
4 1 23 15.69 2 86 91
5 1 25 16.05 1 86 48
6 1 26 16.21 3 64 95
7 0 27 14.42 2 54 82
8 1 23 12.87 3 80 92
9 1 23 13.08 2 62 73
10 1 26 16.30 3 77 81
11 1 24 15.82 4 61 67
12 0 24 14.85 3 67 95
13 0 36 13.31 4 95 96
14 1 27 16.67 4 62 59
15 0 26 16.35 2 50 79
16 1 24 12.50 1 62 88
17 1 26 12.32 1 81 52
18 1 23 14.72 2 76 71
19 1 24 13.94 2 87 75
20 1 24 16.92 2 73 75
21 0 25 13.14 3 85 93
22 1 23 14.92 3 57 84
23 1 23 13.81 2 89 90
24 0 26 15.53 3 70 83
25 1 25 15.33 3 65 73
26 0 25 12.95 2 89 97
27 1 24 12.24 4 87 88
28 1 23 14.94 4 89 81
29 1 22 12.57 3 94 74
30 0 30 12.92 3 71 67
31 1 24 15.94 1 63 80
89
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
32 1 25 13.80 4 67 64
33 1 23 14.42 3 96 82
34 1 24 14.72 2 73 82
35 1 26 12.60 3 92 81
36 0 23 14.53 3 88 77
37 1 26 14.76 4 82 89
38 0 26 13.12 3 84 95
39 1 26 13.35 4 86 58
40 0 23 14.76 2 72 74
41 1 22 15.27 4 82 89
42 1 26 17.00 2 77 68
43 1 24 16.57 2 66 77
44 1 26 14.02 3 73 67
45 1 25 13.08 1 85 99
46 1 24 13.93 3 58 96
47 1 25 14.17 2 58 97
48 0 24 14.65 3 79 92
49 1 22 13.92 1 50 95
50 1 25 13.28 3 93 67
51 1 25 12.96 2 75 52
52 0 23 13.97 2 82 82
53 1 25 13.92 3 57 83
54 1 24 14.92 3 67 87
55 1 24 16.33 2 60 73
56 0 23 14.25 4 56 67
57 1 23 15.29 1 94 72
58 1 26 15.23 3 92 66
59 1 26 15.73 3 81 95
60 0 23 12.94 1 73 82
61 1 24 15.96 1 91 84
62 1 24 16.96 2 72 98
63 1 27 12.23 3 85 93
64 1 22 15.35 2 96 87
65 0 23 16.77 2 85 57
66 1 24 16.12 2 89 85
67 0 25 14.34 3 92 81
68 1 24 14.69 3 66 95
69 1 22 14.67 2 85 90
70 1 23 15.56 2 54 80
71 1 22 12.35 2 85 48
72 1 24 13.39 3 65 71
73 0 26 16.99 1 76 63
74 0 28 15.29 4 63 87
75 0 26 15.93 2 89 97
76 1 25 13.41 3 83 97
77 1 25 15.55 2 57 79
78 1 25 13.97 1 96 71
79 0 23 12.81 4 72 72
80 1 24 12.99 2 73 89
81 1 25 15.67 2 53 94
82 1 23 12.47 3 86 78
83 1 24 12.77 3 64 89
84 0 24 14.67 1 80 84
85 0 25 13.94 3 77 91
86 1 24 14.90 1 52 69
87 1 23 15.44 2 70 89
88 0 23 16.03 4 90 91
90
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
89 1 29 12.15 4 74 89
90 0 22 13.42 2 95 94
91 0 26 12.02 4 84 95
92 0 22 13.04 3 68 78
93 0 30 14.35 4 92 84
94 1 25 13.65 2 52 85
95 1 23 12.66 2 82 69
96 1 26 13.22 3 56 71
97 1 23 13.43 3 85 58
98 1 22 15.54 4 85 93
99 1 26 16.51 3 64 97
100 1 23 16.91 3 61 83
Nombre y Apellidos:
PRACTICA N5 DE LABORATORIA
Realice una anlisis estadsticos de los siguientes datos.
91
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
92
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
93
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
94
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
95
Mtodos Estadsticos aplicados en la Ingeniera Qumica. . MSc. Alfonso Tesn Arroyo
96