Vous êtes sur la page 1sur 130

ESCUELA DE POST-GRADO

DOCTORADO EN CIENCIA, TECNOLOGA Y MEDIO


AMBIENTE

Vladimiro Ibaez Quispe, Dr.


C.U. Julio, 2015

MTODO CIENTFICO Y ESTADSTICA

A. Recopilar la informacin

Un aspecto muy importante en el proceso de


una investigacin es el que tiene relacin con la
obtencin de la informacin, pues de ello
dependen la confiabilidad y validez del estudio
Obtener informacin confiable
requiere cuidado y dedicacin.

vlida

Obtencin de la informacin

Esta etapa de recoleccin de informacin se


conoce como trabajo de campo estos datos
son el medio para probar las hiptesis, y se
logran los objetivos del estudio originados
del problema de investigacin.
Los datos deben ser confiables, pertinentes y
suficientes, para lo cual es necesario definir
las fuentes y tcnicas adecuados para su
recoleccin.

Obtencin de la informacin

RECOLECCION
DE DATOS

b. ELABORACION
DE DATOS

Registros
R
R
||SISTEMAS DE |SEncuestasRCensal
S
RECOLECCION |
Muestral
T
S
T
||FUENTESRPrimaria Dato primario de primera mano
S
|T
TSecundaria Dato secundario de segunda mano

- Crtica de datos (Manual de crtica)


R
||- Codificacin de datos (Manual de codificacin)
||- Clasificacin de Datos (Distribucin de Frecuencias)
R
Directo
R
||
||- Recuento Manual|SPalotes
|S- RECUENTO O |
|
Tarjeta simple
T
TABULACION S
|| DE DATOS |- Recuento Semimecnico Tarjeta perforada
||- Mecnico Sistema Hollerith
||
- Electrnico Computadoras personales
||- PRESENTACIONT
Tabular (Cuadros Estadsticos)
R
|T DE DATOS S
TGrfica (Grficos Estadsticos)

C. Anlisis e Interpretacin de datos.

R
||ANALISIS
Anlisis
BIDIMEN
S
descriptivo |
||SIONAL
T

Descripcin de cuadros y grficos de dos entradas


R
||- Comparacin por cociente (Tasas y Razones)
- Tipo de R
Regresin simple lineal
S
|| Asociacin S
TRegresin simple no lineal
T- Grado de asociacin lCorrelacin simple

Descripcin de cuadros y grficos de una entrada


R
R
||
||Comparacin por cociente (Tasas y Razones)
Media aritmtica
R
||
||
||Media armnica
||
|| Medidas |Media geomtrica
||
||Tendencia |SMedia curtica
||
|| Central ||Media cbica
||Mediana
||
||
TModa
||ANALISIS |
Rango
R
|
Anlisis |
||Cuantiles
UNIDIMEN S
S
descriptivo |
|
||Desviacin cuartil
SIONAL
||
|| Medidas
Desviacin media
de
S
||
||Dispersin ||Varianza
||Desviacin estndar
||
||
TCoeficiente de variacin
||
|| Medidas R
a
||
|| de |S
b
||
||asimetra |Tc
Medidasde R
a
||
||forma
S
Tb
T
T

ANALISIS
R
Anlisis |
Tipo de asociacin Regresin mltiple
R
MULTIDI S
S
descriptivo |
- Grado de asociacin Correlacin mltiple
T
TMENSIONAL
Estimacin puntual
R
R
||ESTIMACION DE PARAMETROSS
ANALISIS
Estimacin por intervalo
T
S
Modelos Paramtricos
INFERENCIAL |
R
|TDOCIMASIA DE HIPOTESIS S
TModelos no Paramtricos
R
Boletines
R
||PUBLICACIONES PERIODICAS |SAnuarios
|TMemorias
PUBLICACION |
S
Artculos
DE DATOS
R
||
|Tesis
PUBLICACIONES OCASIONALESS
|T
|TResultados de investigaciones

LOS TRES COMPONENTES DE UNA


BASE DE DATOS

Registro
(casos)
N

V1

20

V2

Atributo
(variables)
V3

V4

V5

2
A qu se
denomin
a Unidad
de
Anlisis?

3
4
5
6

Valor
(categora
s)

V.n

Fundamentos

A) REGRESIN LINEAL SIMPLE (RLS).


Sir Francis Galtn (1877). Regresin es el
nombre que le di al proceso general de
predecir una variable (Ejm: La talla de los
nios) a partir de otra (la talla de los padres).
Despus los estadsticos encontraron la
expresin regresin mltiple para describir el
proceso en virtud del cual se emplean algunas
variables para predecir otra.

Fundamentos

REGRESIN LINEAL SIMPLE

La regresin se utiliza para analizar datos


que provienen de experimentos que no
fueron diseados, como estudio de
fenmenos no controlados o de registros
histricos.
La regresin se usa para determinar la
mejor relacin funcional entre las
variables en estudio.

Fundamentos

REGRESIN LINEAL SIMPLE

En pocas palabras, regresin es la cantidad de


cambio de una variable asociado a un cambio
nico de otra variable.
La RLS permite determinar si existe relacin
entre las variables (X e Y), el cual utiliza el
comportamiento de una variable (X = independiente), para predecir el comportamiento de
otra variable (Y = dependiente). Las dos
caractersticas por lo general deben ser
cuantitativas.

Fundamentos

USOS DE RLS:
Para hacer predicciones futuras de Y, teniendo como base la
X.
Para ver si la variable (Y) depende de otra (X), estimando por
consiguiente la medida de dicha relacin o asociacin.
Para determinar la forma de la curva de la regresin.
Para conocer el error real implicado en un experimento,
despus que haya sido descontado el efecto de una variable
relacionada.
Sirve de base para el anlisis estadstico.

Vladimiro Ibaez Quispe, M.Sc.

Fundamentos

EJEMPLOS:

Predecir el tiempo meteorolgico basado en


los datos del pasado.
Predecir la produccin de lana/ao, basada
en la informacin recogida en aos
anteriores.
Etc.

Fundamentos

MODELO DE REGRESIN LINEAL SIMPLE


(MRLS)
Variable
dependiente

Variable
independiente

Yi 0 1X i i ,

i = 1,2,..., n
Error de
perturbacin

Parmetro que
indica la ordenada
de la lnea de
regresin

Pendiente de la
recta de regresin

PROPIEDADES DEL MODELO RLS.

a. Toda perturbacin aleatoria tiene de media


cero:

( i ) 0

b. Todas las perturbaciones aleatorias tienen la


misma varianza.

V( i )

2
i

c. Las perturbaciones son independientes entre


s:

cov( i , j ) 0,

i j

Vladimiro Ibaez Quispe, M.Sc.

Para el EJEMPLO b)

Yi
E(Y) = 0 1 X i
Yj
j

.
i

Yi

X1

X2

X3

X4

Suposiciones en regresin

Xi

DIAGRAMA DE DISPERSIN:

La representacin da origen a una nube de


puntos que se denomina diagrama de dispersin
esparcimiento; es la forma ms usual para
detectar si la funcin es lineal, exponencial,
potencial, cuadrtica, etc. al cual el
experimentador ajustar su informacin
recopilada, de tal forma que describa
adecuadamente la relacin entre las variables
en estudio.
Vladimiro Ibaez Quispe, M.Sc.

Eje Y

Eje Y

EJEMPLOS DE DIAGRAMAS DE DISPERSIN

Eje X
Lineal positiva

Eje X
Lineal negativa

Eje Y

Eje Y

EJEMPLOS DE DIAGRAMAS DE DISPERSIN

Eje X
No Lineal

Eje X
Ninguna relacin

ESTIMACIN DE LA ECUACIN DE REGRESIN.

Para lograr la estimacin de los parmetros


desconocidos ( 0 y 1), se utiliza uno de los
mtodos ms conocido el METODO DE
MNIMOS CUADRADOS. Este mtodo
consiste en encontrar los valores 0 y 1de la
ecuacin de regresin muestral.

Yi 0 1X i i ,

i = 1,2,..., n

i = Yi 0 1X i
Vladimiro Ibaez Quispe, M.Sc.

a)

2
i

i=1

b)


i=1

2
i

ECUACIONES NORMALES (EN).

i 1

i 1

n 0 1 X i Yi
n

i 1

i 1

i 1

0 X i 1 X 2i X i Yi
Vladimiro Ibaez Quispe, M.Sc.

PARMETROS ESTIMADOS:

Y X
0
1
n

i 1

(Xi X) (Yi Y)
n

i 1

X X
2
i

X Y nXY
i 1
n

X nX
i 1

2
i

Yi 0 1X i
Vladimiro Ibaez Quispe, M.Sc.

EJEMPLO:
Se llev a cabo un experimento
para estudiar el efecto de cierto
medicamento para disminuir la
frecuencia cardiaca en adultos. La
variable independiente es la dosis
en miligramos del medicamento, y
la variable dependiente es la
diferencia entre la frecuencia
cardiaca ms baja despus de la
administracin del medicamento y
un control antes de administrarlo.
Se reunieron los siguientes datos:

DOSIS
(mg) (X)

REDUC. DEL RITMO


CARD (latidos/min) (Y)

0.50
0.75
1.00
1.25
1.50
1.75
2.00
2.25
2.50
2.75
3.00
3.25
3.50

10
8
12
12
14
12
16
18
17
20
18
20
21

Vladimiro Ibaez Quispe, M.Sc.

DIAGRAMA DE DISPERSIN
DIAGRAMA DE DISPERSI N PARA LA FREC UENC IA C ARDIAC A

LATID OS/M IN UTO (Y)

23
21
19
17
15
13
11
9
7
5
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4

DOSIS (mg) (X)

Los resultados son los siguientes:


2
2
X

26
,
Y

198
,
X
Y

442
.
5
,
X

63
.
375
,
Y
i
i
ii
i
i 3226
13

X Y nXY
i i

i 1
13

2
2
X

nX
i

422.5 13( 2 )( 15.23076923 )

4.087912088
63.375 13( 4 )

i 1

0 Y 1 X 15.23 4.087912088 x 2 7.054945054

Yi 7.054945054 4.087912088 X i

LATIDOS/MINUTO

Recta de regresin lineal ajustada para la Frecuencia


Cardaca
24
22
20
18
16
14
12
10
8
6
4
2
0.00

Yi 7.054945054 4.087912088 X i

0.50

1.00

1.50

2.00

2.50

DOSIS (mg)

3.00

3.50

4.00

ANLISIS DE VARIANZA (ANOVA)

Tabla de Anlisis de Varianza para la Frecuencia Cardaca


F. de V.
G.L.
S.S.
M.S.
Fc.
Regresin
1
190.087912 190.08791
103.41
Error
11
20.219780
1.83816
Total
12
210.307692 17.52564100

Signif
**

Salida del SAS.


Dependent Variable: Y
Source
Model
Error
Corrected Total
Root MSE
Dependent Mean
Coeff Var

Variable
Intercept
X

Variable
Intercept
X

DF
1
11
12

Analysis of Variance
Sum of
Mean
Squares
Square
F Value Pr > F
190.08791
190.08791
103.41 <.0001
20.21978
1.83816
210.30769
1.35579
15.23077
8.90164

R-Square
Adj R-Sq

0.9039
0.8951

Parameter Estimates
Parameter Standard
DF Estimate
Error
t Value
Pr > |t|
1 7.05495
0.88757
7.95
<.0001
1 4.08791
0.40199
10.17
<.0001

Covariance of Estimates
Intercept
X
0.7877836449
-0.32319329
-0.32319329
0.1615966451

95% Confidence Limits


5.10141
9.00848
3.20314
4.97269

B. CORRELACIN (r)
Coeficiente de correlacin.
La correlacin lineal permite medir si hay
asociacin entre dos variables mide la
intensidad de dicha asociacin. Para ello es
importante que la muestra bivariado sea
tomada al azar, tanto para la variable X como
para la variable Y. La r de Pearson, se
ajusta al tipo de informacin cuantitativa. Los
valores del coeficiente de correlacin oscilan
entre +1 y 1.

Clculo del coeficiente de Correlacin (r).

rxy

X Y ( X )( Y ) n
( X ) n Y ( Y
i i

2
X
i

)2 n

Los rangos que del coeficiente de correlacin, se


pueden interpretarse haciendo uso de las
siguientes expresiones:
r = 0.2 a r = 0.3

(coeficiente de correlacin muy bajo).

r = 0.4 a r = 0.5

(coeficiente de correlacin bajo).

r = 0.6 a r = 0.7

(coeficiente de correlacin alto).

r = 0.8 a r = 1.0

(coeficiente de correlacin muy alto).

El coeficiente de correlacin:

rxy

X Y ( X )( Y ) n
( X ) n Y ( Y
i i

2
X
i

442.5 ( 26 )( 198 ) 13
( 63.375 ( 26 ) 13 )( 3226 ( 198 ) 13 )
2

)2 n

0.9507

Salida del SAS:


Pearson Correlation Coefficients, N = 13
Prob > |r| under H0: Rho=0
X

1.00000

0.95071
<.0001

0.95071
<.0001

1.00000

C. COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin, R 2, es el valor
cuadrado del coeficiente r de Pearson, y
representa la proporcin de la varianza
explicada por una variable respecto a la
varianza total. Se considera como medida del
grado de influencia de una variable frente a
otra variable.

Varianza Explicada
SCR
R r
x100
x100
Varianza Total
SCT
2

~2
COEFICIENTE DE DETERMINACIN AJUSTADO R

CME
~2
R 1
o
CMT

MSE
~2
R 1
MSTm

EJEMPLO:

SSRm 190.08791
R

x100 90.39%
SSTm 210.30769
2

MSE
183816
.
~2
R 1
1
89.51%
MSTm
17.525641

D. ANLISIS DE REGRESIN LINEAL MLTIPLE.

Muchos problemas de regresin involucran


ms de una variable regresiva. La regresin
lineal mltiple es una de las tcnicas
estadsticas ms ampliamente utilizadas en la
actualidad. En esta oportunidad se presenta las
tcnicas bsicas de la estimacin de parmetros
mediante el mtodo de Mnimos Cuadrados.
El modelo es el siguiente:

Yi 0 1 X i1 2 X i 2 k X ik i ; Y X

Estimacin de parmetros:
Se usa mtodo de Mnimos Cuadrados para
estimar los coeficientes de regresin. Supngase
que se dispone n>k observaciones, y X ij denota la
observacin isima o el nivel de la variable X j.

Yi 0 1 X i1 2 X i 2 k X ik i
k

0 j X ij i
j 1

i 1,2 ,...., N

Usando las derivadas parciales para estimar a cada uno de los


parmetros:

( )
2
i

0 , 1 , , k

i 1

j 1

2 ( Yi 0 j X ij )( X ij ) 0,
j 1,2 ,..., k

Ecuaciones Normales:
N 0

0 X i1
i 1

0 X ik
i 1

1 X i1
i 1
N

1 X i21
i 1

2 X i 2
N

i 1

k X ik
N

i 1

2 X i1 X i 2 k X i1 X ik

i 1

1 X ik X i1 2 X ik X i 2
i 1

i 1

i 1

k X
i 1

2
ik

i 1

X
i 1

X
i 1

i1 i

ik i

FORMA MATRICIAL: La forma matricial de las


ecuaciones normales. El modelo en trminos de las
observaciones, se puede escribir en notacin
matricial como: Y X

Y1
Y1

YN

X
Nx1

1 X11
1 X21

1 X N1

X12 X1k
X22 X2k

XN 2 XNk

N( k 1)

Vector de parmetros y errores residuales:

y
( k 1 ) x1

Nx 1

PROPIEDADES.
a)

E ( ) 0, E ( Y ) X , Y E ( Y ) , Y E ( Y )

b)

Var( ) E E ( ) E ( ) ' E ( ' ) I N


2

Realizando las derivadas parciales (Forma matricial), se encuentra


la siguiente expresin:
1

1
1

( X' X ) (XX) ( X' X ) X' Y, ( X' X ) X' Y

Ecuaciones normales de forma matricial:


N

N
N

i1

i 1
N

Xi1

Xi1

i 1
N

i 1

X X
i 1

ik

i 1

ik

X
N

i 1

X
i 1
N

Xi1

i1

i2

ik

X
N

Xi 2

X
i 1

i 1

X
i 1

Xi 2

ik

i1

Xik

X
i 1

2
ik

0
1

Y
N

i 1

X Y
i 1
N

i1 i

X Y
i 1

ik i

El modelo de regresin ajustado es: Y


escalar, el modelo ajustado es:

X en notacin

yi 0 j xij , i 1,2 ,.., N


j 1

EJEMPLO:
En un estudio diseado para descubrir qu
factores podran estar relacionados con el
peso al nacer, se obtuvieron los siguientes
datos en 10 nios recin nacidos.

La informacin de 10 nios.

Peso al nacer Calificacin de condicin


Orden
en gramos (Y) socioeconmica (X1) de nacimiento (X2)
1361
8
4
1588
7
3
1815
4
4
2087
5
3
2268
5
2
2404
4
2
3402
3
2
3629
3
1
3765
2
1
4083
1
1

X'X

N
X i1
X i2

X
X
X X
i1
2
i1

i1

X 'Y X Y
X Y

i1 i

i2 i

X
X X
X

i2

i1

i2

26402

93361
51354

2
i2

i2

10 42 23

42 218 114
23 114 65

10 42 23
42 218 114

det( X ' X ) 23 114 65 2006

10
42
23

42 218 114

117 108 226 0.58524427 0.5383848 0.11266201


Adj ( X ' X )
1
0.05383848 0.06031904 0.08673978
( X ' X ) 1

108
121

174

det( X ' X ) 2006


226 174 416 0.11266201 0.08673978 0.20737787

Encontrando la inversa de la matriz y multiplicando XY, se


tiene:
0.58524427 0.5383848 0.11266201
( X ' X ) 1 X ' Y 0.05383848 0.06031904 0.08673978
0.11266201 0.08673978 0.20737787

4639.55932 0

244.432203 1
422.932203 2

26402
93361

51354

El modelo de regresin mltiple estimado es:

Y 4639.55932 244.432203 X i1 422.932203 X i 2


TABLA ANOVA: FORMA MATRICIAL.
Hiptesis a Probarse:

F. de V.

H 0 : 0 vs. H a : 0
G.L.

S.S.

Regresin

r-1

SSRm b ' X ' Y NY 2

Error Residual

N-r

SSE Y ' Y b ' X ' Y

Total

M.S.
SSRm
MSRm
r 1
SSE
MSE
rN

2
SST

Y
'
Y

NY
N-1
m

Fobs.
MSRm
MSE

ANOVA para el ejemplo anterior:


Tabla de Anlisis de Varianza para la Frecuencia Cardaca
F. de V.
G.L.
S.S.
M.S.
Fc. Signif
Debido a Regresin 2 8247389.510 4123694.7550 49.57
**
Error residual
7
582308.090
83186.8700
Total
9 8829697.600 981077.5111

Coeficiente de Determinacin: R2

SSRm
8247389.51
R
x100
( 100 ) 93.41%
SSTm
8829697.6
2

Coeficiente de Determinacin ajustado:

MSE
83186.87
~2
R 1
1
9152
. %
MSTm
981077.51

RESULTADO DEL SAS:


Model Crossproducts XX XY YY
Variable
Intercept
Intercept
10
X1
42
X2
23
Y
26402
Source
Model
Error
Corrected Total
Root MSE
Dependent Mean

Variable
Intercept
X1
X2

Variable
Intercept
X1
X2

DF
1
1
1

Sum of
Squares
8247390
582308
8829698

DF
2
7
9
288.42134
2640.20000
Parameter
Estimate
4639.55932
-244.43220
-422.93220

X1
42
218
114
93361

R-Square
Adj R-Sq

X2
23
114
65
51354
Mean
Square
4123695
83187
0.9341
0.9152

Parameter Estimates
Standard
Error
t Value
Pr > |t|
220.64596
21.03
<.0001
70.83610
-3.45
0.0107
131.34350
-3.22
0.0147

Covariance of Estimates
Intercept
X1
48684.639043
-4478.65504
-4478.65504
5017.7524056
-9372.000361
-7215.610897

F Value
49.57

Y
26402
93361
51354
78536258
Pr > F
<.0001

Coeff Var = 10.92422

95% Confidence Limits


4117.81454
5161.30411
-411.93295
-76.93145
-733.51024
-112.35417

X2
-9372.000361
-7215.610897
17251.115709

DISEOS FACTORIALES 2 K
1) DISEO FACTORIAL

22

El diseo factorial 22 estudia el efecto


de dos factores considerando dos
niveles en cada uno. Cada rplica de
este diseo consiste de 2x2 = 4
combinaciones o tratamientos que se
pueden denotar de diferentes maneras.

Ejemplo: Experimento 2 2.
Se desea estudiar el efecto del tamao de broca
(factor A) y la velocidad (factor B) sobre la
vibracin de la ranuradora (respuesta Y). Se
decide utilizar un diseo factorial 2 2 con cuatro
rplicas, cuatro repeticiones en cada tratamiento,
lo que da un total de 4x22 = 16 corridas del
proceso, que se realizan en orden aleatorio. El
tamao de la broca se prueba en 1/16 y en 1/8 de
pulgada y la velocidad en 40 y 90 revoluciones
por segundo, segn se describe en la siguiente
tabla:

Ejemplo: Experimento 2 2.
Se desea estudiar el efecto del tamao de broca (factor A) y la
velocidad (factor B) sobre la vibracin de la ranuradora
(respuesta Y). Se decide utilizar un diseo factorial 22 con cuatro
rplicas, cuatro repeticiones en cada tratamiento, lo que da un
total de 4x22 = 16 corridas del proceso, que se realizan en orden
aleatorio. El tamao de la broca se prueba en 1/16 y en 1/8 de
pulgada y la velocidad en 40 y 90 revoluciones por segundo, segn
se describe en la siguiente tabla:

Solucin del experimento 2 2.

PROCEDIMIENTO DE GENERACION DEL DISEO CON STATGRAPHICS

Luego se selecciona el diseo adecuado:

Aceptamos y se presenta las opciones de diseos de Cribado


(Screening pantalla ) para 22:

La generacion de la matriz de diseo en STATGRAPHICS es el siguiente:

PROCEDIMIENTO PARA REALIZAR EL ANOVA


1. SOLICITAR EN EL MENU PRINCIPAL: DDE ==> Analizar diseo ==> Analizar diseo (clic)

PROCEDIMIENTO PARA REALIZAR EL ANOVA


2. HACER clic en ACEPTAR.

PROCEDIMIENTO PARA REALIZAR EL ANOVA


3. EL ANOVA precedente muestra una fuente de variacin
para los bloques, esta fuente debe ignorarse haciendo los
siguientes pasos:

PROCEDIMIENTO PARA REALIZAR EL ANOVA


Hace clic en ACEPTAR, y aparece el ANOVA DEFINITIVO, tal como se
presenta a continuacin:

SE PUEDE REALIZAR EL EFECTO DE INTERACCIN, CON LA SIGUIENTE OPCIN:

Realizar CLIC en el tercer ICONO, y aparece las siguientes opciones:

Grfico de Interacciones:

Grfico de interacciones, cambiando los niveles

Grfico de Efectos Principales

PREDICCION SOBRE EL MEJOR TRATAMIENTO Y R 2

Realice CLIC en el segundo ICONO, y aparece lo siguiente:

Coeficientes de regresin para la variable vibracin

El modelo de regresin estimado es el siguiente:


Y = 23.8312 + 8.31875X1 + 3.76875X2 + 4.35625X1X2
Hacer CLIC en el ICONO de grfico, tal como se muestra a continuacin:

Dentro de esta grfica, realice clic con el botn derecho del mouse, y
aparece: opciones de ventana y marcar en el TIPO: la opcin CUADRADO:

REGIN EXPERIMENTAL Y RESPUESTA PREDICHA


PARA RANURADORA.

CLCULO DEL COEFICIENTE DE DETERMINACIN (R 2 Y R 2ajustado

Para fines de prediccin se recomienda un coeficiente de


determinacin ajustado de al menos 70%. Cuando hay muchos
factores se prefiere el estadstico R2(ajustado) en lugar de R2 sin
ajustar, puesto que este ltimo es engaoso al incrementarse de
manera artificial con cada termino que se agrega al modelo,
aunque sea un trmino que no contribuye en nada a la
explicacin de la respuesta. En cambio, el R2(ajustado) incluso
baja de valor cuando el trmino que se agrega no aporta nada.

REALIZAR LA PREDICCIN:
Y(-1,1) = 23.8312 + 8.31875(-1) + 3.76875(1) + 4.35625(-1)(1) = 14.92

VERIFICACIN DE SUPUESTOS.

En la opcin de grfico de diagnstico, escoja RESIDUOS vs PREDICHOS.

GRAFICO DE RESIDUOS vs. TIPO DE BROCA EN EL EXPERIMENTO DE RANURADORA.

GRAFICO DE RESIDUOS EN PAPEL NORMAL PARA EL EJEMPLO DE RANURADORA.

GRAFICO DE RESIDUOS vs. ORDEN DE CORRIDA DEL EXPERIMENTO DE RANURADORA.

2) DISEO FACTORIAL

23

El diseo factorial 23 se estudian tres factores en dos niveles


cada uno. Consta de 23 = 2x2x2 = 8 tratamientos diferentes, los
cuales pueden nombrarse con las mismas notaciones del diseo
anterior. Los tratamientos del diseo 23 se presenta a
continuacin:

Ejemplo 1: DISEO FACTORIAL 2 3


Se utiliz un experimento factorial 23 con el objetivo de localizar una
combinacin de temperaturas en la cual se rompan un mnimo de obleas
por efecto trmico. Se eligieron slo tres temperaturas porque algunas
sustancias, como por ejemplo el cido ntrico, hacen su trabajo a cierta
temperatura durante un periodo fijo, pero no se sabe el tiempo que
requieren para hacer su trabajo a otra temperatura. Los factores
temperatura y tiempo de residencia se pudieron incluir en el estudio, sin
embargo se prefiri no complicar el experimento porque las corridas
experimentales eran a nivel industrial, y el hecho de que se puede controlar
la temperatura anterior y posterior a esta sustancia para reducir su efecto
trmico. Adems, se consider que las tres temperaturas controladas eran
las de mayor efecto trmico sobre la oblea. Cabe agregar que ste fue un
experimento pionero en el rea de obleas de la empresa, y exista cierto
escepticismo por parte de los ingenieros acerca de un resultado interesante.
Los tres factores controlados y sus niveles, en unidades originales, son las
temperaturas:

T1 : Temperatura de grabado (-3C, -1C)


T2 : Temperatura de pirnha (60C, 98C)
T3 : Temperatura de agua (20C, 70C)
La combinacin (-3C, 98C, 20C) era el tratamiento usual o en
operacin antes del experimento. As, uno de los dos niveles en cada
factor es la temperatura usual y el otro es una temperatura que se
supone reduce el efecto trmico sobre la oblea. La respuesta medida
a cada oblea procesada en el experimento toma los valores de se
rompe o no se rompe. En la tabla siguiente se muestran las
frecuencias observadas de obleas rotas en cada lote, y se da la
proporcin de obleas rotas por cada 250 procesadas. Se observa a
simple vista que el factor T1 parece tener un efecto importante; en
su nivel bajo se rompen notoriamente ms obleas que en su nivel
alto. Pero mediante el anlisis estadstico se pretende tener
certidumbre y saber cules efectos influyen en la respuesta y cul es
la combinacin de temperaturas que minimiza el nmero de obleas
rotas.

RESULTADOS DEL ANLISIS

EL MODELO DE REGRESION Y LA SUPERFICIE DE RESPUESTA ES EL SIGUIENTE:

GRAFICO DE PARETO:

GRAFICO DE DANIEL:

EL ANALISIS DE VARIANZA FINAL ES EL SIGUIENTE:

GRAFICO DE RESIDUOS EN PAPEL NORMAL PARA OBLEAS ROTAS.

GRAFICO DE REPRESENTACION DE LOS EFECTOS PRINCIPALES PARA OBLEAS ROTAS.

EL MODELO LINEAL ESTIMADO ES EL SIGUIENTE:

GRAFICO DE EFECTO DE INTERACCION T_grabado por T_Agua

GRAFICO DE CUBO Y RESPUESTA PREDICA PARA OBLEAS ROTAS.

3) DISEO FACTORIAL 2 k NO REPLICADO.


Al aumentar el nmero de factores en el diseo 2k crece rpidamente el nmero de
tratamientos y el nmero de corridas experimentales. Si se realizan dos repeticiones en
cada punto se tienen que hacer 2x2k corridas experimentales, lo cual puede consumir
muchos recursos para ms de cuatro factores (k>=5), ya que seran 64 o ms corridas. El
diseo 25 es quiz el factorial ms grande que todava se puede correr con dos rplicas, lo
que implica hacer 32 corridas del proceso, pero incluso con una rplica (16 pruebas) de
este diseo es muchas veces suficiente para estudiar los 10 efectos de inters (ver la tabla
siguiente).

EJEMPLO 1: (Experimento 2 4 no replicado - Screening).


Un producto qumico se fabrica en un envase presurizado. Se lleva a cabo un
experimento factorial en la planta piloto para estudiar los factores que se
piensa influyen en el ndice de filtracin de este producto. Los cuatro factores
son la TEMPERATURA (A), LA PRESION (B), LA CONCENTRACION DEL
FORMALDEHIDO ( C ) y la VELOCIDAD DE AGITACION (D). Cada factor
esta presente con dos niveles. La matriz de diseo y los datos de la respuesta
obtenidos de una sola replica del experimento 2^4 se muestran en seguida. Las
16 corridas se hacen de manera aleatoria. El ingeniero del proceso esta
interesado en maximizar el ndice de filtracin. Las condiciones actuales del
proceso producen ndices de filtracin de alrededor de 75 gal/h. Asimismo, en el
proceso actual la concentracin de formaldehido, factor C, se usa en el nivel
alto. Al ingeniero le gustara reducir la concentracin de formaldehido lo mas
posible, pero no ha podido hacerlo porque siempre produce ndices de filtracin
mas bajos. El anlisis de estos datos se iniciara construyendo una grfica de
probabilidad normal de las estimaciones de los efectos. La formacin de signos
positivos y negativos para las constantes de los contrastes del diseo 2 4 se
muestra a continuacin. A partir de estos contrastes pueden estimarse 15
efectos factoriales, y las sumas de cuadrados.

SOLUCION: LA MATRIZ DE DISEO GENERADO CON STATGRAPHICS, ES EL SIGUIENTE:

ESTIMACIONES DE LOS EFECTOS DE LOS FACTORES:

GRFICA DE LA PROBABILIDAD NORMAL DE LOS EFECTOS PARA EL


DISEO FACTORIAL 24.

GRFICO DE LOS EFECTOS PRINCIPALES Y LAS INTERACCIONES


DEL EJEMPLO:

ANLISIS DE VARIANZA FINAL (SOLAMENTE SE HAN


QUEDADO CON LOS FACTORES ACTIVOS O SIGNIFICATIVOS)

4. DISEO FACTORIAL 2 k CON PUNTO AL CENTRO.

Cuando en un diseo factorial 2k los k


factores admitan un nivel de prueba
intermedio es recomendable formar un
tratamiento adicional formado por la
combinacin del nivel intermedio o medio
de todos los factores. A tal tratamiento o
combinacin se conoce como punto
central. Hay dos razones por las que es
necesario correr el punto central con cierto
nmero de rplicas.

DISEO FACTORIAL 2 k CON PUNTO AL CENTRO

La primera razn es obtener grados de libertad


adicionales para el error en la tabla de anlisis
de varianza (ANOVA), sin perjudicar el
balance en la estimacin de los efectos de
inters. Ya se ha mencionado la conveniencia
de interpretar ANOVAS con al menos 8 grados
de libertad en el error, condicin que a veces es
difcil de cumplir cuando por razones
econmicas el experimento se corre sin las
rplicas suficientes.

DISEO FACTORIAL 2 k CON PUNTO AL CENTRO

La segunda razn, dirigida a factores


cuantitativos, es que las repeticiones al centro
permiten detectar la posible presencia de
curvatura en al menos uno de los factores
objeto de estudio. La curvatura son los efectos
cuadrticos A2, B2,..... etc. Una vez detectados
este tipo de efectos, el experimento se aumenta
con ms puntos experimentales para estudiar
dicha curvatura. No es conveniente utilizar de
entrada un experimento que permita estudiar
la curvatura, ya que de no existir sta se
estaran gastando recursos.

EJEMPLO: (FACTORIALES 2 3 CON PUNTO AL CENTRO).

En un proceso de circuitos integrados


(obleas) interesa minimizar la corriente de
fuga, que se supone depende de la
temperatura de quemado (A), tiempo de
quemado (B) y porcentaje de nitrgeno
(C). Para ello se decide correr un
experimento factorial de 23 con cuatro
repeticiones al centro. Los resultados
obtenidos se muestran en seguida:

Informacin con puntos centrales.

La matriz de diseo generado con STATGRAPHICS es el siguiente:

TABLA DE ANLISIS DE VARIANZA

Colapsando los factores que no son significativos, se llega al mismo


ANOVA

5) FACTORIALES 2 k EN BLOQUES.

Por lo general, no es posible correr todos los tratamientos de


un diseo factorial 2k bajo las mismas condiciones
experimentales, es decir, durante la planeacin del
experimento aparece alguna restriccin adicional que hace
necesario considerar al menos un factor de bloques en el
estudio. El objetivo del experimento repartido en bloques es
estudiar el efecto de los k factores sobre la respuesta; no es el
objetivo estudiar el efecto de los factores de bloques, pero una
vez incluidos en el experimento se puede evaluar su efecto
sobre la respuesta y conocer la pertinencia de haberlo
considerado. El uso adecuado de bloques incrementa la
precisin del experimento, adems de ser un medio de darle un
rango de validez mayor al estudio: se tienen conclusiones
vlidas dentro de distintos bloques (das, mquinas, material,
tipo de producto, colegios, corrales, etc.) que son inevitables y
estn siempre presentes en el proceso.

EJEMPLO: (FACTORIALES 2 2 EN BLOQUES)


CUANDO LOS BLOQUES SON LAS RPLICAS.
Considere el factorial 22 con cuatro rplicas (ejemplo de
ranuradora). Suponga que cada una de las cuatro rplicas se
corri en un da diferente. El experimento repartido en cuatro
bloques (das) se muestra en la siguiente tabla:

MATRIZ DE DISEO EN STATGRAPHICS.

RESUMEN EN LA TABLA ANOVA.

C) DISEO FACTORIALES FRACCIONADOS 2 k-p

En stos diseos solamente se corre una parte (fraccin)


de los tratamientos de un diseo factorial 2k , debido a
que es imposible en la prctica correr todos los
tratamientos. Cuando crece el nmero de factores
tambin crece rpido el nmero de tratamientos en los
diseos factoriales completos 2k. Por ejemplo, para k = 6
factores una sola rplica del diseo factorial completo 2 6
implica correr 64 pruebas, que corresponden al nmero
de tratamientos del diseo; para k = 7 son 27 = 128
puntos de diseo. La idea es cmo lograr estudiar
muchos factores con slo una parte (una fraccin) del
diseo factorial.

Se muestra el nmero de efectos potencialmente de mayor inters para


diferentes diseos factoriales 2k, de ah se observa que el primer diseo
factorial completo que genera un importante exceso de informacin es el
factorial completo 25 . Ya que este diseo permite estimar 31 efectos, de los
cuales slo 15 son potencialmente importantes (los 5 efectos principales ms
las 10 interacciones dobles) y los 16 restantes efectos, conformados por las
interacciones de tres o ms factores, prcticamente se pueden ignorar a
priori.

En seguida se mostrarn que con una


fraccin a la mitad del diseo factorial
completo 25((1/2)22 = 25-1), se puede estimar
limpiamente los 15 efectos potenciales
importantes, sacrificando la informacin
relativa a las 16 interacciones de alto orden
que no interesan. As, con un diseo
factorial fraccionado 25-1 se puede obtener
esencialmente la misma informacin que
con el factorial completo 25, pero con la
mitad del costo experimental.

EJEMPLO 1: (Experimento 2 5 no replicado - Screening).

En una planta donde se fabrican semiconductores se


quiere mejorar el rendimiento del proceso va diseo
de experimentos. De acuerdo con la experiencia del
grupo de mejora, los factores que podan tener mayor
influencia sobre la variable de respuesta
(rendimiento), as como los niveles de prueba
utilizados, son los siguientes:
A = Nivel de abertura (pequea, grande)
B = Tiempo de exposicin (20% abajo, 20% arriba).
C = Tiempo de revelado (30 seg, 45 seg).
D = Dimensin de la mscara (pequea, grande)
E = Tiempo de grabado (14.5 min, 15.5 min).

Niveles de prueba utilizados en el experimento.

DISENO FACTORIAL FRACCIONADO: 2 5-1


Fraccionando a dos Fracciones (Fraccin principal y Fraccin complementaria).

PROCEDIMIENTO PARA EL DISENO FACTORIAL FRACCIONADO DE


2 5-1
DDE ==> Crear diseo ==> Diseo nuevo (Aparece las siguientes opciones)

Una vez aceptado, se presenta el siguiente cajn de dilogo:

PROCEDIMIENTO PARA REALIZAR EL ANOVA


2. HACER clic en ACEPTAR.

Aceptamos, y se presentan las siguientes opciones:

Se selecciona la opcin adecuada en el ICONO - ACEPTAR Y se presenta:

Se genera la matriz de diseo y se debe ingresar la VARIABLE DE RESPUESTA

Se procede con las siguientes opciones:


DDE ==> Analizar diseo ==> Analizar diseo (aparece la
siguiente pantalla).

Presentacin de resultados analticos y grficos

EN EL ICONO DE GRAFICOS SELECCIONAR, LA OPICON SIGUIENTE:

EXCLUIR LOS EFECTOS QUE NO SON IMPORTANTES Y QUEDARSE CON LOS


EFECTOS MAS IMPORTANTES:

ANLISIS DE VARIANZA DEFINITIVO:

R-cuadrada = 99.4423 porciento


R-cuadrada (ajustada por g.l.) = 99.2395 porciento
Error estndar del est. = 1.69726
Error absoluto medio = 1.24219
Estadstico Durbin-Watson = 1.98964 (P=0.5097)
Autocorrelacin residual de Lag 1 = -0.0659517

Vous aimerez peut-être aussi