Académique Documents
Professionnel Documents
Culture Documents
DE LA INFORMACIN Y COMUNICACIN
LABORATORY 2: NUMERICAL AND DATA-INTENSIVE COMPUTING
(COURSE 2012/2013)
SYSTEM OF LINEAR EQUATIONS
PROFESOR: DR. CARLOS SANTACRUZ
JOS LUIS CARRILLO MEDINA
CESAR NARANJO HIDALGO
EJERCICIO 1.
A partir de los datos del Ejercicio No. 3 de la anterior Unidad. Calcule:
Fraction of the total variance explained by the first principal component
Regression coefficients using the first principal component instead of the original four
variables
Scrip de MatLab
% Scrip de PCA
clear all
clc
Z = load ('matrices.txt')
X= Z(:,1:5)
n=size(X);
S=cov(X)
[U,L]=eig(S)
m=size(S);
Obtenemos la media de X
a
% # reconstruccin
% # total n_pc=m(1)
n_pc=1;
for j=1:n(1)
Xr(j,:)=media;
for k=1:n_pc;
Xr(j,:)= Xr(j,:) + a(j,k)*U(:,m(1)+1-k)'
end
end
Xr
p=0;
Nmero de componentes
for k=1:n_pc
p = p + L(m(1)+1-k,m(1)+1-k);
end
p = p / trace(l);
fprintf('El aporte de las %i componentes es de %f \n',j,p*100);
Mediante este script se obtiene el porcentaje de recuperacin de las valores originales, a travs del
nmero de componentes: 1, 2, 3, 4 y 5 componentes ( autovalores asociados a S).
n_pc --> nmero de componentes
Con n_pc = 5;
Ejecutamos el script y obtenemos:
Z = matriz de datos (De la forma: A1X1 + A2X2 + A3X3 + A4X4 + A5X5 = Y)
Columna 1: X1; Columna 2: X2; Columna 3: X3; Columna 4: X4; Columna 5: X5; Columna 6: Y;
Z=
86
62
110
101
100
78
120
105
112
120
87
133
140
84
106
109
104
150
98
120
74
96
104
94
91
110
97
107
117
101
85
77
122
119
89
81
120
121
113
102
129
83
118
125
94
121
114
73
121
129
100
99
103
93
95
95
80
116
106
105
90
113
96
98
109
102
100
107
108
95
91
114
93
115
97
95
99
101
91
102
94
89
112
110
87
90
101
100
85
99
101
93
108
100
96
95
91
80
85
105
87
100
103
95
88
84
74
102
105
97
88
108
89
78
109
108
102
110
95
90
85
103
80
104
83
88
80
96
76
80
73
58
116
104
99
64
126
94
71
111
109
100
127
99
82
67
109
78
115
83
110 100 95 87
97 99 99 100
107 103 101 103
117 93 91 95
101 95 102 88
78
120
105
112
120
87
133
140
84
106
109
104
150
98
120
74
96
104
94
91
85
77
122
119
89
81
120
121
113
102
129
83
118
125
94
121
114
73
121
129
95
80
116
106
105
90
113
96
98
109
102
100
107
108
95
91
114
93
115
97
94
89
112
110
87
90
101
100
85
99
101
93
108
100
96
95
91
80
85
105
84
74
102
105
97
88
108
89
78
109
108
102
110
95
90
85
103
80
104
83
0.7765
0.4577
0.2216
0.2098
0.3074
11.2337
18.6071
-1.2450
6.4582
-3.6409
-4.0538
-40.8837
17.2136
8.7594
-23.1952
-13.4968
-2.5274
-12.9464
11.1904
-0.5429
16.0918
-17.3395
-14.1265
18.8599
-21.4343
24.2254
13.1730
-31.7843
18.9551
22.4493
-4.5135
14.2117
5.8966
-7.8732
-4.6046
3.2885
-14.9351
5.8686
3.1924
8.8571
3.9417
4.8738
-18.9955
-13.0573
16.1293
-0.6207
15.3430
1.3848
-3.4001
-3.4081
-13.3543
10.5946
0.3417
9.0155
-18.1771
0.8734
-8.6711
-3.7017
4.0212
-7.8040
-4.8378
-2.3168
-7.0712
-8.7847
7.8594
-3.1806
3.4073
1.2196
10.6061
-1.6858
-0.5196
-2.1643
-4.1571
1.9293
-2.1348
-0.8632
9.2462
7.6343
16.1170
-5.0211
-2.6767
3.3281
1.7881
9.0022
-2.0538
-3.7050
0.8440
-9.4853
-0.3250
-1.7639
2.7713
-1.3932
0.1908
-3.0765
0.9120
8.5196
2.6417
1.4466
-3.5672
-0.5205
4.5709
-2.0477
-2.6842
0.6013
-3.3176
95.0000
99.0000
101.0000
91.0000
102.0000
94.0000
89.0000
112.0000
110.0000
87.0000
90.0000
101.0000
100.0000
85.0000
99.0000
101.0000
93.0000
108.0000
100.0000
96.0000
95.0000
91.0000
80.0000
87.0000
100.0000
103.0000
95.0000
88.0000
84.0000
74.0000
102.0000
105.0000
97.0000
88.0000
108.0000
89.0000
78.0000
109.0000
108.0000
102.0000
110.0000
95.0000
90.0000
85.0000
103.0000
80.0000
110.0000
97.0000
107.0000
117.0000
101.0000
85.0000
77.0000
122.0000
119.0000
89.0000
81.0000
120.0000
121.0000
113.0000
102.0000
129.0000
83.0000
118.0000
125.0000
94.0000
121.0000
114.0000
73.0000
100.0000
99.0000
103.0000
93.0000
95.0000
95.0000
80.0000
116.0000
106.0000
105.0000
90.0000
113.0000
96.0000
98.0000
109.0000
102.0000
100.0000
107.0000
108.0000
95.0000
91.0000
114.0000
93.0000
ORD.
NO.
COMPONENTES
% DE
RECUPERACIN
1
2
3
4
5
1
2
3
4
5
49.82%
83.45%
94.16%
98.39%
100.00%
Y
88
80
96
76
80
73
58
116
104
99
64
126
94
71
111
109
100
127
99
82
67
109
78
115
83
Podemos graficamos estos datos en Excel, obtenemos la dispersin de los mismos y los valores de
1 y 2.
92,1999972
0,70172616
Y = 1 + 2 * C1
1 = 92,1999972
2 = 0,70172616
Coeficiente de Regresin: Primer Componente (C1)
Y= 92,1999972 + 0,70172616 * C1
Con esto obtenemos los valores de X con una principal componente: n_pc = 1;
91.8664
76.3593
110.5834
103.4513
97.6276
76.4196
93.1168
116.6892
118.5132
106.8474
79.8673
131.9845
99.9457
90.8058
110.9774
106.7738
103.3414
90.8414
100.6827
114.5762
115.6513
108.7755
92.8735
123.5912
128.9368
87.6051
108.5337
118.8198
96.3791
142.1087
108.5326
106.6986
86.5142
104.8938
84.2517
105.6089
101.7908
121.7949
97.4341
109.7694
115.8320
102.6054
129.5584
109.7687
108.6878
96.7911
107.6240
95.4576
108.0455
105.7951
Los datos obtenidos con la primera componente no son buenos por cuanto estamos utilizando el
49,82% de la informacin.
EJERCICIO NO. 2.
Usando el algoritmo Page Rank determinar la pgina web ms importantes de la EPS.
Para realizar esta tarea se cuentas con:
eps.ids: Archivo que representa la relacin entre una pgina web con cada uno de sus enlaces de
la EPS y su correspondiente nmero de identificacin.
epsfull.mat: Archivo que contiene la matriz de relacin de pginas web de la EPS
E( i, j )
0
si el identificador i de la pgina no tiene ningn enlace a la pgina j,
1
si existe un enlace desde la pgina i a la pgina j.
Existen 3095 pginas en la web de la EPS
Calculo de la pagina ms importante de la EPS (algoritmo Page Rank).
La matriz Q de la cadena de Markov, la cual se define como la matriz de hipervnculos, donde
[F,C]=size(eps);
for i=1:F
eps(i,i)=1;
end
for i=1:F
SF(i,1)=sum(eps(i,:));
end
suma = 0;
for i=1:F
Pno(i,1) = Pno(i,1)/SPno;
end
i=1;
while (i<=nIter)
Pn = Prob*Pno;
nPno = Pno/norm(Pno);
nPn = Pn/norm(Pn);
ErrP = norm(nPn - nPno)
if (ErrP < epsilon)
j = i;
i = nIter + 1;
end
i = i + 1;
Pno = Pn;
end
maxElem = max (Pn);
i = 1;
while (i<=F)
if (Pn(i) == maxElem)
fprintf('El maximo: %d',i);
%Encuentro la posicin del mximo autovalor
end
i = i + 1;
% fprintf('%f %f %d\n',Pn(i:1), i, maxElem);
end
Generado el programa se obtiene los siguientes resultados
Se aplico un:
nIter = 10000;
epsilon = 0.0000001;
obtenindose que:
La mxima probabilidad corresponde: 0.029596541640697
Nmero de Iteraciones realizadas: 172
El error 9.670484508254124e-008
El autovalor mximo encontrado est en la posicin: 2140
De. archivo eps.ids la fila 2140 corresponde a