Académique Documents
Professionnel Documents
Culture Documents
de internet
Carlos D’Andrea
26 / 09 / 2012
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Bloques temáticos de Álgebra (EI)
Sistemas lineales de ecuaciones
Matrices & determinantes
Espacios vectoriales
Subespacios, transformaciones lineales, ...
Polinomios
Números complejos
Vectores y valores propios – Diagonalización
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Álgebra Lineal en la Informática
Agrupamiento y clasificación de datos
Programación gráfica
Redes sociales
Sistemas de recomendación
Reconocimiento de formas (música, huellas, fotografías)
Inteligencia artificial
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¡Todo esto lo verán después!
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
El álgebra lineal detrás de
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¿Qué es un buscador de internet?
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Trabajo básico de un buscador de internet
1 “Censar” las páginas de internet de acceso público
2 Indexar los datos censados de acuerdo a su importancia con
respecto a las palabras claves
3 Ordenar estos datos de acuerdo a su importancia con
respecto a las palabras claves
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
El algoritmo “PageRank”
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
El modelo PageRank
El universo de páginas de internet públicas es un gran grafo
dirigido donde
cada página web es un nodo
hay una arista orientada entre páginas que citan a otras
páginas
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
La “importancia” de una página web
Es alta si
la citan muchas páginas
La citan páginas “importantes”
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Postulado PageRank
La importancia xj de la página Pj es proporcional a la suma
de las importancias de las páginas que enlazan con Pj
0 · x1 +1 · x2 +1 · x3 +1 · x4 +1 · x5 = λ x1
0 · x1 +0 · x2 +1 · x3 +1 · x4 +1 · x5 = λ x2
1 · x1 +0 · x2 +0 · x3 +0 · x4 +1 · x5 = λ x3
0 · x1 +0 · x2 +1 · x3 +0 · x4 +0 · x5 = λ x4
1 · x1 +0 · x2 +0 · x3 +1 · x4 +0 · x5 = λ x5
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Un poco de Álgebra lineal
MT
I ·x = λ·x
0 0 1 0 1
1 0 0 0 0
MI =
1 1 0 1 0
1 1 0 0 1
1 1 1 0 0
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¡Vectores y valores propios!
MT
I ·x = λ·x
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
“Democratizando” el modelo
1 1
0 0 2 0 2
1 0 0 0 0
1 1 1
MI ,E =
13 3 0 3 0
1 1
3 3 0 0 3
1 1 1
3 3 3 0 0
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Una sesión de Mathematica
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¿Es verdad que...
siempre tiene valores propios reales MT
I ,E ?
siempre hay un vector propio con todas sus coordenadas no
negativas?
hay única solución a este problema???
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Eso no es... verdad
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Teorema (Perron– Frobenius (1907–1912))
Supongamos que M tiene entradas no negativas y además es
irreducible. Entonces
existe un valor propio simple λ > 0 tal que M · x = λ · x, con
x>0
este valor propio es mayor o igual, en módulo, que todos los
demás valores propios de M
cualquier otro vector propio positivo de M es un múltiplo
escalar de x
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Matrices irreducibles
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Matriz irreducible ↔ grafo “fuertemente” conexo
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¿Es el grafo de internet fuertemente conexo?
McI,E := c MI ,E + (1 − c)U
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Corolario: todo grafo dirigido tiene su importancia
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
1 1 1 1 1 1
0 1 0 0 0 0 6 6 6 6 6 6
1 1 1 1 1 1 1 1
0 0 2 2 0 0
6 6 6 6 6 6
1 1 1 1 1 1
0 0 0 0 0 0
6 6 6 6 6 6
0, 85 1 1 + 0, 15
1 1 1 1 1 1
0 0 0 0 2 2 6 6 6 6 6 6
1 1 1 1 1 1
0 0 0 0 0 1
6 6 6 6 6 6
1 1 1 1 1 1
0 0 1 0 0 0 6 6 6 6 6 6
=
0, 025 0, 875 0, 025 0, 025 0, 025 0, 025
0, 025 0, 025 0, 45 0, 45 0, 025 0, 025
0, 025 0, 025 0, 025 0, 025 0, 025 0, 025
0, 025 0, 025 0, 025 0, 025 0, 45 0, 45
0, 025 0, 025 0, 025 0, 025 0, 025 0, 875
0, 025 0, 025 0, 875 0, 025 0, 025 0, 025
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Del existencialismo al Cálculo
Métodos Numéricos
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Teorema 1 (Perron, 1907)
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Método de las potencias (usado por Google)
limn→∞ kM·x nk
kxn k = λ
con probabilidad 1
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Google y PageRank
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
Otras aplicaciones del PageRank
Clasificación para las eliminatorias de la NBA
Modelos de evolución de ecosistemas
Análisis de redes de proteínas
Alternativa al ISI impact factor
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
“The $25, 000, 000, 000 Eigenvector: The Linear
Algebra behind Google”, Kurt Bryan & Tanya Leise, Siam
Review 48 (3), 569–581, 2006
“Les Matemàtiques de Google: l’algorisme
PageRank”, Joan Gimbert, Butlletí de la Societat Catalana de
Matemàtiques, Vol 26, 1, 2011, 29–55
“El secreto de Google y el Álgebra Lineal”, P.
Fernández, Bol. Soc. Esp. Mat. Apl. 30 (2004), 115–141
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¿Qué hemos aprendido hoy?
Álgebra lineal
Teoría de grafos
Matrices estocásticas
Cálculo numérico
Análisis funcional
Algoritmos de búsqueda
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
¿Qué es la ingeniería?
... es la actividad
de trasformar el
conocimiento en
algo práctico
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet
http://atlas.mat.ub.es/personals/dandrea
Carlos D’Andrea
El Álgebra Lineal detrás de los buscadores de internet