Académique Documents
Professionnel Documents
Culture Documents
(http://barabasi.com/networksciencebook)
Captulo 1: Introduccin
A primera vista, las dos imgenes del satlite de la Imagen 1.1 son indistinguibles,
mostrando luces brillantes en reas muy pobladas y espacios oscuros que marcan
vastos bosques y ocanos deshabitados. Sin embargo, en una inspeccin ms
minuciosa observamos diferencias: Toronto, Detroit, Cleveland, Columbus y Long
Island, brillantes en (a), se han oscurecido en (b). Esto no es a causa de la prxima
pelcula de Armageddon, pero representa una imagen real del Noreste de Estados
Unidos el 14 de agosto de 2003, antes y despus del apagn que dej sin electricidad a
unos 45 millones de personas en ocho estados de Estados Unidos y a otros 10 millones
en Ontario.
Imagen 1.1
El apagn de 2003 es un ejemplo tpico de un fallo en cascada. Cuando una red acta
como un sistema de transporte, un fallo local cambia las cargas a otros nodos. Si la
carga adicional es insignificante, el sistema puede absorberla sin problemas y el fallo
pasa desapercibido. Si, sin embargo, la carga extra es demasiado para los nodos
vecinos, tambin se inclinarn y redistribuirn la carga a sus vecinos. En cualquier
momento nos enfrentamos a un evento en cascada, cuya magnitud depende de la
posicin y la capacidad de los nodos que fallaron inicialmente.
Se han observado fallos en cascada en muchos sistemas complejos. Se llevan a cabo
en Internet, cuando el trfico se desva para evitar que los routers funcionen mal. Esta
operacin de rutina puede ocasionalmente crear ataques de denegacin de servicio
(DOS), lo que hace que los routers completamente funcionales no estn disponibles al
ser superados con el trfico. El colapso financiero de 2009-2011 se ve a menudo como
un ejemplo clsico de un fallo en cascada, la crisis de credito estadounidense que
acabo paralizando la economa del planeta, dejando atrs decenas de bancos,
corporaciones e incluso estados en banca rota. Los fallos en cascada tambin pueden
ser inducidos artificialmente. Un ejemplo es el esfuerzo mundial para secar el
suministro de dinero de las organizaciones terroristas, con el objetivo de incapacitar su
capacidad para funcionar. Del mismo modo, los investigadores del cncer pretenden
inducir fallos en cascada en nuestras clulas para destruir las clulas cancerosas.
El apagn del Noreste de Estados Unidos ilustra varios temas importantes de este
libro: Primero, para evitar los fallos en cascadas, debemos entender la estructura de la
red en la que se propaga la cascada. En segundo lugar, debemos ser capaces de
modelar los procesos dinmicos que tienen lugar en estas redes, como el flujo de
electricidad. Finalmente, necesitamos descubrir cmo la interaccin entre la estructura
de la red y la dinmica afecta a la robustez de todo el sistema. Aunque los fallos en
cascada pueden parecer aleatorios e impredecibles, siguen leyes reproducibles que
pueden cuantificarse e incluso predecirse utilizando las herramientas de la Network
Science.
El apagn tambin ilustra un tema ms amplio: la vulnerabilidad debida a la
interconexin. De hecho, en los primeros aos de la energa elctrica cada ciudad tena
sus propios generadores y red elctrica. Sin embargo, la electricidad no se puede
almacenar: una vez producida, la electricidad debe ser consumida inmediatamente.
Por lo tanto, tena sentido econmico vincular ciudades vecinas, permitindoles
compartir la produccin extra y pedir prestado electricidad si fuera necesario. Hoy
debemos el bajo precio de la electricidad a la red de energa, la red que emergi a
travs de estas conexiones en pares, uniendo a todos los productores y consumidores
en una sola red. Permite que la energa producida a bajo costo sea transportada
instantneamente en cualquier lugar. La electricidad, por lo tanto, ofrece un ejemplo
maravilloso de las grandes redes de impacto positivo que tienen en nuestra vida.
Ser parte de una red tiene sus beneficios, sin embargo los fallos locales, como la
ruptura de un fusible en algn lugar en Ohio, no permanece localmente. Su impacto
puede viajar a lo largo de los enlaces de la red y afectar a otros nodos, consumidores e
individuos aparentemente eliminados del problema original. En general, la
interconectividad induce una notable no-localidad: permite que la informacin, las
prcticas empresariales, el poder, la energa y los virus se difundan en sus respectivas
redes sociales o tecnolgicas, llegando a nosotros, sin importar nuestra distancia de la
fuente. Por lo tanto las redes llevan ventajas y vulnerabilidades. Descubrir los factores
que pueden aumentar la difusin de rasgos considerados positivos y limitar otros que
hacen que las redes sean dbiles o vulnerables es uno de los objetivos de este libro.
Seccin 1.2: Las redes en el corazn de los sistemas complejos
La Network Science es una nueva disciplina. Uno puede debatir su comienzo exacto,
pero por todas las cuentas el campo ha emergido como disciplina separada solamente
en el siglo XXI.
Por qu no tenamos la Network Science doscientos aos antes? Despus de todo,
muchas de las redes que explora el campo no son nuevas: las redes metablicas se
remontan a los orgenes de la vida, con una historia de cuatro mil millones de aos, y
la red social es tan antigua como la humanidad. Adems, muchas disciplinas, desde la
bioqumica hasta la sociologa y la ciencia del cerebro, han estado tratando con sus
propias redes durante dcadas. La teora de los grafos, un subcampo prolfico de las
matemticas, ha explorado los grafos desde 1735. Hay razn, por lo tanto, para
llamar a la ciencia de la red la ciencia del siglo XXI?
Algo especial ocurri en los albores del siglo XXI que trascendi los campos de
investigacin individuales y cataliz el surgimiento de una nueva disciplina (Imagen
1.3). Para entender por qu esto sucedi ahora y no doscientos aos antes,
necesitamos discutir las dos fuerzas que han contribuido a la aparicin de la Network
Science.
Imagen 1.3: La aparicin de la Network Science
Mientras que el estudio de las redes tiene una larga historia, con races en la teora de
los grafos y la sociologa, el captulo moderno de la Network Science surgi slo
durante la primera dcada del siglo XXI.
El inters explosivo en las redes est bien documentado por el patrn de citas de dos
artculos clsicos, el artculo de Paul Erds y Alfrd Rnyi de 1959, que marca el
comienzo del estudio de redes aleatorias en la teora de grafos [2] y el artculo de 1973
de Mark Granovetter, el documento sobre la red social ms citado [3]. La figura
muestra las citas anuales que cada artculo adquiri desde su publicacin. Ambos
papeles eran muy apreciados dentro de su disciplina, pero tenan un impacto limitado
fuera de su campo. El crecimiento explosivo de las citas a estos documentos en el siglo
XXI es una consecuencia de la aparicin de la Network Science, atrayendo una nueva
atencin interdisciplinaria a estas publicaciones clsicas.
Es fcil enumerar las diferencias entre las diversas redes que encontramos en la
naturaleza o la sociedad: los nodos de la red metablica son molculas diminutas y los
enlaces son reacciones qumicas regidas por las leyes de la qumica y la mecnica
cuntica; Los nodos de la WWW son documentos web y los enlaces son URL
garantizados por algoritmos informticos; Los nodos de la red social son individuos y
los eslabones representan vnculos familiares, profesionales y de amistad.
Los procesos que generaron estas redes tambin difieren mucho: las redes
metablicas fueron modeladas por miles de millones de aos de evolucin; La WWW
es construida por las acciones colectivas de millones de personas y organizaciones; Las
redes sociales estn conformadas por normas sociales cuyas races se remontan a
miles de aos. Dada esta diversidad en tamao, naturaleza, alcance, historia y
evolucin, no nos sorprendera que las redes detrs de estos sistemas fueran muy
diferentes.
Un descubrimiento clave de la ciencia en red es que la arquitectura de las redes que
emergen en diversos mbitos de la ciencia, la naturaleza y la tecnologa son similares
entre s, una consecuencia de ser gobernados por los mismos principios organizativos.
En consecuencia, podemos utilizar un conjunto comn de herramientas matemticas
para explorar estos sistemas.
En resumen, si bien muchas disciplinas han hecho importantes contribuciones a la
Network Science, el surgimiento de un nuevo campo se hizo en parte posible gracias
a la disponibilidad de datos, ofreciendo mapas precisos de redes encontradas en
diferentes disciplinas. Estos diversos mapas permitieron a los cientficos de la red
identificar las propiedades universales de las diversas caractersticas de la red. Esta
universalidad ofrece la base de la nueva disciplina de la Network Science.
La Network Science se define no slo por su tema, sino tambin por su metodologa.
En esta seccin se discuten las caractersticas clave del enfoque adoptado de la
Network Science para entender los sistemas complejos.
Naturaleza interdisciplinaria
La Network Science ofrece un lenguaje a travs del cual diferentes disciplinas pueden
interactuar sin problemas entre s. De hecho, los bilogos celulares, los cientficos del
cerebro y los cientficos informticos se enfrentan a la tarea de caracterizar el
diagrama de cableado detrs de su sistema, extraer informacin de conjuntos de datos
incompletos y ruidosos y comprender la robustez de sus sistemas frente a fallos o
ataques.
Sin duda, cada disciplina trae un conjunto diferente de objetivos, detalles tcnicos y
desafos, que son importantes por s mismos. Sin embargo, la naturaleza comn de
muchas cuestiones con las que luchan estos campos ha llevado a una fertilizacin
interdisciplinaria de herramientas e ideas. Por ejemplo, el concepto de centralidad
intermedia que surgi en la literatura de la red social en los aos setenta desempea
hoy un papel clave en la identificacin de nodos de alto trfico en Internet. Del mismo
modo los algoritmos desarrollados por los cientficos informticos para la particin de
grafos han encontrado nuevas aplicaciones en la identificacin de los mdulos de las
enfermedades en la medicina o la deteccin de comunidades dentro de las grandes
redes sociales.
Varios conceptos clave de la Network Science tienen sus races en la teora de grafos,
un campo frtil de las matemticas. Lo que distingue la Network Science de la teora
de grafos es su naturaleza emprica, es decir, su enfoque en los datos, la funcin y la
utilidad. Como veremos en los prximos captulos, en la Network Science nunca
estamos satisfechos con el desarrollo de herramientas matemticas abstractas para
describir una determinada propiedad de la red. Cada herramienta que desarrollamos
se prueba con datos reales y su valor se juzga por las ideas que ofrece sobre las
propiedades y el comportamiento de un sistema.
Naturaleza cuantitativa y matemtica
Naturaleza computacional
Las empresas ms exitosas del siglo XXI, desde Google a Facebook, Twitter, LinkedIn,
Cisco, Apple y Akamai, basan su tecnologa y su modelo de negocio en las redes. De
hecho, Google no slo ejecuta la mayor operacin de mapeo de red que la humanidad
ha construido, generando un mapa completo y constantemente actualizado de la
WWW, pero su tecnologa de bsqueda est profundamente conectada con las
caractersticas de red de la Web.
Las redes han ganado popularidad con la aparicin de Facebook, la empresa con la
ambicin de mapear la red social de todo el planeta. Facebook no fue el primer sitio de
redes sociales y es probable que no sea el ltimo: Un impresionante ecosistema de
herramientas de redes sociales, de Twitter a LinkedIn, estn luchando por la atencin
de millones de usuarios. Algoritmos concebidos por los cientficos de la red sirven de
combustible de estos sitios, ayudando a todo, desde la recomendacin de amigos a la
publicidad.
Varias nuevas empresas aprovechan las oportunidades que ofrecen las redes de salud
y medicina. Por ejemplo, GeneGo recopila mapas de interacciones celulares de la
literatura cientfica y Genomatica utiliza el poder predictivo detrs de las redes
metablicas para identificar objetivos de frmacos en bacterias y humanos.
Recientemente grandes compaas farmacuticas, como Johnson & Johnson, han
hecho inversiones significativas en la medicina de red, vindolo como el camino hacia
futuros frmacos.
El terrorismo es una enfermedad del siglo XXI, que requiere recursos significativos para
combatirlo en todo el mundo. El Network Thinking est cada vez ms presente en el
arsenal de varias agencias policiales encargadas de responder a las actividades
terroristas. Se usa para interrumpir la red financiera de las organizaciones terroristas y
para mapear las redes adversarias, ayudando a descubrir el papel de sus miembros y
sus capacidades. Si bien gran parte del trabajo en esta rea est clasificada, se han
hecho pblicos varios estudios de casos bien documentados. Los ejemplos incluyen el
uso de las redes sociales para encontrar a Saddam Hussein o a los responsables de los
atentados del 11 de marzo de 2004 en los trenes de Madrid a travs del examen de la
red de llamadas mviles. Los conceptos de redes tambin han impactado la doctrina
militar, llevando al concepto de Network-Centric Warfare, dirigida a combatir
conflictos de baja intensidad contra redes terroristas y criminales que emplean una
organizacin descentralizada flexible de la red.
Dadas las numerosas aplicaciones militares potenciales, tal vez no sea sorprendente
que uno de los primeros programas acadmicos en Network Science se inici en West
Point, la Academia Militar del Ejrcito de los Estados Unidos. Adems, a partir de 2009,
el Laboratorio de Investigacin del Ejrcito dedic ms de 300 millones de dlares para
apoyar centros de Network Science en todo Estados Unidos.
El conocimiento y las capacidades ofrecidas por las redes tambin pueden ser
utilizados para el mal. Tales malos usos fueron bien ilustrados por la operacin de
mapeo de red indiscriminada por la Agencia de Seguridad Nacional. Bajo el pretexto de
detener futuros ataques terroristas, la NSA supervis las comunicaciones de cientos de
millones de personas, de Estados Unidos y del extranjero, que reconstruyeron su red
social. Con esa red los cientficos han despertado a una nueva responsabilidad social:
asegurar el uso tico de nuestras herramientas y conocimientos.
Epidemias: De la prevencin a la detencin de virus mortales
Si bien la pandemia de H1N1 no fue tan devastadora como se tema al comienzo del
brote en 2009, gan un papel especial en la historia de las epidemias: Fue la primera
pandemia cuya evolucin del curso y el tiempo se pronostic con precisin meses
antes de que la pandemia alcanzara su pico. Esto fue posible gracias a los avances
fundamentales en la comprensin del papel de las redes de transporte en la
propagacin de los virus.
Imagen 1.12
La figura compara estas palabras con el uso de la red, que disfrut de un espectacular
aumento despus de la dcada de 1980, superando tanto la evolucin como el
cuntico. Mientras que el trmino red tiene muchos usos (al igual que la evolucin y el
cuntico), su espectacular aumento capta la creciente conciencia social de las redes.
Hay algo comn entre los avances facilitados por la teora evolutiva, la mecnica
cuntica y la ciencia de la red: no son slo campos cientficos importantes con su
propio ncleo intelectual y cuerpo de conocimiento, sino que tambin son plataformas
de apoyo. De hecho, la revolucin actual en gentica se basa en la teora evolutiva y la
mecnica cuntica ofrece una plataforma para una amplia gama de avances en la
ciencia contempornea, desde la qumica a la electrnica. De manera similar, la ciencia
de la red es una plataforma que permite, ofreciendo nuevas herramientas y
perspectivas para una amplia gama de problemas cientficos, desde la creacin de
redes sociales hasta el diseo de frmacos.
Dado este impacto excepcional que las redes tienen tanto en la ciencia como en la
sociedad, debemos dominar las herramientas para estudiarlas y cuantificarlas.
Captulo 2: Teora de Grafos
Euler represent cada una de las cuatro reas separadas por el ro con las letras A, B, C
y D (Imagen 2.1). Luego conect con lneas cada pedazo de tierra que tena un puente
entre ellos. As construy un grafo, cuyos nodos eran pedazos de tierra y los enlaces
eran los puentes. Entonces Euler hizo una simple observacin: si hay un camino
cruzando todos los puentes, pero nunca el mismo puente dos veces, entonces los
nodos con un nmero impar de enlaces deben ser el punto inicial o final de este
camino. De hecho, si llega a un nodo con un nmero impar de enlaces, puede
encontrarse sin tener ningn enlace no utilizado para que lo deje.
Imagen 2.1 Los puentes de Knigsberg
- Un mapa contemporneo de Knigsberg (ahora Kaliningrad, Rusia) durante los tiempos de Euler.
- Una ilustracin esquemtica de las cuatro piezas de tierra de Knigsberg y los siete puentes a travs de
ellas.
- Euler construy un grafo que tiene cuatro nodos (A, B, C, D), cada uno correspondiente a un pedazo de
tierra, y siete enlaces, cada uno correspondiente a un puente. l entonces demostr que no hay ninguna
trayectoria continua que cruce los siete puentes mientras que nunca se cruce el mismo puente dos
veces. El pueblo de Knigsberg renunci a su bsqueda infructuosa y en 1875 construy un nuevo
puente entre B y C, aumentando el nmero de enlaces de estos dos nodos a cuatro. Ahora solo quedaba
un nodo con un nmero impar de enlaces. En consecuencia, deberamos ser capaces de encontrar el
camino deseado. Puedes encontrar uno t mismo?
Un sendero que atraviesa todos los puentes puede tener slo un punto de partida y un
punto final. Por lo tanto, tal ruta no puede existir en un grafo que tenga ms de dos
nodos con un nmero impar de enlaces. El grafo de Knigsberg tena cuatro nodos con
un nmero impar de enlaces, A, B, C y D, por lo que ninguna ruta podra satisfacer el
problema.
La prueba de Euler fue la primera vez que alguien resolvi un problema matemtico
utilizando un grafo. Para nosotros, la prueba tiene dos mensajes importantes: el
primero es que algunos problemas se vuelven ms simples y ms manejables si se
representan como un grafo. La segunda es que la existencia del camino no depende de
nuestro ingenio para encontrarlo. Ms bien, es una propiedad del grafo. De hecho,
dada la estructura del grafo de Knigsberg, no importa cun inteligentes seamos,
nunca encontraremos el camino deseado. En otras palabras, las redes tienen
propiedades codificadas en su estructura que limitan o mejoran su comportamiento.
Para entender las muchas formas en que las redes pueden afectar las propiedades de
un sistema, necesitamos familiarizarnos con la teora de grafos, una rama de las
matemticas que surgi de la prueba de Euler. En este captulo aprenderemos a
representar una red como un grafo e introducir las caractersticas elementales de las
redes, de grados a distribuciones de grados, de caminos a distancias y aprender a
distinguir redes ponderadas, dirigidas y bipartitas. Introduciremos un formalismo y un
lenguaje de teora de grafos que sern utilizados a lo largo de este libro.
Los enlaces de una red pueden ser dirigidos o no dirigidos. Algunos sistemas tienen
enlaces dirigidos, como el WWW, cuyos localizadores uniformes de recursos (URL)
apuntan desde un documento web al otro, o llamadas telefnicas, donde una persona
llama al otro. Otros sistemas tienen vnculos no dirigidos, como los lazos romnticos: si
salgo con Janet, Janet tambin conmigo, o como lneas de transmisin en la red de
energa, en la que la corriente elctrica puede fluir en ambas direcciones.
Una red se llama dirigida (o digrafo) si todos sus enlaces estn dirigidos; Se denomina
no dirigido si todos sus vnculos no estn dirigidos. Algunas redes simultneamente
tienen enlaces dirigidos y no dirigidos. Por ejemplo, en la red metablica algunas
reacciones son reversibles (es decir, bidireccionales o no dirigidas) y otras son
irreversibles, teniendo lugar en una sola direccin (dirigida).
Las elecciones que hacemos cuando representamos un sistema como una red
determinarn nuestra capacidad de utilizar la Network Science con xito para
resolver un problema particular. Por ejemplo, la forma en que definimos los vnculos
entre dos individuos dicta la naturaleza de las preguntas que podemos explorar:
Tambin podemos construir redes que pueden ser vlidas desde una perspectiva de
teora grfica, pero pueden tener poca utilidad prctica. Por ejemplo, si relacionamos a
todos los individuos con el mismo nombre, Johns con Johns y Marys con Marys,
obtenemos un grafo bien definido, cuyas propiedades pueden ser analizadas con las
herramientas de la Network Science. Sin embargo, su utilidad es cuestionable. Por lo
tanto, con el fin de aplicar la teora de la red a un sistema, consideraciones cuidadosas
deben preceder a nuestra eleccin de nodos y enlaces, asegurando su importancia
para el problema que deseamos explorar.
A lo largo de este libro usaremos diez redes para ilustrar las herramientas de la ciencia
en red. Estas redes de referencia, enumeradas en la Tabla 2.1, abarcan sistemas
sociales (redes de llamadas o redes de correo electrnico), redes de colaboracin y
afiliacin (red de colaboracin cientfica, red de actores de Hollywood), sistemas de
informacin (WWW), sistemas tecnolgicos e infraestructurales), Sistemas biolgicos
(interaccin proteica y red metablica), y redes de referencia (citas). Difieren
ampliamente en sus tamaos, desde tan pocos como N = 1.039 nodos en el
metabolismo de E. coli, hasta casi medio milln de nodos en la red de citas. Cubren
varias reas donde las redes se aplican activamente, representando los conjuntos de
datos 'cannicos' usados con frecuencia por los investigadores para ilustrar las
propiedades clave de la red. Como se indica en la Tabla 2.1, algunos de ellos estn
dirigidos, otros no dirigidos. En los prximos captulos vamos a discutir en detalle la
naturaleza y las caractersticas de cada uno de estos conjuntos de datos,
convirtindolos en los cobayas de nuestro viaje para entender las redes complejas.
Tabla 2.1
Las caractersticas bsicas de diez redes utilizadas en este libro para ilustrar las herramientas de la red
de ciencia. La tabla enumera la naturaleza de sus nodos y enlaces, indicando si los enlaces estn
dirigidos o no dirigidos, el nmero de nodos (N) y enlaces (L), y el grado promedio para cada red. Para
las redes dirigidas, el grado promedio mostrado es el promedio de los grados de entrada y salida: k = k in
= kout.
Una propiedad clave de cada nodo es su grado, que representa el nmero de enlaces
que tiene con otros nodos. El grado puede representar el nmero de contactos del
telfono mvil que un individuo tiene en el grfico de llamadas (es decir, el nmero de
personas diferentes con las que la persona ha hablado) o el nmero de citas que un
trabajo de investigacin obtiene en la red de citas.
Grado
Denotamos con ki el grado del ithnode en la red. Por ejemplo, para las redes no
dirigidas mostradas en la Imagen 2.2 tenemos k1 = 2, k2 = 3, k3 = 2, k4 = 1. En una red
no dirigida, el nmero total de enlaces, L, se puede expresar como la suma del grado
de los nodos:
1
= (2.1)
2
=1
Aqu el factor 1/2 corrige el hecho de que en la suma cada enlace se cuenta dos veces.
Por ejemplo, el enlace que conecta los nodos 2 y 4 en la Imagen 2.2 se contar una vez
en el grado del nodo 2 y una vez en el grado del nodo 4.
Grado Medio
Una propiedad importante de una red es su grado medio (BOX 2.2), que para una red
no dirigida es
1 2
< >= = (2.2)
=1
En redes dirigidas distinguimos entre el grado entrante, kiin, que representa el nmero
de enlaces que apuntan al nodo i, y el grado saliente, kiout, que representa el nmero
de enlaces que apuntan desde el nodo i a otros nodos. Finalmente, el grado total de un
nodo, ki, viene dado por
= + (2.3)
Por ejemplo, en la WWW el nmero de pginas a las que apunta un documento dado
representa su grado de salida, kout, y el nmero de documentos que lo apuntan
representa su grado de entrada, kin. El nmero total de enlaces en una red dirigida es
= = (2.4)
=1 =1
El factor 1/2 visto en (2.1) est ausente, ya que para las redes dirigidas las dos sumas
en (2.4) cuentan separadamente los grados saliente y entrante. El grado medio de una
red dirigida es
1 1
<
> = =< > = = (2.5)
=1 =1
BOX 2.2
Distribucin de Grado
= 1 (2.6)
=1
Para una red con N nodos la distribucin de grados es el histograma normalizado
(Imagen 2.3) es dado por
= (2.7)
Donde Nk es el nmero de nodos grado-k. Por lo tanto, el nmero de nodos grado-k
puede obtenerse a partir de la distribucin de grados como Nk = Npk.
La distribucin del grado ha asumido un papel central en la teora de la red despus del
descubrimiento de redes libres de escala. Una de las razones es que el clculo de la
mayora de las propiedades de la red requiere que conozcamos pk. Por ejemplo, el
grado medio de una red se puede escribir como
Una descripcin completa de una red nos obliga a realizar un seguimiento de sus
enlaces. La forma ms sencilla de lograr esto es proporcionar una lista completa de los
enlaces. Por ejemplo, la red de la Imagen 2.2 se describe de forma nica enumerando
sus cuatro enlaces: {(1, 2), (1, 3), (2, 3), (2, 4)}. Con fines matemticos, a menudo
representamos una red a travs de su matriz de adyacencia. La matriz de adyacencia
de una red dirigida de N nodos tiene N filas y N columnas, siendo sus elementos:
- Aij = 1 si hay un enlace que apunta desde el nodo j al nodo i
- Aij = 0 si los nodos i y j no estn conectados entre s
La matriz de adyacencia de una red no dirigida tiene dos entradas para cada enlace,
por ejemplo, el enlace (1, 2) se representa como A12 = 1 y A21 = 1. Por lo tanto, la
matriz de adyacencia de una red no dirigida es simtrica, Aij = Aji (Imagen 2.5b)
= = (2.9)
=1 =1
Para las redes dirigidas, las sumas sobre las filas y columnas de la matriz de adyacencia
proporcionan los grados entrante y saliente, respectivamente
= = (2.10)
=1 =1
Dado que en una red no dirigida el nmero de enlaces salientes es igual al nmero de
enlaces entrantes, tenemos
2 = = = (2.11)
=1 =1
El nmero de elementos distintos de cero de la matriz de adyacencia es 2L, o el doble
del nmero de enlaces. De hecho, un enlace no dirigido que conecta nodos i y j
aparece en dos entradas: Aij=1, un enlace que apunta desde el nodo j al nodo i, y Aji=1,
un enlace que apunta de i a j (Imagen 2.5b).
Imagen 2.5 La matriz de Adyacencia
- El etiquetado de los elementos de la matriz de adyacencia.
- La matriz de adyacencia de una red no dirigida. La figura muestra que el grado de un
nodo (en este caso el nodo 2) se puede expresar como la suma sobre la columna o la
fila apropiada de la matriz de adyacencia. Tambin muestra algunas caractersticas
bsicas de la red, como el nmero total de enlaces, L, y el grado medio, <k>, expresado
en trminos de los elementos de la matriz de adyacencia.
- Lo mismo que en (b) pero para una red dirigida.
Seccin 2.5: Las redes reales son poco densas (Sparse Networks)
En redes reales el nmero de nodos (N) y enlaces (L) puede variar ampliamente. Por
ejemplo, la red neural del gusano C.elegans, el nico sistema nervioso completamente
mapeado de un organismo vivo, tiene N = 302 neuronas (nodos). En contraste, se
estima que el cerebro humano tiene alrededor de cien mil millones (N 10 11)
neuronas. La red gentica de una clula humana tiene unos 20.000 genes como nodos;
La red social se compone de siete mil millones de personas (N 7 109) y se estima
que la WWW tiene ms de un trilln de documentos web (N> 1012).
La Tabla 2.1 indica que el nmero de enlaces tambin vara ampliamente. En una red
de N nodos el nmero de enlaces puede cambiar entre L = 0 y Lmax, donde
( 1)
= (2.12)
2
es el nmero total de enlaces presentes en un grafo completo de tamao N (Imagen
2.6). En un grafo completo cada nodo est conectado a cada otro nodo.
Imagen 2.6 - Grafo completo
Un grafo completo con N = 16 nodos y Lmax = 120 enlaces, segn lo predicho por (2.12). La
matriz de adyacencia de un grafo completo es Aij = 1 para todo i, j = 1,...,N y Aii = 0. El grado
medio de un grfico completo es <k> = N - 1.
En redes reales L es mucho menor que Lmax, lo que refleja el hecho de que la mayora
de las redes reales son dispersas. Llamamos a una red dispersa (Sparse Network) si
L<<Lmax. Por ejemplo, el grafo de WWW en la Tabla 2.1 tiene aproximadamente 1.5
millones de enlaces. Sin embargo, si la WWW fuera un grafo completo, debera tener
Lmax 5x1010 enlaces de acuerdo con (2.12). En consecuencia, el grafo web slo tiene
una fraccin 3x10-5 de los enlaces que podra tener. Esto es cierto para todas las redes
de la Tabla 2.1: Se puede comprobar que su nmero de enlaces es slo una pequea
fraccin del nmero esperado de enlaces para un grafo completo del mismo nmero
de nodos.
Que las redes reales sean dispersas implica que las matrices de adyacencia son
tambin dispersas. De hecho, una red completa tiene Aij = 1, para todos (i, j), es decir,
cada uno de sus elementos de matriz son iguales a uno. En contraste en las redes
reales slo una pequea fraccin de los elementos de la matriz no son cero. Esto se
ilustra en la Imagen 2.7, que muestra la matriz de adyacencia de la red de interaccin
protena-protena listada en la Tabla 2.1 y mostrada en la Imagen 2.4a. Se puede ver
que la matriz est casi vaca.
Hasta ahora hemos discutido slo redes para las cuales todos los enlaces tienen el
mismo peso, es decir, Aij = 1. En muchas aplicaciones necesitamos estudiar redes
ponderadas, donde cada enlace (i, j) tiene un peso nico wij. En las redes de llamadas
mviles el peso puede representar el nmero total de minutos que dos personas
hablan con el otro por telfono; En la red elctrica, el peso es la cantidad de corriente
que fluye a travs de una lnea de transmisin.
Para las redes ponderadas los elementos de la matriz de adyacencia llevan el peso del
enlace como
= (2.13)
Un grafo bipartito (o bigraph) es una red cuyos nodos se pueden dividir en dos
conjuntos disjuntos U y V de manera que cada enlace conecte un nodo U a un nodo V.
En otras palabras, si coloreamos los U-nodos verdes y los V-nodos prpura, cada
enlace debe conectar nodos de diferentes colores (Imagen 2.9).
Podemos generar dos proyecciones para cada red bipartita. La primera proyeccin
conecta dos nodos U por un enlace si estn vinculados al mismo nodo V en la
representacin bipartita. La segunda proyeccin conecta los nodos V por un enlace si
se conectan al mismo nodo U (imagen 2.9).
Imagen 2.9 Red bipartita
Una red bipartita tiene dos conjuntos de nodos, U y V. Los nodos del conjunto U se conectan
directamente slo a los nodos del conjunto V. Por lo tanto, no hay enlaces U-U o V-V directos.
La figura muestra las dos proyecciones que podemos generar de cualquier red bipartita. La
proyeccin U se obtiene conectando dos nodos U entre s si se enlazan al mismo nodo V en la
representacin bipartita. La proyeccin V se obtiene conectando dos nodos V entre s si se
enlazan al mismo nodo U en la red bipartita.
El camino ms corto
El camino ms corto entre los nodos i y j es el camino con el menor nmero de enlaces
(Imagen 2.12b). El camino ms corto a menudo se llama distancia entre los nodos i y j,
y se denotan por dij, o simplemente d. Podemos tener mltiples caminos ms cortos de
la misma longitud d entre un par de nodos (Imagen 2.12b). El camino ms corto nunca
contiene bucles o se interseca a s mismo.
En una red no dirigida dij = dji, es decir, la distancia entre el nodo i y j es la misma que la
distancia entre el nodo j e i. En una red dirigida a menudo dij dji. Adems, en una red
dirigida la existencia de una ruta del nodo i al nodo j no garantiza la existencia de un
camino de j a i.
En redes reales a menudo necesitamos determinar la distancia entre dos nodos. Para
una red pequea, como la que se muestra en la Imagen 2.12, esta es una tarea fcil.
Para una red con millones de nodos encontrar el camino ms corto entre dos nodos
puede llevar bastante tiempo. La longitud del camino ms corto y el nmero de tales
caminos se pueden obtener formalmente a partir de la matriz de adyacencia (BOX 2.4).
En la prctica usamos el algoritmo de bsqueda de amplitud (BFS) explicado en la BOX
2.5 para este propsito.
- Camino: Una secuencia de nodos tal que cada nodo est conectado al siguiente nodo a
lo largo del camino por un enlace. Cada ruta consta de n + 1 nodos y n enlaces. La
longitud de un camino es el nmero de sus enlaces, contando mltiples enlaces varias
veces. Por ejemplo, la lnea naranja 1 2 5 4 3 cubre un trayecto de longitud
cuatro.
- Camino ms corto (Camino Geodsico, d): El camino con la distancia ms corta d entre
dos nodos. Tambin llamamos d la distancia entre dos nodos. Tenga en cuenta que la
ruta ms corta no necesita ser nica: entre los nodos 1 y 4 tenemos dos caminos ms
cortos, 1 2 3 4 (azul) y 1 2 5 4 (naranja), con la misma longitud d1,4 = 3.
- Dimetro (dmax): El camino ms corto ms largo en un grafo, o la distancia entre los
dos nodos ms alejados. En el grafo mostrado aqu el dimetro est entre los nodos 1
y 4, de ah dmax = 3.
- Longitud media de camino (<d>): El promedio de los caminos ms cortos entre todos
los pares de nodos. Para el grafo mostrado a la izquierda de la imagen tenemos <d> =
1.6, cuyo clculo se muestra junto a la figura.
- Ciclo: Una ruta con el mismo nodo inicial y final. En el grafo que se muestra arriba
tenemos slo un ciclo, como lo muestra la lnea naranja.
- Camino Euleriano: Un camino que atraviesa cada enlace exactamente una vez. La
imagen muestra dos caminos Eulerianos, uno en naranja y el otro en azul.
- Camino Hamiltoniano: Una ruta que visita cada nodo exactamente una vez. Se
muestran dos caminos hamiltonianos en naranja y en azul.
BOX 2.4
Dimetro de red
El dimetro de una red, denotado por dmax, es el mximo camino ms corto posible en
la red. En otras palabras, es la mayor distancia registrada entre cualquier par de nodos.
Se puede verificar que el dimetro de la red mostrado en la Imagen 2.13 es d max = 3.
Para redes ms grandes el dimetro puede determinarse usando el algoritmo BFS
descrito en la BOX 2.5.
Longitud media de camino
La longitud media de camino, denotada por <d>, es la distancia media entre todos los
pares de nodos en la red. Para una red dirigida de N nodos, <d> es
1
= , (2.14)
( 1)
,=1 ;
Una red pequea que consta de dos componentes desconectados. De hecho, hay un camino
entre cualquier par de nodos en el componente (1,2,3), as como en el componente (4,5,6,7).
Sin embargo, no hay rutas entre nodos que pertenecen a los diferentes componentes.
BOX 2.6
- El coeficiente de agrupamiento local, Ci, del nodo central con grado ki = 4 para tres
configuraciones diferentes de su vecindad. El coeficiente de agrupacin local mide la
densidad local de enlaces en la vecindad de un nodo.
- Una red pequea, con el coeficiente de agrupacin local de cada nodo que se muestra
junto a l. Tambin se lista el coeficiente de agrupacin promedio de la red <C>, de
acuerdo con (2.16), y su coeficiente de agrupacin global C, definido en la SECCIN
2.12, Ec. (2.17). Tenga en cuenta que para los nodos con grados ki = 0,1, el coeficiente
de agrupamiento es cero.
El curso intensivo ofrecido en este captulo introdujo algunos de los conceptos tericos
bsicos de los grafos y las herramientas usadas en la Network Science. El conjunto de
caractersticas elementales de la red, resumido en la Imagen 2.17, ofrece un lenguaje
formal a travs del cual podemos explorar las redes.
Muchas de las redes que estudiamos en la Network Science consisten en miles o
incluso millones de nodos y enlaces (Tabla 2.1). Para explorarlos, necesitamos ir ms
all de los pequeos grafos mostrados en la Imagen 2.17. Un vistazo de lo que estamos
a punto de encontrar es ofrecido por la red de interaccin protena-protena de la
levadura (Imagen 2.4a). La red es demasiado compleja para comprender sus
propiedades a travs de una inspeccin visual de su diagrama de cableado. Por lo
tanto, necesitamos recurrir a las herramientas de la ciencia en red para caracterizar su
topologa.
Redes no dirigidas
Auto-bucles
En muchas redes los nodos no interactan consigo mismos, por lo que los elementos
diagonales de la matriz de adyacencia son cero, Aii = 0, i = 1,...,N. En algunos sistemas
se permiten interacciones de uno mismo; En tales redes, auto-bucles representan el
hecho de que el nodo i interacta con s mismo.
Ejemplos: Internet, interaccin de protenas
Redes dirigidas
Una red cuyos enlaces tienen un peso, una intensidad o un parmetro de flujo
definidos. Los elementos de la matriz de adyacencia son Aij = wij si existe un enlace con
peso wij entre ellos. Para redes no ponderadas (binarias), la matriz de adyacencia slo
indica la presencia (Aij = 1) o la ausencia (Aij = 0) de un enlace.
Ejemplos: llamadas de telfono mvil, red de correo electrnico.
Utilicemos las medidas que hemos introducido hasta ahora para explorar algunas
caractersticas bsicas de esta red. La red no dirigida, que se muestra en la imagen
2.4a, tiene N = 2.018 protenas como nodos y L = 2.930 interacciones de enlace como
enlaces. Por lo tanto su grado medio, segn (2.2), es <k> = 2.90, lo que sugiere que una
protena tpica interacta con aproximadamente de dos a tres otras protenas. Sin
embargo, este nmero es un poco engaoso. De hecho, el grado de distribucin p k que
se muestra en la imagen 2.4b, c, indica que la gran mayora de los nodos tienen slo
unos pocos enlaces. Para ser exactos, en esta red el 69% de los nodos tienen menos de
tres enlaces, es decir, para estos k < <k>. Estos numerosos nodos con pocos enlaces
coexisten con unos pocos nodos muy conectados, o hubs, el ms grande con 92
enlaces. Tales diferencias en los grados de los nudos son una consecuencia de la
propiedad libre de escala de la red, discutida en el CAPTULO 4. Veremos que la forma
de la distribucin de grados determina una amplia gama de propiedades de red, desde
la robustez de la red hasta la propagacin de virus.
El algoritmo de amplitud de bsqueda (BOX 2.5) nos ayuda a determinar el dimetro
de la red, encontrando dmax = 14. Podramos estar tentados a esperar grandes
variaciones en d, ya que algunos nodos estn cerca unos de otros, sin embargo, puede
ser bastante lejos. La distribucin de distancia (Figura 2.18a) indica lo contrario: pd
tiene un pico prominente entre 5 y 6, dicindonos que la mayora de las distancias son
bastante cortas, estando cerca de <d> = 5.61. Adems, pd decae rpido para d grande,
lo que sugiere que las grandes distancias estn ausentes. De hecho, la varianza de las
distancias es d = 1,64, lo que indica que la mayora de las longitudes de trayecto estn
en la vecindad cercana de <d>.
Por ltimo, una inspeccin visual revela un patrn interesante: los hubs tienen una
tendencia a conectarse a nodos pequeos, dando a la red un carcter hub y spoke
(Imagen 2.4a). Esta es una consecuencia de las correlaciones de grado, discutidas en el
CAPTULO 7. Estas correlaciones influyen en una serie de procesos basados en la red,
desde el fenmeno de propagacin hasta el nmero de nodos de control necesarios
para controlar una red.
La red de interaccin protena-protena (PPI) de la levadura es estudiada con frecuencia por los
bilogos y los cientficos de la red. El diagrama de cableado detallado de la red se muestra en
la Imagen 2.4a. La figura indica que la red, que consta de N = 2.018 nodos y L = 2.930 enlaces,
tiene un gran componente que conecta el 81% de las protenas. Tambin tenemos varios
componentes ms pequeos y numerosas protenas aisladas que no interaccionan con ningn
otro nodo.