Vous êtes sur la page 1sur 44

Network Science Barabasi

(http://barabasi.com/networksciencebook)

Captulo 1: Introduccin

Seccin 1.1: Vulnerabilidad debida a la interconexin

A primera vista, las dos imgenes del satlite de la Imagen 1.1 son indistinguibles,
mostrando luces brillantes en reas muy pobladas y espacios oscuros que marcan
vastos bosques y ocanos deshabitados. Sin embargo, en una inspeccin ms
minuciosa observamos diferencias: Toronto, Detroit, Cleveland, Columbus y Long
Island, brillantes en (a), se han oscurecido en (b). Esto no es a causa de la prxima
pelcula de Armageddon, pero representa una imagen real del Noreste de Estados
Unidos el 14 de agosto de 2003, antes y despus del apagn que dej sin electricidad a
unos 45 millones de personas en ocho estados de Estados Unidos y a otros 10 millones
en Ontario.

Imagen 1.1

El apagn de 2003 es un ejemplo tpico de un fallo en cascada. Cuando una red acta
como un sistema de transporte, un fallo local cambia las cargas a otros nodos. Si la
carga adicional es insignificante, el sistema puede absorberla sin problemas y el fallo
pasa desapercibido. Si, sin embargo, la carga extra es demasiado para los nodos
vecinos, tambin se inclinarn y redistribuirn la carga a sus vecinos. En cualquier
momento nos enfrentamos a un evento en cascada, cuya magnitud depende de la
posicin y la capacidad de los nodos que fallaron inicialmente.
Se han observado fallos en cascada en muchos sistemas complejos. Se llevan a cabo
en Internet, cuando el trfico se desva para evitar que los routers funcionen mal. Esta
operacin de rutina puede ocasionalmente crear ataques de denegacin de servicio
(DOS), lo que hace que los routers completamente funcionales no estn disponibles al
ser superados con el trfico. El colapso financiero de 2009-2011 se ve a menudo como
un ejemplo clsico de un fallo en cascada, la crisis de credito estadounidense que
acabo paralizando la economa del planeta, dejando atrs decenas de bancos,
corporaciones e incluso estados en banca rota. Los fallos en cascada tambin pueden
ser inducidos artificialmente. Un ejemplo es el esfuerzo mundial para secar el
suministro de dinero de las organizaciones terroristas, con el objetivo de incapacitar su
capacidad para funcionar. Del mismo modo, los investigadores del cncer pretenden
inducir fallos en cascada en nuestras clulas para destruir las clulas cancerosas.
El apagn del Noreste de Estados Unidos ilustra varios temas importantes de este
libro: Primero, para evitar los fallos en cascadas, debemos entender la estructura de la
red en la que se propaga la cascada. En segundo lugar, debemos ser capaces de
modelar los procesos dinmicos que tienen lugar en estas redes, como el flujo de
electricidad. Finalmente, necesitamos descubrir cmo la interaccin entre la estructura
de la red y la dinmica afecta a la robustez de todo el sistema. Aunque los fallos en
cascada pueden parecer aleatorios e impredecibles, siguen leyes reproducibles que
pueden cuantificarse e incluso predecirse utilizando las herramientas de la Network
Science.
El apagn tambin ilustra un tema ms amplio: la vulnerabilidad debida a la
interconexin. De hecho, en los primeros aos de la energa elctrica cada ciudad tena
sus propios generadores y red elctrica. Sin embargo, la electricidad no se puede
almacenar: una vez producida, la electricidad debe ser consumida inmediatamente.
Por lo tanto, tena sentido econmico vincular ciudades vecinas, permitindoles
compartir la produccin extra y pedir prestado electricidad si fuera necesario. Hoy
debemos el bajo precio de la electricidad a la red de energa, la red que emergi a
travs de estas conexiones en pares, uniendo a todos los productores y consumidores
en una sola red. Permite que la energa producida a bajo costo sea transportada
instantneamente en cualquier lugar. La electricidad, por lo tanto, ofrece un ejemplo
maravilloso de las grandes redes de impacto positivo que tienen en nuestra vida.
Ser parte de una red tiene sus beneficios, sin embargo los fallos locales, como la
ruptura de un fusible en algn lugar en Ohio, no permanece localmente. Su impacto
puede viajar a lo largo de los enlaces de la red y afectar a otros nodos, consumidores e
individuos aparentemente eliminados del problema original. En general, la
interconectividad induce una notable no-localidad: permite que la informacin, las
prcticas empresariales, el poder, la energa y los virus se difundan en sus respectivas
redes sociales o tecnolgicas, llegando a nosotros, sin importar nuestra distancia de la
fuente. Por lo tanto las redes llevan ventajas y vulnerabilidades. Descubrir los factores
que pueden aumentar la difusin de rasgos considerados positivos y limitar otros que
hacen que las redes sean dbiles o vulnerables es uno de los objetivos de este libro.
Seccin 1.2: Las redes en el corazn de los sistemas complejos

Estamos rodeados de sistemas que son desesperadamente complicados.


Consideremos, por ejemplo, la sociedad que requiere la cooperacin entre miles de
millones de individuos, o infraestructuras de comunicaciones que integran billones de
telfonos con ordenadores y satlites. Nuestra capacidad de razonar y comprender
nuestro mundo requiere la actividad coherente de billones de neuronas en nuestro
cerebro. Nuestra existencia biolgica est arraigada en interacciones sin fisuras entre
miles de genes y metabolitos dentro de nuestras clulas.
Estos sistemas se denominan colectivamente sistemas complejos, capturando el
hecho de que es difcil derivar su comportamiento colectivo a partir del conocimiento
de los componentes del sistema. Dado el papel importante que desempean los
sistemas complejos en nuestra vida cotidiana, en la ciencia y en la economa, su
comprensin, descripcin matemtica, prediccin y, finalmente, control es uno de los
mayores desafos intelectuales y cientficos del siglo XXI.
El surgimiento de la Network Science en los albores del siglo XXI es una demostracin
de que la ciencia puede estar a la altura de este desafo. De hecho, detrs de cada
sistema complejo existe una intrincada red que codifica las interacciones entre los
componentes del sistema:
La red que codifica las interacciones entre genes, protenas y metabolitos
integra estos componentes en clulas vivas. La existencia misma de esta red
celular es un requisito previo de la vida.
El diagrama de cableado que captura las conexiones entre las neuronas,
llamada la red neuronal, es la clave para nuestra comprensin de cmo
funciona el cerebro y nuestra conciencia.
La suma de todos los lazos profesionales, de amistad y familiares, a menudo
llamada la red social, es el tejido de la sociedad y determina la difusin del
conocimiento, el comportamiento y los recursos.
Las redes de comunicacin, que describen qu dispositivos de comunicacin
interactan entre s, a travs de conexiones de Internet por cable o enlaces
inalmbricos, estn en el corazn del sistema de comunicacin moderno.
La red elctrica, una red de generadores y lneas de transmisin, suministra
energa prcticamente toda la tecnologa moderna.
Las redes comerciales mantienen nuestra capacidad para intercambiar bienes y
servicios, siendo responsables de la prosperidad material que el mundo ha
disfrutado desde la Segunda Guerra Mundial.
Las redes tambin estn en el corazn de algunas de las tecnologas ms
revolucionarias del siglo XXI, potenciando todo, desde Google a Facebook, CISCO y
Twitter. Al final, las redes impregnan la ciencia, la tecnologa, los negocios y la
naturaleza a un grado mucho ms alto de lo que puede ser evidente en una inspeccin
casual. Consecuentemente, nunca entenderemos sistemas complejos a menos que
desarrollemos una comprensin profunda de las redes que hay detrs de ellos.
El creciente inters en la Network Science durante la primera dcada del siglo XXI se
basa en el descubrimiento de que, a pesar de la evidente diversidad de sistemas
complejos, la estructura y la evolucin de las redes detrs de cada sistema es
impulsada por un conjunto comn de leyes y principios fundamentales. Por lo tanto, a
pesar de las asombrosas diferencias en forma, tamao, naturaleza, edad y alcance de
las redes reales, la mayora de las redes estn impulsadas por principios organizativos
comunes. Una vez que ignoramos la naturaleza de los componentes y la naturaleza
precisa de las interacciones entre ellos, las redes obtenidas son ms similares que
diferentes entre s. En las secciones siguientes se discuten las fuerzas que han llevado a
la aparicin de este nuevo campo de investigacin y su impacto en la ciencia, la
tecnologa y la sociedad.

Seccin 1.3: Dos fuerzas que ayudaron a la emergencia de la Network Science

La Network Science es una nueva disciplina. Uno puede debatir su comienzo exacto,
pero por todas las cuentas el campo ha emergido como disciplina separada solamente
en el siglo XXI.
Por qu no tenamos la Network Science doscientos aos antes? Despus de todo,
muchas de las redes que explora el campo no son nuevas: las redes metablicas se
remontan a los orgenes de la vida, con una historia de cuatro mil millones de aos, y
la red social es tan antigua como la humanidad. Adems, muchas disciplinas, desde la
bioqumica hasta la sociologa y la ciencia del cerebro, han estado tratando con sus
propias redes durante dcadas. La teora de los grafos, un subcampo prolfico de las
matemticas, ha explorado los grafos desde 1735. Hay razn, por lo tanto, para
llamar a la ciencia de la red la ciencia del siglo XXI?
Algo especial ocurri en los albores del siglo XXI que trascendi los campos de
investigacin individuales y cataliz el surgimiento de una nueva disciplina (Imagen
1.3). Para entender por qu esto sucedi ahora y no doscientos aos antes,
necesitamos discutir las dos fuerzas que han contribuido a la aparicin de la Network
Science.
Imagen 1.3: La aparicin de la Network Science

Mientras que el estudio de las redes tiene una larga historia, con races en la teora de
los grafos y la sociologa, el captulo moderno de la Network Science surgi slo
durante la primera dcada del siglo XXI.
El inters explosivo en las redes est bien documentado por el patrn de citas de dos
artculos clsicos, el artculo de Paul Erds y Alfrd Rnyi de 1959, que marca el
comienzo del estudio de redes aleatorias en la teora de grafos [2] y el artculo de 1973
de Mark Granovetter, el documento sobre la red social ms citado [3]. La figura
muestra las citas anuales que cada artculo adquiri desde su publicacin. Ambos
papeles eran muy apreciados dentro de su disciplina, pero tenan un impacto limitado
fuera de su campo. El crecimiento explosivo de las citas a estos documentos en el siglo
XXI es una consecuencia de la aparicin de la Network Science, atrayendo una nueva
atencin interdisciplinaria a estas publicaciones clsicas.

El surgimiento de las Network Maps

Para describir el comportamiento detallado de un sistema que consiste de cientos a


miles de millones de componentes que interactan, necesitamos un mapa del
diagrama de cableado del sistema. En un sistema social esto requerira una lista precisa
de sus amigos, amigos de sus amigos, y as sucesivamente. En la WWW este mapa nos
dice qu pginas web se enlazan entre s. En las clulas el mapa corresponde a una
lista detallada de interacciones de unin y reacciones qumicas que implican genes,
protenas y metabolitos.
En el pasado, no tenamos las herramientas para mapear estas redes. Era igualmente
difcil hacer un seguimiento de la enorme cantidad de datos detrs de ellos. La
revolucin de Internet, que ofrece mtodos eficaces y rpidos de intercambio de datos
y almacenamiento digital barato, cambi fundamentalmente nuestra capacidad de
recopilar, reunir, compartir y analizar datos pertenecientes a redes reales.
Gracias a estos avances tecnolgicos, a la vuelta del milenio hemos presenciado una
explosin de creacin de mapas (BOX 1.2). Los ejemplos van desde los proyectos
CAIDA o DIMES que ofrecieron los primeros mapas a gran escala de Internet; A los
cientos de millones de dlares gastados por bilogos para determinar
experimentalmente las interacciones protena-protena en las clulas humanas; Los
esfuerzos realizados por compaas de redes sociales, como Facebook, Twitter o
LinkedIn, para desarrollar depsitos precisos de nuestras amistades y lazos
profesionales; El proyecto Connectome del Instituto Nacional de Salud de los EE.UU.
que tiene como objetivo rastrear sistemticamente las conexiones neuronales en los
cerebros de mamferos. La repentina disponibilidad de estos mapas a finales del siglo
XX ha catalizado la aparicin de la ciencia en red.

La universalidad de las Network Characteristics

Es fcil enumerar las diferencias entre las diversas redes que encontramos en la
naturaleza o la sociedad: los nodos de la red metablica son molculas diminutas y los
enlaces son reacciones qumicas regidas por las leyes de la qumica y la mecnica
cuntica; Los nodos de la WWW son documentos web y los enlaces son URL
garantizados por algoritmos informticos; Los nodos de la red social son individuos y
los eslabones representan vnculos familiares, profesionales y de amistad.
Los procesos que generaron estas redes tambin difieren mucho: las redes
metablicas fueron modeladas por miles de millones de aos de evolucin; La WWW
es construida por las acciones colectivas de millones de personas y organizaciones; Las
redes sociales estn conformadas por normas sociales cuyas races se remontan a
miles de aos. Dada esta diversidad en tamao, naturaleza, alcance, historia y
evolucin, no nos sorprendera que las redes detrs de estos sistemas fueran muy
diferentes.
Un descubrimiento clave de la ciencia en red es que la arquitectura de las redes que
emergen en diversos mbitos de la ciencia, la naturaleza y la tecnologa son similares
entre s, una consecuencia de ser gobernados por los mismos principios organizativos.
En consecuencia, podemos utilizar un conjunto comn de herramientas matemticas
para explorar estos sistemas.
En resumen, si bien muchas disciplinas han hecho importantes contribuciones a la
Network Science, el surgimiento de un nuevo campo se hizo en parte posible gracias
a la disponibilidad de datos, ofreciendo mapas precisos de redes encontradas en
diferentes disciplinas. Estos diversos mapas permitieron a los cientficos de la red
identificar las propiedades universales de las diversas caractersticas de la red. Esta
universalidad ofrece la base de la nueva disciplina de la Network Science.

Seccin 1.4: Las caractersticas de la Network Science

La Network Science se define no slo por su tema, sino tambin por su metodologa.
En esta seccin se discuten las caractersticas clave del enfoque adoptado de la
Network Science para entender los sistemas complejos.

Naturaleza interdisciplinaria

La Network Science ofrece un lenguaje a travs del cual diferentes disciplinas pueden
interactuar sin problemas entre s. De hecho, los bilogos celulares, los cientficos del
cerebro y los cientficos informticos se enfrentan a la tarea de caracterizar el
diagrama de cableado detrs de su sistema, extraer informacin de conjuntos de datos
incompletos y ruidosos y comprender la robustez de sus sistemas frente a fallos o
ataques.

Sin duda, cada disciplina trae un conjunto diferente de objetivos, detalles tcnicos y
desafos, que son importantes por s mismos. Sin embargo, la naturaleza comn de
muchas cuestiones con las que luchan estos campos ha llevado a una fertilizacin
interdisciplinaria de herramientas e ideas. Por ejemplo, el concepto de centralidad
intermedia que surgi en la literatura de la red social en los aos setenta desempea
hoy un papel clave en la identificacin de nodos de alto trfico en Internet. Del mismo
modo los algoritmos desarrollados por los cientficos informticos para la particin de
grafos han encontrado nuevas aplicaciones en la identificacin de los mdulos de las
enfermedades en la medicina o la deteccin de comunidades dentro de las grandes
redes sociales.

Naturaleza emprica, impulsada por los datos

Varios conceptos clave de la Network Science tienen sus races en la teora de grafos,
un campo frtil de las matemticas. Lo que distingue la Network Science de la teora
de grafos es su naturaleza emprica, es decir, su enfoque en los datos, la funcin y la
utilidad. Como veremos en los prximos captulos, en la Network Science nunca
estamos satisfechos con el desarrollo de herramientas matemticas abstractas para
describir una determinada propiedad de la red. Cada herramienta que desarrollamos
se prueba con datos reales y su valor se juzga por las ideas que ofrece sobre las
propiedades y el comportamiento de un sistema.
Naturaleza cuantitativa y matemtica

Para contribuir al desarrollo de la Network Science y utilizar adecuadamente sus


herramientas, es esencial dominar el formalismo matemtico que hay detrs de l. La
Network Science tom prestado el formalismo para tratar con los grafos de la teora
de grafos y el marco conceptual para lidiar con la aleatoriedad y buscar los principios
universales de organizacin de la fsica estadstica. ltimamente, el campo se est
beneficiando de conceptos tomados de la ingeniera, como el control y la teora de la
informacin, lo que nos permite entender los principios de control de las redes y de las
estadsticas, ayudndonos a extraer informacin de datos incompletos y ruidosos.

El desarrollo del software de anlisis de redes ha hecho que las herramientas de la


Network Science estn disponibles para una comunidad ms amplia, incluso para
aquellos que no estn familiarizados con las bases intelectuales y las profundidades
matemticas de la disciplina. Sin embargo, para avanzar en el campo y utilizar
eficientemente sus herramientas, debemos dominar su formalismo terico.

Naturaleza computacional

Dado el tamao de muchas de las redes de inters prctico, y la cantidad excepcional


de datos auxiliares detrs de ellos, los cientficos de la red se enfrentan regularmente a
una serie de formidables desafos computacionales. Por lo tanto, el campo tiene un
fuerte carcter computacional, prestando activamente de algoritmos, gestin de bases
de datos y minera de datos. Una serie de herramientas de software estn disponibles
para abordar estos problemas computacionales, permitiendo a los profesionales con
habilidades computacionales diversas analizar las redes de inters para ellos.

En resumen, un dominio de la Network Science requiere familiaridad con cada uno de


estos aspectos del campo. Es su combinacin la que ofrece las herramientas
multifacticas y las perspectivas necesarias para comprender las propiedades de las
redes reales.

Seccin 1.5: Impacto Social

El impacto de un nuevo campo de investigacin se mide tanto por sus logros


intelectuales como por su impacto social, indicado por el alcance y el potencial de sus
aplicaciones. Aunque la Network Science es un campo joven, su impacto est en
todas partes.
Impacto econmico: De la bsqueda Web a la red social

Las empresas ms exitosas del siglo XXI, desde Google a Facebook, Twitter, LinkedIn,
Cisco, Apple y Akamai, basan su tecnologa y su modelo de negocio en las redes. De
hecho, Google no slo ejecuta la mayor operacin de mapeo de red que la humanidad
ha construido, generando un mapa completo y constantemente actualizado de la
WWW, pero su tecnologa de bsqueda est profundamente conectada con las
caractersticas de red de la Web.

Las redes han ganado popularidad con la aparicin de Facebook, la empresa con la
ambicin de mapear la red social de todo el planeta. Facebook no fue el primer sitio de
redes sociales y es probable que no sea el ltimo: Un impresionante ecosistema de
herramientas de redes sociales, de Twitter a LinkedIn, estn luchando por la atencin
de millones de usuarios. Algoritmos concebidos por los cientficos de la red sirven de
combustible de estos sitios, ayudando a todo, desde la recomendacin de amigos a la
publicidad.

Salud: Del diseo de medicamentos a la ingeniera metablica

Completado en 2001, el proyecto del genoma humano ofreci la primera lista


completa de todos los genes humanos [5, 6]. Sin embargo, para comprender
plenamente cmo funcionan nuestras clulas y el origen de una enfermedad, no es
suficiente una lista completa de genes: Tambin necesitamos un mapa preciso de
cmo interactan genes, protenas, metabolitos y otros componentes celulares. De
hecho, la mayora de los procesos celulares, desde el procesamiento de alimentos
hasta a deteccin de cambios en el ambiente, se basan en redes moleculares. La
ruptura de estas redes es responsable de las enfermedades humanas.
La creciente conciencia de la importancia de las redes moleculares ha llevado a la
aparicin de la biologa de la red, un nuevo subcampo de la biologa que tiene como
objetivo comprender el comportamiento de las redes celulares. Un movimiento
paralelo dentro de la medicina, llamada medicina de red, tiene como objetivo
descubrir el papel de las redes en las enfermedades humanas. La importancia de estos
avances se ilustra por el hecho de que la Universidad de Harvard en 2012 comenz la
Division of Network Medicine, que emplea a los investigadores y mdicos que aplican
la red de ideas basadas en la comprensin de las enfermedades humanas.

Las redes juegan un papel particularmente importante en el desarrollo de frmacos. El


objetivo final de la farmacologa de red es desarrollar frmacos que puedan curar
enfermedades sin efectos secundarios significativos. Esta meta se persigue en muchos
niveles, desde los millones de dlares invertidos para mapear las redes celulares hasta
el desarrollo de herramientas y bases de datos para almacenar y analizar datos de
pacientes.

Varias nuevas empresas aprovechan las oportunidades que ofrecen las redes de salud
y medicina. Por ejemplo, GeneGo recopila mapas de interacciones celulares de la
literatura cientfica y Genomatica utiliza el poder predictivo detrs de las redes
metablicas para identificar objetivos de frmacos en bacterias y humanos.
Recientemente grandes compaas farmacuticas, como Johnson & Johnson, han
hecho inversiones significativas en la medicina de red, vindolo como el camino hacia
futuros frmacos.

Seguridad: Lucha contra el terrorismo

El terrorismo es una enfermedad del siglo XXI, que requiere recursos significativos para
combatirlo en todo el mundo. El Network Thinking est cada vez ms presente en el
arsenal de varias agencias policiales encargadas de responder a las actividades
terroristas. Se usa para interrumpir la red financiera de las organizaciones terroristas y
para mapear las redes adversarias, ayudando a descubrir el papel de sus miembros y
sus capacidades. Si bien gran parte del trabajo en esta rea est clasificada, se han
hecho pblicos varios estudios de casos bien documentados. Los ejemplos incluyen el
uso de las redes sociales para encontrar a Saddam Hussein o a los responsables de los
atentados del 11 de marzo de 2004 en los trenes de Madrid a travs del examen de la
red de llamadas mviles. Los conceptos de redes tambin han impactado la doctrina
militar, llevando al concepto de Network-Centric Warfare, dirigida a combatir
conflictos de baja intensidad contra redes terroristas y criminales que emplean una
organizacin descentralizada flexible de la red.
Dadas las numerosas aplicaciones militares potenciales, tal vez no sea sorprendente
que uno de los primeros programas acadmicos en Network Science se inici en West
Point, la Academia Militar del Ejrcito de los Estados Unidos. Adems, a partir de 2009,
el Laboratorio de Investigacin del Ejrcito dedic ms de 300 millones de dlares para
apoyar centros de Network Science en todo Estados Unidos.
El conocimiento y las capacidades ofrecidas por las redes tambin pueden ser
utilizados para el mal. Tales malos usos fueron bien ilustrados por la operacin de
mapeo de red indiscriminada por la Agencia de Seguridad Nacional. Bajo el pretexto de
detener futuros ataques terroristas, la NSA supervis las comunicaciones de cientos de
millones de personas, de Estados Unidos y del extranjero, que reconstruyeron su red
social. Con esa red los cientficos han despertado a una nueva responsabilidad social:
asegurar el uso tico de nuestras herramientas y conocimientos.
Epidemias: De la prevencin a la detencin de virus mortales

Si bien la pandemia de H1N1 no fue tan devastadora como se tema al comienzo del
brote en 2009, gan un papel especial en la historia de las epidemias: Fue la primera
pandemia cuya evolucin del curso y el tiempo se pronostic con precisin meses
antes de que la pandemia alcanzara su pico. Esto fue posible gracias a los avances
fundamentales en la comprensin del papel de las redes de transporte en la
propagacin de los virus.

Antes de 2000, el modelado epidmico estaba dominado por modelos basados en


compartimentos, suponiendo que todos pudieran infectar a todos los dems en el
mismo compartimento socio-fsico. La aparicin de un marco basado en la red ha
trado un cambio fundamental, ofreciendo un nuevo nivel de previsibilidad. Hoy en da
la prediccin epidmica es una de las aplicaciones ms activas de la Network Science,
que se utiliza para prever la propagacin de la gripe o para contener el Ebola.
El impacto de estos avances se hace sentir ms all de la epidemiologa. De hecho, en
enero de 2010 las herramientas de la Network Science se predijeron las condiciones
necesarias para la aparicin de virus que se extienden a travs de telfonos mviles. El
primer brote epidmico mvil que comenz en el otoo de 2010 en China, infectando
a ms de 300.000 telfonos cada da, sigui de cerca el escenario previsto.

Neurociencia: El mapeo del cerebro

El cerebro humano, que consiste en cientos de miles de millones de neuronas


interconectadas, es una de las redes menos entendidas desde la perspectiva de la
Network Science. La razn es simple: Carecemos de mapas que nos digan qu
neuronas estn unidas entre s. El nico cerebro completamente mapeado disponible
para la investigacin es el del gusano de C. elegans, que consta de slo 302 neuronas.
Mapas detallados de cerebros de mamferos podran conducir a una revolucin en la
ciencia del cerebro, permitiendo la comprensin y curacin de numerosas
enfermedades neurolgicas y cerebrales. Con ese cerebro la investigacin podra
convertirlo en uno de las ms prolficas reas de aplicacin de la Network Science.
Impulsado por el posible impacto transformador de estos mapas, en 2010 los Institutos
Nacionales de Salud de los Estados Unidos han iniciado el proyecto Connectome, cuyo
objetivo es desarrollar tecnologas que proporcionen mapas precisos de neuronas a
nivel de cerebro de mamferos.

Gestin: Descubrir la estructura interna de una organizacin

Si bien la gestin tiende a depender de la cadena oficial de mando, cada vez es ms


evidente que la red informal, que capta quin realmente se comunica con quin, juega
el papel ms importante en el xito de una organizacin. Mapas precisos de estas
redes organizativas pueden exponer la posible falta de interacciones entre las
unidades clave, ayudar a identificar a las personas que desempean un papel
importante en reunir diferentes departamentos y productos y ayudar a la alta gerencia
a diagnosticar diversos problemas organizacionales. Por otra parte, hay cada vez ms
pruebas en la literatura de gestin que la productividad de un empleado est
determinada por su posicin en esta red informal de organizacin.
Por lo tanto, numerosas empresas, como Maven 7, Activate Networks u Orgnet,
ofrecen herramientas y metodologas para mapear la verdadera estructura de una
organizacin. Estas empresas ofrecen una gran cantidad de servicios, desde la
identificacin de lderes de opinin hasta la reduccin de la rotacin de empleados, la
optimizacin del conocimiento y la difusin de productos y el diseo de equipos con la
diversidad, tamao y experiencia para ser ms efectivos para tareas especficas. Las
empresas establecidas, de IBM a SAP, han agregado capacidades de redes sociales a
sus negocios. En general, las herramientas de la Network Science son indispensables
en la administracin y en los negocios, mejorando la productividad e impulsando la
innovacin dentro de una organizacin.

Seccin 1.6: Impacto cientfico (Por completar)

En ninguna parte es ms evidente el impacto de la Network Science que en la


comunidad cientfica. Las revistas cientficas ms prominentes, desde Nature to
Science, Cell y PNAS, han dedicado exmenes y editoriales sobre el impacto de las
redes en diversos temas, desde la biologa hasta las ciencias sociales. Por ejemplo,
Science ha publicado un nmero especial sobre redes, que marca el dcimo aniversario
del descubrimiento de redes libres de escala.

Durante la ltima dcada de cada ao, alrededor de una docena de conferencias


internacionales, talleres, escuelas de verano e invierno se han centrado en la Network
Science. Una serie de conferencias cientficas de red de gran xito, llamada Net- Sci,
atrae a los profesionales del campo desde 2005. Varios libros de inters general han
aparecido en las listas de bestseller en muchos pases, trayendo la Network Science al
pblico en general.

Seccin 1.7: Resumen

Si bien el surgimiento de la Network Science puede parecer un fenmeno bastante


repentino, el campo estaba respondiendo a una conciencia social ms amplia del papel
y la importancia de las redes. Esto se ilustra en la Imagen 1.12, que muestra la
frecuencia de uso de las palabras que capturan dos importantes revoluciones
cientficas de los dos ltimos siglos: la evolucin, el trmino ms comn que se refiere
a la teora de Darwin de la evolucin, y el cuntico, a la mecnica cuntica. Como era
de esperar, el uso de la evolucin aumenta despus de la publicacin de 1859 de
Darwin sobre los orgenes de las especies. La palabra cuntica, utilizada por primera
vez en 1902, permaneci prcticamente ausente hasta la dcada de 1920, cuando la
mecnica cuntica gan aceptacin entre los fsicos y lleg a la conciencia pblica.

Imagen 1.12

La figura compara estas palabras con el uso de la red, que disfrut de un espectacular
aumento despus de la dcada de 1980, superando tanto la evolucin como el
cuntico. Mientras que el trmino red tiene muchos usos (al igual que la evolucin y el
cuntico), su espectacular aumento capta la creciente conciencia social de las redes.

Hay algo comn entre los avances facilitados por la teora evolutiva, la mecnica
cuntica y la ciencia de la red: no son slo campos cientficos importantes con su
propio ncleo intelectual y cuerpo de conocimiento, sino que tambin son plataformas
de apoyo. De hecho, la revolucin actual en gentica se basa en la teora evolutiva y la
mecnica cuntica ofrece una plataforma para una amplia gama de avances en la
ciencia contempornea, desde la qumica a la electrnica. De manera similar, la ciencia
de la red es una plataforma que permite, ofreciendo nuevas herramientas y
perspectivas para una amplia gama de problemas cientficos, desde la creacin de
redes sociales hasta el diseo de frmacos.
Dado este impacto excepcional que las redes tienen tanto en la ciencia como en la
sociedad, debemos dominar las herramientas para estudiarlas y cuantificarlas.
Captulo 2: Teora de Grafos

Seccin 2.1: Los puentes de Knigsberg

Pocos campos de investigacin pueden rastrear su nacimiento a un solo momento y


lugar en la historia. La teora de grafos, el andamiaje matemtico detrs de la ciencia
de la red, puede. Sus races se remontan a 1735 en Knigsberg, la capital de Prusia
Oriental, una prspera ciudad mercantil de su tiempo. El comercio apoyado por su
flota de naves permiti a funcionarios de ciudad construir siete puentes a travs del ro
Pregel que rodeaba la ciudad. Cinco de stos conectaron al continente la isla Kneiphof,
cogida entre las dos ramas del Pregel. Los dos restantes cruzaron las dos ramas del ro
(Imagen 2.1). Este peculiar acuerdo dio origen a un rompecabezas contemporneo:
Se puede cruzar los siete puentes y nunca cruzar el mismo dos veces? A pesar de
muchos intentos, nadie pudo encontrar ese camino. El problema permaneci sin
resolver hasta 1735, cuando Leonard Euler, un matemtico suizo, ofreci una prueba
matemtica rigurosa de que tal camino no existe.

Euler represent cada una de las cuatro reas separadas por el ro con las letras A, B, C
y D (Imagen 2.1). Luego conect con lneas cada pedazo de tierra que tena un puente
entre ellos. As construy un grafo, cuyos nodos eran pedazos de tierra y los enlaces
eran los puentes. Entonces Euler hizo una simple observacin: si hay un camino
cruzando todos los puentes, pero nunca el mismo puente dos veces, entonces los
nodos con un nmero impar de enlaces deben ser el punto inicial o final de este
camino. De hecho, si llega a un nodo con un nmero impar de enlaces, puede
encontrarse sin tener ningn enlace no utilizado para que lo deje.
Imagen 2.1 Los puentes de Knigsberg
- Un mapa contemporneo de Knigsberg (ahora Kaliningrad, Rusia) durante los tiempos de Euler.
- Una ilustracin esquemtica de las cuatro piezas de tierra de Knigsberg y los siete puentes a travs de
ellas.
- Euler construy un grafo que tiene cuatro nodos (A, B, C, D), cada uno correspondiente a un pedazo de
tierra, y siete enlaces, cada uno correspondiente a un puente. l entonces demostr que no hay ninguna
trayectoria continua que cruce los siete puentes mientras que nunca se cruce el mismo puente dos
veces. El pueblo de Knigsberg renunci a su bsqueda infructuosa y en 1875 construy un nuevo
puente entre B y C, aumentando el nmero de enlaces de estos dos nodos a cuatro. Ahora solo quedaba
un nodo con un nmero impar de enlaces. En consecuencia, deberamos ser capaces de encontrar el
camino deseado. Puedes encontrar uno t mismo?
Un sendero que atraviesa todos los puentes puede tener slo un punto de partida y un
punto final. Por lo tanto, tal ruta no puede existir en un grafo que tenga ms de dos
nodos con un nmero impar de enlaces. El grafo de Knigsberg tena cuatro nodos con
un nmero impar de enlaces, A, B, C y D, por lo que ninguna ruta podra satisfacer el
problema.

La prueba de Euler fue la primera vez que alguien resolvi un problema matemtico
utilizando un grafo. Para nosotros, la prueba tiene dos mensajes importantes: el
primero es que algunos problemas se vuelven ms simples y ms manejables si se
representan como un grafo. La segunda es que la existencia del camino no depende de
nuestro ingenio para encontrarlo. Ms bien, es una propiedad del grafo. De hecho,
dada la estructura del grafo de Knigsberg, no importa cun inteligentes seamos,
nunca encontraremos el camino deseado. En otras palabras, las redes tienen
propiedades codificadas en su estructura que limitan o mejoran su comportamiento.

Para entender las muchas formas en que las redes pueden afectar las propiedades de
un sistema, necesitamos familiarizarnos con la teora de grafos, una rama de las
matemticas que surgi de la prueba de Euler. En este captulo aprenderemos a
representar una red como un grafo e introducir las caractersticas elementales de las
redes, de grados a distribuciones de grados, de caminos a distancias y aprender a
distinguir redes ponderadas, dirigidas y bipartitas. Introduciremos un formalismo y un
lenguaje de teora de grafos que sern utilizados a lo largo de este libro.

Seccin 2.2: Redes y Grafos

Si queremos entender un sistema complejo, primero necesitamos saber cmo sus


componentes interactan entre s. En otras palabras, necesitamos un mapa de su
diagrama de cableado. Una red es un catlogo de componentes de un sistema a
menudo llamado nodos o vrtices y las interacciones directas entre ellos, denominadas
enlaces o bordes. Esta representacin de red ofrece un lenguaje comn para estudiar
sistemas que pueden diferir mucho en naturaleza, aspecto o alcance. De hecho, como
se muestra en la Imagen 2.2, tres sistemas bastante diferentes tienen exactamente la
misma representacin de red.

La imagen 2.2 introduce dos parmetros bsicos de red:

Nmero de nodos, o N, representa el nmero de componentes en el sistema. A


menudo llamaremos N al tamao de la red. Para distinguir los nodos, los etiquetamos
con i = 1, 2, ..., N.

El nmero de enlaces, que denotamos con L, representa el nmero total de


interacciones entre los nodos. Los enlaces son raramente etiquetados, ya que pueden
ser identificados a travs de los nodos que conectan. Por ejemplo, el enlace (2, 4)
conecta los nodos 2 y 4.

Las redes mostradas en la Imagen 2.2 tienen N = 4 y L = 4.


Imagen 2.2 Diferentes redes, mismos grafos
La figura muestra un pequeo subconjunto de Internet (a), donde los routers (computadoras
especializadas) estn conectados entre s; la red de actores de Hollywood (b), donde dos actores estn
conectados si actan en la misma pelcula; una red de interaccin protena-protena (c), en la que se
conectan dos protenas si hay evidencia experimental de que pueden unirse entre s en la clula. Si bien
la naturaleza de los nodos y los enlaces difieren, estas redes tienen la misma representacin grfica, que
consta de N = 4 nodos y L = 4 enlaces, mostrados en (d).

Los enlaces de una red pueden ser dirigidos o no dirigidos. Algunos sistemas tienen
enlaces dirigidos, como el WWW, cuyos localizadores uniformes de recursos (URL)
apuntan desde un documento web al otro, o llamadas telefnicas, donde una persona
llama al otro. Otros sistemas tienen vnculos no dirigidos, como los lazos romnticos: si
salgo con Janet, Janet tambin conmigo, o como lneas de transmisin en la red de
energa, en la que la corriente elctrica puede fluir en ambas direcciones.

Una red se llama dirigida (o digrafo) si todos sus enlaces estn dirigidos; Se denomina
no dirigido si todos sus vnculos no estn dirigidos. Algunas redes simultneamente
tienen enlaces dirigidos y no dirigidos. Por ejemplo, en la red metablica algunas
reacciones son reversibles (es decir, bidireccionales o no dirigidas) y otras son
irreversibles, teniendo lugar en una sola direccin (dirigida).

Las elecciones que hacemos cuando representamos un sistema como una red
determinarn nuestra capacidad de utilizar la Network Science con xito para
resolver un problema particular. Por ejemplo, la forma en que definimos los vnculos
entre dos individuos dicta la naturaleza de las preguntas que podemos explorar:

- Al conectar a las personas que regularmente interactan entre s en el contexto


de su trabajo, obtenemos la red organizativa o profesional, que juega un papel
clave en el xito de una empresa o una institucin, y es de gran inters para la
investigacin organizacional.
- Al vincular amigos entre s, obtenemos la red de amistad, que juega un papel
importante en la difusin de ideas y hbitos y es de gran inters para la
sociologa, el marketing y las ciencias de la salud.
- Al conectar a los individuos que tienen una relacin ntima, obtenemos la red
sexual, de importancia clave para la propagacin de enfermedades de
transmisin sexual, como el SIDA, y de mayor inters para la epidemiologa.
Mientras que muchos enlaces en estas tres redes se superponen (algunos compaeros
de trabajo pueden ser amigos o pueden tener una relacin ntima), estas redes tienen
diferentes usos y propsitos.

Tambin podemos construir redes que pueden ser vlidas desde una perspectiva de
teora grfica, pero pueden tener poca utilidad prctica. Por ejemplo, si relacionamos a
todos los individuos con el mismo nombre, Johns con Johns y Marys con Marys,
obtenemos un grafo bien definido, cuyas propiedades pueden ser analizadas con las
herramientas de la Network Science. Sin embargo, su utilidad es cuestionable. Por lo
tanto, con el fin de aplicar la teora de la red a un sistema, consideraciones cuidadosas
deben preceder a nuestra eleccin de nodos y enlaces, asegurando su importancia
para el problema que deseamos explorar.

A lo largo de este libro usaremos diez redes para ilustrar las herramientas de la ciencia
en red. Estas redes de referencia, enumeradas en la Tabla 2.1, abarcan sistemas
sociales (redes de llamadas o redes de correo electrnico), redes de colaboracin y
afiliacin (red de colaboracin cientfica, red de actores de Hollywood), sistemas de
informacin (WWW), sistemas tecnolgicos e infraestructurales), Sistemas biolgicos
(interaccin proteica y red metablica), y redes de referencia (citas). Difieren
ampliamente en sus tamaos, desde tan pocos como N = 1.039 nodos en el
metabolismo de E. coli, hasta casi medio milln de nodos en la red de citas. Cubren
varias reas donde las redes se aplican activamente, representando los conjuntos de
datos 'cannicos' usados con frecuencia por los investigadores para ilustrar las
propiedades clave de la red. Como se indica en la Tabla 2.1, algunos de ellos estn
dirigidos, otros no dirigidos. En los prximos captulos vamos a discutir en detalle la
naturaleza y las caractersticas de cada uno de estos conjuntos de datos,
convirtindolos en los cobayas de nuestro viaje para entender las redes complejas.
Tabla 2.1
Las caractersticas bsicas de diez redes utilizadas en este libro para ilustrar las herramientas de la red
de ciencia. La tabla enumera la naturaleza de sus nodos y enlaces, indicando si los enlaces estn
dirigidos o no dirigidos, el nmero de nodos (N) y enlaces (L), y el grado promedio para cada red. Para
las redes dirigidas, el grado promedio mostrado es el promedio de los grados de entrada y salida: k = k in
= kout.

Seccin 2.3: Grado, grado medio y distribucin de grado

Una propiedad clave de cada nodo es su grado, que representa el nmero de enlaces
que tiene con otros nodos. El grado puede representar el nmero de contactos del
telfono mvil que un individuo tiene en el grfico de llamadas (es decir, el nmero de
personas diferentes con las que la persona ha hablado) o el nmero de citas que un
trabajo de investigacin obtiene en la red de citas.

Grado

Denotamos con ki el grado del ithnode en la red. Por ejemplo, para las redes no
dirigidas mostradas en la Imagen 2.2 tenemos k1 = 2, k2 = 3, k3 = 2, k4 = 1. En una red
no dirigida, el nmero total de enlaces, L, se puede expresar como la suma del grado
de los nodos:

1
= (2.1)
2
=1

Aqu el factor 1/2 corrige el hecho de que en la suma cada enlace se cuenta dos veces.
Por ejemplo, el enlace que conecta los nodos 2 y 4 en la Imagen 2.2 se contar una vez
en el grado del nodo 2 y una vez en el grado del nodo 4.
Grado Medio

Una propiedad importante de una red es su grado medio (BOX 2.2), que para una red
no dirigida es

1 2
< >= = (2.2)

=1

En redes dirigidas distinguimos entre el grado entrante, kiin, que representa el nmero
de enlaces que apuntan al nodo i, y el grado saliente, kiout, que representa el nmero
de enlaces que apuntan desde el nodo i a otros nodos. Finalmente, el grado total de un
nodo, ki, viene dado por
= + (2.3)

Por ejemplo, en la WWW el nmero de pginas a las que apunta un documento dado
representa su grado de salida, kout, y el nmero de documentos que lo apuntan
representa su grado de entrada, kin. El nmero total de enlaces en una red dirigida es

= = (2.4)
=1 =1

El factor 1/2 visto en (2.1) est ausente, ya que para las redes dirigidas las dos sumas
en (2.4) cuentan separadamente los grados saliente y entrante. El grado medio de una
red dirigida es

1 1
<
> = =< > = = (2.5)

=1 =1
BOX 2.2

Distribucin de Grado

La distribucin de grado, pk, proporciona la probabilidad de que un nodo seleccionado


aleatoriamente en la red tenga grado k. Dado que pk es una probabilidad, debe
normalizarse, es decir,

= 1 (2.6)
=1
Para una red con N nodos la distribucin de grados es el histograma normalizado
(Imagen 2.3) es dado por

= (2.7)

Donde Nk es el nmero de nodos grado-k. Por lo tanto, el nmero de nodos grado-k
puede obtenerse a partir de la distribucin de grados como Nk = Npk.
La distribucin del grado ha asumido un papel central en la teora de la red despus del
descubrimiento de redes libres de escala. Una de las razones es que el clculo de la
mayora de las propiedades de la red requiere que conozcamos pk. Por ejemplo, el
grado medio de una red se puede escribir como

< > = (2.8)


=0
La otra razn es que la forma funcional precisa de pk determina muchos fenmenos de
red, desde la robustez de la red hasta la propagacin de virus.

Imagen 2.3 Distribucin de grado


La distribucin de grados de una red viene dada por la relacin (2.7).
- Para la red en (a) con N = 4 la distribucin de grados se muestra en (b).
- Tenemos p1=1/4 (uno de los cuatro nodos tiene grado k1=1), p2=1/2 (dos nodos tienen
k3=k4=2), y p3=1/4 (k2=3). Al carecer de nodos de grado k>3, pk=0 para cualquier k>3.
- Una rejilla unidimensional para la cual cada nodo tiene el mismo grado k = 2.
- La distribucin de grados de (c) es una funcin delta de Kronecker, pk = (k - 2).
Imagen 2.4 Distribucin de grado de una red real
En las redes reales, los grados de los nodos pueden variar considerablemente.
- Una disposicin de la red de interaccin de protenas de la levadura (Tabla 2.1). Cada
nodo corresponde a una protena de levadura y los enlaces corresponden a
interacciones de unin detectadas experimentalmente. Observe que las protenas
mostradas en la parte inferior tienen auto-bucles, por lo tanto su grado es k=2.
- La distribucin de grados de la red de interaccin de protenas mostrada en (a). Los
grados observados varan entre k = 0 (nodos aislados) y k = 92, que es el grado del
nodo ms conectado, llamado hub. Tambin hay grandes diferencias en el nmero de
nodos con grados diferentes: Casi la mitad de los nodos tienen grado uno (es decir,
p1=0,48), mientras que slo tenemos una copia del nodo ms grande
(p92=1/N=0,0005).
- La distribucin de los grados se muestra a menudo en una grfica log-log, en la que
tramos log pk en funcin de ln k, o, como lo hacemos en (c), o utilizamos ejes
logartmicos.

Seccin 2.4: Matriz de Adyacencia

Una descripcin completa de una red nos obliga a realizar un seguimiento de sus
enlaces. La forma ms sencilla de lograr esto es proporcionar una lista completa de los
enlaces. Por ejemplo, la red de la Imagen 2.2 se describe de forma nica enumerando
sus cuatro enlaces: {(1, 2), (1, 3), (2, 3), (2, 4)}. Con fines matemticos, a menudo
representamos una red a travs de su matriz de adyacencia. La matriz de adyacencia
de una red dirigida de N nodos tiene N filas y N columnas, siendo sus elementos:
- Aij = 1 si hay un enlace que apunta desde el nodo j al nodo i
- Aij = 0 si los nodos i y j no estn conectados entre s
La matriz de adyacencia de una red no dirigida tiene dos entradas para cada enlace,
por ejemplo, el enlace (1, 2) se representa como A12 = 1 y A21 = 1. Por lo tanto, la
matriz de adyacencia de una red no dirigida es simtrica, Aij = Aji (Imagen 2.5b)

El grado ki del nodo i puede obtenerse directamente de los elementos de la matriz de


adyacencia. Para redes no dirigidas, el grado de un nodo es una suma sobre las filas o
las columnas de la matriz, es decir,

= = (2.9)
=1 =1
Para las redes dirigidas, las sumas sobre las filas y columnas de la matriz de adyacencia
proporcionan los grados entrante y saliente, respectivamente

= = (2.10)
=1 =1
Dado que en una red no dirigida el nmero de enlaces salientes es igual al nmero de
enlaces entrantes, tenemos

2 = = = (2.11)
=1 =1
El nmero de elementos distintos de cero de la matriz de adyacencia es 2L, o el doble
del nmero de enlaces. De hecho, un enlace no dirigido que conecta nodos i y j
aparece en dos entradas: Aij=1, un enlace que apunta desde el nodo j al nodo i, y Aji=1,
un enlace que apunta de i a j (Imagen 2.5b).
Imagen 2.5 La matriz de Adyacencia
- El etiquetado de los elementos de la matriz de adyacencia.
- La matriz de adyacencia de una red no dirigida. La figura muestra que el grado de un
nodo (en este caso el nodo 2) se puede expresar como la suma sobre la columna o la
fila apropiada de la matriz de adyacencia. Tambin muestra algunas caractersticas
bsicas de la red, como el nmero total de enlaces, L, y el grado medio, <k>, expresado
en trminos de los elementos de la matriz de adyacencia.
- Lo mismo que en (b) pero para una red dirigida.

Seccin 2.5: Las redes reales son poco densas (Sparse Networks)

En redes reales el nmero de nodos (N) y enlaces (L) puede variar ampliamente. Por
ejemplo, la red neural del gusano C.elegans, el nico sistema nervioso completamente
mapeado de un organismo vivo, tiene N = 302 neuronas (nodos). En contraste, se
estima que el cerebro humano tiene alrededor de cien mil millones (N 10 11)
neuronas. La red gentica de una clula humana tiene unos 20.000 genes como nodos;
La red social se compone de siete mil millones de personas (N 7 109) y se estima
que la WWW tiene ms de un trilln de documentos web (N> 1012).

Estas grandes diferencias de tamao se aprecian en la Tabla 2.1, que enumera N y L


para varios mapas de red. Algunos de estos mapas ofrecen un diagrama de cableado
completo del sistema que describen (como la red de actores o el metabolismo de
E.coli), mientras que otros son slo muestras, representando un subconjunto de la red
completa (como el WWW o el grfico de llamadas mviles)

La Tabla 2.1 indica que el nmero de enlaces tambin vara ampliamente. En una red
de N nodos el nmero de enlaces puede cambiar entre L = 0 y Lmax, donde
( 1)
= (2.12)
2
es el nmero total de enlaces presentes en un grafo completo de tamao N (Imagen
2.6). En un grafo completo cada nodo est conectado a cada otro nodo.
Imagen 2.6 - Grafo completo
Un grafo completo con N = 16 nodos y Lmax = 120 enlaces, segn lo predicho por (2.12). La
matriz de adyacencia de un grafo completo es Aij = 1 para todo i, j = 1,...,N y Aii = 0. El grado
medio de un grfico completo es <k> = N - 1.

En redes reales L es mucho menor que Lmax, lo que refleja el hecho de que la mayora
de las redes reales son dispersas. Llamamos a una red dispersa (Sparse Network) si
L<<Lmax. Por ejemplo, el grafo de WWW en la Tabla 2.1 tiene aproximadamente 1.5
millones de enlaces. Sin embargo, si la WWW fuera un grafo completo, debera tener
Lmax 5x1010 enlaces de acuerdo con (2.12). En consecuencia, el grafo web slo tiene
una fraccin 3x10-5 de los enlaces que podra tener. Esto es cierto para todas las redes
de la Tabla 2.1: Se puede comprobar que su nmero de enlaces es slo una pequea
fraccin del nmero esperado de enlaces para un grafo completo del mismo nmero
de nodos.

Que las redes reales sean dispersas implica que las matrices de adyacencia son
tambin dispersas. De hecho, una red completa tiene Aij = 1, para todos (i, j), es decir,
cada uno de sus elementos de matriz son iguales a uno. En contraste en las redes
reales slo una pequea fraccin de los elementos de la matriz no son cero. Esto se
ilustra en la Imagen 2.7, que muestra la matriz de adyacencia de la red de interaccin
protena-protena listada en la Tabla 2.1 y mostrada en la Imagen 2.4a. Se puede ver
que la matriz est casi vaca.

La dispersin tiene consecuencias importantes en la forma en que exploramos y


almacenamos redes reales. Por ejemplo, cuando almacenamos una red grande en
nuestro ordenador, es mejor almacenar slo la lista de enlaces (es decir, elementos
para los cuales Aij 0), en lugar de la matriz de adyacencia completa, ya que una
fraccin abrumadora de los elementos Aij son cero. Por lo tanto, la representacin
matricial bloquear un gran trozo de memoria, lleno principalmente de ceros (Imagen
2.7).

Imagen 2.7 La matriz de adyacencia es dispersa


La matriz de adyacencia de la red de interaccin protena-protena de la levadura, que consta
de 2.018 nodos, cada uno de ellos representa una protena de levadura (Tabla 2.1). Se coloca
un punto en cada posicin de la matriz adyacente para la cual Aij = 1, indicando la presencia de
una interaccin. No hay puntos para Aij = 0. La pequea fraccin de puntos ilustra la dispersa
naturaleza de la red de interaccin protena-protena.
Seccin 2.6 Redes ponderadas

Hasta ahora hemos discutido slo redes para las cuales todos los enlaces tienen el
mismo peso, es decir, Aij = 1. En muchas aplicaciones necesitamos estudiar redes
ponderadas, donde cada enlace (i, j) tiene un peso nico wij. En las redes de llamadas
mviles el peso puede representar el nmero total de minutos que dos personas
hablan con el otro por telfono; En la red elctrica, el peso es la cantidad de corriente
que fluye a travs de una lnea de transmisin.
Para las redes ponderadas los elementos de la matriz de adyacencia llevan el peso del
enlace como
= (2.13)

La mayora de las redes de inters cientfico estn ponderadas, pero no siempre


podemos medir los pesos apropiados. En consecuencia, a menudo se aproximan estas
redes con un grfico no ponderado. En este libro nos centramos predominantemente
en redes no ponderadas, pero siempre que sea apropiado, discutimos cmo los pesos
alteran la propiedad de red (Mirar el BOX 2.3).

Seccin 2.7: Redes Bipartitas

Un grafo bipartito (o bigraph) es una red cuyos nodos se pueden dividir en dos
conjuntos disjuntos U y V de manera que cada enlace conecte un nodo U a un nodo V.
En otras palabras, si coloreamos los U-nodos verdes y los V-nodos prpura, cada
enlace debe conectar nodos de diferentes colores (Imagen 2.9).
Podemos generar dos proyecciones para cada red bipartita. La primera proyeccin
conecta dos nodos U por un enlace si estn vinculados al mismo nodo V en la
representacin bipartita. La segunda proyeccin conecta los nodos V por un enlace si
se conectan al mismo nodo U (imagen 2.9).
Imagen 2.9 Red bipartita

Una red bipartita tiene dos conjuntos de nodos, U y V. Los nodos del conjunto U se conectan
directamente slo a los nodos del conjunto V. Por lo tanto, no hay enlaces U-U o V-V directos.
La figura muestra las dos proyecciones que podemos generar de cualquier red bipartita. La
proyeccin U se obtiene conectando dos nodos U entre s si se enlazan al mismo nodo V en la
representacin bipartita. La proyeccin V se obtiene conectando dos nodos V entre s si se
enlazan al mismo nodo U en la red bipartita.

En la teora de la red encontramos numerosas redes bipartitas. Un ejemplo bien


conocido es la red de actores de Hollywood, en la que un conjunto de nodos
corresponde a la pelcula (U), y el otro a los actores (V). Una pelcula est conectada a
un actor si el actor acta en esa pelcula. Una proyeccin de esta red bipartita es la red
de actores, en la que dos nodos estn conectados entre s si actan en la misma
pelcula. Esta es la red listada en la Tabla 2.1. La otra proyeccin es la red de pelculas,
en la que se conectan dos pelculas si comparten al menos un actor en su reparto.
La medicina ofrece otro ejemplo prominente de una red bipartita: La Red de
Enfermedades Humanas conecta enfermedades a los genes cuyas mutaciones son
conocidas por causar o afectar a la enfermedad correspondiente (Imagen 2.10).
Por ltimo, tambin se pueden definir redes multipartitas, como la red tripartita de
recetas-ingrediente-compuesto mostrada en la Imagen 2.11.
Imagen 2.10 Red de Enfermedades Humanas

- Una proyeccin de la enfermedad es la red de enfermedades, cuyos nodos son


enfermedades. Dos enfermedades estn conectadas si los mismos genes estn
asociados con ellas, lo que indica que las dos enfermedades tienen origen gentico
comn. Las figuras (a) - (c) muestran un subconjunto de la enfermedad, centrndose
en los cnceres.
- La Red de Enfermedades Humanas (o enfermedad) es una red bipartita, cuyos nodos
son enfermedades (U) y genes (V). Una enfermedad est conectada a un gen si las
mutaciones en ese gen se sabe que afectan a la enfermedad en particular.
- La segunda proyeccin es la red gentica, cuyos nodos son genes, y donde dos genes
estn conectados si estn asociados con la misma enfermedad.
Imagen 2.11 Red Tripartita

- La construccin de la red tripartita receta-ingrediente-compuesto, en la que un


conjunto de nodos son recetas, como el pollo Marsala; El segundo conjunto
corresponde a los ingredientes que cada receta tiene (como harina, salvia, pollo, vino y
mantequilla para el pollo Marsala); El tercer conjunto captura los compuestos de
sabor, o productos qumicos que contribuyen al sabor de cada ingrediente.
- El ingrediente o la red de sabor representa una proyeccin de la red tripartita. Cada
nodo denota un ingrediente; El color del nodo que indica la categora de alimento y el
tamao del nodo indica la prevalencia del ingrediente en las recetas. Dos ingredientes
estn conectados si comparten un nmero significativo de compuestos de sabor. El
grosor del enlace representa el nmero de compuestos compartidos.

Seccin 2.8: Caminos y distancias

La distancia fsica juega un papel clave en la determinacin de las interacciones entre


los componentes de los sistemas fsicos. Por ejemplo, la distancia entre dos tomos en
un cristal o entre dos galaxias en el universo determina las fuerzas que actan entre
ellos.
En las redes, la distancia es un concepto desafiante. De hecho, cul es la distancia
entre dos pginas web, o entre dos individuos que no se conocen? La distancia fsica
no es relevante aqu: Dos pginas web podran estar situadas en computadoras en
lados opuestos del globo, sin embargo, tienen un enlace entre s. Al mismo tiempo dos
individuos que viven en el mismo edificio pueden no conocerse.
En las redes, la distancia fsica se sustituye por la longitud del camino. El camino es una
ruta que se recorre a lo largo de los enlaces de la red. La longitud de un camino
representa el nmero de enlaces que contiene el camino (Imagen 2.12a).
En la Network Science los caminos juegan un papel central. A continuacin se
discuten algunas de sus propiedades ms importantes.

Imagen 2.12 Caminos


- Una ruta entre los nodos i0 e in es una lista ordenada de n enlaces P = {(i0, i1), (i1, i2), (i2,
i3), ..., (in-1, in)}. La longitud de este camino es n. La trayectoria mostrada en naranja en
(a) sigue la ruta 1 2 5 7 4 6, por lo tanto su longitud es n = 5.
- El camino ms corto entre los nodos 1 y 7, o la distancia d17 corresponde con el camino
con menor nmero de enlaces que conecta los nodos 1 y 7. Puede haber muchos
caminos con la misma longitud, como los caminos naranja y gris. El dimetro de una
red es la mayor distancia en la red, dmax = 3 en este caso.

El camino ms corto

El camino ms corto entre los nodos i y j es el camino con el menor nmero de enlaces
(Imagen 2.12b). El camino ms corto a menudo se llama distancia entre los nodos i y j,
y se denotan por dij, o simplemente d. Podemos tener mltiples caminos ms cortos de
la misma longitud d entre un par de nodos (Imagen 2.12b). El camino ms corto nunca
contiene bucles o se interseca a s mismo.
En una red no dirigida dij = dji, es decir, la distancia entre el nodo i y j es la misma que la
distancia entre el nodo j e i. En una red dirigida a menudo dij dji. Adems, en una red
dirigida la existencia de una ruta del nodo i al nodo j no garantiza la existencia de un
camino de j a i.
En redes reales a menudo necesitamos determinar la distancia entre dos nodos. Para
una red pequea, como la que se muestra en la Imagen 2.12, esta es una tarea fcil.
Para una red con millones de nodos encontrar el camino ms corto entre dos nodos
puede llevar bastante tiempo. La longitud del camino ms corto y el nmero de tales
caminos se pueden obtener formalmente a partir de la matriz de adyacencia (BOX 2.4).
En la prctica usamos el algoritmo de bsqueda de amplitud (BFS) explicado en la BOX
2.5 para este propsito.

Imagen 2.13 Patologa

- Camino: Una secuencia de nodos tal que cada nodo est conectado al siguiente nodo a
lo largo del camino por un enlace. Cada ruta consta de n + 1 nodos y n enlaces. La
longitud de un camino es el nmero de sus enlaces, contando mltiples enlaces varias
veces. Por ejemplo, la lnea naranja 1 2 5 4 3 cubre un trayecto de longitud
cuatro.
- Camino ms corto (Camino Geodsico, d): El camino con la distancia ms corta d entre
dos nodos. Tambin llamamos d la distancia entre dos nodos. Tenga en cuenta que la
ruta ms corta no necesita ser nica: entre los nodos 1 y 4 tenemos dos caminos ms
cortos, 1 2 3 4 (azul) y 1 2 5 4 (naranja), con la misma longitud d1,4 = 3.
- Dimetro (dmax): El camino ms corto ms largo en un grafo, o la distancia entre los
dos nodos ms alejados. En el grafo mostrado aqu el dimetro est entre los nodos 1
y 4, de ah dmax = 3.
- Longitud media de camino (<d>): El promedio de los caminos ms cortos entre todos
los pares de nodos. Para el grafo mostrado a la izquierda de la imagen tenemos <d> =
1.6, cuyo clculo se muestra junto a la figura.
- Ciclo: Una ruta con el mismo nodo inicial y final. En el grafo que se muestra arriba
tenemos slo un ciclo, como lo muestra la lnea naranja.
- Camino Euleriano: Un camino que atraviesa cada enlace exactamente una vez. La
imagen muestra dos caminos Eulerianos, uno en naranja y el otro en azul.
- Camino Hamiltoniano: Una ruta que visita cada nodo exactamente una vez. Se
muestran dos caminos hamiltonianos en naranja y en azul.

BOX 2.4
Dimetro de red

El dimetro de una red, denotado por dmax, es el mximo camino ms corto posible en
la red. En otras palabras, es la mayor distancia registrada entre cualquier par de nodos.
Se puede verificar que el dimetro de la red mostrado en la Imagen 2.13 es d max = 3.
Para redes ms grandes el dimetro puede determinarse usando el algoritmo BFS
descrito en la BOX 2.5.
Longitud media de camino

La longitud media de camino, denotada por <d>, es la distancia media entre todos los
pares de nodos en la red. Para una red dirigida de N nodos, <d> es

1
= , (2.14)
( 1)
,=1 ;

(Mirar la BOX 2.5)

Seccin 2.9: Conectividad

Un telfono sera de uso limitado como un dispositivo de comunicacin si no


pudiramos llamar a ningn nmero de telfono vlido; Correo electrnico sera
bastante intil si solo pudiramos enviar correos electrnicos a ciertas direcciones de
correo electrnico, y no a otros. Desde una perspectiva de red esto significa que la red
detrs del telfono o de Internet debe ser capaz de establecer un camino entre dos
nodos cualesquiera. Esta es de hecho la principal utilidad de la mayora de las redes:
aseguran la conexin. En esta seccin discutiremos la formulacin grfica-terica de la
conexin.
En una red no dirigida los nodos i y j estn conectados si hay un camino entre ellos.
Estn desconectados si tal camino no existe, en cuyo caso tenemos dij = . Esto se
ilustra en la Imagen 2.15a, que muestra una red que consta de dos clsteres
desconectados. Si bien existen rutas entre dos nodos en el mismo clster (por ejemplo,
los nodos 4 y 6), no hay rutas entre nodos que pertenezcan a diferentes clsteres
(nodos 1 y 6).
Una red est conectada si todos los pares de nodos de la red estn conectados. Una
red est desconectada si hay al menos un par con dij = . Es evidente que la red
mostrada en la Imagen 2.15a est desconectada, y llamamos a sus dos sub-redes
componentes o clusters. Un componente es un subconjunto de nodos en una red, por
lo que hay una ruta entre dos nodos que pertenecen al componente, pero uno no
puede agregar ms nodos a la misma que tendran la misma propiedad.
Si una red consta de dos componentes, un enlace sencillo correctamente colocado
puede conectarlos, haciendo que la red est conectada (Imagen 2.15b). Este enlace se
llama puente. En general, un puente es cualquier enlace que, si se corta, desconecta la
red.
Mientras que para una pequea red una inspeccin visual puede ayudarnos a decidir si
est conectado o desconectado, para una red que consiste en millones de conexiones
de nodos la pregunta es ms difcil. Las herramientas matemticas y algortmicas
pueden ayudarnos a identificar los componentes conectados de un grfico. Por
ejemplo, para una red desconectada, la matriz de adyacencia puede ser reordenada en
una forma diagonal de bloque, de manera que todos los elementos distintos de cero
en la matriz estn contenidos en bloques cuadrados a lo largo de la diagonal de la
matriz y todos los dems elementos son cero (Figura 2.15a). Cada bloque cuadrado
corresponde a un componente. Podemos utilizar las herramientas del lgebra lineal
para decidir si la matriz de adyacencia es un bloque diagonal, ayudndonos a
identificar los componentes conectados.

Imagen 2.15 Redes conectadas y desconectadas

Una red pequea que consta de dos componentes desconectados. De hecho, hay un camino
entre cualquier par de nodos en el componente (1,2,3), as como en el componente (4,5,6,7).
Sin embargo, no hay rutas entre nodos que pertenecen a los diferentes componentes.

- El panel derecho muestra la matriz adyacente de la red. Si la red tiene componentes


desconectados, la matriz de adyacencia puede ser reordenada en una forma diagonal
de bloque, de manera que todos los elementos distintos de cero de la matriz estn
contenidos en bloques cuadrados a lo largo de la diagonal de la matriz y todos los
dems elementos sean cero.
- La adicin de un solo enlace, llamado un puente, mostrado en gris, convierte una red
desconectada en un solo componente conectado. Ahora hay un camino entre cada par
de nodos en la red. En consecuencia, la matriz de adyacencia no puede escribirse en
forma de bloque

BOX 2.6

Seccin 2.10: Coeficiente de agrupacin

El coeficiente de agrupacin captura el grado en que los vecinos de un nodo dado se


enlazan entre s. Para un nodo i con grado ki, el coeficiente de agrupacin local se
define como
2
= (2.15)
( 1)
donde Li representa el nmero de enlaces entro los ki vecinos del nodo i. Obsrvese
que Ci est entre 0 y 1.
- Ci = 0 si ninguno de los vecinos del nodo i se vinculan entre s.
- Ci = 1 si los vecinos del nodo i forman un grafo completo, es decir, todos
enlazan entre s.
- Ci es la probabilidad de que dos vecinos de un nodo se unan entre s. En
consecuencia C = 0,5 implica que hay un 50% de probabilidad de que dos
vecinos de un nodo estn vinculados.
En resumen, Ci mide la densidad de enlace local de la red: Cuanto ms densamente
interconectado est el vecindario del nodo i, mayor es su coeficiente de agrupacin
local.
Imagen 2.16 Coeficiente de Agrupacin

- El coeficiente de agrupamiento local, Ci, del nodo central con grado ki = 4 para tres
configuraciones diferentes de su vecindad. El coeficiente de agrupacin local mide la
densidad local de enlaces en la vecindad de un nodo.
- Una red pequea, con el coeficiente de agrupacin local de cada nodo que se muestra
junto a l. Tambin se lista el coeficiente de agrupacin promedio de la red <C>, de
acuerdo con (2.16), y su coeficiente de agrupacin global C, definido en la SECCIN
2.12, Ec. (2.17). Tenga en cuenta que para los nodos con grados ki = 0,1, el coeficiente
de agrupamiento es cero.

El grado de agrupamiento de toda una red es capturado por el coeficiente de


agrupamiento promedio, <C>, que representa el promedio de Ci sobre todos los nodos
i = 1,...,N.

1
< > = (2.16)

=1

En lnea con la interpretacin probabilstica <C> es la probabilidad de que dos vecinos


de un nodo seleccionado aleatoriamente se unan entre s.
Mientras que (2.16) se define para las redes no dirigidas, el coeficiente de
agrupamiento se puede generalizar a las redes dirigidas y ponderadas tambin. En la
literatura de la red tambin podemos encontrar el coeficiente de agrupamiento global,
discutido en TEMAS AVANZADOS 2.A.

Seccin 2.11: Resumen

El curso intensivo ofrecido en este captulo introdujo algunos de los conceptos tericos
bsicos de los grafos y las herramientas usadas en la Network Science. El conjunto de
caractersticas elementales de la red, resumido en la Imagen 2.17, ofrece un lenguaje
formal a travs del cual podemos explorar las redes.
Muchas de las redes que estudiamos en la Network Science consisten en miles o
incluso millones de nodos y enlaces (Tabla 2.1). Para explorarlos, necesitamos ir ms
all de los pequeos grafos mostrados en la Imagen 2.17. Un vistazo de lo que estamos
a punto de encontrar es ofrecido por la red de interaccin protena-protena de la
levadura (Imagen 2.4a). La red es demasiado compleja para comprender sus
propiedades a travs de una inspeccin visual de su diagrama de cableado. Por lo
tanto, necesitamos recurrir a las herramientas de la ciencia en red para caracterizar su
topologa.

Imagen 2.17 Grafologa

En la Network Science, a menudo distinguimos las redes por alguna propiedad


elemental del grafo subyacente. Aqu resumimos los tipos de red ms comnmente
encontrados. Tambin enumeramos sistemas reales que comparten alguna propiedad
particular. Tenga en cuenta que muchas redes reales combinan varias de estas
caractersticas de red elementales. Por ejemplo, la WWW es un multi-grafo dirigido
con auto-interacciones; La red de llamadas mviles est dirigida y ponderada, sin
bucles automticos.

Redes no dirigidas

Una red cuyos enlaces no tienen una direccin definida.


Ejemplos: Internet, red elctrica, redes de colaboracin cientfica.

Auto-bucles

En muchas redes los nodos no interactan consigo mismos, por lo que los elementos
diagonales de la matriz de adyacencia son cero, Aii = 0, i = 1,...,N. En algunos sistemas
se permiten interacciones de uno mismo; En tales redes, auto-bucles representan el
hecho de que el nodo i interacta con s mismo.
Ejemplos: Internet, interaccin de protenas

Multigrafos / Grafos Simples

En un multigrafo se permite a los nodos tener mltiples enlaces (o enlaces paralelos)


entre ellos. Por lo tanto, Aii puede ser cualquier entero positivo. Las redes que no
permiten mltiples enlaces se llaman simples.
Ejemplos de multigrafos: Redes sociales, donde distinguimos la amistad, la familia y los
lazos profesionales.

Redes dirigidas

Una red cuyos enlaces tienen direcciones seleccionadas.


Ejemplos: WWW, llamadas de telfono mvil, red de citas.
Redes ponderadas

Una red cuyos enlaces tienen un peso, una intensidad o un parmetro de flujo
definidos. Los elementos de la matriz de adyacencia son Aij = wij si existe un enlace con
peso wij entre ellos. Para redes no ponderadas (binarias), la matriz de adyacencia slo
indica la presencia (Aij = 1) o la ausencia (Aij = 0) de un enlace.
Ejemplos: llamadas de telfono mvil, red de correo electrnico.

Grafo completo (Clique)

En un grafo completo, o Clique, todos los nodos estn conectados entre s.


Ejemplos: Actores en el reparto de la misma pelcula, ya que estn todos vinculados
entre s en la red de actores.

Utilicemos las medidas que hemos introducido hasta ahora para explorar algunas
caractersticas bsicas de esta red. La red no dirigida, que se muestra en la imagen
2.4a, tiene N = 2.018 protenas como nodos y L = 2.930 interacciones de enlace como
enlaces. Por lo tanto su grado medio, segn (2.2), es <k> = 2.90, lo que sugiere que una
protena tpica interacta con aproximadamente de dos a tres otras protenas. Sin
embargo, este nmero es un poco engaoso. De hecho, el grado de distribucin p k que
se muestra en la imagen 2.4b, c, indica que la gran mayora de los nodos tienen slo
unos pocos enlaces. Para ser exactos, en esta red el 69% de los nodos tienen menos de
tres enlaces, es decir, para estos k < <k>. Estos numerosos nodos con pocos enlaces
coexisten con unos pocos nodos muy conectados, o hubs, el ms grande con 92
enlaces. Tales diferencias en los grados de los nudos son una consecuencia de la
propiedad libre de escala de la red, discutida en el CAPTULO 4. Veremos que la forma
de la distribucin de grados determina una amplia gama de propiedades de red, desde
la robustez de la red hasta la propagacin de virus.
El algoritmo de amplitud de bsqueda (BOX 2.5) nos ayuda a determinar el dimetro
de la red, encontrando dmax = 14. Podramos estar tentados a esperar grandes
variaciones en d, ya que algunos nodos estn cerca unos de otros, sin embargo, puede
ser bastante lejos. La distribucin de distancia (Figura 2.18a) indica lo contrario: pd
tiene un pico prominente entre 5 y 6, dicindonos que la mayora de las distancias son
bastante cortas, estando cerca de <d> = 5.61. Adems, pd decae rpido para d grande,
lo que sugiere que las grandes distancias estn ausentes. De hecho, la varianza de las
distancias es d = 1,64, lo que indica que la mayora de las longitudes de trayecto estn
en la vecindad cercana de <d>.
Por ltimo, una inspeccin visual revela un patrn interesante: los hubs tienen una
tendencia a conectarse a nodos pequeos, dando a la red un carcter hub y spoke
(Imagen 2.4a). Esta es una consecuencia de las correlaciones de grado, discutidas en el
CAPTULO 7. Estas correlaciones influyen en una serie de procesos basados en la red,
desde el fenmeno de propagacin hasta el nmero de nodos de control necesarios
para controlar una red.

Imagen 2.18 Caractersticas de una red real

La red de interaccin protena-protena (PPI) de la levadura es estudiada con frecuencia por los
bilogos y los cientficos de la red. El diagrama de cableado detallado de la red se muestra en
la Imagen 2.4a. La figura indica que la red, que consta de N = 2.018 nodos y L = 2.930 enlaces,
tiene un gran componente que conecta el 81% de las protenas. Tambin tenemos varios
componentes ms pequeos y numerosas protenas aisladas que no interaccionan con ningn
otro nodo.

- La distribucin de distancia, pd, para la red PPI, proporcionando la probabilidad de que


dos nodos elegidos aleatoriamente tengan una distancia d entre ellos (trayecto ms
corto). La lnea vertical gris muestra la longitud media de la trayectoria, que es <d> =
5.61.
- La dependencia del coeficiente de agrupacin local promedio en el grado del nodo, k.
La funcin C (k) se obtiene promediando sobre el coeficiente de agrupacin local de
todos los nodos con el mismo grado k.

Vous aimerez peut-être aussi