Académique Documents
Professionnel Documents
Culture Documents
Noviembre de 2012
Agradecimientos
Este proyecto de n de carrera ha sido desarrollado desde abril de 2012 hasta noviembre de 2012 en el Grupo de Informtica Grca Avanzada, dentro del Departamento de Informtica e Ingeniera de Sistemas de la Universidad de Zaragoza y el Insituto Instituto de Investigacin en Ingeniera de Aragn, y en colaboracin con la Fundacin de los Comunes y el grupo de investigacin 15Mdata. Quiero agradecer el apoyo prestado por toda mi familia. Seguro que tenan tantas ganas como yo de que llegase el momento de entregar este trabajo. A todos los amigos que han estado cerca desde el principio hasta el nal, acompandome en el proceso y apoyndome en todo lo necesario. A los compaeros del laboratorio, por los buenos ratos que hemos pasado mientras trabajbamos y por los conocimientos que hemos compartido. Por ltimo, agradecer a Miguel y Emanuele toda la ayuda prestada, que ha sido imprescindible para llevar a cabo este documento. Adems, me han abierto las puertas a todo un mundo de proyectos muy interesantes que espero que podamos compartir en un futuro.
iii
ndice general
I Memoria
1. Introduccin
1.1. Movimientos sociales y redes de comunicacin . . . . . . . . . . . . . . . . . . . . . 1.1.1. 1.1.2. 1.2. 1.3. 1.4. 1.5. Tecnopoltica: movimientos sociales y TIC . . . . . . . . . . . . . . . . . . . Estrategias de organizacin en movimientos sociales . . . . . . . . . . . . .
xi
1
1 1 2 3 4 4 5
microblogging
. . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Bases tericas
2.1. 2.2. Sistemas complejos: enfoque tradicional-reduccionista vs. enfoque emergente 2.2.1. 2.2.2. 2.2.3. . . . Teora de grafos y redes sociales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Topologa. Deniciones y tipos de redes complejas segn su estructura . . . Anlisis de comunidades y mesoescala. . . . . . . . . . . . . . . . . . . . . . Dinmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7 7 8 14 15
3. Herramientas
3.1. Adquisicin de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. 3.1.2. 3.1.3. 3.2. 3.3. 3.4. 3.5. Recopilando informacin de la red Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
17 17 17 17 18 18 18 19 19
ScraperWiki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Software
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (DFA) . . . . . . . . . . . . . . . . . . . . . . . . .
4. Anlisis
4.1. 4.2. Seleccin de datos 4.2.1. 4.2.2. 4.3. 4.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anlisis de la topologa Redes de mundo pequeo
21
21 23 23 24 26 28
Distribucin de grados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Anlisis dinmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5. Conclusiones
5.1. 5.2. 5.3. Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trabajo futuro
33
33 34 34
II Anexos
A. Datos calculados para el anlisis
A.1. Representatividad de los componentes gigantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2. Coecientes de clustering y distancias promedio . . . . . . . . . . . . . . . . . . . . A.3. Exponentes de las distribuciones de ley de potencias A.4. Cdigo de adquisicin de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
39
39 40 41 42
vi
ndice de guras
1.1. 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. 2.9. Diagrama de Gantt del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 8 8 9 9 10 11 12 12 13 15 15 22 24 25 25 26 27 29 29 29 31 Ilustracin conceptual sobre los distintos enfoques. Direccionalidad Componente gigante de una red Subgrafos fuertemente conexos Distancia entre dos nodos. Coeciente de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
clustering p.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
LyC
p.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
en funcin de
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
long tail
r.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.11. Anlisis de mesoescala en una red articial. 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 4.8. 4.9.
L/Lrandom
frente a
C/Crandom
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribucin del grado de entrada. Red: #es15m. . . . . . . . . . . . . . . . . . . . Distribucin del grado de salida. Red: #es15m. . . . . . . . . . . . . . . . . . . . . Valores absolutos de las pendientes
in
out
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
ndice de tablas
2.1. 4.1. 4.2. Ejemplos de redes reales de mundo pequeo . . . . . . . . . . . . . . . . . . . . . . Listado de hashtags relevantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Datos del estudio dinmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 22 31 39 40 41
A.1. Comparacin de tamaos entre componente gigante y red completa. A.2. Coecientes de clustering y distancias promedio.
. . . . . . . . . . . . . . . . . . .
ix
Parte I
Memoria
xi
Captulo 1
Introduccin
1.1. Movimientos sociales y redes de comunicacin
1.1.1. Tecnopoltica: movimientos sociales y TIC
Histricamente, los movimientos sociales han sido la forma mediante la cual la ciudadana ha mostrado su descontento y ha pretendido defender sus derechos. Por ello, constituyen una herramienta clave para fomentar y consolidar la democracia. Son procesos dinmicos que siempre han estado limitados por las restricciones propias de los procesos de comunicacin. De este modo, la participacin est estrechamente ligada al acceso a la informacin y a las formas de interaccin individual. Dado que vivimos en una poca en la que la tecnologa de la informacin est experimentando un gran desarrollo es lgico que la forma en que se organizan, expanden y materializan los movimientos ciudadanos evolucione con ella. La transformacin de las formas de comunicacin ha permitido crear redes ms horizontales, distribuidas e interactivas, que estn revolucionando el activismo popular. En concreto, el derribo de esas barreras comunicativas ha aumentado notablemente la ecacia en su coordinacin y en la difusin del mensaje. Un individuo puede intervenir activamente en estos procesos, gracias a herramientas que proporcionan acceso a informacin de forma rpida y selectiva y una elevada conectividad. Denominamos tecnopoltica a la articulacin entre el uso estratgico de las tecnologas de comunicacin y la organizacin colectiva [1]. A lo largo de las ltimas dcadas se han dado mltiples casos de auto-organizacin traducidos posteriormente en acciones visibles y de gran repercusin, mediados por avances tecnolgicos. Entre los ejemplos ms destacados se encuentran: Protestas anti-globalizacin en Seattle, noviembre de 1999: Internet y los medios digitales facilitaron la coordinacin y cobertura de las protestas. La conexin en red de ONGs locales, ciudadanos y activistas
grass-roots 1
nuevos canales de informacin, discusin y, en ltima instancia, de accin [2]. Reaccin a la supuesta manipulacin meditica del gobierno de Espaa (13 de marzo de 2004): tras los atentados del 11 de marzo de 2004, se organiz, va mensaje de texto, una protesta frente a la sede del partido gobernante. Se corrobor que las concentraciones fueron promovidas por actores sociales no vinculados a ningn partido poltico. Su repercusin se manifest en importantes incrementos en las comunicaciones por telefona mvil: durante la tarde del da 13 se registraron aumentos en torno al 30 % en el trco de mensajes de texto, respecto a un sbado cualquiera [3]. Paralelamente, la convocatoria saltaba a Internet, donde los portales activistas ms frecuentados aumentaban notablemente sus visitas, con amplia participacin de colectivos extranjeros.
1 Asociaciones
Wikileaks y el caso 'Cablegate': esta organizacin sin nimo de lucro publica informes y documentos con contenido de inters pblico, manteniendo el anonimato de las fuentes. El 28 de noviembre de 2010 fueron mostradas en su web unas 250.000 comunicaciones entre el Departamento de Estado de Estados Unidos y sus embajadas, adems de ser enviadas a cinco peridicos internacionales. Sufri una persecucin por parte de gobiernos y entidades privadas a la que los usuarios de la red respondieron con acciones de apoyo y protesta. Primavera rabe: se produjeron una serie de alzamientos ciudadanos en pases del norte de frica y Oriente Prximo reclamando libertades y democracia. Internet, desde el comienzo del uso de blogs en Egipto en torno al 2004, fue facilitando los enlaces en red, multiplicados despus por las redes sociales. A nales de 2010, la revolucin en Tnez supuso el punto de partida de acciones multitudinarias que se contagiaron a pases vecinos. Anonymous: es un seudnimo adoptado por individuos y grupos para realizar acciones de protesta a favor de la libertad de expresin y la independencia de Internet, entre otros temas. Surge de foros de discusin y carece de estructura conocida. Su organizacin es difusa y se vale de los canales sitios
web
online
Sinde,
Ley
polticos que apoyaron dicha ley. Tuvo gran repercusin en las redes sociales y sirvi, en cierto modo, de precedente a las muestras de descontento que comenzaron a aparecer los meses sucesivos. Democracia Real Ya y 15M: un movimiento auto-organizado se fue formando por miles de personas annimas en las redes sociales, bajo el nombre de Democracia Real Ya, con clara inspiracin en las revueltas rabes y la
revolucin islandesa.
Se posicion en favor de
una democracia ms participativa, alejada del bipartidismo y del dominio de instituciones nancieras y corporaciones, pero sin presentar anidad poltica ni sindical. El crecimiento en simpatizantes del movimiento pas, en gran medida, desapercibido mediticamente, al tiempo que la campaa se difunda de forma viral. El principal mrito fue construir un estado de nimo colectivo [1] que se concret, el 15 de mayo de 2011, en una serie de protestas paccas en 70 ciudades y localidades, bajo el nombre de movimiento 15M. En este trabajo nos centramos en el movimiento 15M. Su carcter novedoso, su cercana y la relevancia de las TIC en sus interacciones lo convierten en una buena oportunidad de estudio. Adems establece un sentimiento de descontento general que fomenta la aparicin de otras muchas movilizaciones de forma simultnea, como acciones en defensa de la educacin y sanidad pblicas o en contra de los desahucios.
informacin se expande de forma viral y, en ltima instancia, el resultado es una accin especca con gran poder de expansin y agregacin. Este tipo de fenmenos ha sido denominado enjambre o manada, y presenta un carcter impulsivo y una breve duracin como colectivo [6]. Provienen de reacciones a eventos inesperados, como ataques por parte de las fuerzas de seguridad o el desalojo de una acampada. De forma opuesta, existen acciones programadas cuyo ritmo de actividad es sensiblemente menor. El propio proceso y su objetivo conforman un marco rgido en el que el individuo no puede inuir signicativamente. Sirva como ejemplo la convocatoria de una huelga general o una gran manifestacin. El periodo de tiempo desde las primeras movilizaciones ha constituido un proceso de aprendizaje para sus participantes, que continuamente experimentan y ponen en prctica nuevas estrategias comunicativas. En uno de los ejemplos ms destacados, varios de los colectivos ms activos del 15M ponen en marcha la campaa 15MPaRato, que consigue una gran cantidad de apoyo ciudadano (de participacin y econmico) para presentar una demanda contra el ex-ministro de economa y expresidente de Bankia, Rodrigo Rato, como una de las personas responsables de la crisis econmica. Se basaba en la intervencin estratgica y calculada de algunos nodos muy bien posicionados en las redes sociales, de modo que actuasen como catalizadores capaces de regular el proceso comunicativo. Los activistas haban identicado un problema en el tipo de organizacin de las movilizaciones y decidieron modular la emergencia del proceso.
microblogging
Se puede denir un
Desde su creacin en 2006, Twitter irrumpi como red social en Internet con la novedad de
microblogging.
microblog
como una
herramienta para enviar mensajes cortos a una red de asociados [7]. En este caso, los mensajes
tweets )
tienen un lmite de 140 caracteres y, una vez publicados por un usuario, son
recibidos por sus seguidores. Esas relaciones de seguimiento no son automticamente recprocas, sino que son direccionales . Los usuarios han desarrollado formas alternativas de comunicarse mediante la inclusin de caracteres especiales dentro de sus mensajes. Por ejemplo, el carcter '@' especica un receptor concreto. Escrito antes del identicador del usuario (@identicador) indica que el mensaje pretende ser relevante para ese individuo. Se usa tanto para responder al para hacer mencin especial a alguien ( tres tipos [8]:
tweet de otro usuario (reply ) como mention ). Adems, existe la prctica de reenviar un mensaje escrito por un usuario, conocida como retweet (RT). Por tanto, los mensajes pueden clasicarse en Singleton : Reply
o mensaje no dirigido y original de un usuario. contiene una '@' seguida de un identicador de usuario dentro.
Mention :
Retweet :
aparecen las siglas RT seguidas de '@' y el identicador de usuario del cual proviene
el mensaje reenviado. La evolucin de la actividad en Twitter tambin ha provocado la aparacin de etiquetas, llamadas
hashtags , que tienen la funcin de reunir mensajes relativos a un tema con la intencin de facilitar la bsqueda y discusin sobre el mismo. La forma de etiquetar un tweet es mediante el carcter
'#' seguido de una palabra o palabras sin espacios (por ejemplo, #elecciones20n). Cuando una etiqueta entra dentro de las ms empleadas por los usuarios se convierte en lo que en Twitter se conoce como
trending topic.
Los hay a distintos niveles, tanto global, nacional o local, pero slo implica haber logrado una enorme difusin y es considerado
los primeros se mantienen en una lista permamente dentro de las pginas de inicio de todos los perles. Llegar a ser
trending topic
2 Al
contrario que en otras redes sociales, como Facebook, en las que se establece un acuerdo bilateral de relacin.
El
microblogging
mantiene una estrecha relacin con los movimientos sociales, pues proporciona
un medio de comunicacin muy rpido (instantneo desde terminales mviles) y un extraordinario potencial de propagacin. Junto con la deteccin de etiquetas permite seleccionar mensajes relativos a un tema concreto y recopilarlos para construir posteriormente distintos tipos de redes: de intercambio de mensajes, de relacin entre
hashtags...
Para este estudio, se considera que el conjunto de mensajes que engloba un a un proceso comunicativo con identidad propia.
hashtag
corresponde
1.5. Planicacin
La primera fase ha consistido en tareas de documentacin sobre teora de redes y herramientas para su anlisis, identicando qu resultaba interesante estudiar y cmo trabajar con la informacin. Seguidamente, se ha procedido a recopilar datos provenientes de las redes sociales sobre las movilizaciones de mayo de 2012, que luego se han tratado y dispuesto de forma adecuada para su anlisis. Por medio de la teora de grafos y bajo un enfoque, alejado del tradicional, basado en los sistemas complejos y sus propiedades emergentes (ver seccin 2.1), se han utilizado mtodos algortmicos y estadsticos para caracterizar las redes resultantes. El diagrama de Gantt correspondiente a la realizacion del proyecto se muestra en la gura 1.1.
Captulo 2
Bases tericas
2.1. Sistemas complejos: enfoque tradicional-reduccionista vs. enfoque emergente
El estudio de sistemas complejos ha sido reconocido recientemente como una nueva disciplina cientca. Proviene de los avances acontecidos en diversos campos, tales como la fsica y la antropologa. La idea de que toda materia est formada por los mismos bloques (tomos y sus partculas), es uno de los conceptos originales de la ciencia, y su carcter universal complementa las leyes mecnicas. Sin embargo, son tambin universales los procesos dinmicos que, de alguna manera, hacen evolucionar a estos sistemas. Esto escapa del enfoque cientco tradicional, que Bajo trata de entenderlos a travs de la diseccin de sus partes como entidades aislables [10].
esta visin reduccionista, las disciplinas tienden a diverger mientras el conocimiento aumenta a razn del avance especco en cada una de ellas, lo que lleva a su aislamiento progresivo [11]. No obstante, muchas de ellas comparten caractersticas y se pueden abordar a travs del estudio de los sistemas complejos. De este modo, la aproximacin cientca a los sistemas particulares se puede hacer dentro de un marco global (gura 2.1). No se puede modelar un sistema de forma eciente sin una correcta comprensin de la relacin del todo con las partes, as como de las propiedades emergentes de la interaccin [12]. Es aqu donde radica la dicultad de su estudio. Por lo tanto, el reto consiste en extraer la informacin que proporcionan las aristas de unin, tanto desde el punto de vista esttico (sus propiedades estructurales, o topologa) como dinmico (su evolucin en el tiempo), para comprender de qu manera se organizan.
Dirigida: la relacin social no es bidireccional sino que apunta de un vrtice a otro, como la red de seguidores en Twitter o el envo de correos electrnicos (ver gura 2.2). No dirigida: existe reciprocidad en el enlace, como los contactos en Facebook o una relacin de coautoridad en artculos.
Figura 2.1: Ilustracin conceptual: (a) Enfoque tradicional-reduccionista (b) Enfoque emergente. Fuente: [11].
Figura 2.2: Direccionalidad: (a) red dirigida, (b) red no dirigida. Fuente: [13].
Carcter explcito-implcito
Explcito: los propios individuos declaran la relacin. Se da, por ejemplo, entre contactos de correo electrnico o de Facebook. Implcito: la relacin se deduce del comportamiento. Comprar en e-Bay o interaccionar en foros produce relaciones implcitas.
Capacitada: las aristas llevan asociado un valor que expresa su fortaleza o peso. En la comunicacin entre dos personas por correo electrnico, una posible medida del peso correspondera al nmero de mensajes intercambiados.
No capacitada: los enlaces slo representan unin, no poseen ningn valor relacionado (red de seguidores de Twitter).
Componente gigante
En ocasiones las redes estn formadas por ms de un componente conexo. Si hay un subgrafo conexo que aglutine la gran mayora de nodos, es interesante comparar las propiedades de la red global y de este componente, llamado componente gigante (ver Figura 2.3). Las caractersticas globales de la red pueden ser muy similares a las que presenta este subgrafo. Para redes dirigidas, se distinguen dos tipos de componentes conexos:
Componente fuertemente conexo: si para cada par de vrtices subgrafo existe un camino de
pertenecientes a un
hacia
Componente dbilmente conexo: al sustituir las aristas dirigidas por no dirigidas el subgrafo se mantiene unido, sin restricciones direccionales.
Distancia promedio
La distancia mide el nmero de aristas que separan un vrtice de otro por el camino ms corto posible (ver gura 2.5). Siendo
de
vrtices, y
d(i, j)
la distancia
entre dos de ellos, la distancia promedio (o longitud de camino media) de la red es:
L=
1 n(n 1)
d(i, j)
i,j
Expresa el promedio de intermediarios por contacto directo existentes entre todos los pares de nodos del sistema. Si el grafo es dirigido, la distancia promedio tiene dos variantes: Distancia promedio dirigida: para trazar un camino es necesario recorrer las aristas en el sentido que indican. Es, por lo tanto, ms restrictiva. Distancia promedio no dirigida: se calcula igual que en una red no dirigida, convirtiendo todos los enlaces en no direccionales.
Grado de un nodo
Es un parmetro local de cada nodo, que indica el nmero de enlaces adyacentes a l. el grado del nodo
ki
denota
i.
Cuando se trata de redes dirigidas, el grado est compuesto por la suma del
+ ki = ki + ki
Mi
clustering
como el nmero de aristas existentes entre vecinos inmediatos del vrtice ser
i,
su coeciente de
ci =
Mi ki (ki 1)
0 ci 1
Para dar un valor general del agrupamiento local de la red se calcula el promedio
10
clustering.
Fuente: wikipedia.org.
C=
1 ci n i=1
0C1
1 [15] que, manteniendo el grafo conexo, alcanzan idntico nmero de aristas total.
n, y con grado medio k = k , las primeras se distribuyen de manera k . Los grafos aleatorios se construyen segn el modelo p de que una arista conecte aleatoriamente
Partiendo del grafo regular, se asigna una probabilidad con una aleatoriedad creciente con
con otro individuo sin duplicar una ya existente [16]. Por consiguiente, se van obteniendo redes
(gura 2.7).
p0 L
Cuando se acerca al otro extremo
n 3 ,C 2k 4
p 1 L Lrandom
Por tanto, intuitivamente, cuando con
p0 L
se asocian valores altos de L (que crece linealmente 3 ) de C . Si p 1 las dos variables parecen alcanzar 4 slo crece logartmicamente con n, y C cae abruptamente.
1 El modelo Erds-Renyi es uno de los ms aplicados para crear grafos aleatorios. Este documento se referir a este modelo cuando se mencione un grafo aleatorio o sus propiedades.
11
p.
Fuente: [16].
Figura 2.8:
LyC
en funcin de
p. Fuente: [16].
p
(normalizados por sus cor-
Sin embargo, la representacin de la variacin de los coecientes con respondientes valores en grafo regular, valores bajos y
L(0)
C(0))
presenta
mantiene valores elevados (ver gura 2.8). Estas redes intermedias se denom-
inan redes de mundo pequeo y presentarn un agrupamiento alto a nivel local, propio de una red regular, y una distancia promedio baja a nivel global, caracterstica de un sistema aleatorio. Comparado con sus valores anlogos en el caso aleatorio, y
L C
Lrandom Crandom
Distribucin de grados
Al construir grafos aleatoriamente es interesante ver cmo evoluciona su conectividad al ir aadiendo aristas, es decir, al ir aumentando el grado medio grca del nmero de elementos
k.
N (k)
que poseen
12
Lreal
3.65 18.7 2.65
Lrandom
2.99 12.4 2.25
Creal
0.79 0.08 0.28
Crandom
0.00027 0.005 0.05
C. elegans
Tabla 2.1: . Corresponden a los siguientes casos: (a) Componente gigante de la red de colaboracin de actores de cine de una popular base de datos en Internet. (b) Generadores, transformadores y subestaciones unidas por lneas de alta tensin en EEUU. (c) Representacin de la red neuronal del gusano
Caenorhabditis elegans.
long tail
k , P (k),
P (k) = ez
zk k!
hubs, con una conectividad muy alta. La distribucin de grado long tail (ver gura 2.9).
P (k) ck
donde
hubs.
Numerosos
estudios sobre redes reales han demostrado comportamientos de este tipo [18][19][20]. Las redes sociales en Internet tambin suelen presentar una distribucin de larga cola [21].
13
a priori
desconocidas que
se agrupan por algn tipo de anidad: geogrca, poltica... Para determinar la calidad de una
Q.
Q=
i
donde
eii a2 i i
con el
eij
j,
ai =
j
eij .
Para redes
capacitadas [23]
Q=
donde
1 2w
wij
ij
wi wj (Ci , Cj ) 2w wij
j
suma de pesos de las aristas del vrtice
wij representa
el peso de la arista
mij , wi = wij y
i,j
i, Ci
representa la comunidad
i, w =
1 2
la funcin
(u, v)
0 si u = v 1 si u = v
Hay diversos mtodos de deteccin de comunidades: Algoritmos decrementales, que detectan y eliminan enlaces intercomunitarios [24][25]. Algoritmos aglomerativos, que fusionan progresivamente nodos y comunidades similares [26]. Mtodos de optimizacin que maximizan la modularidad [27]. Todos se valen de la modularidad para evaluar sus resultados. Un valor de
Q mayor de 0,3-0,4 es un
claro indicador de que los subgrafos obtenidos corresponden a comunidades. Se obtienen divisiones ms precisas y rpidas mediante la maximizacin de la modularidad, por ello se ha utilizado un algoritmo de este grupo, descrito en la seccin 3.4. En ocasiones, existen comunidades dentro de otras ms grandes que son imposibles de detectar en la red original. En particular, si una comunidad
wss
cumple
wss <
permanecer indetectada [28]. expresin queda
w 1 2 r
de aumento de peso a cada nodo, la
Si se introduce un factor
wss <
Al aumentar
disminuye el lmite de
ms despacio que
r,
por lo que
disminuir el tamao de las comunidades identicables. Es interesante incluir aqu el concepto de mesoescala, relacionado con el tamao de los mdulos detectados. resistencia o Abarca un espectro que va desde la microescala (cada nodo representa su propia comunidad) a la macroescala (toda la red formando un elemento nico). El parmetro
r,
llamado
[29]:
Wr = W + rij
Cabe mencionar que esta variacin topolgica no altera ninguna otra propiedad global de la red. Representando el valor de
14
r.
Figura 2.11: Anlisis de mesoescala en una red articial: en la grca se observan las dos particiones estables, (I) y (II), y el punto donde
r = 0,
2.2.3. Dinmica
La dinmica de los sistemas reales, incluidos los movimientos sociales, no responde a un modelo reduccionista. El estudio de las partes de un sistema por separado lleva a una interpretacin errnea por obviar otras propiedades emergentes del mismo que no se aprecian de forma directa, sino que surgen como resultado de la interaccin entre los componentes. Por ello, imprimen notables diferencias al sistema en comparacin con la suma de dinmicas individuales. Se han desarrollado herramientas capaces de analizar la constitucin dinmica de un sistema. Una de ellas es la caracterizacin de los procesos dentro de un sistema en trminos de las correlaciones temporales entre las diferentes escalas que lo componen, en forma de procesos de tipo El ruido
1/f .
1/f
X(f )es
la transformada de Fourier de
x(t).
1/f
Sxx (f )
La existencia de ruido
1 f
1/f
de un sistema, permitindole comportarse como una unidad dinmica coherente, algo que es caracterstico de procesos complejos y auto-organizados [30]. Aplicado a un proceso de movilizacin, podemos pensar en las escalas ms rpidas (conversaciones entre individuos, retransmisin inmediata (
retweet )
Habra otras muchas escalas intermedias, como los ritmos de actividad de usuarios condicionados por sus horarios, ritmos guiados por noticias en los medios de comunicacin, o dinmicas propias
15
trending topic
lizacin se constituya como una unidad con identidad coherente debe haber un equilibrio en el peso de cada escala. Si dominan las rpidas, el sistema se comportar de manera impulsiva e irreexiva. Si, por el contrario, dominan las lentas, las identidades creadas suelen ser muy rgidas e incapaces de adaptarse al entorno inmediato, por lo que dicultan la comunicacin efectiva. La caracterizacin
1/f
para evaluar el peso de cada una de ellas (rpidas, lentas e intermedias). El parmetro clasicar los procesos y relacionarlos con los movimientos sociales: Ruido blanco (
permite
= 0):
sin correlacin en el tiempo. Dominados por escalas temporales cortas (a alta frecuencia), funcionan espontnea y creativamente pero son incapaces de mantener una identidad estable. Un ejemplo sera la respuesta a un desalojo o una concentracin espontnea. Ruido marrn (
= 2):
aunque mantienen una identidad coherente, su rigidez les impide adaptarse al entorno. La preparacin de una huelga o la gestacin de una gran manifestacin podran ser dos ejemplos, pues estn estructurados de antemano. Ruido rosa (
= 1):
tienen una inuencia similar. Se alcanza un equilibrio entre los estados desordenados con gran contenido de informacin (ruido blanco) y estados con memoria pero bajo contenido de informacin (ruido marrn). Esta dinmica, dominada por la interaccin de sus componentes, le conere al proceso estabilidad en su identidad y versatilidad a la hora de responder al entorno.
16
Captulo 3
Herramientas
3.1. Adquisicin de datos
3.1.1. Recopilando informacin de la red
Existen varios mtodos para extraer datos de la red.
Web scraping :
desestructurada de las pginas, normalmente en lenguaje HTML, a un formato estructurado que facilite su posterior almacenamiento y anlisis.
Web crawling : explora y copia la red de forma automtica. Parte de un conjunto inicial de sitios web, llamados semillas, y busca URLs dentro de stas, siguiendo los criterios del usuario.
Todo lo explorado se descarga y un motor de bsqueda lo indexa para poder analizarlo despus. Bases de datos y
Open Data :
3.1.2. Twitter
Twitter proporciona dos APIs para la extraccin de informacin. Por un lado, Search API permite buscar, aplicando los criterios deseados, todos los
tweets
y cuantitativas. Respecto al marco temporal, devuelve resultados de la bsqueda con un mximo de una semana de antigedad. Respecto a la cantidad, el mximo de resultados por bsqueda est limitado a 1500. Asimismo, se puede alcanzar un nmero mximo de llamadas al servidor, establecido en 150 llamadas/hora por cada usuario o IP. En ese caso, una hora despus de la ltima llamada, el contador vuelve a cero y la bsqueda puede proseguir. En segundo lugar, a travs del Streaming API se habilita la recogida de
tweets
en tiempo
real. Proporciona ms informacin relativa al emisor que el mtodo anterior. No tiene limitaciones de cantidad, llamadas al servidor o tiempo de uso. No obstante, tiene desventajas importantes. Diculta el seguimiento de informacin puesto que en la mayora de los casos no se puede predecir que tipos de datos van a ser relevantes. Se necesita un tiempo para evaluar la importancia de un determinado usuario o
hashtag.
3.1.3. ScraperWiki
Es una herramienta
web
web scraping
almacenar datos en archivos descargables . Para el caso que ocupa este documento, la combinacin
17
de este servicio con el Search API de Twitter proporciona la mejor opcin. Esto se debe a que haba que comprobar la importancia de las etiquetas usadas y ver si tenan buena acogida y mediante Streaming API no se permite acceder a datos pasados. Realiza un barrido cada hora en el buscador de Twitter recogiendo los mensajes que contengan los datos objetivo (en este caso, los informacin se descarga en archivos .csv .
hashtags
tweets,
y visualizacin, hemos utilizado el lenguaje de programacin AWK. Es un lenguaje sencillo y su forma de trabajar con listas indexadas por palabras clave, aunque limitada, es suciente para nuestro objetivo. Dado que la informacin por tweet se clasica en archivos .csv y cada categora corresponde a una columna, permite de forma sencilla seleccionar los datos de inters y descartar el resto. El programa realizado se ocupa, para cada listado de descartan los mensajes que no tienen receptor (los tipo
tweets,
contenga una '@' en el campo 'Texto', seguida del identicador del usuario. De este modo se
Singleton,
informacin a las redes objetivo del estudio. Inspecciona el contenido del mensaje y para cada estructura @+IDusuario crea una lnea en un nuevo archivo con emisor, receptor y fecha y hora del envo. Es decir, aade un par de nodos unidos por una arista dirigida. Si hay varios mensajes con idnticos participantes el peso de la arista se va incrementando.
Radatools
Es un conjunto de programas de distribucin libre para analizar redes complejas [33]. Se ha usado principalmente para la deteccin de comunidades y el anlisis de la mesoescala, y se han calculado propiedades que por razones diversas Gephi no poda obtener correctamente.
Matlab
Es un popular software matemtico que cuenta con su propio lenguaje de programacin (lenguaje M). Se ha utilizado para representar los datos y para realizar operaciones matemticas, como la aproximacin por polinomios de una funcin (seccin 4.2.2).
1 Comma-Separated Values: archivo que guarda en las cada unidad de datos, y distribuye, separados por coma, los distintos campos, como el nombre de usuario emisor, receptor, fecha...
18
Q=
i
(eii a2 ) i
i con el j eii ,
, y
ai =
j
eij es la fraccin de aristas total que unen eij . Q representa, por la fraccin de vrtices que se encuentran dentro Q > 0, 3.
de subgrupos,
a2 i
El proceso comienza por aislar todos los individuos, manteniendo los vrtices en segundo plano. Se van uniendo todas las posibles parejas de nodos para acabar validando aquella variacin que proporcione un mayor
Q.
Q.
nodos han pasado a formar parte de un mismo grupo. Cada paso ir formando una nueva particin
asociado.
El algoritmo funciona de forma equivalente en redes capacitadas, sustituyendo los valores de aristas por los pesos [23].
3.5.
zar series temporales y localizar correlaciones entre distintas escalas de tiempo. Dada una serie
puntos,
{zt , t = 1, ..., N }
Z(t) =
donde
(zu z)
u=1
1 z= zt N t=1
es la media global. Seguidamente, a lo largo de la serie cajas que contienen todas ellas sin tendencia (
elimina la tendencia mostrada por los puntos que la forman mediante la funcin de la uctuacin
siendo
k Zf it (t)
se calcula la
1 F ( ) = ( Nb
escala, entonces
Nb
k=1
F ( )
19
de la seal. El anlisis dinmico (seccin 4.4) se realiza con la densidad espectral, y la funcin,
1 f
es
= 2 1
donde
20
Captulo 4
Anlisis
4.1. Seleccin de datos
Durante el mes de mayo de 2012 se produjeron una serie de movilizaciones relacionadas con el movimiento 15M: el aniversario, jado el 12 y 15 de mayo, la huelga de educacin, campaas contra La Caixa... Se han escogido los
hashtags
las concentraciones del 12 de mayo de 2012 la etiqueta central fue #12m15m y para la huelga de eduacin, #22m, entre otras (ver gura 4.1). Cada uno de estos
hashtags
se ha tomado como
representativo de un proceso comunicativo, que a su vez ha formado parte de otro proceso ms amplio de comunicacin social (incluyendo actos en la calle, repercusin en los medios, etc.). Los datos se pueden revisar y descargar en [36]. Se clasican los sistemas correspondientes en tres tipos de movimiento: Tipo A: acciones espontneas o desencadenadas por un factor externo y sin perspectivas concretas ms alla del corto plazo. Son procesos que se coordinan rpidamente y que suelen actuar de forma impulsiva. Surgen por diversos motivos, aunque principalmente responden a eventos externos inesperados. Encontramos ejemplos en las reacciones ciudadanas ante el desalojo de una acampada o ante una noticia perjudicial para los intereses de un colectivo. En algn caso, hemos catalogado como tipo A procesos comunicativos que tienen por nico objetivo alcanzar una visibilidad en la red notable en unas pocas horas, puesto que comparten caractersticas similares en cuanto a organizacin (rpida y en ocasiones catica) y duracin en el tiempo. Tipo B: convocatorias establecidas con antelacin y de forma estructurada. Estos procesos suelen ser rgidos, en el sentido en que hay escasas posibilidades de cambio en sus procedimientos u objetivos. Pueden congregar a un elevado nmero de participantes, pero su actividad suele ser de baja frecuencia y normalmente est condicionada por la planicacin propia del movimiento. Se incluye en esta categora la preparacin de una huelga general o la convocatoria de una protesta masiva. Tipo A-B: acciones mixtas, bien por su mezcla de planicacin e improvisacin, bien por tener objetivos tanto a corto como a largo plazo. En ocasiones, se ja una fecha para un evento en concreto que ms adelante se complementa con acciones no planicadas. En base a esta clasicacin, diramos que posee elementos de los tipos A y B. Vase como muestra la convocatoria del 12M15M, que derivaba en actos de carcter espontneo. Asimismo, otros procesos combinan maniobras inmediatas con metas a largo plazo. Es evidente que hay una planicacin detrs, pero se realiza de una forma menos visible que los de tipo B. La estrategia de los catalizadores, descrita en la seccin 1.1.2, responde a estas caractersticas. El listado completo de hashtags se recoge en la tabla 4.1.
21
Hashtag
#15mSectorRadical #16m #alabolsa #asambleafcom #bankiaesnuestra #cierrabankia #desalojoSol #larimaia #nurembergnanciero #planderescateciudadano #prima500 #12mglobal #22m #alaplaza12m #es15m #feliz15m #huelgadeclase #yovoy12m #12m15m #15mpaRato #lacaixaesmordor #occupymordor
Descripcin Sectores ms ideologizados adoptan esta etiqueta Acciones del 16 de mayo, surgidas sin planicacin previa Protestas espontneas en la Bolsa de Madrid el 16 de mayo Asamblea en Facultad de Comunicacin (Sevilla) sobre recortes Respuesta al rescate de Bankia Llamada al cierre de cuentas en Bankia Desalojo de la Plaza de Sol la madrugada del 13 de mayo Desalojo del centro social La Rimaia, en Barcelona Se pide juzgar a los culpables de la crisis nanciera Campaa-respuesta a los rescates bancarios Reaccin tras sobrepasar la prima de riesgo los 500 puntos Carcter internacional de las convocatorias del 12 de mayo Huelga de educacin convocada por distintos sindicatos Llamamiento a tomar las plazas Aniversario del movimiento, ligado a ms protestas Otra etiqueta del aniversario del movimiento Identica la huelga de educacin del 22 de mayo Otro indicador ms de las movilizaciones del 12 de mayo Etiqueta central de las convocatorias del 12 de mayo Nombre de la campaa para juzgar a Rodrigo Rato Campaa en Barcelona contra La Caixa
22
clustering
indica
que no son redes caticas, sino que sus vrtices tienden a agruparse a nivel local y proporcionan
presencia de clusters .
Para cada
hashtag,
se calculan el coeciente de
prueba si se aproximan a la topologa de mundo pequeo. Las distancias calculadas sern siempre dirigidas (ver seccin 2.2.1). Por consiguiente, se necesitan las redes aleatorias equivalentes (con mismo
N)
pc
pc =
Generando grafos aleatorios con los criterios en el Anexo A.2. Consideramos las variables
2m n(n 1) pc y N se obtienen los datos necesarios, recogidos L/Lrandom y C/Crandom porque, al dividir por su
equivalente aleatorio, se estandariza de alguna forma un anlisis que involucra redes de distintos
N,
Las condiciones a
Crandom
Lrandom
C/Crandom
frente
L/Lrandom .
L/Lrandom
C/Crandom
relati-
vamente bajos. La velocidad de difusin es ptima, pero el escaso agrupamiento local resta consistencia a las redes. Nos lleva a pensar que la rpida coordinacin y ejecucin restringen el valor de las relaciones
C/Crandom .
llen la conanza necesaria para formar cliques o grupos anes. Existen dos excepciones, #desalojosol y #planderescateciudadano. En el caso de #desalojosol, dos factores pudieron propiciar un nmero mayor de agrupaciones locales: la repercusin en los medios, que hizo que la actividad se mantuviera activa durante el da siguiente, y el hecho de que se compartiese el espacio fsico. En cuanto a #planderescateciudadano, la idea surgi de una campaa llevada a cabo por varios colectivos formados con anterioridad, luego es de suponer que se llegase a un grado alto de
clustering
C/Crandom
distancias promedio relativas son altas. Su mayor presencia en el tiempo favorece una construccin ms estructurada, pero la informacin, en general, se transporta menos ecazmente. Los dos procesos ms representativos del tipo B, #huelgadeclase y #22m, identicadores de
1 Por ejemplo, hay usuarios que envan spam y que incluyen trending topics para darles visibilidad. Estos nodos no estarn conectados al componente gigante.
23
1200
1000
random
800
C/C
600
400
200
0 0.5
1.5
2.5
random
3.5
L/L
Figura 4.2:
L/Lrandom
frente a
C/Crandom
la huelga de educacin, y un tercero, #es15m, registran valores entre 2.5 y 3.5 veces mayores que los aleatorios. Aunque no llegan a ser de orden superior, la propagacin por estos canales ser ms costosa que en las otras clases. Tipo A-B (rosa): llama la atencin los valores de distancia promedio, similares a las aleatorias a pesar de ser redes de tamaos grandes (incluida la mayor de todas, #12m15m, con
N = 32749
punto de vista global, denota una diferencia importante en cuanto a la participacin de los individuos. Adems, los valores de
Crandom .
mejor representa el concepto de mundo pequeo, permitiendo una propagacin rpida y una estructura slida, que pueden favorecer su permanencia en el tiempo como colectivo. Se concluye que todos los sistemas poseen topologa de mundo pequeo, pero los de tipo A-B poseen las mejores caractersticas en cuanto a velocidad de propagacin y robustez en su conguracin. Los nodos, a travs de la interaccin, crean canales de forma ms variada, reduciendo la longitud de los caminos cortos. Los procesos A no consiguen, en promedio, construir redes interactivas tan slidas como los otros. Por otra parte, los procesos B requieren ms intermediarios para difundir mensajes que lleguen a la totalidad de individuos, que ven su participacin ms restringida que en los dems sistemas.
P (k) ck ,
indica la tendencia de un vrtice nuevo a conectarse en primer lugar a individuos bien comunicados. la estructura de mundo pequeo que encontramos en la mayora de ejemplos en el mundo real.
conexin preferencial hace disminuir la distancia promedio, y son una forma de alcanzar
A y entrante en B signica que A ha publicado un mensaje B, o bien est reenviando algo que B haba escrito con la transmisin de informacin. Un tweet de A puede ser
En primer lugar, hay que aclarar lo que signica una arista entrante y saliente en nuestras redes. Una arista saliente de un nodo previamente. No hay que confundir en Twitter, que, o bien menciona (o responde) a
ledo por todos sus seguidores directamente, y, de forma indirecta, por cualquiera que lo encuentre mediante una bsqueda, pero esto no implica la creacin de enlaces.
24
10
10 in = 1.7076
out = 2.4739 10
3
10
n (log)
10
n (log)
1 2 3
10
10
10
10 0 10
10
10 k (log)
10
10 0 10
10
10 k (log)
10
Un valor alto del grado conlleva un signicado para el vrtice: Grado elevado de salida: signica que ha interaccionado de las formas mencionadas con un alto nmero de usuarios, lo que le convierte en una fuente, que emite mensajes en muchas direcciones. Grado elevado de entrada: ha sido muy mencionado o muchos han retransmitido sus mensajes, actuara como referencia en el proceso. Ambos grados con valores elevados: la suma de los roles anteriores convertira a ese nodo en una autoridad dentro del proceso de comunicacin asociado a ese
hashtag.
Se carga la distribucin de grados entrantes y salientes en Matlab. Se representan en escala logartmica y se aplica un ajuste polinmico de primer grado. Las rectas se ajustan aproximadamente a los puntos y el valor de
3),
que son redes libres de escala. Un ejemplo se recoge en las guras 4.3 y 4.4. En la totalidad de casos
hubs,
tambin hay menos posiciones intermedias. Dado que las aristas que salen son las nicas que conllevan intencionalidad, es lgico que reproduzcan mejor ese comportamiento. Mediante la representacin de la gura 4.5 se analizan las diferencias entre tipos de movimientos: Tipo A (azul):
|in |
de tipo B pero menos destacados. Su naturaleza diculta la aparacin de vrtices jerrquicamente importantes y estables, por eso los
hubs
= 1,3418).
El comportamiento de
salida es similar al tipo B. Los valores ms bajos corresponden a tres procesos que comparten dos caractersticas. Una de ellas es el carcter local, tanto geogrcamente (#laRimaia, #asambleaFCom) como ideolgicamente (#15mSectorRadical). La otra, un tamao reducido (tres de las cuatro ms pequeas). Parece lgico que en situaciones as haya una mayor distribucin de nodos fuente. Tipo B (negro): la diferencia se observa en
|in |
Presentan una cantidad menor de vrtices referencia. Dicho de otro modo, en comparacin
25
3.2
2.8
out
2.4 2.2
2.6
1.8 1.3
1.4
1.5
1.6
1.7
1.8
1.9
|in|
Figura 4.5: Valores absolutos de las pendientes
in
out
con procesos A, la recepcin de enlaces est ms polarizada. Incluso se podra hablar de una jerarqua ms acusada. Su naturaleza rgida y estructurada obstaculiza la aparicin de otras referencias aparte de las que el propio proceso pueda favorecer. El valor promedio de
|out | es
variada.
el mximo entre las tres clases, luego los nodos fuente interactan de forma menos
Tipo A-B (rosa): es signicativo que tres redes de tamaos tan superiores (1, 3 y 7 por orden de nmero de nodos) presenten valores bajos de
|out |.
fuente intermedios indica que los sistemas acogen mejor la participacin y sta se lleva a cabo de forma ms distribuida. No se pueden extraer muchas conclusiones de las posiciones de
|in |
por falta de ms ejemplos, pero se intuye que la tendencia del grado entrante se
hubs
de entrada, o lo que
es lo mismo, una menor propensin a la exclusividad de los nodos referencia. La distribucin de ley de potencias se observa siempre, ms marcada en el grado saliente por ser intencionado. Los tipos A e intuitivamente A-B, contienen mayor nmero de referencias que el tipo B, de lo que se extrae que la jerarqua est ms repartida en las primeras. La existencia de
hubs
de salida, por contra, es similar para procesos A y B y menor que en la categora A-B, cuyos
Si el
nivel macroscpico domina la interaccin, los componentes por s solos son incapaces de intervenir de manera signicativa en el proceso. Por contra, si domina la microescala, habr multitud de participantes comportndose de forma catica y formarn un sistema irracional. La mesoescala enlazara la actividad a los niveles macro y micro regulando y equilibrando el comportamiento del sistema [35]. La coordinacin de la actividad a nivel de mesoescalas es crucial para la autoorganizacin de sistemas complejos. Un ejemplo destacado de este fenmeno es la actividad en el cerebro, en el que asambleas neuronales a diferentes escalas se asocian para producir actividad
26
signitivativa (ver gura 4.6). Este estudio es una aproximacin preliminar al anlisis de mesoescala. Los algoritmos que resuelven el problema con precisin requieren tiempos de computacin muy elevados, por lo que se ha decidido utilizar el mtodo descrito en la seccin 3.4 para minimizar el tiempo de ejecucin a cambio de perder algo de precisin en los clculos. Hemos escogido una red representativa de cada tipo para estudiar su divisin en comunidades y la estabilidad de sta a travs de la mesoescala (guras 4.7, 4.8 y 4.9). Las lneas continuas corresponden a particiones [23]. La lnea discontinua vertical marca la posicin de la transformacin logartmica. Tipo A. #desalojoSol (N
diferencia entre la resistencia y su valor mnimo, para evitar valores negativos que imposibilitaran
= 3337):
r)
de
0.309 (37 comunidades) y 0.378 (279 comunidades). Tiene cierto grado de mesoescala pero con divisiones muy poco estables. A partir de ah, no existe una particin razonablemente constante hasta
r rasymp
un gran intervalo. En esta ltima divisin hay muchos individuos que se encuentran en comunidades muy pequeas. En concreto, ms de un tercio de la red recae en grupos de menos de 10 componentes. Tipo B. #huelgadeclase (N corresponde a
= 10018):
(comienzo de la lnea continua), sin llegar a estabilizarse. La primera vez que parece asentarse
r = 6,61,
comunidades de tamao menor que 10. Demasiados grupos pequeos de elementos estn aislados y no pueden inuir de manera signicativa en el proceso. Tipo A-B. #15mPaRato (N se mantiene un intervalo en
= 6994): r
el nivel de mesoescala. Se detecta una primera separacin entre 37 y 38 comunidades que de 1.337. Despus de una acusada subida pronto se vuelve a obtener otra particin que permanece aproximadamente constante en
con 535 y 609 agrupaciones. Tras unos cortos intervalos en forma de escalera, la funcin vuelve a asentarse, esta vez ya con 3575 mdulos. De esta manera, hay tres divisiones consistentes, lo que implica que hay comunidades de distintos tamaos que interaccionan entre s en tres escalas diferentes.
27
El sistema de tipo A demuestra la existencia de particiones en comunidades poco robustas, ya que pequeas variaciones de
demasiados grupos y muchos de ellos excesivamente reducidos y aislados, lo que se puede achacar a una organizacin rpida que no logra plasmarse en subestructuras consistentes. El ejemplo del tipo B se comporta de forma distinta, puesto que las particiones no son ables hasta cerca de 1000 comunidades. La limitada interaccin de los participantes impide que se densiquen los enlaces dentro de grupos, y que, una vez identicadas de forma correcta, el resultado sea tambin multitud de participantes solitarios. #15mPaRato s que presenta separaciones de mdulos fuertes que pueden interactuar a varios niveles, algo que dinamiza la existencia del colectivo, al distribuir su actividad entre diferentes escalas del sistema.
1/f .
1/f .
hashtag
tweets
por segundo. Los datos han sido preprocesados utilizando un ltro Butterworth pasa bajo, con frecuencia de corte de 0.06 Hz, para eliminar ruido a altas frecuencias. Una vez obtenidos los resultados, se clasican los procesos en ruido blanco, ruido marrn y ruido rosa (ver seccin 2.2.3). La tabla 4.2 recoge los coecientes
tiempo de correlacin entre escalas, medido en horas. Este ltimo indica el tiempo que el proceso se mantiene como un todo coherente, que no es el mismo que la duracin de la actividad del anlisis dinmico es: Ruido blanco (
hashtag.
La correspondencia entre los tipos de proceso observados bajo nuestro criterio y tipos segn el
< 1),
las escalas temporales cortas y son voltiles como colectivo. Se puede comprobar en cierto modo un carcter irracional e impulsivo. Su organizacin es rpida e impide asentar unas bases comunicativas entre los participantes. Al acercarse a parecen incrementar su correlacin. Ruido rosa ( rosa cuando
=1
1 ), correspondientes al tipo A-B: a efectos prcticos, se considerar ruido 0,8 < < 1,2. Mantienen una identidad ms duradera a lo largo del tiempo. El
equilibrio que se produce entre la interaccin a frecuencias cortas, medias y largas provoca que la correlacin entre escalas alcance los valores ms altos del anlisis. Su capacidad de accin a largo plazo es buena, pero adems es capaz de adaptarse al entorno fcilmente cuando factores externos inuyen el el proceso. Ruido marrn (
>1
que de nuevo disminuyen al alejarse de valores de ruido rosa. Es un buen ejemplo para comprobar que la correlacin entre escalas no tiene nada que ver con la duracin de la actividad del hashtag. Se desarrollaron en un periodo bastante largo de tiempo y, sin embargo, no demuestran apenas anidad entre la actividad a distintas frecuencias. En la grca 4.10 se muestra cmo se ajusta la distribucin del tiempo de correlacin a una funcin gaussiana, con el pico en torno a los procesos de ruido rosa. La correlacin disminuye conforme una de las escalas temporales cortas o largas ejercen mayor inuencia. Hay dos procesos cuya dinmica se opone al tipo que se le haba asignado:
28
10
#desalojosol
10
Comunidades
10
10
10
10
10
rrasymp
Figura 4.7: Anlisis de mesoescala: #desalojoSol
10
#huelgadeclase
10
Comunidades
10
10
10 1 10
10
10
rr
asymp
10
#15mparato
Comunidades
10
10
10
10 0 10
10
10
rrasymp
Figura 4.9: Anlisis de mesoescala: #15mparato
29
#prima500: a pesar de que la etiqueta se activ cuando la prima de riesgo super los 500 puntos, los usuarios estaban esperando a que el momento llegara para lanzar sus mensajes, luego en realidad no fue un evento tan sorprendente como creamos. #cierrabankia: es una campaa creada por la PAH
los datos obtenidos, parece ser que mantuvo un equilibrio entre escalas temporales mayor del que habamos estimado al clasicarlo como tipo A. En denitiva, el balance entre la participacin a frecuencias bajas, medias y altas slo se aprecia en procesos de tipo A-B, que coinciden con valores de
1.
externos y son capaces de llevar a cabo acciones rpidas, mientras que construyen una identidad colectiva de duracin muy superior al resto. Los otros procesos, ya sea por un desarrollo apresurado y escasamente organizado (tipo A) o por una exceciva rigidez que resta variedad e importancia a la participacin (tipo B), existen como agrupacin de individuos coherente durante un tiempo mucho menor.
2 Plataforma
30
10
10
10
0.4
0.6
0.8
1.2
1.4
1.6
Hashtag #alabolsa #nurembernanciero #desalojoSol #15mSectorRadical #laRimaia #bankiaesnuestra #asambleafcom #planderescateciudadano #16m #12m15m #15mparato #lacaixaesmordor #occupymordor #alaplaza12m #Feliz15m #yovoy12m #es15m #cierrabankia #prima500 #22m #huelgadeclase
0.41 0.45 0.46 0.48 0.53 0.59 0.68 0.72 0.79 0.89 1.02 1.12 1.14 1.17 1.22 1.24 1.29 1.30 1.30 1.58
Ruido Blanco Blanco Blanco Blanco Blanco Blanco Blanco Blanco Blanco Rosa Rosa Rosa Rosa Rosa Marrn Marrn Marrn Marrn Marrn Marrn
Correlacin (horas) 0.35 0.88 0.35 0.35 0.55 2.78 0.70 5.54 8.78 145.78 121.5 23.64 1.24 1.97 2.80 1.75 1.11 0.82 0.55 0.39
31
Captulo 5
Conclusiones
5.1. Discusin
Nuestra hiptesis inicial sugera el factor tecnolgico como elemento clave en las movilizaciones sociales, en particular las relacionadas con el movimiento 15M. La validez del estudio pasa por comprobar la relacin directa que tiene la actividad en la red con lo que sucede en el mundo fsico. De este modo, se podran conectar las propiedades analizadas en la red social con las movilizaciones reales. La categorizacin
a priori
de los movimientos bajo nuestro punto de vista coincide en gran A la vista de los resultados
obtenidos, deducimos que la auto-organizacin de los sistemas considerados en el proyecto comparten caractersticas estructurales de forma general. En primer lugar, en todos los sistemas se repite la topologa de mundo pequeo y libre de escala, lo que les conere velocidades de propagacin altas y un agrupamiento denso a nivel local. La existencia de de salida, indica que las redes no son horizontales.
movimientos que hacen pensar que no todos se traducen nalmente en el mismo tipo de redes. Los procesos estn ms abiertos a la interaccin distribuida cuando no estan excesivamente estructurados. Del mismo modo, cuando la participacin s es distribuida, se ha de complementar con cierta organizacin, algo que es difcil de encontrar en los movimientos rpidamente coordinados y de carcter impulsivo. Los que catalogamos como de tipo A-B representan ms elmente la topologa de mundo pequeo, y su distribucin de grado de salida y la presencia de mesoescala indican que la interaccin se diversica ms y que se desarrolla a varios niveles, actuando como elemento de cohesin en los sistemas. Por otro lado, el anlisis dinmico revela notables diferencias entre procesos. La dinmica de cada red corrobora esa cohesin por medio de la participacin activa que sugiere la caracterizacin estructural. Los procesos de ruido rosa se mantienen como una identidad coherente durante ms tiempo, gracias a una actividad distribuida equilibradamente entre escalas temporales cortas, medias y largas. Al alejarse hacia zonas de ruido blanco o marrn, el tiempo de correlacin entre ritmos de actuacin desciende drsticamente y, aunque los procesos permanezcan activos, no se constituyen como un colectivo coherente. Por consiguiente, la auto-organizacin de movimientos en red no siempre tiene la misma repercusin. La forma en que se desarrolle el proceso inuir en la estabilidad de los individuos como grupo conectado. En concreto, la interaccin entre los nodos (tanto en cantidad como en diversidad) y las comunidades es clave. Podemos diferenciar entre comunidades de participacin abierta y espontnea, de actividad ms impredecible y catica, y comunidades cerradas y estructuradas en la que la actividad es ms previsible y coherente. Las primeras demuestran ms creatividad pero son incapaces de mantener su actividad a lo largo del tiempo, mientras que las segundas son ms estables pero no consiguen adaptarse a los cambios en su entorno. Los resultados obtenidos sugieren
33
que la actividad en las escalas temporales y espaciales intermedias son elementos fundamentales para combinar las ventajas de cada uno de estos tipos de organizacin. En resumen, conclumos que las dinmicas observadas en el mundo fsico y en la red son similares. A travs del anlisis de un proceso comunicativo en la red, hemos podido caracterizar la actividad de los colectivos asociados a esos procesos e interpretar cmo se organizan y actan. Por tanto, la tecnologa acta como vehculo para la generacin de estados de nimo comunitarios y potencia su forma de expresarse.
5.2. Aplicaciones
El proceso de aprendizaje continuo que se da en torno a la relacin entre movimientos sociales y tecnologa promueve nuevas formas de anlisis. Este trabajo puede servir como medio para evaluar el funcionamiento de redes y las estrategias que se siguen dentro de ellas. Como los sistemas objetivo no son intuitivos, la aplicacin de estudios de este tipo puede ser provechosa desde el punto de vista organizativo. La presencia de mesoescala y ruido rosa sugieren que los procesos que funcionan no se controlan de arriba a abajo ni emergen espontnemante de la congregacin de individuos, sino que es necesario un puente entre la actividad a distintos niveles. Los movimientos sociales representan un caso interesante de estudio en este campo, pero otros muchos procesos se valen de las redes sociales para su desarrollo, como puede ser el marketing 2.0, aspectos relacionados con los estudios de mercado, reputacin
online
y posicionamiento
web, etc.
Por otro lado, la aplicacin de los procedimientos de este documento en tiempo real puede proporcionar indicadores que monitorizen la evolucin de los sistemas, y, en el caso de las movilizaciones sociales, se obtendra informacin valiosa, como por ejemplo la efectividad del sistema como colectivo.
retweet
ms el signicado de los enlaces, as como comparar stas con las redes de seguimiento. Un planteamiento muy ambicioso incluye el estudio conjunto de distintas capas de activididad (distintas redes en Internet y el espacio fsico) que pueda poner de maniesto relaciones entre ellas. Asimismo, sustituir el componente gigante dbilmente conexo por el fuertemente conexo permitira estudiar los ncleos ms centrales de la red. El anlisis de mesoescala se puede mejorar a travs de algoritmos que, aunque mucho ms costosos en tiempo de computacin, proporcionan divisiones ms precisas. La parte dinmica ofrece multitud de oportunidades interesantes para el estudio de sistemas complejos. Adems de aadir el factor tiempo al anlisis estructural [38], la visin de estos movimientos como una mente colectiva habilita conexiones de trabajos de este tipo con los sistemas cognitivos. Evaluar las dinmicas individuales para relacionarlas con la global sera otro aspecto a considerar.
34
Bibliografa
[1] Toret, J. Una mirada tecnopoltica sobre los primeros das del 15M, en Democracia Distribuida, Universidad Nmada (2012). [2] GlobaliseThis. New media for peace, http://globalisethis.wordpress.com/2009/10/06/1999new-media-revolution-in-seattle/ (2009). [3] Salido, N. Del 11M al 14M: Jornadas de mvil izacin social, ISBN 84-313-2374-4, pgs. 271-284 (2006). [4] Fernndez-Savater, (2012). [5] Malo, M. y Prez, D. Latidos. O del 15M y la revuelta, A. Cmo se organiza un clima?,
http://madrilonia.org/2012/02/latidos-o-del-15m-y-la-revuelta/ (2012). [6] Levi S., Notas para una r-evolucin 2. Segunda fase: vicios vs. nuevas virtudes
tcticas., http://conservas.tk/tacticas/ ,(2012). [7] Jansen, B. J., Zhang, M. M., Sobel, K., y Chowdury, A. Twitter Power: Tweets as Electronic Word of Mouth, Journal of the American Society for Information Science and Technology 60(11), 2169-2188 (2009). [8] Kwak, H., Lee, C., Park, H., y Moon, S. What is Twitter, a social network or a news media?, artculo presentado en el 19th International Conference on World Wide Web (2010). [9] Rey, P., Front page newspaper analysis, http://numeroteca.org/cat/frontpage-
newspaper/ (2011-2012). [10] Sol, R., Redes complejas, Tusquets (2009). [11] Bar-Yam, Y. Dynamics of complex systems, ISBN 0813341213 The Advanced Book Studies in Nonlinearity series, Westview Press (2003). [12] Marashi, E. y Davis, J. P. A Systems Approach for Resolving Complex Issues in a Design Process, Computer-Aided Civil and Infrastructure Engineering, 22 (7), pp. 511-526 (2007). [13] Livingston-Gray, S. Directed Versus Undirected Graphs. http://think-like-a-
git.net/sections/graph-theory/directed-versus-undirected-graphs.html (2011). [14] The iGraph Library, http://igraph.sourceforge.net/screenshots2.html. [15] Erds, P. y Rnyi, A. "On the evolution of random graphs". Publications of the Mathematical Institute of the Hungarian Academy of Sciences 5: 1761 (1960).
35
[16] Watts, D. J. and Strogatz, S. H. Collective dynamics of `small-world' networks. Nature 393, 440442 (1998). [17] Amaral, L. A. N., Scala, A. Barthlmy, M. Stanley, H. E. Classes of small-world networks. PNAS, September 26, 2000. [18] Albert, R., H. Jeong and A.-L. Barabasi. Diameter of the World-Wide Web. Nature 401, 130 (1999). [19] Faloutsos, M., Faloutsos P. and Faloutsos, C. Proc. ACM SIGCOMM, Comput. Commun. Rev. 29, 251 (1999). [20] Jeong, H., Tombor, B., Albert, Z. N., Oltvai, Z. N. y Barabsi, A.-L. The large-scale organization of metabolic networks ,Nature 407, 651 (2000). [21] Borge-Holthoefer, J., Rivero, A., Garca, I., Cauh, E., Ferrer, A.,
et al.
Structural
and Dynamical Patterns on Online Social Networks: The Spanish May 15th Movement as a Case Study . PLoS ONE 6(8): e23883. doi:10.1371/journal.pone.0023883 (2011). [22] Newman, M. E. J., Finding and evaluating community structure in networks, Phys. Rev. E 69, 026113 (2004). [23] Newman, M. E. J., Analysis of weighted networks, Phys. Rev. E 70 056131 (2004). [24] Girvan, M. y Newman, M. E. J., Community structure in social and biological networks, Proc. Natl. Acad. Sci. USA 99 7821 (2002). [25] Radicchi, F., Castellano, C., Cecconi, F., Loreto, V. y Parisi, D. Self-contained algorithms to detect communities in networks. Proc. Natl. Acad. Sci. USA 101 2658 (2004). [26] Pons, P. y Latapy, M. Computing communities in large networks using random walks. Journal of Graph Algorithms and Applications (2006). [27] Clauset, A., Newman, M. E. J. y Moore, C. Finding community structure in very large networks. Phys. Rev. E 70, 066111 (2004). [28] Fortunato, S. y Barthelemy, M. Resolution limit in community detection. PNAS January 2, 2007 vol. 104 no. 1. [29] Arenas, A., Fernandez, A. y Gomez, S. Analysis of the structure of complex networks at dierent resolution levels. New Journal of Physics 10 (2008). [30] Bak, P., Tang, C. and Wiesenfeld, K. "Self-organized criticality: an explanation of 1/f noise". Physical Review Letters 59 (4): 381384 (1987). [31] https://scraperwiki.com/ [32] https://gephi.org/ [33] http://deim.urv.cat/~sgomez/radatools.php [34] Newman, M. E. J. Fast algorithm for detecting community structure in networks Physical Review E 69 (2004). [35] Freeman, W. How Brains Make Up Their Minds. Columbia University Press (2000). [36] https://scraperwiki.com/proles/ignaciomorer/ [37] Barandiaran, X. (2008) Mental Life. A naturalized approach to the autonomy of 3641
cognitive agents, PhD Thesis Dissertation, (2008). [38] Holme, P. y Saramki, J. Temporal Networks, Phys. Rep. 519, 97-125 (2012).
36
Parte II
Anexos
37
Apndice A
hashtag,
del movimiento. Por ejemplo, #16m puede referirse al 16 de mayo por otro motivo ajeno a la movilizacin o incluso signicar algo totalmente distinto (16 minutos, 16 millones...). Todos los dems son ms exclusivos y dejan fuera
tweets
Hashtag
#15msectorradical #16m #alabolsa #asambleafcom #bankiaesnuestra #cierrabankia #desalojosol #larimaia #nurembergnanciero #planderescateciudadano #prima500 #12mglobal #22m #alaplaza12m #es15m #feliz15m #huelgadeclase #yovoy12m #12m15m #15mparato #lacaixaesmordor #occupymordor
Porcentaje nodos
Porcentaje aristas
58,21
76,35 95,67 84,64 90,05 93,08 96,36 95,92 87,11 75,1 72,89 90,95 83,65 76,74 78,23 87,41 93,94 89,7 97,69
91,73
70,87
85,84 98,88 92,95 95,86 97,47 99,07 97,74 94,09 87,07 83,15 96,34 92,72 89,93 89,22 95,19 98,47 92,58 99,59
96,93
65,34
76,96
39
tamao y grado medio. Las relaciones permiten comprobar su estructura de mundo pequeo.
Hashtag
#15msectorradical #16m #alabolsa #asambleafcom #bankiaesnuestra #cierrabankia #desalojosol #larimaia #nurembergnanciero #planderescateciudadano #prima500 #12mglobal #22m #alaplaza12m #es15m #feliz15m #huelgadeclase #yovoy12m #12m15m #15mparato #lacaixaesmordor #occupymordor
C
0,064 0,087 0,091 0,172 0,081 0,047 0,170 0,096 0,079 0,101 0,044 0,059 0,082 0,055 0,083 0,105 0,047 0,079 0,127 0,183 0,149
Crandom
0,00333 0,00048 0,00301 0,00101 0,00099 0,00042 0,00034 0,00096 0,00095 0,00012 0,00022 0,00030 0,00014 0,00030 0,00025 0,00020 0,00018 0,00015 0,00010 0,00040 0,00027
19,23 181,2 30,23 172 81,26 112,84 498,47 99,97 83,54 835,66 202,61 198,63 590,2 181,45 327,68 530,26 258,17 519,83 1211,77 452,64 559,56
Lrandom
2,742 2,821 2,356 3,676 2,672 2,741 3,023 4,011 2,773 2,872 2,425 2,464 2,607 2,944 2,797 3,138 2,639 3,072 4,633 5,823 3,800
L/Lrandom
1,7 2,15 0,65 1,16 1,38 2,45 1,56 1,04 1,52 1,29 1,85 1,1 3,53 1,82 2,4 2,15 2,68 2,05 1,1 0,69 1,25
40
P (k) ck ,
de la recta obtenida mediante la aproximacin por mnimos cuadrados. En la tabla A.3 se recogen los resultados para todos los sistemas, ordenados por tipos.
Hashtag
#15msectorradical #16m #alabolsa #asambleafcom #bankiaesnuestra #cierrabankia #desalojosol #larimaia #nurembergnanciero #planderescateciudadano #prima500 #12mglobal #22m #alaplaza12m #es15m #feliz15m #huelgadeclase #yovoy12m #12m15m #15mparato #lacaixaesmordor #occupymordor
in
-1,5143 -1,5702 -1,3418 -1,6371 -1,7238 -1,7435 -1,5025 -1,5490 -1,5087 -1,5919 -1,6223 -1,7346 -1,8946 -1,7996 -1,7076 -1,8634 -1,7699 -1,6883 -1,7759 -1,6136 -1,61
out
-2,3313 -2,4898 -2,9698 -2,2812 -2,6353 -2,5601 -2,6652 -2,2041 -2,4427 -2,6642 -2,9313 -3,0761 -2,9212 -2,4963 -2,4739 -2,3651 -2,8047 -2,4725 -2,3201 -2,3636 -1,94
41
import scraperwiki import simplejson import sys # Extraer una pgina base_url = 'http://search.twitter.com/search.json?q=' q = 'termino_busqueda' # q es una variable que identifica el trmino que se quiere buscar, # en nuestro caso, el hashtag options = '&rpp=100&page=' page = 1 while 1: try: url = base_url + q + options + str(page) html = scraperwiki.scrape(url) print html soup = simplejson.loads(html) for result in soup['results']: # Guardar los datos en la base de datos de ScraperWiki scraperwiki.sqlite.save(["id"], result) page = page + 1 except: print str(page) + ' pages scraped' break
42