Vous êtes sur la page 1sur 38

Ucinet et Netdraw Logiciels pour lanalyse des rseaux sociaux

Petit mode demploi

Version 1.01 Septembre 2009

Laurent BEAUGUITTE (UMR Gographie-cits, Universit Paris 7) beauguittelaurent@parisgeo.cnrs.fr

Lobjectif de ce livret est simple : permettre des personnes non spcialistes de lanalyse des rseaux sociaux dutiliser les logiciels Ucinet et Netdraw. Pour complter les lments prsents ici, une courte bibliographie commente permet de reprer les ouvrages essentiels. Toutes les captures dcran ont t ralises sur la version 6.220 du logiciel et sous environnement Windows Vista. Ce petit mode demploi ne prtend pas puiser toutes les possibilits offertes par ces logiciels mais permettre leur rapide prise en main.

Vos commentaires et remarques sont les bienvenues et serviront amliorer cet outil. Une version augmente (et corrige si besoin) est programme pour mi-2010.

1. Prsentation des logiciels

Ucinet et Netdraw sont tous deux dvelopps par Borgatti, Everett et Freeman et sont tlchargeables ladresse suivante http://www.analytictech.com/ Si, jusquen dcembre 2008, il tait possible de tlcharger les versions antrieures dUcinet gratuitement, ce nest malheureusement plus le cas. Ucinet est utilisable dans sa version dessai pendant 60 jours (dutilisation effective)1, Netdraw est quand lui gratuit. Ces deux logiciels ne fonctionnent que sous environnement Windows. Pourquoi alors se fatiguer les matriser dans la mesure o il existe des logiciels gratuits et plus puissants (Pajek, Stocnet, Tulip par exemple) ? La raison est simple : ces deux logiciels sont dune grande simplicit demploi et ils permettent de trs rapidement produire des analyses efficaces et claires.
Lun des points les plus perturbants pour un francophone dsireux de se frotter aux logiciels de

Social network analysis est lhtrognit du vocabulaire dun logiciel lautre (ainsi node dans Ucinet devient vertice dans Pajek). La situation se complique encore quand le dit francophone se base sur les ouvrages de rfrence franais. Le parti pris choisi ici est de systmatiquement garder les termes prsents dans les deux logiciels. Les termes les plus courants sont traduits (degree devient degr), les termes plus sotriques sont crits en anglais, en gras, et placs entre apostrophes. Un lexique plac en annexe permet de devenir peu prs bilingue en analyse des rseaux.

La logique des deux logiciels est fondamentalement Windows : quelques icnes, des menus droulants et des sous-menus, plus quelques raccourcis. Les choix effectuer pour lancer un traitement sont indiqus sous cette forme Intitul du menu > intitul du sous-menu > options choisir Les captures dcran prsentes dans la partie 2 permettent de reprer les principales options disponibles. Ainsi, si vous dsirez lancer lalgorithme CONCOR, vous devrez drouler les menus et sous-menus suivants.
1

Les tarifs en septembre 2009 pour une licence sont de 40 dollars pour un tudiant, 150 dollars pour une universit (tarifs dgressifs pour plusieurs licences).

Figure 1 : Lancer lalgorithme CONCOR

Cela sera not Network > Roles & Positions > Structural > CONCOR

Lorsque la premire tape consiste cliquer sur une icne, puis choisir parmi les menus droulants, la notation utilise sera la mme. Ainsi, pour contrler une matrice, il convient de cliquer sur licne Spreadsheet (le nom des icnes apparat lorsque la souris les survole).

Puis, dans la fentre Spreadsheet de drouler le menu File et de choisir Open avant dindiquer lemplacement du fichier ouvrir. La notation pour une telle opration est Spreadsheet > File > Open

Pour installer les logiciels, il suffit de les tlcharger et de lancer les fichiers .exe.

2. Les interfaces

Cette partie est indigeste dans la mesure o elle prsente la plupart des icnes et des menus droulants des 2 logiciels. Il est probablement inutile de la lire entirement mais les captures dcran peuvent tre utiles par la suite, notamment lorsquon ne sait plus o se trouve telle ou telle option. Figure 2 : Page daccueil dUcinet

Figure 3 : Page daccueil de Netdraw

Pourquoi 2 logiciels ? Ucinet permet de raliser un certain nombre de traitements sur des matrices, Netdraw permet de les reprsenter graphiquement. Certaines mesures peuvent tre effectues directement dans Netdraw. Les icnes dUcinet 5 icnes sont prsentes dans la barre des tches dUcinet. Leur nom apparat lorsquon les survole avec la souris (il est indiqu entre parenthses dans les lignes ci-dessous).

De gauche droite : la porte (Exit) permet de quitter le logiciel. la feuille (Matrix spreadsheet editor) permet douvrir une matrice vierge les barres (Excel DL editor) permettent dimporter des fichiers le stylo (Edit Text File) permet douvrir un fichier .txt le D (Display Ucinet Dataset) permet daller rechercher un fichier Ucinet le graphe color (Visualize network with Netdraw) permet de lancer Netdraw Licne Matrix spreadsheet editor permet dimporter des matrices saisies dans un tableur avec un simple Ctrl+C (dans le tableur) Ctrl+V (dans Ucinet). Comme souvent, les actions ralisables en cliquant sur une icne peuvent aussi tre slectionnes via les menus droulants.

Les icnes de Netdraw sont beaucoup plus nombreuses (30 !). Certaines permettent de reprsenter le graphe en fonction de diverses proprits, elles ne seront donc dcrites que dans la partie 6. L encore, le nom apparait quand on survole licne

Les cinq premires de gauche droite

la feuille permet de nettoyer lcran les trois dossiers permettent douvrir des fichiers de format varis (Ucinet bien sr, mais aussi .txt, Pajek etc.). lcran aux flches bleues permet dlargir le graphe afin que celui-ci occupe tout lcran. lcran aux flches croises ouvre une bote doutil pour faire pivoter le graphe dans la direction voulue, de zoomer sur une partie etc.

Les neuf dernires de gauche droite

Les deux A permettent dagrandir ou de rduire la taille des nuds, les deux S permettent dagrandir ou de rduire la taille des noms des nuds. Le L italique et la flche permettent de reprsenter ou nom les noms des nuds et les directions des relations. La barre numrote 1-4 permet de reprsenter ou non lintensit des liens en cas de valued graph. Enfin le point rouge permet de dessiner de nouveaux nuds. La barre de tches situe gauche sera aborde elle aussi dans la partie 6 consacre aux reprsentations graphiques.

Les menus droulants Ucinet propose un choix trs riche et il nest pas question ici de prsenter systmatiquement toutes les options disponibles et leurs consquences. Les captures dcran ci-dessous montrent ce qui se cache derrire les termes de la barre suprieure. Toutes les commandes ou presque ouvrent une bote de commande permettant de modifier les paramtres de laction raliser.

Figure 4 : Menu File, Data et Transform

Le menu Transform est trs utile pour modifier des matrices et propose de nombreuses options. Il est par exemple de les symtriser en utilisant le minimum, le maximum, la somme, la moyenne etc. Le menu Tools permet de raliser des analyses statistiques partir des matrices tudies.

Figure 5 : Menu Tools

Le menu Network permet de mener bien trs des analyses concernant le rseau tudi.

Figure 6 : Menu Network

Le menu Visualise permet de lancer au choix Netdraw, Mage (effets 3D) ou Pajek. Le menu Options permet divers rglages (nombre de dcimales, largeur des colonnes etc.). Enfin le menu Help est trs utile, surtout la partie Help Topic dune grande qualit (raccourci clavier : F1). On trouvera pour toutes les commandes une description dtaille du principe, le dtail des algorithmes utiliss, les conditions dapplication ainsi que des rfrences bibliographiques.

Les menus droulants de Netdraw seront voqus dans la partie 6.

3. Questions de vocabulaire
Pour utiliser Ucinet ou Netdraw, il est ncessaire davoir une matrice (k lignes * l colonnes). Lorsque k = l, la matrice est dite carre. Si les intituls des colonnes et des lignes sont les mmes, il sagit dun one-mode network. Lorsque kj, la matrice est dite rectangulaire (2mode network). Il est possible de saisir une matrice avec Ucinet mais il est beaucoup plus pratique de la crer avec son tableur habituel, de la copier et de la coller ensuite dans Ucinet. Trois matrices carres (one mode network) serviront dexemple tout au long de ce livret2. Les deux premires sont binaires (binary), c'est--dire quelle signale si un lien entre deux nuds est prsent (1) ou absent (0) ; lune est symtrique (non directed), lautre ne lest pas (directed). La dernire est value (valued), ce qui signifie que, non seulement lexistence de la relation importe, mais lintensit de la relation compte galement. Par convention, dans le cas de directed graph, lorigine du lien est en ligne et le destinataire du lien est en colonnes. La nature des acteurs et des liens na pas dimportance. Ayant une formation de gographe, je les avais cres pour tudier des flux commerciaux entre pays, mais ce pourrait trs bien tre des rapports de parent entre personnes ou des liens financiers entre des entreprises Les points du rseau sont les nodes, les liens existant les ties. Par la suite, les termes nuds et acteurs sont quivalents nodes, les termes liens ou relations quivalents ties.

Les trois matrices sont prsents ci-dessous de deux faons diffrentes et quivalentes ; sous leur forme originale dans Excel, sous leur forme graphique dans Netdraw.

Les signed graphs, les two-mode networks et autres multigraphs seront abords dans la version 1.1 de ce livret (version prvue pour lautomne 2010)

Figure 7 : Directed binary matrix and graph (GR1)

Figure 8 : Undirected binary matrix and graph (GR2)

Figure 9: Directed valued matrix and graph (GR3)

Deux remarques concernant ces graphes; ils sont dits simple ( linverse des multigraphs) pour deux raisons. Premirement, les liens dun nud lui-mme (appel loop ou self-tie) nexistent pas, ce qui se vrifie par le fait que la diagonale soit vide dans les trois matrices. Deuximement, une relation et une seule existe entre les acteurs. 10

Autre prcision, tous les nuds sont relis par au moins un lien ; le graphe est dit connected car il ny a pas de nud isol (isolate). Dans les graphes GR1 et GR3, il y a un lien de A et B et un autre de B vers A ; on parle alors de reciprocal tie. Dernier point de vocabulaire, la distance entre deux nuds se mesure en nombre de liens. La distance la plus utilise est nomme godsique (geodesic distance), elle dsigne la distance la plus courte existant entre deux nuds. Dans un graphe connect (connected) et symtrique, il existe une distance entre tous les nuds. Par exemple, dans le graphe GR2, les distances godsiques entre nuds sont les suivantes AB : 1, AL : 2, AJ : 7 etc. Par contre, si le graphe est orient (directed graph), seules les distances possibles seront mesures. Dans le graphe GR1 par exemple, il nest pas possible de se rendre de L H.

4. Premiers pas, premires mesures

La premire tape consiste importer les donnes. La solution la plus simple consiste copier dans son tableur la matrice et de la coller directement dans Ucinet en ouvrant une feuille (Data> Spreadsheets >Matrix ou Ctrl+S ou un clic sur licne Spreadsheets). Les options prsentes sont surtout utiles lorsque lon saisit directement des donnes dans Ucinet. Une fois la matrice colle, enregistrer-l o vous le souhaitez (Save ou Save as ou Ctrl+S).

Un certain nombre de mesures sont utiles pour caractriser le graphe dans son ensemble ; - le nombre de nuds - le nombre de liens - la distance godsique maximale entre deux nuds du graphe - la distance godsique moyenne entre deux nuds - la densit du graphe (nombre de liens existants/nombre de liens rels). Prenons lexemple du graphe GR1.

Avec Ucinet, plusieurs options sont possibles

11

Densit et nombre de liens peuvent tre obtenus avec la commande Network > Cohesion > Density > Density overall

Le rsultat est un fichier texte.


DENSITY / AVERAGE MATRIX VALUE -------------------------------------------------------------------------------Input dataset: GR1 (C:\Users\laurent\Desktop\LOGICIELS\SOCIAL NETWORKS\UCINET MODE D'EMPLOI\DATASETS\GR1) Output dataset: GR1-density (C:\Users\laurent\Desktop\GR1-density) Density No. of Ties -------------- -------------GR1 0.0909 12.0000

Systmatiquement, les rsultats indiquent : lintitul de lopration effectu, le chemin du fichier source et celui du fichier sortie. Si des oprations ont t effectues avant le calcul (ainsi certaines procdures ncessitent des matrices symtriques et binaires), elles sont indiques avant les rsultats.

La densit de liens est donc de 9%, c'est--dire que 9% des liens possibles sont prsents. Pour vrifier le calcul ; le graphe tant orient, il y a 12*11 liens possibles soit 132. 12 liens existent donc la densit est de 12/132 soit 0.09 ou 9%. On obtient la densit et lcart-type (mais pas le nombre de liens) avec la commande Network > Cohesion > Density > Old Density Procedure Les distances entre nuds sont calcules laide de la commande Network > Cohesion > Distance

Les rsultats obtenus avec le graphe GR1 sont les suivants

12

Quest-ce que a veut dire ? La distance moyenne entre nuds est de 1.692. La frquence des distances (effectif brut et pourcentage) apparat ensuite. Enfin, une matrice donne les distances entre chaque nud (il faut par exemple 3 liens pour relier A L : AB BH HL). Dans le premier tableau, la ligne 3 4.000 0.154 signifie quil y a une distance de 3 liens prsente 4 fois dans le graphe, ce qui reprsente 15% du total de nombre de distances entre nuds. La dernire ligne du tableau correspond la distance la plus courte possible entre les nuds les plus loigns les uns des autres du graphe. Cette mesure est aussi appel diamtre ( diameter). Toutes les cases laisses en blanc dans la matrice des geodesic distances signalent des distances impossibles (A ne peut pas joindre C et D). Il est possible de sintresser aux proprits des nuds en tant que tels. Lun des indicateurs les plus communs est celui de degree, il correspond au nombre de liens adjacents un nud. Dans le cas des directed graphs, on distingue les in-degree (nombre de liens qui atteignent le nud) et les out-degree (nombre de liens qui partent du nud). 13

Examinons le graphe GR1

A reoit un lien issu de B et envoie un lien vers E et un vers F ; son in-degree est de 1, son out-degree et de 2. Il est possible de les calculer sous Ucinet comme sous Netdraw. Sous Ucinet, Network > Centrality > Degree

Puis rgler les paramtres (matrice symtrique ou non, diagonale valide ou non)

Sous Netdraw Analysis > Centrality measures Il faut prciser si le graphe est directed ou non. Les rsultats du graphe GR1 avec Ucinet sont les suivants (symmetric NO, diagonal values NO)

14

On retrouve les out et in degree bruts (premier tableau, colonne 1 et 2) et normaliss (tableau 1, colonne 3 et 4) pour chaque nud. Ainsi A envoie 3 liens et pourrait en envoyer au maximum 11 (pas de self-tie), il envoie donc 3/11 soit 27% des liens possibles. Le deuxime tableau prsente des statistiques sur les deux degree. Lindicateur de centralisation prsent aux deux dernires lignes compare la situation tudie avec deux situations thoriques ; celle dun graphe circulaire (lgalit entre nuds est parfaite) et celle du graphe en toile (un nud est li tous les autres et aucun autre lien nexiste, lingalit est maximale). Lindice de centralisation calcul par Ucinet apparat en dessous de chaque graphe.

15

Figure 10: Star network and circle graph

Network centralization (out-degree) 100%

0%

Il est utile de connatre deux autres cas de figure thorique; la ligne et le graphe complet. Mme si on ne les rencontre jamais, ils fournissent des valeurs de rfrence pour comparer entre eux des graphes de diffrentes tailles, densits etc.

Figure 11: Line network and complete network

Network centralization 16.67%

0%

Des mesures plus sophistiques sont disponibles pour caractriser la situation relationnelle dun nud dans un graphe. Pour se limiter aux plus employs, citons closeness, betweeness et eigenvector. Ces mesures sont manier avec prcaution car elles ont t cres pour tudier des faits sociaux et ne peuvent tre appliques tous les flux (conomiques notamment). Attention : Ucinet rend la matrice symtrique et binaire avant de calculer les valeurs Closeness mesure la proximit avec les autres nuds du rseau. Plus un nud est proche de tous les autres, plus son score est lev.

16

Betweeness permet de saisir la position dintermdiaire de certains nuds. Cette position dintermdiaire peut en effet tre cruciale dans certains rseaux (possibilit de faire circuler une information, de transmettre une maladie etc.) Eigenvector recherche les acteurs les plus centraux en tudiant la fois la position du nud et la structure de lensemble du rseau via une analyse factorielle. Calculons ces indicateurs sur le graphe GR2 Network > Centrality > Multiple measures

Dans le cas dun graphe de cette taille, il est prudent dobserver sa structure avant de jouer la DS pour sortir x rsultats plus ou moins contradictoires impossible interprter (je sais de quoi je parle !). Au moins un nud apparat clairement priphrique (L). E a trs peu de liens mais il assure la jonction entre les groupes ABCD et FGHIJK. Les rsultats sont les suivants :

17

Les mesures sont normalises, ce qui naide pas comprendre et interprter les rsultats. La colonne degree a dj t vue ; pourcentage de liens rels par rapport au total des liens possibles par nud. Plus la closeness est leve, plus le nud est proche de tous les autres (comparez le score de L avec celui de E et F). La betweeness est trs disperse avec trois nuds ayant une valeur de zro. Pourquoi ? L nest sur le passage daucun chemin dans le graphe (cest un cul de sac) ; A et G sont connects davantage mais nullement indispensables, un lien direct existe entre BC et entre GH. A linverse, les nuds E et F doivent tre franchis pour joindre de nombreuses paires de nuds. Enfin le eigenvector donne lavantage aux nuds fortement connects (B et D) de la partie gauche du graphe qui est plus dense que la partie droite. Aucune valeur nest meilleure quune autre, elles mesurent des phnomnes diffrents en utilisant des mthodes diffrentes. Dautres indices existent et javoue une faiblesse pour un indice trs malin mis au point par Bonacich. Ce dernier a eu une intuition brillante ; avoir de linfluence suppose davoir de nombreux liens certes, mais linfluence sera dautant plus forte que les contacts seront eux isols. Si je donne une information quelquun qui connat normment de monde, je suis une voix parmi dautres. Si je donne la mme information quatre ermites, ma voix compte davantage. Lindice est calcule via Network > Centrality > Alpha centrality

Le rsultat est intressant pour les graphes de grande taille.

18

5. A la recherche des structures


Lune des grandes forces dUcinet est le nombre de mthodes disponibles pour crer des partitions de graphes ce quun gographe soucieux de rgionalisation ne peut quapprcier. La premire tape consiste dterminer la mthode approprie. Dans le cas de non directed graph, les principales mthodes disponibles sont les cliques (et tous les drivs possibles). Les diffrentes formes dequivalence sont indiques pour les directed graphs.

5.1 Non directed graph

La dfinition dune clique est simple ; un sous graphe complet dau moins trois nuds. Dit autrement, un sous ensemble de trois nuds minimum lintrieur duquel tous les liens possibles sont prsents. La commande pour les obtenir est la suivante Network > Subgroups > Cliques

Le graphe GR2 sera utilis comme exemple dans toute cette partie.

Les rsultats de la commande ci-dessus se prsentent ainsi;

19

La liste des cliques trouves apparat en premier lieu. Puis, un tableau indique la distance entre chaque nud en ligne et chaque clique en colonne. B tant membre des cliques 1 et 2, la distance est de 1. Le nud L est situ une distance de 1 dun lment dune clique de taille 3, la valeur indique est donc de 1/3 soit 0.33. Le nud A est li deux des 3 lments de la clique BCD ; la valeur indique est donc de 2/3 soit 0.667 etc.

Les tableaux fournis ensuite par le logiciel montre le degr de coappartenance de chaque nud aux diffrentes cliques. B et C sont dans les cliques ABC et BCD ; les croisements ligne/colonne dans la matrice indiquent 2. La coappartenance est enfin reprsente sous forme dhistogramme qui permet une visualisation rapide des principaux centres du graphe. Linterprtation des valeurs infrieures 20

1 est problmatique. Il peut paratre trange que A soit inclus dans le groupe ABC au niveau 1 et que D soit inclus au niveau 0.75 seulement. Ucinet considre les nuds dans lordre o ils sont dans la matrice ; cest pourquoi A est considr en premier. D nest examin quensuite ; mais pourquoi 0.75 ? Nayant pas encore trouv la rponse, je conseillerai volontiers de dcouper lhistogramme seulement partir de 1.

La dfinition de la clique a t assouplie de diverses faons pour mettre en vidence des structures denses mais non compltement interconnectes. La N-clique groupe les nuds connects spars par une distance maximale N (2 est gnralement utilis, Ucinet le propose par dfaut). Les rsultats de la commande Network > Subgroups > N-cliques sont les suivants

Le plus simple pour comprendre le principe est de revenir au graphe de dpart

Au dpart, il y a 3 cliques (ABC, BCD, FGH). Le N-clique autorise lintgration des nuds situs deux pas de chacun des nuds de ces cliques. D et L sont distance 1 ou 2 de la clique ABC, do la n-clique ABCDL. Lapparition dune 2-cliques DEF est trange mais logique ; ces nuds sont connects les uns aux autres et la distance maximale entre ses lments est bien de 2 Linconvnient de la mthode est vident ; cela favorise ltirement des sous-groupes cres. 21

La recherche des N-clan vise limiter cet inconvnient en ajoutant une contrainte lie la distance maximale autorise entre les nuds des groupes forms (diamtre). Sur un graphe de cette taille, les rsultats ne sont pas trs diffrents (Network > Subgroups > N-clan diamtre maximal 2)

Seule diffrence, la N-clique numro 6 (FGHIK) nest pas un(e) N-clan. Pourquoi ? La distance entre I et K, dans ce sous-groupe, est de 3, ce qui dpasse le diamtre maximal autoris.

Une autre approche possible est de recherche les quasi-cliques, c'est--dire les sous groupes fortement connects auxquels manquent quelques liens pour former une clique. Les deux mthodes permettant cette recherche sont les k-plexes et les k-cores. Pour les kplexes, un nud est membre dune clique de taille n si il a des liens directs avec k-n membres de cette clique. Un k-core est un groupe dont tous les nuds sont lis k membres du groupe. Les rsultats des deux mthodes sont les suivants (commandes Network > Subgroups > Kplex et Network > Regions > K-core) Les paramtres proposs par dfaut sont gards (K-plex : value of K 2, minimum size 3).

22

Garder la taille minimale par dfaut (3) donne un nombre trs lev de k-plexes pour une raison logique. Il suffit davoir 2 liens entre 3 nuds pour en crer un. La mthode permet la mise en vidence du groupe ABCD. Les rsultats des k-cores se prsentent sous une forme diffrente

23

La position priphrique du nud L apparait, et cest peu prs tout. Les rsultats sont beaucoup plus significatifs avec des graphes de grande taille. Ils ont galement un avantage non ngligeable pour des gographes ; ils fournissent une image centre/priphrie nette et le codage des nuds pour une future cartographie est fourni. Les mthodes vues prcdemment tudient les proprits des nuds pour dterminer les structures. Les deux mthodes suivantes partent du graphe complet. Le premier indicateur est la prsence ou non de component (Network > Regions > Components) ; si le graphe est connect, la valeur est de 1, si le graphe comporte deux sousgraphes non lis, la valeur est de 2 ; si le graphe comprend cinq nuds isols, la valeur est de 5 etc. Cela peut tre utile avec des graphes de grande taille clats en nombreux sous-graphes (Ucinet fournit la taille et la composition des divers components). Il peut tre intressant galement de rechercher les nuds qui, sils taient supprims, creraient des sous-graphes non connects entre eux. Lexamen du graphe GR2 montre que les zones de fragilit du graphe sont nombreuses. Supprimer B isolerait L, Supprimer D, E ou F entrainerait la cration de deux sous-graphes etc. Ces nuds sont appels cutpoints dans Ucinet et sont donns par la commande Network > Regions > Bicomponent

24

Ucinet donne la liste des cutpoints, les blocks peuvent tre considrs comme les groupements de base du graphe. Dautres mthodes sont galement disponibles, fondes sur des proprits diffrentes. Les Lambda sets sont les sous-groupes o le trafic potentiel est le plus important. Ucinet cherche combien de liens doivent tre supprims pour empcher le lien entre deux nuds. Ainsi, dans le graphe GR2, supprimer le lien BL rend L isol, et lempche de joindre tous les autres nuds (do la prsence de 1 sur toute la ligne L supprimer 1 lien suffit). A linverse, il existe 3 moyens de joindre B et C (BC, BAC, BDC). Pour les sparer, il faudrait donc supprimer 3 liens. Lintrt est la mise en vidence des deux axes majeurs BC et FH. Network > Subgroups > Lambda set

25

5.2 Directed graph Dans le cas de directed graph, trois familles dequivalence sont classiquement distingus - structural equivalence : mmes relations avec les mmes acteurs - automorphic equivalence : mmes nombres din et de out-degree3 - regular equivalence : mmes types de relations avec le mme type dacteurs.

Les paramtres spcifis par dfaut sont souvent corrects mais il est peut tre ncessaire de les modifier en fonction de ses besoins, notamment lorsque le logiciel propose par dfaut un nombre donn de classes. Pour comprendre le fonctionnement et surtout les diffrences entre les mthodes (et elles sont nombreuses), le plus simple est : - de lire la rubrique daide correspondante - de lancer une analyse et de regarder les fichiers en sortie - mais surtout de garder ces rsultats et de dessiner les partitions effectues tape par tape. Les deux exemples ci-dessous concernent le graphe GR1 quil convient de dcrire.

On distingue au moins 4 types de nuds. A et B changent entre eux et envoient deux liens chacun. C et D ne font quenvoyer. EFGH reoivent et envoient mais H reoit beaucoup plus. Enfin IJKL ne font que recevoir un lien.

STRUCTURAL EQUIVALENCE Deux mthodes sont disponibles dans Ucinet, CONCOR et Optimization.

Pour plus de dtails, voir Wasserman et Faust pp.469-473

26

CONCOR est un algorithme itratif utilisant la corrlation4. Chaque tape donne une partition en deux sous ensembles. De laveu des spcialistes, les proprits mathmatiques de lalgorithme restent obscures, mais il est cens donner de bons rsultats. Attention, les seules structures susceptibles dapparatre sont des multiples de 2. Une structure du type centre / priphrie intgre / priphrie dlaisse ne peut donc pas tre mise en vidence par cette mthode. La commande Network > Roles and Positions > Structural > CONCOR donne les rsultats suivants (tous les paramtres proposs par dfaut ont t gards)

Cette mthode, comme les suivantes, donne des rsultats sous la forme dune matrice dont lordre a t modifi. Les permutations de lignes et de colonnes visent mettre en vidence les blocs rvls par lanalyse. Le passage de 12 nuds 7 sous ensembles permet de simplifier limage donne par le graphe.

La matrice de densit fournit le nombre de liens raliss sur le nombre de liens possibles entre les groupes forms. Que la diagonale soit tantt vide, tantt pleine de zro est une des nigmes dUcinet. Dernier lment fourni, un dendogramme qui permet parfois de comprendre certains dtails de la partition. Cette mthode est prsente ici car il sagit dune mthode classique, mais lexprience montre que les partitions obtenues sont souvent peu pertinentes. Le choix de la mthode Optimization suppose de rflchir au pralable au nombre de blocs dsirs ; il peut tre utile de tester diffrentes valeurs pour garder la partition la plus pertinente. Lalgorithme vise crer des groupes minimisant la variance intra-groupe.
4

Pour plus de dtails, voir Degenne et Fors pp.113-116 ou Wasserman et Faust, pp.376-381

27

Voici les rsultats obtenus avec les valeurs 2 4 2 : ABEF CDGHIJKL 3 : A BEF CDGHIJKL 4 : AB CD EFGHIJKL H 5 : A B CDIJKL - EF

AUTOMORPHIC EQUIVALENCE Dans un graphe, deux nuds prsentant une automorphic equivalence peuvent tre permuts sans modifier la structure gnrale du graphe. Les regroupements successifs joignent les pairs de nuds ayant la mme distance avec tous les autres nuds du graphe. Dit plus simplement, il sagit de regrouper les nuds qui ont le mme nombre din et de out degree. Dans le graphe GR1, si C et D prennent la place lun de lautre, rien nest modifi. Les deux mthodes disponibles dans Ucinet donnent les rsultats suivants MaxSim (Network > Roles and Positions > Automorphic > MaxSim)

La position originale de H est souligne, tout comme la particularit de L (un seul in degree mais venant de H qui en a 3)

La deuxime mthode est la suivante ; All permutations (Network > Roles and Positions > Automorphic > All permutations)

Deux commentaires personnels sur cette mthode: 28

- elle prend un temps fou - elle produit une division tellement fine quelle perd tout intrt ( quoi bon crer 9 groupes partir de 12 nuds ?).

REGULAR EQUIVALENCE Ces mthodes permettent de crer des groupes dont les structures relationnelles densemble sont quivalentes. Certaines fonctionnent avec des matrices values, et donnent des rsultats interprtables, mme avec des carts de valeur de 1 1000. Une seule mthode est prsente ici REGE Network > Roles and Positions > Maximal Regular > REGE Voici les rsultats obtenus avec le graphe GR1

Quand vous analysez de grands graphes, les dendogrammes sont rapidement illisibles. Avant de les enregistrer dans le format dsir, faites varier les valeurs des x et des y pour obtenir un rsultat lisible. Il arrive, mme sur un ordinateur aussi rcent que puissant, quUcinet mouline longtemps. Le mieux faire dans ces cas l est de ne surtout toucher rien. Parfois, un rsultat finit par apparaitre au bout de 5 10 minutes. Sinon un Esc fera laffaire. Cela est relativement frquent avec des matrices lourdes et values (ce qui parait logique). Dernier point sur les mthodes de partition : dautres mthodes de partition (souvent voisines) existent, et il est trs souvent possible de modifier les paramtres par dfaut. La procdure la plus prudente consiste : 29

examiner attentivement le graphe choisir des mthodes en fonction des particularits du graphe (binary ou valued, directed ou non)

lire la documentation accessible via la touche F1 observer graphiquement les rsultats de la partition tape par tape. Mais pour ce dernier aspect, il faut lire le chapitre 6

6. La reprsentation des rsultats


La grande force de Netdraw est sa simplicit dutilisation. Le graphe utilis pour ce chapitre est le graphe orient et valu suivant (GR3)

Avant de jouer avec, un mot des icnes non encore explores.

De gauche droite G, PC, MDS modifient laspect du graphe en fonction de proprits mathmatiques. Eclair et Eclair = permettent de repositionner les diffrents nuds. Iso supprime les nuds isols Pen supprime les nuds qui ont un seul lien (degree 1). Cela sert explorer graphiquement les graphes touffus pour dceler les nuds principaux. Self supprime les self-tie (lien dun nud vers lui-mme) MC ne garde que les composants principaux du graphe Ego permet de montrer lego-network dun ou plusieurs nuds ~Node permet de supprimer certains nuds ~Tie permet de supprimer certains liens 30

Grille de couleurs permet de colorer les nuds en fonction de proprits (attributes) Formes permet de modifier les formes en fonction dattributs Kim Bill permet de slectionner ltiquette des nuds

La plupart des ces fonctions sont accessibles via les menus droulants. La barre doutils situ sur la droite est trs utile. Les deux onglets sont les suivants

Ces deux onglets permettent de modifier soit les relations, soit les nuds. Une fonctionnalit intressante est quil est possible douvrir, en plus du fichier principal, un fichier attribute (File > Open > Ucinet dataset > Attribute data). La seule condition est que les nuds soient intituls de la mme faon un message derreur apparatra si ce nest pas le cas. Il est possible galement douvrir un fichier coordinates donnant des positions en x,y pour chaque nud. Jai utilis lalgorithme REGE sous Ucinet et nomm le fichier de sortie REGE_GR3. Jouvre le fichier GR3 dans Netdraw (Ucinet dataset > Network) puis le fichier REGE_GR3 (Ucinet dataset > Attributes data) 31

A laide de longlet ID, je peux choisir le niveau de la partition reprsenter pour mieux comprendre les diffrentes tapes (il est possible galement de passer par le menu droulant Properties > Nodes > Symbols> Color > Attribute based). Il est thoriquement possible de transmettre une information avec la taille du nud, une seconde avec la forme, une troisime avec la couleur et la clart du graphe sera compromise. Les graphes ci-dessous montrent les tapes de la partition due lalgorithme REGE. La couleur des nuds varie en fonction du groupe dappartenance. Lpaisseur des lignes varie en fonction de lintensit du lien.

Figure 12 : Les quatre premires tapes de REGE sur le graphe GR1 (de gauche droite et de haut en bas)

A ltape 4, jai calcul les mesures de centralit (Analysis > centrality, directed versions), dcoch longlet color dans longlet nodes situ gauche, coch longlet size puis, dans le menu droulant de longlet, choisi in-degree. Le rsultat est le suivant.

32

Attention, chaque fois que vous modifiez un graphe (ajout ou suppression de liens ou de nuds), les indicateurs doivent tre recalculs.

En guise de conclusion provisoire


Ucinet et Netdraw sont dexcellents logiciels proposant de trs nombreuses mthodes danalyse. Il convient cependant de souligner un inconvnient ; ils ne permettent de traiter que de petites matrices (256*256). Or, pour quelquun travaillant sur des rseaux de villes par exemple, cette limite sera vite dpasse. Il deviendra dans ce cas ncessaire de se former des logiciels permettant de traiter ces grosses matrices (Pajek ou Tulip par exemple).

Reste que pour se former lanalyse des rseaux sociaux, ces deux logiciels sont tout fait indiqus.

Comme indiqu page 1, vos remarques sont bienvenues. La version amliore et augmente prvue pour lautomne 2010 intgrera les lments danalyse pour les types de graphes non abords ici (signed , complexe et multigraph).

33

Elments de bibliographie
La bibliographie sur le sujet est abondante. Toute personne dsireuse dapprofondir tel ou tel aspect trouvera dans les ouvrages indiqus les indications complmentaires. Il existe un bon mode demploi pour Ucinet en anglais tlchargeable ladresse suivante (http://faculty.ucr.edu/~hanneman/). Le logiciel a volu depuis et il faut fouiller un peu pour retrouver certaines commandes, mais il peut utilement complter ce livret. Les non anglophones trouveront une introduction solide dans le Degenne et Fors (notamment aux chapitres 3,4 et 6). Le classique de Wassermann et Faust commence dater et une dition actualise serait ncessaire, mais il reste mon avis louvrage le plus complet et le plus clair sur le sujet. Parcourir la revue Social networks est un bon moyen de connatre les pistes de recherche actuellement explores, notamment en ce qui concerne lanalyse des graphes valus et des multigraphes. Les travaux de L. Freeman sont tous disponibles sur son site Internet ladresse suivante (http://moreno.ss.uci.edu/pubs.html), ceux concernant la reprsentation des rsultats sont particulirement intressants.

DEGENNE A., FORSE M., 1994, Les rseaux sociaux, Paris, Armand Colin, collection U sociologie . HANNEMAN R., RIDDLE M., 2005, Introduction to social network methods, Riverside, CA, University of California, Riverside WASSERMAN S., FAUST K., 1994, Social Network Analysis. Methods and applications, Cambridge, Cambridge University Press, coll. Structural analysis in the social sciences. Les sites suivants sont riches en documentation diverse et varie, tant sur les mthodes que sur les logiciels disponibles http://www.insna.org/ http://supernet.som.umass.edu/ (la homepage est atroce, mais le site riche)

34

Annexe I : Petit lexique anglo-franais

Ce lexique dfinit brivement les termes utiliss dans Ucinet, Netdraw et dans les pages prcdentes. La traduction propose dans le manuel de Degenne et Fors est indique en italiques et entre parenthses. Adjacent : un nud est dit adjacent un autre lorsquil lui est reli par un lien Automorphic equivalence (quivalence forte ou automorphique) : deux nuds partagent une automorphic equivalence sils possdent le mme nombre din et de out degree. Clique (clique) : sous graphe complet de 3 nuds minimum Complete [graph] (graphe complet) : graphe o tous les liens possibles entre les nuds sont prsents. Sa densit est donc gale 1. Connected [graph] (graphe connexe) : dsigne un graphe o tous les nuds sont accessibles. Component (composants): parties du graphe non connectes les unes aux autres. Dans un connected graph, le nombre de component est 1. Cutpoint (point darticulation) : nuds du graphe qui, sils taient supprims, creraient des components Degree (degr): nombre de liens adjacent un nud. Dans le cas de directed graph, on distingue les in (demi-degree intrieur) et les out degree (demi-degr extrieur). Density (densit): nombre de liens rels divis par le nombre de liens thorique. Diameter : le diamtre dun graphe est la plus courte distance entre les deux points les plus loigns dun graphe connect Directed [graph] (graphe orient): graphe dont le sens de la relation importe (AB nest pas obligatoirement gal BA). La matrice correspondante est asymtrique. Ego-network (rseau personnel): un ego-network est constitu par un nud, les nuds qui lui sont adjacents ,et les liens existants entre ces derniers. Geodesic distance (distance godsique): distance la plus courte, mesure en nombre de liens, entre deux nuds. Graph (graphe): quivalent de network. Au sens strict, un graphe dsigne un ensemble de points et de liens dont on tudie les proprits mathmatiques. Ds que des informations sont ajoutes (ex. nom des nuds), on parle de rseau. Isolate (isol): nud qui nest adjacent avec aucun autre nud. Loop = self-tie (boucle): lien dun nud vers lui-mme. 35

Multigraph (multigraphe) : graphe reprsentant simultanment plusieurs types de liens entre les nuds. Network (rseau): ensemble de nuds et de lignes portant des informations. Node (sommet): synonyme dactors, traduit ici par nud. One-mode [network]: graphe qui comporte une seule catgorie dacteurs, donc dans lequel potentiellement nimporte quel acteur peut tre reli nimporte quel autre. Reciprocal tie : dans un graphe orient, signifie que les liens AB et BA sont prsents. Regular equivalence (quivalence rgulire) : deux nuds prsentent une regular equivalence sils partagent le mme type de liens avec le mme type de nuds. Self-tie : voir loop Signed [network] (graphe sign): les liens entre nuds peuvent prendre 3 modalits (-/0/+). Ils peuvent traduire des sentiments (napprcie pas/sans opinion/ apprcie) soit des soldes (dficit/pas de relation/excdent). Simple [network] : graphe qui reprsente un seul type de liens entre les acteurs et qui ne comprend pas de liens dun nud vers lui-mme. Size (ordre): la taille du graphe correspond au nombre de nuds quil contient Structural equivalence (quivalence structurale): deux nuds sont structurellement quivalents sils ont exactement les mmes relations avec les mmes acteurs ; Tie (liaison): lien entre deux nuds. Traduit ici par lien, relation. On distingue gnralement les arcs (liens orients - arcs) et les edges (liens non orients - artes) Two-modes [network] (matrice acteurs-vnements): graphe qui comporte deux catgorie dacteurs (ex. relations entre un groupe denseignants et un groupe dlves) ou une catgorie dacteurs et une catgorie dvnements (ex. un groupe de chercheurs, un groupe de revue scientifiques). Un nud appartenant une catgorie ne peut tre reli qu un nud appartenant lautre catgorie. Valued [network] (graphe valu): graphe o lintensit de la relation importe (ex. matrice de flux commerciaux entre pays)

36

Table des figures

Figure 1 : Lancer lalgorithme CONCOR .................................................................................. 3 Figure 2 : Page daccueil dUcinet ............................................................................................. 4 Figure 3 : Page daccueil de Netdraw ........................................................................................ 4 Figure 4 : Menu File, Data et Transform ................................................................................... 6 Figure 5 : Menu Tools ................................................................................................................ 7 Figure 6 : Menu Network ........................................................................................................... 7 Figure 7 : Directed binary matrix and graph (GR1) ................................................................. 10 Figure 8 : Undirected binary matrix and graph (GR2) ............................................................. 10 Figure 9: Directed valued matrix and graph (GR3) ................................................................. 10 Figure 10: Star network and circle graph ................................................................................. 16 Figure 11: Line network and complete network ...................................................................... 16 Figure 12 : Les quatre premires tapes de REGE sur le graphe GR1 (de gauche droite et de haut en bas)............................................................................................................................... 32

37

Table des matires

1. Prsentation des logiciels ....................................................................................................... 2 2. Les interfaces .......................................................................................................................... 4 3. Questions de vocabulaire........................................................................................................ 9 4. Premiers pas, premires mesures ......................................................................................... 11 5. A la recherche des structures ................................................................................................ 19 5.1 Non directed graph ..................................................................................................... 19 5.2 Directed graph ............................................................................................................ 26 6. La reprsentation des rsultats ............................................................................................. 30 En guise de conclusion provisoire ............................................................................................ 33 Elments de bibliographie ........................................................................................................ 34 Annexe I : Petit lexique anglo-franais .................................................................................... 35 Table des figures ...................................................................................................................... 37 Table des matires .................................................................................................................... 38

38