78

Trucs et astuces pour étudier les réseaux sociaux avec Gephi

Les trois tutoriaux que nous avons réalisés avaient pour but de vous permettre de prendre en main Gephi pour analyser les réseaux sociaux, et de vous y retrouver dans ses nombreux paramétrages. Il existe néanmoins certaines subtilités que l’on ne va pas forcément prendre en compte, mais qui ont leur importance.

Voici donc quelques trucs et astuces que nous vous proposons pour améliorer vos cartes et vos analyses. N’hésitez pas à proposer les vôtres !

L’exemple prit ici est celui de l’analyse de 3266 tweets correspondant à des mentions ou des retweets contenant le hashtag #PDFFrance – utilisé durant la conférence Personal democracy France qui a eu lieu le 14 juin 2014 au CNAM.

Les variations possibles de l’analyse de modularité

Par défaut, on a tendance à analyser un corpus de tweets en utilisant le paramètre de « degrés » pour classer les nœuds (les comptes twitter). C’est en effet le paramètre proposé dans le tutoriel de Gephi qui prend l’exemple des relations entre les personnages du roman Les Misérables. Le degré matérialise l’existence ou non d’un lien entre un nœud et un autre. Dans l’analyse des réseaux sociaux, il est décomposé en degré « sortant » pour indiquer les mentions effectuées par un compte, et degré « entrant » pour indiquer quand un compte est mentionné par un autre. Cela nous donne cette carto en choisissant dans le filtre les 50 comptes ayant la valeur de degré la plus importante :

01_pdffrance_carte_degresLes couleurs correspondent au classement par modularité vu dans les précédents tutoriels, qui donne une valeur de 0,335 pour 22 communautés. Néanmoins, il peut être intéressant d’effectuer plusieurs fois le calcul de modularité. En dehors du fait qu’en choisissant une valeur inférieure ou supérieure à 1 pour la résolution, le nombre de communautés va changer, sans changer cette valeur il peut y avoir des changements minimes.

Cela est dû au fait que l’algorithme de détection des communautés n’est pas parfait : il se base sur un calcul de proximités entre les nœuds, donc le classement peut varier légèrement. En faisant trois tests, la valeur de modularité passe à 0,331, détectant 24 communautés. Les résultats changent donc légèrement :

02_pdffrance_carte_degres_modularitee-changeePrendre en compte ou non le « poids » des liens (mentions et RT)

Mais le paramètre de « degré » ne prend pas en compte les mentions multiples d’un compte par un autre. Si le compte @atuche mentionne 12 fois le compte @axellelemaire, le paramètre degré le comptabilisera comme un seul lien.

On peut ainsi utiliser le paramètre statistique « degré pondéré » pour prendre en compte les mentions et RT multiples :

03__pdffrance_Parametres_degres_pondereUne fois le calcul effectué, on pourra sélectionner la valeur « Weighted Degree » pour classer les nœuds, et effectuer un filtrage de la carte en fonction de ce résultat. Il ne faut pas oublier également pour éviter de devoir séparer à la main les nœuds de modifier l’échelle de spatialisation dans l’algorithme Force Atlas 2.

04__pdffrance_Parametres_degresOn obtient ainsi une nouvelle carte :

05_pdffrance_carte_poids

Faire le choix entre « Weighted Degree », « Weighted In-Degree » and « Weighted Out-Degree »

Ici, nous avons fait le choix de calculer le poids global des mentions. Gephi permet néanmoins de faire une analyse plus fine, et de montrer soit :

– Le poids des mentions et RT faits par un compte, c’est-à-dire le « Weighted Out-Degree » dans le classement des nœuds :

06_pdffrance_carte_poids_sortant

–          Le poids des mentions et RT qui citent un compte, c’est-à-dire le « Weighted In-Degree » dans le classement des nœuds :

07_pdffrance_carte_poids_entrants

Moduler les paramètres d’aperçu

Il est important également de faire attention aux paramètres choisis pour visualiser la cartographie. La taille de police des labels de nœuds définie clairement la visibilité ou non des résultats finaux :

08_pdffrance_parametres_apercuOn constatera que sur les grosses cartographies, choisir une taille des labels proportionnelle est rarement une bonne idée.

09_pdffrance_parametres_apercu_labelsAuteur : Guillaume Sylvestre, consultant à l’ADIT

Etudiant

Les commentaires sont fermés.