Twitter Archives - Master Intelligence Economique et Stratégies Compétitives Le Master Intelligence Economique qui combine analyse économique, outils de veille, e-réputation, gestion de crise et big data via une formation sur deux ans. Wed, 13 Jan 2021 09:25:53 +0000 fr-FR hourly 1 Attention aux biais des données des médias sociaux : ce n’est pas sur Twitter qu’il faut chercher les français réfractaires à la vaccination https://master-iesc-angers.com/attention-aux-biais-des-donnees-des-medias-sociaux-ce-nest-pas-sur-twitter-quil-faut-chercher-les-francais-refractaires-a-la-vaccination/ Wed, 13 Jan 2021 09:25:53 +0000 https://master-iesc-angers.com/?p=3341 Mettre en perspective les données analysées pour en comprendre les limites Une tribune publiée le 11 janvier par des communicants dans le Monde, permettant de présenter leur outil d’analyse des données de Twitter, conteste le fait largement répandu dans les… Continuer la lecture

L’article Attention aux biais des données des médias sociaux : ce n’est pas sur Twitter qu’il faut chercher les français réfractaires à la vaccination est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Mettre en perspective les données analysées pour en comprendre les limites

Une tribune publiée le 11 janvier par des communicants dans le Monde, permettant de présenter leur outil d’analyse des données de Twitter, conteste le fait largement répandu dans les médias que la majorité des français seraient rétifs à la vaccination.

Le propos est intéressant, en revenant sur la façon dont les sondages sur le sujet sont mal présentés, et en rappelant qu’un fort volume de mentions sur Twitter ne signifie pas une capacité à toucher plusieurs communautés. En étant repris uniquement par son réseau, on ne convainc pas grand monde au final. C’est de plus en plus le cas sur les différents RS, de Facebook à Twitter en passant par Linkedin, dont les algorithmes favorisent la communication auprès de son réseau d’abonnés. Seule la polémique peut facilement faire le buzz, mais c’est un autre sujet

C’est par exemple ce qui s’était passé sur la fameuse fausse information du #Pactedemarrakech : plus de 200 000 tweets en décembre 2018, mais qui n’ont dépassé que très marginalement les communautés de droite et d’extrême droite comme on le voit sur cette cartographie des comptes Twitter qui ont repris le sujet : une forte caisse de résonnance, mais qui ne se diffuse pas en dehors de ces réseaux.

 

Twitter n’est pas le miroir de la société française, mais un outil d’influence auprès des médias et des politiques

Les auteurs de la tribune enfoncent le clou en étudiant via leur outil les mentions des vaccins sur Twitter : 2,9 % des “français” indiqueraient y être opposés, ce qui semble très faible en effet. Mais, justement, est-ce que les anti-vaccins sont sur Twitter ? C’est  un outil d’influence, pour toucher politiques et journalistes, mais une très faible partie de la population y est présente. Les twittos réellement actifs sont peu nombreux. Selon les données médiamétrie d’août 2020, il y avait un peu moins de 17 millions d’utilisateurs Twitter en France, dont moins de 4,5 millions actifs quotidiennement.

Twitter donne par ailleurs une fausse impression d’une capacité forte à toucher un public large, via les fameuses « impressions », qui correspondent au total des abonnés des comptes Twitter ayant diffusé un sujet. Celui-ci devient vite très élevé, à plusieurs dizaines de millions, voir plus ( !) pour un sujet français, dès lors que les médias le reprennent : leurs abonnés se recoupent, mais ils sont additionnés … et évidemment, tous les abonnés ne voient pas les tweets émis par les comptes qu’ils suivent ! Un bon exemple via ce corpus de tweet récoltés via la plateforme de veille Visibrain au début du mouvement des gilets jaunes, qui indique 543 millions d’impressions pour un sujet très français …

Justement, en regardant uniquement Twitter, on ne voyait pas le mouvement des Gilets Jaunes se structurer : c’est via Facebook qu’il s’est lancé, à travers des groupes, privés ou publics, locaux, difficiles à identifier avec des outils de veille. Il est en effet très complexe de collecter l’information sur ce réseau social : Facebook sait tout de ses utilisateurs, mais ne revend pas leurs données brutes : il s’en sert pour proposer des publicités ciblées. La recherche d’information y prend donc du temps et sera toujours très partielle, sans compter le fait que nombre de groupes sont privés.

Il est donc illusoire de considérer que via des outils automatisés, on pourra « scruter dans leurs moindres détails les expressions spontanées des Français ». C’est un travail qualitatif précis qu’il faudra effectuer, selon les sujets, en croisant les données de différents médias sociaux et en prenant en compte les biais liés aux données manquantes et aux spécificités du sujet étudié.

Il y a peu d’opération d’influence liés à la santé sur Twitter en France

Sur la santé, si on a observé une réelle guerre d’influence sur Twitter en 2020 concernant l’usage de la chloroquine et le soutien ou non au docteur Raoult l’an dernier, cela est notamment dû à la participation de politiques très actifs comme Christian Estrosi ou de démarches d’influence comme « No Fake Science ». Le bad buzz dont Sanofi a été victime après que Bloomberg ait rapporté – hors interview – des propos du PDG indiquant que le vaccin contre la Covid serait réservé en priorité aux USA a ainsi été éphémère.

En effet, les scandales / affaires de santé ont très peu fait le buzz sur Twitter ces dernières années. Qu’il s’agisse du chlordécone ou de la Dépakine, en dehors de quelques mentions ponctuelles liées à des manifestations ou publications, voir au soutien de certains politiques, il n’y a pas eu de réelle visibilité de ces sujets sur les réseaux sociaux. Contrairement aux problématiques environnementales, il y a peu d’ONG ou de militants spécifiques aux enjeux de santé, notamment puisque l’accès y est universel. Les controverses sur les problèmes liés à certains traitements ne toucheront que les personnes concernées, qui sont peu présentes sur Twitter.

Cela pour une raison simple : les patients français communiquent, notamment sur les effets secondaires éventuels de leur traitement, principalement via Facebook, sur lequel il existe de multiples groupes privés consacrés à ce sujet. Les médecins et personnels de santé sont également peu présents et actifs sur Twitter. Seuls les laboratoires pharmaceutiques vont communiquer sur Twitter. Il y aura évidemment des propagateurs de fausses informations sur les vaccins, mais ceux-ci seront peu repris fautes de communautés intéressées par leurs tweets.

Exploiter les informations issues des médias sociaux pour des effectuer analyses qualifiées et identifier les problématiques à adresser

Les données quantitatives sont une chose, mais il faut aussi regarder dans le détail qui dit quoi. Considérer à partir des seules expressions sur Twitter que seuls des complotistes ou propagateurs de fausses informations seraient opposés aux vaccins est une erreur. S’appuyer sur ces seules données pour indiquer qu’il n’y a pas de réticence à la vaccination en France est un raccourci un peu rapide.

J’avais étudié en 2015 les communautés anti-vaccins présentes aux Etats-Unis sur Twitter, où celles-ci sont très actives depuis de nombreuses années. Il n’y a jamais réellement eu de tentative de l’industrie pharmaceutique ou des autorités pour contrebalancer cette influence, permettant à ces communautés de se développer. On pouvait distinguer trois catégories, connectées entre elles :

  • Les complotistes convaincus que les vaccins ne servent à rien, ou alors à injecter des puces 5G (on avait donc quelques années pour déminer le sujet …), très actifs pour essayer de convaincre d’autres communautés ;

  • Les défenseurs de produits naturels ou « bio », opposés aux vaccins notamment du fait de la présence des « adjuvants » qui en facilitent la prise (notamment l’aluminium) ;

  • Enfin, des personnes (souvent des parents) inquiets des effets secondaires des vaccins, et qui ne trouvent pas ou peu d’information auprès des autorités sanitaires.

Le risque en laissant la parole complotiste se propager, c’est de renforcer les doutes de cette dernière communauté, sur le principe du « il n’y a pas de fumée sans feu ». Au vu des ratés du début de la campagne en France, et du fait qu’une partie de la population ne se considère pas réellement en danger avec la Covid, il y a un risque réel que trop peu de personnes se vaccinent volontairement. Il faut rassurer sur tous les aspects, notamment les effets secondaires, en garantissant une prise en charge en cas de problème.

Un petit sondage sur une population très spécifique pour finir, celle de Time To Sign Off, newsletter quotidienne destinée à une population de cadres / cadres supérieurs a priori plutôt ouverte au consensus scientifique, au vu de sa ligne éditoriale. Sur 3800 répondants à un sondage de TTSO concernant le vaccin contre la Covid proposé le 8 décembre dernier, 27 % ont ainsi indiqué ne pas vouloir se faire vacciner, et 25 % accepteront le vaccin ARN si toutes les garanties sur son innocuité sont apportées.

Bref, il reste du monde à convaincre pour atteindre l’immunité collective !

L’article Attention aux biais des données des médias sociaux : ce n’est pas sur Twitter qu’il faut chercher les français réfractaires à la vaccination est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Twitter : Tout ce qui se dit sur les opérateurs téléphoniques https://master-iesc-angers.com/twitter-tout-ce-qui-se-dit-sur-les-operateurs-telephoniques/ Fri, 13 Apr 2018 14:44:40 +0000 https://master-iesc-angers.com/?p=2749 La fouille d’opinions dans les réseaux sociaux, en particulier sur Twitter qui est un excellent substitut, permet l’analyse des réactions des internautes ainsi que l’identification des leaders des opinons dans un domaine donné. Cette opération est moins coûteuse que les… Continuer la lecture

L’article Twitter : Tout ce qui se dit sur les opérateurs téléphoniques est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
La fouille d’opinions dans les réseaux sociaux, en particulier sur Twitter qui est un excellent substitut, permet l’analyse des réactions des internautes ainsi que l’identification des leaders des opinons dans un domaine donné. Cette opération est moins coûteuse que les enquêtes d’opinions.

En effet Twitter est un outil de microblogage permettant à toute personne voulant partager une idée, de communiquer via un message limité à 280 caractères. Les utilisateurs avec un nom d’utilisateur (@) peuvent interagir entre eux tout en identifiant le mot clé de leurs discussions avec un Hashtag (#).

La téléphonie est un des secteurs les plus sensibles à la critique, cela est dû à la démocratisation des Smartphones, les utilisateurs n’hésitent plus à exprimer publiquement leur opinion sur tout opérateur téléphonique. Cependant, Twitter est le premier réseau social qui regorge de toutes sortes d’opinions.

En France, il existe principalement quatre opérateurs, à savoir : Bouygues Telecom, Free, SFR et Orange.

Sur l’infographie, on remarque qu’Orange est l’opérateur mobile qui est le plus déployé en nombres d’abonnés (followers) qui atteignent les 170 mille. Cependant il reste peu actif : 34.1 mille tweets, en comparaison avec Bouygues qui dépasse les 500 mille tweets. SFR et Free donnent moins d’importance à twitter avec seulement 44k et 22k tweets.

Pourquoi opter pour Twitter comme plateforme d’analyse de sentiments adéquate ;

  • Les textes sur lesquels on travaille sont courts et presque de taille équivalente ;
  • Les textes sont plus focalisés sur un sujet ou un aspect bien déterminé : identifiables à l’aide d’un # ou d’une mention @ ;
  • Les internautes sont identifiables à l’aide de @, même si Twitter reste une plateforme où l’anonymat est répandu ;
  • Les textes sont à jour, et la réactivité des internautes est dynamique : La détection des tendances par rapport à un sujet devient plus facile.

I. Mise en contexte :

Les utilisateurs partagent leurs opinions en temps réel sur différents sujets à propos des opérateurs téléphoniques, en exposant leur satisfaction sur un produit donné ou en se plaignant des différents problèmes rencontrés.

Par ailleurs, les opérateurs téléphoniques peuvent utiliser ainsi les tweets pour collecter les opinions de leurs utilisateurs et avoir un sentiment général sur leurs produits.

Différentes actions sont possibles sur twitter :

  • Liker : cela veut dire que le texte vous plait et que vous avez envie de l’archiver pour une consultation antérieure.
  • Retweeter (RT) : le texte est intéressant et vous voulez le partager avec vos abonnés. Ce partage permet la visibilité du tweet sur votre profil mais avec un nom d’utilisateur différent.
  • Citer : permet de partager le tweet tout en ajoutant votre propre avis, commentaire, opinion à propos de l’information contenue dans le tweet.

L’API twitter

Twitter met à notre disposition des API (interface de programmation) qui permettent d’accéder par programme aux tweets et de réaliser ce qu’on appelle du data mining. Les perspectives sont nombreuses. Elles vont des statistiques descriptives simples (ex. quels sont les auteurs les plus actifs, quels sont les messages les plus retweetés, etc.) à des investigations plus sophistiquées (ex. quels sont les thèmes émergents, des communautés se sont-elles formées, etc.). Ainsi, les tweets se prêtent à de multiples explorations.

Pour chaque Tweet collecté on a :

 – des attributs qui concernent le tweet lui-même : Le contenu (du texte) – Les hashtags s’ils existent- La date de la publication.

des attributs qui concernent la position géographique : Pays

des attributs qui concernent le profil d’utilisateur : Le pseudonyme – Le nom d’utilisateur et l’identifiant.

R comme outil pour le datamining

Dans cet article, nous montrons comment accéder à des tweets principalement liés au thème choisi : les opérateurs téléphoniques français. Nous initierons une étude relativement basique des propriétés des tweets dans un premier temps. Nous enchaînerons ensuite sur l’exploitation du contenu des messages. Nous travaillerons sous R en nous appuyant sur le package “twitteR” de Jeff Gentry qui se révèle particulièrement pratique.

II. Extraction des tweets

La fonction searchTwitter() permet de chercher des tweets en ligne. Plusieurs paramètres sont disponibles. Dans notre exemple ci-dessous, nous spécifions le mot clé qui permettra de les sélectionner, nous limitons le nombre de messages extraits à n = 5000, nous nous intéressons aux documents en langue française (lang).

Le hashtag est devenu le filtre indispensable pour trier l’information qui se déverse des robinets sociaux. Le choix du bon hashtag est essentiel pour augmenter ses chances d’être lu. Bien le choisir est une étape essentielle.

Cependant, pour avoir les bons mots clé nous avons eu recours au site Hashtagify. Ce dernier est une véritable encyclopédie du Hashtag et un outil qui permet de trouver les meilleurs hashtags.

Il est très important de noter que nous ne savons  pas comment choisir les n=5000 tweets précisés précédemment. Et pour plus de précision, l’extraction a été lancée le 22 décembre 2017.

Après l’extraction se fait le stockage des tweets dans une structure data.frame. Puisque nous disposons d’une liste, les traitements sont encore plus facilités lorsque nous passons par une structure data.frame via la commande twListToDF(). Nous disposons ainsi d’un tableau rectangulaire avec n= 5000 lignes (tweets) et p = 16 colonnes.

III. Quelques statistiques descriptives

  1. Analyse des auteurs

Une fois la data.frame en main, il est facile d’établir la liste des 10 auteurs les plus prolifiques avec le nombre de messages envoyés. Mais il peut être biaisé par le fait que certains messages sont en réalité de simples retweets. Ainsi un nettoyage s’impose.

Dans la suite de l’article, les scripts ne seront appliqués que sur Bouygues Telecom. Une procédure qui peut être faite aussi pour les trois autres opérateurs téléphoniques : de la même manière en suivant les mêmes étapes.

2.Top des tweets : analyse de la popularité

Les internautes retweetent les messages lorsqu’ils ont en apprécié la teneur. Parmi les messages qui sont des retweets, nous essayerons d’isoler le message qui est le plus populaire. Mais avant de les extraire il est important d’éliminer les messages en doublon. Nous nous servons de la fonction duplicated() qui permet de les identifier.

Le script appliqué sur Bouygues remonte les deux tweets les plus retweetés, concernant Bouygues Telecom.

IV. Analyse du contenu du tweet

Avant d’analyser les thèmes, il est nécessaire de procéder à un nettoyage des lignes de la table, à savoir :

Le caractère “#” joue un rôle particulier sur Twitter. Il permet de désigner un hashtag, un sujet relatif au message que l’on rédige ou en relation avec nos préoccupations. Plusieurs hashtags peuvent donc apparaître dans un même message. Nous recensons l’ensemble des thèmes cités sous forme de hashtag dans l’ensemble de nos tweets.

Nous affichons les thèmes sous forme de wordcloud :

Conclusion

L’étude des tweets est un axe fort de l’analyse des réseaux sociaux parce que Twitter est devenu un vecteur de communication important. Cet exemple montre qu’il est aisé d’initier une première analyse à partir de données extraites directement en ligne.

Lorsqu’il s’agit d’aller dans le détail, explorer en profondeur les informations que recèlent les messages, l’affaire est tout autre. La phase de préparation des données prend une grande importance. De la rigueur dont nous faisons preuve dans cette étape dépendra la crédibilité des résultats que nous produirons.

Par Ghita Tagnaouti et Sara Lgana, promotion 2017-2018 du M2 IESCI

Bibliographie et webographie

L’article Twitter : Tout ce qui se dit sur les opérateurs téléphoniques est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Désormais notre avis compte : Opinion mining et sentiment analysis https://master-iesc-angers.com/desormais-notre-avis-compte-opinion-mining-et-sentiment-analysis/ Tue, 05 Dec 2017 12:30:59 +0000 http://master-iesc-angers.com/?p=2469 Aujourd’hui, Nous rencontrons de plus en plus de services dits « gratuit » sur le web. Mais une chose est sûre : si c’est gratuit, alors c’est nous le produit ! Un simple like, un commentaire, une indication de géolocalisation, un intérêt pour un… Continuer la lecture

L’article Désormais notre avis compte : Opinion mining et sentiment analysis est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Aujourd’hui, Nous rencontrons de plus en plus de services dits « gratuit » sur le web. Mais une chose est sûre : si c’est gratuit, alors c’est nous le produit !

Un simple like, un commentaire, une indication de géolocalisation, un intérêt pour un événement, une réaction à un post…  Toutes ces informations aussi futiles qu’elles soient représentent une vraie mine d’or pour les intéressés : les data analystes. Cette multitude de données non structurées que les internautes produisent chaque seconde sur la toile, sont ce qu’on appelle les « BIG Data ».

Nous émettons chaque jour, de notre plein gré, des informations qui documentent chacune de nos activités, centres d’intérêt, sentiments, préférences, etc. Celles-ci représentent les matières premières du travail des géants d’internet et leur principale source de pouvoir.

En France, un bracelet connecté fournissant des informations à propos du nombre de calories brulées, du rythme cardiaque, du taux d’oxygène dans le sang… d’un assuré peut lui conférer des réductions auprès de son agence d’assurance. Celle-ci exploite toutes les informations disponibles sur le mode de vie de ses clients afin de les fidéliser et d’augmenter son ROI par la même occasion. « Un assuré en bonne santé est un assureur comblé ».

A Hong Kong, pour donner des crédits, les banques consomment sans modération le flux de données en provenance de Twitter et Facebook des clients afin de bien étudier leur dossiers et de valider leurs demandes de prêt.

Sans oublier les Etats-Unis, où les équipes de Barack Obama ont eu recours à l’analyse des données personnelles des électeurs clés : les indécis, pour analyser leur comportement et bien comprendre leur intérêts. Permettant ainsi à Obama de ressortir les arguments précis pour les faire basculer de son côté.

Une immense masse d’informations qui constitue autant de traces qui parviennent à décrire les comportements, les habitudes, d’un individu comme d’une population entière.

On a souvent dit que celui qui détient l’information, détient le pouvoir, sauf qu’ avec l’avènement du web 2.0, les données se multiplient à une vitesse exponentielle et les gens trouvent plus de liberté à s’exprimer ouvertement à travers les réseaux sociaux…

En analysant, toutes les données que l’on libère volontairement sur le web, les Big Data sont en train de redistribuer les cartes du pouvoir dans le monde. Un monde où ceux qui exploitent ces données décident de l’avenir.

I. Les réseaux sociaux : Un générateur continue d’opinions

La révolution technologique et l’internet sont conçus de la même façon que la révolution industrielle de la machine à vapeur, déterminant peu à peu la base organisationnelle de la société de l’information qui est fondée sur le réseau et les médias sociaux.

L’apparition des médias sociaux représente une phase transitoire dans le cycle de vie de l’internet. Ces médias, dans lesquels les internautes peuvent s’inscrire, créer un réseau virtuel en ajoutant des contacts et échanger avec eux des messages et des opinions en temps réel, représentent le reflet de l’évolution de l’opinion publique sur internet.

La circulation de l’information et la transmission des messages ont pris une nouvelle dimension. Actuellement, chaque information peut être diffusée sur l’ensemble des médias sociaux. La fonction « partager » est mise à disposition par les sites web, ce qui permet à l’internaute de faire circuler une information à l’ensemble de ses contacts sur ces médias en ajoutant un commentaire qui exprime son point de vue personnel.

Il existe donc un vrai phénomène de transmission et de dénaturation de l’information. Cela prouve que l’organisme est exposé au risque en temps réel sur la sphère du web.

Les médias sociaux constituent un nouvel enjeu risqué pour les organismes.

II. L’e-réputation : l’impact des médias sociaux sur la notoriété

Depuis toujours, le souci des entreprises est d’améliorer leur performance et de maintenir de l’avantage concurrentiel. Pourtant, avec la naissance du web qui permet à chacun de s’exprimer et publier son avis sur internet, les entreprises ne sont plus la seule source de pertinence de leur présence sur internet, puisque la recherche d’excellence passe par la satisfaction du client.

Jour après jour, le nombre d’utilisateurs des médias sociaux croit. Ces utilisateurs sont des dirigeants d’entreprises, des fournisseurs, des salariés, des clients, ou de simples internautes. Satisfaire ces différents goûts nécessite une veille continue pour forger une image positive.

L’usage de l’internet par les professionnels et les internautes a changé : La communication autours des marques et des produits se fait désormais sur les blogs, les forums et les réseaux sociaux. Ces discussions peuvent être une source de notoriété inopinée pour les entreprises ou faire perdre tout confiance et décrédibiliser leur réputation.

Le consommateur a pris une place importante quant aux décisions des entreprises qui n’ont plus aucun contrôle sur ses décisions d’achat ou son cercle d’influence. A cet effet les entreprises ont intérêt à consolider leur contact avec les clients, analyser leur besoins et établir le degré de satisfaction vis-à-vis un produit.

En effet les commentaires des internautes, les posts sur Facebook et Twitter et les retours d’expérience sur les forums, sont dorénavant porteurs d’autant d’informations qualitatives utiles pour les entreprises qui ne peuvent plus ignorer les échanges dont elles font l’objet.

Il est désormais important pour les entreprises, non seulement de développer leur présence sur les réseaux sociaux mais aussi de la maintenir et de l’entretenir. L’e-réputation peut valoriser ou être une mauvaise publicité de la marque. Elle peut être tout aussi valorisante que porteuse d’une mauvaise publicité.

Selon une autre étude dont les résultats ont été publiés sur le site web http://www.tribeleadr.com/  par Majorie Calvone :

Les entreprises ont compris que faire la promotion de leurs produits sur les réseaux sociaux est très important, et ceci est lié aux publications du contenu. Les réseaux sociaux sont un moyen de communication avec son entourage et rester informé.

Ils ne sont plus juste un espace en offline pour les internautes mais aussi une place d’interactions entre les internautes, un lieu pour exprimer son avis avec décontraction. Les entreprises doivent prendre en considération les mécanismes du web pour améliorer le référencement de leur marque sur internet.

III. L’opinion mining et le sentiment analysis

Le langage naturel humain a toujours été très complexe pour être analysé et interprété par une machine. Sauf que dès les années 80, des chercheurs se sont intéressés à ce domaine et les résultats de leurs travaux sont la base de toutes les recherches actuelles.

Ci-dessous, la liste des premiers chercheurs qui se sont intéressés à l’analyse de l’opinion.

Les termes anglo-saxons OPINION MINING et SENTIMENT ANALYSIS sont en fait plus ou moins synonymes et interchangeables, et on les utilise souvent indifféremment pour désigner ces technologies.

Le terme opinion mining fait référence au text mining, qui désigne les technologies d’extraction d’opinions, d’analyse, d’agrégation et d’interprétation des résultats. Le terme sentiment analysis désigne, compte à lui, les méthodes d’analyse automatique d’un texte pour en extraire et normaliser les opinions exprimées. Mais qu’est-ce qu’une opinion ?

Le professeur Bing Liu, dans « sentiment analysis and opinion mining », et le premier à définir l’opinion comme un quadruplet (o,s,a,m).

Au-delà d’une distinction positif/négatif, les opinions sont des phénomènes subjectifs dont l’analyse dépend :

  • De la situation dans laquelle s’exprime l’opinion
  • De la personne qui exprime l’opinion (ex: les tweets)

Cependant l’opinion peut être exprimée sous différentes formes, à savoir :

“Votre marque ce n’est pas ce que vous en faîtes, mais c’est ce que les réseaux sociaux en disent

IV. Etude de cas : les opérateurs téléphoniques

Vu les avantages potentiels des réseaux sociaux, les opérateurs téléphoniques français ont investi et ont créé leurs pages sur les principaux réseaux sociaux à savoir Facebook, Twitter, LinkedIn, YouTube et Google + pour s’approcher des internautes et améliorer leur image, mais est-ce que la présence sur les médias sociaux a vraiment permis de développer la e-réputation de ces opérateurs ?

La concurrence est féroce dans le secteur des télécommunications et les offres promotionnelles sont de plus en plus compétitives, c’est pour cette raison que les clients deviennent de plus en plus attentifs et exigeants en termes d’attractivité des offres et de qualité de service rendu. Nous sommes, désormais, dans un marché où la fidélisation des clients et l’innovation dans le service deviennent des facteurs clés de réussite. Pour arriver à saisir les besoins des clients, les opérateurs télécoms ont alors saisi les opportunités que leur offraient les médias sociaux.

C’est aujourd’hui l’un des challenges des Télécoms : utiliser efficacement les réseaux sociaux pour la relation client et ainsi réussir le pari d’une expérience différente et enrichissante pour le client. En effet, cette technologie a ouvert le champ à de nouvelles opportunités commerciales axées conquête et fidélisation. La question qui se pose alors aujourd’hui est comment l’opérateur téléphonique en Tunisie peut maintenir ses clients et quelles politiques doit-il appliquer pour se démarquer de ses concurrents sur ces plateformes ?

Les opinions, recommandations et les notations des internautes sur les posts Facebook ou les forums sont devenues une manière d’évaluer une marque ou un produit sur le marché. Le bouche à oreille oriente désormais les achats et le choix des internautes. De cet effet, les entreprises doivent prendre en considération les mécanismes des usages des médias sociaux.

Savoir tout ce qui se dit sur les réseaux sociaux à propos des différents opérateurs télécoms en France fera l’objet de la deuxième partie de cet article.

Par Ghita Tagnaouti et Sara Lgana, promotion 2017-2018 du M2 IESCI

Webographie et Bibliographie

1   Cadel Peggy, « Le marché de l’e-réputation. Du positionnement fonctionnel aux enjeux technologiques »Les Cahiers du numérique, 2010/4 (Vol. 6), p. 111-121. URL : https://www.cairn.info/revue-les-cahiers-du-numerique-2010-4-page-111.htm  [Consulté le 28/10/2017].

2 Bing Liu, « Sentiment Analysis and Opinion Mining»Morgan & Claypool Publishers, May 2012. URL : https://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdf  [Consulté le 01/11/2017].

Othman BEN FARHAT, « Impact des réseaux sociaux sur l’image de marque de l’entreprise : Cas Tunisie Telecom»Mastère professionnel en Optimisation et Modernisation des Entreprises MOME, Jan 2014. URL : http://pfmh.uvt.rnu.tn/833/1/Impact-reseaux-sociaux-image-marque-entreprise.pdf  [Consulté le 05/11/2017].

4  Magdalena Grębosz, « L’impact des réseaux sociaux sur les comportements des jeunes consommateurs »Ecole Polytechnique de Lodz, Pologne. [Consulté le 10/11/2017]

5 Bernard Normier, « Analyser les avis sur internet et les réseaux sociaux pour valoriser votre notoriété »vitrac éditeur, 2014.

L’article Désormais notre avis compte : Opinion mining et sentiment analysis est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Topsy : l’analyse et la recherche du web social https://master-iesc-angers.com/topsy-lanalyse-et-la-recherche-du-web-social/ https://master-iesc-angers.com/topsy-lanalyse-et-la-recherche-du-web-social/#comments Mon, 05 Jan 2015 09:40:22 +0000 http://master-iesc-angers.com/?p=838 Fondée en 2007 à San Francisco, Topsy fait partie des quatre sociétés (Gnip, NTT Data et Data Shift) partenaires de Twitter et certifiées comme revendeurs officiels de données. Ainsi, cette dernière a accès à un grand nombre de données de… Continuer la lecture

L’article Topsy : l’analyse et la recherche du web social est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Fondée en 2007 à San Francisco, Topsy fait partie des quatre sociétés (Gnip, NTT Data et Data Shift) partenaires de Twitter et certifiées comme revendeurs officiels de données. Ainsi, cette dernière a accès à un grand nombre de données de l’un des plus gros réseaux sociaux avec Facebook. indexer tous les tweets depuis le début de Twitter en 2006, créant ainsi un moteur de recherche payant dédié à ce dernier. Topsy affirme vouloir aider ses clients à « analyser instantanément n’importe quel sujet, expression ou hashtag à travers des années de messages, sur des millions de sites internet ». C’est ainsi qu’un baromètre Twitter et Topsy avaient été mis en place lors de la campagne présidentielle américaine de 2012 afin de suivre l’évolution de l’opinion publique sur Twitter tout au long de la campagne électorale aux états unis.

Les différents produits de la société Topsy sont :

  • Topsy pro Analystics ;
  • Topsy pro Analystics public sector ;
  • Topsy API services;
  • Topsy.com.

Etape 1 :

Pour accéder aux différentes options de Topsy, il faut visiter www.topsy.com à travers un navigateur, j’ai testé avec google chrome et Firefox, le résultat reste le même pour les trois navigateurs :

2015-01-04_2104

Après que vous accédez à topsy.com il faut se connecter à votre compte twitter pour commencer votre recherche.

Etape 2 :

Une fois que vous êtes connectés, vous pouvez commencer à exploiter Topsy.

taper un mot ou une expression et lancer votre recherche.

Je prends l’exemple d’Angers ici :

2015-01-04_2110

Je vais commencer par afficher tous les résultats :

 2015-01-04_2112

En cliquant sur recherche vous aurez tous les liens, tweets, photos, vidéos pour les 5 derniers jours.

Après vous avez la possibilité de personnaliser votre recherche selon votre besoin, la langue, la date de parution de l’information, et sa forme (lien, tweet ou vidéo…).

Nous allons essayer de filtrer notre recherche pour avoir plus de précision en affichant uniquement les tweets français triés par date :

2015-01-04_2113

Topsy vous permet de:

  • Passez en revue tous les tweets selon le contenu, y compris les principaux influenceurs ;
  • Trouver les influenceurs sur un sujet précis ;
  • Trouver tous les messages d’une personne ou influenceur sur un sujet précis ;
  • Trouver tous les tweets d’un utilisateur, un lien vers un site spécifique et les liens qu’ils partagent ;
  • Entreprendre des analyses détaillées de suivi pour des mots clés ou des sites.

Social Analytics :

Avec Topsy Social Analytics, vous pouvez analyser les domaines, noms d’utilisateur Twitter ou les mots clés –  . Chaque type d’analyse renvoie des résultats différents.

La comparaison  peut se faire sur trois sujets via des mots-clés.

2015-01-04_2115

Ou des noms de domaine de sites web :

2015-01-04_2117
Ou encore des @noms d’utilisateur, les entreprises aimeront cela pour l’analyse concurrentielle. Mettez votre compte et celui de deux concurrents dans l’outil de comparaison pour voir qui les citent :

2015-01-04_2118

A noter que Topsy n’intègre pas l’exhaustivité des tweets, sur des forts volumes il peut donc y avoir des erreurs.

 

Social Trends :

Les deux nouveaux outils, alertes et rapports Topsy, offrent aux utilisateurs la possibilité de surveiller toutes les conversations et d’être alerté de manière proactive avec les informations les plus importantes pour leur activité. Avec Topsy alertes, les utilisateurs peuvent recevoir une notification immédiate d’un changement dans l’activité, le sentiment ou l’accélération pour n’importe quel sujet.
Mais cette option ne marche que si vous avez un compte Pro avec Topsy (la version payante).

Exemple des top 100 trends :

2015-01-04_2120

Les utilisateurs de Topsy disposent d’un moyen de tirer parti d’analyses des social médias  pour répondre aux besoins de leurs clients tout en restant connecté avec les tendances et les sujets pertinents.

Personnellement, je trouve que topsy est un moteur de recherche très puissant et intelligent qui offre aux utilisateurs la possibilité de surveiller d’une manière efficace les medias sociaux.

Topsy se différencie des autres moteurs gratuits :

  1. Il permet de segmenter les tweets par type : url, photos, etc ;
  2. Il permet de découvrir l’usager twitter qui twitte le plus, un moyen très intelligent de suivre de nouveaux comptes twitter ;
  3. Il permet de choisir facilement la période d’analyse des tweets ;
  4. Il met en évidence facilement les tweets les plus retweetés sur un sujet donné.

Ce que je reproche à Topsy est qu’on ne peut pas filtrer la recherche par zone géographique.

Imane Khomalli, étudiante promotion 2014-2015 du master 2 IESC

https://www.linkedin.com/pub/imane-khomalli/70/b46/52a

 

L’article Topsy : l’analyse et la recherche du web social est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
https://master-iesc-angers.com/topsy-lanalyse-et-la-recherche-du-web-social/feed/ 6
Tutoriel sur les fonctionnalités avancées de Gephi : usage des filtres pour obtenir des cartographies plus lisibles https://master-iesc-angers.com/tutoriel-sur-les-fonctionnalites-avancees-de-gephi-usage-des-filtres-pour-obtenir-des-cartographies-plus-lisibles/ Wed, 14 May 2014 16:36:52 +0000 http://master-iesc-angers.com/?p=685 Nous avons vu dans le précédent tutoriel comment effectuer des calculs d’influence et les visualiser via Gephi, dans le cadre d’un ensemble de tweets dont on étudie les mentions et RT. Néanmoins, ce genre de calcul ne suffit pas forcément… Continuer la lecture

L’article Tutoriel sur les fonctionnalités avancées de Gephi : usage des filtres pour obtenir des cartographies plus lisibles est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Nous avons vu dans le précédent tutoriel comment effectuer des calculs d’influence et les visualiser via Gephi, dans le cadre d’un ensemble de tweets dont on étudie les mentions et RT. Néanmoins, ce genre de calcul ne suffit pas forcément pour aider à visualiser les informations pertinentes. Dès lors que l’on étudie plusieurs milliers de tweets, l’information peu vite devenir brouillonne. Nous allons ici prendre l’exemple de l’analyse des 205 418 tweets envoyés avec le hashtag #EP2014 en avril : sans filtrage, une telle analyse est impossible à réaliser.

Nous allons voir ici :

–          Comment jouer sur la taille des nœuds (comptes twitter) pour les rendre plus visibles ;

–          Comment mettre en place des filtres mettant en valeur les résultats les plus pertinents selon la variable étudiée ;

–          Comment effectuer des filtrages par communautés

Jouer sur la taille des nœuds

Une première possibilité pour clarifier les cartographies obtenues pourra être de jouer sur la taille des « nœuds » représentés à l’écran – la taille choisie se reflète quel que soit ensuite le classement choisi (par degré, connectivité, centralité eigenvector). Les nœuds correspondent aux comptes twitter, les liens aux tweets du corpus.

La taille minimale correspond à celle des nœuds les plus petits : en l’augmentant, ceux-ci sont plus grands. Le résultat sera un graphique avec beaucoup de nœuds de taille moyenne plutôt que de petite taille.

La taille maximum correspond aux nœuds les plus importants : si on l’augmente, les quelques nœuds les plus importants seront énormes et seront les seuls visibles.

taille

Dans notre exemple, avec le réglage min = 10 et max = 100, on obtient ce graphique, très dense, avec très peu de nœuds visibles, et plutôt illisible (avec une police Ariel 12 pour les labels, de taille proportionnelle à la valeur du degré) :

taille_10_100Si on augmente la valeur maximum à 1000, les mêmes nœuds déjà identifiés deviennent plus visibles – il suffirait d’augmenter l’espace entre les nœuds pour avoir une bonne lisibilité de ceux avec les valeurs les plus élevées :

taille_10_1000Utiliser les filtres

Le filtrage par plage de degrés

Ce filtre correspond à l’affichage des nœuds en fonction du nombre de RT / mentions qu’ils ont obtenu. Plutôt que d’afficher avec Gephi les 200 000 tweets du corpus, on va donc ne retenir que ceux qui ont obtenu au moins 99 RT ou mentions.

Pour ce faire, on cherchera à afficher les degrés sortants. Les degrés entrants correspondent aux tweets envoyés par chaque nœud, et le total des degrés à la somme des tweets avec les mentions et RT. Cela nous permet de changer la taille des nœuds en prenant en compte le classement des degrés sortants (on garde ici une échelle de taille entre 10 et 100). Pour commencer, il faut aller dans la section classement, à gauche de l’écran, dans la section « Vue d’ensemble ».

degres_entrants_rankEnsuite, à droite de l’écran, il faut aller choisir un filtre. Une fois que celui-ci est sélectionné, une barre apparait en bas à droite de l’écran, allant de 1 jusqu’à la valeur de degré maximale. Il suffit de déplacer le curseur pour filtrer les degrés en fonction de leur valeur de degrés entrants.

degres_entrants_filtrage_99Vous noterez qu’en haut à droite de l’écran, le nombre de nœuds et de liens obtenus après le filtrage est indiqué. Cela permet de régler le filtre en fonction du nombre de nœuds désirés.

Nb : Comment ré agencer au mieux les nœuds restants ?

Une fois le filtrage effectué, on obtient en général, surtout sur un grand corpus de tweets, des nœuds très éclatés. Pour les réassembler, il faut utiliser l’algorithme « Force Atlas 2 » dans les paramètres de spatialisation en bas à gauche de l’écran :

degres_entrants_configurationOn obtient ainsi le résultat suivant, nettement plus lisible :

degres_entrants_resultatLes filtrages avancés (influence, connecteurs, PageRank)

Tout d’abord, après chaque filtrage terminé, il faut désélectionner le filtre en validant « filtrer » à nouveau en dessous de la sélection de la plage. On vérifiera bien que tous les nœuds et tous les liens sont à nouveau indiqués sur l’écran en haut à gauche.

filtres_SNAIci, on choisit comme filtre « Betweeness Centrality », qui correspond aux connecteurs. On sélectionne à nouveau une plage et on lance le filtrage :

filtres_connecteurs_mapA nouveau, il faut utiliser l’algorithme « Force Atlas 2 » pour repositionner les nœuds. On obtient un résultat très clair, avec 120 nœuds gardés par le filtre :

EP2014_avril_connecteurs_mapLes filtrages par communautés

Il peut également être intéressant de faire apparaitre certaines communautés, détectées par l’algorithme de Louvain, via un filtrage. On utilise pour ce faire le filtre « Modularity Class ».

Modularity_classOn obtient ensuite une liste des communautés, classées en fonction du pourcentage de nœuds compris dans chacune d’entre-elles. Il suffit de les cocher pour les filtrer ensuite.

Modularity_class_filtrage

Effectuer deux niveaux de filtrages

Dans le cas de l’étude d’un grand corpus, le filtrage des tweets est nécessaire également pour les grandes communautés : 10 % des 200 000 tweets font toujours 20 000 tweets, ce qui rend la cartographie illisible. Il est donc possible de choisir des sous-filtres.

Par exemple, si l’on veut uniquement afficher les nœuds avec plus de 200 mentions/ RT ou tweets, on ajoutera un filtre par plage de degrés, qu’on fera glisser sur l’option « Glissez le sous-filtre ici »:

Modularity_class_double_filtrageCe qui nous donne comme résultat une fois les étapes de « Force Atlas 2 » et de l’affichage passées :

EP2014_avril_0830_0948Auteur : Guillaume Sylvestre, consultant à l’ADIT

L’article Tutoriel sur les fonctionnalités avancées de Gephi : usage des filtres pour obtenir des cartographies plus lisibles est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Introduction à la cartographie de communautés twitter https://master-iesc-angers.com/introduction-a-la-cartographie-de-communautes-twitter/ Tue, 11 Mar 2014 17:56:15 +0000 http://master-iesc-angers.com/?p=605 Outils nécessaires : –          Un compte twitter –          NodeXL, template excel, pour « aspirer les tweets » ou Visibrain (outil payant) si vous souhaitez avec l’exhaustivité (passer à la partie 3 du tutoriel) –          Gephi, outil de cartographie utilisant Java, pour visualiser les… Continuer la lecture

L’article Introduction à la cartographie de communautés twitter est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>
Outils nécessaires :

–          Un compte twitter

–          NodeXL, template excel, pour « aspirer les tweets » ou Visibrain (outil payant) si vous souhaitez avec l’exhaustivité (passer à la partie 3 du tutoriel)

–          Gephi, outil de cartographie utilisant Java, pour visualiser les communautés twitter

–          Les outils de recherche sur twitter

Premier exemple : Cartographier une communauté autour d’un hashtag

Dans notre exemple, nous allons profiter de la dynamique des élections municipales sur les réseaux sociaux pour cartographier les utilisateurs de twitter qui communiquent sur cette élection. Pour ce faire, nous allons identifier les hashtags en lien avec ce sujet. Pourquoi les hashtags et pas simplement les mots-clés ? Les hashtags sont utilisés pour mettre en avant une information et la rendre plus visible : il sera donc plus simple d’identifier les communautés des utilisateurs les plus engagés, notamment les influenceurs sur ce sujet.

  1. Identifier les hashtags correspondant à la recherche « municipales angers »

On pourrait effectuer une recherche sur twitter, mais le site Topsy permet également de visualiser le volume de données correspondant aux hashtags. En faisant la recherche « municipales angers » sur les tweets via Topsy, on va identifier les hashtags #mun49000 et #angers parmi les plus utilisés. Sur la dernière semaine, il y en a eu 1700 avec cette mention, c’est un bon corpus :

 intro_twitter_1

  1. Aspirer les tweets via NodeXL

Une fois le template excel installé, le lancer via le lien « NodeXL Template ». NodeXL ne modifie pas excel, il n’est donc accessible qu’en utilisant son lien. Une fois lancé, sélectionner la boite à outil « NodeXL » et aller sur l’onglet « import » pour importer les données.

 intro_twitter_2

Nous cherchons à importer les tweets correspondant à la recherche twitter « #angers #mun49000 ». Nous allons donc choisir l’option « From Twitter Search Network ».

 intro_twitter_3

NodeXL étant un outil gratuit, il n’a pas accès à tous les tweets. Il est limité à 18 000 tweets, sur une recherche de 7 jours. Par ailleurs, twitter a introduit une limitation de l’aspiration des tweets. Si un certain quota est dépassé, il faut attendre 15 minutes avant la poursuite de la requête. Cela signifie que pour des recherches incluant la cartographie des liens entre les utilisateurs d’un hashtag, il faut prendre son mal en patience. Comptez 5 heures pour 1000 tweets. Sinon, cela prend seulement quelques minutes. Cette recherche a pris environ 6 heures.

Une fois les tweets collectés, demander leur export au format GraphML

 intro_twitter_4

Mise en garde : twitter ne donne pas accès à toutes ses données aux outils gratuits. La limite de récupération des données varie entre 6 et 9 jours, et dépend du volume total demandé. Pour des demandes correspondant à moins de 1000 tweets, l’exhaustivité ne pose pas de problèmes. Par contre, pour les « trending topics », twitter ne donne accès qu’à une présélection de tweets.

  1. Cartographier les communautés via gephi

Si vous utilisez Visibrain, pour faire votre export de données, il faut aller dans le menu “Data”, puis sélectionner “Users” et enfin “Mention Graph”. Attention, si vous avez beaucoup de mentions, le fichier va prendre du temps à se télécharger. Au delà de 50 000 mentions, il faut demander à Visibrain une extraction spécifique (en indiquant l’URL de votre requête et la période de temps voulue). Le fichier obtenu sera au format DOT.

2015-02-14_1144

Une fois Gephi lancé, aller dans « Fichier » puis « Ouvrir », et sélectionner votre export des données NodeXL ou Visibrain.

 intro_twitter_5

Les 229 nœuds correspondent au nombre de comptes twitter identifiés dans les tweets. Les 7762, aux interactions entre eux et autour des hashtags « #angers #mun49000 ». On obtient ensuite un amas de nœuds, qu’il convient de démêler. Pour ce faire, le menu « Spacialisation », au milieu à gauche, propose différentes options. Je vous invite à toutes les tester, nous allons cette fois-ci utiliser « Force Atlas », avec les réglages suivants :

 intro_twitter_6

La valeur de la force de répulsion dépend de la densité des nœuds et de leurs relations, l’important étant de bien distinguer les nœuds et de pouvoir lire chaque label (qui s’affiche via le « T » en bas de l’écran). La variable d’ajustement par taille permet d’éviter les chevauchements.

On obtient donc une cartographie des relations entre les comptes twitter, lisible et détaillée. Néanmoins, deux informations importantes manquent : d’abord, visualiser les comptes les plus importants, ceux qui sont au cœur de la diffusion des informations sur #angers #mun49000. Ensuite, pouvoir identifier les communautés d’utilisateurs de ces hashtags.

 intro_twitter_7

Les nœuds permettent donc de visualiser l’importance des comptes twitter dans le réseau #angers #mun49000 : plus un nœud est gros, plus le compte twitter associé est influent sur ce sujet. Par ailleurs, plus les traits sont visibles entre un nœud et ceux qui l’entourent, plus le compte associé est influent par rapport à ceux qui l’entourent.

 intro_twitter_8

Pour détecter et mettre en évidence les communautés, il faut utiliser l’algorithme de modularité, disponible sur le panneau au milieu à droite de l’écran. Le paramètre par défaut permet d’identifier 4 communautés, c’est un chiffre raisonnable. Si vous le trouvez trop grand ou trop petit, vous pouvez jouer sur la « résolution » pour changer le nombre de communautés. Le calcul est basé sur les relations entre les nœuds.

 intro_twitter_9

On obtient ensuite via le choix « Modularity Class » dans « Partition » et « Nœuds » l’affichage des communautés. Les quatre couleurs sont choisies par défaut, il est possible de les changer. En exécutant, elles s’affichent sur les nœuds. Il ne reste plus qu’à visualiser et à exporter la cartographie.

 intro_twitter_10

On obtient ainsi la carte suivante en cliquant sur « Rafraichir », puis en allant dans « Aperçu » :

 intro_twitter_11

Seules deux communautés de militants sont assez actives pour être identifiées : les supporteurs du maire Frédéric Béatse, en vert ; les soutiens de son challengeur Christophe Béchu, en rouge.

Pour la carte complète : http://www.flickr.com/photos/110207842@N02/12986442103/

Merci pour votre intérêt ! Nous reviendrons sur le sujet plus tard, tant les applications sont nombreuses : identifier les communautés autour d’une marque, visualiser les influenceurs en temps réel lors d’une campagne sur les réseaux sociaux, savoir qui propage des informations négatives / positives.

Pour aller plus loin sur gephi, vous pouvez consulter les tutoriaux en ligne (en anglais) : http://gephi.org/users/quick-start/

 Auteur : Guillaume Sylvestre, consultant à l’ADIT

L’article Introduction à la cartographie de communautés twitter est apparu en premier sur Master Intelligence Economique et Stratégies Compétitives.

]]>