Le BIG DATA est le concept qui aujourd’hui est au centre de toute l’attention des entreprises. Ce concept est dans tous les fils d’actualités à cette ère du digital. C’est donc à raison que nous devons nous demander pourquoi ? Pourquoi les entreprises s’intéressent t-elles autant au BIG DATA ?
Le concept n’est pas du tout nouveau étonnamment. Les scientifiques et les entreprises faisaient déjà du BIG DATA bien avant que cela ne devienne un sujet populaire.
Les scientifiques du CERN à l’origine de la création du web, étaient déjà confrontés aux problèmes de stockage du volume constamment grandissant des data qu’ils collectaient en 1980 dans un ordinateur central. L’accès aux données stockées était possible seulement en voyageant jusqu’à cet ordinateur. Le caractère constamment grandissant du volume de data a conduit ensuite à l’utilisation de différents ordinateurs pour stocker ces informations et à l’établissement de connections intranet entre ces différents ordinateurs pour permettre l’accès à toutes les informations stockées sur chacun d’entre eux. Des réseaux internes se créèrent ainsi dans plusieurs endroits dans le monde mais avec deux obstacles principaux, la distance et la langue. Dans le but de faciliter l’accès et l’analyse de ces informations par leurs scientifiques l’internet fut créé puis le web ensuite pour assurer la facilité de partage des découvertes issues des analyses effectuées sans avoir à voyager.
L’impact de ces nouvelles méthodes a directement entrainé un changement fondamental dans la manière générale de communiquer. Pendant le même laps de temps la mondialisation de son côté formatait les contours de l’économie. L’avènement de l’internet, du web, des nouvelles technologies de l’information et de la communication et leur accès rendu facile au plus grand nombre, entrainent la généralisation de la dématérialisation des pratiques de marché.
Le concept du BIG DATA bien que d’actualité reste toujours élusif aujourd’hui et de ce fait il n’en existe pas encore de définition concrète. Le concept représente une quantité d’information digitale qu’il est difficile de stocker, transporter ou analyser. La quantité est si volumineuse qu’il est impossible de l’appréhender correctement avec les technologies actuelles. Le challenge aujourd’hui est donc de concevoir des outils capables de stocker et analyser ce volume de data en constante progression.
Les spécialistes s’accordent tout de même à reconnaitre au BIG DATA trois grandes caractéristiques. Il s’agit :
- Du volume de données considérables, à traiter, produites par des individus ou une organisation
En matière de volume, quand pouvons-nous parler de Big Data ?
On peut constater que les outils utilisés pour le traitement des données sont aussi caractéristiques de la différence entre le BIG Data actuel et ce qui se faisait avant. La collecte des données produites ne peut plus se faire par le biais d’un seul ordinateur. Il est nécessaire selon la taille des Data d’utiliser des outils plus élaborés pour le traitement des informations.
- La variété des données (venant de diverses sources, non structurées, vidéos, audio, documents, images…)
- La vélocité pour décrire la fréquence à laquelle ces données sont générées, collectées et partagées.
Les investissements en matière de BIG DATA sont en constante progression, si d’après IDC elles étaient de 14.1 billions de dollars investi dans le domaine en 2014, les prévisions pour 2018 sont proches de 41.5 billions de dollars. Pourquoi ?
La raison pour laquelle le Big Data prend de plus en plus d’importance dans les organisations prend source dans la mondialisation, qui a transformé la planète en un marché mondial où les biens circulent librement. Si avant la distance rendait un peu plus difficiles les échanges de biens, de services et d’argent, la dématérialisation des pratiques de marchés a aujourd’hui permis de dégager un gain de temps précieux. Les données sur les divers marchés, les habitudes de consommations, les tendances des consommateurs peuvent être récupérés partout, sur les réseaux sociaux, les téléphones, les clics de pages internet, les habitudes de connexions, les vidéos vues et partagées. La nouvelle économie de l’ère de l’information repose dès lors sur la production de connaissances. Dans une économie mondialisée, gouvernée par l’information, pour rester compétitive, toute entreprise qui est tournée vers l’avenir et qui désire rester compétitive, est appelée à produire, protéger et stocker de la connaissance.
L’analyse que permet le Big data offre cette possibilité, en donnant aux organisations l’opportunité de trouver de nouveaux débouchés et de prendre des décisions efficaces pour leur business respectif.
Le Big data présente cette autre particularité d’être une activité transversale, utile dans tous les domaines. Tous les acteurs économiques sont impactés par le Big Data, à titre d’exemple :
- Les détaillants recourent à l’analyse des Big data pour obtenir une meilleure compréhension des préférences des clients, ils l’utilisent aussi pour cibler les acheteurs et leur proposer des offres personnalisées afin d’augmenter la taille des commandes et les taux de conversion.
- Les fabricants l’utilisent pour optimiser leurs chaînes d’approvisionnement et améliorer la performance des équipements de l’entreprise.
- Les organismes de santé optimisent les soins et améliorent les traitements des patients.
- Les organismes gouvernementaux l’utilisent pour le renseignement, la sécurité nationale,
- Les organismes financiers pour détecter et prévenir les fraudes, …
La gestion de grands volumes de données permet donc aux entreprises de s’offrir une différenciation dans une économie mondialisée, ce qui est synonyme dans le court de terme, d’analyses et de prises de décisions pertinentes et dans le long terme de compétitivité et de rentabilité.
Investir dans le BIG DATA pour son entreprise ou s’abstenir ?
Si toutes les organisations font ou envisagent actuellement d’investir dans une démarche Big Data, en tant que décideur dans votre entreprise, vous vous posez certainement la question de savoir si vous vous devez de vous y mettre aussi. Le Big Data n’est pas un phénomène de mode, c’est un outil stratégique qui va au fil du temps s’imposer dans les entreprises.
La décision d’investir dans le Big Data s’apprécie sur ces trois caractéristiques citées plus haut : le volume, la variété et la vélocité.
Ce que recherchent les entreprises dans le big data, est un ensemble de connaissances, d’informations actionnables pour pouvoir faire des anticipations dans leurs domaines d’activités et proposer des biens et services en corrélations avec l’utilité qu’en ont les consommateurs.
La taille de votre entreprise n’a donc rien à voir avec le fait de faire ou pas un investissement en Big Data. Si votre entreprise est en contact avec un nombre important de clients, plusieurs entreprises qui génèrent des milliers d’informations qui sont en rapport avec votre business et déterminantes pour votre activité, alors vous serez amenés à prendre des mesures dans l’installation de systèmes Big Data pour le management du volume d’informations que génère votre activité.
La vélocité concerne la vitesse à laquelle ces informations sont générées. Si en plus du volume d’informations que vous avez à gérer dans votre business, ces informations sont générées en un court laps de temps et de manière répétitive, prenons l’exemple d’un service qui reçoit toutes les quinze minutes une actualisation des tendances d’achats ou alors des vues de clients sur un site, pour une base de milliers de clients, alors effectivement il faut envisager la mise en place d’un système de gestion du Big Data.
La variété comme définit plus haut concerne les données non structurées collectées dans le but de comprendre ou de faire correspondre un produit à une clientèle, il s’agit peut être ici d’interactions avec les clients par email, d’informations récupérées sur les réseaux sociaux, sur les téléphones mobiles, qui se présentent sous divers format mais qui n’ont un sens qu’analysées en les prenant comme un ensemble, alors à partir de ce moment encore vous devez effectivement penser à investir dans des logiciels de Big Data.
Qu’est ce qui fait le succès d’une démarche Big Data ?
En somme nous sommes de retour au Klondike du temps de la ruée vers l’or, et cette fois ci l’or c’est la data, l’information est le Klondike sauf qu’ici, il n’a pas de limite territoriale, c’est le web et l’internet. La petite nuance cette fois ci, c’est que cet or est partout, on peut l’obtenir facilement, le collecter abondamment du moment où on a les outils nécessaires. La question demeure alors, si « l’or » est partout et accessible à tous, est ce que tout ce qui brille est de l’or ?
Si les bénéfices qui découlent de l’investissement et de l’analyse en Big Data ne font aucun doute, il est nécessaire de comprendre ce qui fait le succès de tous les projets Big Data. Pour les organisations et entreprises qui collectent des données, les stockent, les utilisent et les visualisent, ce process implique de grands investissements. Qui dit investissement attend forcément un retour sur investissement positif.
Les entreprises devraient donc éviter de thésauriser l’information et comprendre que faire du Big Data n’est pas synonyme de constitution de stocks de données, en espérant en ressortir quelque chose à un moment donné. Le problème soulevé par la pratique de la collection de données est qu’actuellement, bien que les entreprises dépensent des fortunes pour collecter, stocker et manager les données, très peu d’entre elles réussissent à transformer ces données, ces informations en connaissances actionnables et valorisables pour leur business. Ceci est surtout vrai lorsqu’on sait qu’actuellement 80 à 90% de toutes les données des organisations est composées de data non structurée.
Un rapport Veritas sur la composition des données collectées par toutes les entreprises laissait voir ceci :
- 52% des datas collectées sont considérées comme des informations inconnues, dont le contenu est non structuré.
- 33% des datas est constitué de données redondantes, obsolètes et inutiles.
- Seulement 15% des data collectées ont une valeur critique pour les entreprises.
Les conséquences de ce management non optimal des données collectées ont beaucoup de répercussions négatives pour les entreprises : Des fuites d’informations qui endommagent l’image de l’entreprise et affectent la confiance des clients et impactent la compétitivité. L’utilisation de mauvaises données, obsolètes expose les entreprises aux risques de prendre des décisions erronées. Un plus grand préjudice de cette mauvaise pratique est la perte de temps précieux.
Les entreprises qui excellent dans le domaine du Big Data ont toutes comprises une chose d’entrée de jeu, lorsqu’il s’agit de données, la taille n’est pas ce qui importe. Ce qui est important est ce que l’on fait avec les données collectées. Ce qui fait intervenir la qualité de l’information collectée, autrement dit la Good data, qui peut être définie comme l’information de grande valeur qui est applicable, peut être analysée et qui est sûre. C’est l’information utile qui permet de faire des analyses pertinentes et de prendre des décisions importantes. La Good Data représente les quatrièmes et cinquièmes V caractéristiques de la big data, et tient pour le compte de la Véracité et Valeur. La Good Data est donc cet ensemble de données crédibles et fiables qui apportent une plus-value non négligeable aux orientations stratégiques de l’entreprise ou de l’organisation qui met en place une bonne politique Big Data.
Comment les entreprises peuvent-elles collecter de la bonne information ? Et la collecte de Good Data est elle synonyme de réussite à elle seule ?
Une fois compris ce qu’était le Big Data, l’importance de la mise en place d’une bonne gouvernance informationnelle et de cerner l’enjeu de privilégier la qualité de la data collectée, est-il encore possible de rater sa démarche Big Data ?
La prise en compte de l’entreprise dans sa globalité est une étape qui nécessite une planification minutieuse dans la démarche Big Data. Le Big Data impacte de manière significative la culture organisationnelle d’une organisation. Devenir une entreprise qui fait du Big Data équivaut à passer à une culture organisationnelle basée sur la coopération et la recherche informationnelle. Cette transition est donc nécessaire et doit se faire dans toutes les strates de l’entreprise.
L’investissement dans des outils d’analyses Big Data, la collecte de bonnes données peut être inutile et même contreproductive si les employés ne sont pas capables d’incorporer les informations dans les processus de prise de décisions.
Il est courant de voir que l’initiative Big Data dans une entreprise passe par l’embauche d’un expert habitué, avec les outils à mettre en place et à la méthode analytique nécessaire. L’idée sous entendue, est que sa compétence sera transmise automatiquement, le résultat est que bien souvent le processus Big Data se « sectorise » et commence par se cantonner à un seul service de l’organisation, parce que les autres employés n’ont pas été entraînés à la méthode analytique, à l’esprit d’analyse.
Très souvent le département informatique est celui qui s’occupe du Big Data dans les entreprises et les informations sont donc collectées par eux et ils sont ensuite chargé de la retransmission aux services où on en a besoin. Les informaticiens doivent donc être préalablement formés à la formulation des besoins de data, parce que si dans le domaine de l’entreprise il y a des départements qui peuvent clairement exprimer leurs besoins en data, il y a d’autres départements où l’expression de besoin en data bien qu’existant n’est pas clairement formulée.
L’implication du top management dans les processus Big Data se cantonne très souvent au lancement de l’initiative Big Data. Le projet est ensuite relégué au service informatique en ne se considérant pas assez expert pour s’impliquer totalement dans la manière dont l’information est partagée dans l’organisation. Ce qu’il faut comprendre c’est que le retour d’investissement en Big Data est proportionnel à l’investissement de l’organisation dans la compréhension de l’information.
Il faut donc veiller à augmenter la capacité générale d’analyse critique de l’organisation dans son ensemble. Il faut formaliser le processus de prise de décision en mettant en place un bon accès à l’information, des indicateurs de performance clairs et inclus dans les définitions de postes des employés en relation avec leur réactivité à l’information, un système d’appréciation qui récompense les bonnes remontées d’information, le dialogue et l’expression d’avis contraire et enfin investir dans de bons outils de visualisations des informations.
Si l’on ne peut pas se passer d’engager des experts pour piloter la mise en place de la démarche Big Data, il faut toutefois préférer des experts qui ont une démarche de coaching continue. Ce qui permet d’assurer un suivi sur le long terme, et une bonne imprégnation de la nouvelle culture organisationnelle.
Le personnel des entreprises doit pouvoir comprendre proprement la composition de leur data en termes de contenus, degré de pertinence, date de parution, et les classer selon ses critères.
- Les entreprises doivent mettre en place une gouvernance informationnelle solide en ce qui concerne les contenus non structurés, avec des méthodes d’évaluations des données collectées. L’identification des données dupliquées, confidentielles, sensibles est une étape clé dans l’acquisition de bonnes données. La gouvernance informationnelle est étroitement reliée avec le succès d’une politique Big Data, elle permet de produire des idées stratégiques qui même mèneront à la création de nouvelles sources de revenus. Cette démarche permet finalement d’éliminer les coûts qu’impliquent le management de grandes quantités de données inutiles.
- Une autre mesure est d’administrer une formation complète et objective à l’équipe data afin de s’assurer que les personnes qui entrent les données dans les diverses applications ou systèmes d’analyses des organisations, savent ce qu’elles font, pourquoi elles le font et comment le faire proprement. Une autre formation pour le personnel de l’entreprise sur la manière d’intégrer l’information dans les processus de décisions.
- S’assurer de l’implication des directions ainsi que des collaborateurs dans la définition et le mapping des données requises pour fournir non seulement l’information que l’entreprise recherche, mais aussi ce qu’elle recherche comme connaissance et idées pour l’aider à la prise de décisions stratégiques
La Good data comme le représente l’image se retrouve dans le Big Data, elle n’est pas différente mais nécessite un travail de définition, de tri, et de méthodes pour la recueillir, un peu comme lorsque les mineurs passent les grains de sable au tamis pour retrouver les pépites d’or.
Toutefois l’enjeu du Big Data dépasse clairement le cadre des entreprises, et des organisations : il réside dans le sociétal, son intérêt n’est donc pas mercantile. Le partenariat entre secteur privé et secteur public sous la gouvernance et l’initiative du secteur public devrait prendre le pas sur l’utilisation du Big Data pour éviter qu’il ne devienne un outil purement économique qui n’échappe pas à la l’emprise des multinationales et se confine dans la société de marché caractéristique de la nouvelle économie.
Pour avoir un aperçu des enjeux, nous vous proposons une intervention de JEN HAWES HEWITT sur le sujet, que vous pouvez retrouvez sur le lien suivant :
https://www.youtube.com/watch?v=NP-elwWdPa0
Par Kevin Kowu, promotion 2017-2018 du M2 IESCI
WEBOGRAPHIE
http://www.toolsforsmartminds.com/it/insight/blog/97-big-data-vs-good-data
From big data to good data: closing the gap between data governance and business insights
https://www.digitalthing.com.au/rich-data-vs-big-data/
http://data-informed.com/the-difference-between-big-data-and-a-lot-of-data/
https://www.bbva.com/en/keys-building-good-big-data-team/
https://barrachd.co.uk/wp-content/uploads/2015/07/Big-data-bad-data-good-data.pdf