Connexion
7 360 Livres Blancs | | |
> Accueil / Dossiers / Le b.a.-ba du big data

Le b.a.-ba du big data


S'il y a bien un anglicisme qui s'est ancré dans le vocabulaire du monde professionnel ces dernières années, c'est le big data. À côté d'autres expressions comme l'inbound et le content marketing, le design thinking ou encore la start-up, le big data a fait le tour des entreprises depuis sa démocratisation dans les années 2010. Elle s'est même vue accorder une place de choix dans le titre de l'évènement "Big Data Paris" qui a eu lieu en début de semaine. Bref, une occasion pour nous de revenir sur le concept du big data et de le définir en toute simplicité. 


Définition

Mégadonnées, données massives, grosses données... Les traductions de l'expression 'big data' sont nombreuses. Toutefois, le terme ne nous dit pas grand-chose sur la définition en elle-même. 

Pour cela il faut remonter dans les années 90 lorsque le terme a été employé pour la première fois dans un document scientifique ("Application-Controlled Demand Paging for Out-of-Core Visualization" publié en 1997 par Michael Cox et David Ellsworth) traitant de la problématique de la taille des ensembles de données (1) et de la manière que l'on peut visualiser ces dernières. Ce n'est toutefois que 15 ans plus tard, début 2012, que l'expression 'big data' s'est démocratisée, entre autres dans le cadre des élections américaines entre Barack Obama et Mitt Romney, où chaque parti a fait usage de techniques liées au big data pour mieux performer au niveau de leur campagne électorale.

En parallèle, les entreprises commencent à réaliser la problématique que représente la quantité phénoménale de données issues du numérique : il devient tout bonnement impossible de les traiter avec les techniques existantes...

  •  
  • LE BIG DATA EN QUELQUES MOTS

En termes simples, le big data représente un ensemble de données tellement volumineuses qu'il est impossible pour une personne d'analyser l'information présentée. Il est donc question de trouver de nouvelles méthodes pour visualiser, analyser et exploiter ces données de manière optimale.

C'est là tout le défi que représente ce phénomène que certaines personnes comparent à la 4e révolution industrielle (d'autres suggèrent que c'est plus en lien avec la 3e, celle de l'informatique de manière globale). Tous s'accordent néanmoins à dire que le big data va révolutionner (si ce n'est pas déjà le cas) de nombreux secteurs. 

Le big data a en effet le potentiel de fournir une visualisation et une analyse particulièrement poussée dans un environnement particulier ; elle peut également fournir une analyse prédictive de certains comportements ou situations. Inutile de vous expliquer les avantages d'un tel système...

  •  
  • LA RÈGLE DES 3V

Le big data se décompose en une problématique à trois facettes, souvent représentées dans les études diverses et variées à ce propos par la règle des 3V : volume, variété et vélocité.

Volume, car la quantité de données stockées de manière numérique ne cesse de croître au fil des jours. Il est estimé que la quantité de données dans le monde équivaut environ 33 zettaoctets, soit 33 milliards de téraoctets (un ordinateur standard aujourd'hui est généralement équipé d'un disque dur entre 0.5 et 1 téraoctet).

Variété, car il y a une surabondance de différentes données : ces données peuvent être tout et n'importe quoi, allant d'un simple numéro transactionnel fait lors d'un achat à une adresse IP en passant par une information qui a pour simple réponse 1 ou 0... Ces données, comme vous pouvez l'imaginer, sont difficilement exploitables en tant que telle, et au vu du volume, impossible à analyser à la main.

Vélocité, car ce volume et cette variété sont créés, reçus et mis à jour en temps réel, et doivent être analysés rapidement pour être pertinents.

 

  • (1) - Au sens informatique, un ensemble de données représente une méthode abstraite de stockage non structurée pour certaines valeurs. Plus simplement dit, un ensemble de données est une collection au format numérique à l'état brut.

 


Quelques chiffres

Ce ne sont pas les chiffres qui manquent dans ce domaine ! Voici quelques-uns des plus intéressants :

163 zettaoctets > La projection du volume de données au niveau mondial d'ici 2025. Pour rappel, 1 zettaoctet représente 1 milliard de téraoctets. (source : Statista)

103 milliards de dollars > La projection des revenues du marché du big data en 2027. À noter que les revenues du secteur étaient de 42 milliards de dollars en 2018 (source : Wikibon)

79 % > Le nombre de décideurs qui estime que les entreprises qui n'intègrent pas le big data dans leurs stratégies risquent de devoir mettre la clé sous la porte à moyen terme (source : Accenture).


Les principaux acteurs à suivre

Nous vous le disions plus haut, le big data révolutionne de nombreux secteurs d'activité. Cette révolution n'est pas menée par le big data en lui-même, étant uniquement un concept : ce sont les applications que les industries y trouvent qui en font une révolution. Les acteurs du big data étant trop nombreux à lister, nous avons préféré vous présenter quelques-uns des exemples du Big Data dans le monde :

  • La réélection de Barack Obama en 2012
  • Pour détailler l'exemple que nous vous avions présenté au début de ce dossier, certains affirment que la stratégie de big data employée par l'équipe d'Obama en 2012 a grandement contribué à sa réélection. Avant même que l'élection n'ait lieu, ils avaient déjà compilé toutes les données accessibles dans un seul repositoire, le rendant plus facilement accessible. Pendant la campagne électorale, il est estimé que l'équipe d'Obama faisait des projections 66 000 fois par nuit sur les résultats de l'élection basés sur les informations existantes. En prenant ces données, ils étaient en mesure de focaliser leurs efforts là où il y avait le plus besoin.
  •  
  • Grand collisionneur de Hadrons (Large Hadron Collider / LHC)
  • Si vous avez un intérêt pour les sciences, vous avez probablement déjà entendu parler du LHC. Ce béhémoth de la physique, enterré à plus d'une centaine de mètres sous terre en Suisse, est un accélérateur de particules (le plus grand du monde). Outre la spéculation alarmiste que ce dernier aurait pu générer un trou noir lors de son lancement initial, le LHC représente un projet titanesque en matière de big data, de par les centaines de milliers de capteurs employés pour recueillir des téraoctets de données afin de faire progresser les recherches scientifiques, en particulier dans le domaine de la physique.
  •  
  • Apache Hadoop
  • Si vous n'êtes pas dans l'informatique, il est probable que n'ayez jamais entendu parler d'Hadoop ; Apache vous parle peut-être, mais de très loin. Toutefois, sachez qu'Apache Hadoop est la référence open source pour le big data. Elle fournit plusieurs outils facilitant la création d'un réseau d'ordinateurs pour résoudre des problèmes demandant énormément de données.
  •  
  • Réseau d'un kilomètre carré (Square Kilometer Array / SKA)
  • Un autre projet scientifique d'envergure, le SKA est en cours de développement en Afrique du Sud. Si le projet aboutit, le SKA sera le plus grand radiotélescope au monde, couvrant (comme le nom l'indique) un kilomètre carré. Il est estimé que ce dernier pourra, à terme, récolter des données (ce fameux big data) 50 fois plus rapidement que ce qui se fait actuellement. Avec ces données, la communauté scientifique mondiale pourra entreprendre de nombreux projets allant des théories entourant les origines de l'univers à l'origine de la vie...

Les livres blancs à consulter


Data scientists, CDO, DPO... La nouvelle génération data

Livre blanc de Big Data Paris

Tout savoir des nouveaux métiers liés à la data.

Big Data : au-delà du mythe

Livre blanc de Access Insight

Découvrez les véritables enjeux du Big Data pour votre entreprise par le biais de ce livre blanc.

Attrition & Big Data

Livre blanc de Saagie

Ce livre blanc vous explique le fonctionnement de l'attrition et son association au Big Data.

Au delà du Big Data

Livre blanc de Iron Mountain

Obstacles et opportunités pour les entreprises de taille moyenne en Europe.

Big Data - Analyse et valorisation de masses de données

Livre blanc de Smile

Smile analyse en détail la question du Big Data, et comme ce concept peut s'appliquer au mieux au sein des entreprises.

Big Data : la matière première de l’APM

Livre blanc de riverbed

Comment le Big Data s'emploie dans le cadre des APM (Application Performance Management).