Connexion
14 793 Livres Blancs | 2 471 |
> Accueil / Dossiers / La gestion des données : ce qu'il faut savoir

La gestion des données : ce qu'il faut savoir

Livre blanc - "Les données : fondation de l'IA performante" - Salesforce

Les données : fondation de l'IA performante

"Bien plus qu’une plateforme de données clients, Data Cloud est un bond en avant qui permet à l'IA de générer des expériences clients révolutionnaires, bien plus personnalisées. En connectant n’importe quelle source de données avec le CRM Salesforce, Data Cloud apporte des analyses approfondies des données et des idées d'actions, points de départ d'une grande expérience.

À travers cet e-book, vous découvrirez comment Data Cloud unifie et harmonise des volumes considérables de données diverses avec les données CRM de la plateforme Salesforce Einstein 1. Les entreprises disposent ainsi d’une vue inégalée de leur univers de données et d’une base solide pour proposer de meilleures expériences client alimentées par l’IA."

Obtenir le livre blanc
Un livre blanc de Salesforce

La gestion des données n'est plus ce que c'était autrefois. Malgré sa présence constante dans l'entreprise depuis plusieurs décennies, l'explosion du numérique ces dernières années a changé la donne. Protection et gouvernance des données, data warehouses et lakes, le MDM, les DMP, CDP... Le Data Management comprend de nombreux éléments qui peuvent parfois prêter à confusion. C'est pourquoi nous vous proposons aujourd'hui de vous plonger un peu plus dans le monde de la gestion des données !


Définition du data management

Avant toute chose, il est nécessaire de définir ce qu'est la gestion des données précisément. La gestion des données, ou data management pour les anglophiles, est essentiellement une discipline qui regroupe toutes les pratiques de management de données en tant que ressource de valeur au sein d'une entreprise.

Selon DAMA, la gestion des données regroupe "l'élaboration et l'exécution d'architectures, les politiques, les pratiques et procédures" ; comme vous pourrez le constater de cette définition de l'expert, le data management est vaste tant il regroupe des services techniques et non techniques pour être géré correctement.

Il existe une multitude de sous-catégories liées à la gestion des données. Nous vous invitons à en découvrir quelques-unes dans la liste établie ci-dessous. N'ayez crainte, nous avons fait tout notre possible pour simplifier même les termes les plus techniques !

  •  
  • Gouvernance des données
  • Tel un gouvernement qui établit des lois et réglementations pour encadrer la société, la gouvernance de données encadre la collecte et l'utilisation des données. Non seulement cette gouvernance s'applique aux règles intérieures d'une entreprise, mais également aux obligations de ces dernières de respecter les réglementations en vigueur dans un pays ou dans un bloc.
  •  
  • Le plus récent de ces règlements, le RGPD, a notamment fait des vagues dans le monde du business de par les changements majeurs qu'il a engendrés dans la collecte et l'utilisation plus éthiques des données. Pour en savoir plus à ce sujet, nous vous recommandons notre dossier à ce propos, ou bien encore la sous-catégorie dédiée aux livres blancs traitant le règlement.
  •  
  •  
  • Architecture de données
  • Pour simplifier un concept particulièrement complexe de l'informatique, l'architecture de données permet de définir le triage, le stockage, l'intégration et l'utilisation de données au sein d'une entreprise grâce à des modèles et algorithmes.
  •  
  •  
  • Intégration de données
  • Un processus informatique dans la gestion des données, l'intégration des données permet de regrouper, consolider et déplacer des données. Cet ensemble de processus permet entre autres de dédupliquer des données, renvoyer les résultats demandés au système cible, etc. Bref, un peu le logisticien de la gestion des données.
  •  
  •  
  • Master data management (MDM)
  • Le Master data management, ou gestion des données de référence en français, est une méthode que certaines entreprises utilisent pour définir et gérer les données référentielles. Qu'est-ce donc, vous dites ? Une donnée référentielle (le fameux Master data) est une donnée classée comme critique à l'infrastructure d'une entreprise qui sert de base aux autres données. En termes lambda, les données référentielles sont ces informations dont nous avons toujours besoin : les unités de mesure, les conversions de poids, les structures de calendriers, etc.

Pour en savoir plus, nous vous invitons à faire un tour dans la sous-catégorie que nous avons dédiées à ce sujet ! 

  •  
  • Data warehouses / Data lakes / Datamarts
  • Si vous n'êtes pas fan de la langue anglaise, vous n'êtes pas servis ici... Les termes anglophones abondent pour décrire les différentes étapes et lieux de stockage des données dans l'entreprise. Pour commencer, les data warehouses, ou entrepôts de données, servent de lieu de stockage pour toutes les données provenant des différents services (marketing, commercial, etc.). Ces entrepôts transmettent par la suite les données aux différents Datamarts (Mart étant un mot anglais du 15e siècle se traduisant "marché" ou "centre de commerce"), des sortes de mini-entrepôts destinés à des données spécifiques pour un service ou un autre.

Enfin, nous arrivons au Data lake, ou lac de données. Au lieu d'un entrepôt bien ordonné comme le data warehouse, le data lake regroupe toutes les données avec très peu de modifications apportées aux informations de base (souvent les données classées comme la Big Data). 

  •  
  • Gestion des métadonnées
  • Les métadonnées sont une forme de donnée assez particulière, peu reconnue en dehors du cercle informatique. Pourtant, nous les voyons presque chaque jour, dès que nous ouvrons un fichier Word, que nous regardons nos mails, et ce sont des éléments cruciaux aux sites web. Pour aller au plus simple, les métadonnées sont les données permanentes d'un fichier, d'une image, etc. comme la date, le poids, ou encore l'auteur permettant de l'identifier.

La gestion des métadonnées consiste très simplement à traiter ces métadonnées afin de permettre à l'entreprise d'y accéder, de les intégrer et de les analyser.

  •  
  • Qualité des données
  • Plutôt une condition qu'un processus, la qualité des données se définit si ces dernières ont une utilité adaptée dans un cadre opérationnel, décisionnel ou de planification.
  •  
  •  
  • Gestion électronique des documents (GED)
  • La gestion électronique des documents, nous savons tous ce que c'est : suffit-il de dire que cette méthode de gestion numérisée se range aux côtés du data management.
  •  
  •  
  • Modélisation des données
  • La modélisation des données, un processus assez technique, permet de créer certains modèles fondamentaux dans lesquels les données peuvent être classées afin de les rendre plus accessibles et améliorer l'uniformité des données à travers toutes les strates d'une entreprise.
  •  
  •  
  • Sécurité de données
  • La sécurité des données est un sujet qui est, malheureusement, presque tout le temps d'actualité. Des attaques toujours plus nombreuses, les vols de données, le manque de sécurisation des données personnelles... Bref, toute une panoplie de raisons qui font que la sécurité des données est actuellement une des plus grosses priorités de toute entreprise avec des données personnelles dans ses bases de données.

On notera, toutefois, que la sécurité des données s'étend bien au-delà des données personnelles. Cette sécurisation s'applique également à toute forme de données, internes ou externes, d'une entreprise.

  •  
  • Data mining
  • L'exploration de données, ou Data mining pour lui donner son titre anglais, est un processus permettant d'extraire des informations à partir d'une grande quantité de données. La finalité de cet acte est de pouvoir en tirer des modèles d'enseignement afin de pouvoir prendre de meilleures décisions et, jusqu'à une certaine mesure, prédire d'éventuels scénarios dans votre entreprise.
  •  
  •  
  • Data management platforms / Customer data platforms (DMP / CDP)
  • Certains nous diront que les DMP et les CDP ne sont pas la même chose, et ils ont bien raison. Toutefois, par souci de simplification dans ce dossier qui couvre tant de sujets, nous avons préféré les regrouper. La DMP (à ne pas confondre avec le dossier médical partagé !) est donc une plateforme de gestion de données, comme le laisse entendre le nom. La finalité de ce type de plateforme est d'unifier toutes les données dans un seul et même endroit, permettant ainsi aux services de marketing de gérer et de mieux cibler les audiences nécessaires à des fins de publicités.

La Customer data platform, quant à elle, vise non les clients prospectifs de l'entreprise par le biais de publicités, mais les clients existants. La finalité reste toutefois la même dans la mesure où la CDP permet de mieux personnaliser les échanges et communications avec le client.

Le sujet étant bien plus complexe que ce résumé de six lignes, nous vous proposons de découvrir les DMP et CDP plus en détail ici !

  •  
  • Sachez que cette liste est loin d'être exhaustive. Comme nous vous l'expliquions au début de ce dossier, le sujet de la gestion des données est particulièrement vaste ; toutefois, vous avez ci-dessus quelques-uns des termes les plus courants sur lesquels vous pourriez tomber dans le cadre de la gestion des données.

Les chiffres du data management

Cela ne vous surprendra certainement pas d'apprendre que le marché qui tourne autour de la gestion des données se porte très bien. Selon une étude d'Orbis Research qui analyse le marché des solutions de gestion de données, la valeur du secteur était de 68.60 milliards de dollars en 2016, et grimpera 142.67 milliards de dollars en 2023. En d'autres termes, il doublera de valeur.

Par ailleurs, un autre chiffre tout aussi impressionnant : savez-vous à combien se chiffre le nombre de teraoctets (To) de données publiés sur le net chaque seconde ? Pas moins de 29 To. Pour vous situer un peu dans la réalité, le disque dur d'un ordinateur aujourd'hui comporte en moyenne entre 0.5 et 2 To. Un chiffre tout bonnement hallucinant.


Les acteurs du data management

Il existe de nombreux acteurs dans le marché mentionné ci-dessus.

Pour n'en citer que quelques-uns qui ressortent dans le rapport d'Orbis, on retrouve forcément des leaders du secteur comme IBM, Intel, Oracle, SAP, Symantec, Talend, Microsoft, ou encore Informatica.


Les livres blancs à consulter


Les stratégies gagnantes de gestion des données avec le digital

Livre blanc de Markess

Comment gérer ses données avec le digital : le livre blanc avec 6 stratégies de Markess pour réussir.

Pourquoi démarrer une gouvernance des données agile ?

Livre blanc de Zeenea

Gouvernance des données agiles : définition et bénéfices.

La nouvelle gouvernance des données personnelles dans le secteur public

Livre blanc de OpenDataSoft & Haas Avocats

Ce livre blanc fait le point sur le RGPD, et l'effet qu'il aurait sur la gestion des données personnelles dans le secteur public.

Base de connaissance et communautés : deux faces du knowledge management

Livre blanc de Jalios

Un livre blanc qui détaille les différents visages du knowledge management.

La gestion des données hiérarchiques en toute simplicité

Livre blanc de Stambia

Un livre blanc qui explique comme gérer les données hiérarchiques de façon simple.

La transformation numérique passe par la gestion des données client

Livre blanc de Uniserv

Les conditions préalables à un parcours client réussi.

Gestion des données techniques pour l'industrie 4.0

Livre blanc de Aletiq

Déployez une solution de gestion des données techniques pour engager votre transformation numérique grâce à ce livre blanc.

Mener une stratégie concrète de gestion des données pour des performances métier optimisées

Livre blanc de Information Builders

Ce livre blanc portera sur le triple alignement des ressources, allant de la formation de chefs de projets internes et de sponsors métier au déploiement de la technologie indispensable à la diffusion de votre stratégie.