À l’heure où le monde prend conscience de l’importance de la donnée, on assiste à une multiplication des projets décisionnels, voire des programmes Data Quality visant à améliorer la qualité des données présentes au sein d’une entreprise.
Le succès n’est pas toujours au rendez-vous : selon les sources consultées, 60 à 85% des projets dits “Big Data” sont abandonnés, et peu d’entreprises exploitent pleinement la valeur de leurs données. Pourtant, entre Analytics et Machine Learning, les avancées technologiques sont considérables et les solutions informatiques se multiplient. Alors, comment garantir le succès de son système décisionnel ?
Communiquer de manière transverse
Quel que soit l’outil du système d’information par lequel elle transite, que ce soit on-premise ou dans le Cloud, une donnée renvoie toujours à un ou plusieurs domaines métier. Il est important de connaître son contexte afin de l’interpréter correctement. Dès lors que l’on se base sur des données générées par d’autres domaines pour prendre des décisions, on comprend vite que la communication est primordiale :
Comment la donnée est-elle générée ? Qui en a besoin ? Y a-t-il des subtilités en matière de définition ? Quelle est sa relation avec d’autres données ? Est-ce que je la comprends de la même manière que mes collègues ?
Après tout, un service commercial n’aura pas forcément la même vision sur des données comme le chiffre d’affaires qu’un service comptabilité. C’est peut-être le premier enjeu de la Data Gouvernance : s’entendre sur les définitions.
Il faut donc communiquer, et ce de manière transverse d’un domaine métier à un autre. En gardant à l’esprit que l’objectif final est d’obtenir des données de qualité qui permettront de soutenir la prise de décision, cette communication implique un certain nombre de responsabilités :
- Apporter les définitions et les règles métiers => c’est le rôle du Data Owner
- Veiller à la bonne application de ces règles dans les systèmes IT => c’est le rôle du Data Steward
Ces responsabilités font appel à des compétences diverses qu’il sera difficile de réunir en une seule personne. C’est pourquoi il est important d’identifier un interlocuteur par domaine métier qui assurera les responsabilités de Data Owner. En effet, c’est dans le domaine que l’on trouvera les connaissances nécessaires sur les processus métier qui permettront de contextualiser les données générées au sein de ce domaine. C’est de là que vient l’idée d’appartenance d’une donnée à un domaine, qui en est donc responsable. Quant aux personnes qui assurent le rôle de Data Steward(s), elles doivent être capables de comprendre les flux de données.
Une fois le propriétaire identifié (pour un domaine), il est temps d’aborder un troisième enjeu majeur de la gouvernance des données : la documentation. Afin de bien interpréter les données produites par un autre domaine, il faut avoir accès à toutes les informations qui la contextualisent : définitions, règles liées à leur usage ou encore dans quelles bases de données elles sont stockées. C’est la fonction du Data Catalog, ou catalogue de données.
Un Data Catalog, sous quelque forme qu’il soit, doit permettre de diffuser la connaissance sur ses données à l’échelle de toute une organisation.
Découvrez l’outil de Data Catalog self-service de notre partenaire DataGalaxy.
Les outils les plus avancés permettent en plus d’automatiser l’import de métadonnées, de visualiser le Data Lineage et même, parfois, de faire du profilage.
Pour résumer, on a grand intérêt à rassembler les bonnes personnes, se mettre d’accord sur les définitions et les communiquer au plus grand nombre. Un véritable exercice de démocratisation de la donnée qui permettra de piloter toutes les facettes du data management, de l’architecture de données à la gestion de la qualité en passant par le MDM et la gestion des métadonnées.
Mise en place d'un Data Catalog : Comment s'y prendre ?
Lorsque l’on dispose d’énormes volumes de données qui proviennent de sources hétérogènes, on peut vite se sentir découragé : Par où commencer ?
Il ne suffit pas de centraliser les données dans un Data Warehouse et espérer que les analystes et les développeurs parviendront à en sortir des informations précieuses à l’aide du bon outil de reporting ou autre solution Big Data. On l’a testé pour vous : cela fait peser une très forte charge sur les équipes de la DSI pour un résultat rarement à la hauteur des attentes. En effet, le consommateur du rapport ne sait pas vraiment ce qui se passe dans l’entrepôt de données, ne sait souvent pas d’où provient l’information reçue et peut donc difficilement l’utiliser.
Pour accélérer la démocratisation de la donnée, comme pour tout projet, il est judicieux de chercher à obtenir des résultats rapidement. Plutôt que de vouloir définir et gouverner toutes les données de l’entreprise en un seul méga-projet, on préférera une approche agile en se focalisant sur un périmètre plus réduit. Par exemple, on peut sélectionner un ou deux tableaux de bord opérationnels jugés importants qui utilisent des données métier produites par un ou deux domaines.
En rassemblant dans un atelier un consommateur du rapport, un spécialiste de la chaîne décisionnelle et un représentant du domaine métier où sont produites les données, on a de quoi nourrir notre catalogue de données et répondre à un grand nombre de questions : Les attributs viennent de l’ERP ou du CRM ? Par combien d’interfaces transitent-elles avant d’atterrir dans mon rapport Power BI ? Que signifie tel ou tel attribut et pourquoi est-il différent d’un rapport à un autre ?
C’est ainsi qu’en réunissant les producteurs et les consommateurs, il est possible de développer un Data Catalog centralisé qui permet de donner accès aux données à chacun, sans avoir besoin de savoir écrire une Query sur une base de données Microsoft SQL ou autre. Idéal pour le chef de projet ou le Data Manager qui va pouvoir communiquer ce premier résultat au reste de l’entreprise. Il est important de ne pas sous-estimer cette étape : c’est en montrant ce que l’on peut réaliser avec une bonne gestion des données que l’on peut réaliser le changement de culture nécessaire pour transcender les silos traditionnels et créer une synergie autour de la data.
Pour une présentation plus détaillée des rôles et acteurs de la data gouvernance, voir aussi notre article : Qu'est-ce que la Data Governance ?
Nos experts sont à votre écoute pour vous accompagner dans la mise en place de votre Data Catalog.
Nos consultants experts de Next Decision vous accompagnent dans vos projets de Data Governance ! Contactez-nous !