Au démarrage d’un projet de référentiel, la qualité des données est un enjeu important car il va conditionner l’effort à réaliser tant pour mettre en qualité les données sources à intégrer dans le référentiel qu’à garantir ensuite la cohérence des nouvelles données. Pour que cet effort soit suivi dans le temps et pérenne il est donc important d’offrir aux utilisateurs et administrateurs des données, des outils leur permettant d’analyser, de suivre et d’administrer la qualité de ces dernières.

Avant de rentrer plus dans le détail, il peut être intéressant de préciser ce que l’on entend par qualité de données. Elle correspond à l’ensemble des règles de gestion mises en place pour enrichir, standardiser et valider les données du référentiel. Ces règles garantissent ainsi la cohérence et l’exactitude des données afin d’assurer un niveau élevé de fiabilité et de qualité.

Analyse de la qualité de données des systèmes sources

La première phase d’un projet de référentiel consiste généralement en l’identification des sources de données qui vont l’alimenter. Cette analyse peut être réalisée par le biais du module Discovery présent dans Semarchy de façon native.

Ce module permet d’avoir un premier niveau d’information et d’indication sur la qualité des données des systèmes sources. Les informations remontées permettront également d’identifier les premières règles de gestion à mettre en place pour optimiser la qualité de la donnée.

Le module Discovery consiste en la présentation d’indicateurs sous une forme graphique, à la fois sur les tables et les colonnes d’un schéma qui a été profilé.

Un premier écran décrit l’état du profilage réalisé, les tables profilées et le nombre d’enregistrements.

Analyser et piloter la qualité de données grâce à Semarchy xDM

Un second écran décrit quant à lui le profilage d’une des tables.

Analyser et piloter la qualité de données grâce à Semarchy xDM

Cet onglet contient des informations d’unicité pour chacune des colonnes de la table. Pour chaque colonne, cela donne des indicateurs comme :

  • Unicité de la colonne
  • Valeur la plus fréquente
  • Valeur moyenne
  • Longueur min et max

Ces indications donnent un premier niveau d’information très intéressant et nous permettent d’identifier les premières règles de gestion ou longueurs des champs à mettre en place.

Enfin, un troisième écran présente le profilage des colonnes d’une table. Cet onglet contient des informations d’unicité pour chacune des colonnes. Pour chaque colonne, cela donne des indicateurs comme :

  • Fréquence de distribution des valeurs
  • Fréquence des patterns des valeurs

Analyser et piloter la qualité de données grâce à Semarchy xDM

Piloter la qualité de données du référentiel

Une fois les règles de gestion misent en place, il est important de suivre l’évolution de la qualité de la donnée du référentiel. Pour ce faire, les administrateurs des données du référentiel vont avoir besoin d’outils et d’indicateurs leurs permettant de suivre cela. La mise en place de ces écrans facilite l’adhésion des futurs utilisateurs au référentiel et garantie une qualité de données durable.

Dans ce cas, la mise en place d’un tableau de bord au sein de Semarchy est particulièrement adaptée. Ce Dashboard pourra être visible pour les administrateurs directement dans l’application Semarchy. Ils pourront ainsi afficher des graphiques avec des indicateurs de pourcentages ou encore avec des comptes d’erreurs pour chacune des règles de gestion mises en place.

Depuis les graphiques proposés, plusieurs fonctionnalités sont offertes aux administrateurs. Détaillons-les.

Consulter la fiche de l'enregistrement en erreur depuis le graphique "Affiche Erreur"

Depuis un graphique, il est possible de naviguer sur une typologie d’erreur comme par exemple, les produits n’ayant pas d’item associés :

Analyser et piloter la qualité de données grâce à Semarchy xDM

Un menu est alors disponible pour consulter la fiche.

Analyser et piloter la qualité de données grâce à Semarchy xDM

On arrive ensuite sur la fiche en erreur.

Analyser et piloter la qualité de données grâce à Semarchy xDM

Il est aussi possible d’exporter les données en erreur directement depuis un Tableau de bord.

Exporter dans un ficher Excel le ou les enregistrements en erreur

Analyser et piloter la qualité de données grâce à Semarchy xDM

Analyser et piloter la qualité de données grâce à Semarchy xDM

Pour résumer, Semarchy a agrémenté sa plateforme xDM d’outils fort judicieux qui permettent aux administrateurs une meilleure efficience. Ils apportent la possibilité de mettre en place une analyse et un pilotage de la qualité des données du référentiel.

Vous souhaitez bénéficier d'experts·tes, de développeurs·euses, ou d'une formation sur Semarchy xDM ? Rendez-vous sur la page Contact !