Présentation du mode In-DB d'Alteryx Designer
Le Designer d’Alteryx propose deux modes de fonctionnement :
Le premier est le mode In-Memory, (en français "en mémoire") dans lequel c’est le moteur de la solution qui effectue les transformations. On reconnait les outils In-Memory avec la petite flèche verte.
Tandis que le mode In-Database communément appelé "In-DB", (en français "en base de données"), permet d’utiliser le Designer d’Alteryx comme un outil ELT. On reconnait les outils In-DB avec la petite icône de liaison bleue.
En effet, un outil ELT permet, à la différence d’un ETL, de transformer les données volumineuses de l’entreprise directement dans sa base de données sans les importer sur votre poste de travail. L’avantage de ce mode est de profiter de la puissance du serveur dans lequel les données sont stockées, ce qui représente un gain de temps considérable pour l’exécution de vos gros traitements.
Alteryx peut se connecter à une multitude de sources de données (Amazon Redshift, Microsoft Azure SQL Data Warehouse, SQL Database, SQL Server, CSV, SAP HANA, QlikView, Teradata, …) et prend en charge la lecture, l’écriture ou la lecture et écriture en fonction de la source de données. En utilisant le mode In-DB, le moteur de la base de données source effectue les transformations. Ce mode est idéal pour le traitement de la Big Data. Ce dernier requiert cependant l’utilisation du langage natif de la base source.
Contrairement au mode In-Memory qui requiert principalement une connaissance approfondie de la donnée, le mode In-DB requiert en plus des connaissances en SQL.
Il existe une correspondance entre les outils In-Memory et In-Database et on peut passer d’un mode à l’autre grâce aux outils Entrée et Sortie du flux de données. Néanmoins, le programme Alteryx peut subir des ralentissements en passant d’un mode à l’autre surtout avec de gros volume de données.
Les outils In-DB d'Alteryx
Les utilisateurs d’Alteryx Designer disposent d’une palette d’outils pour réaliser le processus directement dans la base source.
Grâce à l’outil Connecter en BDD, vous pouvez créer une connexion en lecture et/ou écriture sur les bases sources dans votre workflow. Ensuite vous pouvez insérer votre requête SQL ou bien sélectionner une ou plusieurs tables dans le générateur de requêtes.
L’outil Formule en BDD permet la création, la mise à jour des champs existants ou nouveaux dans le langage natif de la base source. On peut réaliser aussi des agrégations (count, group by, somme, variance …) sur les données avec l’outil Agréger en BDD.
L’outil Parcourir en BDD visualise un échantillon de données idéal pour le débug et la maintenance de vos workflows. Attention à ne pas augmenter considérablement la taille de l’échantillon car cela peut entrainer des ralentissements.
L’outil Ecrire des données en BDD permet la création, la mise à jour ou l’écriture de la table cible.
Les outils Entrée du flux de données, Jointure et Union en BDD permettent d'importer et d'associer facilement des données externes vers la base cible.
L’outil Sortie du Flux de données permet de diriger les données d’un workflow en BDD vers un flux de travail en mémoire, tandis que l’outil Sortie Dynamique de données récupère la requête générée en BDD.
Ajouter une connexion en BDD dans son workflow avec Alteryx
Alteryx est capable de collecter des données brutes ou non en provenance de différentes sources du système d’information de l’entreprise et qu’elles soient stockées en physique ou dans le cloud.
Pour ajouter une connexion en BDD dans votre workflow, vous devez sélectionner le bouton Options > Options avancées > Gérer les connexions en BDD.
Sélectionnez votre source de données, puis cliquez sur "nouveau", sauf si la connexion existe déjà, puis suivez les étapes de la capture d'écran ci-dessous pour configurer votre connexion :
Vous pouvez maintenant vous connecter à votre base de données sur Alteryx.
Les avantages d'Alteryx
Alteryx offre la possibilité, dans le même flux de travail, de nettoyer, de transformer dans la base source avec les outils en BDD les données, puis de les importer en mémoire pour de l’analyse prédictive, spatiale, du reporting, de la Data Visualisation et alimenter/mettre à jour la base cible.
Vous pouvez transformer vos workflows en applications analytiques pour que les utilisateurs puissent facilement intégrer leurs propres données et paramétrer des variables.
Alteryx Designer est un logiciel intuitif. Sa convivialité permet aux collaborateurs orientés métiers de réaliser des processus en autonomie. Il faut ajouter aussi qu’Alteryx Designer facilite la construction de processus ETL complexes et permet d'organiser votre worfklow avec les conteneurs d’outils et l’ajout de commentaires sur le canevas.
Si vous souhaitez aller plus loin avec Alteryx, nous pouvons vous former ! Consultez notre formation Alteryx.
À la recherche de consultants experts d'Alteryx ? Contactez-nous !