Type de produit et caractéristiques de Datastage

DataStage est un outil d’extraction, de transformation et de chargement de données (ETL / data Integration) appartenant à la suite IBM Infopshere. L'ETL Datastage permet à des utilisateurs, via l’édition de travaux ou « jobs », de manipuler tous types de données en entrée pour les rendre utilisable en sortie selon les besoins d’un projet décisionnel.

infosphere datastage

Présentation et concept de Datastage

InfoSphere Datastage permet tout d’abord d’extraire des sources de données diverses d’une entreprise pour ensuite les modifier dans la configuration voulue tout en garantissant des performances élevées. Les possibilités de DataStage sont larges dans la mesure où les fonctions proposées sont puissantes pour chacun de ces composants. De plus, cette application est intuitive puisque l’édition des travaux se fait de manière graphique.

L’application propose plusieurs composants permettant à tous les niveaux hiérarchiques d’un projet d’alimentation de données d’interagir avec celui-ci de façon dynamique. DataStage se veut également compatible avec un environnement de travail Windows ou Unix afin d’utiliser les sessions utilisateurs existantes de l’entreprise. Datastage permet aussi de communiquer avec tous les environnements de votre système d'information, y compris une Database Cloud (aws, Microsoft Azure ou autres).

Outil principal de la suite, DataStage Designer permet la création de travaux sur les données. Il dispose de tous les outils nécessaires au travail sur les bases de données, les fichiers externes (texte, csv par exemple), et à la collecte des données hétérogènes issues de différentes bases de données SQL (MySQL, PostgreSQL, base Oracle, SQL SERVER, etc.) ou NoSQL (MongoDb, ElasticSearch, Hadoop, etc.). La transformation des données est assurée par des fonctions personnalisables à souhait d’agrégation, tri et transformation complexe. Les traitements peuvent s’exécuter séquentiellement ou en parallèle.

DataStage Director est le module qui permet de suivre l’évolution des travaux au sein des projets affectés à l’utilisateur. Il fournit également de nombreuses statistiques pour visualiser la qualité des résultats obtenus. Si un travail rencontre un problème, Director fournit les détails de l’opération pour y remédier à travers un journal d’activités.

DataStage Administrator n’est pas affilié à un projet en particulier car ce composant gère l’ensemble des projets d’un serveur. En effet, un utilisateur de ce module peut créer, supprimer ou configurer des projets.

Fonctionnalités principales de Datastage

Datastage correspond à l'ETL dans une Architecture de Business Intelligence. A partir de différentes de données comme une base de données relationnelle, des web-services, mais aussi des fichiers plats, Datastage permet de collecter les données de manière régulière et de les injecter dans une base cible, un datawarehouse ou un Datalake. Il est aussi bien sûr possible d'utiliser Datastage pour faire des traitement de points à points au sein des architectures logicielles de la DSI.

La force de l'ETL Datastage est qu'il permet de plus d'effectuer des transformations sur les données et ainsi transformer une donnée simple en une donnée analytique. Suite à cela, il est possible de venir brancher sur l'entrepôt de données, alimenté par datastage, un outil de reporting comme Power BI, Qlik ou Cognos pour rester chez l'éditeur IBM.

Datastage est un produit très complet et bien fini. Aussi, bon nombre de fonctions le différencient du reste du marché des ETL :

  • L'installation de datastage sur un Cluster est complètement guidée
  • La console Web permettant la configuration et le tuning de Datastage
  • Le Designer permet la création, l'édition et l'exécution des travaux avec une interface graphique
  • Le Director permet le contrôle des travaux d’un projet sur un engine
  • L'Administrator permet la gestion des projets Datastage
  • Il y a possibilité de travailler en séquentiel ou en parallèle pour une dsi agile
  • La création de scripts de langages informatiques ou de procédures stockées n'est pas nécessaire. En effet, l'ensemble des traitement se paramètrent de manière graphique dans une interface
  • Il y a la possibilité d’installation d’IBM DB2 avec le package datastage
  • La gestion des droits est efficace

infosphere datastage

Avantages de Datastage

  • Compatibilité avec les bases de données professionnelles comme IBM, Microsoft SQL Server, base de données Oracle, ODBC, Netezza, Teradata, Informix, etc.
  • Richesse des fonctions de transformations des données
  • Création intuitive de travaux permettant à des personnes novices d’effectuer des opérations de base
  • Rapidité de création de travaux
  • Maintenabilité aisée
  • Composants permettant la gestion des projets et des travaux
  • Bonnes performances
  • Documentation complète
  • Permet la gestion de projets conséquents

infosphere datastage

Dans quels cas utiliser Datastage ?

  • Entreprise souhaitant disposer d’un outil ETL performant et complet
  • Entreprise ayant des projets d’intégration de données imposants impliquant beaucoup de personnes

Retour aux éditeurs ETL

Vous souhaitez bénéficier d'experts, de développeurs ou d'une formation sur InfoSphere DataStage IBM ? Rendez vous sur la page Contact

Des alimentations Datastage par des consultants BI de Nantes, Paris, Lyon, Angers, Paris, Le Mans, Brest, Rennes, Niort, Laval, Lyon, Grenoble, Saint-Etienne, Bordeaux, Toulouse, La Rochelle, Agen, Bayonne, Montpellier, Nîmes, Marseille, Aix-en-provence...

Next Decision vous accompagne sur l'ETL Datastage en Région Parisienne, île de france, Pays de Loire, Bretagne, Poitou-Charentes, Aquitaine, Midi-Pyrénées, Rhône, Ain, Isère, Loire, Languedoc-Roussillon et Provence-Alpes-Côte d'Azur, Occitanie.