InfoSphere DataStage IBM

Editeur décisionnel ETL

Type de produit et caractéristiques de Datastage

DataStage est un outil d’extraction, de transformation et de chargement de données (ETL / data Integration) appartenant à la suite IBM Infopshere. L'ETL Datastage permet à des utilisateurs avec l’édition de travaux ou « jobs » de manipuler tous types de données en entrée pour les rendre utilisable en sortie selon les besoins d’un projet décisionnel.

infosphere datastage

Présentation et concept de Datastage

InfoSphere Datastage permet tout d’abord d’extraire des sources de données diverses d’une entreprise pour ensuite les modifier dans la configuration voulue tout en garantissant des performances élevées. Les possibilités de DataStage sont larges dans la mesure où les fonctions proposées sont puissantes pour chacun de ces composants. De plus, cette application est intuitive puisque l’édition des travaux se fait de manière graphique.

L’application propose plusieurs composants permettant à tous les niveaux hiérarchiques d’un projet d’alimentation de données d’interagir avec celui-ci de façon dynamique. DataStage se veut également compatible avec un environnement de travail Windows ou Unix afin d’utiliser les sessions utilisateurs existantes de l’entreprise. Datastage permet aussi de communiquer avec tous les environnements de votre système d'information y compris une Database Cloud (aws, Microsoft Azure ou autres).

DataStage Designer est l’outil principal de la suite permettant la création de travaux sur les données. Concernant les données, ce composant propose tous les outils nécessaires pour travailler sur les bases de données, les fichiers externes (texte, csv par exemple) et collecter des données hétérogènes car issues de différentes bases de données SQL (MySQL, PostgreSQL, base Oracle, SQL SERVER...) ou NoSQL (MongoDb, ElasticSearch, Hadoop, etc...). La transformation des données est assurée par des fonctions personnalisables à souhait d’agrégation, tri et transformation complexe. Les traitements peuvent s’exécuter séquentiellement ou en parallèle.

DataStage Director est le module qui permet de suivre l’évolution des travaux au sein des projets affectés à l’utilisateur. Il fournit également de nombreuses statistiques pour visualiser la qualité des résultats obtenus. Si un travail rencontre un problème, Director fournit les détails de l’opération pour y remédier à travers un journal d’activités.

DataStage Administrator n’est pas affilié à un projet en particulier car ce composant gère l’ensemble des projets d’un serveur. En effet, un utilisateur de ce module peut créer, supprimer ou configurer des projets.

Fonctionnalités principales de Datastage

Datastage correspond à l'ETL dans une Architecture de Business Intelligence. A partir de différentes de données comme une base de données relationnelle, des web-services, mais aussi des fichiers plats, Datastage permet de collecter les données de manière régulière et de les injectées dans une base cible, un datawarehouse ou un Datalake. Il est aussi bien sûr possible d'utiliser Datastage pour faire des traitement de points à points au sein des architectures logicielles de la DSI.

La force de l'ETL Datastage est qu'il permet de plus d'effectuer des transformations sur les données et ainsi transformer une donnée simple en une donnée analytique. Suite à cela, il est possible de venir brancher sur l'entrepot de données alimenté par datastage un outil de reporting comme Power BI, Qlik ou Cognos pour rester chez l'éditeur IBM.

Datastage est un produit très complet et bien fini. Aussi, bon nombre de fonctions le discriminent du reste du marché des ETL :

  • L'installation de datastage sur un Cluster est complètement guidée.
  • La console Web permettant la configuration et le tuning de Datastage
  • Le designer permet la création, édition, exécution des travaux avec une interface graphique
  • Le Director permet le contrôle des travaux d’un projet sur un engine
  • L'administrator permet la gestion des projets Datastage
  • Il y a possibilité de travailler en séquentiel ou parallèle pour une dsi agile
  • La création de scripts de langages informatiques ni de procédures stockées n'est pas nécessaire car l'ensemble des traitement se paramètrent de manière graphique dans une interface
  • Il y a la possibilité d’installation d’IBM DB2 avec le package datastage
  • La gestion des droits est efficace

infosphere datastage

Avantages de Datastage

  • Compatibilité avec les bases de données professionnelles comme IBM, Microsoft SQL Server, base de données Oracle, ODBC, Netezza, Teradata, Informix
  • Richesse des fonctions de transformations des données
  • Création de travaux intuitive permettant à des personnes novices d’effectuer des opérations de base
  • Rapidité de création de travaux
  • Maintenabilité aisée
  • Composants permettant la gestion des projets et des travaux
  • Bonnes performances
  • Documentation complète
  • Permet la gestion de projets conséquents

infosphere datastage

Dans quels cas utiliser Datastage ?

  • Entreprise souhaitant disposer d’un outil ETL performant et complet
  • Entreprise ayant des projets d’intégration de données imposants impliquant beaucoup de personnes

Retour aux éditeurs ETL

Vous souhaitez bénéficier d'experts, de développeurs ou d'une formation sur InfoSphere DataStage IBM ? Rendez vous sur la page Contact

Des alimentations Datastage par des consultants BI de Nantes, Paris, Lyon, Angers, Paris, Le Mans, Brest, Rennes, Niort, Laval, Lyon, Grenoble, Saint-Etienne, Bordeaux, Toulouse, La Rochelle, Agen, Bayonne, Montpellier, Nîmes, Marseille, Aix-en-provence...

Next Decision vous accompagne sur l'ETL Datastage en Région Parisienne, île de france, Pays de Loire, Bretagne, Poitou-Charentes, Aquitaine, Midi-Pyrénées, Rhône, Ain, Isère, Loire, Languedoc-Roussillon et Provence-Alpes-Côte d'Azur, Occitanie.