Date de dernière mise à jour du plan : 19/10/2022

Durée : 2 jours

La formation IBM InfoSphere DataStage Expertise est dispensée à Nantes, Paris, Toulouse, Montpellier, Lyon, Bordeaux, Lille, Angers, Rennes, Brest

Cette formation InfoSphere DataStage Expertise est comme son nom l'indique, réservée aux personnes informaticiennes ayant suivi la formation Niveau 1 dans notre organisme de formation ou un autre. De plus, nous préconisons une utilisation à postériori de la formation DataStage niveau 1 de plusieurs mois de pratique.

Au début de la formation, le formateur DataStage fera un tour de table des stagiaires, de la connaissance en DataStage de chacun ainsi que des problématiques qu'il rencontre sur l'ETL de manière quotidienne. Evidemment, vous pouvez venir avec vos cas d'usage DataStage spécifiques.

Objectifs de la formation IBM InfoSphere DataStage Expertise

  • Créer des flux ETL complexes et les optimiser
  • Maîtriser l’environnement DataStage et les notions de parallélisme 

Prérequis de la formation InfoSphere DataStage Expertise

  • Cette formation nécessite une bonne connaissance de l’outil DataStage

Public visé de la formation InfoSphere DataStage Expertise

  • Développeurs souhaitant améliorer leur maîtrise de l’outil pour la conception de leurs traitements ETL

Programme de formation InfoSphere DataStage Expertise

Introduction de la formation InfoSphere DataStage Expertise

  • Rappel de l’architecture DataStage

Parallélisme et partitionnement sous InfoSphere DataStage

  • Fonctionnement d’un traitement DataStage PX
  • Partitionnement/Collecte
    • Modes de partitionnement
    • Modes de collecte

Formation sur la création d'un traitement parallèle complexe

  • Les composants de connexion
    • Unstructured Data - Lire et écrire dans un fichier Excel
    • XML - Lire et écrire dans un fichier XML
  • Les composants de transformation
    • Pivot horizontal et vertical
    • Transformer : boucle

Création d'une séquence complexe sous InfoSphere DataStage

  • Agrémenter les logs
  • Créer une boucle complexe
  • Gérer des fichiers

Optimisation des traitements parallèles

  • Mode sporadique
  • Connexion aux bases : Taille du tableau, …
  • Comparer, Analyser par la Console Opérationnelle

Généralisation des traitements

  • Mode RCP (Runtime Collumn Propagation)