Date de dernière mise à jour du plan : 09/01/2024
Durée : 2 jours
La formation IBM InfoSphere DataStage Expertise est dispensée à Nantes, Paris, Toulouse, Montpellier, Lyon, Bordeaux, Lille, Angers, Rennes, Brest
Cette formation InfoSphere DataStage Expertise est comme son nom l'indique, réservée aux personnes informaticiennes ayant suivi la formation Niveau 1 dans notre organisme de formation ou un autre. De plus, nous préconisons une utilisation à postériori de la formation DataStage niveau 1 de plusieurs mois de pratique.
Au début de la formation, le formateur DataStage fera un tour de table des stagiaires, de la connaissance en DataStage de chacun ainsi que des problématiques qu'il rencontre sur l'ETL de manière quotidienne. Evidemment, vous pouvez venir avec vos cas d'usage DataStage spécifiques.
Objectifs de la formation IBM InfoSphere DataStage Expertise
- Créer des flux ETL complexes et les optimiser
- Maîtriser l’environnement DataStage et les notions de parallélisme
Prérequis de la formation InfoSphere DataStage Expertise
- Cette formation nécessite une bonne connaissance de l’outil DataStage
Public visé de la formation InfoSphere DataStage Expertise
- Développeurs souhaitant améliorer leur maîtrise de l’outil pour la conception de leurs traitements ETL
Programme de formation InfoSphere DataStage Expertise
Introduction de la formation InfoSphere DataStage Expertise
- Rappel de l’architecture DataStage
Parallélisme et partitionnement sous InfoSphere DataStage
- Fonctionnement d’un traitement DataStage PX
- Partitionnement/Collecte
- Modes de partitionnement
- Modes de collecte
Formation sur la création d'un traitement parallèle complexe
- Les composants de connexion
- Unstructured Data - Lire et écrire dans un fichier Excel
- XML - Lire et écrire dans un fichier XML
- Les composants de transformation
- Pivot horizontal et vertical
- Transformer : boucle
Création d'une séquence complexe sous InfoSphere DataStage
- Agrémenter les logs
- Créer une boucle complexe
- Gérer des fichiers
Optimisation des traitements parallèles
- Mode sporadique
- Connexion aux bases : Taille du tableau, …
- Comparer, Analyser par la Console Opérationnelle
Généralisation des traitements
- Mode RCP (Runtime Collumn Propagation)