Date de dernière mise à jour du plan : 05/02/2024

Durée : 3 jours

La formation Talend Studio Data Integration - Maîtrise est dispensée à Brest, Nantes, Rennes, Angers, Lille, Paris, Toulouse, Montpellier, Lyon, Bordeaux

Nos formations peuvent se faire en présentiel ou en distanciel, en intra ou inter-entreprises.

Nos prochaines sessions inter-entreprises pour la formation Talend Studio Data Integration - Maîtrise sont les suivantes :

  • Du 22/05/2024 au 24/05/2024
  • Du 12/06/2024 au 14/06/2024
  • Du 11/09/2024 au 13/09/2024
  • Du 20/11/2024 au 22/11/2024
  • Du 11/12/2024 au 13/12/2024

Pour toute demande de tarification, nous vous remercions de nous contacter, nous vous transmettrons un devis sous 48 heures maximum.

Présentation de la formation Talend Studio Data Integration - Maîtrise

La formation Talend Studio Data Integration - Maîtrise présentera aux stagiaires comment implémenter une solution ETL (Extract – Transform – Load) d’entreprise avec Talend Studio Data Integration. Le cours expliquera comment développer, déployer et gérer des jobs Talend.

Objectifs de la formation Talend Studio Data Integration - Maîtrise

La formation Talend Studio Data Integration - Maîtrise permettra de comprendre l’environnement de Talend et son fonctionnement de par les objectifs ci-dessous :

  • Comprendre la philosophie des ETL (compilation de type ETL ou ELT - Extract Load Transform)
  • Créer des flux de données
  • Transformer et gérer la donnée
  • Comprendre et corriger les erreurs

Prérequis de la formation Talend Studio Data Integration - Maîtrise

  • Tous les stagiaires ont une licence Studio et l’accès à leur compte sur la TMC
  • Tous les stagiaires ont un Studio installé (sur leur poste ou une VM) et dédié à leur usage
  • BDD Sample2007 installé sur un SGBD des stagiaires
  • Au moins 1 des stagiaires (ou le formateur), dispose des droits administrateurs sur la TMC.
  • Un GIT est accessible aux stagiaires, voire le projet GIT est déjà existant

Public visé de la formation Talend Studio Data Integration - Maîtrise

  • La formation Talend Data Integration - Maîtrise est destinée aux professionnels de l’Informatique et aux développeurs ayant besoin d’implémenter des flux de données inter-applications ou devant alimenter un entrepôt de données.

Programme de formation Talend Studio Data Integration - Maîtrise

Introduction

  • Définition du besoin
  • EAI/ETL
    • Échange inter application
    • L’ETL dans un projet décisionnel
  • Création d’un projet dans le cloud

L’environnement de développement

  • Premier lancement du Studio
  • Découverte de l’interface graphique Eclipse
    • Écran de démarrage
    • Connexion au workspace
    • Ouverture d’un projet
    • Présentation des éléments d’interface
    • Définition des éléments de référentiel projet
  • Initiation aux composants
    • La palette
    • Énumération des grandes familles de composants
  • Bonnes pratiques GIT
  • Actions élémentaires GIT avec Talend

Développer les premiers flux

  • Définition job et joblet (non intégré dans la formation)
  • Le développement de jobs
  • Conventions et règles de développement
  • tRowGenerator
  • tFileOutputExcel
  • tFileInputExcel
  • tMsgBox
  • tSendMail
  • Lier les composants entre eux
  • Exécuter un job

Transformer et gérer les données

  • tFilterRow
  • tUniqRow
  • tAgregateRow
  • tSortRow
  • tMap

Mise en place et utilisation des métadonnées

  • Définition du concept
  • Créer une métadonnée Excel
  • Utiliser une métadonnée Excel
  • Créer une métadonnée de base de données
  • Récupérer les informations d’une base de données

Manipuler une base de données avec Talend

  • Définition des composants liés aux bases de données
  • tAccessInput / tMySQLInput
  • tAccessOutput / tMySQLOuput

Notions et composants avancés

  • Définition et utilisation des variables globales
  • tBuffer
  • tSystem
  • tServerAlive
  • tUnite
  • tReplicate

Les boucles dans Talend

  • tFileList
  • tInfiniteLoop
  • tLoop
  • tPOP
  • tFlowToIterate

Mise en place de la gestion logs/erreurs

  • tLogRow
  • tDie et tLogCatcher
  • tWarn
  • tStatCatcher
  • tFlowMeter et tFlowMeterCatcher

Gestion des environnements et transformations réutilisables

  • Définition de la notion de contexte
  • Créer une variable de contexte
  • Utiliser une variable de contexte
  • Modifier une variable de contexte
  • Développement et utilisation de routines

Préparation au déploiement de la solution

  • Définition et développement d’un séquenceur
  • Génération la documentation du projet
  • Construction et automatisation du projet
  • Publier ses jobs