Date de dernière mise à jour du plan : 7/01/2025
Durée : 2 jours
La formation "Introduction aux bases de données et ETL" est dispensée à Nantes, Brest, Angers, Toulouse, Rennes, Bordeaux, Lille, Montpellier, Lyon, Paris
Les sociétés disposent aujourd'hui d'une quantité d'information de plus en plus importante. De plus, les systèmes d'information sont de plus en plus complets et le parc logiciel devient de plus en plus dense. Or, il est parfois capital de réussir à croiser des données de partout, à les réconcilier pour ensuite les stocker à un seul endroit. C'est le rôle des ETL (Extract Transform Load) et des bases de données décisionnelles. Pour assurer un pilotage complet de l’entreprise, ces données doivent être analysées avec soin. L'informatique décisionnelle étudie des données provenant de différentes sources pour en restituer un résultat clair et concis. Cette formation permet aux participants de découvrir la mise en place d'un système décisionnel avec toutes ses étapes.
Objectifs de la formation Introduction aux bases de données et ETL
- Comprendre les modèles de bases de données
- Comprendre l'architecture SGBD (Système de Gestion de Base de Données) et ETL
- Faire un tour d'horizon des SGBD
- Explorer le marché des ETL
- Aprendre à utiliser un ETL avec un exemple pratique
Prérequis de la formation Introduction aux bases de données et ETL
- Les participants à la formation devront maîtriser les bases de l'informatique bureautique (Excel, etc.)
Public visé de la formation Introduction aux bases de données et ETL
- Cette formation s'adresse à toute personne appelée à travailler sur un projet décisionnel d'entreprise. (développeur, responsable de projet décisionnel, etc.)
Programme de la formation Introduction aux bases de données et ETL
PARTIE BASE DE DONNÉES
Introduction
- Qu'est-ce qu'une base de données ?
- Les éditeurs de bases de données du marché (Oracle, Microsoft...)
- Les différents types de bases de données (en ligne, colonnaire, vectorielle....)
Les concepts de base
- Les tables
- Les attributs et les colonnes
- Les différents types de données (chaîne de caractère, numérique, date, booléenne)
- Une valeur particulière : NULL
- Les contraintes des colonnes
- Les clefs primaires et étrangères
- La résolution de relations
- Les contraintes d'intégrité
Les jointures
- Croisée
- Interne
- Externe (Gauche / Droite)
- Naturelle
- Le produit cartésien
La normalisation
- 1ère Forme Normale
- 2ème Forme Normale
- 3ème Forme Normale
- Forme normale de BOYCE-CODD
- Normalisation / Dé-normalisation : quel impact sur les performances, les volumétries ?
Les concepts avancés
- Les indexes : un levier d'optimisation
- Les vues / les vues matérialisées
- Les fonctions
- Les procédures stockées
- Les triggers{/sliders
PARTIE ETL
Introduction
- Qu'est-ce qu'un ETL ?
- Comparatif avec du script SGBD
- L'architecture fonctionnelle
- Les différents ETL du marché
- Les liens avec les SGBD
Les concepts de base
- ETL compilant en SQL
- ETL compilant en C
- Types de données
- Orchestration / Gouvernance
Algorithmie
- La décomposition en éléments simples
- Les boucles
- La gestion des flux de données
- Orchestration
- Normalisation / Dé-normalisation
La qualité des données
- La gestion des rejets
- Les contraintes d'intégrité des données
- Les formats des données
Les jointures
- Les jointures internes
- Les jointures externes
- Avec et sans rejets
Les modalités de chargement
- Insert / Update
- Delete / Insert
La gestion des erreurs
- Les erreurs techniques
- Les erreurs fonctionnelles
Les concepts avancés
- Le suivi de l'exploitation
- Savoir choisir entre script et ETL
- Choisir son ETL