Date de dernière mise à jour du plan : 19/10/2022

Durée : 2 jours

La formation "Introduction aux bases de données et ETL" est dispensée à Nantes, Brest, Angers, Toulouse, Rennes, Bordeaux, Lille, Montpellier, Lyon, Paris

Les sociétés disposent aujourd'hui d'une quantité d'information de plus en plus importante. De plus, les systèmes d'information sont de plus en plus complets et le parc logiciel devient de plus en plus dense. Or, il est parfois capital de réussir à croiser des données de partout, à les réconcilier pour ensuite les stocker à un seul endroit. C'est le rôle des ETL (Extract Transform Load) et des bases de données décisionnelles. Pour assurer un pilotage complet de l’entreprise, ces données doivent être analysées avec soin. L'informatique décisionnelle étudie des données provenant de différentes sources pour en restituer un résultat clair et concis. Cette formation permet aux participants de découvrir la mise en place d'un système décisionnel avec toutes ses étapes.

Objectifs de la formation Introduction aux bases de données et ETL

  • Comprendre les modèles de bases de données
  • Comprendre l'architecture SGBD (Système de Gestion de Base de Données) et ETL
  • Faire un tour d'horizon des SGBD
  • Explorer le marché des ETL
  • Aprendre à utiliser un ETL avec un exemple pratique

Prérequis de la formation Introduction aux bases de données et ETL

  • Les participants à la formation devront maîtriser les bases de l'informatique bureautique (Excel, etc.)

Public visé de la formation Introduction aux bases de données et ETL

  • Cette formation s'adresse à toute personne appelée à travailler sur un projet décisionnel d'entreprise. (développeur, responsable de projet décisionnel, etc.)

Programme de la formation Introduction aux bases de données et ETL

PARTIE BASE DE DONNÉES

Introduction

  • Qu'est-ce qu'une base de données ?
  • Les éditeurs de bases de données du marché (Oracle, Microsoft...)
  • Les différents types de bases de données (en ligne, colonnaire, vectorielle....)

Les concepts de base

  • Les tables
  • Les attributs et les colonnes
  • Les différents types de données (chaîne de caractère, numérique, date, booléenne)
  • Une valeur particulière : NULL
  • Les contraintes des colonnes
  • Les clefs primaires et étrangères
  • La résolution de relations
  • Les contraintes d'intégrité

Les jointures

  • Croisée
  • Interne
  • Externe (Gauche / Droite)
  • Naturelle
  • Le produit cartésien

La normalisation

  • 1ère Forme Normale
  • 2ème Forme Normale
  • 3ème Forme Normale
  • Forme normale de BOYCE-CODD
  • Normalisation / Dé-normalisation : quel impact sur les performances, les volumétries ?

Les concepts avancés

  • Les indexes : un levier d'optimisation
  • Les vues / les vues matérialisées
  • Les fonctions
  • Les procédures stockées
  • Les triggers{/sliders

PARTIE ETL

Introduction

  • Qu'est-ce qu'un ETL ?
  • Comparatif avec du script SGBD
  • L'architecture fonctionnelle
  • Les différents ETL du marché
  • Les liens avec les SGBD

Les concepts de base

  • ETL compilant en SQL
  • ETL compilant en C
  • Types de données
  • Orchestration / Gouvernance

Algorithmie

  • La décomposition en éléments simples
  • Les boucles
  • La gestion des flux de données
  • Orchestration
  • Normalisation / Dé-normalisation

La qualité des données

  • La gestion des rejets
  • Les contraintes d'intégrité des données
  • Les formats des données

Les jointures

  • Les jointures internes
  • Les jointures externes
  • Avec et sans rejets

Les modalités de chargement

  • Insert / Update
  • Delete / Insert

La gestion des erreurs

  • Les erreurs techniques
  • Les erreurs fonctionnelles

Les concepts avancés

  • Le suivi de l'exploitation
  • Savoir choisir entre script et ETL
  • Choisir son ETL