Date de dernière mise à jour du plan : 08/01/2024

Durée : 2 jours


La formation "État de l'art de la Data" est dispensée à Nantes, Brest, Rennes, Angers, Lille, Paris, Lyon, Montpellier, Toulouse, Bordeaux

Le traitement de problématiques Data devient plus en plus complexe, avec le nombre de sources de données différentes (données structurées, non-structurées) et les solutions / architectures en perpétuelle évolution. De plus, l’essor de l’IA (Intelligence Artificielle ou AI en anglais), notamment du Machine Learning, pose des questions quant aux cas d’usages potentiels. Le but de cette formation est donc de proposer un panorama complet des solutions de BI (Business Intelligence), puis d’expliquer l’enjeu des projets Big Data et ce qu’il est possible d’attendre de projets d’IA. Enfin, un chapitre sur le droit, la réglementation et les problèmes éthiques soulevés par ces projets est prévu, afin que vous ayez toutes les cartes en main pour vos futurs projets.

Objectifs de la formation Etat de l'art de la Data

  • Comprendre et mesurer les enjeux d’un projet Data
  • Apprendre à utiliser les outils de l’informatique de la Data
  • Concevoir des modèles de données décisionnels et Datalake
  • Analyser les données

Prérequis de la formation Etat de l'art de la Data

  • Les participants devront être familiarisés avec les principes de l'informatique bureautique.

Public vidé de la formation Etat de l'art de la Data

  • Toute personne destinée à être positionnée sur un projet décisionnel et/ou Big Data d’entreprise.

Programme de la formation Etat de l'art de la Data

Business Intelligence (BI) ou décisionnel

  • Constats amenant à des projets d’ordre BI
  • Introduction au décisionnel
  • Historique des concepts clef de la BI

Le flux de la donnée

  • Comprendre le flux de la donnée, des sources vers la cible
  • Le concept de nuit applicative ou overnight schedule
  • Le mode batch VS le mode streaming

Les briques d’un sid (système d’information décisionnel)

  • Présentation de l’offre autour des ETL (Extract Transform Load)
  • Présentation de l’offre autour des SGBD (Bases de données relationnelles) pour les entrepôts de données et les datamart
  • Présentation des solutions de stockage spécialisées (OLAP / Bases colonnaires / etc.)
  • Présentation de l’offre autour des solutions de restitution (reporting d’entreprise et Dataviz)

La modélisation décisionnelle

  • Modélisation entité relation vs modélisation dimensionnelle
  • Méthodes pour réaliser des modélisations (dictionnaire de données, matrice dimensionnelle, etc.)

Focus sur les SGBD

  • Contenu d’un SGBD (Système de gestion de base de données : tables / relations / clefs primaires / etc.)
  • Introduction au langage d’interrogation des bases de données relationnelles : le SQL

Méthode projet

  • Les différentes phases d’un projet décisionnel
  • Cycle de vie d'un projet décisionnel

Introduction à la qualité de la donnée

  • Présentation des MDM (Master Data Management)
  • Illustration de problématiques courantes de qualité de données
  • Pourquoi le manque de qualité peut freiner les projets Data

Le big data

  • Préambule au Big Data : historique du Big Data
  • Les types de contenus (structuré / semi-structuré / non-structuré)
  • Les types de données (endogènes / exogènes) OpenData
  • Les 5 V du Big Data
  • L’architecture Big Data (Datalake, Datamart)
  • Datalake vs Datawarehouse : deux usages différents
  • Présentation du framework Hadoop
  • Le NOSQL : Théorème de CAP, types de bases de données NOSQL
  • Le Big Data : Évolution de la BI ?

Les métiers de la data

  • Consultant BI
  • Data Engineer
  • Data Scientist
  • Data Analyst

Introduction à l’Intelligence Artificielle (IA) et à la Data Science

  • IA Forte / IA Faible
  • Machine Learning / Deep Learning
  • Biais cognitifs : Et si les machines raisonnaient mieux que nous ?
  • Derrière l’IA : les cas d’usages en entreprise
  • Synergies entre Big Data et IA
  • Le choix du langage (R ? Python ? SAS ? Spark ?)
  • La validation croisée
  • Les algorithmes (supervisé / non-supervisé, classification / régression)

Droit et réglementation

  • Présentation de la CNIL (Historique et missions)
  • Données à caractère personnel
  • Règles à respecter
  • Les droits des clients
  • RGPD
  • Étude de cas : IA et éthique