PDI (Pentaho Data Integration)

Editeur décisionnel ETL

Type de produit et caractéristiques de PDI

PDI (Pentaho Data Integration), qui était auparavant connu sous le nom de Kettle, est un logiciel d’ETL (Extract, Transform, Load) Open Source qui permet la conception ainsi que l’exécution des opérations de manipulation et de transformation de données très complexes.

Présentation et concept de PDI ETL

Son principal intérêt est de récupérer diverses sources dans divers formats, les traiter, les transformer, et former un résultat puis finalement exporter dans le format souhaité vers une destination souhaitée. Tout ceci se fait de visuellement en créant des étapes et en éditant le détail de chaque étape.

Exemples de sources et exports possibles :

  • Bases de données (plus de 37 sgbd - bases de données disponibles : Oracle, MySQL, SQL SERVER, NoSQL, Elasticsearch, Ibm db2, Base de données SQL ou NoSQL) Fichiers (XML, TXT, CSV, PSV, TSV) Récupération ou envoi depuis ou vers des FTP/SFTP…
  • Envoi / récupération depuis ou vers des e-mails / courriels

Fonctionnalités principales de PDI

PDI est une solution complète d'ETL comprenant :

  • Une bibliothèque constituée de 50 objets de mapping utilisables en clic-gauche ou clic-droit
  • Des données avancées pour le datawarehousing, l'opportunité de travailler via Query
  • Un moteur d'Exécution et Entreprise-classe scalability
  • Des connecteurs à des technologies du marché comme par exemple SAP
  • Possibilité d'appels de Webservices, de consommation d'un fichier xml ou REST en Data source
  • Alimentation de bases de données décisionnelles et solutions Big Data

L'intégration de données de Pentaho Data Integration est ouverte. L'intégration de données dans PDI repose sur une architecture normalisée et est ajustable à n'importe quel environnement ou solution de BI.

PDI (Pentaho Data Integration)

Avantages de PDI

  • Pentaho Data Integration bénéficie de deux modalités d'acquisition. Contrairement à ses confrères, la version communautaire de Pentaho est une version aboutie et fiable possédant quasiment toutes les fonctionnalités de la version payante. La version payante embarque un outil de supervision ainsi qu’un accès au support technique aux USA. 
  • Un large appui de point d'émission de données
  • Réutilisation facile des interrogations et des composants de transformation avec les modèles…
  • Exécution groupée des transformations d'ETL sous forme de pipeline
  • Possibilité d'avoir en données sources une requête SQ
  • Entièrement intégré avec la suite Open Source de Pentaho.
  • Possibilité de faire du Data Lineage entre les alimentations ETL de PDI et les reporting de Pentaho Report Design (faire le lien entre les métadonnées utilisés par l'ETL et les rapports)
  • Entièrement basé sur du Java (des scripts personnalisés sous forme de script java) et donc un studio sous éclipse. (À noter : aucun besoin de connaitre le langage JAVA.)
  • Une architecture extensible

Dans quels cas utiliser PDI ?

  • Pour les PME/PMI, Pentaho Data Integration peut être gratuit. (Une solution payante est aussi disponible avec plus de fonctionnalités.)
  • Migration de données d'une base à une autre
  • Alimentation d'un datawarehouse et de datamarts
  • Séquencement entre les alimentations et le rafraichissement de rapports Pentaho Report Design.

Retour aux éditeurs ETL

Vous souhaitez bénéficier d'experts, de développeurs ou d'une formation sur PDI ? Rendez vous sur la page Contact

Des développeurs Pentaho à Paris, Nantes, Cholet, Brest, La Roche-Sur-Yon, Angers, Le Mans, Rennes, Niort, Laval, Lyon, Grenoble, Saint-Etienne, Bordeaux, Toulouse, La Rochelle, Agen, Bayonne, Montpellier, Nîmes, Marseille, Aix-en-Provence

Des développeurs Pentaho en Région Parisienne, Ile de France, Pays de la Loire, Bretagne, Nouvelle-Aquitaine, Occitanie, Rhône, Auvergne-Rhône Alpes. C'est Next Decision !