Nos métiers

Nos métiers

Entre conseil, expertise et intégration, le cabinet Next Decision vous accompagne dans vos projets Data.

BI - Business intelligence

Big Data

Pilotage RSE / ESG

Organisation

Elaboration budgétaire

Gestion de la rémunération

MDM

Solution PIM

CRM

Gestion de projets

Business Apps

Google Apps

Contribution à l'enseignement
Editeurs BI

Editeurs BI

En tant que cabinet spécialisé dans l'informatique décisionnelle, Next Decision propose son expertise autour des technologies d'ETL.

ETL - Extract Transform Load

Effectuez des synchronisations massives d'information d'une source de données vers une autre.

Base de données

Préparez vos données de manière organisée au travers d’une structure adéquat.

Restitution

Présentez et analysez vos données.

Data Quality

Assurez-vous d'avoir des données propres et fiables.
Editeurs Big Data
Editeurs RSE / ESG
Autres éditeurs

Autres éditeurs

Nous vous accompagnons sur plusieurs champs technologiques pour développer vos projets digitaux.

MDM / PIM

ESB / API

Elaboration budgétaire

Gestion de la rémunération

Data Governance

PMO

Data Replication

Automatisation

BPM

GED

CRM

Modélisation

SIRH

E-Commerce
Formations

Formations

Next Decision vous accompagne dans votre formation et votre montée en compétence.

Théorie

Base de données

ETL

DevOps

Restitution

Big Data

MDM

RSE / ESG

ESB / API

Elaboration budgétaire

Organisation Digitalisation

UX / UI
Qui sommes-nous ?

Qui sommes-nous ?

“Ne pas se prendre au sérieux, tout en le faisant sérieusement”

Découvrir Next Decision

Découvrez l’histoire, l’esprit et l’ADN de l’entreprise de Data la plus décalée.

Actualités

Découvrez les événements que nous organisons.

Mécénat et engagement

Next Decision attache de l’importance aux valeurs humaines, elle le montre dans plusieurs projets à impact positif.
Recrutement
Wiki

Apache Spark

En tant qu'expert décisionnel, Next Decision met à disposition des outils adaptés à la restitution de données. Découvrez l'éditeur Apache Spark.

Spark est un framework, qui permet le travail sur les données de manière distribuée. C’est l’une des principales solutions de traitement de l’écosystème Hadoop. En liant Spark à Hadoop, il devient possible de répartir la charge de travail de données sur plusieurs serveurs, pour le stockage et le traitement. Cette configuration est très appréciée pour l’analyse de grands volumes de données.

Spark est un projet Open Source créé en 2009. Il a initialement été développé à l'Université de Californie, par l’AMPLab de Berkeley. En 2010, le code source a été remis à l’Apache Software Foundation qui est actuellement en charge de la maintenance du projet.

Tous les grands éditeurs de distributions Hadoop proposent un support pour Spark : Cloudera, MapR, Hortonworks.

Les composants Spark

Spark, pour travailler sur des données en Batch
Spark Streaming, pour travailler sur des flux de données
Spark MLlib, un ensemble d’algorithme pour faire du Machine Learning
Spark SQL, permet de travailler les données avec du SQL
Spark GraphX, permet de manipuler les données en mode graphe

Apache Spark

Chaque facette du framework Spark peut être complémentaire en fonction des différents cas d’usages. Il va vous permettre de tirer parti des données de votre entreprise, des données exogènes ou encore manipuler les données issues de l’internet des objets. Avec Hadoop, Spark permettra de construire un Datawarehouse ou un Data Lake. L’objectif étant de pouvoir restituer les données de manière efficace, sous forme de tableau de bord ou avec des systèmes d’analyses avancés.

Les avantages de Spark

Permettre de travailler sur de grandes volumétries de données sans augmenter les temps de traitement.
Faire évoluer le système en fonction des besoins.
Travailler avec des données de différents formats.
Implémentation des nouveaux types de traitements : Streaming, Machine Learning, Graphe.

Les avantages de Spark par rapport à MapReduce

Spark est rapide :

10x plus rapide sur disque
100x plus rapide en mémoire

Spark simplifie le développement :

Ecriture simplifiée des programmes
Plus de méthodes natives
La possibilité de travailler avec un shell interactif
Un code plus efficient

Plusieurs modes de déploiement sont disponibles dans Spark :

Mesos
Yarn
Standalone
Local

Spark possède plusieurs modes de stockage :

HDFS
Google Cloud Storage
HBase
Hive

Stack unifié permet de travailler sur différentes structures de données :

Batch
Streaming
Analyses Interactives

Spark supporte plusieurs langages :

Scala
Python
Java
R

Les différents cas d'usage de Spark

Pour un opérateur télécom, Spark sert à mettre en place une solution d’alerte de sécurité à partir de différentes sources de données : les médias sociaux, les enregistrements DNS, les logs des serveurs. Il peut rassembler ces différentes informations pour générer les rapports de sécurité pour ses clients. L’utilisation de Spark permet d’analyser des millions d’événements et de gérer l’intégration de nouvelles données en temps réel.

Dans le domaine de la diffusion TV sur le câble, Spark peut analyser les audiences en fonction de la diffusion des programmes, et ce pour des chaînes retransmises sur différents continents. En analysant à la fois des données des programmes et des métadonnées des téléspectateurs, il permet au diffuseur d’adapter ses programmes et les campagnes publicitaires.

Spark est utilisé dans le médicale pour l’analyse du génome humain. Il a permis de réduire le traitement de plusieurs semaines à moins d’une heure.

Dans quels cas utiliser Spark ?

Next Decision préconise l’utilisation de Spark dans la majorité des projets Big Data. C’est le couteau suisse du traitement de données, à la fois multifonction et performant.

Retour aux éditeurs ETL

Vous souhaitez bénéficier d'experts, de développeurs ou d'une formation sur Apache Spark ? Rendez vous sur la page Contact

Analysez des millions de données avec Apache Spark à Paris, Brest, Rennes, Nantes, La Roche Sur Yon, Angers, Le Mans, Niort, Laval, Lyon, Grenoble, Saint-Etienne, Bordeaux, Toulouse, La Rochelle, Agen, Bayonne, Montpellier, Perpignan, Toulon, Avignon, Ales...

Réalisez vos projets Big Data avec Spark en Bretagne, Région Parisienne, Île de France, Pays de la Loire, Centre-Val de Loire, Nouvelle-Aquitaine, Occitanie, Auvergne-Rhône-Alpes et Provence-Alpes-Côte d'Azur.

Web Demo Apache Spark

Suivez notre prochaine Web Demo sur la technologie :

Apache Spark

Le Mardi 30/07/2024 10:00:00

Besoin d'une réponse rapidement ?

Laissez-nous vos coordonnées et nous vous rappellerons sous 24 heures.