Type de produit et caractéristiques de R
R est un langage de programmation et un logiciel libre pour le traitement des données et l’analyse statistique. Cet outil est disponible sous différentes distributions UNIX ainsi que Windows et MacOs.
Présentation et concept de R
Ce langage a été créé en 1993 par Robert Gentleman et Ross Ihaka, tous deux membres du département de statistiques de l’Université d’Auckland. R est un langage de haut niveau et s’interface aisément avec les langages C, C++ et Fortran pour des tâches de calcul intensif.
L’intérêt principal de R est la richesse des extensions mises librement à disposition. En effet l’écosystème de R compte plus de 16 000 packages couvrant un large panel de besoins et domaines fonctionnels.
Fonctionnalités principales de R
Il est possible de programmer en ligne de commande, toutefois les programmeurs apprécieront de pouvoir choisir l'environnement de développement (IDE) de leur choix. (RStudio, VS Code, ESS, Vim,...)
Génération de reporting
R permet de créer des rapports automatisés (avec R Markdown aux formats pdf, ppt, word, html, excel…) ou dynamique (application web R Shiny) avec des tableaux de données, des statistiques et des visualisations.
Traitement de données
R est un outil de préparation de données qui permet de :
- Nettoyer les données dans les bases de données variées (Oracle, MSSQL, PostgreSQL, MySQL, Hadoop Hive, Impala...)
- Analyser des tableaux de données volumineux (volumineux (Medium à Big Data avec des extensions tels que Spark)
Analyse de données
R dispose d’une vaste collection de packages destinés à l'analyse de données stastistiques (analyse descriptive, tests d'hypothèses détection d’outliers, ACP…)
R permet d'entraîner et d'utiliser des modèles de Machine Learning et de Deep Learning pour modéliser et prévoir des phénomènes.
Il est également possible d'analyser et modéliser d’autres formats de données tels que des séries temporelles, des données spatiales ou textuelles.
Réalisation de graphiques
Les graphiques courants sont facilement réalisables grâce à des fonctions prédéfinies. Ils sont aisément paramétrables (Titres, Légendes, Couleurs…).
Il est possible de réaliser des graphiques plus élaborés (Courbe de surface, graphiques 3D, nuages de points comparatifs, géo-ciblage). Le logiciel est très souple au niveau de la restitution graphique. En effet, des fonctions permettent à l’utilisateur de l’adapter à ses besoins.
Connectivité de R avec d’autres outils
Outre les traitements en local (au sein d’une capsule Docker éventuelle) il est possible de déployer les traitements sur des services Cloud tels que GCP, AWS, Azure, … Des packages R spécifiques ont été développé pour travailler avec ces plateformes.
R s’interface de plus par des API à d’autres outils tel que Keras, Torch, Tensorflow ou Spark pour effectuer des traitements avancés (par exemple : calcul distribué, Deep Learning). Il est également possible d’intégrer les traitements R dans des outils payants (SAS, PowerBI, WPS, Sage, …).
Avantages de R
- R est un langage activement développé (environ une nouvelle version majeure tous les 2 ans et plus de 1000 nouveaux packages publiés par an sur le CRAN (Comprehensive R Archive Network) soutenu par un fondation et un consortium comptant parmi ses sponsors : Microsoft, RStudio, Google,...)
- Le logiciel R est entièrement gratuit et possède son code source ouvert.
- L’écosystème des packages s’enrichit au fil des années grâce au développement communautaire.
- La restitution graphique est très élaborée avec la possibilité de créer des rapports automatisés et des applications Web.
- Combiné à Docker, un traitement R est figé dans le temps : Il n’y a pas de date d’expiration (de licence, de mise à jour, …).
Dans quels cas utiliser R ?
R est utilisé dans des domaines variés tels que l’industrie (lourde, pharmaceutique, agroalimentaire), la finance, la médecine ou l’écologie sur l’ensemble des étapes d’analyses de données pour :
- La manipulation et le nettoyage de données
- L'exploration de données, Data Mining
- Générer des reportings (statiques ou applications) avec statistiques et graphiques
- La mise en oeuvre de méthodes statistiques et des algorithmes de Machine Learning
Retour aux éditeurs de restitution
Vous souhaitez bénéficier d'experts, de développeurs ou d'une formation sur R ? Rendez vous sur la page Contact
Next Decision : les statisticiens sur R à Paris, Brest, Nantes, Niort, Rennes, Redon, Lyon, Grenoble, Saint-Etienne, Bordeaux, Toulouse, La Rochelle, Agen, Bayonne, Montpellier, Nîmes, Marseille, Aix-en-provence.
Un coup de main sur R en Région Parisienne, Ile de France, Bretagne, Centre-Val de Loire, Pays de la Loire, Nouvelle-Aquitaine, Occitanie, Auvergne-Rhône-Alpes, et Provence-Alpes-Côte d'Azur.