Date de dernière mise à jour du plan : 03/01/2024
Durée : 3 jours
La formation Langage R est dispensée à Nantes, Bordeaux, Paris, Angers, Lille, Brest, Lyon, Montpellier, Toulouse, Rennes
Cette formation est une introduction au Langage R dans le but de manipuler et traiter des données, de faire des analyses statistiques et des restitutions graphiques.
Objectifs de la formation Langage R
- Maîtriser les bases du logiciel pour le traitement des données et pour l'analyse statistique
- Permettre à l'utilisateur de créer et modifier des programmes R
Prérequis de la formation Langage R
- Connaître les principes de l'informatique bureautique (traitements de données avec un outil de type tableau, ex : Excel...)
- Avoir des connaissances en statistiques
Public visé de la formation Langage R
- La formation Langage R traitement de données et analyses stastistiques s'adresse à des débutants.
Programme de la formation Langage R
Présentation du logiciel r
- Logiciel en Open source
- Les capacités de R
- L'utilisation du logiciel R
- Dans quels domaines ?
Présentation du logiciel r-studio
- La console
- Le script
- L'environnement
- Les files
- Les plots
- Les packages
- Help, outil d'aide de R
Présentation des objets et du fonctionnement de r
- Les vecteurs et les facteurs
- Les listes
- Les matrices et les arrays
- Les data frames
- Les fonctions
Les packages r
- Installation d'un package
- Chargement d'un package
- Les packages R les plus utilisés
Manipulation d'objets dans r
- Création d'objets
- Vecteur
- Facteur
- Liste
- Matrice
- Array
- Data Frame
- Fonction
- Suppression d'objets
- Import et export des données
- Importation / exportation de fichiers plats (CSV, Text, ...)
- Importation / exportation de fichiers Excel (.xls, xlsx)
- Importation / exportation de fichiers R (.RData, .R)
- Le traitement des données
- Trier un jeu de données
- Renommer des colonnes et des lignes d'un jeu de données
- Sélectionner des données au sein d'un tableau
- Supprimer des données d'un jeu de données
- Utilisation de la fonction merge pour joindre des data frames
- La concaténation
- Ajouter des colonnes à un data frame avec la fonction cbind
- Ajouter des lignes à un data frame avec la fonction rbind
- Création d'indicateurs
Stastistiques descriptives dans r
- Les fonctions usuelles
- Apply
- Aggregate
- Les indicateurs de statistiques simples
- Summary
- Sum (Somme)
- Mean (Moyenne)
- Var (Variance)
- Sd (Ecart type)
- Min (Minimum)
- Max (Maximum)
- Les représentations de graphiques simples
- Plot (Graphique de base)
- Pie (Diagramme circulaire)
- Barplot (Diagramme en barres)
- Boxplot (Boîtes à moustaches)
- Exemples de graphiques avec le package Ggplot2
Estimation et tests statistiques
- Les intervalles de confiance
- Utilisation de la fonction t.test pour un intervalle de confiance d'une moyenne
- Utilisation de la fonction prop.test pour un intrevalle de confiance d'une proportion
- Les tests de normalité
- La fonction ks.test (Test de Kolmogorov-Smirnov)
- La fonction shapiro.test (Test de Shapiro-Wilk)
- Les tests de comparaison de moyennes et de proportions
- La fonction t.test (Test de Student)
- La fonction wilcox.test (Test de Wilkoxon-Man-Whitney)
- La fonction fisher.test (Test de Fisher)
- La fonction chisq.test (Test du Khi²)
Lien entre plusieurs variables
- Obtenir le lien de corrélation entre deux variables avec la fonction cor
- Faire une régression linéaire multiple avec les fonctions lm et (Linear model) et glm (Generalized linear model)
- Analyser la variance avec la fonction anova
- Procéder à un test sur plusieurs variables avec la fonction kruskal.test
Les analyses multivariées
- Réaliser une classification ascendante hiérarchique avec les fonctions dist et hclust
- La fonction kmeans
- Faire une régression logistique avec la fonction glm
Pour aller plus loin avec r
- Exemple d'interface avec RShiny
- Exemple d'utilisation de RMarkdown
- Utilisation avec un autre langage
- SQL
- C++
- Python