Durée : 1 journée - 7 heures
Tarif : Nous contacter pour une formation INTER – INTRA ou en COURS PARTICULIER
Ce cours a pour objectif de vous apprendre à utiliser les packages dplyr et tidyr afin d'effectuer des manipulation de données via le langage R. Il s'adresse à toute personne qui souhaite manipuler des données avec le langage R, langage open source dédié à la data science.
La formation est délivrée en présentiel ou distanciel (e-learning, classe virtuelle, présentiel et à distance). Le formateur alterne entre méthodes démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation). La validation des acquis peut se faire via des études de cas, des quiz et/ou une certification.
Cette formation est animée par un consultant-formateur dont les compétences techniques, professionnelles et pédagogiques ont été validées par des diplômes et/ou testées et approuvées par l’éditeur et/ou par Audit Conseil Formation.
Connaissance préalable du langage R.
- Evaluation des besoins et objectifs en pré et post formation
- Evaluation technique des connaissances en pré et post formation
- Evaluation générale du stage
Accès à des données au format CSV.
Accès à d'autres formats de données (Excel, bases de données SQL, API...).
Introduction au package dplyr : syntaxe et pipe.
Manipulation d'observations (lignes).
Manipulation de variables (colonnes).
Création des tableaux de données résumées.
Gestion des jointures de données.
Re modélisation des données.
Complétion des valeurs manquantes.