Durée : 2 jours - 14 heures
Tarif : Nous contacter pour une formation INTER – INTRA ou en COURS PARTICULIER
Apprenez à exploiter Talend Open Studio for Data Quality pour analyser, nettoyer et améliorer la qualité des données de votre SI. Maîtrisez les indicateurs, règles métiers et automatisations essentielles.
La formation est délivrée en présentiel ou distanciel (e-learning, classe virtuelle, présentiel et à distance). Le formateur alterne entre méthodes démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation). La validation des acquis peut se faire via des études de cas, des quiz et/ou une certification.
Cette formation est animée par un consultant-formateur dont les compétences techniques, professionnelles et pédagogiques ont été validées par des diplômes et/ou testées et approuvées par l’éditeur et/ou par Audit Conseil Formation.
Bonnes connaissances des bases de données relationnelles et du SQL. Connaissances de base de Talend Open Studio for Data Integration.
- Evaluation des besoins et objectifs en pré et post formation
- Evaluation technique des connaissances en pré et post formation
- Evaluation générale du stage
L'évaluation de la qualité des données d'un système d'information.
Critères fondamentaux : exhaustivité, précision et intégrité des données.
Positionnement du produit Talend Open Studio for Data Quality dans la suite Talend.
Les métadonnées : connexions aux bases, fichiers délimités et fichiers Excel.
Présentation des différents types d'analyses.
Les outils et indicateurs d'aide à la réalisation des analyses.
L'explorateur de données.
Recherche de doublons, respect de contraintes d'intervalle, format de date, d'email...
Métriques d'une table, dépendances fonctionnelles entre colonnes.
Identification des redondances de valeurs.
Contrôles de cohérence entre clefs étrangères et primaires.
Utiliser les indicateurs, les modèles, les règles et les fichiers sources.
Analyse de schéma et de la structure des tables via l'explorateur de données.
Analyse multitable et multicolonne, respect de règles métiers.
Recherche et visualisation de corrélation entre colonnes.
Créer ses propres indicateurs et fichiers sources.
Gérer les analyses.
Utiliser des variables de contexte.
Créer des modèles basés sur des expressions régulières.
Exporter/importer les analyses et les données analysées.
Corriger les données erronées avec Talend Data Integration.