dbt
Créez des workflows efficaces de gestion de données avec dbt
Ce que vous allez apprendre
- Comprendre les concepts clés, les avantages et l'architecture de dbt en tant qu'outil de transformation et de modélisation des données.
- Créer des modèles de données structurés avec dbt, et effectuer des transformations pour traiter et préparer les données en vue de l'analyse.
- Maîtriser les fonctionnalités avancées telles que les macros, les modèles Jinja, les variables et le contrôle de flux.
- Utiliser les instantanés (snapshots) dbt pour suivre les changements au fil du temps et gérer les données historiques, facilitant l'analyse des tendances historiques et les dimensions à changement lent.
- Mettre en œuvre des tests pour garantir la qualité et l'intégrité des données, permettant de valider les résultats des transformations et de détecter les anomalies.
Prérequis
- Des connaissances pratiques de SQL équivalentes au cours SQL les fondamentaux
Public cible
- Data Analysts, Data Engineers, Toute personne intéressée par la transformation des données
Programme de la Formation
13 modules pour maîtriser les fondamentaux
Sujets abordés
- →Évolution de la pile de données
- →Comprendre les différences entre les approches d'intégration de données Extract-Transform-Load (ETL) et Extract-Load-Transform (ELT)
- →Introduction à la pile de données moderne
Sujets abordés
- →Aperçu de dbt
- →Installation de dbt et configuration de l'environnement de développement
- →Créer un projet dbt
- →Connexion aux sources de données
Activités
Mise en place d'un projet dbt
Sujets abordés
- →Comprendre les modèles dbt
- →Comment fonctionnent les modèles de dbt ?
- →Options de matérialisation
- →Configuration de la matérialisation
- →Présentation de la fonctionnalité de tagging pour l'organisation des métadonnées
Activités
Créer des modèles de données avec dbt
Sujets abordés
- →Introduction aux sources dbt
- →Configuration des sources dbt
- →Travailler avec des références dbt
Activités
Configuration des sources dbt, référencement des données externes et gestion des dépendances du modèle
Sujets abordés
- →Introduction aux seeds dbt
- →Création et remplissage de données seed
- →Avantages de l'utilisation de seeds pour l'initialisation des données
- →Intégrer des seeds à vos modèles dbt
Activités
Créer et intégrer des seeds dans vos projets dbt
Sujets abordés
- →Comprendre les snapshots dans dbt
- →Configuration et définition de snapshots
- →Exécuter et gérer des snapshots
Activités
Mise en œuvre d'une stratégie de snapshots
Sujets abordés
- →Comprendre les macros
- →Jinja, un langage de modèles
- →Utiliser des variables pour gérer la configuration du pipeline de données
Activités
Transformation et contrôle avancés des données
Sujets abordés
- →Introduction aux packages dbt
- →Explorer le hub dbt
- →Installation et utilisation de package dbt
Activités
Explorer les packages dbt
Sujets abordés
- →Mettre en évidence les risques potentiels dans le code
- →Mise en place de tests automatisés
- →Choisir le test approprié
- →Implémentation des tests de données
Activités
Implémentation de tests de données
Sujets abordés
- →Documenter les modèles de données
- →Utiliser les fonctionnalités de documentation intégrées de dbt pour générer et maintenir une documentation de modèle accessible et à jour
- →L'importance du lineage
Activités
Documenter les modèles de DBT
Sujets abordés
- →Effectuer une analyse des données
- →Exécuter du code personnalisé avant et après l'exécution de dbt
- →Créer des assets de données partageables et accessibles
Activités
Créer une exposition
Sujets abordés
- →Comprendre manifest.json
- →Introduction de run_result.json
Sujets abordés
- →Ressources sur les meilleures pratiques en matière de dbt
- →À propos de l'examen de certification DBT
Processus Qualité
L'engagement de SFEIR Institute : une démarche d'excellence pour garantir la qualité et la réussite de toutes nos formations. En savoir plus sur notre démarche qualité
- Lectures / Apports théoriques (Slides) — Présentation de concepts via des supports visuels (PowerPoint, PDF).
- Démonstration technique (Démos) — Le formateur réalise une manipulation ou une procédure devant les apprenants.
- Laboratoires dirigés (Labs) — Mise en pratique guidée sur logiciel, machine ou environnement technique.
L'atteinte des objectifs de la formation est évaluée à plusieurs niveaux pour garantir la qualité de la prestation :
- Évaluation continue des acquis : Vérification des connaissances tout au long de la formation via des méthodes participatives (en fonction de la formation: quiz, exercices pratiques, mises en situation) sous la supervision du formateur.
- Mesure de la progression : Dispositif d'auto-évaluation comparatif comprenant un diagnostic initial pour situer le niveau de départ, suivi d'une évaluation finale pour valider l'évolution des compétences.
- Évaluation de la qualité : Questionnaire de satisfaction en fin de session pour mesurer la pertinence et l'efficacité de la formation ressentie par les participants.
Prochaines sessions
Aucune date ne vous convient ?
Nous organisons régulièrement de nouvelles sessions. Contactez-nous pour connaître les prochaines dates disponibles ou pour organiser une session à la date de votre choix.
S'inscrire à une date personnaliséeFormer plusieurs collaborateurs
- Tarifs dégressifs (plusieurs places)
- Session privée ou sur-mesure
- En présentiel ou à distance