DBT

Formation dbt - 2 jours pour apprendre à transformer vos données

Apprenez à transformer vos données avec dbt, l'outil de référence du Modern Data Stack.

Vous commencerez par comprendre l'évolution des architectures data et la différence entre ETL et ELT. Vous installerez dbt, créerez votre premier projet et le connecterez à vos sources de données.

Vous apprendrez ensuite à construire des modèles de données structurés, à choisir les bonnes options de matérialisation (table, view, incremental) et à organiser vos métadonnées avec les tags. Vous découvrirez comment référencer vos sources et gérer les dépendances entre modèles.

Vous explorerez les fonctionnalités avancées : seeds pour initialiser vos données de référence, snapshots pour suivre l'historique et gérer les dimensions à évolution lente, macros Jinja et variables pour automatiser vos transformations.

Enfin, vous mettrez en place des tests automatisés pour garantir la qualité de vos données, documenterez vos modèles avec le lineage, et découvrirez les packages de la communauté dbt.

Formation pratique avec 60% de labs.

Formation officielle SFEIR InstituteNiveau Introduction⏱️ 2 jours (14h)

Ce que vous allez apprendre

  • Comprendre les concepts clés, les avantages et l'architecture de dbt en tant qu'outil de transformation et de modélisation des données.
  • Créer des modèles de données structurés avec dbt, et effectuer des transformations pour traiter et préparer les données en vue de l'analyse.
  • Maîtriser les fonctionnalités avancées telles que les macros, les modèles Jinja, les variables et le contrôle de flux.
  • Utiliser les instantanés (snapshots) dbt pour suivre les changements au fil du temps et gérer les données historiques, facilitant l'analyse des tendances historiques et les dimensions à changement lent.
  • Mettre en œuvre des tests pour garantir la qualité et l'intégrité des données, permettant de valider les résultats des transformations et de détecter les anomalies.

Prérequis

  • Des connaissances pratiques de SQL équivalentes au cours SQL les fondamentaux

Public cible

  • Data Analysts, Data Engineers, Toute personne intéressée par la transformation des données

Programme de la Formation

13 modules pour maîtriser les fondamentaux

Sujets abordés
  • Évolution de la pile de données
  • Comprendre les différences entre les approches d'intégration de données Extract-Transform-Load (ETL) et Extract-Load-Transform (ELT)
  • Introduction à la pile de données moderne
Sujets abordés
  • Aperçu de dbt
  • Installation de dbt et configuration de l'environnement de développement
  • Créer un projet dbt
  • Connexion aux sources de données
Activités

Mise en place d'un projet dbt

Sujets abordés
  • Comprendre les modèles dbt
  • Comment fonctionnent les modèles de dbt ?
  • Options de matérialisation
  • Configuration de la matérialisation
  • Présentation de la fonctionnalité de tagging pour l'organisation des métadonnées
Activités

Créer des modèles de données avec dbt

Sujets abordés
  • Introduction aux sources dbt
  • Configuration des sources dbt
  • Travailler avec des références dbt
Activités

Configuration des sources dbt, référencement des données externes et gestion des dépendances du modèle

Sujets abordés
  • Introduction aux seeds dbt
  • Création et remplissage de données seed
  • Avantages de l'utilisation de seeds pour l'initialisation des données
  • Intégrer des seeds à vos modèles dbt
Activités

Créer et intégrer des seeds dans vos projets dbt

Sujets abordés
  • Comprendre les snapshots dans dbt
  • Configuration et définition de snapshots
  • Exécuter et gérer des snapshots
Activités

Mise en œuvre d'une stratégie de snapshots

Sujets abordés
  • Comprendre les macros
  • Jinja, un langage de modèles
  • Utiliser des variables pour gérer la configuration du pipeline de données
Activités

Transformation et contrôle avancés des données

Sujets abordés
  • Introduction aux packages dbt
  • Explorer le hub dbt
  • Installation et utilisation de package dbt
Activités

Explorer les packages dbt

Sujets abordés
  • Mettre en évidence les risques potentiels dans le code
  • Mise en place de tests automatisés
  • Choisir le test approprié
  • Implémentation des tests de données
Activités

Implémentation de tests de données

Sujets abordés
  • Documenter les modèles de données
  • Utiliser les fonctionnalités de documentation intégrées de dbt pour générer et maintenir une documentation de modèle accessible et à jour
  • L'importance du lineage
Activités

Documenter les modèles de DBT

Sujets abordés
  • Effectuer une analyse des données
  • Exécuter du code personnalisé avant et après l'exécution de dbt
  • Créer des assets de données partageables et accessibles
Activités

Créer une exposition

Sujets abordés
  • Comprendre manifest.json
  • Introduction de run_result.json
Sujets abordés
  • Ressources sur les meilleures pratiques en matière de dbt
  • À propos de l'examen de certification DBT

Formations associées

SFEIR Institute
Best

SQL les fondamentaux

Maîtrisez les fondamentaux du SQL en 2 jours. Vous commencerez par comprendre l'histoire des systèmes de gestion de données et le rôle des bases relationnelles aujourd'hui. Vous apprendrez ensuite à manipuler vos données : insérer, modifier, supprimer et surtout interroger avec SELECT. Progressivement, vous maîtriserez les clauses WHERE, ORDER BY, LIMIT, puis les agrégations avec GROUP BY et HAVING. Vous découvrirez la puissance des jointures pour croiser plusieurs tables, les sous-requêtes et les Common Table Expressions (CTE) pour structurer vos requêtes complexes. Enfin, vous aborderez la conception de bases de données : modélisation entité-relation, normalisation, clés primaires et étrangères, index et vues. Formation pratique avec 60% de labs sur des cas concrets.

2 j
Fondamental
Google Cloud

Entreposage de données avec BigQuery : Conception du stockage, optimisation des requêtes et administration

Dans ce cours, vous découvrirez les composants internes de BigQuery et les meilleures pratiques pour la conception, l'optimisation et l'administration de votre entrepôt de données. Grâce à une combinaison de conférences, de démonstrations et de travaux pratiques, vous découvrirez l'architecture de BigQuery et comment concevoir un stockage et des schémas optimaux pour l'ingestion et les modifications de données. Ensuite, vous apprendrez des techniques pour améliorer les performances de lecture, optimiser les requêtes, gérer les charges de travail et utiliser les outils de journalisation et de surveillance. Vous découvrirez également les différents modèles de tarification. Enfin, vous apprendrez diverses méthodes pour sécuriser les données, automatiser les charges de travail et créer des modèles d'apprentissage automatique avec BigQuery ML.

3 j
Intermédiaire

Prochaines sessions

12 mars 2026
Distanciel • Français
Session garantie
S'inscrire
23 avril 2026
Distanciel • Français
S'inscrire
25 juin 2026
Distanciel • Français
S'inscrire
27 août 2026
Distanciel • Français
S'inscrire
22 octobre 2026
Distanciel • Français
S'inscrire
17 décembre 2026
Distanciel • Français
S'inscrire

Processus Qualité

L'engagement de SFEIR Institute : une démarche d'excellence pour garantir la qualité et la réussite de toutes nos formations. En savoir plus sur notre démarche qualité

Méthodes pédagogiques mobilisées
  • Lectures / Apports théoriques (Slides)Présentation de concepts via des supports visuels (PowerPoint, PDF).
  • Démonstration technique (Démos)Le formateur réalise une manipulation ou une procédure devant les apprenants.
  • Laboratoires dirigés (Labs)Mise en pratique guidée sur logiciel, machine ou environnement technique.
Dispositif d'évaluation et de suivi

L'atteinte des objectifs de la formation est évaluée à plusieurs niveaux pour garantir la qualité de la prestation :

  • Évaluation continue des acquis : Vérification des connaissances tout au long de la formation via des méthodes participatives (en fonction de la formation: quiz, exercices pratiques, mises en situation) sous la supervision du formateur.
  • Mesure de la progression : Dispositif d'auto-évaluation comparatif comprenant un diagnostic initial pour situer le niveau de départ, suivi d'une évaluation finale pour valider l'évolution des compétences.
  • Évaluation de la qualité : Questionnaire de satisfaction en fin de session pour mesurer la pertinence et l'efficacité de la formation ressentie par les participants.

Questions fréquentes

dbt s'inscrit dans l'approche ELT (Extract-Load-Transform) plutôt qu'ETL. Les données sont d'abord chargées dans le data warehouse, puis transformées avec dbt en utilisant du SQL. Cette approche tire parti de la puissance de calcul des data warehouses modernes et permet aux Data Analysts de gérer eux-mêmes leurs transformations.
Cette formation s'adresse aux Data Analysts, Data Engineers et Analytics Engineers qui souhaitent structurer leurs transformations de données. Une connaissance pratique de SQL est requise (niveau équivalent à notre formation SQL les fondamentaux). Aucune expérience préalable avec dbt n'est nécessaire.
Vous devez maîtriser les bases de SQL : SELECT, JOIN, GROUP BY, fonctions d'agrégation et sous-requêtes. Si vous n'êtes pas à l'aise avec ces concepts, nous recommandons de suivre d'abord notre formation SQL les fondamentaux.
La formation couvre les concepts fondamentaux de dbt et mentionne la certification dbt Analytics Engineering dans le module de conclusion. Pour préparer spécifiquement l'examen de certification, une pratique supplémentaire sur des projets réels est recommandée après la formation.
La formation alterne présentations théoriques et travaux pratiques. Chaque module est suivi d'exercices hands-on pour appliquer immédiatement les concepts : création de modèles, configuration de sources, implémentation de tests et documentation. Environ 60% du temps est dédié aux labs.
Nos organismes de formation SFEIR SAS et SFEIR-Est sont certifiés Qualiopi pour les actions de formation, ce qui permet de solliciter une prise en charge par votre OPCO. L'acceptation du financement reste à la discrétion de votre OPCO. Contactez-nous pour obtenir un devis.

1 580€ HT

par apprenant