GCP200DATAPLEX

Gérer un maillage de données avec Dataplex

Dataplex est une fabrique de données intelligente qui permet aux organisations de découvrir, gérer, surveiller et gouverner de manière centralisée leurs données à travers les lacs de données, les entrepôts de données et les datamarts. Vous pouvez utiliser Dataplex pour construire une architecture de maillage de données afin de décentraliser la propriété des données entre les propriétaires de domaines de données. Dans ce cours, vous apprendrez à découvrir, gérer, surveiller et gouverner vos données à travers les lacs de données, les entrepôts de données et les datamarts grâce à des conférences guidées et des exercices indépendants utilisant des données d'exemple.

Google Cloud
Formation officielle Google CloudNiveau Intermédiaire⏱️ 2 jours (14h)

Ce que vous allez apprendre

  • Identifier l'importance d'une plateforme de données moderne
  • Configurer et mettre en place Dataplex
  • Sécuriser les lacs de données, les zones et les actifs
  • Mettre en œuvre le balisage des ressources et utiliser les balises pour rechercher des actifs
  • Traiter les données à l'aide des tâches Dataplex
  • Concevoir, exécuter et rendre compte des processus de qualité des données

Prérequis

  • Avoir suivi les cours "Modernizing Data Lakes and Data Warehouses with Google Cloud" et "Building Batch Data Pipelines on Google Cloud" du parcours d'apprentissage "Data Engineer" ou posséder une expérience équivalente avec Google Cloud.

Public cible

  • Clients

Programme de la Formation

7 modules pour maîtriser les fondamentaux

Objectifs
  • Identifier l'importance d'une plateforme de données moderne
  • Expliquer le rôle de Dataplex sur Google Cloud
Sujets abordés
  • Plateformes de données modernes et conception orientée données
  • Piliers de la gouvernance des données
  • Qu'est-ce que Dataplex ?
  • Capacités de Dataplex
  • Comparaison de Dataplex avec d'autres produits sur Google Cloud
Objectifs
  • Définir les concepts clés de Dataplex
  • Configurer et mettre en place Dataplex
Sujets abordés
  • Qu'est-ce qu'un maillage de données ?
  • Concepts de Dataplex
  • Création de lacs de données et de zones
  • Actifs dans Dataplex
Activités

Lab : Provisionner un maillage de données avec Dataplex

Objectifs
  • Comprendre les différentes options de traitement des données dans Dataplex
  • Configurer et exécuter des tâches de préparation des données sur Dataplex
Sujets abordés
  • Traitement des données sur Dataplex
  • Tâches de préparation des données
  • Tâches d'ingestion
  • Tâches Dataflow et Spark
Activités

Lab : Standardiser les données à l'aide des tâches Dataplex

Objectifs
  • Sécuriser les lacs de données, les zones et les actifs dans Dataplex
Sujets abordés
  • Permissions et rôles IAM
  • Sécurisation de votre lac de données
  • Gestion des politiques
  • Sécurité des métadonnées
Activités

Lab : Gérer la sécurité des données avec Dataplex

Objectifs
  • Mettre en œuvre le balisage des ressources et utiliser les balises pour rechercher des actifs
Sujets abordés
  • Introduction au catalogue de données
  • Métadonnées techniques vs. métadonnées métier
  • Balises et modèles de balises
  • Entrées et groupes d'entrées
  • Lignage des données
Activités

Lab : Catalogue de données et lignage des données

Objectifs
  • Concevoir, exécuter et rendre compte des processus de qualité des données
Sujets abordés
  • Tâches de qualité des données et AutoDQ
  • Rapports sur la qualité des données
  • Profilage des données
Activités

Lab : Qualité des données et profilage de vos données dans BigQuery

Objectifs
  • Mettre en œuvre les bonnes pratiques pour Dataplex
Sujets abordés
  • Bonnes pratiques
  • Démonstration de bout en bout
Activités

Challenge Lab : Gérer un maillage de données avec Dataplex

Formations associées

SFEIR Institute
Best

dbt

Apprenez à transformer vos données avec dbt, l'outil de référence du Modern Data Stack. Vous commencerez par comprendre l'évolution des architectures data et la différence entre ETL et ELT. Vous installerez dbt, créerez votre premier projet et le connecterez à vos sources de données. Vous apprendrez ensuite à construire des modèles de données structurés, à choisir les bonnes options de matérialisation (table, view, incremental) et à organiser vos métadonnées avec les tags. Vous découvrirez comment référencer vos sources et gérer les dépendances entre modèles. Vous explorerez les fonctionnalités avancées : seeds pour initialiser vos données de référence, snapshots pour suivre l'historique et gérer les dimensions à évolution lente, macros Jinja et variables pour automatiser vos transformations. Enfin, vous mettrez en place des tests automatisés pour garantir la qualité de vos données, documenterez vos modèles avec le lineage, et découvrirez les packages de la communauté dbt. Formation pratique avec 60% de labs.

2 j
Fondamental
Google Cloud

Introduction à l'Analyse de Données sur Google Cloud

Ce cours est une introduction à l'analyse de données sur Google Cloud. Il est conçu pour les apprenants qui n'ont aucune expérience préalable de l'analyse de données ou de Google Cloud. Le cours couvre les bases de l'analyse de données, y compris la collecte, le stockage, l'exploration, la visualisation et le partage. Il présente également aux apprenants les outils et services d'analyse de données de Google Cloud. À travers des conférences vidéo, des démos, des quiz et des travaux pratiques, le cours montre comment passer des données brutes à des visualisations et des tableaux de bord percutants.

1 j
Fondamental

Prochaines sessions

2 avril 2026
Distanciel • Français
S'inscrire
9 juillet 2026
Distanciel • Français
S'inscrire
8 octobre 2026
Distanciel • Français
S'inscrire

Processus Qualité

L'engagement de SFEIR Institute : une démarche d'excellence pour garantir la qualité et la réussite de toutes nos formations. En savoir plus sur notre démarche qualité

Méthodes pédagogiques mobilisées
  • Lectures / Apports théoriques (Slides)Présentation de concepts via des supports visuels (PowerPoint, PDF).
  • Démonstration technique (Démos)Le formateur réalise une manipulation ou une procédure devant les apprenants.
  • Laboratoires dirigés (Labs)Mise en pratique guidée sur logiciel, machine ou environnement technique.
  • Quiz / QCMTest rapide de connaissances (format papier ou numérique type Kahoot/Klaxoon).
Dispositif d'évaluation et de suivi

L'atteinte des objectifs de la formation est évaluée à plusieurs niveaux pour garantir la qualité de la prestation :

  • Évaluation continue des acquis : Vérification des connaissances tout au long de la formation via des méthodes participatives (en fonction de la formation: quiz, exercices pratiques, mises en situation) sous la supervision du formateur.
  • Mesure de la progression : Dispositif d'auto-évaluation comparatif comprenant un diagnostic initial pour situer le niveau de départ, suivi d'une évaluation finale pour valider l'évolution des compétences.
  • Évaluation de la qualité : Questionnaire de satisfaction en fin de session pour mesurer la pertinence et l'efficacité de la formation ressentie par les participants.

1 580€ HT

par apprenant