Gérer un maillage de données avec Dataplex
Dataplex est une fabrique de données intelligente qui permet aux organisations de découvrir, gérer, surveiller et gouverner de manière centralisée leurs données à travers les lacs de données, les entrepôts de données et les datamarts. Vous pouvez utiliser Dataplex pour construire une architecture de maillage de données afin de décentraliser la propriété des données entre les propriétaires de domaines de données. Dans ce cours, vous apprendrez à découvrir, gérer, surveiller et gouverner vos données à travers les lacs de données, les entrepôts de données et les datamarts grâce à des conférences guidées et des exercices indépendants utilisant des données d'exemple.

Ce que vous allez apprendre
- Identifier l'importance d'une plateforme de données moderne
- Configurer et mettre en place Dataplex
- Sécuriser les lacs de données, les zones et les actifs
- Mettre en œuvre le balisage des ressources et utiliser les balises pour rechercher des actifs
- Traiter les données à l'aide des tâches Dataplex
- Concevoir, exécuter et rendre compte des processus de qualité des données
Prérequis
- Avoir suivi les cours "Modernizing Data Lakes and Data Warehouses with Google Cloud" et "Building Batch Data Pipelines on Google Cloud" du parcours d'apprentissage "Data Engineer" ou posséder une expérience équivalente avec Google Cloud.
Public cible
- Clients
Programme de la Formation
7 modules pour maîtriser les fondamentaux
Objectifs
- Identifier l'importance d'une plateforme de données moderne
- Expliquer le rôle de Dataplex sur Google Cloud
Sujets abordés
- →Plateformes de données modernes et conception orientée données
- →Piliers de la gouvernance des données
- →Qu'est-ce que Dataplex ?
- →Capacités de Dataplex
- →Comparaison de Dataplex avec d'autres produits sur Google Cloud
Objectifs
- Définir les concepts clés de Dataplex
- Configurer et mettre en place Dataplex
Sujets abordés
- →Qu'est-ce qu'un maillage de données ?
- →Concepts de Dataplex
- →Création de lacs de données et de zones
- →Actifs dans Dataplex
Activités
Lab : Provisionner un maillage de données avec Dataplex
Objectifs
- Comprendre les différentes options de traitement des données dans Dataplex
- Configurer et exécuter des tâches de préparation des données sur Dataplex
Sujets abordés
- →Traitement des données sur Dataplex
- →Tâches de préparation des données
- →Tâches d'ingestion
- →Tâches Dataflow et Spark
Activités
Lab : Standardiser les données à l'aide des tâches Dataplex
Objectifs
- Sécuriser les lacs de données, les zones et les actifs dans Dataplex
Sujets abordés
- →Permissions et rôles IAM
- →Sécurisation de votre lac de données
- →Gestion des politiques
- →Sécurité des métadonnées
Activités
Lab : Gérer la sécurité des données avec Dataplex
Objectifs
- Mettre en œuvre le balisage des ressources et utiliser les balises pour rechercher des actifs
Sujets abordés
- →Introduction au catalogue de données
- →Métadonnées techniques vs. métadonnées métier
- →Balises et modèles de balises
- →Entrées et groupes d'entrées
- →Lignage des données
Activités
Lab : Catalogue de données et lignage des données
Objectifs
- Concevoir, exécuter et rendre compte des processus de qualité des données
Sujets abordés
- →Tâches de qualité des données et AutoDQ
- →Rapports sur la qualité des données
- →Profilage des données
Activités
Lab : Qualité des données et profilage de vos données dans BigQuery
Objectifs
- Mettre en œuvre les bonnes pratiques pour Dataplex
Sujets abordés
- →Bonnes pratiques
- →Démonstration de bout en bout
Activités
Challenge Lab : Gérer un maillage de données avec Dataplex
Processus Qualité
L'engagement de SFEIR Institute : une démarche d'excellence pour garantir la qualité et la réussite de toutes nos formations. En savoir plus sur notre démarche qualité
- Lectures / Apports théoriques (Slides) — Présentation de concepts via des supports visuels (PowerPoint, PDF).
- Démonstration technique (Démos) — Le formateur réalise une manipulation ou une procédure devant les apprenants.
- Laboratoires dirigés (Labs) — Mise en pratique guidée sur logiciel, machine ou environnement technique.
- Quiz / QCM — Test rapide de connaissances (format papier ou numérique type Kahoot/Klaxoon).
L'atteinte des objectifs de la formation est évaluée à plusieurs niveaux pour garantir la qualité de la prestation :
- Évaluation continue des acquis : Vérification des connaissances tout au long de la formation via des méthodes participatives (en fonction de la formation: quiz, exercices pratiques, mises en situation) sous la supervision du formateur.
- Mesure de la progression : Dispositif d'auto-évaluation comparatif comprenant un diagnostic initial pour situer le niveau de départ, suivi d'une évaluation finale pour valider l'évolution des compétences.
- Évaluation de la qualité : Questionnaire de satisfaction en fin de session pour mesurer la pertinence et l'efficacité de la formation ressentie par les participants.
Prochaines sessions
Former plusieurs collaborateurs
- Tarifs dégressifs (plusieurs places)
- Session privée ou sur-mesure
- En présentiel ou à distance