Ingénierie des données sur Google Cloud
Acquérez une expérience pratique dans la conception et la création de systèmes de traitement de données sur Google Cloud. Ce cours utilise des conférences, des démonstrations et des travaux pratiques pour vous montrer comment concevoir des systèmes de traitement de données, créer des pipelines de données de bout en bout et analyser des données. Ce cours couvre les données structurées, non structurées et en streaming.
Ce que vous allez apprendre
- Concevoir et créer des systèmes de traitement de données sur Google Cloud.
- Traiter des données en batch et en streaming en implémentant des pipelines de données à mise à l'échelle automatique sur Dataflow.
- Tirer des informations commerciales à partir de très grands ensembles de données à l'aide de BigQuery.
- Exploiter les données non structurées à l'aide de Spark et des API ML sur Dataproc.
- Permettre des analyses instantanées à partir des données en streaming.
Prérequis
- Expérience préalable de Google Cloud en utilisant Cloud Shell et en accédant aux produits depuis la console Google Cloud.
- Maîtrise de base d'un langage de requête courant tel que SQL.
- Expérience en modélisation de données et en activités ETL (extraction, transformation, chargement).
- Expérience dans le développement d'applications à l'aide d'un langage de programmation courant tel que Python.
Public cible
- Ingénieurs de données, Administrateurs de bases de données, Administrateurs système
Programme de la Formation
18 modules pour maîtriser les fondamentaux
Objectifs
- Expliquer le rôle d'un ingénieur de données.
- Comprendre les différences entre une source de données et un récepteur de données.
- Expliquer les différents types de formats de données.
- Expliquer les options de solutions de stockage sur Google Cloud.
- En savoir plus sur les options de gestion des métadonnées sur Google Cloud.
- Comprendre comment partager facilement des ensembles de données avec Analytics Hub.
- Comprendre comment charger des données dans BigQuery à l'aide de la console Google Cloud et/ou de la CLI gcloud.
Sujets abordés
- →Le rôle d'un ingénieur de données
- →Sources de données versus synchronisations de données
- →Formats de données
- →Options de solutions de stockage sur Google Cloud
- →Options de gestion des métadonnées sur Google Cloud
- →Partager des ensembles de données avec Analytics Hub
Activités
Lab : Chargement de données dans BigQuery
Processus Qualité
L'engagement de SFEIR Institute : une démarche d'excellence pour garantir la qualité et la réussite de toutes nos formations. En savoir plus sur notre démarche qualité
- Lectures / Apports théoriques (Slides) — Présentation de concepts via des supports visuels (PowerPoint, PDF).
- Démonstration technique (Démos) — Le formateur réalise une manipulation ou une procédure devant les apprenants.
- Laboratoires dirigés (Labs) — Mise en pratique guidée sur logiciel, machine ou environnement technique.
- Quiz / QCM — Test rapide de connaissances (format papier ou numérique type Kahoot/Klaxoon).
L'atteinte des objectifs de la formation est évaluée à plusieurs niveaux pour garantir la qualité de la prestation :
- Évaluation continue des acquis : Vérification des connaissances tout au long de la formation via des méthodes participatives (en fonction de la formation: quiz, exercices pratiques, mises en situation) sous la supervision du formateur.
- Mesure de la progression : Dispositif d'auto-évaluation comparatif comprenant un diagnostic initial pour situer le niveau de départ, suivi d'une évaluation finale pour valider l'évolution des compétences.
- Évaluation de la qualité : Questionnaire de satisfaction en fin de session pour mesurer la pertinence et l'efficacité de la formation ressentie par les participants.
Prochaines sessions
Former plusieurs collaborateurs
- Tarifs dégressifs (plusieurs places)
- Session privée ou sur-mesure
- En présentiel ou à distance