Entreposage de données avec BigQuery : Conception du stockage, optimisation des requêtes et administration
Dans ce cours, vous découvrirez les composants internes de BigQuery et les meilleures pratiques pour la conception, l'optimisation et l'administration de votre entrepôt de données. Grâce à une combinaison de conférences, de démonstrations et de travaux pratiques, vous découvrirez l'architecture de BigQuery et comment concevoir un stockage et des schémas optimaux pour l'ingestion et les modifications de données. Ensuite, vous apprendrez des techniques pour améliorer les performances de lecture, optimiser les requêtes, gérer les charges de travail et utiliser les outils de journalisation et de surveillance. Vous découvrirez également les différents modèles de tarification. Enfin, vous apprendrez diverses méthodes pour sécuriser les données, automatiser les charges de travail et créer des modèles d'apprentissage automatique avec BigQuery ML.
Ce que vous allez apprendre
- Décrire les principes fondamentaux de l'architecture BigQuery.
- Mettre en œuvre des modèles de conception de stockage et de schéma pour améliorer les performances.
- Utiliser DML et planifier des transferts de données pour ingérer des données.
- Appliquer les meilleures pratiques pour améliorer l'efficacité de la lecture et optimiser les performances des requêtes.
- Gérer la capacité et automatiser les charges de travail.
- Comprendre les modèles par rapport aux anti-modèles pour optimiser les requêtes et améliorer les performances de lecture.
- Utiliser des outils de journalisation et de surveillance pour comprendre et optimiser les modèles d'utilisation.
- Appliquer les meilleures pratiques de sécurité pour gouverner les données et les ressources.
- Créer et déployer plusieurs catégories de modèles d'apprentissage automatique avec BigQuery ML.
Prérequis
- Introduction à l'ingénierie des données
Public cible
- Analystes de données, scientifiques des données, ingénieurs de données et développeurs qui effectuent des travaux à une échelle nécessitant une connaissance avancée des composants internes de BigQuery pour optimiser les performances.
Programme de la Formation
11 modules pour maîtriser les fondamentaux
Objectifs
- Expliquer les avantages du stockage en colonnes.
- Comprendre comment BigQuery traite les données.
- Explorer les bases du service de répartition de BigQuery pour améliorer l'efficacité des requêtes.
Sujets abordés
- →Introduction
- →Infrastructure principale de BigQuery
- →Stockage BigQuery
- →Traitement des requêtes BigQuery
- →Répartition des données BigQuery
Activités
Travaux pratiques et démos
Processus Qualité
L'engagement de SFEIR Institute : une démarche d'excellence pour garantir la qualité et la réussite de toutes nos formations. En savoir plus sur notre démarche qualité
- Lectures / Apports théoriques (Slides) — Présentation de concepts via des supports visuels (PowerPoint, PDF).
- Démonstration technique (Démos) — Le formateur réalise une manipulation ou une procédure devant les apprenants.
- Laboratoires dirigés (Labs) — Mise en pratique guidée sur logiciel, machine ou environnement technique.
- Quiz / QCM — Test rapide de connaissances (format papier ou numérique type Kahoot/Klaxoon).
L'atteinte des objectifs de la formation est évaluée à plusieurs niveaux pour garantir la qualité de la prestation :
- Évaluation continue des acquis : Vérification des connaissances tout au long de la formation via des méthodes participatives (en fonction de la formation: quiz, exercices pratiques, mises en situation) sous la supervision du formateur.
- Mesure de la progression : Dispositif d'auto-évaluation comparatif comprenant un diagnostic initial pour situer le niveau de départ, suivi d'une évaluation finale pour valider l'évolution des compétences.
- Évaluation de la qualité : Questionnaire de satisfaction en fin de session pour mesurer la pertinence et l'efficacité de la formation ressentie par les participants.
Prochaines sessions
Former plusieurs collaborateurs
- Tarifs dégressifs (plusieurs places)
- Session privée ou sur-mesure
- En présentiel ou à distance