Logging, Monitoring, and Observability in Google Cloud
Surveiller, dépanner et améliorer les performances des infrastructures et applications dans Google Cloud
Présentation du cours
Ce cours enseigne aux participants des techniques de surveillance et d’amélioration des performances de l’infrastructure et des applications dans Google Cloud.
À l’aide d’une combinaison de présentations, de démonstrations, de laboratoires pratiques et d’études de cas réels, les participants acquièrent de l’expérience dans la surveillance complète de la pile, la gestion et l’analyse des journaux en temps réel, le débogage du code en production, le traçage des goulots d’étranglement des performances des applications et le profilage du processeur. et l’utilisation de la mémoire.
Objectifs pédagogiques
- Planifier et mettre en œuvre une infrastructure de journalisation et de surveillance bien conçue
- Définir des indicateurs de niveau de service (SLI) et des objectifs de niveau de service (SLO)
- Créer des tableaux de bord et des alertes de surveillance efficaces
- Surveiller, dépanner et améliorer l’infrastructure Google Cloud
- Analyser et exporter les journaux d’audit Google Cloud
- Identifier les défauts du code de production, identifier les goulots d’étranglement et améliorer les performances
- Optimiser les coûts de surveillance
Public cible
- Architectes cloud, administrateurs et personnel SysOps
- Développeurs cloud et personnel DevOps
Prérequis
- Avoir suivi la formation Google Cloud Platform Fundamentals: Core Infrastructure ou avoir une expérience équivalente
- Connaissance de base des scripts ou du codage
- Maîtrise des outils de ligne de commande et de l’environnement du système d’exploitation Linux
Programme
zModule 1: Introduction aux outils de surveillance Google Cloud
- Comprendre l’objectif et les capacités des composants Google Cloud axés sur les opérations: journalisation, surveillance, rapports d’erreur et surveillance des services
- Comprendre l’objectif et les capacités des composants Google Cloud composants axés sur la gestion des performances des applications: débogueur, traceur, et profileur
Module 2: Éviter aux clients des situations douloureuses
- Construire une base de surveillance sur les quatre signaux d’or: latence, trafic, erreurs et saturation
- Mesurez la souffrance des clients avec les SLI
- Définir des mesures de performances critiques
- Créer et utiliser des SLO et SLA
- Atteindre l’harmonie des développeurs et des opérations avec les budgets d’erreur
Module 3: Surveillance des systèmes critiques
- Choisir les meilleures pratiques de surveillance de projet d’architecture
- Différencier les rôles Cloud IAM pour la surveillance
- Utiliser les tableaux de bord par défaut de manière appropriée
- Créer des tableaux de bord personnalisés pour montrer la consommation des ressources et
la charge d’application - Définir des contrôles de disponibilité pour suivre la vitalité et la latence
Module 4: Politiques d’alerte
- Développer des stratégies d’alerte
- Définir des politiques d’alerte
- Ajouter des canaux de notification
- Identifier les types d’alertes et les utilisations courantes de chacune
- Construire et alerter sur les groupes de ressources
- Gérer les politiques d’alerte par programmation
Module 5: Journalisation et analyse avancées
- Identifier et choisir parmi les approches d’étiquetage des ressources
- Définir les récepteurs de journaux (filtres d’inclusion) et les filtres d’exclusion
- Créer des métriques basées sur les journaux
- Définir des métriques personnalisées
- Lier les erreurs d’application à la journalisation à l’aide du rapport d’erreurs
- Exporter les journaux vers BigQuery
Module 6: Utilisation des journaux d’audit
- Journaux d’audit
- Journalisation des accès aux données
- Format d’entrée des journaux d’audit
- Bonnes pratiques
Module 7: Configurer les services d’observabilité Google Cloud
- Intégrer des agents de journalisation et de surveillance dans les VM et les images Compute Engine
- Activer et utiliser la surveillance Kubernetes
- Étendre et clarifier la surveillance Kubernetes avec Prometheus
- Exposer des métriques personnalisées via du code et à l’aide de OpenCensus
Module 8: Surveillance de Google Cloud VPC
- Collecter et analyser les journaux de flux VPC et les journaux des règles de pare-feu
- Activer et surveiller le Packet Mirroring
- Expliquer les capacités de Network Intelligence Center
- Utiliser les journaux d’audit des activités d’administration pour suivre les modifications apportées à la configuration ou aux métadonnées des ressources
- Utiliser les journaux d’audit d’accès aux données pour suivre les accès ou les modifications des données de ressources fournies par l’utilisateur
- Utiliser les journaux d’audit des événements système pour suivre les actions administratives de GCP
Module 9: Gérer les incidents
- Définir les rôles de gestion des incidents et les canaux de communication
- Atténuer l’impact des incidents
- Dépanner les causes profondes
- Résoudre les incidents
- Documenter les incidents dans un processus post-mortem
Module 10: Étude des problèmes de performances des applications
- Déboguer le code de production pour corriger les défauts de code
- Tracer la latence à travers les couches d’interaction de service pour éliminer goulots d’étranglement de performance
- Profilage et identification des fonctions gourmandes en ressources dans une application
Module 11: Optimiser les coûts de surveillance
- Analyser l’utilisation des ressources pour surveiller les composants associés dans Google Cloud
- Mettre en œuvre les meilleures pratiques pour contrôler le coût de la surveillance au sein Google Cloud
Nos sessions de formations
Ce cours vous intéresse ?
Demandez un devis
personnalisée ? Contactez-nous