Introduction aux données sur Google Cloud Platform
- Mettre en évidence les défis analytiques rencontrés par les analystes de données.
- Comparer le big data on-premises versus dans le cloud.
- Apprendre des cas d’utilisation réels d’entreprises transformées grâce à l’analyse dans le cloud.
- Parcourir les bases d’un projet Google Cloud Platform.
Travaux pratiques
Premiers pas avec Google Cloud Platform
Présentation des outils de big data
- Présentation des tâches, des défis et des outils de données de Google Cloud Platform.
- Démonstration : analyser 10 milliards d’enregistrements avec Google BigQuery.
- Découvrir les neuf fonctionnalités fondamentales de Google BigQuery.
- Comparer les outils GCP pour les analystes, les scientifiques de données et les ingénieurs de données.
Travaux pratiques
Explorer des ensembles de données avec Google BigQuery.
Exploration de vos données avec SQL
- Comparer les techniques courantes d’exploration de données.
- Apprendre à coder du SQL standard de haute qualité.
- Explorer les ensembles de données publics Google BigQuery.
- Aperçu de la visualisation : Google Data Studio.
Travaux pratiques
Résoudre les erreurs SQL courantes.
Tarification de Google BigQuery
- Présentation d'une tâche BigQuery.
- Calculer les tarifs de BigQuery : coûts de stockage, d'interrogation et de streaming.
- Optimiser les requêtes pour le coût.
Travaux pratiques
Calculer les tarifs de Google BigQuery.
Nettoyage et transformation de vos données
- Examiner les cinq principes de l’intégrité des ensembles de données.
- Caractériser la forme et le biais d’un jeu de données.
- Nettoyer et transformer des données à l’aide de SQL.
- Nettoyer et transformer les données à l’aide d’une nouvelle interface utilisateur : présentation de Cloud Dataprep.
Travaux pratiques
Explorer et mettre en forme des données avec Cloud Dataprep
Stockage et exportation de données
- Comparer les tables permanentes et temporaires.
- Enregistrer et exporter les résultats de requête.
- Performance Preview : Query Cache.
Travaux pratiques
Créer de nouvelles tables permanentes.
Ingestion de nouveaux ensembles de données dans Google BigQuery
- Créer des requêtes à partir de sources de données externes.
- Éviter les pièges de l'ingestion de données.
- Ingérer de nouvelles données dans des tables permanentes.
- Discuter des inserts en streaming.
Travaux pratiques
Ingérer et interroger de nouveaux ensembles de données.
Visualisation des données
- Présentation des principes de visualisation des données.
- Approches d'analyses exploratoires versus explicatives.
- Démonstration : Google Data Studio UI.
- Connexion de Google Data Studio à Google BigQuery.
Travaux pratiques
Explorer un ensemble de données dans Google Data Studio
Union et fusion des ensembles de données
- Fusionner des tables de données historiques avec UNION.
- Introduire des caractères génériques de table pour des fusions faciles.
- Passez en revue les schémas de données : liaison de données entre plusieurs tables.
- Procédure pas à pas JOIN Exemples et pièges.
Travaux pratiques
Joindre et regrouper des données à partir de plusieurs tables.
Fonctions et clauses avancées
- Passer en revue les instructions de cas SQL.
- Présentation des fonctions de fenêtre analytique.
- Protection des données avec le cryptage de champs unidirectionnel.
- Discussion autour de la conception efficace des sous-requêtes et des CTE.
- Comparaison entre les UDF SQL et JavaScript.
Travaux pratiques
Dériver des informations avec des fonctions SQL avancées.
Conception de schémas et structures de données imbriquées
- Comparer l'architecture de données Google BigQuery à l'architecture de données SGBDR traditionnelle.
- Normalisation versus dénormalisation : compromis sur les performances.
- Revue de schéma : le bon, le mauvais et le laid.
- Tableaux et données imbriquées dans Google BigQuery.
Travaux pratiques
Interroger des données imbriquées et répétées.
Plus de visualisation avec Google Data Studio
- Créer des instructions Case et des champs calculés.
- Éviter les pièges de performance avec des considérations de cache.
- Partager les tableaux de bord et discuter de l'accès aux données.
Optimisation de la performance
- Éviter les pièges de performance de Google BigQuery.
- Empêcher les points d'accès dans ses données.
- Diagnostiquer les problèmes de performances avec la carte d'explication des requêtes.
Accès aux données
- Comparer les rôles d'ensemble de données IAM et BigQuery.
- Éviter les pièges d'accès.
- Passer en revue les membres, les rôles, les organisations, l'administration des comptes et les comptes de service.
Notebooks in the cloud
- Cloud Datalab.
- Compute Engine et Cloud Storage.
- Analyse de données avec BigQuery.
Travaux pratiques
Rent-a-VM pour traiter les données sur les tremblements de terre.
Google et le machine learning
- Introduction au machine learning pour les analystes.
- Entraînement avec les API de ML pré-entraînées pour la compréhension des images et du texte.
Travaux pratiques
Pretrained ML APIs.
Application de l'apprentissage automatique aux ensembles de données BQML
- Création d'ensembles de données machine learning et analyse des fonctionnalités.
- Création de modèles de classification et de prévision avec BQML.
Travaux pratiques
Prédire les achats des visiteurs avec un modèle de classification dans BQML. Prédire les tarifs des taxis à l'aide d'un modèle de prévision BigQuery ML.