En qualité de partenaire Google Cloud, nous vous aiderons à acquérir les compétences nécessaires afin de traiter les données de manière efficace et évolutive, en utilisant une série de produits Google spécialement conçus sur Google Cloud Platform.
Jellyfish a été sélectionné par Google pour construire et dispenser cette formation d’une journée.
Grâce à des partages d'expériences et des ateliers pratiques, vous bénéficierez d'un aperçu de Google Cloud Platform ainsi que d'une vue détaillée des capacités de traitement des données et de Machine Learning. Cette formation donne la mesure de la facilité, de la flexibilité et de la puissance ses solutions Big Data offertes par Google Cloud Platform.
Cette formation fait partie de la série « Professional Data Engineer » et peut être dispensée sur le site de votre choix, ou en classe virtuelle.
Aperçu du cours
À qui s’adresse cette formation ?
Cette formation est destinée aux profils suivants:
- Les data analysts, data scientists et business analysts qui débutent avec Google Cloud Platform
- Les personnes chargées de concevoir des pipelines et des architectures pour le traitement des données, de créer et de maintenir des modèles statistiques et de Machine Learning, d’interroger des ensembles de données, de visualiser les résultats des requêtes et de créer des rapports
- Les dirigeants et décideurs informatiques évaluant Google Cloud Platform en vue de son utilisation par des data scientists
Vous repartirez avec les compétences nécessaires pour :
- Identifier l’objectif et la valeur des principaux produits Big Data et d'apprentissage automatique sur Google Cloud Platform
- Utiliser Cloud SQL et Cloud Dataproc pour migrer les charges de travail existantes de MySQL et de Hadoop/Pig/Spark/Hive vers Google Cloud Platform
- Utiliser BigQuery et Cloud Datalab pour effectuer une analyse interactive des données
- Former et utiliser un réseau de neurones avec TensorFlow
- Utiliser les API ML
- Choisir entre différents produits de traitement des données sur Google Cloud Platform
Prérequis
Afin d'optimiser cette formation, vous devez posséder les connaissances suivantes:
- Maîtrise de base d’un langage de requêtes courant tel que SQL
- Expérience en matière de modélisation des données, d’extraction, de transformation et de chargement des activités
- Développement applicatifs utilisant un langage de programmation commun tel que Python
- Connaissance basique des concepts de Machine Learning et/ou des statistiques
Programme de la formation
- Aperçu des Fondamentaux de Google Platform
- Produits Big Data de Google Cloud Platform
- CPU à la demande (Moteur de calcul)
- Un système de fichiers global (Stockage sur le Cloud)
- CloudShell
- Atelier : Mise en place d’un pipeline de traitement des données « Ingest-Transform-Publish » (« Ingérer-Transformer-Publier »)
- Des jalons vers le Cloud
- Cloud SQL: votre base de données SQL sur le Cloud
- Atelier: Importation de données dans CloudSQL et exécution de requêtes
- Spark sur Dataproc
- Atelier: Recommandations pour le Machine Learning avec Spark sur Dataproc
- Accès aléatoire rapide
- Datalab
- BigQuery
- Atelier: Création d’un ensemble de données pour le Machine Learning
- Machine Learning avec TensorFlow
- Atelier: réalisation de ML avec TensorFlow
- Modèles préconçus pour des besoins courants
- Atelier: Utilisation des API ML
- Architectures axées sur les messages avec Pub/Sub
- Créer des pipelines avec Dataflow
- Architecture de référence pour le traitement des données en temps réel et par lots
- Pourquoi GCP ?
- Étapes suivantes
- Ressources supplémentaires