- Level Professional
- المدة
- الطبع بواسطة Google Cloud
-
Offered by
عن
Este curso intensivo de uma semana baseia-se nos cursos anteriores da especialização Data Engineering on Google Cloud Platform. Por meio de videoaulas, demonstrações e laboratórios práticos, você aprenderá a criar e gerenciar clusters de computação para executar jobs do Hadoop, Spark, Pig e/ou Hive no Google Cloud Platform.Você também aprenderá a acessar várias opções de armazenamento em nuvem dos clusters de computação e integrar os recursos de machine learning do Google aos respectivos programas de análise. Nos laboratórios práticos, você criará e gerenciará os clusters do Dataproc usando o console da Web e a CLI e usará o cluster para executar jobs do Spark e Pig. Depois você criará notebooks iPython que são integrados ao BigQuery e ao armazenamento e utilizará o Spark. Por fim, você integrará as APIs de machine learning à análise de dados. Pré-requisitos • Noções básicas de Big Data e Machine Learning do Google Cloud Platform (ou experiência equivalente) • Algum conhecimento de Pythonالوحدات
Introdução
2
Videos
- Bem-vindo
- Introdução ao Cloud Dataproc
Por que dados não estruturados?
2
Videos
- Como definir dados não estruturados?
- Como extrair valor de dados não estruturados
Por que o Cloud Dataproc?
4
Videos
- Abordagens ao trabalhar com Big Data
- Origens do MapReduce e do Hadoop
- Excesso de sobrecarga com o uso do Hadoop no local
- Comparação entre o Cloud Dataproc e as opções do Hadoop
Como criar um cluster do Dataproc
3
Videos
- Como criar um cluster do Dataproc
- Personalização do Dataproc
- O Dataproc e a CLI
Laboratório 1: criar um cluster do Dataproc
1
External Tool
- Laboratório 1: criar um cluster do Dataproc
2
Videos
- Laboratório 1: visão geral
- Laboratório 1: demonstração e avaliações
Tipos de máquinas personalizados
3
Videos
- Tipos de máquina personalizados
- VMs preemptivas
- Resumo do módulo
Questionário do módulo 1
1
Quiz
- Questionário do módulo 1
Como executar jobs
2
Videos
- Visão geral da execução dos jobs do Dataproc
- Métodos para envio de jobs
Laboratório 2: trabalhar com dados estruturados e semiestruturados
1
External Tool
- Laboratório 2: trabalhar com dados estruturados e semiestruturados
2
Videos
- Laboratório 2: visão geral
- Laboratório 2: demonstração e avaliações
Separação de armazenamento e computação
4
Videos
- Separação do armazenamento e da computação
- A evolução do processamento de dados
- A importância da rede no processamento de dados
- Como separar o armazenamento do processamento com o Spark
Como enviar jobs
1
Videos
- Como enviar jobs do Spark
RDDs do Spark, transformações e ações
1
Videos
- Visão geral dos conceitos do Spark
Laboratório 3: como trabalhar com jobs do Spark
1
External Tool
- Laboratório 3: enviar jobs do Dataproc para dados não estruturados
2
Videos
- Visão geral do laboratório
- Laboratório 3: demonstração e avaliações
Resumo
1
Videos
- Resumo do módulo
Questionário do módulo 2
1
Quiz
- Questionário do módulo 2
Visão geral
1
Videos
- Introdução ao uso do GCP
Suporte do BigQuery
1
Videos
- Suporte do BigQuery
Laboratório 4: usar o GCP
1
External Tool
- Laboratório 4: usar o GCP
2
Videos
- Laboratório 4: visão geral
- Laboratório 4: demonstração e avaliações
Como personalizar clusters
2
Videos
- Personalização do cluster
- Como instalar um software em um cluster do Dataproc
Laboratório 5: automação de cluster usando comandos da CLI
1
External Tool
- Laboratório 5: automação de cluster usando comandos da CLI
2
Videos
- Laboratório 5: visão geral
- Laboratório 5: demonstração e avaliações
Resumo do módulo
2
Videos
- Resumo do módulo
- Avaliações
Questionário do módulo 3
1
Quiz
- Questionário do módulo 3
Visão geral
1
Videos
- Saiba mais sobre o aprendizado de máquina
Implemente o aprendizado de máquina na sua empresa
3
Videos
- Aprendizado de máquina em detalhes
- Exemplos da aplicação do aprendizado de máquina
- Processamento de linguagem natural em detalhes
Laboratório 6: adicionar aprendizado de máquina
1
External Tool
- Laboratório 6: adicionar aprendizado de máquina
2
Videos
- Laboratório 6: visão geral
- Laboratório 6: demonstração e avaliações
Questionário do módulo 4
1
Quiz
- Questionário do módulo 4
Resumo do módulo
1
Videos
- Resumo do módulo
Auto Summary
Unlock the power of unstructured data with the "Leveraging Unstructured Data with Cloud Dataproc on Google Cloud" course, taught entirely in Brazilian Portuguese. Targeted at professionals in Data Science and AI, this intensive one-week course is designed to build on previous knowledge from the Data Engineering specialization on the Google Cloud Platform. Led by Coursera, the course offers a comprehensive blend of video lectures, demonstrations, and practical labs. You will gain hands-on experience in creating and managing computing clusters to run Hadoop, Spark, Pig, and Hive jobs on Google Cloud Platform. Additionally, you'll learn to access various cloud storage options and integrate Google's machine learning capabilities into your data analysis workflows. During the practical labs, you will manage Dataproc clusters using the web console and command-line interface (CLI), execute Spark and Pig jobs, and create iPython notebooks that integrate with BigQuery and cloud storage while leveraging Spark. The course culminates in integrating machine learning APIs for advanced data analysis. Ideal for those with basic knowledge of Google's Big Data and Machine Learning platforms and some Python proficiency, this professional-level course offers flexible subscription options, including Starter and Professional tiers, to suit your learning needs. Dive into this enriching learning experience and advance your data engineering skills with Google Cloud Dataproc.

Google Cloud Training