Онлайн-курс — сертифицированная профессиональная специализация по бессерверной обработке данных с использованием Dataflow Google Cloud Institute.

Создание приложений для больших данных, способных масштабироваться и расти. Передовые решения для всех нужд в области больших данных.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

Средний уровень

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Умение анализировать проблемы
  • коммуникативные навыки
  • работа в команде
  • технологические навыки
  • тайм-менеджмент
  • Творческое мышление
  • Разрешение конфликтов
  • профессионализм
  • Организация и управление проектом
  • независимое обучение

What you will learn in the course

Courses for which the course is suitable

  • Разработчик данных
  • Инженер данных
  • аналитик данных
  • Менеджер проектов по работе с данными
  • Эксперт по большим данным
  • Разработчик трубопроводов
  • Менеджер информационных систем
  • Эксперт по Google Cloud

Стажировка – серия трехблочных курсов.

Поддерживает технологии, которые всегда на пике популярности

Это становится все более взаимосвязанным, особенно с учетом растущих потребностей бизнеса, ориентированного на данные. Любой, кто работает с большими данными, знает три «V» больших данных: объем, скорость и разнообразие. Что, если бы существовала технология, защищающая от опухолей, отвечающая этим требованиям?

Встречайте Google Cloud Dataflow

Google Cloud Dataflow упрощает обработку данных за счет объединения обработки ATCH и обработки потока данных и обеспечивает бессерверную работу, позволяющую пользователям сосредоточиться на аналитике, а не на инфраструктуре. Эта стажировка предназначена для клиентов и партнеров, которые хотят глубже понять Dataflow для продвижения своих приложений по обработке данных.

Эта специализация состоит из трех курсов:

  • Основы:
    Объясняет, как Apache Beam и Dataflow работают вместе, чтобы удовлетворить ваши потребности в обработке данных без риска привязки к одному поставщику.
  • Разработка трубопроводов:
    Описывается, как преобразовать нашу бизнес-логику в приложения для обработки данных, которые могут работать в Dataflow.
  • Действия:
    Обзор наиболее важных уроков по управлению приложением данных в Dataflow, включая мониторинг, устранение неполадок, тестирование и надежность.

Практический учебный проект

По этой специализации проводятся практические занятия на платформе Qwiklabs. Лабораторные занятия построены на основе концепций, изученных в модулях курса. При необходимости мы предоставили версии лабораторных работ на Java и Python. Для лабораторий, которым требуется добавление/обновление кода, мы предоставили рекомендуемое решение.

Details of the courses that make up the specialization

Бессерверная обработка данных с помощью Dataflow: базовый курс

Курс 1 • 3 часа • 4.2 (79 оценок)

Детали курса

чему ты научишься
  • Этот курс является частью 1 серии из 3 курсов по бессерверной обработке данных с помощью Dataflow.
  • В первом курсе мы начнем с краткого объяснения того, что такое Apache Beam и какое отношение он имеет к Dataflow.
  • Затем мы поговорим о концепции Apache Beam и преимуществах принципа мобильности Beam.
  • Принцип переносимости Beam позволяет разработчикам использовать предпочитаемый ими язык программирования вместе с желаемой платформой выполнения.
  • Затем мы покажем, как Dataflow позволяет отделить вычисления от хранилища, экономя при этом деньги.
  • Как инструменты управления, доступа и обнаружения работают с вашими конвейерами потока данных.
  • Наконец, мы рассмотрим, как реализовать подходящую модель безопасности для вашего варианта использования потока данных.

Предпосылки:

  • Серия курсов по бессерверной обработке данных с помощью Dataflow основана на терминах, обсуждаемых в специализации по инженерии данных.
  • В качестве подготовки мы рекомендуем следующие курсы:
    • (i) Создание конвейеров пакетных данных в облаке Google: рассматриваются основные принципы потока данных.
    • (ii) Создание устойчивых систем потоковой аналитики в Google Cloud: охватывает основные концепции потоковой передачи, такие как окна, триггеры и водяные знаки.

>> Регистрируясь на этот курс, вы соглашаетесь с условиями обслуживания Qwiklabs, подробно описанными в разделе «Часто задаваемые вопросы» и на странице: https://qwiklabs.com/terms_of_service <<

Бессерверная обработка данных с помощью Dataflow: разработка конвейера

Курс 2 • 31 час • 4.0 (40 оценок)

Детали курса

чему ты научишься
  • Обзор основных концепций Apache Beam, обсуждаемых в курсе Data Engineering в Google Cloud.
  • Обзор основных концепций потоковой передачи, обсуждаемых в DE (неограниченные коллекции PC, окна, водяные знаки и триггеры).
  • Выбор и сопоставление ввода/вывода (I/O) по вашему выбору с вашим конвейером потока данных.
  • Использование схем для упрощения кода в Beam и повышения производительности конвейера.

Бессерверная обработка данных с помощью Dataflow: действия

Курс 3 • 9 часов • 3.6 (17 оценок)

Детали курса

чему ты научишься
  • Выполняйте мониторинг, устранение неполадок, тестирование и CI/CD в конвейерах потока данных.
  • Внедрение конвейеров потока данных с упором на надежность для максимизации стабильности вашей платформы обработки данных.