Онлайн-курс — сертифицированная профессиональная специализация по бессерверной обработке данных от Google Cloud Institute.

Разработка масштабируемых приложений больших данных с использованием передовых технологий и индивидуальных решений.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

начиная

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • ошибка аппроксимы
  • график
  • Определение причинно-следственной связи
  • модель данных
  • Извлечение, преобразование и загрузка (ETL)
  • Аналитика
  • режим (информатика)

What you will learn in the course

Courses for which the course is suitable

  • Разработчик больших данных
  • Инженер данных
  • аналитик данных
  • Менеджер проектов по работе с данными
  • Эксперт по Google Cloud
  • Разработчик приложений для обработки данных
  • Менеджер информационных систем
  • Специалист по решениям данных

Стажировка — серия из 3 курсов

По мере роста требований к бизнесу, основанному на данных, становится все труднее идти в ногу с технологиями. Все специалисты по работе с большими данными знакомы с тремя основными качествами больших данных: объемом, скоростью и разнообразием. Что, если бы существовала технология, не боящаяся ограничений и созданная для удовлетворения этих требований?

Встречайте Google Cloud Dataflow. Google Cloud Dataflow упрощает обработку данных за счет объединения пакетной и потоковой обработки, обеспечивая бессерверную работу, позволяющую пользователям сосредоточиться на аналитике, а не на инфраструктуре. Эта стажировка предназначена для клиентов и партнеров, которые хотят улучшить свое понимание Dataflow для продвижения своих приложений по обработке данных.

Стажировка включает в себя три курса:

  • основы
    — который объясняет, как Apache Beam и Dataflow работают вместе для удовлетворения потребностей в обработке данных, не полагаясь на поставщика услуг.
  • Разработка маршрута
    — речь идет о том, как преобразовать нашу бизнес-логику в приложения обработки данных, которые могут работать на Dataflow.
  • операции
    — в котором рассматриваются наиболее важные уроки по управлению приложением данных в Dataflow, включая мониторинг, устранение неполадок, тестирование и надежность.

Практический учебный проект

Эта стажировка включает в себя практические занятия с использованием платформы Qwiklabs. Лабораторные работы основаны на информации, полученной в модулях курса. При необходимости предоставляются версии лабораторных работ на Java и Python. Для лабораторий, которым требуется добавление/обновление кода, мы предлагаем рекомендуемое решение.

Details of the courses that make up the specialization

Бессерверная обработка данных с помощью Dataflow: основы

Курс 1 • 3 часа

Детали курса

Что вы узнаете:
  • Продемонстрируйте, как Apache Beam и Cloud Dataflow работают вместе для удовлетворения потребностей вашей организации в обработке данных.
  • Обобщить преимущества платформы мобильности Beam и предоставить ей возможность работать с конвейерами потоков данных.
  • Запустите Shuffle & Streaming Engine для конвейеров обработки данных как в пакетном, так и в потоковом режиме, чтобы достичь максимальной производительности.
  • Обеспечьте гибкое планирование ресурсов для более экономичной производительности.

Бессерверная обработка данных с помощью Dataflow: разработка конвейеров

Курс 2 • 18 часов

Детали курса

Что вы узнаете:
  • Во второй части серии курсов по Dataflow мы подробно разберем разработку конвейеров с помощью Beam SDK. Начнем с обзора концепций Apache Beam.
  • Далее мы рассмотрим обработку данных в потоке с окнами, водяными знаками и триггерами.
  • Далее мы рассмотрим варианты источников и приемников в ваших конвейерах, соглашения для выражения данных, которые можно структурировать, и способы выполнения преобразований с отслеживанием состояния с помощью API-интерфейсов State и Timer.
  • Далее мы рассмотрим лучшие методологии повышения производительности конвейера.
  • В конце курса мы представим SQL и Dataframes для представления вашей бизнес-логики в Beam, а также способы итеративной разработки конвейеров с использованием блокнотов Beam.
Навыки, которые вы получите:
  • Категория: Модель данных
  • Категория: Извлечение, преобразование и загрузка (ETL)
  • Категория: Аналитика
  • Категория: Режим (Информатика)

Бессерверная обработка данных с помощью Dataflow: операции

Курс 3 • 9 часов

Детали курса

Что вы узнаете:
  • Выполняйте мониторинг, устранение неполадок, тестирование и операции CI/CD в конвейерах потока данных.
  • Внедряйте конвейеры потока данных с учетом надежности, чтобы максимизировать стабильность вашей платформы обработки данных.
Навыки, которые вы получите:
  • Категория: ошибка близости
  • Категория: график
  • Категория: Регрессия
  • Категория: причинно-следственная связь