Онлайн-курс — сертифицированная профессиональная специализация по бессерверной обработке данных Google Cloud

Создание легко и эффективно масштабируемых приложений для работы с большими данными.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

начиная Средний уровень продвижение вовлеченный

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • ошибка аппроксимации
  • график
  • регресс
  • причинность
  • модель данных
  • Извлечение, преобразование и загрузка (ETL)
  • Аналитика
  • Статистика (информатика)

What you will learn in the course

Courses for which the course is suitable

  • Инженер данных
  • Аналитик больших данных
  • Архитектор облачных данных
  • Разработчик конвейера данных
  • Специалист по операциям с данными
  • Специалист по данным
  • Разработчик бизнес-аналитики
  • Инженер по обработке данных

Стажировка — серия курсов из трех частей.

Становится все труднее поддерживать набор технологий, способных удовлетворить постоянно растущие потребности бизнеса, ориентированного на данные. Каждый специалист по большим данным знает три «V» больших данных: объем, скорость и разнообразие. А что, если бы существовала технология, подходящая для больших объемов и отвечающая этим требованиям?

Именно здесь в игру вступает Google Cloud Dataflow. Google Cloud Dataflow упрощает обработку данных за счет объединения пакетной и потоковой обработки и обеспечивает бессерверную работу, которая позволяет пользователям сосредоточиться на анализе, а не на инфраструктуре. Эта стажировка предназначена для клиентов и партнеров, которые хотят глубже понять Dataflow и улучшить свои приложения для обработки данных.

В рамках стажировки проводятся три курса:

  • Foundations , в котором рассмотрено, как Apache Beam и Dataflow работают вместе для удовлетворения ваших потребностей в обработке данных без риска зависимости от поставщика.
  • Разработка конвейеров — о том, как преобразовать нашу бизнес-логику в приложения для обработки данных, которые можно запускать в Dataflow.
  • Operations , в котором рассматриваются наиболее важные классы для запуска приложения данных в Dataflow, включая мониторинг, устранение неполадок, тестирование и надежность.

Прикладной учебный проект:

Эта стажировка включает в себя практические занятия с использованием платформы Qwiklabs. Лабораторные работы основаны на концепциях, обсуждаемых в модулях курса. При необходимости мы предоставляем версии лабораторных работ на языках Java и Python. Для лабораторий, которым требуется добавить/обновить код, мы предоставляем рекомендуемое решение на ваше рассмотрение.

Details of the courses that make up the specialization

Бессерверная обработка данных с помощью Dataflow: основы курса бразильского португальского языка

  • Курс 1 • 3 часа

Детали курса

чему ты научишься

  • Продемонстрируйте, как Apache Beam и Cloud Dataflow работают вместе для удовлетворения потребностей вашей организации в обработке данных.
  • Обобщить преимущества Beam Portability Framework и позволить вам использовать ее в своих конвейерах потока данных.
  • Включите Shuffle & Streaming Engine для пакетных и потоковых конвейеров таким образом, чтобы обеспечить максимальную производительность.
  • Чтобы обеспечить гибкое планирование ресурсов для более прибыльной работы.

Бессерверная обработка данных с помощью Dataflow: работа с курсом на бразильском португальском языке

  • Курс 2 • 9 часов

Детали курса

чему ты научишься

  • Выполнение мониторинга, устранения неполадок, тестирования и CI/CD в конвейерах потока данных.
  • Внедрите конвейеры потока данных с упором на надежность, чтобы максимизировать стабильность платформы обработки данных.

навыки, которые вы приобретете

  • категория: ошибка аппроксимации
  • Категория: Графики
  • Категория: Регрессия
  • Категория: причинно-следственная связь

Бессерверная обработка данных с помощью Dataflow: разработка конвейеров в курсе на бразильском португальском языке

  • Курс 3 • 18 часов

Детали курса

чему ты научишься

  • Во второй части серии курсов по Dataflow мы углубимся в разработку конвейеров с помощью Beam SDK. Мы начнем с обзора основных идей Apache Beam.
  • Далее мы обсудим обработку потоковых данных с использованием окон, водяных знаков и драйверов.
  • Мы продолжим рассматривать варианты источников и назначений в ваших конвейерах, схемы для выражения ваших структурированных данных и способы выполнения преобразований с отслеживанием состояния с помощью API-интерфейсов State и Timer.
  • Мы перейдем к рассмотрению лучших практик, которые помогут максимизировать производительность вашего конвейера.
  • Ближе к концу курса мы представим SQL и Dataframes для представления вашей бизнес-логики в Beam, а также способы итеративной разработки конвейеров с использованием блокнотов Beam.

навыки, которые вы приобретете

  • Категория: Модель данных
  • Категория: Производство, преобразование и нагрузка (ЭТЛ)
  • Категория: Аналитика
  • Категория: Режим (Информатика)