Онлайн-курс — сертифицированный профессиональный сертификат в области инженерии данных DeepLearning.AI

Изучите принципы эффективной обработки данных. Развивайте необходимые навыки проектирования данных и узнайте, как можно получить реальную ценность для бизнеса, применяя набор принципов и стратегий разработки систем данных.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

начиная

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Перевод потребностей заинтересованных сторон в системные требования и выбор подходящих инструментов для построения системы.
  • Создание конвейеров данных для рекомендаций по продуктам на AWS — как в пакетном режиме, так и в прямом эфире.
  • Применяйте принципы хорошей архитектуры данных для оценки безопасности, производительности, надежности и масштабируемости систем данных на AWS.
  • Исследование различных типов исходных систем и решение распространенных проблем с подключением.
  • Использование таких инструментов, как инфраструктура и конвейеры, в качестве кода для координации, автоматизации и управления конвейерами данных.
  • Проектирование архитектур хранения данных и водяных дверей для различных случаев.
  • Исследование влияния выбора хранилища данных на производительность запросов и затраты.
  • Моделируйте и преобразовывайте данные для целей аналитики и машинного обучения, а также сравнивайте платформы централизованной обработки, такие как Pandas, с платформами распределенной обработки, такими как Spark.
  • Передача данных заинтересованным сторонам для бизнес-анализа и использования машинного обучения.

What you will learn in the course

Courses for which the course is suitable

  • Инженер данных
  • аналитик данных
  • Эксперт по машинному обучению
  • Разработчик систем обработки данных
  • Менеджер проектов в области данных
  • Бизнес-аналитик
  • Разработчик конвейера данных
  • Эксперт по архитектуре данных
  • Разработчик облачных решений

Профессиональный сертификат — серия из 4 курсов

Сертификат DeepLearning.AI в области инженерии данных — это комплексная онлайн-программа для инженеров данных и специалистов, заинтересованных в начале или расширении своей карьеры.

Организации всех размеров и во всех отраслях собирают и генерируют данные все более быстрыми темпами. В этих организациях каждая команда, от менеджеров по продажам и маркетингу, финансам и операциям, продуктам и инжинирингу до обслуживания клиентов, может извлекать ценную информацию и ценность из организационных данных. Независимо от того, используется ли конечная цель в области науки о данных, машинного обучения или аналитики, именно инженерия данных позволяет необработанным данным стать ценностью для бизнеса. Поэтому роль дата-инженера сегодня является одной из самых востребованных профессий в сфере технологий.

В ходе этой программы вы изучите основы инженерии данных и получите практический опыт проектирования и реализации архитектур данных с использованием AWS и инструментов с открытым исходным кодом.

Этот сертификат под руководством эксперта в этой области Джо Райса, соавтора книги «Основы инженерии данных», предоставит вам инструменты и знания для роста в востребованной области с упором на получение, обработку, преобразование, хранение и представление данных заинтересованным сторонам для достижения организационных целей и бизнеса. Практические занятия были разработаны в сотрудничестве с AWS и Factored.AI, чтобы предоставить вам подлинный опыт создания систем данных в облаке.

Благодаря этому сертификату у вас будут инструменты для продвижения по карьерной лестнице в области разработки данных.

Практический учебный проект

В этой программе А:

  • Вы преобразуете потребности заинтересованных сторон в системные требования и выбираете подходящие инструменты для построения системы.

  • Вы будете создавать конвейеры данных рекомендаций по продуктам на AWS — как в пакетном режиме, так и в реальном времени.

  • Применяйте принципы хорошей архитектуры данных для оценки безопасности, производительности, надежности и масштабируемости систем данных на AWS.

  • Вы изучите различные типы исходных систем и решите типичные проблемы с подключением.

  • Вы будете использовать такие инструменты, как инфраструктура и конвейеры, в качестве кода для оркестрации, автоматизации и мониторинга конвейеров данных.

  • Вы разработаете архитектуры хранения данных и водяных дверей для разных случаев.

  • Изучите влияние выбора хранилища данных на производительность запросов и затраты.

  • Моделируйте и преобразуйте данные для приложений аналитики и машинного обучения, а также сравнивайте платформы централизованной обработки, такие как Pandas, с платформами распределенной обработки, такими как Spark.

  • Отправьте свои данные заинтересованным сторонам для использования в бизнес-аналитике и машинном обучении.

Details of the courses that make up the specialization

Введение в инженерию данных

Продолжительность: 17 часов

  • Понимание жизненного цикла обработки данных и основных деталей.
  • Сбор требований от заинтересованных сторон и преобразование их в системные требования.
  • Проектирование и внедрение конвейеров данных в комплектах AWS.

Исходные системы, прием данных и конвейеры

Продолжительность: 34 часа

  • Сбор требований от заинтересованных сторон и преобразование их в системные требования.
  • Реализация процессов приема данных пакетами и потоками на AWS.
  • Обеспечивает интеграцию аспектов информационной безопасности, управления данными и DataOps в системах данных.

Хранение данных и запросы

Продолжительность: 22 часа

  • Проектирование архитектур хранения данных для различных сценариев и выбор подходящих технологий для реализации этих архитектур.
  • Практикуйте общие шаблоны запросов и определяйте способы повышения производительности запросов и повышения ценности ваших систем данных.

Модель данных, преобразование и обслуживание

Продолжительность: 27 часов

  • Моделируйте и преобразуйте данные в соответствии с потребностями заинтересованных сторон для повышения ценности бизнеса.
  • Выбор подходящих инструментов для обработки данных в соответствии с вашим архитектурным проектом.
  • Обработка данных для пакетной аналитики и конвейеров данных для машинного обучения с использованием распределенных и нераспределенных платформ обработки.

Эти курсы предлагают широкий спектр навыков и знаний в области инженерии данных и предназначены для всех, кто заинтересован в развитии своих знаний и навыков в этой области.