Онлайн-курс — сертифицированная профессиональная специализация по инженерии данных на Python от Google и Университета Дьюка.

Совершенствуйте свои навыки программирования с помощью обработки данных. Используйте большие данные для принятия решений, проведения аналитики и разработки приложений искусственного интеллекта и машинного обучения.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

Средний уровень

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Наука о данных
  • Большие данные
  • Программирование на Python
  • Информационная инженерия
  • Кубернетес
  • Визуализация данных
  • Апач Хадуп
  • Докер-контейнер
  • Апач Спарк
  • Снежинка (Хранилище данных)

What you will learn in the course

Courses for which the course is suitable

  • инженер-программист
  • ключ
  • исследователь
  • Специалист по данным
  • Инженер данных
  • Эксперт по машинному обучению
  • Эксперт по деловой информации

Стажировка — серия из трех курсов

Узнайте, как использовать обработку данных для использования больших данных для бизнес-стратегии, анализа данных или машинного обучения и искусственного интеллекта. Пройдя эту серию курсов, вы приобретете знания и навыки, необходимые для построения эффективных конвейеров данных и управления передовыми платформами, такими как:

  • Хадуп
  • Искра
  • Снежинка
  • Блоки данных
  • Кубернетес

и рассказывайте истории с помощью данных посредством визуализации. Погрузитесь в фундаментальные концепции больших данных, распределенные вычисления с помощью Spark, архитектуру Snowflake, возможности машинного обучения Databricks, методы Python для визуализации данных и критически важные методы, такие как DataOps.

целевая аудитория

Эта серия курсов предназначена для:

  • инженеры-программисты
  • разработчики
  • исследователи
  • Специалисты по данным

которые хотят усилить свою специализацию в области науки о данных или машинного обучения, а также для профессионалов, которые хотят развивать карьеру в качестве инженера-программиста, ориентированного на данные, специалиста по данным или инженера по обработке данных, работающего в области облачных вычислений, машинного обучения, бизнес-информации или другие поля.

Практический учебный проект

В рамках стажировки есть финальный проект, в котором основное внимание уделяется использованию API Databricks для репликации существующего проекта. Он предоставляет практический опыт работы с Databricks для создания готового решения для обработки данных. Python будет применяться для решения различных задач по обработке данных.

Details of the courses that make up the specialization

Spark, Hadoop и Snowflake для обработки данных

  • Курс 1 • 29 часов • 3,9 (40 оценок)

Детали курса

чему ты научишься
  • Создавайте масштабируемые конвейеры данных (Hadoop, Spark, Snowflake, Databricks) для эффективного управления данными.
  • Оптимизируйте обработку данных с помощью кластеризации и масштабирования для повышения производительности и использования ресурсов.
  • Создавайте решения машинного обучения (PySpark, MLFlow) на Databricks для бесперебойной разработки и внедрения моделей.
  • Применяйте методы DataOps и DevOps для непрерывной интеграции и развертывания (CI/CD) приложений, управляемых данными, включая автоматизацию процессов.
навыки, которые вы приобретете
  • Категория: большие данные
  • Категория: Программирование на Python
  • Категория: Информационная инженерия
  • Категория: Apache Hadoop
  • Категория: Апач Спарк

Виртуализация, Docker и Kubernetes для обработки данных

  • Курс 2 • 27 часов • 3,8 (23 оценки)

Детали курса

чему ты научишься
  • Освойте виртуализацию, контейнеризацию и Docker, включая создание Dockerfile и координацию между несколькими контейнерами с помощью Compose и Airflow.
  • Развитие опыта в основных концепциях Kubernetes, кластерной архитектуре и реализации с использованием облачных сред, кодовых пространств GitHub и инструментов на основе искусственного интеллекта.
  • Перемещайтесь по сценариям обработки данных, осваивая контейнеризацию, реализацию приложений и решая производственные проблемы с помощью координации облака и методов SRE.
навыки, которые вы приобретете
  • Категория: Облачная интеграция
  • Категория: контейнеризация
  • Категория: Виртуализация
  • Категория: Кубернетес
  • Категория: Докер (программное обеспечение)

Визуализация данных с помощью Python

  • Курс 3 • 9 часов • 4.2 (15 оценок)

Детали курса

чему ты научишься
  • Профессионально используйте Python, электронные таблицы и инструменты бизнес-аналитики для создания впечатляющих интерактивных визуализаций данных.
  • Создавайте и распространяйте идеи и истории на основе данных с помощью впечатляющих визуализаций и историй с данными.
  • Проведите оценку и выберите наиболее подходящие инструменты и методы визуализации для удовлетворения потребностей и целей организации.
навыки, которые вы приобретете
  • Рубрика: деловое общение
  • Категория: Анализ данных
  • Категория: Программирование на Python
  • Категория: Облачные приложения
  • Категория: Визуализация данных