Онлайн-курс – сертифицированная профессиональная специализация по NoSQL, Big Data и Spark Института IBM.

Начните свою карьеру в области больших данных. Освойте основы NoSQL, больших данных и Apache Spark, приобретя практические, готовые к использованию на рынке навыки машинного обучения и проектирования данных.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

начиная

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Облачные базы данных
  • Монго БД
  • Кассандра
  • NoSQL
  • Клодан
  • машинное обучение
  • Конвейеры машинного обучения
  • Инженер данных
  • Искра МЛ
  • Апач Спарк
  • большие данные
  • Искровой SQL
  • Апач — наркотик

What you will learn in the course

Courses for which the course is suitable

  • Инженер данных
  • Разработчик программного обеспечения
  • Архитектор информационных систем
  • специалист по данным
  • ИТ-менеджер

Специализация — курсовая серия из 3-х курсов.

Инженеры по обработке данных и специалисты с навыками работы с NoSQL пользуются большим спросом в индустрии управления данными. Эта специализация предназначена для тех, кто желает развить базовые навыки работы с большими данными, базами данных Apache Spark и NoSQL. Три насыщенных информацией курса охватывают популярные базы данных, такие как MongoDB и Apache Cassandra, а также широко используемый набор инструментов Apache Hadoop для больших данных и, конечно же, аналитический механизм Apache Spark для крупномасштабной обработки данных.

Обзор

  • Обзор различных категорий баз данных NoSQL (не только SQL)
  • Практическая работа с несколькими базами данных, в том числе:
    • IBM Клаудант
    • МонгоБД
    • Кассандра
  • Задачи управления данными, такие как:
    • Создание базы данных
    • их реконструкция
    • Ввод данных
    • обновление
    • удаление
    • Запросы
    • Индекс
    • Агрегация
    • обмен данными
  • Базовые знания технологий больших данных, таких как:
    • Хадуп
    • MapReduce
    • HDFS
    • Улей
    • HBase
  • Более глубокие знания Apache Spark, в том числе:
    • DataFrames Spark
    • Искровой SQL
    • ПиСпарк
    • Интерфейс приложения Spark
    • Масштабирование нагрузки с помощью Kubernetes
  • Работа со структурированной потоковой передачей Spark и Spark ML для выполнения задач обработки ETL (извлечение, преобразование, загрузка) и машинного обучения.

Практический учебный проект

В этой специализации упор делается на практическое обучение. Поэтому каждый курс включает практические занятия для отработки и применения навыков работы с NoSQL и большими данными, полученных во время занятий.

первое блюдо
  • Работайте с несколькими базами данных NoSQL — MongoDB, Apache Cassandra и IBM Cloudant для выполнения самых разных задач:
    • Создание базы данных
    • Добавление документов
    • Запросы данных
    • Использование HTTP API
    • Выполнение операций создания, чтения, обновления и удаления (CRUD)
    • Ограничение и сортировка записей
    • Индекс
    • Агрегация
    • реконструкция
    • Использование оболочки CQL
    • Операции в ключевом пространстве
    • Дополнительные операции над таблицами
Второй курс
  • Запуск кластера Hadoop с использованием Docker и выполнение заданий Map сокращения.
  • Изучите работу с Spark с использованием журналов Jupyter в ядре Python.
  • Развитие навыков Spark с использованием DataFrames, Spark SQL и масштабирование заданий с помощью Kubernetes.
Третий курс
  • Использование Spark для обработки ETL.
  • Обучение и запуск моделей машинного обучения с использованием IBM Watson.

Эта специализация подходит новичкам в области NoSQL и больших данных — даже если вы уже работаете инженерами данных, разработчиками, архитекторами информационных систем, учеными по данным или ИТ-менеджерами.

Details of the courses that make up the specialization

Введение в базы данных NoSQL

  • Курс 1
    • 18 часов
    • 4,6 (293 оценки)

Детали курса

Что вы узнаете:
  • Различают четыре основные категории баз данных NoSQL.
  • Описать характеристики, преимущества, ограничения и области применения популярных инструментов обработки больших данных.
  • Выполняйте общие задачи с помощью MongoDB, включая операции создания, чтения, обновления и удаления (CRUD).
  • Выйдите из операций Keyspace, Table и CRUD в Cassandra.
навыки, которые вы приобретете
  • Категория: Облачная база данных
  • Категория: Монгодб
  • Категория: Кассандра
  • Категория: NoSQL
  • Категория: Облаждающий агент

Введение в большие данные с помощью Spark и Hadoop

  • Курс 2
    • 19 часов
    • 4,4 (377 оценок)

Детали курса

Что вы узнаете:
  • Объясните влияние больших данных, включая варианты использования, инструменты и методы обработки.
  • Описать архитектуру, экосистему, методы и пользовательские приложения Apache Hadoop, включая Hive, HDFS, HBase, Spark и MapReduce.
  • Применяйте основы программирования Spark, включая основы параллельного программирования для DataFrames, наборов данных и Spark SQL.
  • Используйте RDD и наборы данных Spark, оптимизируйте Spark SQL с помощью Catalyst и Tungsten, а также воспользуйтесь преимуществами возможностей разработки и уровней выполнения Spark.
навыки, которые вы приобретете
  • Категория: Большие данные
  • Категория: СпаркSQL
  • Категория: SparkML
  • Категория: Apache Hadoop
  • Категория: Апач Спарк

Машинное обучение с Apache Spark

  • Курс 3
    • 15 часов
    • 4,5 (79 оценок)

Детали курса

Что вы узнаете:
  • Опишите машинное обучение, объясните его роль в инженерии данных, обобщите генеративный искусственный интеллект, обсудите использование Spark, а также проанализируйте конвейеры машинного обучения и сохранение моделей.
  • Оценивайте модели машинного обучения, различайте модели регрессии, классификации и распределения, а также сравнивайте конвейеры обработки данных с конвейерами машинного обучения.
  • Создавайте процессы анализа данных с помощью Spark SQL и выполняйте регрессию, классификацию и распределение с помощью SparkML.
  • Реализуйте подключение к кластерам Spark, создавайте конвейеры машинного обучения, выполняйте извлечение и преобразование функций и сохраняйте модели.
навыки, которые вы приобретете
  • Категория: машинное обучение
  • Категория: Конвейеры машинного обучения
  • Категория: Инженер данных
  • Категория: SparkML
  • Категория: Апач Спарк