Онлайн-курс — сертифицированный профессиональный сертификат в области инженерии данных IBM

Подготовьтесь к карьере инженера. Приобретайте навыки, необходимые на рынке труда, и тренируйтесь в области искусственного интеллекта. Получите сертификат от IBM. Никакого предыдущего опыта не требуется.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

начиная

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Питон
  • SQL
  • Реляционные базы данных (СУБД)
  • NoSQL
  • ЭТЛ
  • хранилища данных
  • Апач Спарк
  • Управление базой данных
  • Работа с неструктурированными данными
  • Генеративные инструменты и методы искусственного интеллекта
  • Создание туннелей данных
  • Практический опыт работы в проектах
  • Резервное копирование файлов в Linux
  • Анализ данных о трафике
  • Проектирование и создание хранилища данных
  • Передача данных в базах данных NoSQL
  • Обучение модели машинного обучения
  • Комплексное управление платформой обработки данных
  • Портфель проектов
  • Профессиональный сертификат от IBM
  • Цифровой значок от IBM
  • Доступ к карьерным ресурсам
  • Интервью с анестезиологом
  • Поддержка резюме
  • До 12 академических кредитов

What you will learn in the course

Courses for which the course is suitable

  • Инженер данных
  • специалист по данным
  • Аналитик бизнес-аналитики
  • ETL-разработчик
  • менеджер базы данных
  • Python-разработчик
  • аналитик данных
  • Специалист по большим данным
  • Разработчик хранилища данных
  • NoSQL-разработчик
  • Эксперт Apache Spark
  • Разработчик приложений для обработки данных
  • Менеджер проектов в области данных
## Профессиональный сертификат — 16 серий курсов Подготовьтесь к карьере в развивающейся области разработки данных. В этой программе вы освоите необходимые навыки, такие как Python, SQL и базы данных, чтобы быть **готовыми к работе менее чем за 5 месяцев**. Инженерия данных занимается созданием систем сбора, обработки и **организации необработанных данных в полезную информацию**. Инженеры по обработке данных предоставляют базовую информацию, которая необходима ученым, работающим с данными, и аналитикам бизнес-аналитики для принятия решений. Эта программа научит вас основам инженерии данных, которые работодатели ищут на отраслевых должностях, включая Python, один из наиболее широко используемых языков программирования. Кроме того, вы освоите **SQL, СУБД, ETL, хранилища данных, NoSQL, большие данные и Spark** с помощью практических лабораторий и проектов. **Вы научитесь использовать язык программирования Python** и сценарии Linux/UNIX для извлечения, преобразования и загрузки (ETL) данных. Вы будете работать с реляционными базами данных (СУБД) и запрашивать данные с помощью команд SQL, а также использовать базы данных NoSQL и неструктурированные данные. Вы также узнаете, как инструменты и методы генеративного искусственного интеллекта используются в инженерии данных. По завершении программы у вас будет **портфолио проектов** и профессиональный сертификат от IBM, подтверждающий ваш опыт. Кроме того, вы получите цифровой значок от IBM и **получите доступ к карьерным ресурсам**, которые помогут вам в поиске работы, включая собеседования с седативными препаратами и поддержку при составлении резюме. Эта программа рекомендована ACE®: по ее окончании **вы сможете заработать до 12 академических кредитов**. ## Проект практического обучения В ходе этого профессионального сертификата вы будете выполнять практические лабораторные работы и проекты, чтобы получить практический опыт работы с Python, SQL, реляционными базами данных, базами данных NoSQL, Apache Spark, созданием конвейеров данных, управлением базами данных и работой. с хранилищами данных. ### Проекты: — Разработка реляционной базы данных, которая поможет сети кофеен улучшить свою деятельность. — Использование SQL для запроса демографических данных по опросам населения, преступности и школ. — Написание Bash-скрипта в Linux для резервного копирования измененных файлов. — Создание, тестирование и оптимизация платформы данных, содержащей базы данных MySQL, PostgreSQL и IBM Db2. — Анализируйте данные о дорожном движении для выполнения ETL и создания конвейеров с помощью Airflow и Kafka. — Проектирование и создание хранилища данных для компании по обращению с твердыми отходами. — Передача, запрос и анализ данных в базах данных MongoDB, Cassandra и Cloudant NoSQL. — Обучение модели машинного обучения путем создания приложения Apache Spark. — Проектирование, установка и управление комплексной платформой обработки данных.

Details of the courses that make up the specialization

Введение в инженерию данных

Курс 1

  • 12 часов
  • 4.7

Детали курса

чему ты научишься

  • Разработайте список основных навыков, необходимых для должности инженера данных начального уровня.
  • Ознакомьтесь с различными этапами и концепциями жизненного цикла разработки данных.
  • Описать технологии обработки данных, такие как реляционные базы данных, базы данных NoSQL и механизмы больших данных.
  • Краткое изложение концепций информационной безопасности, управления и соответствия требованиям.

Навыки, которые вы приобретете

  • Категория: Shell-скрипт
  • Категория: Bash (Unix Shell)
  • Категория: Извлечение, преобразование и загрузка (ETL)
  • Категория: Линукс
  • категория: Команды Linux

Python для науки о данных, искусственного интеллекта и разработки

Курс 2

  • 25 часов
  • 4.6

Детали курса

чему ты научишься

  • Изучите Python — самый популярный язык программирования для анализа данных и разработки программного обеспечения.
  • Преобразуйте логику программирования Python в переменные, структуры данных, ветвления, циклы, функции, объекты и классы.
  • Продемонстрируйте способность использовать библиотеки Python, такие как Pandas и Numpy, и разрабатывать код с помощью Jupyter Notebooks.
  • Получайте доступ к данным из Интернета и извлекайте их с помощью API-интерфейсов Python и библиотек, таких как Beautiful Soup.

Навыки, которые вы приобретете

  • Категория: Облачные базы данных
  • Категория: Монгодб
  • Категория: Кассандра
  • Категория: NoSQL
  • Категория: Облаждающий агент

Проект Python для обработки данных

Курс 3

  • 9 часов
  • 4.6

Детали курса

чему ты научишься

  • Покажите свои навыки Python для работы и обработки данных.
  • Внедряйте очистку веб-данных и используйте API для извлечения данных с помощью Python.
  • Играйте роль инженера по обработке данных в реальном проекте по извлечению, преобразованию и загрузке данных.
  • Используйте блокноты Jupyter и IDE для завершения своего проекта.

Введение в реляционные базы данных (СУБД)

Курс 4

  • 15 часов
  • 4.6

Детали курса

чему ты научишься

  • Описывать базы данных, базы данных, реляционные базы данных и облачные базы данных.
  • Объяснять модели информации и данных, реляционные базы данных и концепции реляционных моделей (включая схемы и таблицы).
  • Объясните диаграмму отношений и конструкцию реляционной базы данных для конкретного варианта использования.
  • Развивайте практические знания популярных СУБД, включая MySQL, PostgreSQL и IBM DB2.

Навыки, которые вы приобретете

  • Категория: Наука о данных
  • Категория: Анализ данных
  • Категория: Программирование на Python
  • Категория: Нампи
  • Категория: Панды

Базы данных и SQL для науки о данных с помощью Python

Курс 5

  • 20 часов
  • 4.7

Детали курса

чему ты научишься

  • Анализируйте данные в базе данных с помощью SQL и Python.
  • Создайте реляционную базу данных и работайте с несколькими таблицами с помощью команд DDL.
  • Создавайте базовые и промежуточные SQL-запросы с помощью команд DML.
  • Создавайте более мощные запросы с помощью передовых методов SQL, таких как представления, транзакции, хранимые процедуры и соединения.

Навыки, которые вы приобретете

  • Категория: машинное обучение
  • Категория: Конвейеры машинного обучения
  • Категория: Инженер данных
  • Категория: SparkML
  • Категория: Апач Спарк

Практическое введение в команды Linux и сценарии оболочки.

Курс 6

  • 14 часов
  • 4.6

Детали курса

чему ты научишься

  • Описать архитектуру Linux и распространенные дистрибутивы Linux, а также установить программное обеспечение в системе Linux.
  • Выполняйте команды информации, файла, содержимого, навигации, сжатия и сети в оболочке Bash.
  • Разрабатывайте сценарии оболочки, используя команды Linux, переменные среды, каналы и фильтры.
  • Запланируйте задания cron в Linux с помощью crontab и объясните синтаксис cron.

Навыки, которые вы приобретете

  • Категория: Программирование на Python
  • Категория: Реляционные базы данных
  • Категория: SQL
  • Категория: NoSQL
  • Категория: каналы передачи данных

Администрирование базы данных (DBA)

Курс 7

  • 21 час
  • 4.4

Детали курса

чему ты научишься

  • Создавайте, запрашивайте и настраивайте базы данных, а также получайте доступ и создайте системные объекты, такие как таблицы.
  • Выполняйте базовое управление базами данных, включая резервное копирование и восстановление баз данных, а также управление ролями и привилегиями пользователей.
  • Отслеживайте и оптимизируйте важные аспекты производительности базы данных.
  • Решайте проблемы с базой данных, такие как подключение, вход в систему и настройку, а также автоматизируйте такие функции, как отчеты, сообщения и оповещения.

Навыки, которые вы приобретете

  • Категория: Программирование на Python
  • Категория: Информационная инженерия
  • Категория: Извлечение, преобразование и загрузка (ETL)
  • Категория: Инженер данных
  • Категория: парсинг данных

ETL и конвейеры данных с Shell, Airflow и Kafka

Курс 8

  • 17 часов
  • 4.5

Детали курса

чему ты научишься

  • Описывать и различать процессы выборки, преобразования, загрузки (ETL) и извлечения, загрузки, преобразования (ELT).
  • Объясните конденсаторные и параллельные режимы выполнения.
  • Запустите процесс ETL, используя команды Bash и функции Python.
  • Описывать компоненты конвейеров данных, процессов, инструментов и технологий.

Навыки, которые вы приобретете

  • Категория: Извлечение, преобразование и загрузка (ETL)
  • Категория: Инженер данных
  • Категория: Апач Кафка
  • Категория: Apache Airflow
  • Категория: каналы передачи данных

Основы работы с хранилищами данных

Курс 9

  • 15 часов
  • 4.4

Детали курса

чему ты научишься

  • Готовые к работе навыки в области хранилищ данных за 6 недель, подкрепленные практическим опытом и сертификацией IBM.
  • Спроектируйте и заполните хранилище данных, а также отбирайте и запрашивайте данные с помощью CUBE, ROLLUP и реализованных представлений.
  • Определите популярные инструменты анализа данных и бизнес-аналитики и создайте визуализацию данных с помощью IBM Cognos Analytics.
  • Как форматировать и загружать данные в хранилище данных, писать сводные запросы, создавать материализованные таблицы запросов и создавать аналитическую панель мониторинга.

Навыки, которые вы приобретете

  • Категория: Большие данные
  • Категория: СпаркSQL
  • Категория: SparkML
  • Категория: Apache Hadoop
  • Категория: Апач Спарк

Панели мониторинга BI с IBM Cognos Analytics и Google Looker

Курс 10

  • 11 часов

Детали курса

чему ты научишься

  • Изучите назначение инструментов аналитики и бизнес-аналитики (BI).
  • Уничтожили возможности IBM Cognos Analytics и Google Looker Studio.
  • Продемонстрируйте свою способность анализировать данные DB2 с помощью IBM Cognos Analytics.
  • Создавайте и делитесь интерактивными информационными панелями с помощью IBM Cognos Analytics и Google Looker Studio.

Навыки, которые вы приобретете

  • Категория: Программирование на Python
  • Категория: Облачные базы данных
  • Категория: Система управления реляционными базами данных (СУБД)
  • Категория: SQL
  • Категория: Блокноты Jupyter

Введение в базы данных NoSQL

Курс 11

  • 18 часов
  • 4.6

Детали курса

чему ты научишься

  • Различайте четыре основные категории баз данных NoSQL.
  • Опишите характеристики, особенности, преимущества, ограничения и области применения наиболее популярных инструментов обработки больших данных.
  • Выполняйте общие задачи с помощью MongoDB, включая создание, чтение, обновление и удаление (CRUD).
  • Запускайте операции с пространством ключей, таблицами и CRUD в Cassandra.

Навыки, которые вы приобретете

  • Категория: Безопасность баз данных
  • Категория: Система управления базами данных (СУБД)
  • Категория: Серверы баз данных
  • Категория: Управление базами данных
  • Категория: Реляционные базы данных

Введение в большие данные с помощью Spark и Hadoop

Курс 12

  • 19 часов
  • 4.4

Детали курса

чему ты научишься

  • Объясните влияние больших данных, включая варианты использования, инструменты и методы обработки.
  • Описать архитектуру, систему, методы и пользовательские приложения Apache Hadoop, включая Hive, HDFS, HBase, Spark и MapReduce.
  • Возродите фундаментальные концепции программирования Spark, включая основы параллельного программирования для DataFrames, наборов данных и Spark SQL.
  • Используйте RDD и наборы данных Spark, оптимизируйте Spark SQL с помощью Catalyst и Tungsten, а также используйте возможности разработки и среды выполнения Spark.

Навыки, которые вы приобретете

  • Категория: Наука о данных
  • Категория: Система управления базами данных (СУБД)
  • Категория: Информационная инженерия
  • Категория: SQL
  • Категория: NoSQL

Машинное обучение с Apache Spark

Курс 13

  • 15 часов
  • 4.6

Детали курса

чему ты научишься

  • Опишите машинное обучение, объясните его роль в инженерии данных, опишите генеративный искусственный интеллект, обсудите использование Spark, а также проанализируйте конвейеры машинного обучения и модель персистентности.
  • Оценивайте модели машинного обучения, различайте модели регрессии, классификации и кластеризации, а также сравнивайте конвейеры обработки данных с конвейерами машинного обучения.
  • Создавайте процессы анализа данных с помощью Spark SQL и выполняйте регрессию, классификацию и кластеризацию с помощью SparkML.
  • Демонстрируйте подключение к кластерам Spark, создавайте конвейеры машинного обучения, выполняйте извлечение и преобразование функций, а также составляйте отчеты о сохранении модели.

Навыки, которые вы приобретете

  • Категория: бизнес-аналитика
  • Категория: Визуализация данных
  • Категория: IBM Cognos Analytics
  • Категория: Google Looker Studio
  • Категория: Панели мониторинга

Финальный проект по инженерии данных

Курс 14

  • 16 часов
  • 4.7

Детали курса

чему ты научишься

  • Продемонстрировать владение навыками, необходимыми для должности инженера данных начального уровня.
  • Проектируйте и внедряйте различные концепции и компоненты в жизненном цикле обработки данных, например базы данных.
  • Продемонстрируйте практические знания о реляционных базах данных, базах данных NoSQL, механизмах больших данных, хранилищах данных и конвейерах данных.
  • Используйте навыки написания сценариев на языках программирования Linux, SQL и Python для решения задач инженерии данных.

Навыки, которые вы приобретете

  • Категория: Сверточная нейронная сеть
  • Категория: Информационная инженерия
  • Категория: Запрос к базе данных
  • Категория: Создание данных
  • Категория: Генеративный ИИ

Генеративный искусственный интеллект: продвижение в карьере инженера данных

Курс 15

  • 12 часов
  • 4.9

Детали курса

чему ты научишься

  • Используйте различные генеративные инструменты и методы в процессах обработки данных в различных отраслях.
  • Внедряйте различные процессы обработки данных, такие как создание, дополнение и анонимизация данных, с использованием генеративных инструментов.
  • Практикуйте навыки генеративного искусственного интеллекта в лабораториях и практических проектах для разработки схемы хранилища данных и построения инфраструктуры.
  • Оцените реальные случаи, иллюстрирующие успешное использование генеративного ИИ для ETL и хранилищ данных.

Навыки, которые вы приобретете

  • Категория: Проектирование баз данных (БД)
  • Категория: PostgreSQL
  • Категория: Система управления реляционными базами данных (СУБД)
  • Категория: Архитектура базы данных
  • Категория: MySQL

Руководство по карьере инженера данных и подготовка к собеседованию

Курс 16

  • 11 часов
  • 4.8

Детали курса

чему ты научишься

  • Опишите роль инженера по обработке данных и некоторые варианты карьеры, а также будущие возможности в этой области.
  • Объясните, как построить основы поиска работы, включая изучение списков вакансий, написание резюме и подготовку портфолио.
  • Кратко опишите, чего кандидат может ожидать во время типичного цикла собеседования, различные типы собеседований и способы подготовки к ним.
  • Объясните, как провести эффективное собеседование, включая методы ответа на вопросы и как провести профессиональную личную презентацию.

Навыки, которые вы приобретете

  • Категория: Кубики
  • Категория: хранилища данных
  • Категория: Схемы снежинок
  • Категория: Озера данных
  • Категория: РОЛЛАПЫ
  • Категория: Витрины данных
  • Категория: Звездные схемы