在线课程 – IBM 数据工程认证专业证书

为工程师的职业生涯做好准备。获得就业市场所需的技能,并在人工智能领域进行自我培训。从 IBM 获取证书。不需要任何经验。

Suggested by: Coursera (What is Coursera?)

Professional Certificate

开始

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • SQL
  • 关系数据库 (RDBMS)
  • 无 SQL
  • ETL
  • 数据仓库
  • Apache Spark
  • 数据库管理
  • 使用非结构化数据
  • 生成式 AI 工具和技术
  • 构建数据隧道
  • 项目实践经验
  • 在 Linux 中备份文件
  • 交通数据分析
  • 数据仓库的设计和构建
  • NoSQL 数据库数据迁移
  • 机器学习模型训练
  • 管理端到端数据工程平台
  • 项目组合
  • IBM 专业证书
  • IBM 的数字徽章
  • 获取职业资源
  • 休眠访谈
  • 简历支持
  • 最多 12 个学分

What you will learn in the course

Courses for which the course is suitable

  • 数据工程师
  • 数据科学家
  • 商业智能分析师
  • ETL 密钥
  • 数据库管理器
  • Python 密钥
  • 数据分析师
  • 伟大的信息专家
  • 开发人员数据仓库
  • NoSQL 开发人员
  • Apache Spark 专家
  • 数据应用开发人员
  • 数据项目经理
## 专业证书 – 一系列 16 门课程为在新兴数据工程领域的职业生涯做准备。在此计划中,您将学习所需的技能,例如 Python、SQL 和数据库,以便在 5 个月内为工作做好准备。数据工程涉及构建用于收集、处理原始数据并将其组织为有用信息的系统。数据工程师提供数据科学家和商业智能分析师做出决策所需的基本信息。该计划将教您雇主在该行业寻找职位的数据工程基础知识,包括 Python,这是使用最广泛的编程语言之一。此外,您还将通过动手实验和项目掌握 SQL、RDBMS、ETL、数据仓库、NoSQL、大数据和 Spark**。**您将学习使用 Python 编程语言** 和 Linux/UNIX 脚本来提取、修改和加载 (ETL) 数据。您将使用关系数据库 (RDBMS) 并使用 SQL 命令淬灭数据,还将使用 NoSQL 数据库和非结构化数据。此外,您还将了解如何在数据工程中使用生成式 AI 工具和技术。完成该计划后,您将获得 **项目组合** 和 IBM 颁发的专业证书,以展示您的专业知识。此外,您还将获得 IBM 的数字徽章,并访问职业资源来帮助您找工作,包括休眠面试和简历支持。此计划由 ACE® 推荐 – 完成后,您将获得最多 12 个学分。## 动手学习项目 在此专业证书期间,您将进行动手实验和项目,以获得 Python、SQL、关系数据库、NoSQL 数据库、Apache Spark、构建数据管道、管理数据库和使用数据仓库方面的实践经验。### 项目: – 设计一个关系数据库,帮助咖啡网络改善其运营。 – 使用SQL查询人口、犯罪和学校调查的人口统计数据。 – 在Linux上编写一个备份修改文件的Bash脚本。 – 建立、测试和优化包含MySQL、PostgreSQL和IBM Db2数据库的数据平台。 – 分析道路交通数据以执行ETL并创建Airflow和Kafka使用的管道。 – 为一家固体废物管理公司设计和设置数据仓库。 – 迁移, 查询和分析 MongoDB、Cassandra 和 Cloudant NoSQL 数据库中的数据。- 通过创建 Apache Spark 应用程序来训练机器学习模型。- 设计、安装和管理端到端数据工程平台。

Details of the courses that make up the specialization

数据工程概论

课程 1

  • 12 小时
  • 4.7

课程详情

学习内容

  • 制定一份初创数据工程角色所需的基本技能清单。
  • 步入数据工程生命周期的不同阶段和概念。
  • 描述数据工程技术,例如关系数据库、NoSQL 数据库和大数据引擎。
  • 信息安全、政府和合规性概念的方案。

您将获得的技能

  • 类别: Shell 脚本
  • 类别: Bash (Unix Shell)
  • 类别: 检索、转换和加载 (ETL)
  • 类别: Linux
  • 类别: Linux 命令

用于数据科学、AI 和开发的 Python

课程 2

  • 25 小时
  • 4.6

课程详情

学习内容

  • 学习 Python – 数据科学和软件开发领域最流行的编程语言。
  • 将 Python 编程的逻辑转换为变量、数据结构、分支、循环、函数、对象和类。
  • 演示了使用 Python 库(如 Pandas 和 Numpy)以及使用 Jupyter Notebook 开发代码的能力。
  • 使用 Python API 和 Beautiful Soup 等库从 Web 访问和抓取数据。

您将获得的技能

  • 类别: 云数据库
  • 类别: MongoDB
  • 类别: Cassandra
  • 类别: NoSQL
  • 类别: Cloudant

用于数据工程的 Python 项目

课程 3

  • 9 小时
  • 4.6

课程详情

学习内容

  • 展示您的工作和数据处理 Python 技能。
  • 实施 Web 抓取并使用 API 通过 Python 提取数据。
  • 在实际项目中扮演数据工程师的角色,以提取、转换和加载数据。
  • 使用 Jupyter Notebook 和 IDE 完成您的项目。

关系数据库 (RDBMS) 简介

课程 4

  • 15 小时
  • 4.6

课程详情

学习内容

  • 描述数据、数据库、关系数据库和云数据库。
  • 解释信息和数据模型、关系数据库和关系模型概念(包括架构和表)。
  • 解释特定使用案例的关系图和关系数据库的设计。
  • 掌握常用 DBMS(包括 MySQL、PostgreSQL 和 IBM DB2)的实践知识。

您将获得的技能

  • 类别: 数据科学
  • 类别: 数据分析
  • 类别: Python 编程
  • 类别: Numpy
  • 类别: 熊猫

使用 Python 进行数据科学的数据库和 SQL

课程 5

  • 20 小时
  • 4.7

课程详情

学习内容

  • 使用 SQL 和 Python 分析数据库中的数据。
  • 使用 DDL 命令创建关系数据库并处理多个表。
  • 使用 DML 命令构建从基础到中级的 SQL 查询。
  • 使用高级 SQL 技术(如视图、事务、存储过程和联接)编译更强大的查询。

您将获得的技能

  • 类别: 机器学习
  • 类别: 机器学习管
  • 类别: 数据工程师
  • 类别: SparkML
  • 类别: Apache Spark

Linux 命令和 Shell 脚本实用介绍

课程 6

  • 14 小时
  • 4.6

课程详情

学习内容

  • 描述 Linux 和常见 Linux 发行版的架构,并在您的 Linux 系统上安装软件。
  • 在 Bash shell 中执行 info、file、content、navigation、compression 和 network 命令。
  • 使用 Linux 命令、环境变量、管道和筛选器开发 shell 脚本。
  • 在 Linux 中使用 crontab 配置 cron 作业并解释 cron 的语法。

您将获得的技能

  • 类别: Python 编程
  • 类别: 相对数据库
  • 类别: SQL
  • 类别: NoSQL
  • 类别: 数据管道

数据库管理 (DBA)

课程 7

  • 21 小时
  • 4.4

课程详情

学习内容

  • 创建、查询和配置数据库,以及访问和构建表等系统对象。
  • 执行基本的数据库管理,包括备份和还原数据库以及管理用户角色和权限。
  • 监控和优化数据库性能的重要方面。
  • 解决连接、登录和设置等数据库问题,并自动执行报告、通知和警报等功能。

您将获得的技能

  • 类别: Python 编程
  • 类别: 信息工程
  • 类别: 检索、转换和加载 (ETL)
  • 类别: 数据工程师
  • 类别: 数据抓取

使用 Shell、Airflow 和 Kafka 的 ETL 和数据管道

课程 8

  • 17 小时
  • 4.5

课程详情

学习内容

  • 描述和区分检索、转换、加载 (ETL) 流程和提取、加载、转换 (ELT) 流程。
  • 解释冷凝器与平行器的性能模式。
  • 使用 Bash 命令和 Python 函数运行 ETL 进程。
  • 描述数据管道、流程、工具和技术的组件。

您将获得的技能

  • 类别: 检索、转换和加载 (ETL)
  • 类别: 数据工程师
  • 类别: Apache Kafka
  • 类别: Apache Airflow
  • 类别: 数据管道

数据仓库基础知识

课程 9

  • 15 小时
  • 4.4

课程详情

学习内容

  • 在 6 周内掌握数据仓库的就业就绪技能,并得到实践经验和 IBM 认证的支持。
  • 设计和填充数据仓库,并使用 CUBE、ROLLUP 和 Realized Representations 对数据进行采样和借用。
  • 识别流行的数据分析和商业智能工具,并使用 IBM Cognos Analytics 创建数据可视化。
  • 如何格式化数据并将其加载到数据仓库中、编写摘要查询、创建已实施的查询表以及创建分析控制面板。

您将获得的技能

  • 类别: 大数据
  • 类别: SparkSQL
  • 类别: SparkML
  • 类别: Apache Hadoop
  • 类别: Apache Spark

使用 IBM Cognos Analytics 和 Google Looker 的 BI 仪表板

课程 10

  • 11 小时

课程详情

学习内容

  • 探索分析和商业智能 (BI) 工具的用途。
  • 粉碎 IBM Cognos Analytics 和 Google Looker Studio 的功能。
  • 展示您使用 IBM Cognos Analytics 分析 DB2 数据的能力。
  • 使用 IBM Cognos Analytics 和 Google Looker Studio 创建和共享交互式仪表板。

您将获得的技能

  • 类别: Python 编程
  • 类别: 云数据库
  • 类别: 相对数据库管理系统 (RDBMS)
  • 类别: SQL
  • 类别: Jupyter 笔记本

NoSQL 数据库简介

课程 11

  • 18 小时
  • 4.6

课程详情

学习内容

  • 区分 NoSQL 存储库的四个主要类别。
  • 描述更流行的大数据处理工具的特性、特性、优势、限制和应用。
  • 使用 MongoDB 执行常见任务,包括创建、读取、更新和删除 (CRUD)。
  • 在 Cassandra 中运行 keyspace、table 和 CRUD 操作。

您将获得的技能

  • 类别: 数据库安全
  • 类别: 数据库管理系统 (DBMS)
  • 类别: 数据库服务器
  • 类别: 数据库管理
  • 类别: 相对数据库

使用 Spark 和 Hadoop 的大数据简介

课程 12

  • 19 小时
  • 4.4

课程详情

学习内容

  • 解释大数据的影响,包括使用案例、处理工具和方法。
  • 描述 Apache Hadoop 的架构、系统、方法和与用户相关的应用程序,包括 Hive、HDFS、HBase、Spark 和 MapReduce。
  • 改进 Spark 编程的基本概念,包括 DataFrames、数据系统和 Spark SQL 的并行编程基础。
  • 使用 Spark RDD 和数据集,使用 Catalyst 和 Tungsten 优化 Spark SQL,并利用 Spark 的开发和运行选项。

您将获得的技能

  • 类别: 数据科学
  • 类别: 数据库管理系统 (DBMS)
  • 类别: 信息工程
  • 类别: SQL
  • 类别: NoSQL

使用 Apache Spark 进行机器学习

课程 13

  • 15 小时
  • 4.6

课程详情

学习内容

  • 描述 ML,解释其在数据工程、生成式 AI 架构中的作用,讨论 Spark 的用途,并分析 ML 管道和持久性模型。
  • 评估 ML 模型,区分回归、分类和聚类模型,并将数据工程管道与 ML 管道进行比较。
  • 使用 Spark SQL 构建数据分析流程,并使用 SparkML 执行回归、分类和聚类分析。
  • 显示与 Spark 集群的连接,构建 ML 管道,执行特征提取和转换,并宣布模型持久性。

您将获得的技能

  • 类别: 商业智能
  • 类别: 数据可视化
  • 类别: IBM Cognos Analytics
  • 类别: Google Looker Studio
  • 类别: 仪表板

数据工程最终项目

课程 14

  • 16 小时
  • 4.7

课程详情

学习内容

  • 证明熟练掌握入门级数据工程角色所需的技能。
  • 设计和应用数据工程生命周期中的各种概念和组件,例如数据库。
  • 展示关系数据库、NoSQL 数据库、大数据引擎、数据仓库和数据管道的可操作知识。
  • 使用 Linux、SQL 和 Python 编程语言的脚本编写技能来解决数据工程问题。

您将获得的技能

  • 类别: 卷积神经网络
  • 类别: 信息工程
  • 类别: 查询数据库
  • 类别: 数据生成
  • 类别: 生成式 AI

生成式 AI:推进您的数据工程职业生涯

课程 15

  • 12 小时
  • 4.9

课程详情

学习内容

  • 在不同行业的数据工程流程中利用不同的生成工具和技术。
  • 实施各种数据工程流程,例如使用生成式工具创建、扩展和匿名化数据。
  • 在实验室和动手项目中练习生成式 AI 技能,以设计数据仓库架构并设置基础设施。
  • 评估真实案例,说明成功将生成式 AI 用于 ETL 和数据存储库。

您将获得的技能

  • 类别: 数据库设计 (DB)
  • 类别: PostgreSQL
  • 类别: 相对数据库管理系统 (RDBMS)
  • 类别: 数据库架构
  • 类别: MySQL

数据工程职业和面试准备指南

课程 16

  • 11 小时
  • 4.8

课程详情

学习内容

  • 描述数据工程师的角色和一些职业选择,以及该领域的未来机会。
  • 解释如何构建求职的基础知识,包括研究职位列表、撰写简历和准备作品集。
  • 总结候选人在典型的求职面试周期中可以期待什么、不同类型的面试以及如何准备。
  • 解释如何进行有效的面试,包括回答问题的技巧以及如何进行专业的个人陈述。

您将获得的技能

  • 类别: 立方体
  • 类别: 数据仓库
  • 类别: Snowflake 架构
  • 类别: 数据湖
  • 类别: 汇总
  • 类别: 数据集市
  • 类别: 星型 Schema