在线课程 – IBM Institute NoSQL、大数据和 Spark 专业认证

大数据职业生涯的飞跃。掌握 NoSQL、大数据和 Apache Spark 的基础知识,并掌握机器学习和数据工程方面的市场就绪实践技能。

Suggested by: Coursera (What is Coursera?)

Professional Certificate

开始

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • 云数据库
  • Mongo 数据库
  • 卡珊德拉
  • 无 SQL
  • Claudient
  • 机器学习
  • 机器学习管
  • 数据工程师
  • Spark ML
  • Apache Spark
  • 大数据
  • Spark SQL
  • 阿帕奇箍

What you will learn in the course

Courses for which the course is suitable

  • 数据工程师
  • 程序员
  • 信息系统架构师
  • 数据科学家
  • IT 经理

专业化 – 3 门课程系列

数据管理行业对具有 NoSQL 技能的数据工程师和专业人员的需求量很大。此专业化面向那些有兴趣培养使用大数据、Apache Spark 和 NoSQL 数据库的基本技能的人。三门内容丰富的课程涵盖 MongoDB 和 Apache Cassandra 等常用数据库,以及广泛使用的大数据 Apache Hadoop 工具包,当然还有用于大规模数据处理的 Apache Spark 分析引擎。

概述

  • 不同类别的 NoSQL 数据库(不仅仅是 SQL)的概述
  • 动手操作多个数据库,包括:
    • IBM Cloudant
    • MongoDB 数据库
    • 卡珊德拉
  • 数据管理任务,例如:
    • 创建数据库
    • 恢复
    • 数据输入
    • 更新
    • 删除
    • 查询
    • 指数
    • 集合体
    • 数据共享
  • 大数据技术的基本知识,例如:
    • Hadoop
    • MapReduce
    • HDFS
    • 蜂房
    • HBase
  • 更深入地了解 Apache Spark,包括:
    • DataFrames של Spark
    • Spark SQL
    • PySpark
    • Spark 应用程序接口
    • 使用 Kubernetes 增加负载
  • 使用 Spark Structured Streaming 和 Spark ML 执行 ETL(提取、转换、加载)处理和机器学习任务。

实践学习项目

该专业的重点是实践学习。因此,每门课程都包括动手实验,用于练习和应用在课程中学到的 NoSQL 和大数据技能。

第一道菜
  • 使用多个 NoSQL 数据库 – MongoDB、Apache Cassandra 和 IBM Cloudant 来执行各种任务:
    • 创建数据库
    • 添加文档
    • 数据查询
    • 使用 HTTP API
    • 创建、读取、更新和删除 (CRUD)
    • 限制和排序记录
    • 指数
    • 集合体
    • 恢复
    • 使用 CQL shell
    • Keyspace 操作
    • 对表的更多操作
第二道菜
  • 使用 Docker 启动 Hadoop 集群并操作 Map Reduce 作业。
  • 探索在 Python 内核上使用 Jupyter 日志使用 Spark。
  • 使用 DataFrames、Spark SQL 构建 Spark 技能,并使用 Kubernetes 增加作业。
第三道菜
  • 使用 Spark 进行 ETL 处理。
  • 使用 IBM Watson 训练和运行机器学习模型。

此专业适合 NoSQL 和大数据领域的初学者 – 即使您已经担任数据工程师、开发人员、IT 架构师、数据科学家或 IT 管理员。

Details of the courses that make up the specialization

NoSQL 数据库简介

  • 课程 1
    • 18 小时
    • 4.6 (293 评价)

课程详情

您将学到什么:
  • 区分 NoSQL 数据库的四个主要类别。
  • 描述用于处理大数据的常用工具的特性、优势、限制和应用。
  • 使用 MongoDB 执行常见任务,包括创建、读取、更新和删除 (CRUD) 操作。
  • 退出 Cassandra 中的 Keyspace、Table 和 CRUD 操作。
您将获得的技能
  • 类别: 云数据库
  • 类别: MongoDB
  • 类别: Cassandra
  • 类别: NoSQL
  • 类别: Cloudant

使用 Spark 和 Hadoop 的大数据简介

  • 课程 2
    • 19 小时
    • 4.4 (377 评价)

课程详情

您将学到什么:
  • 解释大数据的影响,包括用例、工具和处理方法。
  • 描述 Apache Hadoop 的架构、生态系统、方法和用户相关的应用程序,包括 Hive、HDFS、HBase、Spark 和 MapReduce。
  • 实施 Spark 编程的基础知识,包括 DataFrames、数据集和 Spark SQL 的并行编程基础知识。
  • 使用 Spark RDD 和数据集,使用 Catalyst 和 Tungsten 优化 Spark SQL,并利用 Spark 的开发和运行级功能。
您将获得的技能
  • 类别: 大数据
  • 类别: SparkSQL
  • 类别: SparkML
  • 类别: Apache Hadoop
  • 类别: Apache Spark

使用 Apache Spark 进行机器学习

  • 课程 3
    • 15 小时
    • 4.5 (79 评价)

课程详情

您将学到什么:
  • 描述 ML,解释其在数据工程中的作用,总结生成式 AI,讨论 Spark 的用途,并分析 ML 管道和模型保留。
  • 评估 ML 模型,区分回归、分类和分布模型,并将数据工程管道与 ML 管道进行比较。
  • 使用 Spark SQL 构建数据分析流程,并使用 SparkML 执行回归、分类和分发。
  • 实现与 Spark 集群的连接,构建 ML 管道,执行功能和修改签出,并保存模型。
您将获得的技能
  • 类别: 机器学习
  • 类别: 机器学习管
  • 类别: 数据工程师
  • 类别: SparkML
  • 类别: Apache Spark