在线课程 – Google 和杜克大学 Python 数据工程专业认证

通过数据工程提高您的编程技能。使用大数据做出决策、执行分析以及开发 AI 和机器学习应用程序。

Suggested by: Coursera (What is Coursera?)

Professional Certificate

中档

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • 数据科学
  • 大数据
  • Python 编程
  • 信息工程
  • Kubernetes (简体中文)
  • 数据可视化
  • Apache Hadoop
  • Docker 容器
  • Apache Spark
  • Snowflake (数据仓库)

What you will learn in the course

Courses for which the course is suitable

  • 软件工程师
  • 钥匙
  • 研究员
  • 数据科学家
  • 数据工程师
  • 机器学习专家 (Machine Learning Specialist)
  • 商业信息专家

专业化 – 三个课程系列

了解如何使用数据工程将大数据用于业务战略、数据分析或机器学习和 AI。通过完成本系列课程,您将掌握构建有效数据管道所需的知识和技能,管理高级平台,例如:

  • Hadoop
  • 火花
  • 雪花
  • Databricks
  • Kubernetes (简体中文)

并通过可视化用数据讲故事。深入了解基本的大数据概念、使用 Spark 进行分布式计算、Snowflake 的架构、Databricks 的机器学习功能、用于数据可视化的 Python 技术以及 DataOps 等关键方法。

目标受众

本课程系列专为以下人员设计:

  • 软件工程师
  • 开发 人员
  • 研究者
  • 数据科学家

那些想要加强自己在数据科学或机器模式方面的专业化的人,以及希望将职业生涯发展为以数据为中心的软件工程师、数据科学家或在云、机器学习、商业信息或其他领域工作的数据工程师的专业人士。

实践学习项目

实习生有一个最终项目,重点是使用 Databricks API 重新创建现有项目。这提供了使用 Databricks 构建投资组合就绪数据解决方案的实践经验。在各种数据工程任务中实施 Python。

Details of the courses that make up the specialization

用于数据工程的 Spark、Hadoop 和 Snowflake

  • 课程 1 • 29 小时 • 3.9 (40 个等级)

课程详情

学习内容
  • 创建可扩展的数据管道(Hadoop、Spark、Snowflake、Databricks)以实现高效的数据管理。
  • 通过分组和扩展来优化数据工程,以提高性能和资源利用率。
  • 在 Databricks 上构建 ML(PySpark、MLFlow)解决方案,以实现无缝的模型开发和实施。
  • 实施 DataOps 和 DevOps 实践,以实现数据驱动型应用程序的持续集成和实施 (CI/CD),包括流程自动化。
您将获得的技能
  • 类别: 大数据
  • 类别: Python 编程
  • 类别: 信息工程
  • 类别: Apache Hadoop
  • 类别: Apache Spark

用于数据工程的虚拟化、Docker 和 Kubernetes

  • 课程 2 • 27 小时 • 3.8 (23 评分)

课程详情

学习内容
  • 控制虚拟化、容器化和 Docker,包括使用 Compose 和 Airflow 跨多个容器创建和协调 Dockerfile。
  • 使用云环境、GitHub Codespaces 和 AI 驱动型工具培养 Kubernetes 核心概念、集群架构和实施方面的专业知识。
  • 浏览数据场景,同时通过云编排和 SRE 实践控制容器化、应用程序实施和处理生产问题。
您将获得的技能
  • 类别: 基于云的集成
  • 类别: 容器化
  • 类别: 虚拟化
  • 类别: Kubernetis
  • 类别: Docker (软件)

使用 Python 进行数据可视化

  • 课程 3 • 9 小时 • 4.2 (15 个评分)

课程详情

学习内容
  • 专业地使用 Python、电子表格和 BI 工具创建令人印象深刻的交互式数据可视化。
  • 通过令人印象深刻的可视化和数据故事讲述来制定和交流数据驱动的洞察和故事。
  • 进行评估并选择最合适的可视化工具和技术,以满足组织的需求和目标。
您将获得的技能
  • 类别: 商业传播
  • 类别: 数据分析
  • 类别: Python 编程
  • 类别: 云应用
  • 类别: 数据可视化