Curso online – especialización profesional certificada en NoSQL, Big Data y Spark por IBM Institute

Comience su carrera en big data. Domine los fundamentos de NoSQL, Big Data y Apache Spark con habilidades prácticas y listas para el mercado en aprendizaje automático e ingeniería de datos.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

a partir de

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Bases de datos en la nube
  • MongoDB
  • casandra
  • No SQL
  • claudante
  • aprendizaje automático
  • Canalizaciones de aprendizaje automático
  • Ingeniero de datos
  • Chispa ML
  • chispa apache
  • grandes datos
  • Chispa SQL
  • Apache la droga

What you will learn in the course

Courses for which the course is suitable

  • Ingeniero de datos
  • desarrollador de software
  • Arquitecto de sistemas de información
  • científico de datos
  • gerente de TI

La especialización: una serie de cursos de 3 cursos.

Los ingenieros de datos y los profesionales con habilidades NoSQL tienen una gran demanda en la industria de la gestión de datos. Esta especialización está dirigida a quienes deseen desarrollar habilidades básicas para trabajar con bases de datos Big Data, Apache Spark y NoSQL. Tres cursos llenos de información cubren bases de datos populares como MongoDB y Apache Cassandra, así como el kit de herramientas Apache Hadoop ampliamente utilizado para big data y, por supuesto, el motor de análisis Apache Spark para el procesamiento de datos a gran escala.

Descripción general

  • Descripción general de diferentes categorías de bases de datos NoSQL (no solo SQL)
  • Trabajo práctico con varias bases de datos, que incluyen:
    • IBM Cloudant
    • MongoDB
    • casandra
  • Tareas de gestión de datos, tales como:
    • Creando bases de datos
    • su reconstrucción
    • Entrada de datos
    • actualizando
    • supresión
    • Consultas
    • Índice
    • Agregación
    • compartir datos
  • Conocimientos básicos de tecnologías Big Data como:
    • hadoop
    • MapaReducir
    • HDFS
    • Colmena
    • HBase
  • Conocimiento más profundo de Apache Spark, que incluye:
    • Marcos de datos de Spark
    • Chispa SQL
    • PySpark
    • La interfaz de la aplicación Spark
    • Escalar la carga con Kubernetes
  • Trabajar con Spark Structured Streaming y Spark ML para realizar tareas de procesamiento ETL (Extracción, Transformación, Carga) y aprendizaje automático.

Un proyecto de aprendizaje práctico.

El énfasis en esta especialización está en el aprendizaje práctico. Por ello, cada curso incluye laboratorios prácticos para practicar y aplicar las habilidades de NoSQL y Big Data aprendidas durante las clases.

primer plato
  • Trabaje con varias bases de datos NoSQL: MongoDB, Apache Cassandra e IBM Cloudant para realizar una variedad de tareas:
    • Creando una base de datos
    • Agregar documentos
    • Consultas de datos
    • Usando la API HTTP
    • Realizar operaciones de creación, lectura, actualización y eliminación (CRUD)
    • Restringir y ordenar registros
    • Índice
    • Agregación
    • reconstrucción
    • Usando el shell CQL
    • Operaciones en espacio clave
    • Operaciones adicionales en tablas.
Segundo curso
  • Lanzar un clúster de Hadoop usando Docker y operar trabajos de Map Reduce.
  • Explore cómo trabajar con Spark usando registros de Jupyter en el núcleo de Python.
  • Desarrollar habilidades de Spark usando DataFrames, Spark SQL y escalando trabajos usando Kubernetes.
Tercer curso
  • Usando Spark para el procesamiento ETL.
  • Entrenamiento y ejecución de modelos de aprendizaje automático utilizando IBM Watson.

Esta especialización es adecuada para principiantes en el campo de NoSQL y Big Data, incluso si ya trabaja como ingeniero de datos, desarrollador, arquitecto de sistemas de información, científico de datos o administrador de TI.

Details of the courses that make up the specialization

Introducción a las bases de datos NoSQL

  • Curso 1
    • 18 horas
    • 4,6 (293 valoraciones)

Detalles del curso

Lo que aprenderás:
  • Distinga entre las cuatro categorías principales de bases de datos NoSQL.
  • Describir las características, ventajas, limitaciones y aplicaciones de herramientas populares para procesar big data.
  • Realice tareas comunes utilizando MongoDB, incluidas operaciones de creación, lectura, actualización y eliminación (CRUD).
  • Salga de las operaciones Keyspace, Table y CRUD en Cassandra.
habilidades que adquirirás
  • Categoría: Base de datos en la nube
  • Categoría: MongoDB
  • Categoría: Casandra
  • Categoría: NoSQL
  • Categoría: Nuboso

Introducción al Big Data con Spark y Hadoop

  • Curso 2
    • 19 horas
    • 4,4 (377 valoraciones)

Detalles del curso

Lo que aprenderás:
  • Explicar el impacto del big data, incluidos casos de uso, herramientas y métodos de procesamiento.
  • Describir la arquitectura, el ecosistema, las prácticas y las aplicaciones relacionadas con el usuario de Apache Hadoop, incluidos Hive, HDFS, HBase, Spark y MapReduce.
  • Aplique los fundamentos de la programación de Spark, incluidos los fundamentos de la programación paralela para DataFrames, conjuntos de datos y Spark SQL.
  • Utilice Spark RDD y conjuntos de datos, optimice Spark SQL usando Catalyst y Tungsten, y aproveche las opciones de desarrollo y los niveles de ejecución de Spark.
habilidades que adquirirás
  • Categoría: Grandes Datos
  • Categoría: SparkSQL
  • Categoría: SparkML
  • Categoría: Apache Hadoop
  • Categoría: Apache Spark

Aprendizaje automático con Apache Spark

  • Curso 3
    • 15 horas
    • 4,5 (79 valoraciones)

Detalles del curso

Lo que aprenderás:
  • Describa ML, explique su papel en la ingeniería de datos, resuma la IA generativa, analice los usos de Spark y analice las canalizaciones de ML y la retención de modelos.
  • Evalúe modelos de ML, distinga entre modelos de regresión, clasificación y distribución, y compare canales de ingeniería de datos con canales de ML.
  • Cree procesos de análisis de datos utilizando Spark SQL y realice regresión, clasificación y distribución utilizando SparkML.
  • Realice la conexión a clústeres de Spark, cree canalizaciones de aprendizaje automático, realice extracción y transformación de características y guarde modelos.
habilidades que adquirirás
  • Categoría: aprendizaje automático
  • Categoría: canales de aprendizaje automático
  • Categoría: Ingeniero de datos
  • Categoría: SparkML
  • Categoría: Apache Spark