Curso online – especialización profesional certificada en NoSQL, Big Data y Spark por IBM Institute

Comience su carrera en big data. Domine los fundamentos de NoSQL, Big Data y Apache Spark con habilidades prácticas y listas para el mercado en aprendizaje automático e ingeniería de datos.

Suggested by: Coursera (What is Coursera?)

Start your Coursera.com free trial today

Curso online - especialización profesional certificada en NoSQL, Big Data y Spark por IBM Institute

Professional Certificate

a partir de

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

Bases de datos en la nube
MongoDB
casandra
No SQL
claudante
aprendizaje automático
Canalizaciones de aprendizaje automático
Ingeniero de datos
Chispa ML
chispa apache
grandes datos
Chispa SQL
Apache la droga

What you will learn in the course

Courses for which the course is suitable

Ingeniero de datos
desarrollador de software
Arquitecto de sistemas de información
científico de datos
gerente de TI

La especialización: una serie de cursos de 3 cursos.

Los ingenieros de datos y los profesionales con habilidades NoSQL tienen una gran demanda en la industria de la gestión de datos. Esta especialización está dirigida a quienes deseen desarrollar habilidades básicas para trabajar con bases de datos Big Data, Apache Spark y NoSQL. Tres cursos llenos de información cubren bases de datos populares como MongoDB y Apache Cassandra, así como el kit de herramientas Apache Hadoop ampliamente utilizado para big data y, por supuesto, el motor de análisis Apache Spark para el procesamiento de datos a gran escala.

Descripción general

Descripción general de diferentes categorías de bases de datos NoSQL (no solo SQL)
Trabajo práctico con varias bases de datos, que incluyen:

IBM Cloudant
MongoDB
casandra

Tareas de gestión de datos, tales como:

Creando bases de datos
su reconstrucción
Entrada de datos
actualizando
supresión
Consultas
Índice
Agregación
compartir datos

Conocimientos básicos de tecnologías Big Data como:

hadoop
MapaReducir
HDFS
Colmena
HBase

Conocimiento más profundo de Apache Spark, que incluye:

Marcos de datos de Spark
Chispa SQL
PySpark
La interfaz de la aplicación Spark
Escalar la carga con Kubernetes

Trabajar con Spark Structured Streaming y Spark ML para realizar tareas de procesamiento ETL (Extracción, Transformación, Carga) y aprendizaje automático.

Un proyecto de aprendizaje práctico.

El énfasis en esta especialización está en el aprendizaje práctico. Por ello, cada curso incluye laboratorios prácticos para practicar y aplicar las habilidades de NoSQL y Big Data aprendidas durante las clases.

primer plato

Trabaje con varias bases de datos NoSQL: MongoDB, Apache Cassandra e IBM Cloudant para realizar una variedad de tareas:

Creando una base de datos
Agregar documentos
Consultas de datos
Usando la API HTTP
Realizar operaciones de creación, lectura, actualización y eliminación (CRUD)
Restringir y ordenar registros
Índice
Agregación
reconstrucción
Usando el shell CQL
Operaciones en espacio clave
Operaciones adicionales en tablas.

Segundo curso

Lanzar un clúster de Hadoop usando Docker y operar trabajos de Map Reduce.
Explore cómo trabajar con Spark usando registros de Jupyter en el núcleo de Python.
Desarrollar habilidades de Spark usando DataFrames, Spark SQL y escalando trabajos usando Kubernetes.

Tercer curso

Usando Spark para el procesamiento ETL.
Entrenamiento y ejecución de modelos de aprendizaje automático utilizando IBM Watson.

Esta especialización es adecuada para principiantes en el campo de NoSQL y Big Data, incluso si ya trabaja como ingeniero de datos, desarrollador, arquitecto de sistemas de información, científico de datos o administrador de TI.

Details of the courses that make up the specialization

Introducción a las bases de datos NoSQL

Curso 1

18 horas
4,6 (293 valoraciones)

Detalles del curso

Lo que aprenderás:

Distinga entre las cuatro categorías principales de bases de datos NoSQL.
Describir las características, ventajas, limitaciones y aplicaciones de herramientas populares para procesar big data.
Realice tareas comunes utilizando MongoDB, incluidas operaciones de creación, lectura, actualización y eliminación (CRUD).
Salga de las operaciones Keyspace, Table y CRUD en Cassandra.

habilidades que adquirirás

Categoría: Base de datos en la nube
Categoría: MongoDB
Categoría: Casandra
Categoría: NoSQL
Categoría: Nuboso

Introducción al Big Data con Spark y Hadoop

Curso 2

19 horas
4,4 (377 valoraciones)

Detalles del curso

Lo que aprenderás:

Explicar el impacto del big data, incluidos casos de uso, herramientas y métodos de procesamiento.
Describir la arquitectura, el ecosistema, las prácticas y las aplicaciones relacionadas con el usuario de Apache Hadoop, incluidos Hive, HDFS, HBase, Spark y MapReduce.
Aplique los fundamentos de la programación de Spark, incluidos los fundamentos de la programación paralela para DataFrames, conjuntos de datos y Spark SQL.
Utilice Spark RDD y conjuntos de datos, optimice Spark SQL usando Catalyst y Tungsten, y aproveche las opciones de desarrollo y los niveles de ejecución de Spark.

habilidades que adquirirás

Categoría: Grandes Datos
Categoría: SparkSQL
Categoría: SparkML
Categoría: Apache Hadoop
Categoría: Apache Spark

Aprendizaje automático con Apache Spark

Curso 3

15 horas
4,5 (79 valoraciones)

Detalles del curso

Lo que aprenderás:

Describa ML, explique su papel en la ingeniería de datos, resuma la IA generativa, analice los usos de Spark y analice las canalizaciones de ML y la retención de modelos.
Evalúe modelos de ML, distinga entre modelos de regresión, clasificación y distribución, y compare canales de ingeniería de datos con canales de ML.
Cree procesos de análisis de datos utilizando Spark SQL y realice regresión, clasificación y distribución utilizando SparkML.
Realice la conexión a clústeres de Spark, cree canalizaciones de aprendizaje automático, realice extracción y transformación de características y guarde modelos.

habilidades que adquirirás

Categoría: aprendizaje automático
Categoría: canales de aprendizaje automático
Categoría: Ingeniero de datos
Categoría: SparkML
Categoría: Apache Spark

Curso online – especialización profesional certificada en NoSQL, Big Data y Spark por IBM Institute

Professional Certificate

a partir de

Time to complete the course

7-day free trial

Skills you will acquire in the course

What you will learn in the course

Courses for which the course is suitable

La especialización: una serie de cursos de 3 cursos.

Descripción general

Un proyecto de aprendizaje práctico.

primer plato

Segundo curso

Tercer curso

Details of the courses that make up the specialization

Introducción a las bases de datos NoSQL

Detalles del curso

Lo que aprenderás:

habilidades que adquirirás

Introducción al Big Data con Spark y Hadoop

Detalles del curso

Lo que aprenderás:

habilidades que adquirirás

Aprendizaje automático con Apache Spark

Detalles del curso

Lo que aprenderás:

habilidades que adquirirás

Productos relacionados

Curso online – especialización profesional certificada en Java como segundo idioma por LearnQuest

Curso en línea – especialización profesional certificada en ingeniería de sistemas de la Universidad de Colorado Boulder

Curso en línea: pasantía profesional certificada en el curso de JavaScript para principiantes de Google y la Universidad de California, Davis

Curso en línea – especialización profesional certificada en Programación Java e ingeniería de software de la Universidad de Duke