Curso online: especialización profesional certificada en procesamiento de datos sin servidor de Google Cloud

Creación de aplicaciones de big data escalables de manera fácil y eficiente.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

a partir de nivel intermedio avanzando involucrado

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • error de aproximación
  • gráfico
  • regresión
  • causalidad
  • modelo de datos
  • Extraer, transformar y cargar (ETL)
  • Analítica
  • Estadística (Ciencias de la Computación)

What you will learn in the course

Courses for which the course is suitable

  • Ingeniero de datos
  • Analista de Big Data
  • Arquitecto de datos en la nube
  • Desarrollador de canalización de datos
  • Especialista en operaciones de datos
  • científico de datos
  • Desarrollador de Inteligencia de Negocios
  • Ingeniero de procesamiento de datos

Pasantía: una serie de cursos de tres partes

Cada vez es más difícil mantener un conjunto de tecnologías capaces de satisfacer las crecientes demandas de un negocio centrado en datos. Todo profesional del Big Data conoce las tres V del Big Data: volumen, velocidad y variedad. ¿Y si existiera una tecnología adecuada para grandes volúmenes y diseñada para cumplir con estos requisitos?

Aquí es donde entra en juego Google Cloud Dataflow. Google Cloud Dataflow simplifica el procesamiento de datos al combinar el procesamiento por lotes y en flujo, y proporciona una experiencia de trabajo sin servidor que permite a los usuarios centrarse en el análisis en lugar de en la infraestructura. Esta pasantía es para clientes y socios que desean profundizar su comprensión de Dataflow y mejorar sus aplicaciones de procesamiento de datos.

Como parte de la pasantía, hay tres cursos:

  • Foundations , que revisó cómo Apache Beam y Dataflow trabajan juntos para satisfacer sus necesidades de procesamiento de datos sin correr el riesgo de depender del proveedor.
  • Developing Pipelines , que trata sobre cómo convertir nuestra lógica empresarial en aplicaciones de procesamiento de datos que se puedan ejecutar en Dataflow.
  • Operaciones , que explora las clases más importantes para ejecutar una aplicación de datos en Dataflow, incluido el monitoreo, la resolución de problemas, las pruebas y la confiabilidad.

Proyecto de aprendizaje aplicado:

Esta pasantía incluye laboratorios prácticos utilizando la plataforma Qwiklabs. Las prácticas de laboratorio se basan en conceptos discutidos en los módulos del curso. Cuando corresponde, proporcionamos versiones de los laboratorios en lenguaje Java y Python. Para los laboratorios que requieren agregar/actualizar un código, brindamos una solución recomendada para su revisión.

Details of the courses that make up the specialization

Procesamiento de datos sin servidor con Dataflow: Curso básico de portugués brasileño

  • Curso 1 • 3 horas

Detalles del curso

¿Qué aprenderás?

  • Demuestre cómo Apache Beam y Cloud Dataflow trabajan juntos para satisfacer las necesidades de procesamiento de datos de su organización.
  • Resumir los beneficios de Beam Portability Framework y permitirle usarlo en sus canalizaciones de Dataflow
  • Habilite Shuffle & Streaming Engine para canalizaciones por lotes y de streaming de una manera que proporcione el máximo rendimiento
  • Permitir una planificación flexible de los recursos para actuaciones más rentables.

Procesamiento de datos sin servidor con Dataflow: operaciones del curso en portugués brasileño

  • Curso 2 • 9 horas

Detalles del curso

¿Qué aprenderás?

  • Realizar monitoreo, solución de problemas, pruebas y CI/CD en canalizaciones de Dataflow
  • Implementar canalizaciones de Dataflow con énfasis en la confiabilidad para maximizar la estabilidad de la plataforma de procesamiento de datos.

habilidades que adquirirás

  • Categoría: Error de aproximación
  • Categoría: Gráficos
  • Categoría: Regresión
  • categoría: causalidad

Procesamiento de datos sin servidor con Dataflow: desarrollo de pipelines en un curso en portugués brasileño

  • Curso 3 • 18 horas

Detalles del curso

¿Qué aprenderás?

  • En la segunda parte de la serie de cursos sobre Dataflow profundizaremos en el desarrollo de pipelines utilizando el SDK de Beam. Comenzaremos con una descripción general de las ideas básicas en Apache Beam.
  • A continuación, analizaremos el procesamiento de datos de transmisión mediante ventanas, marcas de agua y controladores.
  • Continuaremos cubriendo opciones para fuentes y destinos en sus canalizaciones, esquemas para expresar sus datos estructurados y cómo realizar transformaciones con estado utilizando las API State y Timer.
  • Pasaremos a revisar las mejores prácticas que ayudarán a maximizar el rendimiento de su canalización.
  • Hacia el final del curso, presentaremos SQL y Dataframes para representar su lógica empresarial en Beam y cómo desarrollar canalizaciones utilizando cuadernos Beam de forma iterativa.

habilidades que adquirirás

  • Categoría: Modelo de datos
  • Categoría: Producción, Transformación y Carga (ETL)
  • Categoría: Análisis
  • Categoría: Estado (Ciencias de la Computación)