Curso online – especialización profesional certificada en Procesamiento de datos sin servidor por Google Cloud Institute

Desarrollando aplicaciones Big Data escalables con tecnologías avanzadas y soluciones personalizadas.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

a partir de

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • error aproximado
  • gráfico
  • Determinación de causalidad
  • modelo de datos
  • Extraer, transformar y cargar (ETL)
  • Analítica
  • modo (informática)

What you will learn in the course

Courses for which the course is suitable

  • Desarrollador de big data
  • Ingeniero de datos
  • analista de datos
  • Responsable de proyectos de datos
  • Experto en la nube de Google
  • Desarrollador de aplicaciones de procesamiento de datos.
  • gerente de sistemas de informacion
  • Especialista en soluciones de datos.

Prácticas: una serie de 3 cursos.

A medida que crecen las demandas de una empresa basada en datos, se vuelve más difícil mantenerse actualizado con la tecnología. Todos los profesionales del big data están familiarizados con las tres V del big data: volumen, velocidad y variedad. ¿Y si existiera una tecnología que no temiera limitaciones, diseñada para cumplir con estos requisitos?

Conozca el flujo de datos de Google Cloud. Google Cloud Dataflow simplifica el procesamiento de datos al unificar el procesamiento por lotes y el procesamiento de transmisión, brindando una experiencia sin servidor que permite a los usuarios centrarse en el análisis en lugar de la infraestructura. Esta pasantía es para clientes y socios que desean mejorar su comprensión de Dataflow para avanzar en sus aplicaciones de procesamiento de datos.

La pasantía incluye tres cursos:

  • lo esencial
    – que explica cómo Apache Beam y Dataflow trabajan juntos para satisfacer las necesidades de procesamiento de datos sin depender de un proveedor de servicios.
  • Desarrollo de rutas
    – que trata sobre cómo convertir nuestra lógica empresarial en aplicaciones de procesamiento de datos que puedan ejecutarse en Dataflow.
  • operaciones
    – que repasa las lecciones más importantes para administrar una aplicación de datos en Dataflow, incluido el monitoreo, la resolución de problemas, las pruebas y la confiabilidad.

Un proyecto de aprendizaje práctico.

Esta pasantía incluye laboratorios prácticos utilizando la plataforma Qwiklabs. Las prácticas de laboratorio se basan en la información aprendida en los módulos del curso. Cuando es necesario, se proporcionan versiones Java y Python de los laboratorios. Para los laboratorios que requieren agregar/actualizar código, proporcionamos una solución recomendada para su uso.

Details of the courses that make up the specialization

Procesamiento de datos sin servidor con Dataflow: conceptos básicos

Curso 1 • 3 horas

Detalles del curso

Lo que aprenderás:
  • Demuestre cómo Apache Beam y Cloud Dataflow trabajan juntos para satisfacer las necesidades de procesamiento de datos de su organización.
  • Resuma los beneficios del marco de movilidad Beam y habilítelo para trabajar con canalizaciones de flujo de datos.
  • Ejecute Shuffle & Streaming Engine para canalizaciones de procesamiento de datos, tanto por lotes como por streaming, para alcanzar el máximo rendimiento.
  • Permita una planificación flexible de los recursos para lograr un rendimiento más rentable.

Procesamiento de datos sin servidor con Dataflow: desarrollo de canalizaciones

Curso 2 • 18 horas

Detalles del curso

Lo que aprenderás:
  • En la segunda parte de la serie de cursos sobre Dataflow analizaremos en profundidad el desarrollo de pipelines con la ayuda del SDK de Beam. Comencemos con una descripción general de los conceptos de Apache Beam.
  • A continuación, veremos el procesamiento de datos en un flujo con ventanas, marcas de agua y activadores.
  • A continuación, revisaremos las opciones para fuentes y sumideros en sus canalizaciones, las convenciones para expresar datos que se pueden estructurar y cómo realizar conversiones con estado utilizando las API State y Timer.
  • A continuación, revisaremos las mejores metodologías para la conversión del rendimiento de la canalización.
  • Al final del curso, presentaremos SQL y Dataframes para representar su lógica empresarial en Beam y cómo desarrollar canalizaciones de forma iterativa utilizando los portátiles Beam.
Habilidades que obtendrás:
  • Categoría: Modelo de datos
  • Categoría: Extraer, Transformar y Cargar (ETL)
  • Categoría: Análisis
  • Categoría: Estado (Ciencias de la Computación)

Procesamiento de datos sin servidor con Dataflow: operaciones

Curso 3 • 9 horas

Detalles del curso

Lo que aprenderás:
  • Realice operaciones de monitoreo, resolución de problemas, pruebas y CI/CD en canalizaciones de Dataflow.
  • Implemente canalizaciones de Dataflow teniendo en cuenta la confiabilidad para maximizar la estabilidad de su plataforma de procesamiento de datos.
Habilidades que obtendrás:
  • Categoría: error de proximidad
  • categoría: gráfico
  • Categoría: Regresión
  • categoría: causalidad