Cree mejores herramientas de ciencia de datos. Aprenda a diseñar software para herramientas de datos, distribuir paquetes R y crear visualizaciones personalizadas.
Suggested by: Coursera (What is Coursera?)
No prior knowledge required
No unnecessary risks
R es un lenguaje de programación y un entorno de software gratuito para cálculos y gráficos estadísticos, ampliamente utilizado por analistas, científicos de datos y estadísticos.
Esta especialización se ocupa del desarrollo de software en R para la construcción de herramientas de ciencia de datos. A medida que evoluciona el campo de la ciencia de datos, queda claro que las habilidades de desarrollo de software son esenciales para producir y ampliar resultados y productos útiles de la ciencia de datos.
Aprenderá métodos modernos de desarrollo de software para crear herramientas reutilizables, modulares y adecuadas para su uso en entornos de equipo o comunidades de desarrolladores.
En cada uno de los cursos, los estudiantes aplicarán las habilidades avanzadas de R que hayan adquirido para:
Estos proyectos producirán una cartera de código R que se puede reutilizar y desarrollar para su implementación en el mundo real.
Este curso proporciona una introducción profunda al lenguaje de programación R, con énfasis en el uso de R para el desarrollo de software de ciencia de datos. Ya sea que sea parte de un equipo de ciencia de datos o trabaje de forma independiente en una comunidad de desarrolladores, este curso le brindará el conocimiento de R que necesita para contribuir de manera significativa en estos campos. Como primer curso de especialización, proporciona los conceptos básicos de R necesarios para cursos posteriores. Introduciremos conceptos básicos en R, principios del lenguaje, conceptos clave como datos ordenados y herramientas relacionadas en Thediaverse, procesamiento y manipulación de conjuntos de datos grandes y complejos, manejo de datos textuales y tareas básicas de ciencia de datos. Después de completar el curso, los estudiantes dominarán el uso de la consola R y podrán crear conjuntos de datos ordenados a partir de una amplia variedad de fuentes de datos posibles.
Este curso cubre temas avanzados en programación R necesarios para desarrollar herramientas de ciencia de datos potentes, robustas y utilizables. Los temas incluyen programación funcional en R, manejo resistente de errores, programación orientada a objetos, pruebas y perfiles de rendimiento, depuración y diseño de funciones adecuadas. Después de completar el curso, podrá identificar e incluir tareas comunes de análisis de datos dentro de las funciones destinadas a los usuarios. Dado que cada entorno de ciencia de datos enfrenta desafíos de datos únicos, siempre es necesario desarrollar software adaptado al informe de su organización. También puede definir nuevos tipos de datos en R y desarrollar líneas de acción únicas para esos tipos de datos para permitir una ejecución más clara de las tareas de ciencia de datos. mayor usabilidad dentro de un equipo.
Escribir un buen código para la ciencia de datos es sólo una parte del trabajo. Para maximizar la usabilidad y reutilización del software de ciencia de datos, el código debe organizarse y distribuirse de manera que cumpla con los estándares comunitarios y brinde una buena experiencia de usuario. Este curso cubre las principales formas en que el software R se organiza y distribuye a otros. Cubrimos el desarrollo de paquetes R, la redacción de documentación buena y equilibrada, la redacción de software resistente, el desarrollo multiplataforma, las herramientas de integración continua y la distribución de paquetes a través de CRAN y GitHub. Los estudiantes producirán paquetes R que cumplan con los criterios de envío a CRAN.
La revolución de la ciencia de datos ha producido grandes cantidades de datos de una amplia variedad de nuevas fuentes. Estos nuevos datos se utilizan para responder nuevas preguntas de una manera que no se ha descrito antes. La visualización sigue siendo una de las formas más poderosas de sacar conclusiones a partir de datos, pero la afluencia de nuevos tipos de datos requiere el desarrollo de nuevas técnicas de visualización. Este curso le proporciona las habilidades para crear esas herramientas de visualización. Nos centraremos en el marco ggplot2 y mostraremos cómo usar y expandir el sistema de acuerdo con las necesidades específicas de su organización o equipo. Al finalizar el curso, los estudiantes podrán crear las herramientas necesarias para visualizar una amplia variedad de tipos de datos y tendrán los conocimientos básicos necesarios para manejar nuevos tipos de datos a medida que se reciban.
Un curso resumido para la programación en R



