Создавайте более эффективные инструменты для анализа данных. Научитесь разрабатывать программное обеспечение для инструментов обработки данных, распространять пакеты R и создавать собственные визуализации.
Suggested by: Coursera (What is Coursera?)
No prior knowledge required
No unnecessary risks
R — это язык программирования и бесплатная программная среда для статистических расчетов и графики, которая широко используется аналитиками, специалистами по обработке данных и статистиками.
Эта специализация занимается разработкой программного обеспечения на R для создания инструментов обработки данных. По мере развития области науки о данных становится ясно, что навыки разработки программного обеспечения необходимы для получения и расширения полезных результатов и продуктов в области науки о данных.
Вы изучите современные методы разработки программного обеспечения, позволяющие создавать инструменты многократного использования, модульные и подходящие для использования в командных средах или сообществах разработчиков.
На каждом курсе студенты будут применять приобретенные ими продвинутые навыки R для:
Эти проекты создадут портфель кода R, который можно будет повторно использовать и дорабатывать для реального развертывания.
Этот курс представляет собой углубленное введение в язык программирования R с упором на использование R для разработки программного обеспечения для обработки данных. Независимо от того, являетесь ли вы частью команды по обработке данных или работаете самостоятельно в сообществе разработчиков, этот курс даст вам знания R, необходимые для внесения значимого вклада в эти области. В качестве первого курса повышения квалификации он обеспечивает необходимые основы R для последующих курсов. Мы представим базовые концепции R, принципы языка, ключевые понятия, такие как упорядоченные данные и связанные с ними инструменты в Thediaverse, обработку и манипулирование сложными и большими наборами данных, обработку текстовых данных и основные задачи науки о данных. После завершения курса студенты будут свободно пользоваться консолью R и смогут создавать упорядоченные наборы данных из самых разных возможных источников данных.
В этом курсе рассматриваются продвинутые темы программирования на R, необходимые для разработки мощных, надежных и удобных инструментов обработки данных. Темы включают функциональное программирование на R, отказоустойчивую обработку ошибок, объектно-ориентированное программирование, профилирование и тестирование производительности, отладку и правильное проектирование функций. После прохождения курса вы сможете определять и включать общие задачи анализа данных в функции, предназначенные для пользователей. Поскольку каждая среда обработки данных сталкивается с уникальными проблемами обработки данных, всегда необходимо разрабатывать программное обеспечение, адаптированное к отчету вашей организации. Вы также можете определить новые типы данных в R и разработать уникальные направления действий для этих типов данных, чтобы обеспечить более четкое выполнение задач по обработке и анализу данных. более удобное использование внутри команды.
Написание хорошего кода для науки о данных — это только часть работы. Чтобы максимизировать удобство использования и возможность повторного использования программного обеспечения для обработки данных, код должен быть организован и распространен таким образом, чтобы он соответствовал стандартам сообщества и обеспечивал хороший пользовательский опыт. В этом курсе рассматриваются основные способы организации и распространения программного обеспечения R среди других. Мы занимаемся разработкой пакетов R, написанием хорошей и сбалансированной документации, написанием отказоустойчивого программного обеспечения, кроссплатформенной разработкой, инструментами непрерывной интеграции и распространением пакетов через CRAN и GitHub. Студенты будут создавать пакеты R, соответствующие критериям подачи в CRAN.
Революция в области науки о данных привела к появлению больших объемов данных из самых разных новых источников. Эти новые данные используются для ответа на новые вопросы способом, который ранее не был описан. Визуализация остается одним из самых мощных способов сделать выводы на основе данных, но приток новых типов данных требует разработки новых методов визуализации. Этот курс дает вам навыки создания инструментов визуализации. Мы сосредоточимся на платформе ggplot2 и покажем, как использовать и расширять систему в соответствии с конкретными потребностями вашей организации или команды. По завершении курса студенты смогут создавать инструменты, необходимые для визуализации широкого спектра типов данных, и будут иметь базовые знания, необходимые для обработки новых типов данных по мере их поступления.
Краткий курс по программированию на R



