Bouw betere datawetenschapstools. Leer software voor datatools ontwerpen, R-pakketten distribueren en aangepaste visualisaties maken.
Suggested by: Coursera (What is Coursera?)
No prior knowledge required
No unnecessary risks
R is een programmeertaal en gratis softwareomgeving voor statistische berekeningen en grafische afbeeldingen, die veel wordt gebruikt door analisten, datawetenschappers en statistici.
Deze specialisatie houdt zich bezig met de ontwikkeling van software in R voor het bouwen van data science-tools. Naarmate het vakgebied van de datawetenschap zich ontwikkelt, wordt het duidelijk dat softwareontwikkelingsvaardigheden essentieel zijn voor het produceren en opschalen van bruikbare datawetenschapsresultaten en -producten.
Je leert moderne softwareontwikkelmethoden om tools te bouwen die herbruikbaar, modulair en geschikt zijn voor gebruik in teamomgevingen of ontwikkelaarsgemeenschappen.
In elk van de cursussen passen studenten de geavanceerde R-vaardigheden toe die ze hebben verworven om:
Deze projecten zullen een portfolio met R-code opleveren dat kan worden hergebruikt en waarop kan worden voortgebouwd voor implementatie in de echte wereld.
Deze cursus biedt een diepgaande introductie in de programmeertaal R, met de nadruk op het gebruik van R voor de ontwikkeling van data science-software. Of je nu deel uitmaakt van een data science-team of zelfstandig werkt in een ontwikkelaarsgemeenschap, deze cursus geeft je de R-kennis die je nodig hebt om op deze gebieden een zinvolle bijdrage te leveren. Als eerste cursus in expertise biedt het de noodzakelijke basiskennis van R voor volgende cursussen. We introduceren basisconcepten in R, taalprincipes, sleutelconcepten zoals geordende data en gerelateerde tools in Thediaverse, verwerking en manipulatie van complexe en grote datasets, het omgaan met tekstuele data en fundamentele datawetenschapstaken. Na voltooiing van de cursus kunnen studenten vloeiend omgaan met de R-console en kunnen ze geordende datasets maken uit een grote verscheidenheid aan mogelijke gegevensbronnen.
Deze cursus behandelt geavanceerde onderwerpen in R-programmering die nodig zijn om krachtige, robuuste en bruikbare data science-tools te ontwikkelen. Onderwerpen zijn onder meer functioneel programmeren in R, veerkrachtige foutafhandeling, objectgeoriënteerd programmeren, prestatieprofilering en testen, debuggen en goed functieontwerp. Na voltooiing van de cursus kunt u algemene gegevensanalysetaken identificeren en opnemen in functies die bedoeld zijn voor gebruikers. Omdat elke data science-omgeving met unieke data-uitdagingen te maken krijgt, is het altijd nodig om software te ontwikkelen die is afgestemd op het rapport van uw organisatie. U kunt ook nieuwe datatypen definiëren in R en unieke actielijnen voor die datatypen ontwikkelen om een duidelijkere uitvoering van data science-taken mogelijk te maken sterkere bruikbaarheid binnen een team.
Het schrijven van goede code voor data science is slechts een deel van het werk. Om de bruikbaarheid en herbruikbaarheid van data science-software te maximaliseren, moet de code worden georganiseerd en gedistribueerd op een manier die voldoet aan op de gemeenschap gebaseerde standaarden en een goede gebruikerservaring biedt. Deze cursus behandelt de belangrijkste manieren waarop R-software wordt georganiseerd en naar anderen wordt gedistribueerd. We behandelen het ontwikkelen van R-pakketten, het schrijven van goede en evenwichtige documentatie, het schrijven van veerkrachtige software, platformonafhankelijke ontwikkeling, continue integratietools en het distribueren van pakketten via CRAN en GitHub. Studenten zullen R-pakketten produceren die voldoen aan de criteria voor indiening bij CRAN.
De datawetenschapsrevolutie heeft grote hoeveelheden gegevens voortgebracht uit een grote verscheidenheid aan nieuwe bronnen. Deze nieuwe gegevens worden gebruikt om nieuwe vragen te beantwoorden op een manier die nog niet eerder is beschreven. Visualisatie blijft een van de krachtigste manieren om conclusies te trekken uit data, maar de toestroom van nieuwe soorten data vereist de ontwikkeling van nieuwe visualisatietechnieken. Deze cursus biedt u de vaardigheden om deze visualisatietools te maken. We zullen ons concentreren op het ggplot2-framework en laten zien hoe u het systeem kunt gebruiken en uitbreiden volgens de specifieke behoeften van uw organisatie of team. Na voltooiing van de cursus kunnen studenten de tools bouwen die nodig zijn om een grote verscheidenheid aan gegevenstypen te visualiseren en beschikken ze over de fundamentele kennis die nodig is om met nieuwe gegevenstypen om te gaan zodra ze worden ontvangen.
Een samenvattende cursus voor R-programmeren



