Cursusbeschrijving
Met het toenemende gebruik van programmeertalen in data analytics is het nu tijd om de ins en outs te leren. Deze cursus richt zich op het begrijpen van statistische modellen en het analyseren van de resultaten terwijl je leert werken met R. Naast het introduceren van de software aan nieuwkomers, worden basis- en meer geavanceerde statistieken gepresenteerd met behulp van een overkoepelend raamwerk van het gegeneraliseerde lineaire model.
De eerste week is gewijd aan het leren gebruiken van R en regressieanalyse. We beginnen met het inlezen van gegevens in R, beschrijvende statistieken en visuele weergave van gegevens, wat de eerste stap is voor statistische analyses. Daarna introduceren we het lineaire regressiemodel, een veelgebruikt model met twee hoofddoelen: het modelleren van relaties tussen de variabelen en het voorspellen van toekomstige waarnemingen.
In de tweede week breiden we het lineaire model uit naar het 'generalized linear framework' om discrete afhankelijke variabelen te analyseren. De logit regressie waarmee je zult werken, blijkt nuttig om de rest van de cursus te begrijpen: classificatie. Je leert hoe je gegevensdimensies kunt reduceren met behulp van principale componentenanalyse en clusteranalyse, en hoe je de geleerde methoden kunt gebruiken voor voorspelling.
Elke dag bestaat uit korte colleges met voorbeelden en oefeningen waarin je het geleerde meteen toepast. De focus in de oefeningen en opdrachten ligt op het coderen in R en het toepassen en interpreteren van gegeneraliseerde lineaire regressiemodellen. Het is de bedoeling dat je na de les werkt aan een opdracht waarin je integreert wat je tijdens de les in de oefeningen hebt geleerd. Deze opdracht wordt beoordeeld.
Lees hieronder verder voor meer informatie