Kursen består två moment:

Moment 1: Metoder för data science (5 hp)Moment 2: Tillämpningar inom data science (5 hp)

Moment 1 behandlar statistiska metoder för att lösa de speciella problem som uppkommer inom data science, med tonvikt på metoder för modellselektering vid och dimensionsreducering av stora och komplexa datamängder. Momentet behandlar "statistical learning", vars två huvudgrupper kallas "supervised learning" respektive "unsupervised learning".

Moment 2 löper delvis parallellt med moment 1 och syftet är att praktiskt tillämpa den kunskap om "statistical learning" som inhämtats under moment 1.

Programvaran R används genomgående.

Undervisningen i vissa kursmoment/delar av moment kan komma att ges på engelska.