I kursen diskuteras teori och tillämpning av algoritmer för maskininlärning och slutledning, utifrån ett AI perspektiv. I detta sammanhang betraktar vi ”lärande” som slutledning från givna data eller erfarenheter som resulterar i en viss modell som generaliserar dessa uppgifter. Slutledning är att bestämma de önskade svaren eller åtgärder baserade på modellen.

Algoritmer av detta slag används vanligen i till exempel klassificeringsuppgifter (t.ex. teckenigenkänning, eller att förutsäga om en ny kund är kreditvärdig) och i expertsystem (t.ex., för medicinsk diagnostik). Ett nytt och kommersiellt viktig område är ”data mining”, där algoritmer används för att automatiskt identifiera speciellt intressant information och speciella relationer i stora kommersiella eller vetenskapliga databaser.

Kursen avser att ge en god förståelse för detta tvärvetenskapliga område, med tillräckligt djup för att använda och utvärdera tillgängliga metoder, och för att kunna följa aktuell vetenskaplig litteratur inom området. Under kursens gång kan vi diskutera eventuella problem med maskininlärningsmetoder, till exempel bias i träningsdata och säkerhet för autonoma agenter.

Följande begrepp behandlas i kursen:

  • Bayesiansk inlärning: likelihood, prior, posterior
  • Övervakad inlärning: Bayes-klassificerare, Logistic regression, Deep Learning, supportvektormaskiner
  • Oövervakad inlärning: Algoritmer för klustring, EM-algoritmen, mixture-modeller, kernel-metoder
  • Dolda Markov-modeller, MCMC
  • Reinforcement learning