Visa engelsk kursplan
 
KURSPLAN
Data Mining and Statistical Learning, 15hp
 
Kurskategori Master´s Programme in Statistics and Data Mining
Huvudområde Statistik - STA
Ämnesområde Statistik - ST1
  Kurskod   732A33
Mål
Kursen lägger grunden för ett professionellt arbete och forskning där stora datavolymer undersöks, modifieras, modelleras och utvärderas för att upptäcka tidigare okända mallar och trender.

Efter avslutad kurs skall den studerande kunna:
- redovisa principer av statistisk modellering, speciellt för analyser av stora datamängder
- använda redskap i SAS miljö för att utforska stora och komplexa datamängder, skapa datadrivna modeller, utvärdera deras utfall och använda sådana modeller för prediktion.
- jämföra prestanda av statistiska och data mining modeller för att välja den mest relevanta modellen i ett givet sammanhang.
Kursinnehåll
- grundläggande begrepp i statistical learning, speciellt inom övervakad inlärning
- modellvalsstrategier som använder tränings- validerings- och testmängder och modellvalet med hjälp av korsvalidering
- linjär regression och krympningsmetoder
- splines och kernelmetoder
- beslutsträd och klassificeringsmetoder såsom diskriminantanalys och logistisk regression
- neurala nätverk, supportvektormaskiner och generaliserade additiva modeller
- samspelsmetoder, inklusive bagging och boosting
- Bayesianska metoder i data mining
Undervisning/Arbetsformer
Kursen består av föreläsningar, datorövningar och seminarier. Föreläsningarna ägnas åt genomgång av teori, koncept och metodik. Datorövningarna ägnas åt praktisk dataanalys i SAS miljö (som regel) eller i andra miljöer (i undantagsfall). Seminarier ägnas åt studentpresentationer och diskussioner av uppgifter.
Språk: Engelska
Examination
Skriftlig redovisning av labbuppgifter. Obligatorisk närvaro på seminarierna. En skriftlig tentamen.

Studerande som underkänts två gånger på kursen eller del av kursen har rätt att begära en annan examinator vid förnyat examinationstillfälle.

Den som godkänts i prov får ej delta i förnyat prov för högre betyg.
Förkunskap

För tillträde till kursen krävs det att den studerande har ett kandidatexamen med lägst 90 hp, dvs. 18 månader heltidsstudier, i matematik, tillämpad matematik, statistik eller datavetenskap. Matematikkurserna på grundnivå bör inkludera såväl kalkyl som linjär algebra. Utöver detta, erfordras kurser på grundnivå i grundläggande statistik och datavetenskap.
Engelska B eller motsvarande.
Betyg
På kursen ges betyget Väl godkänd, Godkänd eller Underkänd
Kursbevis
Kursbevis utfärdas av filosofiska fakultetsstyrelsen, efter begäran av den studerande. Begäran om bevis ska göras på särskild blankett som finns att hämta på Centrala studerandeexpeditionerna eller via http://www.student.liu.se/examen?l=sv. Blanketten lämnas till Examensenheten.
Kurslitteratur
Lista över kurslitteratur fastställs av ansvarig institution/motsvarande
Övrigt
Planering och genomförande av kurs skall utgå från kursplanens formuleringar. Den kursvärdering som skall ingå i varje kurs skall därför behandla frågan om hur kursen överensstämmer med kursplanen.

Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.
 
Data Mining and Statistical Learning
Data Mining and Statistical Learning
 
Kursansvarig är: IDA - Institutionen för datavetenskap
           
Dnr: 1330/06-41   Kurskod: 732A33      
    Provkoder: (se förteckning i LADOK)      
Ämne: Statistik - STA          
           
Nivå   Utbildningsnivå     Ämneskod   Utbildningsområde  
A1X   Avancerad     STA   SA  
Fastställd av Kvalitetetsnämndens AU 2008-09-10 på delegation av filosofiska fakultetsstyrelsen.
Senast fastställd 2013-03-18