Visa engelsk kursplan
 
KURSPLAN
Text Mining, 6hp
 
Kurskategori Master´s Programme in Statistics and Data Mining
Huvudområde Statistik
Ämnesområde Statistik - ST1
  Kurskod   732A47
Mål
Efter avslutad kurs skall den studerande på en avancerad nivå kunna:
- redovisa och använda principer för lagring av och åtkomst till textinformation
- redovisa metoder för informationsutvinning och informationssökning
- tillämpa textbehandlingsmetoder för att förbereda dokument för statistisk modellering
- tillämpa relevanta statistiska modeller för analys av textinformation och tolka resultat på ett korrekt sätt
- använda statistiska modeller för prediktion av textinformation
- utvärdera prestanda av statistiska modeller för textmaterialet
Kursinnehåll
Kursen syftar till att visa hur textinformation kan utvinnas, lingvistiskt bearbetas och därefter analyseras kvantitativt med formella statistiska metoder och modeller. Kursen utnyttjar expertkunskaper från databashanteringen, beräkningslingvistiken och statistiken.
Kursen består av fyra delar:
1. Inledningsmoduler
- Introduktion till programmering i Python
- Introduktion till statistisk modellering
- Introduktion till beräkningslingvistik
2. Datamodeller och informationsutvinning av textmaterialet
3. Statistiska modeller för textmaterialet
4. Projekt i Text Mining
Undervisning/Arbetsformer
Kursen består av föreläsningar, datorövningar och ett projekt. Föreläsningarna ägnas åt genomgång av koncept och metodik. Datorövningarna ägnas åt praktisk tillämpning av Text Mining redskapen. Projektarbetet ger praktisk erfarenhet av lösning av ett specifikt Text Mining problem. Utöver detta ska den studerande utöva självstudier. Undervisningen sker på engelska
Examination
Skriftlig och muntlig redovisning av det genomförda projektarbetet. Inlämning av laborationsuppgifter. Detaljerad information återfinns i studiehandledningen.

Studerande som underkänts två gånger på kursen eller del av kursen har rätt att begära en annan examinator vid förnyat examinationstillfälle.

Den som godkänts i prov får ej delta i förnyat prov för högre betyg.
Förkunskap

För tillträde till kursen krävs det att den studerande har ett kandidatexamen med lägst 90 hp, dvs. 18 månader heltidsstudier, i matematik, tillämpad matematik, statistik eller datavetenskap. Matematikkurserna på grundnivå bör inkludera såväl kalkyl som linjär algebra. Utöver detta, erfordras kurser på grundnivå i grundläggande statistik och datavetenskap samt Engelska B/6.
Betyg
På kursen ges betyget Väl godkänd, Godkänd eller Underkänd
Kursbevis
Kursbevis utfärdas av filosofiska fakultetsstyrelsen, efter begäran av den studerande. Begäran om bevis ska göras på särskild blankett som finns att hämta på Centrala studerandeexpeditionerna eller via http://www.student.liu.se/examen?l=sv. Blanketten lämnas till Examen
Kurslitteratur
Lista över kurslitteratur fastställs av ansvarig institution/motsvarande
Övrigt
Planering och genomförande av kurs skall utgå från kursplanens formuleringar. Den kursvärdering som skall ingå i varje kurs skall därför behandla frågan om hur kursen överensstämmer med kursplanen.

Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.
 
Text Mining
Text Mining
 
Kursansvarig är: IDA - Institutionen för datavetenskap
           
Dnr: 2012-01070   Kurskod: 732A47      
    Provkoder: (se förteckning i LADOK)      
Ämne: Statistik          
           
Nivå   Utbildningsnivå     Ämneskod   Utbildningsområde  
A1X   Avancerad       TE  
Fastställd av Kvalitetetsnämndens AU 2013-10-18 på delegation av filosofiska fakultetsstyrelsen.