studiehandbok@lith
 

Tekniska högskolan vid Linköpings universitet

 
 
År : 2016
 
TDDD02 Språkteknologi för informationssökning, 4 hp
/Language Engineering /

För:   IT  

 

Prel. schemalagd tid: 33
Rek. självstudietid: 74

  Utbildningsområde: Teknik

Huvudområde: Informationsteknologi   Nivå (G1,G2,A): G2

  Datavetenskap Datavetenskap, kognitionsvetenskap

  Mål:  IUAE-matris
Kursen ska ge kunskap om grundläggande metoder för analys och tolkning av ord, meningar och texter och färdigheter i deras tillämpning på informationssökning. Efter fullgjord kurs ska studenten kunna:
  • Förklara innebörden av morfologisk, syntaktisk och semantisk analys av texter och redogöra för de vanligaste analysmetoderna
  • Tillämpa enkla metoder inkl. reguljära uttryck, ngrammodeller, vektorbaserade modeller på problemet att klassificera ord i text
  • Redogöra för arkitekturer och problem i tillämpningar som frågebesvarande system, sammanfattningssystem, flerspråkig informationssökning
  • Utvärdera algoritmer och system med avseende på korrekthet, precision och recall.


  Förkunskaper: (gäller studerande antagna till program som kursen ges inom, se 'För:' ovan)
Grundläggande programmering och diskret matematik

OBS! Tillträdeskrav för icke programstudenter omfattar vanligen också tillträdeskrav för programmet och ev. tröskelkrav för progression inom programmet, eller motsvarande.

  Påbyggnadskurser
Matematisk informationssökning, Språkteknologi,

  Organisation:
Kursen består av föreläsningar och laborationer och examineras med laborationsuppgifter och en skriftlig tentamen.

  Kursinnehåll:
  • Grundläggande lingvistik: morfologi, syntax, semantik, diskursanalys. Semantiska relationer. Ordnät.
  • Språkteknologi i traditionell informationssökning. Tokenisering, lemmatisering, stemming vs morfologi.
  • Metoder för analys och klassificering av ord: ordklasstaggning, ordprediktion, betydelsebestämning. Frasanalys och frasigenkänning.
  • Avancerad informationsåtkomst: namnigenkänning, frågebesvarande system, informationsutvinning, automatisk sammanfattning, flerspråkig informationssökning.
  • Utvärdering av klassificeringsproblem.


  Kurslitteratur:
Daniel Jurafsky and James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall, 2000 eller senare.

  Examination:
TEN1 LAB1 BAS1
Skriftlig tentamen (U,3,4,5)
Laborationskurs (U,G)
Basgruppsarbete (U,G)
2 hp
1 hp
1 hp
 



Undervisningsspråk är Svenska.
Institution: IDA.
Studierektor: Jalal Maleki
Examinator: Marco Kuhlmann
Ansvarig programnämnd: Data&Medie

Engelsk kursplan

Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.

Planering och genomförande av kurs skall utgå från kursplanens formuleringar. Den kursvärdering som ingår i kursen skall därför genomföras med kursplanen som utgångspunkt.

Om inget annat anges ovan gäller betygsskala enligt avsnitt a8.5 i de gemensamma bestämmelserna.

Kursplanen gäller för 2016 enligt beslut av ansvarig programnämnd/fakultetstyrelse.

Tekniska högskolan vid Linköpings universitet


Informationsansvarig: TFK , val@tfk.liu.se
Senast ändrad: 09/16/2015