TDDD02 |
Språkteknologi för informationssökning, 4 hp
/Language Engineering /
För:
IT
|
|
Prel. schemalagd
tid: 33
Rek. självstudietid: 74
|
|
Utbildningsområde: Teknik
Huvudområde: Informationsteknologi Nivå (G1,G2,A): G2
|
|
Datavetenskap Datavetenskap, kognitionsvetenskap
|
|
Mål:
IUAE-matris
Kursen ska ge kunskap om grundläggande metoder för analys och tolkning av ord, meningar och texter och färdigheter i deras tillämpning på informationssökning. Efter fullgjord kurs ska studenten kunna:
- Förklara innebörden av morfologisk, syntaktisk och semantisk analys av texter och redogöra för de vanligaste analysmetoderna
- Tillämpa enkla metoder inkl. reguljära uttryck, ngrammodeller, vektorbaserade modeller på problemet att klassificera ord i text
- Redogöra för arkitekturer och problem i tillämpningar som frågebesvarande system, sammanfattningssystem, flerspråkig informationssökning
- Utvärdera algoritmer och system med avseende på korrekthet, precision och recall.
|
|
Förkunskaper: (gäller studerande antagna till program som kursen ges inom, se 'För:' ovan) Grundläggande programmering och diskret matematik
OBS! Tillträdeskrav för icke programstudenter omfattar vanligen också tillträdeskrav för programmet och ev. tröskelkrav för progression inom programmet, eller motsvarande.
|
|
Påbyggnadskurser Matematisk informationssökning, Språkteknologi,
|
|
Organisation: Kursen består av föreläsningar och laborationer och examineras med laborationsuppgifter och en skriftlig tentamen.
|
|
Kursinnehåll:
- Grundläggande lingvistik: morfologi, syntax, semantik, diskursanalys. Semantiska relationer. Ordnät.
- Språkteknologi i traditionell informationssökning. Tokenisering, lemmatisering, stemming vs morfologi.
- Metoder för analys och klassificering av ord: ordklasstaggning, ordprediktion, betydelsebestämning. Frasanalys och frasigenkänning.
- Avancerad informationsåtkomst: namnigenkänning, frågebesvarande system, informationsutvinning, automatisk sammanfattning, flerspråkig informationssökning.
- Utvärdering av klassificeringsproblem.
|
|
Kurslitteratur: Daniel Jurafsky and James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall, 2000 eller senare.
|
|
Examination: |
TEN1
LAB1
BAS1
|
Skriftlig tentamen (U,3,4,5) Laborationskurs (U,G) Basgruppsarbete (U,G) |
2 hp 1 hp 1 hp
|
|
|
|
|