TDDB03 | TALTEKNOLOGI, 5 poäng /Speech Technology/ För: C3, C4, D4 | |
Utbildningsområde: Teknik Ämnesgrupp: Datalogi | ||
Fördjupningsnivå: C | ||
Klassning för datavetenskaplig examen: Datavetenskap | ||
Mål: Kursen skall ge grundläggande kunskap om olika tekniker för analys, igenkänning och syntes av mänskligt tal samt deras tillämpningar t.ex. i samband med systemstyrning, talkommunikation med informationssystem, handikapp hjälpmedel och tolkhjälp.Förkunskaper: TDDA58 Artificiell intelligens C eller TDDA13 Artificiell intelligens D. Dessutom kunskap motsvarande en av kurserna TDDA94 Lingvistik, grundkurs eller TSIT65 Signalteori D. Kursen ger en viss genomgång av grunderna i dessa moment.Organisation: Undervisningen består av föreläsningar och laborationer. Laborations uppgifterna är obligatoriska. Vidare ingår en större projektuppgift där deltagarna ges möjlighet att fördjupa sig inom sitt huvudsakliga kunskapsområde.Kursinnehåll: Modeller för talad kommunikation. Lingvistiska grundbegrepp. Den mänskliga talapparaten (anatomi och fysiologi). Talets produktion och perception. Signalbehandling. Akustiska elementa. Språkljuden: fonetik och fonologi. Tekniker för talsyntes (artikulatoriska tekniker, LPS). Tekniker för tal igenkänning (regelbaserade, stokastiska, DTW-tekniker). Arkitekturer för talförståelsesystem och dialogsystem.Kurslitteratur: Meddelas senare. Ett antal grundböcker som täcker stora delar av området finns, t.ex. Schmandt, C. (1994). Voice Communication with Computers . New York: Van Nostrand Reinhold. Keller, E. (ed.) (1994). Fundamentals of Speech Synthesis and Speech Recognition. Basic Concepts, State of the Art and Future Challenges . Chichester: Wiley. Saito, S. (1992). Speech Science and Technology . Tokyo: Omsha. | ||
LAB 1 | En laborationskurs. | |
UPG 1 | Större projektuppgift. |