| TANA07 |
Datautvinning med matrismetoder, 4 p
/
6 hp
/Data mining using matrix methods/
För:
CS
D
IT
MMAT
|
OBS! |
Överlappar med TANA25/TANA08
|
| |
Prel. schemalagd
tid: 38
Rek. självstudietid: 122
|
| |
Utbildningsområde: Naturvetenskap
Ämnesgrupp: Matematik Nivå (A-D):C
Huvudområde: Matematik, Tillämpad matematik Nivå (G1,G2,A): A
|
| |
Datavetenskap Matematik, tillämpad matematik
|
| |
Mål:
IUAE-matris
Många problem inom datautvinning och mönsterigenkänning kan lösas med matrismetoder. Studenten ska tillägna sig kunskap om grundläggande begrepp inom området och ha förtrogenhet med ett urval algoritmer. Efter kursen ska studenten kunna
- använda singulärvärdesfaktorisering (SVD) och liknande matrisfaktoriseringar för att lösa minsta kvadratproblem och beräkna ortogonala baser,
- använda SVD, klustring och liknande metoder för att göra textsökning, mönsterigenkänning och websidrangberäkning,
- använda enkel programvara (parser) för texthantering med inriktning på textsökning
|
| |
Förkunskaper: (gäller studerande antagna till program som kursen ges inom, se 'För:' ovan) Grundkurser i numeriska algoritmer (tekniska beräkningar) och programmering.
OBS! Tillträdeskrav för icke programstudenter omfattar vanligen också tillträdeskrav för programmet och ev. tröskelkrav för progression inom programmet, eller motsvarande.
|
| |
Organisation: Teorin presenteras i huvudsak på storseminarier. Programmeringsprojekt ger praktiska övningar i att lösa tillämpade problem och att använda lämpliga verktyg.
|
| |
Kursinnehåll:
- Ortogonala transformationer, QR-faktorisering, minstakvadratproblem.
- Egenvärdes- och singulärvärdesfaktorisering, separation av signalrum och brusrum. Data-kompression med singulärvärdesfaktorisering.
- Algoritmiska aspekter av matrisfaktoringar (robusthet, effektivitet, programbibliotek), användning av algoritmerna som byggstenar för att lösa tillämpade problem.
- Mönsterigenkänning (handskrivna siffror).
- Informationssökning och sökmotorer.
- Klustring och klassificering.
|
| |
Kurslitteratur: L. Eldén: Matrix methods in data mining and pattern recognition, SIAM 2007
|
| |
Examination: |
TEN1 LAB1
|
En skriftlig tentamen (U,3,4,5) En laborationskurs (U,G) |
3 hp 3 hp
|
| |
|
|