Viikon ensimmäisellä luennolla käsiteltiin audiokompressiokappale kokonaan sekä alkuosa luokittelusta (kpl 8).
Audiokompression ideana on tallentaa äänisignaali häviöllisesti poistaen bittejä sieltä missä kuulo ei niitä havaitse. Tässä auttaa kuulon ominaisuuksien tuntemus, joista olennaisin osa on s. 81 kuulokäyrä. Kuulo havaitsee matalia ja korkeitä ääniä heikommin kuin keskiääniä. Tämän vuoksi epätarkemmin havaittavat taajuudet voidaan esittää pienemmällä bittimäärällä. Tässä yhteydessä on hyvä muistaa että jokainen poistettu bitti lisää kvantisointikohinaa kuudella desibelillä. Kysymys voidaan siis asettaa muotoon: "montako kuuden desibelin palikkaa kuulokäyrän alle mahtuu kullakin taajuudella". Lisätilaa kuuden desibelin palikoille saadaan havaitsemalla, että äänet peittävät heikompia ääniä alleen. Tässä tapauksessa siis itse kompressoitava signaali peittää näitä heikompia kuuden desibelin palikoita. Luennolla nähtiin myös esimerkki siitä miltä tulosmaski saattaisi näyttää yksittäisen piippauksen ympäristössä.
Jotta kuulomallia voitaisiin käyttää, täytyy signaali jakaa taajuuskaistoihin. Tämä tehdään kaistanpäästösuotimilla, ja kaistoja mp3-standardissa on 32. Kukin kaista voidaan alinäytteistää kertoimella 32, jolloin dataa on saman verran kuin alun perin. Nämä kaistat voidaan sitten kvantisoida kuulomallin mukaisesti. Palautettaessa alkuperäistä näytteenottotaajuutta riittää tehdä ylinäytteistys (nollien lisääminen) kertoimella 32, jolloin havaitaan, että aiemmin laskostunut signaali pomppaakin oikealle paikalleen ja vieläpä oikein päin --- siinäkin tapauksessa, että se olisi sattunut laskostumaan peilikuvakseen.
Luokittelua (kpl. 8) lähestyttiin yleisemmästä kuin pelkästä hermoverkkojen näkökulmasta. Monisteen liitteessä on kuva, jossa kaksiulotteista dataa on jaettu kahteen luokkaan, ja näiden perusteella pitäisi rakentaa luokittelija. Tämä tehdään ylihuomisissa harjoituksissa käyttäen Fisherin lineaarista diskriminanttia. LDA on yksinkertaisin luokittelumenetelmä, kun taas hermoverkot ovat monimutkaisimmasta päästä. Keinotekoinen hermoverkko matkii aivojen toimintaa, joka perustuu suureen määrään yksinkertaisia laskentayksiköitä, jotka aktivoituvat ja lähettävät tiedon tilastaan eteenpäin. Tässä tapauksessa yksiköt laskevat painotetun summan naapuriensa aktivointitasoista. Näitä painoja on yleensä kymmeniä tuhansia, joten niiden valinta vaatii automaattisen menetelmän. Yleisimmin käytetty menetelmä, backpropagation, perustuu virhefunktion osittaisderivaattaan kunkin painon suhteen.
Tilaa:
Lähetä kommentteja (Atom)

Ei kommentteja:
Lähetä kommentti