torstai 19. huhtikuuta 2012

Digitaalisesta musiikista ja sen käyttämisestä

Totesin hiljattain, että näin iTunes Storen ja Spotifyn valtapäivinä olen alkanut uudemman kerran kaivata vanhoja kuuntelutapojani. Toisin sanoen haluan kuunnella albumeita alusta loppuun. Koska kuitenkin istun enemmän tietokoneeni äärellä, kuin stereoiden vierellä – ne on kytketty telkkarin käyttöön – tämä ei ole tapahtunut. Sitä paitsi koneessani on paremmat AD-muuntimet ja äänentoisto tapahtuu studiokajareilla, joten laatukin on vaan parempi.

Toisaalta olen seurannut musiikkituotantofoorumeilla käytävää keskustelua digitaalisesta äänenlaadusta. MP3:n ja muiden pakattujen äänitiedostojen tultua jäädäkseen ja verkkojakelun ollessa selvästi jäämässä, on ollut käynnissä prosessi teknisesti laadukkaan musiikin saattamisesta verkkoon. Mikäli tämä meni ohi alkuvuodesta, niin tässä muistutus:  Neil Young: Steve Jobs and I were working on new iPod. Itse kirjoitin asiasta tuolloin piratismikysymyksen näkökulmasta näin. Young ehdotti radikaalia bluray-tasoista ääntä käytettäväksi kuluttajatasolla. Rankasti yksinkertaistaen totuttu stereoääni olisi kaksi kanavaa pakettikoolla 24 bittiä 96 kilohertzin näytteenottotarkkuudella. Jos tarkemmat speksit kiinnostavat. CD:n vastaavat luvut ovat 16 bittiä ja 44,1 kHz:ä.

Mitä tämä oikein sitten tarkoittaa?

Ihmisen havaitsema äänien voimakkuusala on 140 desibeliä. Tämä vaihtelee hippasen ja tyypillisesti kuulomme heikkenee iän myötä, mutta pidetään tuota lähtökohtana. Harva meistä kuitenkaan kuuntelee musiikkiaan niin kovaa, että puskisimme tuota ylärajaa päin, sitä ennen nimittäin tulee vastaan kipuraja. Tämä on hyvä tietää, sillä täten todetaan, että ihminen kuulee suuremmalla dynaamisella vaihteluvälillä, kuin millä äänentallennus- ja -toistojärjestelmät toimivat. Vinyylilevyn käytännöllinen ala on 80 dB:tä, sen voisi ehkä nostaa 120 dB:n, jos on valmis dramaattisiin kustannuksiin (esim. saksalaisen Clearaudion Master Reference -soitin). Useimmiten laitteiston meli kaventaa dynaamista vaihteluväliä kuitenkin selvästi. CD pääsee teoriassa 96 dB:n ja Youngin ehdottama 24-bittinen hurjaan 144 dB:n. Nämä ovat kuitenkin laskennallisia arvoja, jotka eivät ota huomioon fyysisiä rajoitteita kuten käytettyä laitteistoa. Arkitodellisuudessa CD:n dynaaminen vaihteluväli on 90 dB:n luokkaa.

24-bittinen ääni vie tietenkin voiton käytössä olevista menetelmistä, mutta onko sillä väliä?

Tyypillisen populaarimusiikkikappaleen (ihan sama mikä tyyli on kyseessä) dynaaminen vaihteluväli on nykyisin 6-10 desibeliä. Kyllä, juuri niin vähän. Jo ennen ipodeita ja ämppäreitä ryhdyttiin kisailemaan siitä, kuka tekee kuuminta musaa. Täysin epävirallinen listaus, josta voi käydä ihmettelemässä levyjen kuumuutta löytyy täältä. Tätä vastoin laaja dynaaminen vaihteluväli on yhä käytössä elokuvateattereissa. Valitettavasti tämä ei ole mennyt aina teatteriyrittäjille aina jakeluun, eikä teattereita ole kalibroitu oikein vaan äänet on käännetty kovalle. Olen itsekin kävellyt parista leffasta kotiin korvat soiden. Mikä sitten on tyypillinen elokuvan dynaaminen vaihteluväli? Tätä on vaikeampi selvittää, koska on elokuvia ja sitten on elokuvia, mutta mm. Bob Katz (Mastering Audio, toinen painos, kyllä se on kirja!) ehdottaa noin 20 dB:n jättämistä digitaalisen rajan ja havaitun äänenvoimakkuuden välille kovia ääniä varten.

Lyhyemmin sanoen kaikki viimeisten 81 vuoden aikana kuluttajia varten kehitetyt formaatit ovat riittäviä.

-

Sitten se toinen asia digitaalisessa äänessä: näytteenottotaajuus. Mistä tässä on kyse? Ääni on taas yleistäen aaltoliikettä, meillä päin useimmiten ilmahiukkasten, jota on sittemmin opittu tallentamaan elektronisesti. Analoginen musiikin tallentaminen on ihan yhtälailla sähköä vaativa prosessi kuin digitaalinenkin, ammattistudioissa käytetään yhä paljolti samoja mikrofoneja ja muita laitteita. Ero on siinä, että analoginen ääni meni ennen (vielä ajoittain) magneettinauhalle, mistä se päätyi lopulta vinyylille, joka on mekaaninen tallennusmuoto. Digitaalinen tarkoittaa sämpläämistä, eli otetaan tasaisin väliajoin äänestä näytteitä, joista ääniaalto on rekonstruoitavissa.

Yllättävän usein tämä käsitetään siten, että äänestä katoaa sen aaltomaisuus, ihan kuin näytteiden välit vedettäisiin suoraksi. Näin ei ole, vaan digitaalisen äänen palauttaminen analogiseksi sisältää paljon matematiikkaa, jonka tarkoituksena on palauttaa sen aaltomuoto tarkasti. Jotta tämä voidaan tehdä, on näytteenottotaajuuden oltava kaksinkertainen sämplättävän ääniaallon taajuuteen. Kun CD-formaattia kehitettiin, päädyttiin lopulta 44 100 hertzin sämpläystaajuuteen, jolla saavutetaan teoreettinen 22 050 hertzin ääni. Käytännössä kaikissa käytössä olevissa laitteistoissa on filtteri, joka poistaa tuota raja-arvoa lähestyvät taajuudet. Tälle on syynsä. Ihmisen kuulo nimittäin yltää oletettavasti vain 20 000 hertziin, usein tuskin sinnekään.

Mikäli et ole tarkastuttanut kuuloasi, saatat yllättyä kuinka vähän itseasiassa kuuletkaan. Minä tiedän, että oma ylä-äänitarkkuuteni on heikentynyt vuosien musiikkiharrastuksen parissa, minkä takia suojaan nykyisin kuuloni varsin tarkasti ja käytän tiukkaa harkintaa äänentoistoni kanssa.

96 kHz:n näytteenottotarkkuus antaisi siis meille paljon jotain, jota emme fyysisesti kykene kuulemaan (korvassa ei vain ole tilaa sellaisille sensorisoluille). Missä 24 bitin syvyys on yleisesti hyväksytty ja tarpeelliseksi koettu tapa parantaa nauhoitettavan äänen signaalin suhdetta kohinaan studiossa, eivät monet ammattilaisetkaan koe tarpeelliseksi käyttää korkeampia näytteenottotaajuuksia. Toiset taas vannovat tämän parantavan saundia. Varmaa on se, että käytännön ja teorian välillä on laadullinen hyppäys. LP-levylle kyetään teoriassa tallentamaan jo 40 000 hertzin ääniä, teoriassa, käytännössä tällaiseen lienee harvoin (ellei koskaan) ryhdytyn. Me nimittäin emme kuule kaikkia taajuuksia yhtä tarkasti. Ihmiskorva on erikoistunut kuulemaan nimenomaisesti ihmisen puhetaajuudella. Se lienee ollut evoluution näkökulmasta hyödyllistä.

Aiheesta lisää tässä artikkelissa.

Me ihmiset olemme oman mielemme kahvitettavissa muutenkin koko ajan. Kun tämän aiheen keskusteluja seuraa, on varmaa, että aina mukana on joku äänen fysiikkaa tai ihmisen kuulemista käsittelevää psykoakustiikkaa ymmärtämätön, joka uskoo varmasti juuri hän kykenee ja onkin kuullut eron ja se on merkittävä! No, jos on maksanut kymmeniä tuhansia euroja laitteistaan, haluaakin kuulla eron. Tämän takia on kehitetty kätevä tapa arvioida sitä, kykeneekö henkilö edes erottamaan kaksi erilaista aistinäytettä toisistaan. Tämä ABX-testi on muuten armoton. Sitä tehdessä katoavat nopeasti ylimieliset kuvitelmat oman kuuloaistin erheettömyydestä. Ihan helppoa testin tekeminen ei ole, sillä näytteet tulee valmistaa mahdollisimman samanlaisiksi. Me kykenemme alitajuisesti erottamaan jopa desibelin kymmenyksen voimakkuuseron kahden lähteen välillä (havaittu äänenvoimakkuus ei huippuarvo), ja tietenkään näytteissä ei saa olla mitään selviä eroja.

Windowsissa voi käyttää tähän vaikka foobar2000-ohjelmaa. Macille löytyy kätevä ABXer.

Olen tehnyt jonkin verran kokeita 320:n mp3:n ja Apple Losslessin tunnistamisen suhteen. Aloitin tällä parivaljakolla, koska olen aikasemmin todennut, että osaan tunnistaa huonolaatuisten mp3:n artifaktit kohtuullisen tarkasti. Palaan varmasti tulevaisuudessa pienempiin pakkauskokoihin, sillä nämä testini osoittivat, etten kykene näitä kahta varmuudella toisistaan erottamaan. Tulokseni olivat noin 75% oikein, eli kaukana sekä arvauksesta (50%) tai tilastollisesta varmuudesta (95%). Kykenisinkö kuulemaan CD:tä paremman musiikin eroa, en tiedä, pitää joskus kokeilla.

-

Ja tästä pääsemmekin kauniisti digitaalisen musiikin käyttöön.

Koska tila ei ihan heti ole koneessani loppumassa, päätin hiljan korjata tuon alussa mainitsemani puutteen. Muutan omat CD:ni uudemman kerran tietokone- ja ipodiin sopivaan formaattiin, tällä kertaa Apple Losslessiksi. Homma ei tapahdu hetkessä, mutta samalla kun sitä teen, tulee osin jo kauan sitten hankitut levyt kuunneltua uudestaan. Tätä kirjoitusta rustaillessani olen työstänyt sitä minulle tärkeimmän bändin tuotantoa.

Tuleepahan siivottua hyllyjä ja samalla kuunneltua musiikkia ajatuksella. Se täytyy sanoa, että mitä enemmän kuuntelen tällä laitteistolla, sitä vähemmän haluan kuunnella nykyistä kuumaksi tuotettua musiikkia. Siitä puuttuu dynamiikka.

Ei kommentteja: