Stiskanje zvoka

Stiskanje je koristno, kadar želimo zmanjšati velikost datotek. Ko zvočni posnetek stisnemo odstranimo zvočne podatke in tako zmanjšamo velikost datoteke. To je zelo koristno pri pretočnem prenosu (ang. streaming) in pri običajnem prenosu (ang. download) datotek. Datoteke WAV sploh ne vključujejo stiskanja zvočnih podatkov, zato je velikost datotek enaka izračunani – produkt bitne hitrosti in trajanja zvočnega posnetka.

Stiskanje brez izgub

Obstajajo zapisi datotek, kot na primer FLAC, ki stiskajo podatke brez izgub in v splošnem lahko stisnejo datoteko WAV na polovico izvirne velikosti. To dosežejo tako, da za stiskanje uporabijo postopek kodiranja z dolžinami čet, ki v zvočni datoteki išče ponavljajoče se vzorce in namesto vsakega posameznega vzorca zapiše podatke o tem, kolikokrat zaporedoma se ta vzorec pojavlja.

Drugi postopek, ki ga za stiskanje zvočnih podatkov uporabljajo datoteke FLAC, je linearna napoved (ang. linear prediction). Linearna napoved je matematična operacija, pri kateri izračunamo oziroma ocenimo bodoče vrednosti s pomočjo linearne funkcije prejšnjih vzorcev.

Datoteke FLAC so še vedno zelo velike. Za shranjevanje zvočnih datotek na računalniku ali na prenosnem glasbenem predvajalniku ali preprosto za prenašanje preko spleta potrebujemo zapis zvočnih datotek, ki bo omogočal ustvarjanje zvočnih datotek, katerih velikost bo bistveno manjša.

Stiskanje z izgubami

Zvočne datoteke lahko zmanjšamo tako, da zmanjšamo frekvenco vzorčenja in/ali ločljivost vzorčenja, kar ima lahko zelo slabe posledice za kakovost končnega zvoka. Vendar obstajajo še drugi pametni postopki stiskanja zvočnih podatkov. Ti postopki nam ne omogočajo, da bi dobili nazaj zvok, ki je enak izvirniku, vendar bo približek zelo blizu tega. Te postopke imenujemo stiskanje z izgubami.


Obstaja veliko postopkov stiskanja z izgubami, vključno z: MP3, AAC, Ogg Vorbis in WMA. Postopki stiskanja z izgubami delujejo tako, da zmanjšajo natančnost določenih delov zvoka, ki jih večina ljudi ni sposobna slišati.

Te postopke običajno imenujemo zaznavno kodiranje (ang. perceptual coding). Delujejo tako, da uporabljajo psihoakustične modele, s pomočjo katerih zavržejo ali zmanjšajo natančnost delov, ki so manj slišni za človeški sluh, nato pa na učinkovit način zapišejo preostale zvočne podatke. Ker je natančnost določenih frekvenc izgubljena, lahko pogosto opazimo razliko med izvirnikom in različico z izgubami, pri čemer lahko slišimo izgubo visokih in nizkih tonov. Bitna hitrost MP3 datotek je med 128 kbps in 320 kbps, kar je bistveno manj od 1411 kbps pri nestisnjenem zvoku.

Zanimivost