Kodiranje zvoka

Zvok je predstavljen z zaporedjem vrednosti zvočnega signala, vzorčenega v različnih časovnih trenutkih. Za dobro kvaliteto zvoka je potrebno za vsako sekundo zvoka imeti vsaj 44100 vrednosti zvočnega signala, vzorčenih v enakomernih časovnih intervalih. Ta številka izhaja iz lastnosti človeškega sluha. Za predstavitev vrednosti zvočnega signala je ponavadi dovolj 16 bitov. To omogoča predstavitev 65536 različnih vrednosti, kar zagotavlja kvaliteten zvok.

Zvočno valovanje ima določeno:

  • amplitudo (jakost zvoka)
  • frekvenco (višna zvoka)

Časovno spreminjanje zvoka prikažemo z ovojnico.

Za kakovosten zapis zvoka HiFi (High Fidelity) odčitamo odmik ovojnice vsako sekundo 44100 krat. Dobljene vrednosti zapišemo s 16 biti.

Standard MIDI (Musical Instrument Digital Interface) določa podatke za proženje zvoka. Pri zvoku kot opisu se uporablja MIDI vmesnik, ki ni format za zvočne datoteke ampak za datoteke z zapisom, ki pove zvočni kartici, katere note naj igra: proži zvočne vzorce, ki so shranjeni na zvočni kartici ali drugi audio napravi. Te datoteke (.MIDI) so mnogo manjše kot zvočne datoteke in »igrajo« na večini zvočnih kartic. Novejši sintetizatorji delajo na principu valovne sinteze (wave synthesis).

Zvok je analogna informacija, ki je digitalni računalnik ne more obdelovati. Zvok v računalnik sprejmemo prek zvočne kartice, ki velikosti zvočnega vala ne meri neprekinjeno ampak v določenih časovnih razmikih. Pri predvajanju valovno kodiranega zvoka zvočna kartica izvede nasprotni postopek – izpolni vrzeli med vrednostmi in tako iz digitalnega signala ustvari analognega. Zvok, ki ga želimo posneti iz realnega sveta in ga računalniško obdelati, mora analogno-digitalni pretvornik spremeniti v digitalno obliko. Osnovni princip je preprost: naprava v določenih časovnih intervalih odčitava vrednosti zvočnega signala in jo shrani v binarni obliki. Pri predvajanju pa digitalno-analogni pretvornik poskrbi za obratno pretvorbo. Ni težko uganiti, da bo predvajani zvok tem bolj podoben izvirniku, kolikor hitrejše bo vzorčenje pri snemanju.


Standardni formati za zvočne datoteke so:
  • MP3; MPEG-1 Audi Layer 3
  • M4A; MPEG-4 Audio File
  • WMA; Windows Media Audio
  • RA; RealAudio
  • MIDI; Musical Instrument Digital Interface
  • AAC; Advanced Audio Coding

Valovno kodiranje zvoka je prestavitev zvoka z velikostmi zvočnega vala, merjenega v določenih, enako velikih časovnih razmikih.
Kodiranje zvočnega vala določimo z dvema parametroma:
  • kako natančno merimo velikost zvočnega vala (s koliko vrednostmi – 8 bitov = 256 vrednosti, 16 bitov = 65536 vrednosti);
  • kako pogosto izvajamo meritve (frekvenca vzorčenja – standardne velikosti 11 kHz, 22 kHz, 44 kHz).
Podobno kot slike digitaliziramo tudi zvok. Zvok je nihanje zraka s slišno frekvenco. Z mikrofonom ga spremenimo v nihanje električne napetosti, ki je analogna predstavitev zvoka. Za razliko od slike je pri zvoku pomembna časovna dimenzija. Analogno predstavitev zvoka digitaliziramo tako, da čas razdelimo na drobne časovne korake. Nato določimo povprečno velikost zvočnega signala v posameznem časovnem koraku. Na sliki je povprečna velikost signala predstavljena s stolpci. Velikost stolpcev izrazimo z dvojiškimi števili. Dobljeno zaporedje dvojiških števil predstavlja digitalni zapis zvoka.

Pri sliki je natančnost digitalne predstavitve odvisna od gostote mreže, pri zvoku pa je odvisna od frekvence vzorčenja. Čim večja je dobljena količina informacije, tem bolj natančna je predstavitev zvoka. Če je časovni korak dovolj kratek, da zajamemo tudi visoke frekvence, ki so na robu slišnega območja človeškega ušesa, potem bolj natančna predstavitev zvoka ni smiselna. Zgornja meja slišnih frekvenc človeškega ušesa je približno 18 kHz. Pri digitalizaciji zvoka za zapis na CD je frekvenca vzorčenja 44 kHZ. Vsak vzorec pa je predstavljen s 16 biti.