(published at MOTOR Magz ed. 286 September 2006)

TELAAH SUARA ARTIFISIAL

Musik yang elu nikmati via CD adalah bagian dari teknologi perekaman digital. Ya, bayangkan saja, suatu frekuensi suara diwakilkan oleh kode binery via metoda codec (compressor-decompressor, coder-decoder) tertentu yang melalui konverter digital-analog. Canggih, suara bisa natural meski hasil olah artifisial!
Nah, perekaman digital ini sekurangnya dibagi menjadi 3 macam, berformat tanpa kompresi(contoh; *.wav & *.aiff/*.iff), kompresi lossless audio (contoh; TTA/True Audio Codec & FLAC/Free Lossless Audio Codec) dan kompresi lossy audio yang berteknologi psychoacoustic (menghilangkan frekuensi audio yang tidak terdengar oleh manusia/diluar 20-20.000 Hz).
Sistem kompresi ini mempunyai 2 parameter penting untuk menjaga resolusi/kualitas suara, yaitu bit rate dan sampling rate. Bit rate berupa kecepatan olah data digital berparameter bps/kbps. Sedang sampling rate atau disebut juga sampling frekuensi berupa kecepatan olah data sampel yang berparameter Hz.
Sekurangnya terdapat 13 sistem kompresi audio yang ditelurkan di dunia ini. Salah satunya yang paling gaek adalah MP3 dan AAC. Nah, padahal masih banyak yang tak kalah mumpuni. Meskipun sebagian belum bisa diputar di head unit, berikut disarikan beberapa jenis audio kompresi digital yang layak elu simak.

MP3 (MPEG-1 Layer 3)
MP3 adalah pengembangan lanjut dari sistem Moving Picture Experts Group, khususnya turunan dari MPEG-1 setelah Layer 2 yang dikenal MP2. MP3 mampu mengkompresi file audio hingga 12 kali dengan pilihan bit rate dari 32, 40, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 hingga 320 kbps (kilo bit per second).
Makin tinggi bit rate, makin bagus kualitas suaranya, namun diikuti berkurangnya rasio kompresi yang dijabani sehingga file pun makin besar. Itu kalau dijabani formasi contant bit rate (CBR). Solusinya dengan variable bit rate (VBR) yang lebih fleksibel dimana file dibagi per segmen dengan bit rate yang berbeda-beda menyesuaikan ‘bobot’ dinamika frekuensi.

AAC (Advanced Audio Coding)
Karena MP3 punya beberapa kelemahan, hadirlah AAC yang dikembangkan dari sistem MPEG-2 Part 7 dan MPEG-4 Part 3 sebagai audio coding ber-bit rate menengah ke atas. Tak ayal AAC yang terkenal lewat jukebox iPod dan iTunes ini berfrekuensi sampel lebih luas dari 8-96 kHz (bandingkan, MP3 hanya pada rentang 16-48 kHz!). AAC juga dikenal dalam format MP4 dan M4A.
Pengembangan lanjut, AAC muncul dalam versi High Efficiency AAC (aacPlus versi 1/AAC+) dan Enhanced aacPlus (aacPlus versi 2/AAC++). AAC+ dilengkapi sistem Spectral Band Replication (SBR) yang berfungsi menjernihkan kualitas suara. Versi ini di MP3 disebut sebagai mp3Pro. Sedang AAC++ adalah AAC+ yang ditambah teknologi Parametric Stereo (PS) yang menyerupai fitur joint stereo pada MP3.

WMA (Windows Media Audio)
Kegusaran Bill Gates (bos Microsoft) adanya teknologi MP3 dijawab dengan menghadirkan audio digital WMA. Apalagi AAC sudah dikenal lekat dengan kompetitornya, Apple Computer, sehingga WMA resmi jadi bagian dari framework Windows Media sistem operasi Microsoft.
Secara sistem, WMA mirip dengan MP3, bisa CBR maupun VBR. Pertama kali keluar dalam versi WMA 7 yang disempurnakan menjadi WMA 9. Pengembangan lanjut, lahir WMA 10 Pro kualitas audio 24 bit 96 kHz. Tak ayal, Microsoft mengklaim WMA lebih bagus dibanding MP3 pada bit rate yang sama.

Ogg Vorbis
Vorbis dilansir oleh Xiph.org Foundation pada tahun 1998 sebagai audio digital jenis open source ketika MP3 diisukan bakal berlisensi (masih kan ingat ributnya sistem peer to peer Napster dengan grup musik Metallica 2000 lalu). Sistem ini dikenal dengan format Ogg yang diambil nama karakter Nanny Ogg dalam novel Disworld karya Terry Pratchett. Sayangnya, baru peranti Jukebox tertentu yang bisa memutar musik digital ini.
Ogg hanya berfrekuensi sampel 44,1 kHz (mengikuti standar kualitas CD), tapi punya pilihan bit rate yang banyak, 45-500 kbps! Bit rate yang besar ini memberikan 13 level kualitas yang bisa diatur secara VBR atau CBR. Hebatnya, Ogg dikenal berkualitas suara dahsyat sehingga Ogg ber-bit rate 160 kbps bisa sama kualitasnya dengan MP3 190 kbps. Tak ayal, file Ogg bisa lebih kecil dibanding MP3 dengan kualitas yang sama.

ATRAC3plus
Sony tak kalah unjuk teknologi soal audio digital. Tahun 1992 doi lansir file ATRAC (Advanced Transform Acoustic Coding) yang baru tahun 2002 disempurnakan menjadi ATRAC3plus. Rentang bit-rate-nya dari 48-352 kbps hasil dari encoding Quadrature Mirror Filter dipadu Modified Discrete Cosine Transform (spek dasar kompresi audio).
Hebatnya lagi, hasil pengetesan independen diperoleh bahwa kualitas ATRAC3plus (file *.atp) ber-bit rate 64 kbps sama bagusnya dengan MP3 pada 128 kbps atau AAC pada 96 kbps. Lagi-lagi kayak Ogg, file ATRAC3plus jadi lebih kecil! Sayang, hanya peranti Sony (Walkman atau head unit Xplod) yang mendukung file ini.

RealAudio
RealNetworks melansir format multimedia yang cukup strategis. Hingga kini, jalur streaming audio-video dijabani via RealMedia (*.rm), salah satu pengembangan dari format RealAudio (*.rm). Selanjutnya, ada format pengembangan lainnya kayak *.rv (file video tanpa audio), *.rmvb (RealAudio dengan VBR), *.ram (RealAudio Metadata) dan *.smil (Synchronized Multimedia Integration Language) yang terintergrasi dalam sistem website.
Audio Codec dari RealNetworks mengalami banyak evolusi sekaligus berafiliasi dengan pengembang audio lainnya. Diantaranya:
– *.lpcJ: IS-54 VSELP (RealAudio 1)
– *.28_8: G.728 LD-CELP (RealAudio 2)
– *.dnet: Dolby AC3 (RealAudio 3)
– *.sipr: Sipro Lab Telecom ACELP-NET (RealAudio 4/5)
– *.cook: G2/Cook Codec (RealAudio 6)
– *.atrc: Sony ATRAC3 (RealAudio 8)
– *.raac: MPEG-4 LC-AAC (RealAudio 9)
– *.racp: MPEG-4 HE-AAC (RealAudio 10)
– *.ralf: RealAudio Lossless Format (RealAudio 10)
RAGAM AUDIO CODEC
Selain audio codec di atas, juga beredar format audio lainnya yang perlu elu tahu, diantaranya:
– FLAC (Free Lossless Audio Codec), menemani kompresi lossy MP3 atau AAC hanya unggulnya file ini bandwidth dan ukuran bisa berkurang tanpa mengorbankan kesatuan sumber suara
– Monkey’s Audio (*.ape), format kompresi lossless dengan merekonstruksi bentuk gelombang sumber suara dengan cerdas, namun sayangnya format ini tidak bisa dijabani dengan gratis seperti MP3
– Speex, format audio codec yang sering dipakai dalam sistem VoIP (voice internet protocol) yang juga terkadang melengkapi audio codec dari Vorbis
– WavPack (*.WV), adalah teknologi hybrid, menggunakan keunggulan sistem kompresi lossless dengan file audio sekelas WAV
– Musepack (*.mpc), merupakan lossy audio codec berspek open source formatnya dalam bentuk *.mp+ atau *.mpp

ToM! (dari berbagai sumber)

TEST KOMPARASI
‘Iseng-iseng’ gue jabani komparasi 4 jenis file musik kompresi digital yaitu AAC/MP4, MP3, Ogg dan WMA. File musik diambil dari CD album tester USHER track 10 dan 14 untuk uji dengar juga IASCA track 97 (pink noise) untuk uji RTA (Real Time Analyzer).
Semua dikompresi/dikonversi melalui software Nero StartSmart versi 2.0.0.11 pada PC berprosesor Intel Pentium III 531 Mhz pada memory RAM 512 MB. Kecuali WMA, semua file ber-bit rate 2 macam (CBR dan VBR) dengan rincian.
– MP3 CBR (PowerPack Lame) 128 kbps highest quality kanal stereo 44,1 kHz
– MP3 VBR (PowerPack Lame) kualitas 5 (skala 10) kanal stereo 44,1 kHz
– MP4 CBR (Low Complexity-AAC) 128 kbps highest quality kanal stereo 44,1 kHz
– MP4 VBR (Low Complexity-AAC) 100-120 kbps streaming quality 44,1 kHz
– Ogg CBR (Vorbis Encoder) 128 kbps 44,1 kHz
– Ogg VBR (Vorbis Encoder) kualitas 4 (skala 100) 44,1 kHz
– WMA CBR 128 kbps kualitas CD 44,1 kHz 128 kBit (Nero tidak menyediakan konversi WMA VBR)
Semua file ini berkualitas hampir tidak berbeda ketika dicoba via program Winamp versi 5.24 pada laptop Toshiba Satellite M40 (prosesor Pentium 1,6 GHz memory RAM 512 MB beraudio 16 bit). Lalu dikoneksi ke instalasi berpower David Valveaudio 100Wx2 RMS dengan speaker Seas Excel Millenium 6 inci 2-way. Toh, dengan dibantu penilaian Fritzgerald Anderson Haliman (Fritz Audio) diperoleh ‘nilai’ masing-masing file berikut ini.

“Ogg lebih pas buat tweeter yang kalem, kalau MP3 dan MP4 pas pakai tweeter yang tajam,” papar Fritzgerald
Untuk hasil pengetesan versi lain secara lengkap, elu bisa klik di http://www.rjamorim.com/test/ dan http://www.xiph.org/vorbis/listen.html. Sedangkan untuk hasil pengukuran RTA via file pink noise, simak foto-foto berikut.


1. MP3 CBR frekuensi 20 kHz hilang, sedang 16 kHz jatuh pada 3-6 dB


2. Hampir sama dengan MP3 CBR, hanya saja versi VBR menunjukkan 16 kHz yang lebih kuat 6 dB dan 20 kHz muncul pada -9 dB


3. MP4 CBR menunjukkan grafik yang lebih ‘rapi’ ketimbang MP3, frekuensi tinggi rata namun jatuh pada 20 kHz pada -6 dB


4. MP4 VBR terlihat memperkuat MP4 CBR pada frekuensi 16 & 20 kHz


5. Meskipun tidak rata, grafik Ogg CBR cenderung lebih mulus dengan frekuensi 16 & 20 kHz sangat kuat (9 dB)


6. Ogg VBR berkarakter hampir sama dengan CBR-nya namun terdapat penyempurnaan pada frekuensi 12 kHz


7. Sama halnya dengan MP3, 20 kHz pada WMA hilang dengan posisi sub-bass dan midbas sangat lemah

Simak perbedaan 4 format audio digital di tabel Detail Teknis berikut


Program Nero Start Smart untuk konversi data audio digital:

Special thanks to: Fritz Audio, Jl. Pantai Indah Selatan I Blok DC No. 2, Pantai Indah Kapuk, Jakarta Utara, Telp: (021) 5881074

Source logo: http://www.netministry.com, http://www.mikewren.com, http://www.wikipedia.org, http://www.newworldmusic.com, http://www.swik.net, http://www.sanshin.co.jp, http://www.radiofreemonterey.org, http://www.forum-mp3.net, http://www.radio.goldseek.com