Chapter 7 Kompresi Audio Metode kompresi lossless yang masih tradisional seperti Huffman, LZW. Penggunaanya tidak bekerja dengan baik pada kompresi audio, sama seperti sebagian kompresi untuk gambar. Sehingga dibentuklah sebuah metoda kompesi untuk mengatasi keterbatasa n pada metode kompresi lossless, yaitu disebut dengan metode kompresi lossy.
ciri-ciri dari metode kompresi lossy pada audio Adaptive Differetial Pulse Code Modulation, contohnya CCITT G.721,16 tau 32 Kbit/sec Melakukan encode dua atau lebih sinyal yang berbeda, perbedaan kuantisasi pada encode tersebut adalah kehilangan sinyal data suara Mengadaptasi terhadap kuantisasi terhadap beberapa bit dapat digunakan asalkan isi data sinyal suara sedikit
ciri-ciri dari metode kompresi lossy pada audio (cont...) Linier Predective Coding (LPC)difungsikan untuk menyesuaikan sinyal data yang ada dengan sinyal suara manusia, kemudian mengirimkan parameter model suara tersebut ketempat tujuan, seperti sebuah computer yang dapat berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps Code Excited Linear Predicator (CELP) bekerja mirip seperti LPC, tetapi ada tambahan CELP dapat memancarkan data suara yang salah, sedangkan PLC tidak, contohnya mutu percakapan audio pada kecepatan 4,8 kbps
Critical Bands Sistem suara manusia memiliki keterbatasn, dimana resolusi frekuensinya terbatas. Keragaman leber frekuensi dapat dibedakan menjadi critical bands. Jika frekuensi yang ada kuramng dari 100 Hz maka diangap frekuensi audio yang rendah, dan apabila lebih dari 4 kHz disebut frekuensi audi yang tinggi. Kesemuanya frekuensi audio dapat dibagi menjadi 25 critical bands. Satuan frekuensi suara dapat diubah menjadi nilai satuan yang baru yaitu bark,di mana; 1 Bark = jangkauan satu critical band Untuk frekuensi < 500 Hz, dapat diubah menjadi Bark, Untuk frekuensi > 500 Hz, adalah Bark
Teknik Kompresi Audio dengan format MPEG Beberapa fakta yang terjadi pada format MPEG; MPEG-1: 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunkan untuk video dan 0,3 Mbits/sec digunkan untuk audio, nilai ini lebih kecil dibandingkan dengan CD audio yang belum dikompresi sebesar 44,100 samples/sec * 16 bits/sample * 2 channel lebih dari 1,4 Mbits/ sec Jangkauan Faktor kompresi dari MPEG-1 adalah dari 2,7 s/d 24. Sehingga dengan kompresi rasio sebesar 6:1 untuk 16 bit stereo dan frekuensi 48 Khz didapatkan kapasitas rate data sebesar 256 kbit/sec, ini merupakan suara yang sangat baik didengar oleh telingamanusia. MPEG audio mendukung frekuensi sebesar 32 kHz, 44,1 kHz dan 48 kHz.
Teknik Kompresi Audio dengan format MPEG (cont...) Mampu bekerja pada satu atau dua buah kanal, dari empat jenis suara, antara lain: Monophonic (single audio channel) Dual Monophonic, dua buah cahanel yang berbeda dan tidak ada kaitan satu sama lain Stereo , untuk kanal stereo adalah dua buah kanal adalah pengabungan beberapa bit, tapi tidak menggunakan koding jont stereo joint stereo, mengambil nilai yang paling baik dari jenis suara stereo, bisanya lebih dari dua buah kanal (channel)
Langkah-Langkah yang ada Pada Algoritma MPEG Meggunakan saringan (filter) untuk membagi signal audio, contoh 48 kHz suara dibagi menjadi 32 jenis lebar frekeuensi (subband frequency) Memberikan pembatas pada masing frekensi yang telah dibagi-bagi, karena kalu tidak dibatasi akan mengakibatkan intermodulasi Jika kekuatan suara terlalu rendah maka tidak dilakukan encode pada suara tersebut
Langkah-Langkah yang ada Pada Algoritma MPEG (cont...) Cara lain adalah memberikan bit pengecekan yang berfungsi mengecek data suara tersebut rusak atau tidak yang diakibatkan oleh noise atau gangguan, apabila rusak maka data bit tersbut digantikan bit yang jenisnya sama denga terdekatnya. Mengubah format data suara menjadi format Bitstream Setelah dianalisa rangeuntuk 16 subband dari 32 subband, dimana masing-masing band memiliki level; ---------------------------------------------------------------------------------------- Band 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Level (db) 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
Lapisan pada MPEG Fungsi masing-masing lapisan adalah sebagai berikut; Lapisan 1 : fungsi dari lapisan ini adalah melakukan penyaringan pada tiap frame dengan model DCT dan melakukan pengelompokan terhadap sinyal yang memepunyai bandwidth yang sama Lapisan 2. menggunakan 3 frame dalam filter sehingga total pada 3 fame tersebut ada 1152 sample Lapisan 3: membuat critical band yang paling baik untuk frekuensi yang tidak sama dengan menggunakan model psychoacoustic yang didalamnya terdapat efek masking , dimana efek masking diambil untuk menghitung nilai strereo redudancy, dan juga menggunakan Huffman coder
Nilai efektivitas dari MPEG Lapisan Target Bit-rate Rasio Kualitas dengan 64 kb/s Kualitas dengan128 kb/s Theoretical Min. Delay Lapisan 1 192 kb/s 4:1 --- 19 ms Lapisan 2 128 kb/s 6:1 2.1 to 2.6 4+ 35 ms Lapisan 3 64 kb/s 12:1 3.6 to 3.8 59 ms
MP3 MP3 adalah nama singkat dari MPEG-1 Layer III atau MPEG Audio Layer III yang merupakan format audio standar industri MPEG yang udah jadi standar internasional MPEG-1 layer III adalah komponen kompresi yang terdiri dari layer (bagian) audio saja, yang merupakan pengembangan dari format MPEG-1 (kompresi data video buat pemakaian internet dengan kualitas minimal) Standar MP3 dikembangkan oleh Fraunhofer Institut Integrierte Schaltungen di Jerman
ATRAC3 Plus Teknologi Kompresi Audio Eksklusif dari Sony ATRAC3 (Adaptive Transform Acoustic Coding 3) kompresi ATRAC3 berdasarkan prinsip psychoacoustic, yaitu menghilangkan informasi-informasi audio yang tidak dapat didengar oleh telinga manusia. Informasi suara yang dihasilkan lalu di-encoding dengan ATRAC3 Teknologi ATRAC3 Plus mampu mengompresi file musik hingga 1/20 dari ukuran aslinya Ukuran file pun menjadi lebih kecil, yaitu sekitar 1,38 MB (1.450.680 bytes) untuk satu lagu dengan durasi putar empat menit.