MAKALAH PENGOLAHAN SINYAL DIGITAL
DISUSUN OLEH :
NAMA
: Nofriadi
NIM
: 1410951038
JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS ANDALAS PADANG 2017
DAFTAR ISI
JUDUL DAFTAR ISI BAB I PENDAHULUAN 1.1 Latar Belakang BAB II PEMBAHASAN 2.1 Audio Multichannel dan Kompresi Audio 2.1.1 Pengertian Audio 2.1.2 Jenis-jenis Audio 2.1.3 Pengertian Audio Multichannel 2.1.4 Parameter dari Audio Multichannel 2.1.5 Pengertian Kompresi Audio 2.1.6 Teknik Audio Koding (lossless, losy) 2.1.7 Kelebihan dan Kekurangan Teknik Audio Koding 2.1.8 Macam-macam Format Audio 2.1.9 Penilaian Kualitas Audio 2.1.10 Aplikasi 2.2 Pengolahan Sinyal Digital Pada Citra 2.2.1 Pengertian Citra 2.2.2 Macam-macam Citra 2.2.3 Karakteristik Citra Digital 2.2.4 Resolusi Citra 2.2.5 Ruang Warna (RGB, Greyscale, citra biner) 2.2.6 Preprocessing Citra 2.2.7 Kompresi Citra (lossless, lossy) 2.2.8 Tujuan Compresi Citra
1
2.2.9 Kriteria Kompresi (waktu, memori, MSE, PSNR) 2.2.10 Contoh Perhitungan Kompresi Citra 2.2.11 Metode Kompresi ( LZW, Packbits, deflate ) 2.2.12 Format Citra 2.3 Filter Suara 2.3.1 Sinyal Ucapan 2.3.2 Jenis-jenis Ucapan 2.3.3 Jenis-jenis Derau 2.3.4 Speech Enhancement 2.3.5 Pengertian Filter Suara 2.3.6 Klasifikasi Filter 2.3.7 Jenis Filter Digital (LMS, NLMS) 2.3.8 Algoritma Filter (LMS, NLMS) DAFTAR PUSTAKA
2
BAB I PENDAHULUAN
1.1 Latar Belakang Pada masa sekarang ini, pengolahan sinyal secara digital telah diterapkan begitu luas. Dari peralatan instrumentasi dan kontrol, peralatan musik, peralatan kesehatan dan peralatan lainnya. Istilah pengolahan sinyal digital sebenarnya kurang begitu tepat, yang lebih tepat adalah pengolahan sinyal diskrete. Tetapi karena istilah ini sudah luas digunakan, maka istilah pengolahan sinyal digital tetap digunakan . Di bidang musik PSD dipakai dalam perekaman, pencampuran, sintesa, dan penyimpanan. Pada bidang telekomunikasi dan multimedia, PSD diterapkan misalnya pada transmisi, modulasi, pemampatan (compression), proteksi data, pentapisan, ekstraksi ciri, dan identifikasi. Sementara itu PSD dipakai pada pengolahan citra misalnya dalam pentapisan dua dimensi, pemampatan, image enhancement, dan pengenalan pola. Dalam bidang biomedik, PSD dimanfaatkan untuk diagnosis dan monitoring pasien.
3
BAB II PEMBAHASAN 2.1 Audio Multichannel dan Kompresi Audio 2.1.1 Pengertian Audio merupakan salah satu elemen penting yang ikut berperan dalam membangun sebuah sistem komunikasi dalam bentuk suara, yaitu suatu sinyal elektrik yang akan membawa unsur bunyi didalamnya. Audio sendiri terbentuk melalui beberapa tahap, antara lain tahap pengambilan/penangkapan suara, sambungan transmisi pembawa bunyi, amplifier dan lain sebagainya.
2.1.2 Jenis-jenis Audio Macam-macam atau Jenis-jenis audio, terdapat berbagai macam audio yang dikelompok berdasarkan media ataupun perangkat yang sering gunakan, diantaranya: 1) Audio Streaming adalah istilah yang dipakai untuk mendengarkan live melalui jaringan internet. Seperti : Winamp (MP3), RealAudio (RAM) dan juga Liquid Radio. 2) Audio visual adalah suatu istilah yang digunakan untuk seperangkat soundsystem yang dilengkapi dengan tampilan gambar, biasanya dipakai untuk presentasi. 3) Audio Modem Riser (AMR) adalah suatu istilah yang dipakai untuk sebuah kartu plug-in untuk motherboard intel yang memuat sirkuit audio ataupun Modem.
2.1.3 Pengertian Audio Multichannel Sistem audio yang menggunakan banyak kanal dikenal dengan Multichannel audio.Teknologi multichannel ini bertujuan untuk menghasilkan reproduksi suara yang lebih berkualitas dan nyata.
4
2.1.4 Parameter dari Audio Multichannel Sistem multichannel yang terstandarisasi yaitu 2.0 (Stereo), 5.1 dan 7.1 Audio multichannel. Secara umum penulisan Audio Multichannel ditulis dengan cara “m.n”, m merupakan kanal fullband dan n adalah kanal limited bandwidth (LFE). Sistem Audio Multichannel bisa memvisualisasikan sumber suara, tetapi menggunakan bandwidth yang lebih besar.
2.1.5 Pengertian Kompresi Audio Kompresi audio bertujuan untuk mengecilkan atau mengurangi ukuran file audio. Kompresi audio dilakukan pada saat pembuatan file audio dan saat distribusi file audio tersebut. Audio tersebut dikecilkan ukuran filenya tanpa merubah informasi dari data tersebut. 2.1.6 Teknik Audio Koding (lossless, lossy) Ada dua cara yang digunakan untuk proses kompresi audio, yaitu teknik lossless dan lossy. Seperti teknik kompresi pada umumnya, kompresi audio baik itu lossless maupun lossy memanfaatkan adanya reduktansi antara informasi dengan pengkodean, pengenalan pola maupun maupun prediksi linear. a. Teknik kompresi lossless. Kompresi lossless merupakan metoda kompresi data yang memungkinkan data asli dapat disusun kembali dari data hasil kompresi, maka rasio hasil kompresi pun tidak terlalu besar serta data hasil kompresi dapat dikembalikan ke bentuk semula.
b. Teknik Kompresi Lossy Prinsip dasar kompresi lossy pada data audio memanfaatkan teori psikoakustik, yaitu keterbatasan pendengaran manusia. Telinga manusia hanya dapat menangkap suara dalam rentang 20Hz hingga 20000Hz, maka dalam kompresilossy, data suara di luar rentang tersebut tidak disimpan. Oleh karena itu, noise pada data audio (yang biasanya memiliki amplitude rendah) dapat ‘disembunyikan’ dengan cara
5
disimpan pada rentang frekuensi tinggi. metode untuk mengkompresi data dan mendekompresinya, dimana data yang diperoleh mungkin berbeda dari yang aslinya tetapi cukup dekat perbedaanya, penurunan (perbedaan) kualitas data disebutcompression artefacts.
2.1.7 Kelebihan dan Kekurangan Teknik Audio Koding a. kompresi lossless Kelebihan : 1) Tidak ada satupun informasi data yang hilang. 2) Data dapat didekompresi dan membentuk data yang sama persis dengan aslinya (reversible). Kekurangan : 1) kompresi lossless menggunakan algoritma RLE dan Huffman Coding akan tergantung pada data yang akan dikompresi. 2) Dalam algoritma RLE (Run Length Encoding), jika karakter yang muncul berbeda-beda maka ukuran file akan lebih besar. 3) Dalam penerapan Huffman Coding dibutuhkan tempat pada awal (header) file untuk menyimpan informasi yang diperlukan untuk proses dekompresi (decoding). 4) Kompresi pada data audio, image, dan video juga sebenarnya dapat menggunakan metode general purpose seperti Huffman Coding, RLE, dan algoritma kompresi lossless lainnya.
b. Kompresi lossy Kelebihan : 1) Merupakan format audio yang sering digunakan yang biasa digunakan sebagai output file audio. 2) MP3 memiliki kapasitas yang lumayan kecil.
6
Kekurangan : 1)
Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate yang lebih tinggi, tetapi sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki bit rate tinggi).
2)
Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal suara yang sangat transient, sehingga dapat menyebabkan noise.
3)
Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi efisiensi coding.
4)
Tidak ada scale factor band untuk frekuensi di atas 15,5 atau 15,8 kHz.
5)
Mode joint stereo dilakukan pada basis per frame.
6)
Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk gapless playback (pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME, dapat menambahkan metadata tambahan yang memberikan informasi kepada MP3 player untuk mengatasi hal ini.
2.1.8 Macam-macam Format Audio Berikut ini beberapa macam format audio dan serta codec yang sering digunakan: 1) WAV (WAVE-form) WAV (WAVE-form) : singkatan dari istilah dalam bahasa Inggris waveform audio format. Wav umumnya digunakan untuk menyimpan audio tak termampatkan, file suara berkualitas CD, yang berukuran besar(sekitar 10 MB per menit). File .wav juga dapat berisi data terkodekan dengan beraneka ragam codec untuk mengurangi ukuran file. Akan tetapi untuk keperluan mengoleksi musik, transfer via internet dan memainkan diplayer portable, format ini kurang popular dibandingkan dengan MP3, Ogg Vorbis dan VMA yang dikarenakan ukuran file yang sangat besar. 2) AAC (Advanced Audio Coding) AAC adalah file format audio yang berbasis MPEG2 dan MPEG4. AAC bersifat lossy compression (data hasil kompresi tidak bisa dikembalikan lagi ke data semula, karena setelah di kompres terdapat data-data yang hilang). File AAC
7
dikompresi dengan cara lebih efisien pada kecepatan 128 kbps dengan suara stereo dibandingkan versi yang lebih dulu muncul, yakni mp3. AAC merupakan audio codec yang menyempurnakan MP3 dalam hal medium dan high bit rates. 3) MPEG Layer 3 (MP3) Mp3 merupakan format kompresi audio yang dikembangkan oleh Moving Picture Experts Group (MPEG). Format file ini menggunakan Layer 3 kompresi audio yang secara umum digunakan untuk menyimpan file – file music dan audiobooks dalam hard drive. Format file mp3 mampu memberikan kualitas suara yang mendekati kualitas CD stereo dengan 16-bit. untuk mendapati kualitas yang mendekati kualitas CD diperlukan bit-rate 192 kbps. Kualitas CD dan MP3 sulit dibedakan pada bit-rate 192 kbps. Sebagai file kompresi, MP3 menggunakan teknik lossy compression sehingga ada kemungkinan kualitas file berkurang ketika dikonversi kedalam MP3. Ekstensi : .mp3
4)
Audio Interchange File Format . AIFF dan AIFC ( Audio Interchange File Format ) : merupakan format file
yang tidak dikompres, yang dikembangkan oleh Apple pada Machintosh dan platform Unix. AIFF yaitu berkas suara digital yang tidak terkompres seperti berkas yang ada dalam CD audio. Dengan memutarnya di Windows, sebuah lagu di CD tampil sebagai CDA (CD Audio Track). Sebuah variasi dari AIFF adalah berkas AFC yang dapat memadatkan data berkas yang dikandungnya. Berkas tersebut dimulai dengan header yang menggambarkan format internal dari data audio yang berbentuk sampling rate, jumlah saluran, identifikasi data dan sebagainya. Format data audio mengikuti header. Karena sebagian besar yang menggunakan AIFF berbasis pada mikroprosesor Motorola, berkas ini menggunakan byte yang besar. Ekstensi : .aiff, .aif, .aifc 5) Audio CD File dengan ekstensi .cda merupakan representasi dari track CD-audio. File dengan format .cda dapat langsung dijalankan melalui CD-ROM, sementara filenya
8
sendiri tidak mempunyai informasi kode modulasi apapun sehingga jika dikopi ke dalam harddisk, file tersebut menjadi tidak dapat di-play. Ekstensi : .cda 6) RealAudio RealAudio : adalah codec audio yang dikembangkan oleh Real Networks pada tahun 1995. Codec ini awalnya dikembangkan untruk transmisi bandwith rendah. Dapat digunakan untuk streaming informasi audio dan dapat berjalan saat file audio tersebut masih didownload. RealAudio banyak digunakan oleh statiun radio untuk streaming program-program mereka via internet secara real time. RealNetworks juga menyediakan player software gratisan dan berbayar yang bernama RealPlayer, namun untuk yang gratisan tidak dapat melakukan meyimpan audio stream sebagai file. 7) MIDI (Music Instrument Digital Interface) MIDI adalah singkatan dari Musical Instrument Digital Interface. MIDI merupakan sebuah standar perangkat keras dan perangkat lunak internasional untuk bertukar data (seperti, kode music dan MIDI event) di antara perangkat music elektronik dan computer dari merk yang berbeda. 8) WMA ( Window Media Audio ) Format wma codec untuk lossy compression, yang dikembangkan pertama kali untuk tujuan menyaingi MP3 oleh Microsoft. Format ini dirancang dengan kemampuan Digital Right Management (DRM) untuk proteksi penyalinan, penggandaan dan membatasi pemutaran pada PC atau peranti tertentu. WMA audio stream hampir selalu dengan file ASF. 9) OGG dan OOG Vorbis Ogg dan Ogg Vorbis : Ogg adalah format multimedia gratisan yang dirancang untuk streaming dan penyimpanan yang effiesien. Format ini dikembangkan oleh Xiph.org Foundation. Begitu pula Vorbis yang merupakan codec audio gratisan. 2.1.9 Penilaian Kualitas Audio
9
Berikut adalah beberapa parameter yang digunakan untuk menilai kualitas suatu audio. 1. Spectral Balance (Keseimbangan Spektrum) Deskripsi: keakuratan tonal (tonal accuracy) sebuah sistem di seluruh bandwith audio. Penilaian secara keseluruhan ini menentukan apakah sebuah sistem mampu mereproduksi suara/rekaman sebagai sebuah kesatuan utuh perpaduan berbagai ukuran frekwensi; bukan terdengar terpecah-pecah dalam frekuensi individual masing-masing suara yang ada dalam rekaman tersebut 2. Listening Position: Front/ Rear (Posisi Mendengar: Depan/Belakang) Deskripsi: arah panggung suara (dari depan) dan jarak yang ideal antara panggung suara & pendengar; bahwa pendengar mendapat ilusi bahwa panggung suara terletak di depan secara layak. 3. Stage Width: Left/Right (Lebar Panggung Suara: Kiri/Kanan) Deskripsi: Jarak antara batas-batas kiri dan kanan dari panggung suara yang diciptakan. Semakin lebar semakin bagus karena berarti bisa mengakomodir lebih dari 1 posisi dengar ideal. 4. Stage Height: Left to Right/Front to Rear (Tinggi Panggung Suara: Kiri ke Kanan/Depan ke Belakang) Deskripsi: ini tentang ilusi tinggi panggung suara, beserta vertical spread (penyebaran suara secara level horizontal dari garis vertical tinggi panggung tadi). Jadi, jika vocal berada di titik tengah (vertical), maka drum akan berada di belakang vocal (Depan ke Belakang) , gitar akan terasa di samping kanan vocal (Kiri ke Kanan) dan seterusnya. 5. Stage Depth (Kedalaman Panggung Suara) Deskripsi: Ilusi bahwa suara orang atau instrumen seakan berlapis; satu suara ada di depan suara lainnya. 6. Ambience Deskripsi: “perceived space around a sound source”. Ini terminology psychoacoustic, di mana dalam setiap rekaman sebenarnya terdapat ambient yang bisa melukiskan ruangan saat rekaman berlangsung.
10
7. Imaging Deskripsi: kemampuan sebuah sistem suara dalam mereproduksi suara setiap instrumen di lokasi tepatnya masing-masing secara proporsional di panggung suara. 2.1.10 Aplikasi Contoh Teknologi Audio Digital : 1) Digital Audiotape : adalah media perekaman yang membentang jurang dua teknologi yaitu antara analog dan digital. Pada satu tangan, menggunakan pita sebagai media perekam, di sisi lain, menyimpan sinyal sebagai data digital dalam bentuk nomor untuk mewakili sinyal audio. Bentuknya seperti compact audio kaset. 2) Compact Disc : a.
High-density compatible digital (HDCD), dimiliki oleh Microsoft, adalah sebuah proses rekaman yang meningkatkan kualitas audio dari compact disc, memberikan hasil akhir yang lebih bisa diterima dari CD audio standar. Dimana memiliki penyaringan yang dapat mengurangi distorsi, gangguan, keakuratan dan suara yang lebih alami.
b. Super Audio CD (SACD). Philips dan Sony telah menghasilkan spesifikasi
alternatif yang disebut Super Audio CD yang menggunakan metode berbeda yaitu pengkodean audio. SACD dirancang untuk tidak bisa dikopi dan membutuhkan player khusus. SACD memiliki kelebihan dibanding CD sebelumnya karena memiliki keakuratan dan kejernihan tingkat tinggi. 3) DVD-Audio: DVD-Audio dirilis pada bulan April 1999. DVD-Audio dapat memberikan stereo berkualitas tinggi daripada CD, dengan tingkat sampling hingga 192 kHz (dibandingkan dengan 44,1 kHz untuk CD). 4) MP3: Adalah singkatan dari MPEG 1 layer 3. MPEG adalah Moving Pictures Experts Group yang merupakan bentuk standar file audio dan video. MP3 merupakan salah satu perkembangan teknologi audio yang masih populer hingga saat ini. MP3 adalah salah satu format berkas pengkodean suara yang mempunyai kompresi yang baik, hal itu menyebabkan ukuran dari berkas it
11
sendiri bisa menjadi lebih kecil. Contoh MP3 adalah Ipod yang akan dibahas setelah ini.
2.2 Pengolahan Sinyal Digital Pada Citra 2.2.1 Pengertian Citra Citra adalah suatu representasi (gambaran), kemiripan, atau imitasi dari suatu objek. Citra terbagi 2 yaitu ada citra yang bersifat analog dan ada citra yang bersifat digital. Setiap citra memiliki ukuran dan resolusi yang berbeda- beda. 2.2.2 Macam-macam Citra Nilai suatu Pixel memiliki nilai dalam rentang tertentu, dari nilai minimum sampai nilai maksimum.Jangkauan yang digunakan berbeda-beda tergantung dari jenis warnanya. Namun secara umum jangkauannya adalah 0 – 255. Citra dengan penggambaran seperti ini digolongkan ke dalam citra integer. Berikut adalah jenisjenis citra berdasarkan nilai Pixel-nya. 1) Citra Biner Citra biner adalah citra digital yang hanya memiliki dua kemungkinan nilai Pixel yaitu hitam dan putih. Citra biner juga disebut sebagai citra B&W (black and white) atau citra monokrom. Hanya dibutuhkan 1 bit untuk mewakili nilai setiap Pixel dari citra biner 2.) Citra Grayscale Sedangkan pada citra grayscale, setiap Pixel adalah representasi derajat intensitas atau keabuan. Terdapat 256 jenis derajat keabuan pada citragrayscale. Mulai dari putih, kemudian sekain gelap sampai warna hitam.Oleh karena terdapat kemungkinan 256 derajat keabuan, maka setiap Pixel padagrayscale dismpan 1 byte memory (8 bits). 3) Citra Warna Citra warna terdiri atas 3 layar metriks, yaitu R-layer, G-layer, Blayer.System warna RGB (Red, Green, Blue) menggunakan sisetem tampilan grafik
12
kualitas tinggi (higt quality Raster Graphic) yaitu 24 bit. Setiap komponen warn merah, hijau, biru masing-masing mnedapatkan alokasi 8 bit untuk menampilkan warna.
2.2.3 Karakteristik Citra Digital 1) Pixel Pixel ( picture element ) adalah sebuah titik yang merupakan elemen paling kecil pada citrasatelit.Angka numerik ( 1 byte ) dari pixel disebut digital number ( DN ). DN bisa ditampilkan dalam waktu kelabu, berkisar antara putih dan hitam ( gray scale ), tergantung level energi yang terdeteksi. Pixel yang disusun dalam order yang benar akan membentuk sebuah citra. Kebanyakan citra satelit yang belum diproses disimpan dalam bentuk gray scale, yang merupakan skala warna dari hitam ke putih dengan derajat keabuan yang bervariasi. 2) Kontras Contrast adalah perbedaan antara brightness relatif antara sebuah benda dengan sekelilingnya pada citra. Sebuah bentuk tertentu mudah terdeteksi apabila pada sebuah citra contrast antara bentuk tersebut dengan backgroundnya tinggi. Teknik pengolahan citra bisa dipakai untuk mempertajam contrast.
2.2.4 Resolusi Citra Resolusi dari sebuah citra adalah karakteristik yang menunjukkan level kedetailan yang dimiliki oleh sebuah citra. Resolusi didefinisikan sebagai area dari permukaan bumi yang diwakili oleh sebuah pixel sebagai elemen terkecil dari sebuah citra. Pada citra satelit pemantau cuaca yang mempunyai resolusi 1 km, masing-masing pixel mewakili rata-rata nilai brightness dari sebuah area berukuran 1×1 km. Bentuk yang lebih kecil dari 1 km susah dikenali melalui image dengan resolusi 1 km. Landsat 7 menghasilkan citra dengan resolusi 30 meter, sehingga jauh lebih banyak detail yang bisa dilihat dibandingkan pada citra satelit dengan resolusi 1 km. Resolusi adalah hal penting yang perlu dipertimbangkan dalam rangka pemilihan citra yang akan
13
digunakan terutama dalam hal aplikasi, waktu, biaya, ketersediaan citra dan fasilitas komputasi.
2.2.5 Ruang Warna (RGB, Greyscale, citra biner) Warna adalah spektrum tertentu yang terdapat di dalam suatu cahaya sempurna (berwarna putih). Nilai warna ditentukan oleh tingkat kecerahan maupun kesuraman warna. Nilai ini dipengaruhi oleh penambahan putih ataupun hitam.
1) RGB disebut juga ruang warna yang dapat divisualisasikan sebagai sebuah kubus seperti gambar 2.4 dengan tiga sumbunya yang mewakili komponen warna merah (red) R, hijau (green) G, biru (blue) B. Salah satu pojok alasnya yang Sistem Klasifikasi Jenis dan Kematangan Buah Tomat Berdasarkan Bentuk dan Ukuran serta Warna Permukaan Kulit Buah Berbasis Pengolahan Citra Digital berlawanan menyatakan warna hitam ketika R = G = B = 0, sedangkan pojok atasnya yang berlawanan menyatakan warna putih ketika R= G= B= 255 ( sistem warna 8 bit bagi setiap komponennya ).
2) Cita Grayscale (skala keabuan) Citra grayscale mempunyai kemungkinan warna hitam untuk nilai minimal dan warna putih untuk nilai maksimal. Banyaknya warna tergantung pada jumlah bit yang disediakan di memori untuk menampung kebutuhan warna tersebut. Semakin besar jumlah bit warna yang disediakan di memori, maka semakin halus gradasi warna yang terbentuk. 3) Citra Biner (Binary Image) Citra biner (binary image) adalah citra yang hanya mempunyai dua nilai derajat keabuan yaitu hitam dan putih. Alasan masih digunakannya citra biner dalam pengolahan citra digital hingga saat ini adalah algoritma untuk citra biner telah berkembang dengan baik dan waktu pemrosesan lebih cepat karena jumlah bit untuk tiap pikselnya lebih sedikit.
14
4) 2.2.6 Preprocessing Citra
Secara umum, langkah-langkah dalam pengolahan citra dapat dijabarkan menjadi beberapa langkah. 1. Akusisi citra Akuisisi citra adalah tahap awal untuk mendapatkan citra digital. Tujuan akuisisi citra adalah untuk menentukan data yang diperlukan dan memilih metode perekaman citra digital. Tahap ini dimulai dari objek yang akan diambil gambarnya, persiapan alat-alat, sampai pada pencitraan. Pencitraan adalah kegiatan transformasi dari citra tampak(foto, gambar, lukisan, patung,pemandangan dan lain-lain) menjadi citra digital. Beberapa alat yang dapat digunakan untuk pencitraan adalah :
a) Video kamera, kamera digital ataupun kamera konvensional. b) Scanner c) Photo sinar-X / infra merah 2. Peningkatan kualitas citra Pada tahap ini dikenal dengan pre-processing dimana dalam meningkatkan kualitas citra dapat meningkatkan kemungkinan dalam keberhasilan pada tahap pengolahan citra digital berikutnya. Hal-hal penting yang dilakukan pada tingkatan ini diantaranya adalah :
a) Peningkatan Kualitas (Kontras, brightness, dan lain-
lain) b) Menghilangkan noise c) Perbaikan citra d) Transformasi e) Menentukan bagian Citra yang akan diobservasi 3. Segmentasi citra Tahapan ini bertujuan untuk mempartisi citra menjadi bagian-bagian pokok yang mengandung informasi penting. Misalnya, memisahkan objek dan latarbelakang Segmentasi terdiri dari downsampling, penapisan dan deteksi tepian.
15
4. Representasi dan Uraian Dalam
hal
ini
representasi
merupakan
suatu
proses
untuk
merepresentasikansuatu wilayah sebagai suatu daftar titik-titik koordinat dalam kurva tertutup,dengan dekripsi
luasan atau perimeternya.
Setelah suatu wilayah
dapatdirepresentasi, proses selanjutnya adalah melakukan deskripsi citra dengan cara seleksi ciri dan ekstrasi ciri (feature extraction and selection). Seleksi ciri bertujuan untuk memilih informasi kuantitatif dari cirri yang ada, yang dapatmembedakan kelas-kelas objek secara baik, sedangkan ekstrasi ciri bertujuanuntuk mengukur besaran kuantitatif ciri setiap piksel, misalnya rata-rata,standar deviasi, koefisien variasi, SignaltoNoise ratio (SNR), dan lain-lain. 5. Pengenalan dan Interpretasi Pengenalan pola tidak hanya bertujuan untuk mendapatkan citra dengan suatu kualitas tertentu, tetapi juga untuk mengklasifikasikan bermacam-macam citra, memberi label pada sebuah objek yang informasinya disediakan oleh descriptor . Dari sejumlah citra diolah sehingga citra dengan ciri yang sama akan dikelompokkan pada suatu kelompok tertentu. Interpretasi meliputi penekanan dalam mengartikan objek yang dikenali.
2.2.7 Kompresi Citra (lossless, lossy) Sebuah citra diubah ke bentuk digital agar dapat disimpan dalam memori komputer atau media lain. Proses mengubah citra ke bentuk digital bisa dilakukan dengan beberapa perangkat, misalnya scanner, kamera digital, dan handycam. Ketika sebuah citra sudah diubah ke dalam bentuk digital (selanjutnya disebut citra digital), bermacam-macam proses pengolahan citra dapat diperlakukan terhadap citra tersebut. Ada dua tipe pada kompresi data, yaitu
16
1. Kompresi tipe lossless. Kompresi tipe lossless Adalah kompresi yang tidak menghilangkan informasi setelah kompresi terjadi, akibatnya kualitas citra hasil kompresi tidak menurun. Beberapa ciri dari kompresi lossless : a. Teknik kompresi citra dimana tidak ada satupun informasi citra yang dihilangkan. b. Biasa digunakan pada citra medis. c. Metode loseless: Run Length Encoding, Entropy Encoding (Huffman, Aritmatik), dan Adaptive Dictionary Based (LZW). Beberapa teknik loseless: 1) Color reduction: untuk warna-warna tertentu yang mayoritas dimana informasi warna disimpan dalam color palette. 2) Chroma subsampling: teknik yang memanfaatkan fakta bahwa mata manusia merasa
brightness
(luminance)
lebih
berpengaruh
daripada
warna
(chrominance) itu sendiri, maka dilakukan pengurangan resolusi warna dengan disampling ulang. Biasanya digunakan pada sinyal YUV. Chorma Subsampling terdiri dari 3 komponen: Y (luminance) : U (CBlue) : V (CRed) 3) Transform coding: menggunakan Fourier Transform seperti DCT. – Fractal Compression: adalah suatu metode lossy untuk mengkompresi citra dengan menggunakan kurva fractal. Sangat cocok untuk citra natural seperti pepohonan, pakis, pegunungan, dan awan. – Fractal Compression bersandar pada fakta bahwa dalam sebuah image, terdapat bagian-bagian image yang menyerupai bagian bagian image yang lain. – Proses kompresi Fractal lebih lambat daripada JPEG sedangkan proses dekompresinya sama. 1. Kompresi tipe lossy Adalah kompresi dimana terdapat datayang hilang selama proses kompresi, akibatnya kualitas data yang dihasilkan jauh lebih rendah daripada kualitas data asli. Beberapa ciri dari kompresi lossy :
17
a. Ukuran file citra menjadi lebih kecil dengan menghilangkan beberapa informasi dalam citra asli. b. Teknik ini mengubah detail dan warna pada file citra menjadi lebih sederhana tanpa terlihat perbedaan yang mencolok dalam pandangan manusia, sehingga ukurannya menjadi lebih kecil. c. Biasanya digunakan pada citra foto atau image lain yang tidak terlalu memerlukan detail citra, dimana kehilangan bit rate foto tidak berpengaruh pada citra. 2.2.8 Tujuan Compresi Citra Pemampatan citra bertujuan meminimalkan kebutuhan memori untuk merepresentasikan citra digital dengan mengurangi duplikasi data di dalam citra sehingga memori yang dibutuhkan menjadi lebih sedikit daripada representasi citra semula.
2.2.9 Kriteria Kompresi (waktu, memori, MSE, PSNR) Kriteria Mengukur Metode Kompresi Citra 1) Waktu kompresi dan waktu rekronstruksi yang sebaiknya cepat. 2) Kebutuhan memori Memori yang dibutuhkan untuk merepresentasikan citra seharusnya berkurang secara berarti. Teknik kompresi dikatakan baik apabila didapatkan rasio kompresi yang besar, karena semakin besar rasio kompresi yang didapat berarti semakin kecil ukuran hasil kompresi. Pada beberapa metode, ukuran memori hasil kompresi bergantung pada citra itu sendiri. Citra yang mengandung banyak elemen duplikasi (misalnya citra langit cerah tanpa awan, citra lantai keramik) umumnya berhasil dikompresikan dengan memori yang lebih sedikit dibandingkan dengan mengkompresikan citra yang mengandung banyak objek (misalnya citra pemandangan alam).
18
3) Kualitas kompresi (fidelity) Informasi yang hilang akibat kompresi seharusnya seminimal mungkin sehingga kualitas hasil kompresi tetap dipertahankan. Kualitas hasil kompresi dengan kebutuhan memori biasanya berbanding terbalik. Kualitas sebuah citra bersifat subyektif dan relatif, bergantung pada pengamatan orang yang menilainya. Dan untuk dapat membuat ukuran kualitas hasil kompresi citra menjadi ukuran kuantitatif dengan menggunakan besaran PSNR (Peak Signal to Noise Ratio). Teknik kompresi dikatakan baik apabila menghasilkan nilai MSE yang kecil dan nilai PSNR yang tinggi yang berarti error atau kesalahan dari teknik kompresi ini sangat kecil dan hasil citra rekonstruksi terhadap citra asli mempunyai kemiripan yang tinggi. Sedangkan nilai rasio sinyal terhadap derau puncak atau
2.2.10 Contoh Perhitungan Kompresi Citra metode yang digunakan adalah metode huffman, bisa dilihat pada contoh kasus berikut bagaimana sebenarnya metode huffman bekerja. Misalnya kita memiliki citra dalam matrix sebagai berikut
Kita kelompkkan yang memiliki nilai yang sama : 222 3333 444 555555 Ada sebanyak 16 karakter, berarti memory yang dibutuhkan sebelum dikompresi adalah : 16 x 8 bit = 128 bit. Selanjutnya kita akan mencari Huffman tree, pertama yang kita lakukan adalah memberi kode nilai
2.2.11 Metode Kompresi ( LZW, Packbits, deflate ) Kompresi data (pemampatan data) merupakan suatu teknik untuk memperkecil jumlah ukuran data (hasil kompresi) dari data aslinya. Pemampatan data digunakan untuk mengurangkan jumlah bit-bit yang dihasilkan dari setiap simbol
19
yang muncul. Dengan pemampatan ini diharapkan dapat mengurangi (memperkecil ukuran data) dalam ruang penyimpanan dan waktu pengiriman data ketika akan dikirim melalui jaringan. 1. Algoritma Lempel Ziv Welch (LZW) Algoritma LZW dikembangkan dari metode kompresi yang dibuat oleh Ziv dan Lempel pada tahun 1977. algoritma ini melakukan kompresi dengan menggunakan dictionary. Pendekatan ini bersifat adaptif dan efektif. Prinsip kompresi tercapai jika referensi dalam bentuk pointer dapat disimpan dalam jumlah bit yang lebih sedikit dibandingkan string aslinya. Lempel-Ziv (LZ) metode kompresi adalah salah satu algoritma paling populer untuk penyimpanan lossless. 2. Deflate Deflate ataumengempis adalah variasi LZ yang dioptimalkan untuk kecepatan dekompresi dan rasio kompresi, sehingga kompresi ini bisa lambat. Deflate digunakan dalam PkZip , gzip dan PNG . 3. Packbits encoding (Run-length encoding) a) Kompresi
data paling sederhana dan digunakan pada awal penggunaan
kompresi. b) Digunakan untuk kompresi image hitam-putih (binary). c) String karakter yang berulang menempati dua byte: d) Byte pertama berisi jumlah dari banyaknya perulangan dan Byte kedua berisi
karakter itu sendiri e) Dilakukan pada satu baris (atau scanline), dan tidak digunakan pada baris yang mempunyai jumlah scanline banyak. f) Byte lebih besar dari pada byte image asli.
2.2.12 Format Citra jenis-jenis format citra diantaranya yaitu: 1. JPEG (.jpg)
20
2. GIF (.gif) 3. PNG (.png) 4. TIFF (.tif , .tiff) 5. RAW 6. BMP 7. PBM 8. PGM 9. PPM 10. PORTABLE IMAGE FILE FORMAT 11. CGM 12. PCX 13. MPEG (.mpg)
1.3 Filter Suara 1.3.1
Sinyal Ucapan
Sinyal ucapan merupakan sinyal yang berubah terhadap waktu dengan kecepatan perubahan yang relatif lambat. Jika diamati pada selang waktu yang pendek (antara 5 sampai dengan 100 mili detik), karakteristiknya praktis bersifat tetap; tetapi jika diamati pada selang waktu yang lebih panjang karakteristiknya terlihat berubah-ubah sesuai dengan kalimat yang sedang diucapkan.
1.3.2
Jenis-jenis Ucapan
1. Vokal
Sinyal ucapan vokal memiliki bentuk kuasi periodik. Setiap vokal mempunyai komponen frekuensi tertentu yang membedakan karakter satu fonem vokal dengan fonem vokal lainnya. Fonem vokal Bahasa Inggris mencakup fonem-fonem /IY/, /IH/, /EH/, /AE/, /AA/, /ER/, /AH/, /AX/, /AO/, /UW/, /UH/, dan /OW/. 2. Diftong
21
Diftong pada prinsipnya adalah dua fonem vokal yang berurutan dan diucapkan tanpa jeda. Fonem diftong Bahasa Inggris mencakup /AY/, /OY/, /AW/, dan /EY/. Karakteristik diftong mirip dengan karakteristik fonem-fonem vokal pembentuknya disertasi bentuk transisinya. 3.
Konsonan Nasal Konsonan nasal dibangkitkan dengan eksitasi glotal dan vocal tract mengerut
total pada beberapa titik tertentu sepanjang lintasan pengucapan. Bagian belakang langit-langit merendah, sehingga udara mengalir melalui nasal tract dengan suara yang dipancarkan melalui lubang hidung. Konsonan nasal Bahasa Inggris adalah /M/, /N/, dan /NX/. 4.
Konsonan Frikatif Konsonen frikatif pada prinsipnya dapat dibedakan menjadi frikatif unvoiced
serta voiced. Fonem Bahasa Inggris yang termasuk frikatif unvoiced adalah /F/, /TH/, /S/, dan /SH/, sedangkan yang termasuk frikatif voiced adalah /V/, /Z/, dan /ZH/. 5. Konsonan Stop Seperti konsonan frikatif, konsonen stop dapat dibedakan menjadi konsonan stop unvoiced serta voiced. Konsonan stop memiliki bentuk yang berbeda dengan konsonan konsonan lainnya. Konsonan ini memperlihatkan pola transient dan tidak kontinyu. Konsonan ini dibentuk dengan cara memberikan tekanan pada kondisi pengerutan total di bagian rongga mulut tertentu, dan segera diikuti dengan pelemasan. 1.3.3
Jenis-jenis Derau
1. Correlated noise: hubungan antara sinyal dan noise masuk dalam kategori ini. Karena itu, correlated noise hanya muncul saat ada sinyal. 2. Uncorrelated noise: noise yang dapat muncul kapanpun, saat terdapat sinyal maupun tidak ada sinyal. Uncorrelated noise muncul tanpa memperhatikan adanya sinyal atau tidak.
22
2.3.4 Speech Enhancement Peningkatan tuturan bertujuan untuk meningkatkan kualitas ucapan dengan menggunakan berbagai algoritma. Tujuan peningkatan adalah peningkatan kualitas kejelasan dan / atau keseluruhan persepsi persepsi sinyal terdegradasi dengan menggunakan teknik pemrosesan sinyal audio . Peningkatan pidato yang terdegradasi oleh kebisingan, atau pengurangan kebisingan, adalah bidang peningkatan bicara yang paling penting, dan digunakan untuk banyak aplikasi seperti telepon genggam , VoIP , sistem telekonferensi , pengenalan suara , dan alat bantu dengar
2.3.5
Pengertian Filter Suara Filter merupakan suatu sistem yang mempunyai fungsi transfer tertentu untuk
meloloskan sinyal masukan pada frekuensi - frekuensi tertentu dan menyaring / memblokir / melemahkan sinyal masukan pada frekuensi- frekuensi yang lain.
2.3.6 Klasifikasi Filter Filter dapat diklasifikasikan menjadi : 1. Filter analog : sinyal masukan berupa sinyal analog, pada filter analog dapat dibagi menjadi dua yaitu : a. Filter pasif : filter yang hanya disusun komponen tahanan, induktor dan kapasitor. b. Filter aktif : filter yang disusun komponen op amp atau transistor ditambah tahanan, induktor, dan kapasitor. 2. Filter digital : sinyal masukan berupa sinyal diskrit, dibedakan menjadi dua yaitu : a. Fixed Filter b. Adaptive Filter : Merubah nilai – nilai koefisien berdasarkan input. Dua jenis algoritma adaptif: Least mean Square (LMS) dan Recursive least Square (RLS). LMS algoritma didasarkan pada pencarian gradien tipe untuk melacak karakteristik sinyal waktu bervariasi. Algoritma RLS menyediakan konvergensi yang lebih cepat dan pelacakan yang lebih baik dari statistik sinyal varian waktu-dari LMS
23
algoritma, tetapi komputasi yang lebih kompleks. Berdasarkan respon impuls, filter digital terbagi menjadi :
FIR (Finite Impulse Response)
IIR (Infinite Impulse Response )
2.3.7 Jenis Filter Digital (LMS, NLMS) Filter digital adalah semua filter elektronik yang bekerja dengan menerapkan operasi matematika digital atau algoritma pada suatu pemrosesan sinyal. Salah satu batasan utama pada filter digital adalah dalam hal keterbatasan kecepatan pemrosesan/waktu komputasi yang sangat tergantung dengan kemampuan mikrokontroler atau komputer yang digunakan. Jenis-jenis filter digital yaitu 1) LMS ( least mean square) Algoritma RLS menyediakan konvergensi yang lebih cepat dan pelacakan yang lebih baik dari statistik sinyal varian waktu-dari LMS algoritma, tetapi komputasi yang lebih kompleks. 2) NLMS adalah bentuk lain dari algoritma LMS, yang menggunakan nilai
stepsize μ(n) yang berbeda untuk setiap iterasinya. 2.3.8
Algoritma Filter (LMS, NLMS) LMS dan NLMS itu adalah algoritmanya, dimana w(n+1)=.........dan seterusnya, dimana algoritma tersebut berfungsi untuk mencari nilai atau error atau galat terkecil dari hasil rumusan algoritma tersebut, dimana galat tersebut akan dijumlah dan dikalikan dengan bobot penyama W(n), dengan begitu akan memperoleh w(n) yang diharapkan. itu bahasa sederhana ane tentang LMS
24
DAFTAR PUSTAKA
http://adys.blog.uns.ac.id/2009/09/30/pengolahan-sinyal/ http://id.wikipedia.org/wiki/Pengolahan_sinyal http://elektronika-dasar.web.id/definisi-dan-jenis-filter-digital/ http://daily-tekno.blogspot.co.id/2016/10/pengertian-audio-dan-jenis-jenis-audio.html https://en.wikipedia.org/wiki/Multichannel_audio http://agfi.staff.ugm.ac.id/blog/index.php/2008/12/pemisahan-derau-dan-suaraspeech-noise-reduction/ http://gugum08.blogspot.co.id/2013/02/pengertian-suara.html http://www.e-jurnal.com/2013/12/pengertian-suara-dan-jenis-jenisnya.html http://spullx.blogspot.co.id/2011/06/kompresi-audio.html http://ryanzps.blogspot.co.id/2015/10/pengolah-sinyal-digital.html
25