MAKALAH PENGOLAHAN SINYAL DIGITAL
Disusun Oleh :
Nama
: Khaidir Arif Lubis
NIM
: 1410951015
JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS ANDALAS PADANG 2017
KATA PENGANTAR
Puji syukur dipanjatkan kehadirat Allah SWT karena atas limpahan rahmat-Nya sehingga makalah Pengolahan Sinyal Digital ini dapat diselesaikan tepat pada waktunya. Makalah ini dibuat dengan tujuan memenuhi tugas praktikum pengolahan sinyal digital. Disadari bahwa tulisan ini dibuat masih jauh dari kesempurnaan. Untuk itu kritik dan saran yang membangun sangat diharapkan demi perbaikan makalah yang selanjutnya.
Padang, 23 Oktober 2017
Penulis
1
DAFTAR ISI
JUDUL KATA PENGANTAR ............................................................................................1 DAFTAR ISI ...........................................................................................................2 BAB I PENDAHULUAN 1.1 Latar Belakang ...................................................................................................4 1.2 Rumusan Masalah............................................................................................4 1.3 Tujuan ...............................................................................................................4 BAB II PEMBAHASAN 2.1 Audio Multichannel dan Kompresi Audio 2.1.1 Pengertian Audio .....................................................................................5 2.1.2 Jenis-jenis Audio ......................................................................................5 2.1.3 Pengertian Audio Multichannel ...............................................................5 2.1.4 Parameter dari Audio Multichannel .........................................................5 2.1.5 Pengertian Kompresi Audio .....................................................................6 2.1.6 Teknik Audio Koding (lossless, losy) ......................................................6 2.1.7 Kelebihan dan Kekurangan Teknik Audio Koding 7 ............................................................................................................................. 2.1.8 Macam-macam Format Audio .................................................................8 2.1.9 Penilaian Kualitas Audio .......................................................................11 2.1.10 Aplikasi ...............................................................................................12 2.2 Pengolahan Sinyal Digital Pada Citra 2.2.1 Pengertian Citra ............................................................................................................................ 14 2.2.2 Macam-macam Citra14
2
2.2.3 Karakteristik Citra Digital ......................................................................................................................... 14 2.2.4 Resolusi Citra ............................................................................................................................ 15 2.2.5 Ruang Warna (RGB, Greyscale, citra biner) .......................................................................................................................... 15 2.2.6 Preprocessing Citra ............................................................................................................................ 17 2.2.7 Kompresi Citra (lossless, lossy) .......................................................................................................................... 18 2.2.8 Tujuan Compresi Citra ............................................................................................................................ 20 2.2.9 Kriteria Kompresi (waktu, memori, MSE, PSNR) ........................................................................................................................ 20 2.2.10 Contoh Perhitungan Kompresi Citra ............................................................................................................................ 21 2.2.11 Metode Kompresi ( LZW, Packbits, deflate ) 22 2.2.12 Format Citra ............................................................................................................................ 23 2.3 Filter Suara
3
2.3.1 Sinyal Ucapan........................................................................................................................ 26 2.3.2 Jenis-jenis Ucapan........................................................................................................................ 26 2.3.3 Jenis-jenis Derau .......................................................................................................................... 27 2.3.4 Speech Enhancement .............................................................................................................. 28 2.3.5 Pengertian Filter Suara........................................................................................................................... 28 2.3.6 Klasifikasi Filter ........................................................................................................................... 28 2.3.7 Jenis Filter Digital (LMS, NLMS) ....................................................................................................................... 29 2.3.8 Algoritma Filter (LMS, NLMS) ....................................................................................................................... 29 BAB III PENUTUP 3.1 Simpulan .........................................................................................................34 DAFTAR PUSTAKA ...........................................................................................35
4
BAB I PENDAHULUAN
1.1 Latar Belakang Pengolahan Sinyal Digital (Digital Signal Processing, disingkat DSP) adalah suatu bagian dari sain dan teknologi yang berkembang pesat selama 40 tahun terakhir. Perkembangan ini terutama karena perkembangan teknologi komputer dan rangkaian terintegrasi (Integrated Circuit), khususnya DSP microprocessor. Saat ini, aplikasi Pengolahan Sinyal Digital (PSD) telah merambah berbagai bidang, misalnya musik, telekomunikasi dan multimedia, pengolahan citra, biomedik, serta kontrol otomatik. Di bidang musik PSD dipakai dalam perekaman, pencampuran, sintesa, dan penyimpanan. Pada bidang telekomunikasi dan multimedia, PSD diterapkan misalnya pada transmisi, modulasi, pemampatan (compression), proteksi data, pentapisan, ekstraksi ciri, dan identifikasi. Sementara itu PSD dipakai pada pengolahan citra misalnya dalam pentapisan dua dimensi, pemampatan, image enhancement, dan pengenalan pola. Dalam bidang biomedik, PSD dimanfaatkan untuk diagnosis dan monitoring pasien. Pada makalah ini akan membahas tiga topik utama Pengolahan Sinyal Digital, yaitu audio multichannel dan kompresi audio, pengolahan sinyal digital pada citra serta filter suara.
1.2 Rumusan Masalah Dari uraian latar belakang di atas, beberapa permasalahan yang akan dibahas pada makalah ini adalah: 1. Apa itu Audio multichannel dan kompresi audio serta aplikasinya? 2. Apa yang dimaksud dengan pengolahan sinyal digital pada citra? 3. Apa itu filter suara?
5
1.3 Tujuan 1. Mengetahui tentang audio multichannel dan kompresi audio serta pengaplikasiannya. 2. Mengetahui tentang pengolahan sinyal digital pada citra. 3. Mengetahui tentang filter suara.
6
BAB II PEMBAHASAN 2.1 Audio Multichannel dan Kompresi Audio 2.1.1 Pengertian Audio Audio merupakan suara atau bunyi yang dapat di hasilkan dari getaran suatu benda yang agar dapat di tangkap oleh Manusia haruslkah kuat dan minima 20 kali/detik. Suara merupakan gataran yang di hasilkan dari pergesekan, pantulan, dan yang lainnya antara benda-benda. Audio merupakan elemen penting yang dapat ikut berperan di dalam membangun suatu system komunikasi dengan bentuk suata yang berupa suatu sinyal elektrik yang dapat membawa unsur-unsur bunyi Suara yaitu suatu getaran yang dihasilkan oleh gesekan atau pantulan, antara benda-benda. Sedangkan gelombang yaitu suatu getaran yang terdiri dari Amplitudo dan juga waktu.
2.1.2 Jenis-jenis Audio a) Audio visual : Perangkat soundsistem yang dilengkapi dengan penampilan gambar, biasanya digunakan untuk presentasi, home theater, dsb. b) Audio Streaming : istilah yang dipergunakan untuk mendengarkan siaran secara live melalui Internet. Berbeda dengan cara lain, yakni mendownload file dan menjalankannya di komputer kita bila download-nya sudah selesai, dengan streaming kita dapat mendengarnya langsung tanpa perlu mendownload file-nya sekaligus. Ada bermacam-macam audio streaming, misalnya Winamp (mp3), RealAudio (ram) dan liquid radio. c) Audio Modem Riser (AMR) adalah suatu istilah yang dipakai untuk sebuah kartu plug-in untuk motherboard intel yang memuat sirkuit audio ataupun Modem.
7
2.1.3 Pengertian Audio Multichannel Sistem audio yang menggunakan banyak kanal dikenal dengan Multichannel audio.Teknologi multichannel ini bertujuan untuk menghasilkan reproduksi suara yang lebih berkualitas dan nyata. 2.1.4 Parameter dari Audio Multichannel Sistem multichannel yang terstandarisasi yaitu 2.0 (Stereo), 5.1 dan 7.1 Audio multichannel. Secara umum penulisan Audio Multichannel ditulis dengan cara “m.n”, m merupakan kanal fullband dan n adalah kanal limited bandwidth (LFE). Sistem Audio Multichannel bisa memvisualisasikan sumber suara, tetapi menggunakan bandwidth yang lebih besar.
2.1.5 Pengertian Kompresi Audio Kompresi audio bertujuan untuk mengecilkan atau mengurangi ukuran file audio. Kompresi audio dilakukan pada saat pembuatan file audio dan saat distribusi file audio tersebut. Audio tersebut dikecilkan ukuran filenya tanpa merubah informasi dari data tersebut. 2.1.6 Teknik Audio Koding (lossless, lossy) Ada dua cara yang digunakan untuk proses kompresi audio, yaitu teknik lossless dan lossy. Seperti teknik kompresi pada umumnya, kompresi audio baik itu lossless maupun lossy memanfaatkan adanya reduktansi antara informasi dengan pengkodean, pengenalan pola maupun maupun prediksi linear. a. Teknik kompresi lossless. Kompresi lossless merupakan metoda kompresi data yang memungkinkan data asli dapat disusun kembali dari data hasil kompresi, maka rasio hasil kompresi pun tidak terlalu besar serta data hasil kompresi dapat dikembalikan ke bentuk semula..
b. Teknik Kompresi Lossy Prinsip dasar kompresi lossy pada data audio memanfaatkan teori psikoakustik, yaitu keterbatasan pendengaran manusia. Telinga manusia hanya
8
dapat menangkap suara dalam rentang 20Hz hingga 20000Hz, maka dalam kompresilossy, data suara di luar rentang tersebut tidak disimpan. Oleh karena itu, noise pada data audio (yang biasanya memiliki amplitude rendah) dapat ‘disembunyikan’ dengan cara disimpan pada rentang frekuensi tinggi. metode untuk mengkompresi data dan men-dekompresinya, dimana data yang diperoleh mungkin berbeda dari yang aslinya tetapi cukup dekat perbedaanya, penurunan (perbedaan) kualitas data disebutcompression artefacts.
2.1.7 Kelebihan dan Kekurangan Teknik Audio Koding a. kompresi lossless Kelebihan : 1) Tidak ada satupun informasi data yang hilang. 2) Data dapat didekompresi dan membentuk data yang sama persis dengan aslinya (reversible). Kekurangan : 1) kompresi lossless menggunakan algoritma RLE dan Huffman Coding akan tergantung pada data yang akan dikompresi. 2) Dalam algoritma RLE (Run Length Encoding), jika karakter yang muncul berbeda-beda maka ukuran file akan lebih besar. 3) Dalam penerapan Huffman Coding dibutuhkan tempat pada awal (header) file untuk menyimpan informasi yang diperlukan untuk proses dekompresi (decoding). 4) Kompresi pada data audio, image, dan video juga sebenarnya dapat menggunakan metode general purpose seperti Huffman Coding, RLE, dan algoritma kompresi lossless lainnya.
b. Kompresi lossy Kelebihan : 1) Merupakan format audio yang sering digunakan yang biasa digunakan sebagai output file audio. 2) MP3 memiliki kapasitas yang lumayan kecil. Kekurangan :
9
1)
Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate yang lebih tinggi, tetapi sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki bit rate tinggi).
2)
Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal suara yang sangat transient, sehingga dapat menyebabkan noise.
3)
Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi efisiensi coding.
4)
Tidak ada scale factor band untuk frekuensi di atas 15,5 atau 15,8 kHz.
5)
Mode joint stereo dilakukan pada basis per frame.
6)
Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk gapless playback (pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME, dapat menambahkan metadata tambahan yang memberikan informasi kepada MP3 player untuk mengatasi hal ini.
2.1.8 Macam-macam Format Audio Berikut ini beberapa macam format audio dan serta codec yang sering digunakan: 1) WAV (WAVE-form) WAV (WAVE-form) : singkatan dari istilah dalam bahasa Inggris waveform audio format. Wav umumnya digunakan untuk menyimpan audio tak termampatkan, file suara berkualitas CD, yang berukuran besar(sekitar 10 MB per menit). Ekstensi : .wav atau .wv Kelebihan: a) WAV biasanya menggunakan coding PCM (Pulse Code Modulation). Dengan cara ini , detil tidak hilang ketika audio analog didigitalkan dan disimpan. Ini membuat format WAV (menggunakan PCM) menjadi pilihan untuk mengedit audio high-fidelity b) Software yang dapat menciptakan WAV dari Analog Sound misalnya adalah Windows Sound Recorder c) WAV adalah data tidak terkompres sehingga seluruh sampel audio disimpan semuanya di harddisk.
10
Kekurangan: a) Maksimal ukuran file WAV adalah 2GB. b) WAV jarang sekali digunakan di internet karena ukurannya yang relative besar. 2) AAC (Advanced Audio Coding) AAC adalah file format audio yang berbasis MPEG2 dan MPEG4. AAC bersifat lossy compression (data hasil kompresi tidak bisa dikembalikan lagi ke data semula, karena setelah di kompres terdapat data-data yang hilang). Ekstensi : .m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4, .aac Kelebihan:
Suara lebih bagus untuk kualitas bit yang rendah (dibawah 16 Hz).
Memiliki 48 channel.
Sample ratenya antara 8 Hz – 96 kHz
3) MPEG Layer 3 (MP3) Mp3 merupakan format kompresi audio yang dikembangkan oleh Moving Picture Experts Group (MPEG). Format file ini menggunakan Layer 3 kompresi audio yang secara umum digunakan untuk menyimpan file – file music dan audiobooks dalam hard drive. Format file mp3 mampu memberikan kualitas suara yang mendekati kualitas CD stereo dengan 16-bit. Ekstensi : .mp3 Kelebihan :
Mendekati kualitas CD stereo dengan 16-bit
Kekurangan :
Bit rate terbatas
Sudah terkompresi, kualitas file sudah berkurang
4) Audio Interchange File Format . AIFF dan AIFC ( Audio Interchange File Format ) : merupakan format file yang tidak dikompres, yang dikembangkan oleh Apple pada Machintosh dan platform Unix. AIFF yaitu berkas suara digital yang tidak terkompres seperti berkas yang ada dalam CD audio. Dengan memutarnya di Windows, sebuah lagu di CD tampil sebagai CDA (CD Audio Track). 11
Ekstensi : .aiff, .aif, .aifc 5) Audio CD File dengan ekstensi .cda merupakan representasi dari track CD-audio. File dengan format .cda dapat langsung dijalankan melalui CD-ROM, sementara filenya sendiri tidak mempunyai informasi kode modulasi apapun sehingga jika dikopi ke dalam harddisk, file tersebut menjadi tidak dapat di-play. Ekstensi : .cda Kelebihan :
Langsung dapat dibaca melalui CD-ROM
Kekurangan :
Formatnya harus dirubah agar dapat dijalankan atau dibaca dikomputer
6) RealAudio RealAudio : adalah codec audio yang dikembangkan oleh Real Networks pada tahun 1995. Codec ini awalnya dikembangkan untruk transmisi bandwith rendah. MIDI (Music Instrument Digital Interface) MIDI adalah singkatan dari Musical Instrument Digital Interface. MIDI merupakan sebuah standar perangkat keras dan perangkat lunak internasional untuk bertukar data (seperti, kode music dan MIDI event) di antara perangkat music elektronik dan computer dari merk yang berbeda. 7) WMA ( Window Media Audio ) Format wma codec untuk lossy compression, yang dikembangkan pertama kali untuk tujuan menyaingi MP3 oleh Microsoft. Format ini dirancang dengan kemampuan Digital Right Management (DRM) untuk proteksi penyalinan, penggandaan dan membatasi pemutaran pada PC atau peranti tertentu. WMA audio stream hampir selalu dengan file ASF. 8) OGG dan OOG Vorbis Ogg dan Ogg Vorbis : Ogg adalah format multimedia gratisan yang dirancang untuk streaming dan penyimpanan yang effiesien. Format ini dikembangkan oleh Xiph.org Foundation. Begitu pula Vorbis yang merupakan codec audio gratisan. Vorbis biasanya dipasang bersama Ogg, sehingga muncullah yang namanya Ogg Vorbis.
12
Kelebihan :
Mendukung berbagai macam codec
Kekurangan :
Kurang popular dibandingkan MP3
2.1.9 Penilaian Kualitas Audio Berikut adalah beberapa parameter yang digunakan untuk menilai kualitas suatu audio. 1. Spectral Balance (Keseimbangan Spektrum) Deskripsi: keakuratan tonal (tonal accuracy) sebuah sistem di seluruh bandwith audio. Penilaian secara keseluruhan ini menentukan apakah sebuah sistem mampu mereproduksi suara/rekaman sebagai sebuah kesatuan utuh perpaduan berbagai ukuran frekwensi; bukan terdengar terpecah-pecah dalam frekuensi individual masing-masing suara yang ada dalam rekaman tersebut 2. Listening Position: Front/ Rear (Posisi Mendengar: Depan/Belakang) Deskripsi: arah panggung suara (dari depan) dan jarak yang ideal antara panggung suara & pendengar; bahwa pendengar mendapat ilusi bahwa panggung suara terletak di depan secara layak. 3. Stage Width: Left/Right (Lebar Panggung Suara: Kiri/Kanan) Deskripsi: Jarak antara batas-batas kiri dan kanan dari panggung suara yang diciptakan. Semakin lebar semakin bagus karena berarti bisa mengakomodir lebih dari 1 posisi dengar ideal. 4. Stage Height: Left to Right/Front to Rear (Tinggi Panggung Suara: Kiri ke Kanan/Depan ke Belakang) Deskripsi: ini tentang ilusi tinggi panggung suara, beserta vertical spread (penyebaran suara secara level horizontal dari garis vertical tinggi panggung tadi). Jadi, jika vocal berada di titik tengah (vertical), maka drum akan berada di belakang vocal (Depan ke Belakang) , gitar akan terasa di samping kanan vocal (Kiri ke Kanan) dan seterusnya. 5. Stage Depth (Kedalaman Panggung Suara) Deskripsi: Ilusi bahwa suara orang atau instrumen seakan berlapis; satu suara ada di depan suara lainnya. 6. Ambience 13
Deskripsi: “perceived
space
around
a
sound
source”. Ini
terminology psycho-acoustic, di mana dalam setiap rekaman sebenarnya terdapat ambient yang bisa melukiskan ruangan saat rekaman berlangsung. 7. Imaging Deskripsi: kemampuan sebuah sistem suara dalam mereproduksi suara setiap instrumen di lokasi tepatnya masing-masing secara proporsional di panggung suara.
2.1.10 Aplikasi Contoh Teknologi Audio Digital : 1) Digital Audiotape : adalah media perekaman yang membentang jurang dua teknologi yaitu antara analog dan digital. Pada satu tangan, menggunakan pita sebagai media perekam, di sisi lain, menyimpan sinyal sebagai data digital dalam
bentuk
nomor
untuk
mewakili
sinyal
audio. Bentuknya seperti compact audio kaset. 2) Compact Disc : a.
High-density compatible digital (HDCD), dimiliki oleh Microsoft, adalah sebuah proses rekaman yang meningkatkan kualitas audio dari compact disc, memberikan hasil akhir yang lebih bisa diterima dari CD audio standar. Dimana memiliki penyaringan yang dapat mengurangi distorsi, gangguan, keakuratan dan suara yang lebih alami.
b. Super Audio CD (SACD). Philips dan Sony telah menghasilkan spesifikasi
alternatif yang disebut Super Audio CD yang menggunakan metode berbeda yaitu pengkodean audio. SACD dirancang untuk tidak bisa dikopi dan membutuhkan player khusus. SACD memiliki kelebihan dibanding CD sebelumnya karena memiliki keakuratan dan kejernihan tingkat tinggi. 3) DVD-Audio: DVD-Audio dirilis pada bulan April 1999. DVD-Audio dapat memberikan stereo berkualitas tinggi daripada CD, dengan tingkat sampling hingga 192 kHz (dibandingkan dengan 44,1 kHz untuk CD). 4) MP3: Adalah singkatan dari MPEG 1 layer 3. MPEG adalah Moving Pictures Experts Group yang merupakan bentuk standar file audio dan video. MP3 merupakan salah satu perkembangan teknologi audio yang masih populer
14
hingga saat ini. MP3 adalah salah satu format berkas pengkodean suara yang mempunyai kompresi yang baik, hal itu menyebabkan ukuran dari berkas it sendiri bisa menjadi lebih kecil. Contoh MP3 adalah Ipod yang akan dibahas setelah ini. 5) Ipod : merupakan pemutar media digital yang diproduksi oleh Apple. Ipod merupakan alat pemutar musik atau lagu-lagu dengan memori besar yang bisa menyimpan ribuan file lagu. Disamping itu, ipod juga memiliki kepraktisan dalam hal ukuran yang kecil, ringan dan mudah dibawa bahkan dikantongi.
6) Podcasting : Podcasting adalah aktifitas merekam suara, biasanya dalam format MP3, lalu di unggah ke internet dan bisa diunduh dan didengarkan oleh siapa saja. Podcasting umumnya dilakukan secara berkala, seperti halnya kita menulis di blog dan siapapun bisa berlangganan secara rutin lewat teknologi feed/rss seperti halnya di blog. 2.2 Pengolahan Sinyal Digital Pada Citra 2.2.1 Pengertian Citra Citra digital merupakan suatu matriks dimana indeks baris dan kolomnya menyatakan suatu titik pada citra tersebut dan elemen matriksnya (yang disebut sebagai elemen gambar/ pixel/ piksel/ pels/ picture element) menyatakan tingkat keabuan pada titik tersebut. Citra digital adalah citra f(x,y) dimana dilakukan diskritisasi koordinat sampling/ spasial dan diskritisasi tingkat kwantisasi (kabuan/ kecemerlangannya). Citra digital merupakan fungsi intensitas cahaya f(x,y), dimana harga x dan harga y adalah koordinat spasial. Harga fungsi tersebut di setiap titik (x,y) merupakan tingkat kecemerlangan citra pada titik tersebut. 2.2.2 Macam-macam Citra Nilai suatu Pixel memiliki nilai dalam rentang tertentu, dari nilai minimum sampai nilai maksimum.Jangkauan yang digunakan berbeda-beda tergantung dari jenis warnanya. Namun secara umum jangkauannya adalah 0 – 255. Citra dengan penggambaran seperti ini digolongkan ke dalam citra integer. Berikut adalah jenisjenis citra berdasarkan nilai Pixel-nya. 1) Citra Biner 15
Pada citra digital dengan tipe biner, setiap piksel pada citra hanya memiliki dua nilai saja yaitu 0 dan 1. Nilai 0 mewakili warna hitam dan nilai 1 mewakili warna putih. Karena hanya memiliki 2 nilai yang mungkin untuk setiap piksel, maka setiap piksel hanya memiliki ukuran 1 bit saja. Citra dengan tipe biner seperti ini akan sangat efisien dalam proses penyimpanannya. Berikut adalah contoh tipe citra biner, dimana warna putih mewakili piksel tepid an warna hitam mewakili latar belakang. 2.) Citra Grayscale Pada citra dengan tipe grayscale, setiap piksel mewakili derajat keabuan dengan nilai antara 0 (hitam) sampai 255 (putih). Pada jangkauan nilai 0 sampai 255 , ini berarti bahwa setiap piksel memiliki ukuran 8 bit atau 1 byte. Berikut adalah contoh citra bertipe grayscale. 3) Citra Digital Bertipe Warna RGB atau True Colour Pada citra dengan tipe RGB, setiap piksel memiliki 3 komponen warna , yaitu merah (R), hijau(G) dan biru (B). Setiap komponen warna memiliki jangkauan nilai antara 0 sampai 255 (8 bit). Hal ini akan memberikan kemungkinan total warna sebanyak 2553 = 16 777 216. Jadi total ukuran bit untuk setiap piksel adalah 24 bit (8 bit R, 8 bit G dan 8 bit B). Citra seperti ini biasanya juga disebut dengan citra warna 24 bit. Berikut adalah contoh dari citra RGB.
2.2.3 Karakteristik Citra Digital 1) Pixel Pixel ( picture element ) adalah sebuah titik yang merupakan elemen paling kecil pada citrasatelit.Angka numerik ( 1 byte ) dari pixel disebut digital number ( DN ). DN bisa ditampilkan dalam waktu kelabu, berkisar antara putih dan hitam ( gray scale ), tergantung level energi yang terdeteksi. Pixel yang disusun dalam order yang benar akan membentuk sebuah citra. Kebanyakan citra satelit yang belum diproses disimpan dalam bentuk gray scale, yang merupakan skala warna dari hitam ke putih dengan derajat keabuan yang bervariasi. 2) Kontras
16
Contrast adalah perbedaan antara brightness relatif antara sebuah benda dengan sekelilingnya pada citra. Sebuah bentuk tertentu mudah terdeteksi apabila pada sebuah citra contrast antara bentuk tersebut dengan backgroundnya tinggi. Teknik pengolahan citra bisa dipakai untuk mempertajam contrast.
2.2.4 Resolusi Citra Resolusi dari sebuah citra adalah karakteristik yang menunjukkan level kedetailan yang dimiliki oleh sebuah citra. Resolusi didefinisikan sebagai area dari permukaan bumi yang diwakili oleh sebuah pixel sebagai elemen terkecil dari sebuah citra. Pada citra satelit pemantau cuaca yang mempunyai resolusi 1 km, masing-masing pixel mewakili rata-rata nilai brightness dari sebuah area berukuran 1×1 km. Bentuk yang lebih kecil dari 1 km susah dikenali melalui image dengan resolusi 1 km. Landsat 7 menghasilkan citra dengan resolusi 30 meter, sehingga jauh lebih banyak detail yang bisa dilihat dibandingkan pada citra satelit dengan resolusi 1 km. Resolusi adalah hal penting yang perlu dipertimbangkan dalam rangka pemilihan citra yang akan digunakan terutama dalam hal aplikasi, waktu, biaya, ketersediaan citra dan fasilitas komputasi.
2.2.5 Ruang Warna (RGB, Greyscale, citra biner) Warna adalah spektrum tertentu yang terdapat di dalam suatu cahaya sempurna (berwarna putih). Nilai warna ditentukan oleh tingkat kecerahan maupun kesuraman warna. Nilai ini dipengaruhi oleh penambahan putih ataupun hitam. Penelitian memperlihatkan bahwa kombinasi warna yang memberikan rentang paling lebar adalah red (R), green (G) dan blue (B). Ketiga warna tersebut merupakan warna pokok yang biasa disebut RGB. Warna lain dapat diperoleh dengan mencampurkan ketiga warna pokok tersebut dengan perbandingan tertentu. Setiap warna pokok mempunyai intensitas sendiri dengan nilai maksimum 255 (8bit). Misal warna kuning merupakan kombinasi warna merah dan hijau sehingga nilai RGB: 255 255 0. 1) RGB disebut juga ruang warna yang dapat divisualisasikan sebagai sebuah kubus seperti gambar 2.4 dengan tiga sumbunya yang mewakili komponen warna merah (red) R, hijau (green) G, biru (blue) B. Salah satu pojok
17
alasnya yang Sistem Klasifikasi Jenis dan Kematangan Buah Tomat Berdasarkan Bentuk dan Ukuran serta Warna Permukaan Kulit Buah Berbasis Pengolahan Citra Digital berlawanan menyatakan warna hitam ketika R = G = B = 0, sedangkan pojok atasnya yang berlawanan menyatakan warna putih ketika R= G= B= 255 ( sistem warna 8 bit bagi setiap
komponennya
).
Pada gambar 2.5 di atas, garis diagonal ruang menyatakan warna grayscale, yakni warna-warna piksel dalam rentang gradasi warna hitam dan putih yang dapat diperoleh dengan mengalikan ketiga komponen warna pokok merah, hijau dan biru dengan suatu koefisien yang jumlahnya satu.
2) Cita Grayscale (skala keabuan) Citra grayscale mempunyai kemungkinan warna hitam untuk nilai minimal dan warna putih untuk nilai maksimal. Banyaknya warna tergantung pada jumlah bit yang disediakan di memori untuk menampung kebutuhan warna tersebut. Semakin besar jumlah bit warna yang disediakan di memori, maka semakin halus gradasi
warna
yang
terbentuk.
Contoh:
skala keabuan 2 bit… jumlah kemungkinan 22 = 4 warna. Jadi, kemungkinan warna 0 (minimal) sampai 4 (maksimal)
3) Citra Biner (Binary Image)
Citra biner (binary image) adalah citra yang hanya mempunyai dua nilai derajat keabuan yaitu hitam dan putih. Alasan masih digunakannya citra biner dalam pengolahan citra digital hingga saat ini adalah algoritma untuk citra biner
18
telah berkembang dengan baik dan waktu pemrosesan lebih cepat karena jumlah bit untuk
tiap
pikselnya
lebih
sedikit.
2.2.6 Preprocessing Citra Secara umum, langkah-langkah dalam pengolahan citra dapat dijabarkan menjadi beberapa langkah. 1. Akusisi citra Akuisisi citra adalah tahap awal untuk mendapatkan citra digital. Tujuan akuisisi citra adalah untuk menentukan data yang diperlukan dan memilih metode perekaman citra digital. Tahap ini dimulai dari objek yang akan diambil gambarnya, persiapan
alat-alat,
sampai
pada
pencitraan.
Pencitraan adalah
kegiatan
transformasi dari citra tampak(foto, gambar, lukisan, patung,pemandangan dan lain-lain) menjadi citra digital. Beberapa alat yang dapat digunakan untuk pencitraan adalah : a) Video kamera, kamera digital ataupun kamera konvensional. b) Scanner c) Photo sinar-X / infra merah 2. Peningkatan kualitas citra Pada tahap ini dikenal dengan pre-processing dimana dalam meningkatkan kualitas citra dapat meningkatkan kemungkinan dalam keberhasilan pada tahap pengolahan citra digital berikutnya. Hal-hal penting yang dilakukan pada tingkatan ini diantaranya adalah : a) Peningkatan Kualitas (Kontras, brightness, dan lain-lain) b) Menghilangkan noise c) Perbaikan citra d) Transformasi e) Menentukan bagian Citra yang akan diobservasi
19
3. Segmentasi citra Tahapan ini bertujuan untuk mempartisi citra menjadi bagian-bagian pokok yang mengandung informasi penting. Misalnya, memisahkan objek dan latarbelakang Segmentasi terdiri dari downsampling, penapisan dan deteksi tepian. 4. Representasi dan Uraian Dalam
hal
ini
representasi
merupakan
suatu
proses
untuk
merepresentasikansuatu wilayah sebagai suatu daftar titik-titik koordinat dalam kurva tertutup,dengan dekripsi luasan atau perimeternya. Setelah suatu wilayah dapatdirepresentasi, proses selanjutnya adalah melakukan deskripsi citra dengan cara seleksi ciri dan ekstrasi ciri (feature extraction and selection). Seleksi ciri bertujuan untuk memilih informasi kuantitatif dari cirri yang ada, yang dapatmembedakan kelas-kelas objek secara baik, sedangkan ekstrasi ciri bertujuanuntuk mengukur besaran kuantitatif ciri setiap piksel, misalnya ratarata,standar deviasi, koefisien variasi, SignaltoNoise ratio (SNR), dan lain-lain. 5. Pengenalan dan Interpretasi Pengenalan pola tidak hanya bertujuan untuk mendapatkan citra dengan suatu kualitas tertentu, tetapi juga untuk mengklasifikasikan bermacam-macam citra, memberi label pada sebuah objek yang informasinya disediakan oleh descriptor . Dari sejumlah citra diolah sehingga citra dengan ciri yang sama akan dikelompokkan pada suatu kelompok tertentu. Interpretasi meliputi penekanan dalam mengartikan objek yang dikenali.
2.2.7 Kompresi Citra (lossless, lossy) Sebuah citra diubah ke bentuk digital agar dapat disimpan dalam memori komputer atau media lain. Proses mengubah citra ke bentuk digital bisa dilakukan dengan beberapa perangkat, misalnya scanner, kamera digital, dan handycam. Ketika sebuah citra sudah diubah ke dalam bentuk digital (selanjutnya disebut citra digital), bermacam-macam proses pengolahan citra dapat diperlakukan terhadap citra tersebut. Ada dua tipe pada kompresi data, yaitu 1. Kompresi tipe lossless.
20
Kompresi tipe lossless Adalah kompresi yang tidak menghilangkan informasi setelah kompresi terjadi, akibatnya kualitas citra hasil kompresi tidak menurun. Beberapa ciri dari kompresi lossless : a. Teknik kompresi citra dimana tidak ada satupun informasi citra yang dihilangkan. b. Biasa digunakan pada citra medis. c. Metode loseless: Run Length Encoding, Entropy Encoding (Huffman, Aritmatik), dan Adaptive Dictionary Based (LZW). Beberapa teknik loseless: 1) Color reduction: untuk warna-warna tertentu yang mayoritas dimana informasi warna disimpan dalam color palette. 2) Chroma subsampling: teknik yang memanfaatkan fakta bahwa mata manusia merasa brightness (luminance) lebih berpengaruh daripada warna (chrominance) itu sendiri, maka dilakukan pengurangan resolusi warna dengan disampling ulang. Biasanya digunakan pada sinyal YUV. Chorma Subsampling terdiri dari 3 komponen: Y (luminance) : U (CBlue) : V (CRed) 3) Transform coding: menggunakan Fourier Transform seperti DCT. – Fractal Compression: adalah suatu metode lossy untuk mengkompresi citra dengan menggunakan kurva fractal. Sangat cocok untuk citra natural seperti pepohonan, pakis, pegunungan, dan awan. – Fractal Compression bersandar pada fakta bahwa dalam sebuah image, terdapat bagian-bagian image yang menyerupai bagian bagian image yang lain. – Proses kompresi Fractal lebih lambat daripada JPEG sedangkan proses dekompresinya sama. 2. Kompresi tipe lossy Adalah kompresi dimana terdapat data yang hilang selama proses kompresi, akibatnya kualitas data yang dihasilkan jauh lebih rendah daripada kualitas data asli. Beberapa ciri dari kompresi lossy :
21
a. Ukuran file citra menjadi lebih kecil dengan menghilangkan beberapa informasi dalam citra asli. b. Teknik ini mengubah detail dan warna pada file citra menjadi lebih sederhana tanpa terlihat perbedaan yang mencolok dalam pandangan manusia, sehingga ukurannya menjadi lebih kecil. c. Biasanya digunakan pada citra foto atau image lain yang tidak terlalu memerlukan detail citra, dimana kehilangan bit rate foto tidak berpengaruh pada citra. 2.2.8 Tujuan Compresi Citra Pemampatan citra bertujuan meminimalkan kebutuhan memori untuk merepresentasikan citra digital dengan mengurangi duplikasi data di dalam citra sehingga memori yang dibutuhkan menjadi lebih sedikit daripada representasi citra semula.
2.2.9 Kriteria Kompresi (waktu, memori, MSE, PSNR) Kriteria Mengukur Metode Kompresi Citra 1) Waktu kompresi dan waktu rekronstruksi yang sebaiknya cepat. 2) Kebutuhan memori Memori yang dibutuhkan untuk merepresentasikan citra seharusnya berkurang secara berarti. Teknik kompresi dikatakan baik apabila didapatkan rasio kompresi yang besar, karena semakin besar rasio kompresi yang didapat berarti semakin kecil ukuran hasil kompresi. Pada beberapa metode, ukuran memori hasil kompresi bergantung pada citra itu sendiri. Citra yang mengandung banyak elemen duplikasi (misalnya citra langit cerah tanpa awan, citra lantai keramik) umumnya berhasil dikompresikan dengan memori yang lebih sedikit dibandingkan dengan mengkompresikan citra yang mengandung banyak objek (misalnya citra pemandangan alam). 3) Kualitas kompresi (fidelity) Informasi yang hilang akibat kompresi seharusnya seminimal mungkin sehingga kualitas hasil kompresi tetap dipertahankan. Kualitas hasil kompresi dengan kebutuhan memori biasanya berbanding terbalik. Kualitas sebuah citra bersifat subyektif dan relatif, bergantung pada pengamatan orang yang menilainya.
22
Dan untuk dapat membuat ukuran kualitas hasil kompresi citra menjadi ukuran kuantitatif dengan menggunakan besaran PSNR (Peak Signal to Noise Ratio). Teknik kompresi dikatakan baik apabila menghasilkan nilai MSE yang kecil dan nilai PSNR yang tinggi yang berarti error atau kesalahan dari teknik kompresi ini sangat kecil dan hasil citra rekonstruksi terhadap citra asli mempunyai kemiripan yang tinggi. Sedangkan nilai rasio sinyal terhadap derau puncak atau nilai PNSR dalam dicibels (dB) dapat dihitung dari persamaan
2.2.10 Contoh Perhitungan Kompresi Citra metode yang digunakan adalah metode huffman, bisa dilihat pada contoh kasus berikut bagaimana sebenarnya metode huffman bekerja. Misalnya kita memiliki citra dalam matrix sebagai berikut
Kita kelompkkan yang memiliki nilai yang sama : 222 3333 444 555555 Ada sebanyak 16 karakter, berarti memory yang dibutuhkan sebelum dikompresi adalah : 16 x 8 bit = 128 bit. Selanjutnya kita akan mencari Huffman tree, pertama yang kita lakukan adalah memberi kode nilai
Selanjutnya mencari root dengan cara binary.
23
root telah didapat, selanjutnya mencari Huffman Tree
Selanjutnya kita akan mencari bit dari Huffman Tree yang baru kita buat
Dengan tabel di atas kita bisa lihat bahwa karakter 5 tinggal membutuh 1, 3 membutuhkan 2 bit. 4 membutuhkan 4 bit. sekarang kita akan hitung tempat yang dibutuhkan setelah dikompresi.
Ukuran citra = 3*3 + 4*2 + 3*4 + 6*1 = 9 + 8 + 12 + 6 = 35 bit berarti citra setelah dikompresi tinggal 35 bit. bisa dilihat perbandinganya saat sebelum dikompres, dibutuhkan tempat penyimpanan sebanya 128 bit, tetapi setelah dikompresi tinggal 35 bit saja. sekarang kita akan menghitung hasil
24
kompresi citra
Hasil Kompresi = ((nilai awal - nilai akhir) / nilai awal ) * 100% = ((12835)/128)*100=72,65 %
2.2.11 Metode Kompresi ( LZW, Packbits, deflate ) Kompresi data (pemampatan data) merupakan suatu teknik untuk memperkecil jumlah ukuran data (hasil kompresi) dari data aslinya. Pemampatan data digunakan untuk mengurangkan jumlah bit-bit yang dihasilkan dari setiap simbol yang muncul. Algoritma Lempel Ziv Welch (LZW) Algoritma LZW dikembangkan dari metode kompresi yang dibuat oleh Ziv dan Lempel pada tahun 1977. algoritma ini melakukan kompresi dengan menggunakan dictionary. Pendekatan ini bersifat adaptif dan efektif. Prinsip kompresi tercapai jika referensi dalam bentuk pointer dapat disimpan dalam jumlah bit yang lebih sedikit dibandingkan string aslinya. Lempel-Ziv (LZ) metode kompresi adalah salah satu algoritma paling populer untuk penyimpanan lossless. 1. Deflate Deflate ataumengempis adalah variasi LZ yang dioptimalkan untuk kecepatan dekompresi dan rasio kompresi, sehingga kompresi ini bisa lambat. Deflate digunakan dalam PkZip , gzip dan PNG . 2. Packbits encoding (Run-length encoding) a) Kompresi
data paling sederhana dan digunakan pada awal penggunaan
kompresi. b) Digunakan untuk kompresi image hitam-putih (binary). c) String karakter yang berulang menempati dua byte: d) Byte pertama berisi jumlah dari banyaknya perulangan dan Byte kedua berisi
karakter itu sendiri e) Dilakukan pada satu baris (atau scanline), dan tidak digunakan pada baris yang mempunyai jumlah scanline banyak. f) Byte lebih besar dari pada byte image asli.
25
2.2.12 Format Citra jenis-jenis format citra diantaranya yaitu: 1. JPEG (.jpg) JPEG atau Joint Photographic Experts Group adalah format gambar yang banyak digunakan untuk menyimpan gambar-gambar dengan ukuran lebih kecil. Ada beberapa karakteristik gambar dalam JPEG yang tentu kita tahu pasti memiliki ekstensi .jpg atau .jpeg. Selain itu JPEG juga mampu menayangkan warna dengan kedalaman 24-bit true color. Mengkompresi gambar dengan sifat lossy. Dan umumnya digunakan untuk menyimpan gambar-gambar hasil foto. Ukuran file JPEG biasanya lebih besar daripada GIF. 2. GIF (.gif) Jenis file gambar ini sering kita jumpai dan sering kita Pakai, Salah satu ciri khas tipe gambar berekstensi GIF adalah bisa memainkan animasi gambar sederhana. Beberapa karakteristik lain format gambar GIF adalah mampu menayangkan maksimum sebanyak 256 warna karena format GIF menggunakan 8bit untuk setiap pixel-nya. Selain itu GIF juga mampu mengkompresi gambar dengan sifat lossless dan mendukung warna transparan. File GIF digunakan untuk mengkompresi file asli sampai dengan 256 warna. Karena sangat tidak mungkin menggunakan file asli untuk ditampilkan ke web mengingat ukuran file asli (dalam bentuk bitmap) yang besar. File GIF bisa menghasilkan baik gambar statis maupun dinamis (animasi). 3. PNG (.png) PNG atau Portable Network Graphics adalah salah satu format penyimpanan
citra
yang
menggunakan
metode
pemadatan
yang
tidak
menghilangkan bagian dari citra tersebut. Secara umum PNG dipakai untuk Citra Web. Citra dengan format PNG mempunyai faktor kompresi yang lebih baik dibandingkan dengan GIF (5%-25% lebih baik dibanding format GIF). File PNG bisa bekerja baik pada gambar dengan pemisahan warna jelas maupun bergradasi. 4. TIFF (.tif , .tiff) TIFF (Tagged Image File Format) adalah format yang fleksibel yang biasanya disimpan sebagai 8 bits atau 16 bits per warna (merah, hijau, biru) untuk 24-bit dan total 48-bit, masing-masing, menggunakan nama file TIFF atau TIF.
26
TIFF adalah lossy dan lossless, sebagian menawarkan kompresi lossless yang baik untuk citra bi-level (hitam&putih). Beberapa kamera digital bisa menyimpan dengan format TIFF, menggunakan algoritma kompresi LZW untuk penyimpanan lossless. 5. RAW RAW ditujukan untuk format citra raw yang tersedia secara opsional di beberapa kamera digita. Format ini biasanya kompresi lossless atau nearly-lossless, dan menghasilkan file yang lebih keci dari format TIFF dari proses penuh sebuah kamera digital. Format raw tidak distandarisasi atau didokumentasi, dan berbedabeda di antara berbagai perusahaan pembuat kamera. Banyak program grafik dan editor citra mungkin tidak menerima sebagian format ini, dan format-format lama telah dihentikan penggunaannya. 6. BMP (.bmp) File format BMP (Windows bitmap) menangani file grafik di sistem
operasi Microsoft Windows. Umumya, file BMP tidak dikompresi, maka ukurannya besar. Keuntungannya adalah kesederhanaannya, diterima luas, dan dikenali program-progam Windows. Biasanya digunakan oleh aplikasi dan system operasi Microsoft Windows. Merupakan kompresi tipe lossless. 7. PBM PBM kepanjangan dari Portable Bitmap Format. Merupakan format citra hitam-putih yang sederhana. PBM memerlukan satu bit tiap pixel. Tidak seperti format citra lainnya, format PBM merupakan plain text yang bisa diolah dengan menggunakan pengolah teks. Format PBM merupakan bagian dari PNM (Portable Pixmap File Format). 8. PGM PGM kepanjangan dari Portable Graymap Format. Merupakan format citra abu-abu yang sederhana. Format PGM memerlukan delapan bit tiap pixel. PGM merupakan citra mentah dengan kompresi tipe lossless. Format PGM merupakan bagian dari PNM (Portable Pixmap File Format) 9. PPM PPM kepanjangan dari Portable Pixmap Format. Merupakan format citra berwarna yang sederhana. PPM memerlukan 24 bit tiap pixel. PPM merupakan citra
27
mentah dengan kompresi tipe lossless. Format PPM merupakan bagian dari PNM (Portable Pixmap File Format). 10. PORTABLE IMAGE FILE FORMAT Format ini memiliki bagian diantarannya adalah portable bitmap, portable graymap, portable pixmap, dan portable network map dengan format berturut-turut adalah .pbm, .pgm, .ppm dan .pnm. Format ini baik digunakan untuk menyimpan dan membaca kembali data citra. 11. CGM CGM (Computer
Graphics
Metafile) adalah
format
file
untuk grafik
vektor 2D, grafik raster, dan text, dan didefinisikan oleh ISO/IEC 8632. semua
elemen grafisl bisa dispesifikasikan di source file tekstual yang bisa di-compile menjadi file binary atau satu diantara dua representasi. CGM menyediakan fungsi pertukaran data grafis untuk representasi komputer dari informasi grafis 2D yang tidak tergantung aplikasi apa pun, sistem, platform, atau peralatan. Standar ini telah di adopsi di area ilustrasi teknis dan desain profesional, tetapi telah diambil alih oleh format SVG dan DXF. 12. PCX PCX adalah format gambar yang aslinya diciptakan untuk PC Paintbrush (PCX = "Personal Computer eXchange"). Sebuah file PCX adalah format file berbentuk raster, kepala filenya menyimpan informasi tentang perangkat keras monitor (resolusi layar, kedalaman warna, informasi palet, jumlah bit dst.) secara terpisah dari gambarnya. Hal ini membuat file PCX dapat dipindahkan dan dibuka di perangkat komputer lain dengan perangkat keras yang berbeda. Sebuah file PCX biasanya dapat menyimpan gambar-gambar dengan indeks palet 2 hingga 4 bit dan 16 hingga 256 warna, namun sekarang telah ditambah untuk menyimpan gambargambar true color (24-bit). 13. MPEG (.mpg) Format ini digunakan di dunia internet dan diperuntukkan sebagai format penyimpanan citra bergerak (video). Format ini mendukung video dengan kompresi ber-rugi. 14. POSTSCRIPT (.ps, .eps, .epfs)
28
Format ini diperkenalkan sebagai format untuk menyimpan citra buku elektronik . Dalam format ini, citra dipresentasikan kedalam deret nilai decimal atau hexadecimal yang dikodekan ke dalam ASCII. 15. RGB(.rgb) Format ini menggunakan format penyimpanan citra yang dibuat oleh silicon graphics untuk menyimpan citra berwarna. 16. RAS (.ras) Format .ras digunakan untuk menyimpan citra dengan format RGB tanpa kompresi.
2.3 Filter Suara 2.3.1
Sinyal Ucapan
Sinyal ucapan merupakan sinyal yang berubah terhadap waktu dengan kecepatan perubahan yang relatif lambat. Jika diamati pada selang waktu yang pendek (antara 5 sampai dengan 100 mili detik), karakteristiknya praktis bersifat tetap; tetapi jika diamati pada selang waktu yang lebih panjang karakteristiknya terlihat berubah-ubah sesuai dengan kalimat yang sedang diucapkan.
2.3.2
Jenis-jenis Ucapan
1. Vokal
Sinyal ucapan vokal memiliki bentuk kuasi periodik. Setiap vokal mempunyai komponen frekuensi tertentu yang membedakan karakter satu fonem vokal dengan fonem vokal lainnya. Fonem vokal Bahasa Inggris mencakup fonem-fonem /IY/, /IH/, /EH/, /AE/, /AA/, /ER/, /AH/, /AX/, /AO/, /UW/, /UH/, dan /OW/. 2. Diftong Diftong pada prinsipnya adalah dua fonem vokal yang berurutan dan diucapkan tanpa jeda. Fonem diftong Bahasa Inggris mencakup /AY/, /OY/, /AW/, dan /EY/. Karakteristik diftong mirip dengan karakteristik fonem-fonem vokal pembentuknya disertasi bentuk transisinya. 3.
Konsonan Nasal Konsonan nasal dibangkitkan dengan eksitasi glotal dan vocal tract mengerut
total pada beberapa titik tertentu sepanjang lintasan pengucapan. Bagian belakang
29
langit-langit merendah, sehingga udara mengalir melalui nasal tract dengan suara yang dipancarkan melalui lubang hidung. Konsonan nasal Bahasa Inggris adalah /M/, /N/, dan /NX/. 4.
Konsonan Frikatif Konsonen frikatif pada prinsipnya dapat dibedakan menjadi frikatif unvoiced
serta voiced. Fonem Bahasa Inggris yang termasuk frikatif unvoiced adalah /F/, /TH/, /S/, dan /SH/, sedangkan yang termasuk frikatif voiced adalah /V/, /Z/, dan /ZH/. 5. Konsonan Stop Seperti konsonan frikatif, konsonen stop dapat dibedakan menjadi konsonan stop unvoiced serta voiced. Konsonan stop memiliki bentuk yang berbeda dengan konsonan konsonan lainnya. Konsonan ini memperlihatkan pola transient dan tidak kontinyu. Konsonan ini dibentuk dengan cara memberikan tekanan pada kondisi pengerutan total di bagian rongga mulut tertentu, dan segera diikuti dengan pelemasan. Untuk fonem /B/ pengerutan terjadi di bibir, untuk fonem /D/ pengerutan terjadi di belakang gigi depan, sedangkan untuk fonem /G/ pengerutan terjadi di sekitar bagian belakang langit-langit. Selama perioda total pengerutan terjadi, tidak ada suara yang dikeluarkan dari mulut, sehingga fonem ini selalu mengandung bagian yang menyerupai silence. Fonem Bahasa Inggris yang termasuk konsonan stop unvoiced adalah /P/, /T/, dan /K/, sedangkan yang termasuk konsonan stop voiced adalah /B/, /D/, dan /G/.
2.3.3
Jenis-jenis Derau
1. Correlated noise: hubungan antara sinyal dan noise masuk dalam kategori ini. Karena itu, correlated noise hanya muncul saat ada sinyal. 2. Uncorrelated noise: noise yang dapat muncul kapanpun, saat terdapat sinyal maupun tidak ada sinyal. Uncorrelated noise muncul tanpa memperhatikan adanya sinyal atau tidak. Noise dalam kategori ini dapat dibagi lagi menjadi dua kategori umum, yaitu : a. Eksternal Noise: Adalah noise yang dihasilkan dari luar alat atau sirkuit. Noise
tidak
disebabkan
oleh komponen alat
dalam sistem
komunikasi tersebut.
30
b. Internal Noise:Internal noise juga menjadi faktor yang penting dalam sistem komunikasi. Internal noise adalah gangguan elektris yang dihasilkan alat atau sirkuit. Noise muncul berasal dari komponen alat dalam sistem komunikasi bersangkutan. 2.3.4 Speech Enhancement Peningkatan tuturan bertujuan untuk meningkatkan kualitas ucapan dengan menggunakan berbagai algoritma. Tujuan peningkatan adalah peningkatan kualitas kejelasan dan / atau keseluruhan persepsi persepsi sinyal terdegradasi dengan menggunakan teknik pemrosesan sinyal audio . Peningkatan pidato yang terdegradasi oleh kebisingan, atau pengurangan kebisingan, adalah bidang peningkatan bicara yang paling penting, dan digunakan untuk banyak aplikasi seperti telepon
genggam , VoIP , sistem
telekonferensi , pengenalan
suara ,
dan alat bantu dengar
2.3.5
Pengertian Filter Suara Filter merupakan suatu sistem yang mempunyai fungsi transfer tertentu
untuk meloloskan sinyal masukan pada frekuensi - frekuensi tertentu dan menyaring / memblokir / melemahkan sinyal masukan pada frekuensi- frekuensi yang lain.
2.3.6 Klasifikasi Filter Filter dapat diklasifikasikan menjadi : 1. Filter analog : sinyal masukan berupa sinyal analog, pada filter analog dapat dibagi menjadi dua yaitu : a. Filter pasif : filter yang hanya disusun komponen tahanan, induktor dan kapasitor. b. Filter aktif : filter yang disusun komponen op amp atau transistor ditambah tahanan, induktor, dan kapasitor. 2. Filter digital : sinyal masukan berupa sinyal diskrit, dibedakan menjadi dua yaitu : a. Fixed Filter
31
b. Adaptive Filter : Merubah nilai – nilai koefisien berdasarkan input. Dua jenis algoritma adaptif: Least mean Square (LMS) dan Recursive least Square (RLS). LMS algoritma didasarkan pada pencarian gradien tipe untuk melacak karakteristik sinyal waktu bervariasi. Algoritma RLS menyediakan konvergensi yang lebih cepat dan pelacakan yang lebih baik dari statistik sinyal varian waktu-dari LMS algoritma, tetapi komputasi yang lebih kompleks. Berdasarkan respon impuls, filter digital terbagi menjadi :
FIR (Finite Impulse Response)
IIR (Infinite Impulse Response )
2.3.7 Jenis Filter Digital (LMS, NLMS) Filter digital adalah semua filter elektronik yang bekerja dengan menerapkan operasi matematika digital atau algoritma pada suatu pemrosesan sinyal. Salah satu batasan utama pada filter digital adalah dalam hal keterbatasan kecepatan pemrosesan/waktu komputasi yang sangat tergantung dengan kemampuan mikrokontroler atau komputer yang digunakan. Jenis-jenis filter digital yaitu 1) LMS ( least mean square) Algoritma RLS menyediakan konvergensi yang lebih cepat dan pelacakan yang lebih baik dari statistik sinyal varian waktu-dari LMS algoritma, tetapi komputasi yang lebih kompleks. 2) NLMS adalah bentuk lain dari algoritma LMS, yang menggunakan nilai
stepsize μ(n) yang berbeda untuk setiap iterasinya. 2.3.8
Algoritma Filter (LMS, NLMS)
1) Algoritma LMS Algoritma LMS merupakan algoritma yang sangat populer dan sangat sederhana serta dapat digunakan untuk beberapa aplikasi pemrosesan sinyal, antara lain masalah penghapusan derau, gema, dan interferensi. Penelitian ini menggunakan metode algoritma LMS (Least Mean Square) untuk Filter Finite Impulse Response (FIR). Algoritma LMS seringkali digunakan untuk beberapa aplikasi yang berbeda pada pemrosesan sinyal adaptif. Ada beberapa alasan yang
32
mendasari hal tersebut, antara lain: komputasi yang mudah dan sederhana, tidak ada pengulangan data, dan tanpa peramalan gradien. 2) NLMS adalah bentuk lain dari algoritma LMS, yang menggunakan nilai stepsize μ(n) yang berbeda untuk setiap iterasinya. Nilai μ(n) ini berbanding terbalik dengan nilai energi total dari sinyal masukan x(n). Algoritma NLMS dapat dituliskan sebagai berikut. 1. Menghitung keluaran dari tapis adaptif.
2. Menghitung galat.
33
BAB III PENUTUP 2.1 Simpulan 1. Audio adalah suara atau bunyi yang dihasilkan oleh getaran suatu benda pada rentang frekuensi pendengaran manusia (20 Hz – 20 kHz). Penilaian kualitas audio tergantung pada tingkat kejernihan dan visualisasi letak sumber suara 2. Citra adalah suatu representasi (gambaran), kemiripan, atau imitasi dari suatu objek. Citra terbagi 2 yaitu ada citra yang bersifat analog dan ada citra yang bersifat digital. Setiap citra memiliki ukuran dan resolusi yang berbeda- beda. 3. Sinyal ucapan merupakan sinyal yang berubah terhadap waktu dengan kecepatan perubahan yang relatif lambat. Jika diamati pada selang waktu yang pendek (antara 5 sampai dengan 100 mili detik), karakteristiknya praktis bersifat tetap; tetapi jika diamati pada selang waktu yang lebih panjang karakteristiknya terlihat berubah-ubah sesuai dengan kalimat yang sedang diucapkan.
34
DAFTAR PUSTAKA
http://r1fai.blogspot.co.id/2012/04/langkah-langkah-penting-dalam.html, diakses tanggal 20 jam 21.30 WIB. http://elektronika-dasar.web.id/definisi-dan-jenis-filter-digital/, diakses tanggal 20 jam 21.10 WIB.
http://ilmu27.blogspot.co.id/2012/08/makalah-multimedia-audio.html, diakses tanggal 20 jam 21.20 WIB.
http://saputra2503.blogspot.co.id/2015/08/makalah-audio.html, diakses tanggal 20 jam 21.27 WIB.
http://daily-tekno.blogspot.co.id/2016/10/pengertian-audio-dan-jenis-jenisaudio.html, diakses tanggal 20 jam 21.40 WIB.
https://en.wikipedia.org/wiki/Multichannel_audio, diakses tanggal 20 jam 21.35 WIB.
http://agfi.staff.ugm.ac.id/blog/index.php/2008/12/pemisahan-derau-dansuara-speech-noise-reduction/, diakses tanggal 20 jam 21.45 WIB.
http://gugum08.blogspot.co.id/2013/02/pengertian-suara.html, diakses tanggal 20 jam 20.47 WIB.
35
http://www.e-jurnal.com/2013/12/pengertian-suara-dan-jenis-jenisnya.html, diakses tanggal 20 jam 20.55 WIB.
36