KATA PENGANTAR
Rasa syukur yang dalam kami sampaikan ke hadiran Tuhan Yang Maha Pemurah, karena berkat kemurahanNya makalah ini dapat kami selesaikan sesuai yang diharapkan.Dalam makalah ini kami membahas “Computer Vision” yang merupakan salah satu bagian dari kecerdasan buatan. Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision) yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki kemmpuan tingkat tinggi sebagaiman human visual. Serta kesempatan dari dosen pembimbing mata kuliah Kecerdasan Buatan.Makalah ini dibuat dalam rangka tugas kelompok yang diberikan.
Demikian makalah ini saya buat semoga bermanfaat,
Padang, 20 Mei 2011
penulis
BAB I PENDAHULUAN Kecerdasan buatan adalah kemampuan komputer untuk berpikir dengan intelegensia. Ini tercapai dengan mempelajari bagaimana manusia mengingat dan berpikir ketika sedang mengambil keputusan dan memecahkan masalah. Kemampuan komputer memproses bahasa dasar adalah salah satu contoh dari kecerdasan buatan. Apabila dulu kita harus mempelajari perintah-perintah tertentu untuk berkomunikasi dengan komputer, sekarang ini kita sudah tidak perlu lagi untuk mempelajarinya. Hal ini dikarenakan komputer sekarang sudah dilengkapi dengan kemampuan untuk memahami bahasa kita, sehingga kita dapat lebih mudah untuk berkomunikasi dengan komputer. Kecerdasan buatan yang dibangun mempunyai beberapa komponen yang saling berhubungan untuk membangun sistem yaitu basis pengetahuan, mesin inferensi, antarmuka pemakai. Persoalan yang dipecahkan dalam sistem ini adalah bagaimana cara menyusun aturan yang terdiri atas beberapa premis dan konklusi dari fakta-fakta yang tersedia, sehingga dihasilkan suatu solusi, dengan menggunakan mesin inferensi. Kecerdasan buatan lain yang memudahkan interaksi kita dengan computer adalah kemampuan untuk mengenali cara berbicara atau kata-kata yang digunakan oleh manusia. Kita hanya perlu untuk mengucapkan perintah secara lisan kepada computer untuk melakukan suatu program, daripada dengan cara biasa yaitu dengan mengetiknya, dan nantinya computer juga akan balik menjawab perintah tersebut Kemampuan ini juga dapat dihubungkan dengan computer vision, sebagai contoh sebuah sistem pengenal karakter optikal (OCR), yang susunan dari OCR dapat mengenali kalimat dari dokumen yang telah dicetak. Komputer juga sekarang telah dilengkapi dengan sistem ahli, yang merupakan penasihat dasar dari sebuah computer, sehingga computer dapat membantu dalam bidang medis, pabrik, dan bidang-bidang lain. Inti dari sistem ahli ini adalah pengetahuan yang berasal dari pengalaman manusia. Sumber penambahan informasi dapat mencakup buku dan dokumen lain. Kecerdasan buatan yang lainnya adalah gambar computer. Gambar computer diartikan sebagai sebuah gambar yang diambil dengan menggunakan kamera yang kemudian diolah di computer (image analysis). Dalam hal ini, kamera dan computer merupakan alat yang memiliki fungsi yang sama seperti fungsi mata dan otak manusia. Bagian dari artificial intelligent ini adalah computer vision yang dapat menganalisis dan mengolah pencitraan visual dengan
menggunakan computer. Selain OCR dan image analysis, ada begitu banyak implementasi dari computer vision ini seperti image recognition, eye recognition maupun face recognition. Implementasi dari computer vision ini memberikan banyak manfaat bagi manusia di berbagai bidang. Karena kecerdasan buatan itu sesuatu yang diciptakan oleh manusia, untuk menggantikan manusia yang tentunya bermanfaat bagi manusia. Jadi bisa jadi kecerdasan buatan itu merupakan suatu ancaman. Walau pun menyadari bahwa kecerdasan buatan bisa jadi adalah suatu ancaman untuk manusia, tapi manusia masih saja mengembangkan apa yang disebut dengan kecerdasan buatan. Manusia masih saja mencoba mengembangkan/mendapatkan sesuatu (teknologi) yang baru, yang dapat berpikir seperti manusia. Hal ini terjadi karena adanya ketidakpuasan dalam diri manusia, manusia ingin mendapatkan sesuatu dengan cara yang lebih mudah. Walaupun terasa sangat futuristik dan terlihat berbahaya, karena mesin nantinya akan memiliki kecerdasan dan emosi, para pakar AI menganggap pengembangan disiplin ilmu ini penting karena bisa diterapkan di Internet nantinya. Pada intinya, sistem Computer Vision memudahkan manusia untuk melihat visualisasi atau gambar atas suatu hal yang sulit dijangkau. Dan gambar tersebut dapat dilihat melalui komputer untuk dianalisa. Contoh penggunaanya adalah pada dunia astronomi. Misalnya untuk melihat permukaan di planet Mars. Berdasarkan analisis dan intepretasi yang dilakukan oleh sistem ini, komputer dapat mengidentifikasi dan menghindari bahaya secara otomatis. Seperti halnya mengamati meteor yang beredar di sekitar bumi, apakah akan menabrak bumi atau tidak, gambaranya dapat dilihat melalui sistem ini.
BAB II ISI MAKALAH
A. Pengertian Komputer Vision Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision) yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki kemmpuan tingkat tinggi sebagaiman human visual. Kemampuan itu diantaranya adalah: •
Object detection → Apakah sebuah objek ada pada scene? Jika begiru, dimana batasanbatasannya..?
•
Recognation → Menempatkan label pada objek.
•
Description → Menugaskan properti kepada objek.
•
3D Inference → Menafsirkan adegan 3D dari 2D yang dilihat.
•
Interpreting motion → Menafsirkan gerakan. Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan yang
mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi. Cabang ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu menghasilkan sistem intelijen visual (Visual Intelligence System). Computer Vision adalah kombinasi antara Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya dapat dilihat pada gambar 1. Pengolahan citra merupakan proses awal dari computer vision, sedangkan pengenalan pola merupakan proses menginterpretasikan citra.
B. Proses dalam Computer Vision Untuk menunjang tugas computer vision, maka terdapat beberapa fungsi pendukung ke dalam sistem ini, antara lain : •
Proses penangkapan citra/gambar (image acquisition)
•
Proses pengolahan citra (image processing)
•
Analisa data citra (image analysis)
•
Proses pemahaman data citra (image understanding)
Proses-proses dalam Computer Vision : 1. Image Acqusition •
Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik, sedangkan amplitude berkaitan dengan tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.
•
Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya dan membaginya menjadi ratusan garis horizontal yang sama.
•
Tiap‐tiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.
•
Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analog‐to‐digital converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer.
•
ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk informasi sinyal
•
tunggal ke dalam sebuah aliran (stream) sejumlah bilangan biner.
•
Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data raw yang akan diproses.
2. Image Processing •
Tahapan berikutnya computer vision akan melibatkan sejumlah manipulasi utama (initial manipulation) dari data binary tersebut.
•
Image processing membantu peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan di olah lebih jauh secara lebih efisien.
•
Image processing akan meningkatkan perbandingan sinyal terhadap noise (signal‐ to‐noise ratio = s/n).
•
Sinyal‐sinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada dalam image.
•
Sedangkan noise adalah segala bentuk interferensi, kekurang pengaburan, yang terjadi pada sebuah objek.
3. Image Analysis •
Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari objek melalui suatu proses investigasi.
•
Sebuah program komputer akan mulai melihat melalui bilangan biner yang merepresentasikan informasi visual untuk mengidentifikasi fitur‐fitur spesifik dan karekteristiknya.
•
Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas‐ batasan objek dalam image.
•
Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua objek yang spesifik.
•
Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang berbeda dengan salah satu batasnya.
4. Image Understanding •
Ini adalah langkah terakhir dalam proses computer vision, yang mana sprsifik objek dan hubungannya di identifikasi.
•
Pada bagian ini akan melibatkan kajian tentang teknik-teknik artificial intelligent.
•
Understanding berkaitan dengn template matching yang ada dalam sebuah scene.
•
Metoda ini menggunakan program pencarian (search program)dan teknik penyesuaian pola (pattern matching techniques). Beberapa aplikasi yang dihasilkan dari Computer Vision antara lain :
1. Robotic – navigation and control 2. Medical Image Analysis – measurement and interpretation of many types of images 3. Industrial Inspection – measurement, fault checking, process control 4. Optical Character Recognition – text reading 5. Remote Sensing – land use and environmental monitoring 6. Psychology, AI – exploring representation and computation in natural vision
Gambar1. Hubungan Antara Computer Vision, Pengolahan Citra, dan Pengenalan Pola
Pengolahan Citra (Image Processing) merupakan bidang yang berhubungan dengan proses transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra yang lebih baik. Sedangkan Pengenalan Pola (Pattern Recognition) berhubungan dengan proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk mengekstrak informasi/pesan yang disampaikan oleh gambar/citra. Untuk mendukung tugas dari computer vision, akan ada beberapa fungsi pendukung yang ditambahkan ke dalam sistem ini, yaitu: •
Proses penangkapan citra/gambar (image acquisition)
•
Proses pengolahan citra (image processing)
•
Analisa data citra (image analysis)
•
Proses pemahaman data citra (image understanding)
C. Hirarki Pada Computer Vision
Gambar2. Proses Pada Computer Vision Hirarki pada computer vision ada 3 tahap, yaitu: •
Pengolahan Tingkat Rendah (Image to image) → Menghilangkan noise, dan peningkatan gambar (enchament image).
•
Pengolahan Tingkat Menengah (Image to dimbolic) → Kumpulan garis / vektor yang merepresentasikan batas sebuah obyek pada citra.
•
Pengolah Tingkat Tinggi (Simbolic to simbolic) → Representasi simbolik batas- batas obyek menghasilkan nama obyek tersebut.
Sebelum membuat aplikasi computer vision, maka perlu dibuat pertimbangan dan perancangannya. Pertimbangan dan perancangan tersebut dapat dilakukan dalam 3 tahap, yaitu: a. Informasi apa yang ingin diperoleh dan bagaimana informasi tersebut dimanifestasikan ke dalam citra. b. Pengetahuan apa yang diperlukan untuk memperoleh informasi. Untuk menentukan hubungan antara intensitas piksel dan sifat-sifat citra diperlukan suatu model, misalnya adalah: ♦ Scene model: jenis features, textures, smoothness. ♦ Illumination model: posisi dan karakteristik sumber cahaya serta sifat-sifat reflektansi permukaan obyek .
♦ Sensor model: posisi dan kinerja optik dari kamera yang digunakan, noise dan distorsi pada proses dijitasi . c. Kecepatan pemrosesan dan representasi pengetahuan.
D.
Computer
Vision
dan
Hubungannya
dengan
Pengolahan Citra Pengolahan citra adalah pemrosesan citra, khususnya dengan menggunakan komputer, menjadi citra yang kualitasnya lebih baik. Sebagai contoh, citra burung nuri pada Gambar 1.2 (a) tampak agak gelap, lalu dengan operasi pengolahan citra kontrasnya diperbaiki sehingga menjadi lebih terang dan tajam (b). Umumnya, operasi-operasi pada pengolahan citra diterapkan pada citra bila [JAI89]: 1. perbaikan atau memodifikasi citra perlu dilakukan untuk meningkatkan kualitas penampakan atau untuk menonjolkan beberapa aspek informasi yang terkandung di dalam citra, 2. elemen di dalam citra perlu dikelompokkan, dicocokkan, atau diukur, 3. sebagian citra perlu digabung dengan bagian citra yang lain.
Di dalam bidang komputer, sebenarnya ada tiga bidang studi yang berkaitan dengan data citra, namun tujuan ketiganya berbeda, yaitu: 1. Grafika Komputer (computer graphics). 2. Pengolahan Citra (image processing). 3. Pengenalan Pola (pattern recognition/image interpretation). Hubungan antara ketiga bidang (grafika komputer, pengolahan citra, pengenalan pola) ditunjukkan pada Gambar 1.3.
Pengolahan citra merupakan proses awal (preprocessing) pada computer vision, sedangkan pengenalan pola merupakan proses untuk menginterpretasi citra. Teknik-teknik di dalam pengenalan pola memainkan peranan penting dalam computer vision untuk mengenali objek. Jika dihubungkan dengan grafika komputer, maka computer vision merupakan kebalikannya. Grafika komputer membentuk (sintesis) citra, sedangkan computer vision mengoraknya (analisis). Pada masa awal kedua bidang ini, tidak ada hubungan antara keduanya, tetapi beberapa tahun belakangan kedua bidang tersebut berkembang semakin dekat. Computer vision menggunakan representasi kurva dan permukaan dan beberapa teknik lain dari grafika komputer, sedangkan grafika komputer menggunakan teknik -teknik di dalam computer vision untuk memuat citra realistik (virtual reality) [JAI95]. Pengolahan citra mempunyai aplikasi yang sangat luas dalam berbagai bidang kehidupan. Di bawah ini disebutkan beberapa aplikasi dalam beberapa bidang [MEN89]. 1. Bidang perdagangan (a) Pembacaan kode barang (bar code) yang tertera pada barang (umum digunakan di pasar swalayan/supermarket). (b) Mengenali huruf/angka pada suatu formulir secara otomatis. 2. Bidang militer (a) Mengenali sasaran peluru kendali mela lui sensor visual. (b) Mengidentifikasi jenis pesawat musuh. 3. Bidang kedokteran
(a) Pengolahan citra sinar X untuk mammografi (deteksi kanker payudara) (b) NMR (Nuclear Magnetic Resonance) (c) Mendeteksi kelainan tubuh dari foto sinar X. (d) Rekonstruksi foto janin hasil USG 4. Bidang biologi Pengenalan jenis kromosom melalui gambar mikroskopik 5. Komunikasi data Pemanfaatan citra yang ditransmisi. 6. Hiburan Pemaanfaatan video (MPEG) 7. Robotika Visualy-guided autonomous navigation 8. Pemetaan Klasifikasi penggunaan tanah melalui foto udara/LANDSAT 9. Geologi Mengenali jenis batu-batuan melalui foto udara/LANDSAT 10. Hukum (a) Pengenalan sidik jari (b) Pengenalan foto narapidana.
4. Aplikasi Computer Vision Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Aplikasi pada visi komputer mencakup berbagai macam sistem, yaitu:
1. Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom). 2. Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung). 3. Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan). 4. Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis / topografis). 5. Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer). 6. Sub-domain visi komputer meliputi adegan rekonstruksi, acara deteksi, pelacakan video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi.
Gambar3. Hasil Proses Computer Vision Pada Shape Recovery Dan Cell Segementation Kategori software pendukung : 1. 3D,
6. mathematical toolkits,
2. contours
7. pattern recognition,
3. display tools
8. stereo,
4. features
9. synthetic data generators,
5.
ocr
10. texture,
11. toolkits,
13. misc.
12. tracking,
5.Contoh Penerapan Computer Vision
5.1 Biometriks Secara tradisional, password (suatu keamanan berbasis knowledge) dan kartu ID (suatu keamanan berbasis token) biasanya digunakan untuk membatasi akses terhadap suatu sistem, sehingga sistem hanya dapat digunakan oleh individu tertentu yang sah. Bagaimanapun, keamanan sistem dapat secara mudah diterobos ketika password dari sistem tersebut telah diketahui oleh pihak – pihak yang tidak berwenang atau kartu ID dapat diakses juga jika kartu tersebut dicuri oleh pengguna–pengguna yang tidak sah. Password yang sederhana mungkin mudah ditebak oleh para pengguna yang tidak berwenang, sementara password yang rumit akan mengalami kesulitan bagi individu yang sah di dalam mengingat kode–kode yang dibuat oleh dirinya sendiri. Untuk mengatasi gangguan–gangguan verfikasi sistem secara tradisional, maka para ilmuwan pada saat ini menawarkan suatu metode yang lebih terjamin di dalam memberikan keamanan di dalam mengakses suatu sistem, metode tersebut diistilahkan metode biometriks. Biometriks dapat dikatakan sebagai suatu sistem
pengidentifikasian (verifikasi) individual secara otomatis dengan memanfaatkan keadaan atau keunikan fisiologi manusia atau perilaku individual tertentu yang memiliki keunikan tertentu. Dengan memanfaatkan biometriks kita dapat membangun suatu keamanan dari suatu identitas yang berbasiskan “who you are” bukan “what you posses” seperti keamanan sistem tradisional yang sering melekat pada sistem keamanan ID card, atau “what you remember” seperti pada sistem yang menggunakan password. Sistem biometriks telah membentuk suatu identitas personal dengan menggunakan sidik jari, hand- geometry, iris, retina, face, hand vein, facial thermograms, signature, voiceprint, gaya berjalan (gait), palmprint, dan lain – lain (lihat gambar 1.1). .
BIOMETRIKS 3 Gambar 1.3 menampilkan suatu modul enrollment dan verifikasi dari suatu sistem biometriks khusus. Suatu sistem biometriks yang sederhana, memiliki empat modul utama : 1. ModulSensor yang bertugas menangkap (capture) data
biometriks dari user secara individual. 2. Modul Ekstraksi Fitur, data–data yang diperoleh selanjutnya diproses untuk mengekstraksi nilai–nilai fitur. 3. ModulMatching, nilai–nilai fitur selanjutnya dibandingkan dengan nilai–nilai fitur template. 4. ModulDecision-Making, pada tahap ini klaim kepemilikan yang sah atau tidak, sudah ditentukan oleh sistem biometriks.
4. KOMPUTER VISI & PENGOLAHAN CITRA LANJUT Gambar 1.2 Sistem biometrik untuk aplikasi umum, (a) sistem border-passage menggunakan iris recognation pada pelabuhan udara Heathrow London, (b) INSPASS (INS Passenger Accelerated Service System pada pelabuhan udara internasional JFK (New York), (c) Express Card entry-kiosks menggunakan sistem hand-geometry pada
pelabuhan udara Ben Gurion, Tel Aviv, Israel, untuk keamanan dan imigrasi, (d) sistem FacePass yang digunakan sebagai aplikasi verifikasi point-of-sale seperti layaknya mesin ATM tetapi meniadakan sistem keamanan menggunakan kode – kode PIN atau password, (e) pelayanan “Pay by Touch” Indivos untuk mempercepat transaksi di pusat perbelanjaan, (f) sistem TouchClock sidik jari Identix.
5.2 Content-based retrieval image (CBIR) Content-based image retrieval (CBIR), adalah suatu aplikasi computer vision yang digunakan untuk melakukan pencarian gambar-gambar digital pada suatu database. Yang dimaksud dengan "Content-based" di sini adalah: bahwa yang dianalisa dalam proses pencarian itu adalah actual contents (kandungan aktual) sebuah gambar. Istilah content pada konteks ini merujuk pada warna, bentuk, tekstur, atau informasi lain yang didapatkan dari gambar tersebut. Proses umum dari CBIR adalah pada gambar yang menjadi query dilakukan proses ekstraksi feature (image contents), begitu halnya dengan gambar yang ada pada sekumpulan gambar juga dilakukan proses seperti pada gambar query. Parameter feature gambar yang dapat digunakan untuk retrieval pada system ini dapat berupa histogram, susunan warna, teksture, dan shape, tipe spesifik dari obyek, tipe event tertentu, nama individu, lokasi, emosi. Fitur Warna Selain bentuk dan textur, warna merupakan salah satu image contents yang sering digunakan pada kebanyakan sistem CBIR. Model warna (color model) adalah sebuah cara untuk merepresentasikan warna yang diindera manusia dalam komputasi. Model warna yang digunakan saat ini dapat digolongkan ke dalam dua kategori: hardware-oriented dan user-oriented. Model warna hardware-oriented banyak digunakan untuk warna alat-alat. Misalnya model warna RGB (red, green, blue), biasa digunakan untuk warna monitor dan kamera. Model warna CMY (cyan, magenta, yellow), digunakan untuk warna printer; dan warna YIQ digunakan untuk penyiaran tv warna. Sedangkan model warna yang user-oriented termasuk HLS,
HCV, HSV, MTM, dan CIE-LUV, didasarkan pada tiga persepsi manusia tentang warna, yaitu hue (keragaman warna), saturation (kejenuhan), dan brightness (kecerahan). Berikut penjenjelasan ringkas tentang berbagai macam model atau format warna: a) Format warna RGB Format ini digunakan untuk menghasilkan warna di monitor dan televisi tabung yang menggunankan gelombang elektromagnetik. Sebuah titik ditembak dengan spektrum R, G dan B. b) Format warna HSV atau HSI atau HSL Format ini merupakan format warna alamiah dengan mempertimbangkan bahwa spektrum warna adalah sebuah koordinat polar seperti warna pantulan yang jatuh di mata manusia. Format ini sangat baik untuk membedakan warna-warna yang 'terlihat'. c) Format warna CIE Format warna ini adalah varians dari RGB dengan normalisasi spektrum, sehingga sifat orthogonalitas dari masing-masing komponen warna lebih dijamin. FOrmat ini merupakan standard dalam QBIC d) Format warna YCrCb Format warna ini disebut juga dengan warna chrominant. Format ini banyak digunakan dalam skin-detection. e) Format warna CMYK Format warna ini adalah penghasil warna pada cat atau tinta. Format warna ini yang digunakan oleh mesin cetak. HSV dan RGB Model warna RGB merupakan yang paling banyak digunakan pada systemCBIR. Pada model ini, warna direpresentasikan menjadi tiga warna primer, yaitu: red, green, dan blue . Nilai masing-masing warna primer itu berkisar antara 0 255. Sedangkan HSV (hue, saturation, value) merupakan model warna yang diturunkan dari RGB. Literatur menunjukkan bahwa performa HSV ternyata lebih baik dalam membedakan warna jika dibandingkan dengan RGB Berikut ini rumus mengkonversi nilai-nilai RGB menjadi HSV: Rumus untuk menentukan h:
Rumus untuk menentukan s:
Rumus untuk menentukan v: v = max Color Histogram Color histogram adalah representasi distribusi warna dalam sebuah gambar yang didapatkan dengan menghitung jumlah pixel dari setiap bagian range warna, secara tipikal dalam dua dimensi atau tiga dimensi. Misalnya ada sebuah gambar berukuran 3x3 pixel dengan nilai RGB sebagai berikut: (1,1,1) (1,2,0) (1,2,0) (1,1,0) (2,1,0) (2,3,1) (3,2,1) (2,2,1) (2,1,0) Bila yang digunakan adalah format H(r,g,b) dimulai dari H(0,0,0) s/d H(3,3,3) , maka histogram gambar tersebut adalah sebagai berikut : H(0,0,0)=0 H(0,0,1)=0 H(0,0,2)=0 H(0,0,3)=0 H(0,1,0)=0 H(0,1,1)=0 H(0,1,2)=0 H(0,1,3)=0 H(0,2,0)=0 H(0,2,1)=0 H(0,2,2)=0 H(0,2,3)=0 H(0,3,0)=0 H(0,3,1)=0 H(0,3,2)=0 H(0,3,3)=0 H(1,0,0)=0 H(1,0,1)=0 H(1,0,2)=0 H(1,0,3)=0 H(1,1,0)=1 H(1,1,1)=1 H(1,1,2)=0 H(1,1,3)=0 H(1,2,0)=1 H(1,2,1)=0 H(1,2,2)=0 H(1,2,3)=0 H(1,3,0)=0 H(1,3,1)=0 H(1,3,2)=0 H(1,3,3)=0 H(2,0,0)=0 H(2,0,1)=0 H(2,0,2)=0 H(2,0,3)=0 H(2,1,0)=2 H(2,1,1)=0 H(2,1,2)=0 H(2,1,3)=0 H(2,2,0)=0 H(2,2,1)=1 H(2,2,2)=0 H(2,2,3)=0 H(2,3,0)=0 H(2,3,1)=1 H(2,3,2)=0 H(2,3,3)=0 H(3,0,0)=0 H(3,0,1)=0 H(3,0,2)=0 H(3,0,3)=0 H(3,1,0)=0 H(3,1,1)=0 H(3,1,2)=0 H(3,1,3)=0
H(3,2,0)=0 H(3,2,1)=1 H(3,2,2)=0 H(3,2,3)=0 H(3,3,0)=0 H(3,3,1)=0 H(3,3,2)=0 H(3,3,3)=0 Jika ditulis, histogram dari data-data diatas adalah: H = {0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0}
Color Quantization Dalam pembuatan histogram, nilai RGB yang punya range dari 0 sampai 255 akan punya kemungkinan kombinasi warna sebesar 16777216 (didapat dari: 255 x 255 x 255). Pada proses komputasi, tentu saja ini proses yang menghabiskan banyak waktu (time consuming). Masalah tersebut dapat diatasi dengan color quantization (kuantisasi warna), yaitu suatu prosedur untuk mengurangi kemungkinan jumlah warna. Dengan cara ini, jumlah warna yang besar tadi bisa dikurangi, sehingga proses yang dibutuhkan akan semakin mudah. Seperti dijelaskan dalam literatur [7], misalnya nilai sebuah pixel RGB adalah (260, 200, 150). Maka setelah melalui kuantisasi menjadi 64 warna, misalnya, range R: 0-3, range G: 0-3, dan range B: 0-3, nilai itu menjadi (260 * 4/255, 200 * 4/255, 150 * 4/255) atau (3,3,2 ).
Pencarian dengan CBIR ternyata tidak hanya melibatkan satu atau dua gambar saja, namun melibatkan lebih banyak lagi (ratusan atau lebih). Oleh karena itu, untuk lebih mempercepat proses pencarian, gambar-gambar tadi dikelompokkan terlebih dahulu menjadi bebarapa cluster berdasarkan kesamaan histogramnya (clustering). Teknik clustering ini bisa menggunakan algoritma K-Means, Algoritma Genetika, FGKA [2] dan sebagainya . Selanjutnya, pencarian dapat dilakukan dengan membandingkan histogram sample gambar dengan nilai-nilai pusat cluster (centroid) tersebut.
5.3 Optical Character Recognition (OCR) OCR (Optical Character Recognition) adalah sebuah sistem komputer yang dapat membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin ketik) maupun yang berasal dari tulisan tangan. Adanya sistem pengenal huruf ini akan meningkatkan fleksibilitas ataupun kemampuan dan kecerdasan sistem komputer. Dengan adanya sistem OCR maka user dapat lebih leluasa memasukkan data karena user tidak harus memakai papan ketik tetapi bisa menggunakan pena elektronik untuk menulis sebagaimana user menulis di kertas. Adanya OCR juga akan memudahkan penanganan pekerjaan yang memakai input tulisan seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan, dll. Adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran yang saat ini dilakukan banyak pihak yakni usaha digitalisasi informasi dan pengetahuan, misalnya dalam pembuatan koleksi pustaka digital, koleksi sastra kuno digital, dll. OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas yakni pengenal pola otomatis (automatic pattern recognition). Dalam pengenal pola otomatis, sistem pengenal pola mencoba mengenali apakah citra masukan yang diterima cocok dengan salah satu citra yang telah ditentukan. Sistem ini misalnya dipakai untuk mendeteksi sidik jari, tandatangan, bahkan wajah seseorang. Ada banyak pendekatan yang dapat dipakai untuk mengembangkan pembuatan pengenal pola otomatis antara lain memakai pendekatan numerik, statistik, sintaktik, neural dan, aturan produksi (rule-based). Secara umum metode-
metode tersebut dapat digolongkan menjadi dua kelompok metode yakni metode berbasis statistik dan metode berbasis struktur. Dalam metode yang berbasis statistik, setiap pola ditransformasi ke dalam vektor yang memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik misalnya distribusi pixel ataupun jarak pixel. Sedang dalam metode yang berbasis struktur, setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer. Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan struktur yang sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori bahasa formal dan automata.
1. Data Capture Data capture merupakan proses konversi suatu dokumen (hardcopy) menjadi suatu file gambar (BMP). 2. Preprocessing
Preprocessing merupakan suatu proses untuk menghilangkan bagianbagian yang tidak diperlukan pada gambar input untuk proses selanjutnya. Beberapa contoh preprocessing adalah noise filtering. 3. Segmentation Segmentasi adalah proses memisahkan area pengamatan (region) pada tiap karakter yang akan dideteksi. 4. Normalization Normalization adalah proses merubah dimensi region tiap karakter dan ketebalan karakter. Algoritma yang digunakan pada proses ini adalah algoritma scaling dan thinning. 5. Feature Extraction Feature Extraction adalah proses untuk mengambil ciri-ciri tertentu dari karakter yang diamati. 6. Recognition Recognition merupakan proses untuk mengenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri karakter yang ada pada database. 7. Postprocessing
Pada umumnya proses yang dilakukan pada tahap ini adalah proses koreksi ejaan sesuai dengan bahasa yang digunakan.
E.
software pendukung
1. bcWebCam 2. OmniPage 3. DTKBarcode 4. LuxandBlinkSetup
BAB III PENUTUP A. Kesimpulan Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision) yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki kemampuan tingkat tinggi sebagaiman human visual. Computer Vision adalah kombinasi antara Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya dapat dilihat pada gambar 1. Pengolahan citra merupakan proses awal dari computer vision, sedangkan pengenalan pola merupakan proses menginterpretasikan citra.
1. Proses yang terjadi pada computer vision. a. Memperoleh atau mengakuisisi citra digital. b. Operasi pengolahan citra.
c. Menganalisis dan menginterpretasi citra dan menggunakan hasil
pemrosesan untuk tujuan tertentu, misal memandu robot, mengontrol peralatan, dll. 2. 3 hirarki pada komputer vision a. Pengolahan
Tingkat
Rendah
(Image
to
image)
→
Menghilangkan noise, dan peningkatan gambar (enchament image). b. Pengolahan
Tingkat
Menengah
(Image
to
dimbolic)
→
Kumpulan garis / vektor yang merepresentasikan batas sebuah obyek pada citra. c. Pengolah Tingkat Tinggi (Simbolic to simbolic) → Representasi simbolik batas- batas obyek menghasilkan nama obyek tersebut.
Aplikasi yang digunakan pada computer vision 7.
Pengendalian proses.
8.
Mendeteksi peristiwa.
9.
Mengorganisir informasi.
10.
Modeling benda atau lingkungan.
11.
Interaksi .
12.
Sub-domain visi komputer meliputi adegan rekonstruksi, acara
deteksi, pelacakan video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi. Fitur warna: a) Format warna RGB b) Format warna HSV atau HSI atau HSL c) Format warna CIE d) Format warna YCrCb
e) Format warna CMYK
Kekurangan Computer Vision Computer vision memberikan dampak negative bagi manusia yang telah mencitakan dan juga memanfaatkannya. Berbagai dampak penyakit dapat diterima pengguna yang memanfaatkan computer vision dalam kehidupan sehari – hari. Seperti gejala Computer Vision Syndrome (CVS). CVS adalah keluhan-keluhan atau gejala pada mata, kepala, dan tulang punggung yang disebabkan oleh efek penyinaran pada aktivitas komputer, televise. `1 Gejala ini sudah lama ada, tetapi banyak masyarakat yang tidak menyadari kalau itu merupakan gejala CVS. Kebanyakan, orang menganggap itu karena radiasi yang ditimbulkan oleh komputer. Padahal, tak ada kaitannya dengan radiasi, tapi karena resolusi tingkat ketajaman gambar. Banyak orang merasa kondisi-kondisi tersebut merupakan gejala minus atau plus pada mata. Padahal, hal itu merupakan kelelahan pada mata yang diakibatkan menurunnya daya akomodasi pada mata.
B. Saran
Pemanfaatan computer vision juga harus mempertimbangkan dampak yang akan ditimbulkan jika pemanfaatannya melebihi batas wajar. Pekerjaan yang berhubungan dengan computer vision yang mengharuskan untuk selalu berinteraksi dengan komputer setiap harinya, mengakibatkan pengguna terkena Computer Vision Syndrome (CVS). Syndrome ini dapat dicegah dengan melakukan terapi ringan. Misalnya, dengan membebaskan mata untuk melihat sesuatu yang jauh. Bisa juga melihat benda yang berwarna hijau (tanaman). "Sebaiknya istirahatkan mata dengan memejamkan mata sambil rileks kurang lebih 5 menit setiap 1 jam sekali, saat berinteraksi dengan komputer,"
Langkah lain yang bisa dilakukan adalah dengan mengalihkan pandangan dari layar komputer. Minumlah banyak air putih selama di kantor. Ini membantu tubuh tidak kekurangan cairan, sehingga ada cukup persediaan air yang memudahkan tubuh menghasilkan air mata, dan menjaga agar mata tidak kering. Sudut pandangan ke komputer juga harus pas, bagian atas layar komputer harus sejajar dengan mata. Sesuaikan tingkat terang/gelap layar, dan pastikan tidak ada pantulan yang menyilaukan dari sumber cahaya lain.
DAFTAR PUSTAKA
Pedram Azad, Tilo Gockel, Rüdiger Dillmann ; Computer Vision Principles and Practice Blogger ; Pengantar Pengolahan Citra
IlmuKomputer.com ; Penggunaan Color Histogram Dalam Image Retrieval
http://www.scribd.com/doc/14598876/-Komputer-Visi-Biometriks-Fadlisyah
http://juliocaesarz.blogspot.com/2010/11/computer-vision.html