1
ỤC LỤC
M
LÝ Ả NH ,TIỀ N XỬ LÝ CHƢƠNG 1:TỔ NG QUAN VỀ XỬ LÝ Ử LÝ VÀ PHÂN ĐOẠ N ......................................... ........................... .......................... .......................... ........................... ........................... ........................... ................. ... 5 Ả NH ........................... 1.1
Tổng Quan Về Xử Lý Ảnh .......................... ....................................... .......................... ........................... ........................ ..........5
1.2
Tổng quan về phân đoạn ảnh ......................... ...................................... .......................... ........................... ...................... ........6
1.3
Tổng quan về tiền xử lý ảnh .......................... ....................................... .......................... ........................... ...................... ........7
LÝ Ả NH .......................... .................................. ........8 CHƢƠNG 2:MỘT SỐ PHƢƠNG PHÁP TIỀ N XỬ LÝ 2.1. Nhị phân ảnh .......................... ........................................ ........................... ........................... ........................... .......................... ..................... ........8 2.1.1. Phân loại các phƣơng pháp xác định ngƣỡ ng ng T ...................................... ........................................ 10 2.1.2. Một số phƣơng pháp xác định ngƣỡ ng ng T ......................... ....................................... ........................ ..........11 2.1.3. Nhận xét .......................... ........................................ ........................... ........................... ........................... .......................... ................... ......15 2.2. Hiệu chỉnh độ nghiêng của trang văn bả n .......................... ....................................... ........................... ................17 2.2.1.
....................................... ........................ .......... 18 Phƣơng pháp dựa trên biến đổi Hough .........................
2.2.2. Phƣơng pháp láng giềng gần nhất (nearest neighbours) .......................... .......................... 19 2.2.3. Phƣơng pháp sử dụng chiếu nghiêng (project profile) .............. ............................ ................ 21 2.2.4. Nhận xét .......................... ........................................ ........................... ........................... ........................... .......................... ................... ......22 2.3. Các toán tử hình thái (Morphological operations) ........................... ......................................... ................ 23
CHƢƠNG 3:PHƢƠNG PHÁP PHÂN ĐOẠ N CHỨ NG MINH NHÂN DÂN .......27 3.1. Giớ i thiệu bài toán .......................... ........................................ ........................... ........................... ........................... ....................... ..........27
3.2. Tách các trƣờ ng ng thông tin ở m mặt trƣớ c .......................... ........................................ ........................... ................... ......29 3.2.1. Tiền xử lý ảnh......................... ...................................... ........................... ........................... ........................... .......................... ............30 ng Số CMND ......................... ....................................... ........................... ........................... ........................ ..........33 3.2.2. Tách trƣờ ng 3.2.3. Tách các trƣờ ng ng thông tin còn lại .......................... ........................................ ........................... ..................... ........37
3.3. Tách các trƣờ ng ng thông tin ở m mặt sau ......................... ....................................... ........................... ....................... ..........42 3.3.1. Tiền xử lý ảnh......................... ...................................... ........................... ........................... ........................... .......................... ............43 3.3.2. Xác định cấu trúc bảng .......................... ........................................ ........................... ........................... ........................ ..........43 ng thông tin ................................. .............................................. .......................... ........................... .................... ...... 45 3.3.3. Tách trƣờ ng
CHƢƠNG 4:CÀI ĐẶT THỬ NGHI NGHIỆM ......................... ....................................... ........................... ........................... ................ 46 K ẾT LUẬ N ........................... ......................................... ........................... .......................... .......................... ........................... ........................... ................. .... 48 TÀI LIỆU THAM KHẢO......................... ....................................... ........................... ........................... ........................... ....................... ..........49
2
Danh mục thuật toán
Thuật toán 2.1. Nhị phân ảnh ...................................................................................8 Thuật toán 2.2. Phƣơng pháp phân ngƣỡ ng Niblack................................................11 Thuật toán 2.3. Phƣơng pháp phân ngƣỡ ng Otsu....................................................13 Thuật toán 2.4. Hiệu chỉnh độ nghiêng của ảnh tài liệu..........................................17 Thuật toán 2.5. Xoay ảnh ........................................................................................17 Thuật toán 2.6. Xác đị nh góc nghiêng dựa vào biến đổi Hough..............................19 Thuật toán 2.7. Phƣơng pháp láng giềng gần nhất ..................................................20 Thuật toán 2.8. Sử dụng chiếu nghiêng để xác định góc nghiêng ...........................22 Thuật toán 3.1. Xác đị nh các vùng có thể là Trƣờ ng Số CMND............................33 33.Thuật toán 3.2. Tìm và tách trƣờ ng Số CMND...................................................35 Thuật toán 3.3. Phân đoạn vùng Số CMND............................................................35 Thuật toán 3.4. Ƣớc lƣợ ng bề dày đƣờng lƣợ n sóng ..............................................36 Thuật toán 3.5. Tách các ký t ự thuộc mỗi dòng .......................................................39 Thuật toán 3.6. Xoá ph ần tiêu đề .............................................................................40 Thuật toán 3.7. Tìm các đƣờ ng k ẻ ngang trong ảnh.................................................44
3
LỜ I CẢM ƠN
Trƣớ c hết em xin chân thành cảm ơn các thầ y giáo trong khoa công nghệ thông tin trƣờng đại học dân lậ p H ải Phòng dã trang bị nh ững cơ bản c ần thiết để em có thể thực hiện đề tài của mình . Đặc biệt em xin bày tỏ lòng kính tr ọng và biết ơn sâu sắ c tớ i thầy giáo hƣớ ng dẫn PGS.TS Ngô Quốc T ạo ngƣời đã tận tình hƣớ ng d ẫn ,chỉ b ảo và tạo m ọi điều kiện thuận lợ i giúp em trong quá trình thực tậ p. Mặc dù đã cố gắng hết sức cùng vớ i sự tận tâm của thầy giáo hƣớ ng dẫn xong do trình độ có h ạn ,nội dung đề tài còn quá mớ i mẻ v ớ i em nên khó tránh khỏi những sai xót trong quá trình tiế p nhận kiến thức.Em r ất mong đƣợ c sự chỉ dẫn của thầy cô và sự góp ý bạn bè để trong thờ i gian tớ i em có thể xây dựng đồ án một cách hoàn thiện nhất.
Sinh viên Tr ần Văn Toàn
4
Mở Đầu
Xử lý ảnh là một trong những chuyên ngành quan tr ọng và lâu đờ i của ngành Công Nghệ Thông Tin.XLA đƣợ c áp dụng cho nhiều lĩnh vực khác nhau nhƣ y học ,vật lý ,hóa học,truy tìm tội ph ạm…Mục đích chung của vi ệc XLA thƣờ ng là (1)xử lý ảnh ban đầu để có đƣợ c một bức ảnh mớ i theo một yêu cầu cụ thể,(2)phân tích ảnh để thu đƣợc các thông tin đặc trƣng trên ả nh nhằm hỗ tr ợ cho việc phân loại và nhận biết ảnh,(3)phân đoạn ảnh để nhận biết đƣợ c các thành phần trong ảnh nhằm hiểu đƣợ c k ết cấu của bức ảnh có mức độ cao hơn.Để xử lý đƣợ c một bức ảnh thì phải tr ải qua nhiều bƣớc,nhƣng trong phần này em xin trình bày 2 bƣớ c quan tr ọng trong xử lý ảnh là tiền xử lý ảnh và bƣớc phân đoạ n ảnh. Hiện nay có r ất nhiều thuật toán đƣợc đề xuất để giải quyết bài toán về tiền xử lý và phân đoạn ảnh.
Phân đoạn ảnh thì hầu hết các thuật toán đều dựa vào hai thuộc tính quan tr ọng của mổi điểm ảnh so với các điểm lân cận của nó đó là sự khác nhau và giống nhau.Các phƣơng pháp dự a trên sự khác nhau của các điể m ảnh đƣợ c gọi là phƣơng pháp biên (boundary- based methods) còn các phƣơng pháp dự a trên sự gi ống nhau của các điể m ảnh đƣợ c gọi là phƣơng pháp miền Tiền x ử lý ảnh là một bƣớ c quan tr ọng trong xử lý ảnh.ở bƣớ c này hình ảnh vẫn ở mức thấ p nhất chƣa đƣợ c x ử lý.Vớ i mục đích cải thiện các dữ liệu hình ảnh và ngăn chặn các biến dạng không mong muốn hoặc tăng cƣờ ng .nội dung thông tin hình ảnh …nhiều phƣơng pháp tiền xử lý hình ảnh đã đƣợc đề xuất .Dƣới đây em xin trình bày một số phƣơng pháp cho quá trình này.
5
CHƢƠNG 1:TỔNG QUAN VỀ XỬ LÝ ẢNH ,TIỀN XỬ LÝ VÀ PHÂN ĐOẠN ẢNH Tổng Quan Về Xử Lý Ảnh
1.1
Trong xã hội loài ngƣờ i,ngôn ngữ là một phƣơng tiện trao đổi thông tin phổ biên trong quá trình giao tiế p.Bên cạnh ngôn ngữ,hình ảnh cũng là một cách trao đổi thông tin mang tính chính xác biểu c ảm khá cao và đặ c bi ệt không bị c ảm giác chủ quan của đối tƣợ ng giao tiế p chi phối .Thông tin trên hình ảnh r ất phong phú ,đa dạng và có thể x ử lý b ằng máy tính .Chính vì vậy,trong những năm gần đây sự k ết hợ p giữa ảnh và đồ họa đã trở lên chặt chẽ trong lĩnh vực xử lý thông tin.
Cũng nhƣ xử lý dữ li ệu hình ảnh bằng đồ h ọa,việc x ử lý ảnh số là một lĩnh vực của tin học ứng dụng .Việc xử lý dữ liệu bằng đò họa đè cập đế n những hình ảnh nhân tạo,các ảnh này đƣợc xem xét nhƣ là nhữ ng cấu trúc dữ liệu và đƣợ c tạo ra bởi các chƣơng trình .XLA số thao tác trên các ảnh t ự nhiên thông qua các phƣơng pháp và k ỹ thu ật mã hóa.Ảnh sau khi đƣợ c thu nhận b ằng các thiết b ị thu nhận ảnh sẽ đƣợ c biến đổi thành ảnh số theo các phƣơng phá số hóa đƣợ c nhúng trong các thiết b ị k ỹ thu ật khác nhau và đƣợ c bi ểu di ễn trên máy tinhsduwowis dạng ma tr ận 2 chiều hoặc 3 chiều Mục đích củ a việc XLA đƣợ c chia làm 2
Biến đổi ảnh làm tăng chất lƣợ ng ảnh Tự động nhận dạng ,đoán ảnh,đánh giá nội dung ảnh
Phƣơng pháp biến đổi các đƣợ c sử dụng trong việc xử lý các ảnh chụ p từ không trung .Một ứng dụng khác của việc biên đổi ảnh là mã hóa ảnh ,trong đó cac ảnh đƣợ c xử lý để r ồi lƣu trữ hoặc truyền đi. Các phƣơng pháp nhận dạng ảnh đƣợ c xử dụng khi xử lý tế bào,nhiễm sắc thể,nhận dạng chữ...Thực chất của công việc nhận dạng chính là sự phân loại đối tƣợng thành các lopws đối tƣợng chƣa biế t .bài toán nhận d ạng ảnh là một bài toán lớ n,có r ất nhiều ý nghĩa thực tiễnvà ta cũng cos thể thấy r ằng để công việc nhận dạng tr ở lên dễ dàng thì ảnh phải đƣợc tách thành các đối tƣợ ng riêng biệt đây là mục đích chính của bài toán phân đoạ n ảnh .Nếu ohaan đoạn ảnh không tốt sẽ d ẫn đến sai lầm trong quá trình nhận dạng ảnh.
49
TÀI LIỆU THAM KHẢO Tiếng Việt
[1] Nghị định số: 577-TTg “Đặt giấy ch ứng minh và quy định thể lệ cấ p phát giấy chứng minh”, Chính phủ, Hà Nội, ngày 27 tháng 11 năm 1957. [2] Nghị định s ố: 05/1999/NĐ-CP “Về ch ứng minh nhân dân”, Chính phủ , Hà Nội, ngày 03 tháng 02 năm 1999. [3] Nghị định s ố: 170/2007/NĐ-CP “Sửa đổi, b ổ sung một số điều c ủa nghị định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 củ a chính phủ về chứng minh nhân
dân”, Hà Nội, ngày 19 tháng 11 năm 2007. Tiếng Anh
[4] K. Kpalma and J. Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007. [5] Anoop M Namboodiri and Anil Jain, “Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and R ecent Advances B. B. Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1-84628-501-1), Jan. 2007. [6] Toyohide WATANABE, “Document Analysis and Recognition”, IEICE TRANS. INF. &. SYST., vol.e82-d, no.3. [7] G. Nagy, S. Seth and M. Viswanathan, "A Prototype Document Image-Analysis System for Technical Journals", Computer 25, (1992), 10 – 22. [8] Baird, U.S. and Jones, S.E. and Fortune, S.J.: Image Segmentation by ShapeDirected Covers. in Proceedings of International Conference on Pattern Recognition, Atlantic City, NJ (1990), 820-825. [9] Pavlidis, T. and Zhou, J.: Page Segmentation by White Streams. Proceedings of International Conference on Document Analysis and Recognition, Saint-Malo, France (1991), 945-953. [10] Breuel, T.M.: Two Geometrie Algorithms for Layout Analysis, in Proceedings of the Fifth International Workshop on Document Analysis Systems, Princeton, NY
50 (2002), LNCS 2423, 188-199. [11] O Gorman, L.: The Document Spectrum for Page Layout Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence 15 (1993), 1162-1173. ‟
[12] Kise, K. and Sato, A. and Iwata, M.: Segmentation of Page Images using the Area Voronoi Diagram. Computer Vision and Image Understanding 70 (1998), 370382.
[13] Mehmet Sezgin & Bülent Sankur, “Survey over image thresholding techniques and quantitative performance evaluation”, Journal of Electronic Imaging 13(1), 146 – 165 (January 2004). [14] W. Niblack, “An Introduction to Digital Image Processing”, pp. 115 -116, Prentice Hall, 1986. [15] Z. Zhang and C. L. Tan, “Restoration of images scanned from thick bound
documents”, Proc. Int. conf. Image Processing., vol. 1, 2001, pp.1074 -1077. [16] N. Otsu, „„A threshold selection method from gray -level histograms IEEE Trans. Syst. Man Cybern. 9(1), 62 – 66 (1979). ‟‟
[17] Yichao Ma, Chunheng Wang, Baihua Xiao, et Ruwei Dai. “Usage -oriented performance evaluation for text localization algorithms”. In Document Anal ysis and Recognition, 2007. ICDAR 2007. Ninth International Conference on, volume 2, page(s) 1033-1037, 2007. [18] Xian-Sheng Hua, Liu WenYin, and Hong-Jiang Zhang, “An Automatic Performance Evaluation Protocol for Video Text Detection Algorithms”. In IEEE Transactions on circuits and systems for video technology, vol.14, no.4, avril 2004 [19] Vasant Manohar , Padmanabhan Soundararajan , Matthew Boonstra, Harish Raju, Dmitry Goldgof, Rangachar Kasturi, and John Garofolo, “Performance Evaluation of Text Detection and Tracking in Video”. In Document analysis systems VII, vol. 3872, pages 576-587, 2006.