Đồ án Truy vấn ảnh dựa trên biến ðổi Wavelet (Phần 1)
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Truy vấn ảnh dựa trên biến ðổi Wavelet (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
do_an_truy_van_anh_dua_tren_bien_oi_wavelet_phan_1.pdf
Nội dung text: Đồ án Truy vấn ảnh dựa trên biến ðổi Wavelet (Phần 1)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA ĐIỆN-ĐIỆN TỬ ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ ĐIỆN TỬ VIỄN THÔNG TRUY VẤN ẢNH DỰA TRÊN BIẾN ÐỔI WAVELET GVHD: ThS. LÊ MINH THÀNH SVTH: TRẦN MINH PHÚC MSSV: 10117052 SVTH: PHẠM QUỐC VIỆT MSSV: 10117080 S K L 0 0 3 2 5 4 Tp. Hồ Chí Minh, tháng 07/2014
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT TP.HCM KHOA ĐIỆN - ĐIỆN TỬ BỘ MÔN ĐIỆN TỬ-VIỄN THÔNG ĐỒ ÁN TỐT NGHIỆP NGÀNH: CÔNG NGHỆ ĐIỆN TỬ VIỄN THÔNG ĐỀ TÀI: TRUY VẤN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET GVHD: ThS. LÊ MINH THÀNH SVTH: TRẦN MINH PHÚC 10117052 PH ẠM QUỐC VIỆT 10117080 TP.HỒ CHÍ MINH – 7/2014
- Truy vấn ảnh dựa trên biến đổi Wavelet i LỜI CẢM ƠN Trong suốt quá trình học tập và hoàn thành đề tài, bên cạnh sự nỗ lực cố gắng của nhóm thực hiện đề tài còn có sự hƣớng dẫn nhiệt tình của quý thầy, cô và sự hỗ trợ, động viên rất lớn từ gia đình bạn bè. Với lòng kính trọng và biết ơn sâu sắc, nhóm thực hiện đề tài xin chân thành cảm ơn: Nhóm thực hiện đề tài xin cảm ơn thầy Lê Minh Thành, giáo viên trực tiếp hƣớng dẫn, đã tận tình chỉ bảo và hƣớng dẫn cho nhóm thực hiện hoàn thành đề tài một cách tốt nhất. Nhóm thực hiện cũng xin cảm ơn các thầy, cô trong Khoa Điện-Điện tử, đặc biệt là các thầy, cô bộ môn Điện tử-Viễn thông đã tận tình dạy dỗ, truyền đạt cho nhóm những kiến thức cơ sở và chuyên ngành, để có nền tảng kiến thức hoàn thành tốt đề tài. Nhóm thực hiện cũng xin gửi lời cảm ơn đến gia đình, anh chị, bạn bè đặc biệt là tập thể lớp 101170 đã động viên, giúp đỡ nhóm trong suốt quá trình học tập và thực hiện đề tài. Một lần nữa nhóm thực hiện đề tài xin chân thành cảm ơn. Tp. Hồ Chí Minh, ngày 25 tháng 7 năm 2014 Nhóm sinh viên thực hiện Trần Minh Phúc – Phạm Quốc Việt Lời cám ơn
- Truy vấn ảnh dựa trên biến đổi Wavelet ii MỤC LỤC LỜI CẢM ƠN i MỤC LỤC ii LIỆT KÊ HÌNH vi LIỆT KÊ TỪ VIẾT TẮT ix TÓM TẮT xi ABSTRACT xii Chƣơng 1: GIỚI THIỆU 1 1.1 Vai trò và ứng dụng của kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet 1 1.2 Mục đích của đề tài 1 1.3 Mục tiêu và phạm vi nghiên cứu 2 1.4 Bố cục của đồ án 2 Chƣơng 2: TỔNG QUAN VỀ TRUY VẤN ẢNH 3 2.1 Tổng quan về ảnh số 3 2.1.1 Giới thiệu về ảnh số 3 2.1.2 Đặc trƣng màu sắc 4 2.1.3 Đặc trƣng kết cấu 4 2.1.4 Đặc trƣng hình dạng 5 2.1.5 Đặc trƣng cục bộ bất biến 5 2.2 Giới thiệu về hệ thống xử lý ảnh 5 2.2.1 Phần thu nhận ảnh 6 2.2.2 Tiền xử lý 6 2.2.3 Phân đoạn hay phân vùng ảnh 6 2.2.4 Biểu diễn ảnh 7 Mục lục
- Truy vấn ảnh dựa trên biến đổi Wavelet iii 2.2.5 Nhận dạng và nội suy ảnh 7 2.2.6 Cơ sở tri thức 7 2.3 Xử lý nâng cao chất lƣợng ảnh 7 2.3.1 Cải thiện ảnh sử dụng các toán tử điểm 8 2.3.2 Tăng độ tƣơng phản 8 2.3.2.1 Tách nhiễu và phân ngƣỡng 9 2.3.2.2 Biến đổi âm bản 10 2.3.2.3 Cắt theo mức 10 2.3.2.4 Trích chọn bit 11 2.3.2.5 Nén dải độ sáng. 12 2.3.2.6 Mô hình hóa và biến đổi lƣợc đồ xám 12 2.3.3 Cải thiện ảnh dùng các toán tử không gian 12 2.3.3.1 Làm trơn nhiễu bằng lọc tuyến tính 13 2.3.3.2 Làm trơn nhiễu bằng lọc phi tuyến 14 2.3.3.3 Mặt nạ gờ sai phân và làm nhẵn 15 2.3.3.4 Lọc thông thấp, thông cao và lọc dải thông 16 2.3.3.5 Khuếch đại và nội suy ảnh 17 2.3.3.6 Một số kỹ thuật cải thiện ảnh nhị phân 18 2.4 Truy vấn ảnh 19 2.5 Các kỹ thuật truy vấn ảnh 21 2.5.1 Truy vấn theo lời chú thích 21 2.5.2 Truy vấn ảnh theo ngữ nghĩa 22 2.5.3 Truy vấn ảnh theo đối tƣợng (OBIR) 22 2.5.4 Truy vấn ảnh dựa trên nội dung (CBIR) 23 2.5.5 Các vấn đề thƣờng gặp phải 24 Mục lục
- Truy vấn ảnh dựa trên biến đổi Wavelet iv 2.5.6 Các cách tiếp cận hiện tại và giải pháp đƣợc chọn 25 Chƣơng 3: KỸ THUẬT TRUY VẤN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET . 26 3.1 Biến đổi Wavelet 26 3.1.1 Biến đổi Wavelet liên tục 26 3.1.1.1 Phép biến đổi Wavelet thuận 26 3.1.1.2 Biểu diễn các hệ số Wavelet 26 3.1.1.3 Phép biến đổi Wavelet nghịch 27 3.1.1.4 Phép biến đổi Wavelet liên tục hai chiều và nhiều chiều 27 3.1.1.5 Rời rạc hóa phép viến đổi Wavelet liên tục 28 3.1.1.6 Hiệu ứng biên 28 3.1.2 Biến đổi Wavelet rời rạc 28 3.1.2.1 Phép biến đổi Wavelet rời rạc và phân tích đa phân giải 28 3.1.2.2 Phép biến đổi Wavelet rời rạc hai chiều: 29 3.2 Kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet 30 3.2.1 Giới thiệu về kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet 30 3.2.2 Wavelet Haar 31 3.2.3 Bộ lọc Gabor 33 3.2.4 Đặc trƣng cấu trúc và đặc trƣng màu 34 3.2.3.1 Đặc trƣng cấu trúc 34 3.2.3.2 Đặc trƣng màu 34 3.2.5 Thuật toán truy vấn ảnh 35 3.2.6 So sánh độ tƣơng đồng của ảnh và đánh giá hiệu suất của hệ thống 36 Chƣơng 4: MÔ PHỎNG KỸ THUẬT TRUY VẤN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET 37 4.1 Đặt vấn đề mô phỏng trên matlab 37 Mục lục
- Truy vấn ảnh dựa trên biến đổi Wavelet v 4.1.1 Cơ sở dữ liệu ảnh 37 4.1.2 Ảnh đầu vào và các tác nhân gây ảnh hƣởng 37 4.1.2.1 Sự mờ ảnh 37 4.1.2.2 Sự mở rộng nhiễu 38 4.1.3 Tiền xử lý ảnh 38 4.1.3.1 Khôi phục ảnh mờ 38 4.1.3.2 Giảm nhiễu 39 4.2 Lƣu đồ thuật toán 40 4.2.1 Đọc ảnh yêu cầu, chuyển đổi kiểu ảnh và phân tích Wavelet 41 4.2.2 Lấy trị tuyệt đối các hệ số Wavelet 41 4.2.3 Kết hợp chi tiết dọc và ngang 41 4.2.4 Chọn điểm quan trọng 41 4.2.5 Hình thành vector đặc trƣng màu 42 4.2.6 Hình thành vector đặc trƣng cấu trúc 42 4.2.7 Tiến hành so sánh vector đặc trƣng và đƣa ra kết quả 42 4.2.8 Các hàm trong matlab đƣợc sử dụng cho đồ án 43 4.3 Thực nghiệm 43 4.3.1 Đối với đặc trƣng màu sắc 43 4.3.2 Đối với đặc trƣng cấu trúc 44 4.3.3 Tiến hành lựa chọn các thông số phù hợp 44 4.4 Giới thiệu chƣơng trình 48 Chƣơng 5: KẾT QUẢ MÔ PHỎNG KỸ THUẬT TRUY VẤN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET 50 5.1 Kết quả mô phỏng 50 5.2 Độ chính xác 55 Mục lục
- Truy vấn ảnh dựa trên biến đổi Wavelet vi 5.3 Tốc độ truy vấn ảnh 58 Chƣơng 6: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 59 6.1 Kết quả đạt đƣợc 59 6.2 Hƣớng phát triển 59 PHỤ LỤC 60 CODE CHƢƠNG TRÌNH 60 TÀI LIỆU THAM KHẢO 68 LIỆT KÊ HÌNH Chƣơng 2 Hình 2.1: Các bước cơ bản trong xử lý ảnh 6 Hình 2.2: Tách nhiễu 10 Hình 2.3 :Phân ngưỡng 10 Hình 2.4: Biến đổi âm bản 10 Hình 2.5: Kỹ thuật cắt theo mức không có nền 11 Hình 2.6: Kỹ thuật cắt theo mức có nền 11 Hình 2.7: Các toán tử gờ sai phân 16 Hình 2.8: Sơ đồ bộ lọc thông cao. 16 Hình 2.9: Một số nhân chập trong lọc thông cao. 17 Hình 2.10: Khuyếch đại bởi lặp 2x2. 18 Hình 2.11: Mô hình trích đặc trưng thời gian thực 20 Hình 2.12: Mô hình tách riêng cơ sở dữ liệu đặc trưng 21 Liệt kê hình
- Truy vấn ảnh dựa trên biến đổi Wavelet vii Chƣơng 3 Hình 3.1: Phân tích đa phân giải sử dụng biến đổi Wavelet rời rạc 29 Hình 3.2: Phép biến đổi Wavelet rời rạc 2-D 30 Hình 3.3: Sơ đồ khối kỹ thuật truy vần ảnh dựa trên Wavelet 31 Hình 3.4: 2-D DWT bậc 1 32 Hình 3.5: Ví dụ kết quả 2-D DWT bậc 1 32 Chƣơng 4 Hình 4.1: Lưu đồ thuật toán truy vấn ảnh dựa trên biến đổi wavelet. 40 Hình 4.2 So sánh độ chính xác của truy vấn ảnh sử dụng màu, cấu trúc và kết hợp màu, cấu trúc 47 Hình 4.3: Giao diện chương trình 48 Hình 4.4:Giao diện truy vấn ảnh 49 Hình 4.5: Kết quả của truy vấn một ảnh trong loại hình Khung long 49 Chƣơng 5 Hình 5.1: Kết quả trong trường hợp truy vấn đến ảnh Nguoi 50 Hình 5.2: Kết quả trong trường hợp truy vấn đến ảnh Bai bien 50 Hình 5.3: Kết quả trong trường hợp truy vấn đến ảnh Kien truc 51 Hình 5.4: Kết quả trong trường hợp truy vấn đến ảnh Bus 51 Hình 5.5: Kết quả trong trường hợp truy vấn đến ảnh Khung long 52 Hình 5.6: Kết quả trong trường hợp truy vấn đến ảnh Voi 52 Hình 5.7: Kết quả trong trường hợp truy vấn đến ảnh Hoa 53 Hình 5.8: Kết quả trong trường hợp truy vấn đến ảnh Ngua 53 Hình 5.9: Kết quả trong trường hợp truy vấn đến ảnh Nui 54 Hình 5.10: Kết quả trong trường hợp truy vấn đến ảnh Thuc an 54 Hình 5.11: Độ chính xác của 5 loại ảnh có kết quả truy vấn tốt nhất 56 Liệt kê hình
- Truy vấn ảnh dựa trên biến đổi Wavelet viii Hình 5.12 Biểu đồ so sánh độ chính xác của phương pháp đề xuất với các phương pháp truy vấn ảnh khác. 57 LIỆT KÊ BẢNG Chƣơng 4 Bảng 4.1: Các hàm matlab đƣợc sử dụng trong đồ án 43 Bảng 4.2: Thống kê độ chính xác của các thành phần đặc trƣng về màu sắc (%) 44 Bảng 4.3: Thống kê độ chính xác của đặc trƣng về cấu trúc với , , 휙: √ √ √ √ 45 Bảng 4.4: Thống kê độ chính xác của đặc trƣng về cấu trúc với , , 휙: √ √ √ √ 45 Bảng 4.5: Thống kê độ chính xác của đặc trƣng về cấu trúc với , , 휙: √ √ √ √ 46 Bảng 4.6: Thống kê độ chính xác của đặc trƣng về cấu trúc với , , 휙: √ √ √ √ 46 Bảng 4. 7: Độ chính xác truy vấn theo các đặc trƣng màu sắc, cấu trúc và sự kết hợp giữa màu sắc, cấu trúc với các thông số đã đƣợc lựa chọn (%). 47 Chƣơng 5 Bảng 5.1: Thống kê độ chính xác trung bình của các loại ảnh trong cơ sở dữ liệu 55 Bảng 5.2: Độ chính xác của 5 loại ảnh có kết quả truy vấn tốt nhất (%) 55 Bảng 5.3 : So sánh độ chính xác của các phƣơng pháp truy vấn khác. 57 Liệt kê bảng
- Truy vấn ảnh dựa trên biến đổi Wavelet ix LIỆT KÊ TỪ VIẾT TẮT C CBIR Content Based Image Retrieval Truy vấn ảnh dựa trên nội dung CCD Charge Couple Device Camera CCD CSDL Cơ sở dữ liệu D DWT Discrete Wavelet Transformation Biến đổi Wavelet rời rạc DCT Discrete Cosine Transformation Biến đổi Cosine rời rạc F FD Feature vector of query image Vector đặc trƣng của ảnh yêu cầu FQ Feature vector of image in dataset Vector đặc trƣng của ảnh trong cơ sở dữ liệu H HH High- High Cao –cao HL High- Low Cao- thấp HSV Hue- Saturation- Value Màu sắc- độ bão hòa- giá trị HSI Hue- Saturation- Intensity Màu sắc- độ bão hòa- cƣờng độ L LH Low- High Thấp- cao LL Low- Low Thấp- thấp M MSN Microsoft Network Tập hợp các dịch vụ Internet cung cấp bởi Microsoft Liệt kê từ viết tắt
- Truy vấn ảnh dựa trên biến đổi Wavelet x N NRRI Number of relevant retrieval Số ảnh truy vấn thỏa mãn images O OBIR Object Based Image Retrieval Truy vấn ảnh dựa vào đối tƣợng P PSF Point Spread Function Hàm trải rộng điểm, dùng để làm mờ ảnh Q QBIC Query Based Image Content Hệ thống truy vấn dựa trên sự phát thảo do IBM phát triển R RGB Red- Green- Blue Không gian màu RGB S SIFT Scale Invariant Feature Transform Biến đổi đặc trƣng bất biến T TR Total number of relevant images tổng số lƣợng ảnh truy vấn thỏa in dataset mãn có trong cơ sở dữ liệu X XR X top ranking of retrieval image X ảnh gần giống nhất so với ảnh truy vấn Liệt kê từ viết tắt
- Truy vấn ảnh dựa trên biến đổi Wavelet xi TÓM TẮT Việc truy vấn ảnh sẽ tìm ra các hình ảnh tƣơng tự về nội dung với hình ảnh cần truy vấn. Vấn đề đặt ra là cần xây dựng một hệ thống tìm kiếm các hình ảnh tƣơng tự nhƣng vẫn đảm bảo về tốc độ, không gian truy vấn và đặc biệt là độ chính xác. Một phƣơng pháp truy vấn ảnh mới dựa trên biến đổi Wavelet đƣợc đề xuất nhằm cải thiện độ chính xác. Trong luận văn này, nhóm thực hiện đề tài đã phát triển một phƣơng pháp truy vấn ảnh mới dựa trên biến đổi Wavelet để trích đặc trƣng cục bộ của ảnh, đặc trƣng cục bộ bao gồm đặc trƣng màu và đặc trƣng cấu trúc. Khi một bức ảnh đƣợc đƣa vào xem xét, chúng ta biến đổi ảnh sử dụng biến đổi Wavelet tạo thành bốn ảnh băng tần con. Bốn ảnh bao gồm một ảnh với tần số thấp, gần giống nhất so với ảnh gốc ban đầu (LL), một ảnh chứa tần số cao gọi là chi tiết ngang (LH), một ảnh cũng chứa tần số cao gọi là chi tiết dọc (HL), và một ảnh bao gồm cả chi tiết dọc và ngang (HH). Để làm nổi bật cấu trúc và làm mạnh các cạnh, nhóm thực hiện đề tài đã kết hợp thành phần chi tiết dọc và ngang thành một ma trận mới. Bƣớc tiếp theo là đánh giá các điểm quan trọng đƣợc gọi là điểm ý nghĩa bởi một ngƣỡng giá trị cao. Sau khi các điểm ý nghĩa đƣợc trích từ ảnh, tọa độ những điểm ý nghĩa sẽ đƣợc sử dụng để tìm những thông tin quan trọng nhất từ ảnh và chuyển sang các vùng nhỏ hơn. Dựa vào tọa độ những điểm quan trọng này, nhóm thực hiện đề tài đã trích đƣợc các đặc trƣng cục bộ gồm màu và cấu trúc của ảnh. Đây là những nội dung quan trọng của một bức ảnh, và việc truy vấn ảnh là dựa trên sự tƣơng đồng giữa những đặc trƣng ảnh để tìm kiếm các ảnh giống nhau. Tóm tắt
- Truy vấn ảnh dựa trên biến đổi Wavelet xii ABSTRACT Image retrieval will find out the similar images in content with the query image. The problem needs to build the image retrieval system to find the similar images which ensures the speed, space to query and specially, the accuracy. A novel method for retrieving image based on Wavelet transformation is proposed for improving the accuracy. In this research, we develop a novel image retrieval method based on Wavelet transformation to extract the local features of an image, the local features consist color feature and texture teature. Once an image taken into account, we transform it by using Wavelet transformation to four sub-band frequency images. It consists of image with low frequency which most same with the source called approximation (LL), image containing high frequency called horizontal detail (LH), image containing high frequency called vertical detail (HL), and image containing horizontal and vertical detail (HH). In order to enhance the texture and strong edge, we combine the vertical and horizontal detail to be other matrix. The next step is we estimate the important points called significant points by threshold the high value. After the significant points have been extracted from image, the coordinate of significant points will be used for knowing the most important information from the image and convert into small regions. Based on the significant point coordinates, we extract the image texture and color locally. They are the important contents of an image, and retrieving image method compares the similar between feature image to find the similar images. Abstract
- Truy vấn ảnh dựa trên biến đổi Wavelet 1 Chƣơng 1 GIỚI THIỆU 1.1 Vai trò và ứng dụng của kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet Truy vấn ảnh là tìm kiếm một bức ảnh trong cơ sở dữ liệu với hàng nghìn ảnh. Với sự mở rộng của công nghệ đa phƣơng tiện và Internet, truy vấn ảnh đƣợc các nhà khoa học bắt đầu quan tầm từ những năm đầu 1990. Khái niệm truy vấn dựa trên nội dung ra đời từ đầu những năm 1980, và có những ứng dụng quan trọng từ những năm đầu 1990. Ngày nay, cùng với sự phát triển của phần mềm và phần cứng, khối lƣợng ảnh đƣợc lƣu trữ ngày càng lớn trong thƣ viện ảnh số và trên các website. Vì vậy tìm kiếm ảnh là một nhu cầu tất yếu. Hiện tại, truy vấn ảnh ứng dụng trong khá nhiều lĩnh vực nhƣ: quản lý nhãn hiệu logo, truy tìm tội phạm, ứng dụng trong y khoa, quân sự, Mặc dù các nhà nghiên cứu đã có nhiều nỗ lực trong những năm gần đây trong việc nghiên cứu hệ thống truy vấn ảnh nhƣng vẫn chƣa có giải thuật thuyết phục đƣợc chấp nhận phổ biến có thể biểu diễn hoàn chỉnh các đặc điểm nhìn của con ngƣời, đặc biệt là có thể “hiểu” đƣợc ảnh, và điều này luôn là thách thức lớn với tất cả các nhà nghiên cứu. So với các nghiên cứu hệ thống CBIR công bố trƣớc năm 2000, sự khác biệt trong các nghiên cứu gần đây là việc gia tăng của đa dạng các đặc trƣng mô tả ảnh. Các đề xuất bắt nguồn từ cải tiến những đặc trƣng cơ bản (nhƣ histogram màu, texture, shape, ) đến những đặc trƣng ảnh mới dựa trên những phép biến đổi nhƣ Wavelet, Contourlet, và kết hợp đa dạng các mô hình toán học trong thiết kế CBIR. Truy vấn ảnh dựa trên Wavelet là một kỹ thuật mới, có độ chính xác cao hơn so với các kỹ thuật truy vấn ảnh hiện tại. Xuất phát từ thực tế trên, nhóm thực hiện đề tài thực hiện tiến hành tìm hiểu và nghiên cứu đề tài: “Kỹ thuật truy vấn ảnh dựa trên Wavelet”. 1.2 Mục đích của đề tài Tìm hiểu và mô phỏng kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet, qua đó thể Chương 1: Giới thiệu
- Truy vấn ảnh dựa trên biến đổi Wavelet 2 hiện đƣợc ƣu điểm của phƣơng pháp mới này, thể hiện sự cải thiện độ chính xác so với các phƣơng pháp thông thƣờng. Thông qua đó, hình thành và nâng cao cho ngƣời thực hiện đề tài khả năng nghiên cứu khoa học, làm việc nhóm, tìm kiếm tài liệu, phân tích giải quyết vấn đề, tƣ duy và khả năng lập trình. 1.3 Mục tiêu và phạm vi nghiên cứu Nghiên cứu ứng dụng biến đổi Wavelet và hệ thống CBIR mà cụ thể là xây dựng các thuật toán trích đặc trƣng dùng biến đổi Wavelet và giải thuật truy vấn phù hợp. - Tìm hiểu tổng quan về lý thuyết xử lý ảnh. - Tìm hiểu về truy vấn ảnh và các kỹ thuật truy vấn ảnh. - Tìm hiểu về biến đổi Wavelet. - Tìm hiểu kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet. - Mô phỏng kỹ thuật truy vấn ảnh dựa trên Wavelet trên phần mềm Matlab. 1.4 Bố cục của đồ án Nội dung của đồ án gồm 6 chƣơng: - Chƣơng 1: Giới thiệu. Trình bày vai trò và ứng dụng của đề tài, lý do chọn đề tài, mục tiêu cần đạt đƣợc của đề tài, và bố cục của đồ án. - Chƣơng 2: Tổng quan về truy vấn ảnh. Trong chƣơng này trình bày những kiến thức tổng quan về ảnh số, xử lý ảnh, truy vấn ảnh và các kỹ thuật truy vấn ảnh hiện nay. - Chƣơng 3: Kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet. Trình bày lý thuyết về kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet: biến đổi Wavelet, bộ lọc Gabor, đặc trƣng màu, đặc trƣng cấu trúc, và chi tiết về phƣơng pháp truy vấn ảnh đề xuất. - Chƣơng 4: Mô phỏng kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet. Chƣơng này trình bày về việc đặt vấn đề mô phỏng, lƣu đồ giải thuật, cách thức tính toán, chƣơng trình mô phỏng trên matlab. - Chƣơng 5: Kết quả mô phỏng kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet. Chƣơng này trình bày kết quả mô phỏng trong chƣơng 4, giải thích kết quả và nhận xét. - Chƣơng 6: Kết luận và hƣớng phát triển. Trình bày kết kết luận, hƣớng mở rộng phát triển của đề tài trong tƣơng lai. Chương 1: Giới thiệu
- Truy vấn ảnh dựa trên biến đổi Wavelet 3 Chƣơng 2 TỔNG QUAN VỀ TRUY VẤN ẢNH 2.1 Tổng quan về ảnh số Sự phát triển mạnh mẽ của công nghệ ảnh số đã làm số lƣợng hình ảnh đƣợc lƣu trữ trên các trang web tăng lên một cách nhanh chóng. Mỗi ngày, có hàng triệu bức ảnh đƣợc đăng tải cũng nhƣ đƣợc tìm kiếm trên các trang ảnh trực tuyến nhƣ: Flickr, Photobucket, Facebook, Cùng với nhu cầu tìm kiếm văn bản, việc tìm kiếm ảnh cũng nhận đƣợc nhiều sự quan tâm của ngƣời sử dụng. Tuy nhiên, với một số lƣợng ảnh quá lớn trên Internet công việc tìm kiếm trở nên vô cùng khó khăn. Để giải quyết vấn đề này, các hệ thống tìm kiếm ảnh đã ra đời nhƣ: Yahoo, MSN, Google Image Search, Bing, Các hệ thống này cho phép ngƣời sử dụng nhập truy vấn các ảnh cần quan tâm. Thông qua việc phân tích các văn bản đi kèm ảnh, hệ thống gửi trả các ảnh tƣơng ứng theo sự truy vấn của ngƣời dùng. Một số công cụ tìm kiếm ảnh thƣơng mại khác nhƣ Tiltomo, ByoImageSearch, cho phép ngƣời dùng nhập câu hỏi dƣới dạng ảnh. Đây là một hƣớng nghiên cứu mới nhận đƣợc nhiều sự quan tâm của nhiều công trình khoa học trên thế giới. Một số sản phẩm thử nghiệm của các công ty lớn về tìm kiếm ảnh nhƣ: Google Image Swirl, Like, Tineye, Tiltomo, đã ra đời. 2.1.1 Giới thiệu về ảnh số Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật. Ảnh là một sự vật đại diện cho con ngƣời, sinh vật hay sự vật nào đó.v.v ảnh động nhƣ ta thấy trên truyền hình thực chất là tập hợp của rất nhiều ảnh tĩnh liên tiếp. Khi một ảnh đƣợc số hóa thì nó trở thành ảnh số và ảnh số này lại là một tập hợp của rất nhiều phần tử ảnh đƣợc gọi là điểm ảnh hay là “pixel”. Mỗi điểm ảnh lại đƣợc biểu diễn dƣới dạng một số hữu hạn các bit. Chúng ta có thể chia ảnh ra làm ba loại khác nhau: - Ảnh đen-trắng: mỗi điểm ảnh đƣợc biểu diễn bởi một bit. - Ảnh Gray-scale: mỗi điểm ảnh đƣợc biểu diễn bằng các mức chói khác nhau, thƣờng thì ảnh này đƣợc biểu diễn bằng 256 mức chói hay là 8 bit cho mỗi điểm ảnh. Chương 2: Tổng quan về truy vấn ảnh
- Truy vấn ảnh dựa trên biến đổi Wavelet 4 - Ảnh màu: mỗi điểm ảnh chia ra thành tín hiệu chói và tín hiệu màu. 2.1.2 Đặc trƣng màu sắc Tìm kiếm ảnh theo lƣợc đồ màu là phƣơng pháp phổ biến và đƣợc sử dụng nhiều nhất trong các hệ thống tìm kiếm ảnh theo nội dung. Đây là phƣơng pháp đơn giản, tốc độ tìm kiếm tƣơng đối nhanh, tuy nhiên kết quả tìm kiếm có độ chính xác không cao. Đây có thể xem là bƣớc lọc đầu tiên cho những bƣớc tìm kiếm sau đó. Một số lƣợc đồ màu đƣợc sử dụng nhƣ: lƣợc đồ màu RGB, lƣợc đồ màu HSV, lƣợc đồ màu HSI, lƣợc đồ HSI cải tiến. Trong đó, lƣợc đồ màu RGB đƣợc sử dụng phổ biến nhất. Với lƣợc màu RGB có 256 màu thì tƣơng đƣơng với lƣợc đồ màu của ảnh xám. Đối với ảnh 24 bit màu, lƣợc đồ miêu tả khả năng kết nối về cƣờng độ của ba kênh màu R, G, B. Lƣợc đồ màu này đƣợc tính bằng cách rời rạc hóa từng màu trong ảnh, sau đó đếm số điểm ảnh của mỗi màu. Khi mà số lƣợng màu là có hạng, để thuận tiện hơn, ngƣời ta thƣờng chuyển đổi ba kênh màu thành một biến giá trị duy nhất. Một cách khác để tính lƣợc đồ màu của ảnh RGB là ta phân ra làm 3 lƣợc đồ riêng biệt , , . Khi đó, mỗi lƣợc đồ đƣợc tính bằng cách đếm kênh màu tƣơng ứng trong mỗi điểm ảnh. 2.1.3 Đặc trƣng kết cấu Kết cấu là một đối tƣợng dùng để phân hoạch ảnh ra thành những vùng quan tâm để phân lớp những vùng đó. Kết cấu cung cấp thông tin về sự sắp xếp về mặt không gian của màu sắc và cƣờng độ một ảnh. Kết cấu đƣợc đặc trƣng bởi sự phân bổ không gian của những mức cƣờng độ trong một khu vực láng giềng với nhau. Kết cấu gồm các kết cấu gốc hay nhiều kết cấu gộp lại đôi khi gọi là texel. Một số phƣơng pháp dùng để trích xuất các đặc trƣng kết cấu nhƣ: o Kim tự tháp "có thể lái đƣợc". o Biến đổi đƣờng viền. o Biến đổi Gabor Wavelet. o Biểu diễn ma trận đồng hiện. o Hệ thống bộ lọc định hƣớng phức. Chương 2: Tổng quan về truy vấn ảnh
- Truy vấn ảnh dựa trên biến đổi Wavelet 5 2.1.4 Đặc trƣng hình dạng Màu sắc và kết cấu là những thuộc tính có khái niệm toàn cục trong một ảnh. Trong khi đó, hình dạng không phải là một thuộc tính của ảnh. Nói tới hình dạng không phải là nhắc đến hình dạng của một ảnh. Thay vì vậy, hình dạng có khuynh hƣớng chỉ đến một khu vực đặc biệt trong ảnh, hay hình dạng chỉ là biên của một đối tƣợng nào đó trong ảnh. Trong tìm kiếm ảnh theo nội dung, hình dạng là một cấp cao hơn so với màu sắc và kết cấu. Nó đòi hỏi sự phân biệt giữa các vùng để tiến hành xử lý về độ đo của hình dạng. Các hệ thống tìm kiếm ảnh theo nội dung thƣờng khai thác hai nhóm biểu diễn hình dạng sau: Biểu diễn hình dạng theo đƣờng biên: Biểu diễn các đƣờng biên bao bên ngoài. Biểu diễn theo vùng: Biểu diễn một vùng toàn vẹn. 2.1.5 Đặc trƣng cục bộ bất biến Ngƣời ta thƣờng chia đặc trƣng cục bộ thành 2 loại là những điểm trích xuất đƣợc từ điểm "nhô ra" của ảnh và đặc trƣng SIFT đƣợc trích chọn từ các điểm hấp dẫn Haris. 2.2 Giới thiệu về hệ thống xử lý ảnh Hai nhiệm vụ cơ bản của quá trình xử lý ảnh là nâng cao chất lƣợng thông tin hình ảnh và xử lý số liệu cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển. Xét các bƣớc cần thiết trong xử lý ảnh. Quá trình bắt đầu từ việc thu nhận ảnh nguồn (từ các thiết bị thu nhận ảnh dạng số hoặc tƣơng tự) gửi đến máy tính. Trƣớc đây, ảnh thu qua Camera là các ảnh tƣơng tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng đƣợc lấy ra từ Camera, sau đó nó đƣợc chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh có thể quét từ ảnh chụp bằng máy quét ảnh. Hình vẽ dƣới đây mô tả các bƣớc cơ bản trong xử lý ảnh. Dữ liệu ảnh đƣợc lƣu trữ ở định dạng phù hợp với quá trình xử lý. Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tƣợng trong Chương 2: Tổng quan về truy vấn ảnh
- Truy vấn ảnh dựa trên biến đổi Wavelet 6 không gian và nó có thể xem nhƣ một hàm n biến P(c1, c2, , cn). Do đó, ảnh trong xử lý ảnh có thể xem nhƣ ảnh n chiều. Thu Tiền xử Phân Biểu di ễn Nhận dạng nhận lý ảnh đoạn và mô tả và nội suy ảnh ảnh Cơ sở trí thức Hình 2.1: Các bước cơ bản trong xử lý ảnh Sơ đồ này bao gồm các thành phần nhƣ phần đƣợc trình bày sau: 2.2.1 Phần thu nhận ảnh Ảnh có thể nhận qua camera màu hoặc đen trắng. Thƣờng ảnh nhận qua camera là ảnh tƣơng tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (nhƣ loại CCD – Charge Coupled Device) là loại photodiot tạo cƣờng độ sáng tại mỗi điểm ảnh. Camera thƣờng dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều. Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng, phong cảnh). 2.2.2 Tiền xử lý Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử lý để nâng cao chất lƣợng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét hơn. 2.2.3 Phân đoạn hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Chương 2: Tổng quan về truy vấn ảnh
- Truy vấn ảnh dựa trên biến đổi Wavelet 7 2.2.4 Biểu diễn ảnh Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác trong phạm vi ảnh nhận đƣợc. Ví dụ: trong nhận dạng ký tự trên phong bì thƣ, chúng ta miêu tả các đặc trƣng của từng ký tự giúp phân biệt ký tự này với ký tự khác. 2.2.5 Nhận dạng và nội suy ảnh Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học (hoặc lƣu) từ trƣớc. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thƣ có thể đƣợc nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh đƣợc phân theo hai loại nhận dạng ảnh cơ bản: - Nhận dạng theo tham số. - Nhận dạng theo cấu trúc. Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt ngƣời 2.2.6 Cơ sở tri thức Ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phƣơng pháp toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc phát huy. 2.3 Xử lý nâng cao chất lƣợng ảnh Thu nhận ảnh không phải lúc nào cũng cho kết quả là những ảnh có chất lƣợng tốt. Hệ thống truy vấn ảnh phụ thuộc rất nhiều vào chất lƣợng ảnh đầu vào. Trong các ảnh Chương 2: Tổng quan về truy vấn ảnh
- S K L 0 0 2 1 5 4



