Đồ án Mô phỏng hệ thống truy vấn ảnh (Phần 1)

pdf 22 trang phuongnguyen 160
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Mô phỏng hệ thống truy vấn ảnh (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfdo_an_mo_phong_he_thong_truy_van_anh_phan_1.pdf

Nội dung text: Đồ án Mô phỏng hệ thống truy vấn ảnh (Phần 1)

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ KỸ THUẬT ÐIỆN TỬ, TRUYỀN THÔNG MÔ PHỎNG HỆ THỐNG TRUY VẤN ẢNH GVHD :THS. LÊ MINH THÀNH SVTH :TRẦN NGUYỄN SONG TOÀN MSSV:12110304 ÐINH QUỐC DƯƠNG MSSV:12141287 S K L 0 0 4 6 3 2 Tp. Hồ Chí Minh, tháng 07/2016
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬTTHÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀ O TAỌ CHẤ T LƢƠṆ G CAO  ĐỒ ÁN TỐT NGHIỆP MÔ PHỎNG HỆ THỐNG TRUY VẤN ẢNH GVHD :THS. LÊ MINH THÀNH SVTH :TRẦ N NGUYỄN SON G TOÀN MSSV:12110304 ĐINH QUỐC DƢƠNG MSSV:12141287 Khoá :2012 Ngành : CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ, TRUYỀN THÔNG TP. Hồ Chí Minh, tháng 07 năm 2016 i
  3. CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc Tp. Hồ Chí Minh, ngày 15 tháng 07 năm 2016 NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Họ và tên sinh viên 1: Trần Nguyễn Song Toàn MSSV: 12110304 Họ và tên sinh viên 2: Đinh Quốc Dƣơng MSSV: 12141287 Ngành:Công nghệ kỹ thuật điện tử truyền thông Lớp: 12141CLVT Giảng viên hƣớng dẫn: ThS. Lê Minh Thành ĐT: 0908352494 Ngày nhâṇ đề tài: Ngày nộp đề tài: 22/02/2016 23/7/2016 1. Tên đề tài:MÔ PHỎNG HỆ THỐNG TRUY VẤN ẢNH 2. Các số liệu, tài liệu ban đầu: Kohei Arai, C. Rahmad, Wavelet Based Image Retrieval Method, International Journal of Advanced Computer Science and Applications (IJACSA), Vol.3, No.4, 2012 3. Nội dung thƣc̣ hiêṇ đề tài: Tìm hiểu về ảnh màu bao gồm màu sắc và cấu trúc ảnh. Tìm các phƣơng pháp trích đặc trƣng ảnh. Tìm hiểu phép biến đổi Wavelet và ứng dụng vào phân tích đặc trƣng cục bộ của bức ảnh. Tìm hiểu và mô phỏng hệ thống truy vấn ảnh dựa vào phép biến đổi Wavelet. 4. Sản phẩm: Chƣơng trình mô phỏng hệ thống truy vấn ảnh trên Matlab ii
  4. CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh Phúc PHIẾ U NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ và tên Sinh viên: Trần Nguyễn Song Toàn MSSV: 12110304 Đinh Quốc Dƣơng MSSV: 12141287 Ngành: Công nghệ kỹ thuật điện tử truyền thông Tên đề tài: Mô phỏng hệ thống truy vấn ảnh Họ và tên Giáo viên phản biện:ThS. Nguyễn Ngô Lâm NHẬN XÉT 1. Về nội dung đề tài & khối lƣợng thực hiện: 2. Ƣu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày 01 tháng 08năm 2016 Giáo viên hƣớng dẫn (Ký & ghi rõ họ tên) iii
  5. CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh Phúc PHIẾ U NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ và tên Sinh viên: Trần Nguyễn Song Toàn MSSV: 12110304 Đinh Quốc Dƣơng MSSV: 12141287 Ngành: Công nghệ kỹ thuật điện tử truyền thông Tên đề tài: Mô phỏng hệ thống truy vấn ảnh Họ và tên Giáo viên phản biện: ThS. Nguyễn Ngô Lâm NHẬN XÉT 1. Về nội dung đề tài & khối lƣợng thực hiện: 2. Ƣu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày 01 tháng 08 năm 2016 Giáo viên phản biện (Ký & ghi rõ họ tên) iv
  6. LỜI CẢM ƠN Để hoàn thành đồ án tốt nghiệp này và có đƣợc những kiến thức vô cùng quý báu trong quá trình thực hiện,nhóm em xin chân thành gửi lời cảm ơn sâu sắc đến Th.S Lê Minh Thànhlà giảng viên chính trong thời gian qua đã hƣớng dẫn cho nhóm em nhiệt tình, tận tâm và đầy trách nhiệm từ đó giúp nhóm định hƣớng cách thức thực hiện cũng nhƣ góp phần chỉnh sửa giúp nhóm về những mặt hạn chế để có thể hoàn thành đƣợc luận văn tốt nghiệp này. Chúng em xin cảm ơn các Thầy Cô trong bộ môn Điện tử- Viễn thông của trƣờng Đại Học Sƣ Phạm Kỹ Thuật Thành Phố Hồ Chí Minh đã truyền đạt lại rất nhiều kiến thức nền tảng và tạođiều kiện thuận lợi để chúng em có thể hoàn thành tốt đồ án này, và nhóm emcũng xin cảm ơn quý thầy cô trƣờng Đại học Sƣ Phạm Kỹ Thuật Thành Phố Hồ Chí Minh, khoa Điện – Điện Tử đã dạy dỗ chúng trong suốt thời gian qua. Nhóm cũng xin chân thành gửi lời cảm ơn đến các Thầy Cô trong hội đồng bảo vệ đã dành ra chút thời gian để xem bài luận văn tốt nghiệp này, và giúp em chỉ ra những mặt tích cực và hạn chế. Nhóm thực hiện đề tài cũng chân thành cảm ơn các bạn lớp 12141CLVT đã giúp đỡ và góp ý để nhómhoàn thành đề tài.Cuối cùng, nhóm thực hiện xin gửi lời cảm ơn chân thành và sâu sắc nhất đến các bậc cha mẹ, ngƣời thân đã động viên và giúp đỡ nhóm trong suốt chặng đƣờng học tập cũng nhƣ quá trình nghiên cứu đồ án tốt nghiệp. Do thời gian thực hiện đề tài ngắn, kiến thức còn hạn hẹp, dù nhóm đã rất cố gắng nhƣng vẫn không tránh khỏi những sai sót, hạn chế. Nhóm rất mong nhận đƣợc lời chỉ dẫn, góp ý quý báu từ quý thầy cô và bạn bè. Xin chân thành cảm ơn! v
  7. TÓM TẮT Khoảng hơn mƣời năm trở lại đây, phần cứng máy tính và các thiết bị liên quan đã có sự tiến bộ vƣợt bậc về tốc độ tính toán, dung lƣợng chứa lớn, khả năng xử lý nhanh, v.v và giá cả đãgiảm đến mức máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn là thiết bị chuyên dụng nữa. Khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi ngƣời trong xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng cùng với việc đƣa vào máy tính xử lý đã trở nên đơn giản. Truy vấn ảnh là một việc làm rất cần thiết để tìm ra các hình ảnh có nội dung tƣơng tự với hình ảnh cần truy vấn. Vấn đề đặt ra trong đề tài là cần xây dựng một hệ thống tìm kiếm các hình ảnh tƣơng tự nhƣng vẫn đảm bảo về tốc độ, không gian truy vấn và đặc biệt là độ chính xác. Một phƣơng pháp theo lý thuyết đƣợc áp dụng cho việc truy vấn hình ảnh dựa trên việc trích xuất về màu sắc và cấu trúc đã đƣợc đề xuất để cải thiện tính chính xác của đề tài. Với luận văn này, ngƣời thực hiện đã kế thừa và phát triển phƣơng pháp theo lý thuyết đó để truy vấn ảnh dựa trên biến đổi Wavelet để trích xuất đặc trƣng cục bộ của một hình ảnh, đặc trƣng cục bộ đó bao gồm đặc trƣng về cấu trúc và đặc trƣng về màu sắc. Mỗi lần xem xét hình ảnh đầu vàothì cần quan tâmđến bốnbăng tần con của hình ảnh băngtần thấp là hệ số chi tiết gần đúng (LL); băng tần cao đƣợc gọi là hệ số chi tiết ngang (LH); băngtần cao đƣợc gọi là hệ số chi tiết dọc (HL) và băng tần chứa cả hệ số chi tiết ngang và dọc (HH). Các bƣớc cần thực hiện cơ bản trong đề tài: Đầu tiên kết hợp hệ số chi tiết ngang và hệ số chi tiết dọc để tạo ra ma trận khác. Bƣớc tiếp theo là ƣớc lƣợng điểm quan trọng đƣợc gọi là điểm cốt yếu bởi ngƣỡng giá trị cao. Sau khi điểm cốt yếu đƣợc trích xuất từ hình ảnh, tọa độ của điểm quan trọng sẽ đƣợc sử dụng để cho biết thông tin quan trọng từ hình ảnh và chuyển đổi thành các vùng nhỏ. Dựa trên tọa độ của những điểm quan trọng, cấu trúc hình ảnh và màu sắc cục bộ đƣợc trích xuất. vi
  8. MỤC LỤC Trang phụ bìa TRANG Nhiệm vụ đồ án môn hoc̣ ii Trang phiếu nhận xét của giáo viên hƣớng dẫn iii Trang phiếu nhận xét của giáo viên phản biện iv LỜI CẢM ƠN v TÓM TẮT vi MỤC LỤC vii DANH MỤC CÁC TỪ VIẾT TẮT x DANH MỤC CÁC HÌNH ẢNH, BẢNG SỐ LIỆU xi CHƢƠNG 1: GIỚI THIỆU 1 1.1. TỔNG QUAN 1 1.2. MỤC TIÊU ĐỀ TÀI 1 1.3. GIỚI THIỆU ĐỀ TÀI 3 1.4. BỐ CỤC ĐỀ TÀI 5 CHƢƠNG 2: CƠ SỞ LÝ THUYẾT 6 2.1. TỔNG QUAN VỀ ẢNH SỐ 6 2.1.1. Khái niệm về ảnh tĩnh, ảnh số 6 2.1.2. Phân biệt ảnh tĩnh với ảnh số 7 2.2. HỆ THỐNG XỬ LÝ ẢNH SỐ 8 2.3. TRUY VẤN ẢNH 12 2.4. CÁC KỸ THUẬT TRUY VẤN ẢNH 14 2.4.1. Truy vấn theo lời chú thích 14 vii
  9. 2.4.2. Truy vấn theo đối tƣợng 14 2.4.3. Truy vấn theo nội dung 15 2.4.4. Truy vấn theo ngữ nghĩa 17 2.4.5. Truy vấn dựa trên histogram 17 2.4.6. Truy vấn theo màu sắc, vị trí, hình dạng 18 CHƢƠNG 3: KỸ THUẬT TRUY VẤN ẢNH DỰA TRÊNBIẾN ĐỔI WAVELET 3.1. BIẾN ĐỔI WAVELLET RỜI RẠC 20 3.1.1. Phép biến đổi Wavelet rời rạc (DWT) và phân tích đa phân giải (MBA) 20 3.1.2. Biến đổi Wavelet rời rạc hai chiều 21 3.2. KỸ THUẬT TRUY VẤN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET 22 3.2.1. Giới thiệu kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet 23 3.2.2. Phép biến đổi Wavelet Haar 24 3.2.3. Bộlọc Gabor 26 3.2.4. Đặc trƣng về màu sắc và cấu trúc 28 3.2.5. Thuật toán thực hiện 32 3.2.6. Tính toán khoảng cách Euclide để so sánh tƣơng quan và đánh giá hiệu suất hệ thống 33 CHƢƠNG 4: MÔ PHỎNG KỸ THUẬT TRUY VẤN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET 34 4.1. ĐẶT VẤN ĐỀ MÔ PHỎNG 34 4.2. SƠ ĐỒ KHỐI TỔNG QUÁT 34 4.3. LƢU ĐỒ THỰC HIỆN 35 4.3.1. Đọc ảnh, chuyển đổi loại ảnh, phân tích Wavelet 36 viii
  10. 4.3.2. Thực hiện kết hợp chi tiết LH, HL từ các hệ số Wavelet 36 4.3.3. Chọn điểm quan trọng 36 4.3.4. Hình thành vector đặc trƣng màu 37 4.3.5. Hình thành vector đặc trƣng cấu trúc 37 4.3.6. Kết hợp vector màu và cấu trúc để so sánh 37 4.4. THỰC NGHIỆM 37 4.4.1. Đối với màu sắc 37 4.4.2. Đối với cấu trúc 38 4.4.3. Lựa chọn thông số 38 4.4.4. Giao diện mô phỏng bằng Matlab 40 4.4.5. Kết quả mô phỏng 41 CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ĐỀ TÀI 47 5.1. KẾT LUẬN 47 5.2. HƢỚNG PHÁT TRIỂN ĐỀ TÀI 47 TÀI LIỆU THAM KHẢO 48 PHỤ LỤC MÃ NGUỒN MÔ PHỎNG 50 ix
  11. DANH MUC̣ CÁC TƢ̀ VIẾ T TẮ T 1D-DWT 1 DimensionDiscrete Wavelet Transform. 2D-DWT 2 DimensionsDiscrete Wavelet Transform. CBIR Content Based Image Retrieval. CBR Case Based Reasoning. CSDL (Database Images) Cơ Sở dữ liệu. DWT Discrete Wavelet Transform. FT Fourier Transform. HH High- High. HL High- Low. HSV Hue Saturation Value colour space (Human Visual System). LH Low- High. LL Low- Low. OBIR Object Based Image Retrieval. QBIC Query By Image Content. RGB Red Green Blue colour space. STFT Short time Fourier Transform. x
  12. DANH SÁCH CÁC HÌNH ẢNH, BẢNG SỐ LIỆU Hình 2.1Một vài ví dụ về ảnh số 5 Hình 2.2So sánh ảnh tƣơng tự (trái) và ảnh số hóa (phải) 6 Hình 2.3 Các giai đoạn trong xử lí ảnh 7 Hình 2.4a. Ảnh thật 10x10; b. Ảnh đƣợc zoom; c. Mô tả ảnh bằng ma trận điểm 8 Hình 2.5Hệ thống khôi phục ảnh 9 Hình 2.6Mô hình tách riêng cơ sở dữ liệu đặc trƣng 12 Hình 2.7Thống kê theo các kỹ thuật 15 Hình2.8 Bảng thông số 25 màu cơ bản 18 Hình 2.9Phân vùng vị trí 19 Hình 2.10Bảng kết quả thực nghiệm hệ thống của B.G. Prasad, K.K Biswas và S.K. Gupta 19 Hình 3.1 Sơ đồ thuật toán biến đổi 2D-DWT 21 Hình 3.2 Ma trận bốn hệ số băng con LL, LH, HL, HH 22 Hình 3.3 Biến đổi 1D-DWT 24 Hình 3.4Cấp độ 1 của biến đổi 2D-DWT 25 Hình 3.5 Ví dụ cấp độ 1 của biến đổi 2D DWT 25 Hình 3.6Ví dụ về cấu trúc 30 Hình 4.1 Sơ đồ khối tổng quát của hệ thống truy vấn ảnh 34 Hình 4.2 Lƣu đồ thực hiện 35 Bảng 4.3 Thống kê độ chính xác của các thành phần đặc trƣng về màu sắc (%) 39 Bảng 4.4 Thống kê độ chính xác của đặc trƣng về cấu trúc 39 Hình4.5 Giao diện chính mô phỏng bằng Matlab 40 xi
  13. Hình 4.6 Kết quả truy vấn ảnh kiến trúc 41 Hình 4.7 Kết quả truy vấn ảnh bus 42 Hình 4.8 Kết quả truy vấn ảnh khủng long 42 Hình 4.9 Kết quả truy vấn ảnh hoa 43 Hình 4.10 Kết quả truy vấn ảnh ngựa 43 Hình 4.11 Biểu đồ tỷ lệ % độ truy vấn chính xác của 10 loại ảnh 44 Bảng 4.12 Tỷ lệ độ truy vấn chính xác của các phƣơng pháp 45 Hình 4.13 Biểu đồ độ truy vấn chính xác trung bình các phƣơng pháp 46 xii
  14. CHƢƠNG 1 GIỚI THIỆU 1.1 TỔNG QUAN Kỹ thuật truy vấn hình ảnh đã đạt đƣợc nhiều bƣớc tiến lớn trong hơn một thập kỷ trở lại đây. Rất nhiều công trình nghiên cứu đã đƣợc thực hiện bởi rất nhiều nhà nghiên cứu. Kỹ thuật áp dụng cho việc truy vấn tự động của hình ảnh từ một cơ sở dữ liệu dựa vào việc trích xuất màu sắc và cấu trúc. Trong thập kỷ qua, nhiều hệ thống truy xuất hình ảnh đã đƣợc phát triển thành công, chẳng hạn nhƣ hệ thống IBM QBIC đƣợc phát triển tại Trung tâm Nghiên cứu IBM Almaden, hệ thống Virage đƣợc phát triển bởi tập đoàn Virage, hệ thống Photobook đƣợc phát triển bởi MIT Media Lab, hệ thống Visual Seek đƣợc phát triển tại Đại Học Columbia, hệ thống WBIIS đƣợcphát triển tại Đại Học Stanford, hệ thống Blobworld phát triển tại UC Berkeley và hệ thống SIMPLIcity. Trƣớc đó, đặc trƣng màu sắc và cấu trúc đơn giản thì không đủ cơ sở để đại diện cho một hình ảnh, truy vấn hình ảnh dựa trên cấu trúc và màu sắc vẫn còn là một vấn đề dang dở cho đến khi có phƣơng pháp mới này đƣợc đề xuất. Cấu trúc cũng đƣợc coi là một trong những trích xuất đặc trƣngđƣợc nhiều nhà nghiên cứu áp dụng. Cấu trúc cụ thể nhƣ là độ mịn, độ sần sùi và độ bằng phẳng. Các đặc trƣng cấu trúc của một hình ảnh đƣợc phân tích thông qua phƣơng pháp thống kê hoặc phƣơng pháp phổ. 1.2 MỤC TIÊU ĐỀ TÀI Kỹ thuật truy vấn hình ảnh cần thiết đƣợc phát triển và có thể thấy rõ trong nhiều lĩnh vực quan trọng nhƣ: khai thác dữ liệu, giáo dục, hình ảnh trong y học, phòng chống tội phạm, dự báo thời tiết, viễn thám và quản lý tài nguyên đất. Từ các hình ảnh thu thập đƣợc từ thực tế bằng các phƣơng pháp kỹ thuật nhƣ chụp, ghi hình 1
  15. đến các hình ảnh đƣợc tạo ra bằng phƣơng pháp thủ công nhƣ vẽ, từ các ảnh có kích thƣớc lớn đến các ảnh có kích thƣớc nhỏ hoặc siêu nhỏ. Trong mỗi lĩnh vực, hình ảnh đều mang lại các giá trị thiết thực, giúp làm phong phú quá trình phục vụ nhu cầu nhất định của con ngƣời nên nhóm thực hiện lựa chọn đề tài này để có thể phát triển và ứng dụng nhiều hơn nữa để phục vụ việc tìm kiếm hình ảnh trong nhiều lĩnh vực mà xã hội đang và sẽ phát triển trong tƣơng lai. Hiện nay có rất nhiều phƣơng pháp, kỹ thuật truy vấn ảnh nhƣ là: truy vấn hình ảnh bằng chữ ký mờ và cây chữ ký S-Tree, tốn nhiều chi phí và mất nhiều thời gian;truy vấn hình ảnh theo ngữ nghĩa rất phức tạp và có độ chính xác không cao; truy vấn ảnh dựa trên biên xung quanh ảnh v.v. Đề tài này trình bày về việc truy vấn hình ảnh sử dụng các đặc trƣng về màu sắc và cấu trúc thông qua biến đổi Wavelet.Phƣơng pháp này rất đƣợc khuyến khích sử dụng và phát triển, có tính hiệu quả hơn so với các phƣơng pháp thông thƣờng hiện nay. Vì với lý do này, nhóm đã lựa chọn đề tài này để mong muốn ứng dụng truy vấn ảnh đƣợc phát triển và nâng cao hiệu quả. 1.3 GIỚI THIỆU ĐỀ TÀI Hình ảnh truy vấn đƣợc sử dụng để tìm kiếm một hình ảnh bất kỳ trên hàng ngàn hình ảnh trong cơ sở dữ liệu. Trên trang web dựa trên công cụ tìm kiếm, các hình ảnh truy vấn đƣợc sử dụng để tìm kiếm một hình ảnh dựa trên văn bản hoặc hình ảnh đƣa vào. Khi xem xét mỗi ảnh đƣa vào, phƣơng pháp này sẽ giúp tìm kiếm hình ảnh có liên quan nhất so với đầu vào. Các sự tƣơng quan giữa đầu vào và đầu ra đƣợc xác định bằng một vai trò cụ thể. Với sự mở rộng và phát triển kỹ thuật đa phƣơng tiện và Internet, hệ thống CBIR đã trở thành một chủ đề nghiên cứu sôi nổi từ những năm đầu của thập niên 1990. Các khái niệm về truy vấn dựa trên nội dung hình ảnh (CBR) bắt đầu từ những năm đầu tiên của thập niên 1980 và ứng dụng quan trọng bắt đầu vào những năm đầu tiên thập niên 1990. Truy vấn ảnh từ cơ sở dữ liệu với một số 2
  16. lƣợng lớn hình ảnh đã thu hút đƣợc sự chú ý đáng kể từ tầm nhìn máy tính và giá trị nhận dạng mẫu. Tuy nhiên tồn tại hai nhƣợc điểm trong truy vấn ảnh bằng các từ khóa chú thích. Đầu tiên, hình ảnh không phải lúc nào cũng đƣợc chú thích và quá trình chú thích tiêu tốn lƣợng thời gian lớn. Thứ hai, chú thích của con ngƣời không phải là mục tiêu với cùng một hình ảnh và có thể đƣợc chú thích khác nhau bởi những ngƣời quan sát khác nhau [2]. Không giống nhƣ phƣơng pháp truyền thống sử dụng từ khóa chú thích nhƣ là một phƣơng pháp để tìm kiếm hình ảnh, hệ thống CBIR thực hiện truy vấn dựa trên các đặc trƣng tƣơng tự nhƣ là vector của màu sắc, cấu trúc, độ sắc nét và nội dung khác của hình ảnh. So với các hệ thống truyền thống, hệ thống CBIR thực hiện truy vấn khách quan hơn [3]. Một vấn đề rất cơ bản trong thiết kế một hệ thống CBIR là lựa chọn đặc trƣng hiệu quả nhất của hình ảnh để đại diện cho nội dung hình ảnh [4]. Đặc trƣng tổng quát liên quan đến màu sắc hoặc cấu trúc thƣờng đƣợc sử dụng để mô tả nội dung hình ảnh trong truy vấn hình ảnh. Vấn đề về việc sử dụng đặc trƣng tổng quát của phƣơng pháp này là không thể nắm bắt tất cả các phần của hình ảnh có các đặc điểm khác nhau [5]. Để nắm bắt đƣợc các phần cụ thể của hình ảnh thì thƣờngsử dụng các đặc trƣng cục bộ. Phƣơng pháp đề xuất sử dụng phép biến đổi wavelet rời rạc hai chiều với hàm cơ bản nhƣ Haar Wavelet, kết hợp hai tần số cao của băng con để nhấn mạnh lợi thế cạnh tranh đáng kể sau đó ƣớc lƣợng điểm quan trọng đƣợc gọi là điểm cốt yếu bởi ngƣỡng giá trị cao. Sau khi các điểm quan trọng đã đƣợc trích xuất từ hình ảnh, tọa độ của điểm quan trọng sẽ đƣợc sử dụng để cho biết các thông tin quan trọng nhất từ hình ảnh và chuyển đổi thành các vùng nhỏ. Dựa trên tọa độ những điểm quan trọng để sau đó trích xuất các đặc trƣng cấu trúc hình ảnh và màu sắc cục bộ.Phƣơng pháp dựa trên hệ thống CBIR là phƣơng pháp truy xuất hình ảnh quan trọng có hiệu quả nhất và đƣợc nghiên cứu rộng rãi trong các giới học giả. Truy vấn hình ảnh bằng 3
  17. wavelet dựa trên cấu trúc và màu sắc đã làm giảm thời gian xử lý cho việc truy vấn một hình ảnh đại diện tốt nhất. 1.4 BỐ CỤC ĐỒ ÁN Bố cục của đồ án bao gồm 5 chƣơng: Chƣơng 1: Giới thiệu Chƣơng này trình bày vai trò, ứng dụng của đề tài đang nghiên cứu. Trình bày mục đích, nhiệm vụ của đề tài, những mặt tích cực và những vấn đề còn tồn tại; bố cục của đồ án. Chƣơng 2: Cơ sở lý thuyết Tìm hiểu tổng quan về ảnh số, hệ thống xử lý ảnh, truy vấn ảnh. Giới thiệu các kỹ thuật truy vấn ảnh. Chƣơng 3: Kỹ thuật truy vấn ảnh dựa trên biến đổi Wavelet Trình bày về đặc trƣng màu sắc và cấu trúc, mô tả biến đổi Wavelet rời rạc, biến đổi Wavelet Haarcũng nhƣ lý thuyết về bộ lọc Gabor, so sánh sự tƣơng quan hình ảnh, trình bày các bƣớc của thuật toán. Chƣơng 4: Mô phỏng kỹ thuật truy vấn Chƣơng này trình bày về sơ đồ khối tổng quát hệ thống, lƣu đồ và từng bƣớc thuật toán của phƣơng pháp thực hiện. Liệt kê các kết quả đạt đƣợc theo các phƣơng pháp và nhận xét các kết quả. Chƣơng 5:Kết luận và hướng phát triển đề tài Trình bày kết luận của đề tài thực hiện, hƣớng mở rộng phát triển của đề tài trong tƣơng lai. 4
  18. CHƢƠNG 2 CƠ SỞ LÝ THUYẾT 2.1 TỔNG QUAN VỀ ẢNH SỐ 2.1.1 Khái niệm ảnh tĩnh, ảnh số . Ảnh tĩnh (ảnh tƣơng tự): Ảnh tĩnh trong không gian hai chiều đƣợc định nghĩa là một hàm hai biến S(x,y) với S là giá trị biên độ (đƣợc biểu diễn bằng màu sắc) tại vị trí không gian (x,y). . Ảnh số: Ảnh tạo ra bởi điểm ảnh, điểm ảnh có vô vàn thứ, ví dụ nhƣ ảnh chân dung, ảnh X-quang, ảnh thân nhiệt. Điểm ảnh đặc trƣng cho một giá trị nào đó là một hàm n biến. Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để xử lí ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh. Trong quá trình số hóa, ngƣời ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu(rời rạc về không gian) và lƣợng hóa thành phần giá trị mà về nguyên tắc bằng mắt thƣờng không phân biệt đƣợc hai điểm kề nhau. Trong quá trình này ngƣời ta sử dụng khái niệm điểm ảnh. Hình 2.1 Một vài ví dụ về ảnh số 5
  19. Vậy xử lý ảnh số là gì? . Xử lí ảnh số là một loạt các thao tác xử lí ảnh bằng máy tính. . Để cải thiện chất lƣợng ảnh tốt hơn. . Xử lí dữ liệu tự động trên máy tính. 2.1.2 Phân biệt giữa ảnh tƣơng tự và ảnh số - Ảnh tƣơng tự S(x,y): (x,y) liên tục, S liên tục . - Ảnh số S(m,n): (m,n) rời rạc, S rời rạc. - Một ảnh (gồm một tập hợp các điểm ảnh) có thể xem nhƣ bao gồm tập hợp các ảnh con (các vùng ảnh). Thuật ngữ gọi là vùng quan tâm ROIs (Region of Interest). - Ảnh số trong không gian rời rạc thu đƣợc từ ảnh tƣơng tự trong không gian liên tục thông qua quá trình số hóa. Quá trình số hóa có thể hiểu đơn giản nhƣ sau: + Ảnh tƣơng tự đƣợc chia thành M hàng và N cột. + Giao của hàng và cột đƣợc gọi là pixel. + Giá trị biên độ của pixel tại tọa độ nguyên (m,n) là S(m,n): là trung bình độ sáng trong pixel đó S(m,n) ≤ L (với L số mức xám dùng biểu diễn ảnh). - M, N thƣờng đƣợc chọn là M=N=2K (K = 8,9,10). L =2B, B là số bit mã hóa cho độ sáng (biên độ) mỗi pixel. - Ảnh số đƣợc biểu diễn bởi ma trận hai chiều. Các phần tử của nó biểu diễn cho các pixel số hóa. - Ta kí hiệu một ảnh số là S(M,N). Ta nói ảnh có độ phân giải MxN kí hiệu S(m,n) để chỉ ra một phần tử ảnh. Hình 2.2 So sánh ảnh tƣơng tự (trái) và ảnh số hóa (phải) 6
  20. 2.2 HỆ THỐNG XỬ LÝ ẢNH SỐ Hệ thống xử lí ảnh - Xử lí ảnh: Ảnh vào→ Ảnh kết quả. - Đối tƣợng xử lí của hệ thống ở đây là các ảnh (hàm hai biến liên tục hoặc rời rạc) Lƣu trữ Nhận camera dạng Thu nhận Xử lí Hệ quyết Số hóa ảnh Hiển thị ảnh số định sensor Truyền Lƣu trữ thông Hình 2.3 Các giai đoạn trong xử lí ảnh Thu nhận ảnh: - Qua các camera (tƣơng tự, số). - Từ vệ tinh qua các bộ cảm biến. - Qua các máy quét ảnh. Số hóa ảnh: Biến đổi ảnh tƣơng tự thành ảnh rời rạc để xử lý bằng máy tính thông qua quá trình lấy mẫu (rời rạc về mặt không gian) và lƣợng tử hóa(rời rạc về mặt biên độ). Xử lí ảnh số là một tiến trình gồm nhiều công đoạn nhỏ: tăng cƣờng ảnh, khôi phục ảnh, phát hiện biên, phân vùng ảnh, trích chọn các đặc tính, Hệ quyết định: Tùy mục đích của ứng dụng mà chuyển sang giai đọan khác làhiển thị, nhận dạng, phân lớp, truyền thông Các vấn đề cơ bản trong xử lí ảnh  Biểu diển và mô hình hóa Biểu diễn ảnh 7
  21. - Ảnh có thể đƣợc xem là một hàm hai biến chứa các thông tin nhƣ biểu diễn của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lƣợng của hàm này. Dựa vào đặc trƣng của ảnh đó là pixel. Giá trị pixel có thể là một giá trị vô hƣớng, hoặc một vector(3 thành phần trong trƣờng hợp ảnh màu). - Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận điểm. trong mô hình toán học, ảnh hai chiều đƣợc biểu diễn nhờ các hàm hai biến, đó là: ∞ ∞ 푆 , 푛 = =−∞ =−∞ 푆( , 푙)훿( − , 푛 − 푙) (1) Với 0≤m, k≤M-1, 0≤n, l≤N-1 Biễu diễn bằng hàm toán - S: Ảnh. - (m,n): Tọa độ của pixel trong miền không gian (2D). - S(m,n): Độ sáng(Mức xám) của pixel(m,n). - [0-Lmax]: Thang mức xám – Vùng các mức xám đƣợc phép sử dụng. Lmax thƣờng là 255, nghĩa là chúng ta sử dụng thang mức xám 8 bit. 0≤m≤M-1, 0≤n≤N-1, ta gọi đó là ảnh số MxN. Biểu diễn bằng điểm: Hình 2.4 a. Ảnh thật 10x10; b. Ảnh đƣợc zoom; c. Mô tả ảnh bằng ma trận điểm 8