Khóa luận Ứng dụng xử lý ảnh trong phân loại chất lượng gạo (Phần 1)
Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Ứng dụng xử lý ảnh trong phân loại chất lượng gạo (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- khoa_luan_ung_dung_xu_ly_anh_trong_phan_loai_chat_luong_gao.pdf
Nội dung text: Khóa luận Ứng dụng xử lý ảnh trong phân loại chất lượng gạo (Phần 1)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA ỨNG DỤNG XỬ LÝ ẢNH TRONG PHÂN LOẠI CHẤT LƯỢNG GẠO GVHD: TS. LÊ MỸ HÀ SVTH: TRẦN QUỐC DŨNG MSSV: 11151217 SVTH: ĐINH CÔNG PHONG MSSV: 11151155 S K L 0 0 4 1 9 2 Tp. Hồ Chí Minh, tháng 1/2016
- TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP Đề Tài: ỨNG DỤNG XỬ LÝ ẢNH TRONG PHÂN LOẠI CHẤT LƯỢNG GẠO SVTH: TRẦN QUỐC DŨNG MSSV: 11151217 SVTH: ĐINH CÔNG PHONG MSSV: 11151155 Khóa: 2011-2015 Ngành: CNKT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA GVHD: TS. LÊ MỸ HÀ TP. HỒ CHÍ MINH - 01/2016
- CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc Tp. Hồ Chí Minh, ngày tháng .năm 20 NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Họ và tên Sinh viên: Trần Quốc Dũng MSSV: 11151217 Đinh Công Phong MSSV: 11151155 Ngành: Công Nghệ Kỹ Thuật Điều Khiển và Tự Động Hóa Lớp: 11151CL1 Họ và tên giáo viên hướng dẫn: TS. Lê Mỹ Hà ĐT: Ngày nhận đề tài: 5/10/2015 Ngày nộp đề tài : 15/01/2016 1. Tên đề tài: Ứng Dụng Xử Lý Ảnh Trong Phân Loại Chất Lượng Gạo 2. Các số liệu, tài liệu ban đầu: 3. Nội dung thực hiện đề tài: Thiết kế mô hình có khả năng phát hiện được hạt gạo xấu không đạt yêu cầu theo tiêu chuẩn về hình dạng và màu sắc. Quá trình phân tích, xử lý ảnh để tìm ra hạt gạo không đạt chất lượng được lập trình trên phần mềm Matlab. 4. Sản phẩm: Chương trình máy tính và mô hình. TRƯỞNG NGÀNH GIẢNG VIÊN HƯỚNG DẪN TS. Lê Mỹ Hà TS. Lê Mỹ Hà i
- CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh Phúc PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ và tên Sinh viên: Trần Quốc Dũng MSSV: 11151217 Đinh Công Phong MSSV: 11151155 Ngành: Công Nghệ Kỹ Thuật Điều Khiển và Tự Động Hóa Tên đề tài: Ứng Dụng Xử Lý Ảnh Trong Phân Loại Chất Lượng Gạo Họ và tên Giáo viên hướng dẫn: TS. Lê Mỹ Hà NHẬN XÉT 1. Về nội dung đề tài & khối lượng thực hiện: 2. Ưu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày .tháng .năm 20 Giáo viên hướng dẫn ii
- CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh Phúc PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ và tên Sinh viên: Trần Quốc Dũng MSSV: 11151217 Đinh Công Phong MSSV: 11151155 Ngành: Công Nghệ Kỹ Thuật Điều Khiển và Tự Động Hóa Tên đề tài: Ứng Dụng Xử Lý Ảnh Trong Phân Loại Chất Lượng Gạo Họ và tên Giáo viên phản biện: PGS.TS Lê Chí Kiên NHẬN XÉT 1. Về nội dung đề tài & khối lượng thực hiện: 2. Ưu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày .tháng .năm 20 Giáo viên phản biện iii
- LỜI CÁM ƠN Đầu tiên nhóm thực hiện xin gửi lời cảm ơn đến tất cả quý thầy cô giảng dạy tại trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh, đặc biệt là quý thầy cô khoa Điện-Điện Tử, khoa Đào Tạo Chất Lượng Cao những người đã tận tình chỉ dạy cho nhóm trong suốt quá trình học tập tạo tiền đề quan trọng cho nhóm thực hiện đồ án này. Nhóm xin gửi lời cảm ơn chân thành và biết ơn sâu sắc tới TS. Lê Mỹ Hà đã tận tình hướng dẫn, giúp đỡ, cung cấp các kiến thức quan trọng giúp nhóm có nhiều điều kiện thuận lợi trong suốt quá trình thực hiện đồ án. Cuối cùng, nhóm được bày tỏ lòng biết ơn vô hạn tới những người thân trong gia đình, bạn bè đã dành cho nhóm sự quan tâm, động viên trong suốt quá trình học tập cũng như trong thời gian hoàn thành khóa luận tốt nghiệp. Do thời gian nghiên cứu có hạn, chắc chắn khóa luận không tránh khỏi những thiếu sót. Nhóm rất mong nhận được những góp ý, nhận xét của thầy cô và các bạn để đề tài của nhóm được hoàn thiện hơn. Nhóm thực hiện Trần Quốc Dũng Đinh Công Phong iv
- TÓM TẮT ĐỀ TÀI Đề tài này được xây dựng dựa trên mô hình máy phân loại chất lượng gạo trong thực tế nhằm làm hạ giá thành sản phẩm để có thể được sử dụng rộng rãi trên thị trường. Nhóm thiết kế ra mô hình có khả năng phát hiện ra hạt gạo không đạt chất lượng nhờ vào hệ thống xử lý ảnh. Hệ thống gồm camera, máy tính và đèn LED. Camera sẽ chụp ảnh gạo cần kiểm tra rồi sau đó đưa vào máy tính dùng phần mềm Matlab để xử lý. Việc xác định hạt gạo không đạt tiêu chuẩn sẽ dựa vào các tiêu chuẩn về hình dạng và màu sắc. Kết quả thực nghiệm cho thấy hệ thống nhận dạng được sản phẩm lỗi khá cao. Độ chính xác của giải thuật đạt 90%. v
- MỤC LỤC NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP i PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ii PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN iii LỜI CÁM ƠN iv TÓM TẮT ĐỀ TÀI v MỤC LỤC vi DANH MỤC CÁC TỪ VIẾT TẮT viii DANH MỤC CÁC BẢNG BIỂU ix DANH MỤC CÁC HÌNH x Chương 1: TỔNG QUAN 1 1.1. Đặt vấn đề. 1 1.1.1. Tính cấp thiết của đề tài. 1 1.1.2. Tình hình nghiên cứu trong nước. 2 1.1.3. Tình hình nghiên cứu ngoài nước. 2 1.1.4. Giải pháp. 4 1.2. Mục tiêu đề tài. 4 1.3. Giới hạn đề tài. 5 1.4. Nội dung đề tài. 5 Chương 2: CƠ SỞ LÝ THUYẾT 6 2.1. Giới thiệu chung về xử lý ảnh. 6 2.2. Các vấn đề trong quá trình xử lý ảnh. 10 2.2.1. Các thiết bị thu nhận ảnh. 10 2.2.2. Những khái niệm cơ sở về xử lý ảnh . 13 2.2.3. Quá trình xử lý ảnh. 14 2.2.4. Các phép toán hình thái Morphology . 23 2.2.5. Không gian màu. 28 2.2.6. Những định dạng của ảnh. 37 vi
- Chương 3: NHẬN DẠNG GẠO DỰA TRÊN HÌNH DẠNG VÀ MÀU SẮC 39 3.1. Quy trình xử lý ảnh. 39 3.2. Phần mềm sử dụng. 40 3.3. Phân loại theo diện tích và tỷ lệ. 41 3.3.1. Chuyển đổi ảnh RGB sang ảnh mức xám. 41 3.3.2. Lọc nhiễu. 42 3.3.3. Tách biên. 42 3.3.4. Loại nhỏ pixel nhỏ. 43 3.3.5. Phân đoạn ảnh. 44 3.4. Phân loại theo màu sắc. 47 3.4.1. Chuyển ảnh từ hệ màu RGB sang hệ màu Lab. 47 3.4.2. So sánh với ảnh mẫu 48 3.5. Kết quả. 49 Chương 4: KẾT QUẢ THỰC NGHIỆM 50 4.1. Hình ảnh phần cứng mô hình. 50 4.1.1. Khung mô hình. 50 4.1.2. Thiết bị Camera. 51 4.1.3. Thiết bị chiếu sáng. 52 4.2. Kết quả thực nghiệm. 52 Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 59 5.1. Kết luận. 59 5.1.1. Kết quả đạt được. 59 5.1.2. Những mặt hạn chế. 59 5.2. Hướng phát triển. 60 TÀI LIỆU THAM KHẢO 61 PHỤ LỤC 62 vii
- DANH MỤC CÁC TỪ VIẾT TẮT CCD: Charge-Coupled Device CCIR: Comité Consultatif International des Radiocommunications CMYK: Cyan-Magenta-Yellow-Key CIE: Commission Internationale d’Eclairage BMP: Bitmap Picture DSP: Digital Signal Processing/Processor GIF: Graphics Interchange Format HSI: Hue-Saturation-Intensity HSV: Hue-Saturation-Value IMI: Industial Machinery and Instruments IMG: Image JPEG: Joint Photographic Experts Group NTSC: National Television System Committee PAL: Phase Alternate Line RGB: Red-Green-Blue SECAM: Sequential Color with Memory TV: Television viii
- DANH MỤC CÁC BẢNG BIỂU Bảng 1.1: Thông số kỹ thuật máy phân loại gạo 3 Bảng 2.1: Bảng tiêu chuẩn quan sát 36 Bảng 4.1: Độ chính xác trong việc phát hiện gạo không đạt 58 ix
- DANH MỤC CÁC HÌNH Hình 1.1: Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014 1 Hình 1.2: Máy phân loại gạo dòng sản phẩm S.PRECISION trong thực tế. 3 Hình 2.1: Các bước cơ bản trong xử lý ảnh. 7 Hình 2.2: Thiết bị CCD. 12 Hình 2.3: Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b). 13 Hình 2.4: Đường biên của ảnh. 19 Hình 2.5: Đối tượng cần phình A và nhân tạo ảnh B. 24 Hình 2.6: Minh họa quét các bi khắp A . 24 Hình 2.7: Kết quả đạt được. 24 Hình 2.8: Kết quả đạt được. 25 Hình 2.9: Sử dụng phép mở. 26 Hình 2.10: Phép đóng. 27 Hình 2.11: Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới). 28 Hình 2.12: Ba màu cơ bản red, green, blue. 30 Hình 2.13: Mô hình không gian màu RGB. 30 Hình 2.14:Màu cơ bản trong hệ CMYK. 31 Hình 2.15: Mô hình không gian màu HSV biểu diễn dưới dạng hình nón. 32 Hình 2.16: Mô hình không gian màu HSV biểu diễn dưới dạng hình trụ. 33 Hình 2.17: Mô hình không gian màu HSI. 34 Hình 2.18: Mô hình không gian màu CIE- L*a*b*. 35 Hình 2.19: Cấu trúc chung của định dạng ảnh. 38 Hình 3.1: Sơ đồ khối thể hiện quy trình xử lý ảnh gạo. 39 Hình 3.2: Phần mềm Matlab. 40 Hình 3.3: Ảnh gạo RGB. 41 Hình 3.4: Ảnh gạo chuyển mức xám. 41 Hình 3.5: Ảnh đã được lọc nhiễu. 42 Hình 3.6: Ảnh đã được tách biên. 43 Hình 3.7: Ảnh loại bỏ những vùng nhỏ hơn 10 pixel. 43 x
- Hình 3.8: Lắp đầy những vùng biên kín. 44 Hình 3.9: Biên được làm dầy lên. 44 Hình 3.10: Lắp đầy những vùng biên kín lần 2 45 Hình 3.11: Biên được làm mảnh trở lại 45 Hình 3.12: Các vùng ảnh gạo được đánh dấu. 46 Hình 3.13: Những hạt gạo được đánh dấu không đạt yêu cầu theo diện tích và tỷ lệ. 46 Hình 3.14: Ảnh màu RGB. 47 Hình 3.15: Ảnh sau khi chuyển sang hệ màu Lab. 47 Hình 3.16: Ảnh gạo mẫu RGB . 48 Hình 3.17: Ảnh gạo mẫu chuyển sang hệ màu Lab. 48 Hình 3.18: Những hạt gạo được đánh dấu không đạt theo màu sắc. 49 Hình 3.19: Những hạt gạo được đánh dấu không đạt về diện tích, tỷ lệ và màu. 49 Hình 4.1: Khung mô hình phần cứng. 50 Hình 4.2: Vị trí lắp đặt camera. 51 Hình 4.3: Logitech B525 HD Webcam. 51 Hình 4.4: Đèn LED dùng cho chiếu sáng. 52 Hình 4.5: Ảnh 1. 53 Hình 4.6: Ảnh 2 53 Hình 4.7: Ảnh 3 54 Hình 4.8: Ảnh 4 54 Hình 4.9: Ảnh 5 55 Hình 4.10: Ảnh 6 55 Hình 4.11: Ảnh 7 56 Hình 4.12: Ảnh 8 56 Hình 4.13: Ảnh 9 57 Hình 4.14: Ảnh 10 57 xi
- Chương 1: Tổng Quan Chương 1: TỔNG QUAN 1.1. Đặt vấn đề. 1.1.1. Tính cấp thiết của đề tài. Lúa gạo là một trong những cây lương thực chính trên thế giới. Đặc biệt tại Việt Nam đây là cây lương thực chính để tạo ra các sản phẩm thiết yếu để phục vụ đời sống con người. Ngành sản xuất lúa gạo có khả năng tạo nhiều việc làm cho người lao động, tăng danh thu, làm cơ sở phát triển cho các ngành khác, góp phần nâng cao mức sống và ổn định an ninh lương thực từ đó góp phần ổn định tình hình chính trị của đất nước. Với một nước nông nghiệp như Việt Nam hiện nay thì ngành sản xuất lúa gạo vẫn còn là ngành chủ lực trong phần trăm cơ cấu cây trồng và phân công lao động xã hội. Việt Nam có thế mạnh trong việc sản xuất lúa gạo và là nước nhiều năm liền xuất khẩu gạo đứng thứ ba trên thế giới thu về nguồn ngoại tệ lớn. Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014 được thể hiện trong Hình 1.1 [1]. Hình 1.1: Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014. Tuy nhiên, xuất khẩu gạo của Việt Nam vẫn còn gặp không ít khó khăn. Hệ thống sản xuất gạo vẫn còn lạc hậu, sản xuất nhỏ lẻ dẫn đến chất lượng của hạt gạo Việt Nam còn thấp hơn so với các nước xuất khẩu lớn trong khu vực như: Thái Lan, Ấn Độ, Vì thế khả năng cạnh tranh của hạt gạo Việt Nam trên thế giới còn thấp. Việt Trang 1
- Chương 1: Tổng Quan Nam chủ yếu xuất khẩu gạo qua các nước đang phát triển ở châu Á như: Trung Quốc, Philipines, Indonesia, một số nước ở châu Phi. Đối với những thị trường khó tính như: Mỹ, EU, Nhật, thì việc xuất khẩu qua các nước này vẫn còn hạn chế do hạt gạo chưa đáp ứng được chất lượng mà các thị trường này đặt ra. 1.1.2. Tình hình nghiên cứu trong nước. Kỹ thuật phân loại sử dụng các sensor quang đã bước đầu được thực hiện ở Việt Nam từ đầu những năm 90 tại các trung tâm nghiên cứu lớn như Viện Máy và dụng cụ công nghiệp, Trường Đại học Bách khoa Hà Nội Tuy nhiên, kỹ thuật và thiết bị phân loại chỉ có thể ứng dụng cho các đối tượng có màu sắc rõ ràng, di chuyển chậm theo tốc độ và mật độ hoàn toàn xác định trước. Việc nghiên cứu kỹ thuật và thiết bị phân loại đối tượng có màu không rõ ràng di chuyển nhanh với mật độ lớn như các loại vật liệu rời và nông sản thực phẩm dạng hạt thì vẫn chưa được quan tâm đúng mức [2]. Việc ứng dụng xử lý ảnh trong việc phân loại chất lượng gạo cũng đã được nhiều nhiều nhóm thực hiện: Phân loại gạo theo màu sắc của Viện Máy và dụng cụ công nghiệp (IMI); ứng dụng neural và xử lý ảnh trong nhận dạng và phân loại gạo trắng của nhóm tác giả Ths Nguyễn Xuân Vinh, Ths Lê Đình Lượng; nghiên cứu xử lý ảnh trong phân loại sản phẩm theo màu sắc của sinh viên Bùi Nhân Tiến, K6 Khoa Điện tử, Trường ĐH Tôn Đức Thắng (TPHCM). 1.1.3. Tình hình nghiên cứu ngoài nước. Kỹ thuật phân loại vật liệu rời và thực phẩm dạng hạt được nghiên cứu ứng dụng trên thế giới từ những năm 70. Các thế hệ phân loại đầu tiên sử dụng sensor quang rời rạc (photodiodes) để nhận thông tin màu sắc, đồng thời xử lý các thông tin này bằng các thiết bị tương tự. Nguyên tắc phân loại kiểu này tuy bước đầu đáp ứng yêu cầu thị trường phân loại sản phẩm nhưng bộc lộ nhiều nhược điểm: hệ thông phân loại cồng kềnh, năng suất phân loại thấp, sai số lớn, độ linh hoạt không cao, rất khó khăn khi thay đổi đối tượng phân loại. Trang 2
- Chương 1: Tổng Quan Hình 1.2: Máy phân loại gạo dòng sản phẩm S.PRECISION trong thực tế. Bảng 1.1: Thông số kỹ thuật máy phân loại gạo. Mã sản phẩm 5R-6SXM-315 Năng suất (tấn/giờ) 4.0-9.0 Số kênh 315 Độ chính xác (%) ≥ 99.9% Tỷ lệ loại bỏ (tốt: xấu) ≥10:1 Công suất điện (Kw) 2.6 Số máng chính 5 Bắn khí Italy Lượng khí tiêu thụ 2000-3500 (lít/phút) CCD Camera Japan 2048 Pixel Bộ điều khiển USA Màn hình hiển thị Japan Điện áp (V/Hz) 220/50 Trọng lượng (kg) 1043 Kích thước (DxRxC) mm 2279x1640x2015 Cùng với sự phát triển của kỹ thuật quang, các thế hệ đo – thu nhận tín hiệu màu sắc ngày càng đạt độ chính xác cao, tích hợp ngày càng chặt chẽ, gọn nhẹ, trong đó đặc biệt đáng kể là thiết bị quét quang học dựa trên CCD ( Charge Coupled Devides). Các camera quang số kết hợp với kỹ thuật thu nhận – xử lý hình ảnh bằng máy tính đã mở Trang 3
- Chương 1: Tổng Quan ra bước ngoặt mới cho cho thiết bị phân loại sản phẩm: kết cấu máy hết sức gọn nhẹ, độ chính xác cao, linh hoạt khi thay đổi đối tượng phân loại. Nguyên tắc phân loại nhờ camera quang số đã được hầu hết các hãng lớn trên thế giới như Allen, Delta(Mỹ), Sortex (Anh), Satake (Nhật bản) ứng dụng và phát triển cho đến ngày nay. Với thành tựu to lớn trong tất cả các thiết bị điều khiển liên quan đến thiết bị phân loại như kỹ thuật ánh sáng, kỹ thuật –thiết bị camera, kỹ thuật xử lý phân tích màu, thiết bị số, vi xử lý và máy tính, các thiết bị phân loại vật liệu rời dạng hạt ngày nay đã đạt được tốc độ cao, đến hàng chục triệu sản phẩm mỗi giờ, đạt độ chính xác 0- 0.2% và cho phép phân loại sản phẩm có kích thước nhỏ đến 1mm. Với các tính năng trên, thiết bị phân loại đã được ứng dụng rộng rãi trong hầu hết lĩnh vực phân loại vật liệu rời như quặng, đá các loại, thủy tinh, nhựa tái chế cũng như sản phẩm dạng hạt trong lĩnh vực chế biến nông sản thực phẩm như rau, đậu, các loại hoa quả, gạo, cacao, cà phê [2]. Hình 1.2 là hình ảnh của một máy phân loại gạo trong thực tế. 1.1.4. Giải pháp. Nghiên cứu một hệ thống phân loại chất lượng của gạo dùng xử lý ảnh. Hệ thống gồm có một camera thu nhận hình ảnh rồi đưa vào máy tính xử lý để phát hiện ra sản phẩm xấu sau đó dùng súng hơi loại bỏ sản phẩm xấu vừa mới phát hiện. Hệ thống nhỏ gọn giá thành thấp nếu so với máy phân loại gạo trong thực tế của các hãng nước ngoài, khi đưa vào thực tế thì sẽ tiết kiệm được chi phí do giá thành của các máy phân loại gạo rất cao. 1.2. Mục tiêu đề tài. Đề tài “ỨNG DỤNG XỬ LÝ ẢNH TRONG PHÂN LOẠI CHẤT LƯỢNG GẠO” được xây dựng từ máy phân loại gạo trong thực tế nhằm làm hạ giá thành sản phẩm để có thể được sử dụng rộng rãi trên thị trường. Mô hình xây dựng trong đề tài nhỏ gọn thích hợp trong phòng thí nghiệm. Mục tiêu của đề tài này là thiết kế một hệ thống có khả năng phát hiện các sản phẩm xấu không đạt yêu cầu của hạt gạo, có thể đối phó được với nhiễu từ môi trường xung quanh làm ảnh hưởng đến việc phân loại gạo. Trang 4
- Chương 1: Tổng Quan 1.3. Giới hạn đề tài. Đề tài chỉ mới dừng lại ở việc đánh giá chất lượng của hạt gạo theo chỉ tiêu về diện tích, kích thước và màu sắc chưa loại bỏ được hạt không đạt chất lượng. Thời gian và tốc độ xử lý vẫn còn chậm nên chưa thể chạy đúng với thời gian thực. 1.4. Nội dung đề tài. Phần còn lại của đề tài như sau: Chương 2: Cơ sở lý thuyết. Chương này sẽ trình bày cơ bản lý thuyết về xử lý ảnh, các chỉ tiêu đánh giá trong việc phân loại chất lượng của hạt gạo. Chương 3: Nhận dạng gạo dựa trên hình dạng và màu sắc. Chương này sẽ trình bày các bước phân tích để có thể phân loại chất lượng của hạt gạo. Chương 4: Kết quả thực nghiệm. Nội dung chương này tổng hợp các kết quả sau khi thi công mô hình và kết quả đạt được trong việc phân loại gạo. Chương 5: Kết luận và hướng phát triển. Kết quả nhận được khi hoàn thành đề tài, đưa ra các phương án phát triển hoàn thiện mô hình nhằm tiến tới tối ưu hệ thống trong tương lai. Trang 5
- Chương 2: Cơ Sở Lý Thuyết Chương 2: CƠ SỞ LÝ THUYẾT Trong chương này sẽ trình bày sơ lược các khái niệm cơ bản về xử lý ảnh, các quy trình đánh giá chất lượng của hạt gạo dùng xử lý ảnh. Đồng thời cũng trình bày các chỉ tiêu đánh giá chất lượng của hạt gạo. 2.1. Giới thiệu chung về xử lý ảnh. Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới so với nhiều ngành khoa học khác. Song tốc độ của nó phát triển rất nhanh, kích thích được nhiều các trung tâm nghiên cứu về nó với nhiều ứng dụng khác nhau. Xử lý ảnh có thể được áp dụng cho nhiều lĩnh vực khác nhau từ những lĩnh vực về dân sự đến những lĩnh vực an ninh quốc phòng. Xử lý ảnh đang được ứng dụng rất nhiều như trong dự báo cháy rừng, dự báo lũ lụt, dự báo thời tiết, trong lĩnh vực an ninh như nhân dạng vân tay, nhận dạng khuôn mặt, nhận dạng tội phạm. Ngoài ra còn một ứng dụng của xử lý ảnh mà mấy năm trở lại đây được cho là rất quan trọng đó chính là ứng dụng xử lý ảnh trong việc phân biệt màu sắc, nó được áp dụng trong nhiều lĩnh vực khác nhau. Đặc biệt bây giờ đang được áp dụng rất mạnh trong nông nghiệp, như ứng dụng xử lý ảnh cho việc phát hiện vật phẩm xấu. Do vậy xử lý ảnh đang được phát triện hết sức toàn diện trên mọi lĩnh vực. Các bước cần thiết trong xử lý ảnh, đầu tiên ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh). Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 2.1 mô tả các bước cơ bản trong xử lý ảnh [3]. Trang 6
- Chương 2: Cơ Sở Lý Thuyết Hình 2.1: Các bước cơ bản trong xử lý ảnh. Sơ đồ như Hình 2.1 bao gồm các thành phần sau: Phần thu nhận ảnh (Image Acquisition). Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (như loại CCD – Charge Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh) Tiền xử lý (Image Processing). Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. Phân đoạn (Segmentation) hay phân vùng ảnh. Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp Trang 7
- Chương 2: Cơ Sở Lý Thuyết khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Biểu diễn ảnh (Image Representation). Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình thường thu được bằng cách so sánh với mẫu chuẩn đã được học hoặc lưu từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại nhận dạng cơ bản: Nhận dạng theo tham số. Nhận dạng theo cấu trúc. Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự ( chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản(Text), nhân dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người Cơ sở tri thức (Knowledge Base) Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo Trang 8
- Chương 2: Cơ Sở Lý Thuyết tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy. Mô tả (biểu diễn ảnh) Từ Hình 2.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region). Một số phương pháp biểu diễn thường dùng: Biểu diễn bằng mã chạy (Run-LengthCode). Biểu diễn bằng mã xích (Chaine-Code). Biểu diễn bằng mã tứ phân (Quad-Tree Code). Biểu diễn bằng mã chạy. Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân. Một vùng ảnh R có thể mã hóa đơn giản nhờ một ma trận nhị phân: U(m, n) = 1 nếu (m, n) thuộc R. U(m, n) = 0 nếu (m, n) không thuộc R. Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1. Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị“1” liên tục theo chiều ngang hoặc dọc. Biểu diễn bằng mã xích. Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24, mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng. Trang 9
- Chương 2: Cơ Sở Lý Thuyết Biểu diễn bằng mã tứ phân. Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất. 2.2. Các vấn đề trong quá trình xử lý ảnh. 2.2.1. Các thiết bị thu nhận ảnh. Bộ cảm biến ảnh. Bao gồm như máy chụp ảnh, camera có thể ghi lại hình ảnh như phim trong máy chụp ảnh, vidicon trong camera truyền hình. Có nhiều loại máy cảm biến (sensor) làm việc với ánh sáng nhìn thấy được và hồng ngoại như: Micro Densitomerters, Image Disector, Camera Divicon, linh kiện quan điện bằng bán dẫn . Camera. Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera như là con mắt của hệ thống. Có 2 loại camera: camera ống loại CCIR và camera CCD. Loại camera ứng với chuẩn CCIR với tần số 1/25 và mỗi ảnh gồm 25 dòng. Loại CCD gồm các photo điốt và làm tương ứng một cường độ sáng tại một điểm ảnh ứng với một phần tử ảnh (pixel). Như vậy, ảnh là tập hợp các điểm ảnh. Số pixel tạo nên một ảnh gọi là độ phân giải (resolution). Có nhiều kiểu thiết bị tạo ảnh, từ mắt động vật đến những ống kính camera ghi hình và radio. Chúng có thể có hoặc không trang bị thấu kính. Mô hình buồng tối camera đầu tiên được phát minh vào thế kỷ 16 không có các thấu kính, nhưng thay vào đó là một lỗ (pinhole) để hội tụ các tia sáng lên trên tường hoặc tấm mờ. Các lỗ dần dần được thay thế bởi các thấu kính càng ngày càng phức tạp. Nói chung camera thường có hai bộ phận cơ bản một là hệ thống tạo ảnh và hai là bề mặt tạo ảnh có chứa chất nhạy cảm quang. Bề mặt tạo ảnh của một camera thông Trang 10
- Chương 2: Cơ Sở Lý Thuyết thường là hình chữ nhật, nhưng các camera toàn cảnh có thể trang bị mặt tạo ảnh hình trụ để tăng trường nhìn. Những phần tử nhạy tạo ảnh có những đặc trưng khác nhau. Chúng có thể ghi nhận một ảnh rời rạc hoặc một ảnh liên tục về mặt không gian. Hệ thống tạo ảnh có thể là lỗ hoặc là hệ thấu kính trong các camera hiện đại [2]. Cảm biến ảnh CCD (Charge Couple Device). Như chúng ta biết Niepce phát minh ra kỹ thuật chụp ảnh từ đầu thế kỷ 19, nhưng Daguerre mới là người giới thiệu nó với công chúng. Sau hai lần cùng cộng tác trong năm 1826, Daguerre tiếp tục phát triển phương pháp chụp ảnh của riêng mình sử dụng hơi thuỷ ngân để khuếch đại và để lộ ra ảnh được tạo trên miếng đồng mạ bạc được bôi iốt. Phép chụp ảnh Daguerre ngay lập tức thành công khi Arago biểu diễn phương pháp Daguerre ở viện hàn lâm khoa học Pháp năm 1839. Những cột mốc khác trong lịch sử lâu dài của phương pháp chụp ảnh bao gồm phương pháp tấm ướt âm/dương của Legray và Archer năm 1850, phương pháp gelatin (chất lỏng trong suốt không có vị để chế tạo phim ảnh) của Maddox năm 1870, Eastman giới thiệu phim chụp ảnh năm 1889, và phát minh kỹ thuật điện ảnh (cinema) của Lumiere năm 1895 và chụp ảnh màu năm 1908. Các camera CCD (Charge Couple Device) được đề xuất năm 1970 và đã thay thế các camera vidicon trong hầu hết các ứng dụng hiện đại. Cảm biến CCD sử dụng một lưới hình chữ nhật của các điểm (site) thu thập điện tử phủ trên một đế silic mỏng để ghi lại năng lượng ánh sáng đến mỗi điểm trong chúng (hình 2.2). Mỗi một điểm được tạo thành bằng cách cấy một lớp SiO2 trên đế và sau đó lắng đọng một cấu trúc cổng dẫn lên trên. Khi photon đập vào silic, thì cặp điện tử lỗ trống được tạo ra (chuyển đổi quang) và điện tử bị bắt giữ bằng giếng điện thế được tạo thành bởi tác động của một điện thế dương ở cổng tương ứng. Các điện tử được tạo ra ở mỗi điểm được tập hợp qua một chu kỳ thời gian T cố định. Trang 11
- Chương 2: Cơ Sở Lý Thuyết Hình 2.2: Thiết bị CCD. Các điện tích được lưu trữ ở những điểm riêng biệt sẽ được di chuyển sử dụng cách mắc tích nạp điện (charge coupling): Các gói điện tích được truyền từ điểm này đến điểm kia bằng cách vận chuyển các điện thế cổng và bảo tồn các gói riêng biệt. ảnh được đọc ra khỏi CCD một hàng một lần, mỗi hàng được truyền song song tới một thanh ghi lối ra nối tiếp. Giữa hai lần đọc hàng, thanh ghi truyền một ô điện tích của nó một lần (hình 2.1) tới một bộ khuếch đại lối ra tạo ra một tín hiệu tỷ lệ với điện tích nó nhận được. Quá trình này tiếp tục cho tới khi toàn bộ ảnh đã được đọc ra. Nó có thể được lặp lại 30 lần trong một giây (tốc độ TV) cho các ứng dụng ghi hình hoặc ở tốc độ thấp hơn nhiều, bỏ đi nhiều thời gian (giây, phút, thậm chí hàng giờ) để thu thập điện tử trong các ứng dụng mức sáng thấp như thiên văn học. Lưu ý rằng lối ra số của hầu hết các CCD camera được chuyển đổi bên trong thành một tín hiệu ghi hình tương tự trước khi được chuyển tới một bộ bắt hình (frame grabber) ở đó tạo dựng ảnh số cuối cùng. Các CCD camera màu cấp độ dân dụng thực chất sử dụng các chip giống như các camera đen trắng, chỉ khác là các hàng hoặc các cột liên tiếp của cảm biến được tạo ra nhạy cảm với ánh sáng đỏ, lục hoặc lam thường sử dụng một bộ lọc phủ để bù ánh sáng. Các mẫu lọc khác có thể thực hiện được bao gồm các khối khảm (mosaic) 2 2 được tạo bởi các bộ cảm nhận hai lục, một đỏ và một lam (mẫu Bayer). Độ phân giải không gian của camera một CCD tất nhiên là có giới hạn, các camera chất lượng cao hơn sử dụng một bộ chia chùm tia để chuyển ảnh tới 3 CCD khác nhau thông qua các Trang 12
- Chương 2: Cơ Sở Lý Thuyết bộ lọc màu. Các kênh màu riêng biệt sau đó được số hoá hoặc là riêng biệt (lối ra RGB) hoặc kết hợp thành tín hiệu ghi hình màu hỗn hợp (NTSC, SECAM hoặc PAL) hoặc thành định dạng ghi hình thành phần tách rời thông tin màu và độ chiếu sáng [2]. 2.2.2. Những khái niệm cơ sở về xử lý ảnh [2]. Điểm ảnh (Picture Element). Hình 2.3: Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b). Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel.Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y). Trong thị giác máy tính, thường coi một pixel cần khảo sát ở trung tâm có hình chữ nhật thì có 4 pixel hoặc 8 pixel lân cận như mô tả trên hình 2.3. Thường biểu diễn trực tiếp các số đo mức xám của các pixel như hình 2.3c. Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh . Độ phân giải của ảnh. Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một Trang 13
- Chương 2: Cơ Sở Lý Thuyết mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều. Mức xám của ảnh. Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh. Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó. Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255). Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau. Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1. Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈16,7 triệu màu . 2.2.3. Quá trình xử lý ảnh. Trong phạm vi đề tài này ảnh sau khi thu nhận được sẽ được xử lý thay đổi mức xám ảnh, chuyển từ ảnh màu gạo gốc sang ảnh gạo theo mức xám, tiếp theo ảnh được dò tách biên, lấp lỗ trống, làm dày biên để tách đối tượng ra khỏi ảnh. Sau đó ảnh được lọc bỏ các nhiễu và các điểm ảnh lỗi. Sau cùng ảnh được phân đoạn thành các vùng có cùng tính chất nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám [4]. Trang 14
- Chương 2: Cơ Sở Lý Thuyết Chuyển đổi mức xám ảnh. Theo tiêu chuẩn của hệ thống màu NTSC, một ảnh bậc độ xám của một ảnh màu có được bằng cách tính mỗi pixel tương ứng của ảnh bậc độ xám theo công thức [4]: 푌 = 푌푅 + 푌 + 푌 = 훼. 푅 + 훽. + 훿. (2.1) Trong đó: Y là giá trị bậc độ xám của pixel ảnh các bậc độ xám (nhiều khi còn gọi là ảnh đen trắng). Rd, Gd, Bd là giá trị của các pixels màu cơ bản R, G, B. 훼 = 0.29890 훽 = 0.58662 훿 = 0.11448 Lọc nhiễu. Ảnh thu nhận được thường sẽ bị nhiễu nên cần phải loại bỏ nhiễu. Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: làm trơn nhiễu, nổi biên. Để làm trơn nhiễu hay tách nhiễu, người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hoặc lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình). Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua , để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình). Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, lọc Laplace. Người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung [3]. + Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi: 푞푠 = ố + 휂 (2.2) + Nhiễu nhân: Nhiễu nhân thường phân bố khắp ảnh và ảnh thu được sẽ biểu diễn với công thức: 푞푠 = ố ∗ 휂 (2.3) + Nhiễu xung: Nhiễu xung thường gây đột biến tại một số điểm ảnh. Trang 15
- Chương 2: Cơ Sở Lý Thuyết Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp [3]. Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp. Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài (Outlier). Lọc trung bình không gian .Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận và được định nghĩa như sau: 푣( , 푛) = ∑ ∑( ,푙)휖푊 ( , 푙) ( − , 푛 − 푙) (2.4) Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình trên sẽ trở thành: 1 푣( , 푛) = ∑ ∑ ( − , 푛 − 푙) (2.5) ( ,푙)휖푊 với: y(m,n): ảnh đầu vào. v(m,n): ảnh đầu ra. a(k, l) : là cửa sổ lọc. 1 a(k, l)= với 푤 là số điểm ảnh trong cửa sổ lọc W. 푤 Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập H. Nhân chập H trong trường hợp này có dạng: 1 1 1 1 = [1 1 1] 9 1 1 1 Lọc thông thấp. Lọc thông thấp thường được sử dụng để làm trơn nhiễu.Về nguyên lý của bộ lọc thông thấp giống như đã trình bày trên. Trong kỹ thuật này người ta hay dùng một số nhân chập có dạng sau: 1 0 1 0 = [1 2 1] 푡1 8 0 1 0 Trang 16
- Chương 2: Cơ Sở Lý Thuyết 1 1 1 = [ 2 ] ( + 2)2 1 1 Ta dễ dàng nhận thấy khi b =1, Hb chính là nhân chập Ht1 (lọc trung bình). Để hiểu rõ hơn bản chất khử nhiễu cộng của các bộ lọc này, ta viết lại phương trình thu nhận ảnh dưới dạng: 푞푠[ , 푛] = ố [ , 푛] + 휂[ , 푛] (2.6) 2 Trong đó η[m, n] là nhiễu cộng có phương sai σ n. Như vậy, theo cách tính chất của lọc trung bình ta có: 1 푌( , 푛) = ∑ ∑( ,푙)휖푊 푞푠( − , 푛 − 푙) + 휂[ , 푛] (2.7) 푤 Hay: 2 1 휎푛 푌( , 푛) = ∑ ∑( ,푙)휖푊 푞푠( − , 푛 − 푙) + (2.8) 푤 푤 Như vậy, nhiễu cộng trong ảnh đã giảm đi Nw lần. Lọc đồng hình (Homomorphie Filter). Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân. Thực tế, ảnh quan sát được gồm ảnh gốc nhân với một hệ số nhiễu. Gọi X(m, n) là ảnh thu được, X(m, n) là ảnh gốc và η(m, n) là nhiễu, như vậy: ( , 푛) = ̅( , 푛) ∗ 휂( , 푛) (2.9) Lọc đồng hình thực hiện lấy logarit của ảnh quan sát. Do vậy ta có kết quả sau: log ( ( , 푛)) = log ( ̅( , 푛)) ∗ log (휂( , 푛)) (2.10) Rõ ràng, nhiễu nhân có trong ảnh sẽ bị giảm. Sau quá trình lọc tuyến tính, ta chuyển về ảnh cũ bằng phép biến đổi hàm e mũ. Làm trơn nhiễu bằng lọc phi tuyến [3]. Các bộ lọc phi tuyến cũng hay được dùng trong kỹ thuật tăng cường ảnh. Trong kỹ thuật này, người ta dùng bộ lọc trung vị, giả trung vị, lọc ngoài. Với lọc trung vị, điểm ảnh đầu vào sẽ được thay thế bởi trung vị các điểm ảnh còn lọc giả trung vị sẽ dùng trung bình cộng của hai giá trị “trung vị” (trung bình cộng của max và min). Trang 17
- Chương 2: Cơ Sở Lý Thuyết Lọc trung vị. Trung vị được viết với công thức: 푣( , 푛) = 푛 푣푖( ( − , 푛 − 푙)) 푣ớ푖 { , 푙}휖푊 (2.11) Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự tăng hay giảm dần so với giá trị trung vị. Kích thước cửa số thường được chọn sao cho số điểm ảnh trong cửa sổ là lẻ. Các cửa sổ hay dùng là cửa sổ có kích thước 3x3, hay 5x5 hay 7x7. Tính chất của lọc trung vị: + Lọc trung vị là loại lọc phi tuyến. Điều này dẽ nhận thấy từ: Trungvi(x(m)+y(m)) ≠ Trungvi(x(m)) + Trungvi(y(m)). + Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân giải. + Hiệu quả giảm khi số điểm trong cửa sổ lớn hay bằng một nửa số điểm trong cửa sổ. Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớn nhất nếu Nw lẻ. Lọc trung vị cho trường hợp 2 chiều coi như lọc trung vị tách được theo từng chiều. Lọc ngoài (Outlier Filter). Giả thiết có ngưỡng nào đó cho các mức nhiễu (có thể dựa vào lược đồ xám). Tiến hành so sánh giá trị độ xám của một điểm ảnh với trung bình số học 8 lân cận của nó. Nếu sai lệch lớn hơn ngưỡng, điểm ảnh này được coi như nhiễu. Trong trường hợp đó,thay thế giá trị của điểm ảnh bằng giá trị trung bình 8 lân cận vừa tính được. Bộ lọc ngoài có thể diễn tả bằng công thức sau: 훼(푤) 푌( , 푛) = { ( 2.12) ( , 푛) với : α(w) là trung bình cộng các điểm trong lân cận w. Các cửa sổ tính toán thường chọn là 3x3. Tuy nhiên, cửa sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tương quan giữa các điểm ảnh. Vấn đề quan trọng là xác định ngưỡng để loại nhiễu mà vẫn không làm mất thông tin của ảnh. Trang 18
- Chương 2: Cơ Sở Lý Thuyết Phương pháp phát hiện biên [3] [4]. Hình 2.4: Đường biên của ảnh. Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên. Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng. Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một đường biên hay đường bao. Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên của đường biên là một loại đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt. Ngược lại, người ta cũng sử dụng các vùng ảnh để tìm đường phân cách. Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần vẽ một cách đầy đủ. Mô hình biểu diễn đường biên: theo toán học điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột theo Hình 2.4. Như vậy, phát hiện biên một cách lý tưởng là phát hiện được tất cả các đường biên trong các đối tượng. Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên. Điều quan trọng là sự biến thiên giữa các điểm ảnh thường nhỏ, trong khi đó biến thiên độ sáng của điểm biên thường là khá lớn khi qua biên. Xuất phát cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên như sau: Trang 19
- Chương 2: Cơ Sở Lý Thuyết + Phương pháp phát hiện biên trực tiếp: phương pháp này chủ yếu dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm. Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient; nếu lấy đạo hàm bậc hai ta có kỹ thuật Laplace. Hai phương pháp này được gọi chung là phương pháp dò biên cục bộ. Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa vào công cụ toán học là nguyên lý quy hoạch động và được gọi là phương pháp dò biên tổng thể. Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu. + Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy, chúng ta thu được các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên. Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân vùng. Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng nhỏ. Phương pháp gradient: Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc độ thay đổi mức xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều) tức: 휕 ( , ) , ( + , )− ( , ) = ≈ (2.13) 휕 휕 ( , ) , ( , + )− ( , ) = ≈ (2.14) 휕 Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế chọn dx= dy=1). Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng x, y. Gradient trong tọa độ góc (r,θ), với r là véc tơ, θ: góc ( ,휃) 휕 휕 , , = + = 표푠휃 + 푠푖푛휃 (2.15) 휕 휕 (.) f(.) đạt cực đại khi =0 , , tức 표푠휃 + 푠푖푛휃 = 0 hay: Trang 20
- Chương 2: Cơ Sở Lý Thuyết , 푠푖푛휃 푡 휃 = = , 표푠휃 { , (2.16) ,2 , 2 휃 = 푡 ( , ) 푣à = √ + Theo định nghĩa về Gradient, nếu áp dụng nó vào xử lý ảnh, việc tính toán sẽ rất phức tạp. Để đơn giản mà không mất tính chất của phương pháp Gradient, người ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ H1, H2 trực giao (theo 2 hướng vuông góc). Nếu định nghĩa g1, g2 là Gradient theo hai hướng x, y tương ứng thì biên độ g(m,n) tại điểm (m,n) được tính: 2 2 0 = ( , 푛) = √ 1 ( , 푛) + 2 ( , 푛) (2.17) 휃 ( , 푛) = 푡 ( 2( , 푛)/ 1( , 푛)) (2.18) Để giảm độ phức tạp tính toán, A0 được tính gần đúng như sau: 0 = | 1( , 푛)| + | 2( , 푛)| (2.19) Các toán tử đạo hàm được áp dụng khá nhiều. Ở đây ta chỉ nêu lên một số toán tử tiêu biểu: Robert, Sobel, Prewit Toán tử Robert. Trước tiên chúng ta xét toán tử Robert. Toán tử này do Robert đề xuất năm 1965. Nó áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y). Với mỗi điểm ảnh I[x,y] của ảnh I, đạo hàm theo x, theo y được ký hiệu tương ứng g1, g2 được tính: = [ + 1, ] − [ , ] { ( 2.20) = [ , + 1] − [ , ] Điều này tương ứng với việc nhân chập ảnh với hai mặt nạ H1, H2 các mặt nạ này gọi là mặt nạ Robert: 0 1 −1 0 = [ ] = [ ] (2.21) 1 −1 0 2 0 −1 Toán tử Sobel. Toán tử Sobel được Duda và Hart đặt ra 1973 với mặt nạ tương tự như của Robert nhưng cấu hình khác nhau như sau: Trang 21
- Chương 2: Cơ Sở Lý Thuyết −1 0 1 −1 −2 −1 1 = [−2 0 2] 2 = [ 0 0 0 ] (2.22) −1 0 1 1 2 1 Hướng ngang (x) Hướng dọc (y) Toán tử Prewitt. Toán tử được Prewitt đưa ra năm 1970 có dạng −1 0 1 −1 −1 −1 1 = [−1 0 1] 2 = [ 0 0 0 ] (2.23) −1 0 1 1 1 1 Hướng ngang (x) Hướng dọc (y) Thực tế cho thấy rằng, các toán tử Sobel và Prewitt tốt hơn toán tử Robert, bởi chúng ít nhạy cảm với nhiễu. Ta cũng thấy rằng việc lấy đạo hàm một tính hiệu có xu hướng làm tăng nhiễu trong tín hiệu đó. Độ nhạy cảm này có thể làm giảm xuống nhờ các thao tác lấy trung bình cục bộ trong miền phủ bởi mặt nạ. Lưu ý rằng, toán tử Sobel và Prewitt dễ dàng chuyển đổi cho nhau bằng cách thay đổi hệ số. Phân đoạn ảnh [4]. Phân đoạn ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích ảnh thành các vùng có cùng tính chất nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám. Quá trình phân đoạn ảnh nhằm tách đối tượng cần khảo sát ra khỏi phần nội dung còn lại của ảnh, hay phân chia các đối tượng trong ảnh thành những đối tượng riêng biệt. Như vậy quá trình phân đoạn ảnh là quá trình giảm bớt số lượng thông tin trong ảnh và chỉ giữ lại những thông tin cần thiết cho ứng dụng. Do đó phân đoạn ảnh là quá trình loại bỏ các đối tượng không quan tâm trong ảnh. Có nhiều phương pháp phân đoạn ảnh khác nhau. Trong đó quá trình phân đoạn ảnh sử dụng một ngưỡng giá trị xám để phân đoạn ảnh ra thành các đối tượng và nền là phương pháp đơn giản nhất. Lúc này các điểm ở bên dưới ngưỡng giá trị xám thuộc về nền còn những điểm ảnh ở bên trên ngưỡng giá trị xám thuộc về đối tượng. Phương pháp phân đoạn ảnh này hiệu quả lớn đối với ảnh nhị phân, văn bản in hay đồ họa Trang 22
- Chương 2: Cơ Sở Lý Thuyết Dựa vào đặc tính vật lý của vùng ảnh, các kỹ thuật phân đoạn vùng có thể được chia làm 3 loại: Các kỹ thuật cục bộ: dựa trên các đặc tính cục bộ của các điểm ảnh và các lân cận của nó. Các kỹ thuật tổng thể: phân đoạn một ảnh dựa trên cơ sở của thông tin lấy từ tổng thể như sử dụng biểu đồ mức xám histogram. Các kỹ thuật chia, nối và phát triển: dựa trên các khái niệm tương đồng về hình dạng và tính đồng nhất. Hai vùng có thể được nối lại với nhau và liền kề bên nhau. Các vùng không đồng nhất có thể được chia thành các vùng nhỏ. Một vùng có thể được phát triển bằng các nối các điểm ảnh sao cho nó đồng nhất với nhau. 2.2.4. Các phép toán hình thái Morphology [5] [6]. Khái niệm Morphology trong xử lý ảnh số khởi nguồn từ một ngành của sinh học, nghiên cứu về hình thể và cấu trúc của động thực vật. Đây là một công cụ giúp rút trích các thành phần trong ảnh nhị phân, biễu diễn và mô tả chúng dưới dạng các vùng hoặc dạng như các đường biên, xương và bao lồi. Kỹ thuật morphology cũng được áp dụng trên ảnh xám cho các công đoạn tiền/hậu xử lý ảnh (pre or post processing). Các phép toán đầu tiên trong Morphology được phát triển vào những năm 1964 bởi Georges Matheron (1930 - 2000) và Jean Serra (1940) tại trường đại học École des Mines de Paris, Pháp. Matheron là tiến sĩ hướng dẫn của Jean, họ cố gắng xác định số lượng đặc tính của khoáng sản thông qua “thin cross section” và công việc cho ra kết quả là một phương pháp tiếp cận mới, cũng như sự tiến bộ trong hình học tích phân và tô pô. Từ đó đến hết năm 1970, Morphology xử lý cơ bản với các ảnh nhị phân, tạo ra các phép toán và kĩ thuật như: Dilation, Erosion, Opening, Closing . Phép dãn (Dilation). Phép toán Dilation là thao tác dãn nở/phình to các đối tượng ảnh đơn sắc. Gọi A là ảnh góc , B là phần tử cấu trúc là hai tập hợp con trong ℤ2, thực hiện phép toán Trang 23
- Chương 2: Cơ Sở Lý Thuyết Hình 2.5: Đối tượng cần phình A và Hình 2.6: Minh họa quét các 푖 khắp A nhân tạo ảnh B. Hình 2.7:Kết quả đạt được. Dilation trong A theo B ký hiệu A⊕B và được định nghĩa như sau: A⊕B={z | ̂ z ∩ A ≠ ∅}. B chính là nhân tạo hình. Trong thực tế, người ta chọn những nhân tạo ảnh sao cho B= ̂, tức là sử dụng những nhân tạo ảnh có các phần tử trong nhân tạo ảnh đối xứng qua chính tâm của nó. Bên cạnh đó, với việc ta lê những cái tâm z của nhân tạo B ảnh đi khắp A và tìm những điểm nào mà B∩ A ≠ ∅ thì ta có thể hiểu như A⊕B=⋃ 푖∈ 푖 với 푖 là những khu vực mà A ∪ Bi thỏa A ∩ Bi ≠ ∅ .Có thể xem hình minh họa: Hình 2.5, Hình 2.6, Hình 2.7. Phép co (Erosion). Phép toán Erosion là thao tác xói mòn/co hẹp các đối tượng ảnh đơn sắc. Nếu như phép dãn có thể nói là thêm điểm ảnh vào trong đối tượng ảnh, làm cho đối tượng ảnh trở nên lớn hơn thì phép co sẽ làm cho đối tượng ảnh trở nên nhỏ hơn, ít điểm ảnh Trang 24
- Chương 2: Cơ Sở Lý Thuyết Hình 2.8: Kết quả đạt được. hơn (ở đây ta vẫn quan niệm rằng đối tượng ảnh là những điểm ảnh đen ). Trong trường hợp đơn giản nhất, một phép co nhị phân sẽ tách lớp điểm ảnh bao quanh đối tượng ảnh. Dễ hiểu hơn, ta tưởng tượng rằng một ảnh nhị phân có những điểm ảnh đen (đối tượng ảnh ) và điểm ảnh trắng (nền). Từ ảnh ban đầu, ta thay các điểm đen mà lân cận của nó có ít nhất một điểm trắng thành trắng. Khi đó ảnh nhận được là ảnh được co bằng phép co đơn giản. Trong phép co này, mẫu được dùng chính là mảng 3 x 3 của các điểm ảnh đen, đã được nói đến trong phép dãn nhị phân trước đây. Goi A là ảnh gốc, B là phần tử cấu trúc là hai tập hợp con trong ℤ2, thực hiện phéo toán Erosion trong A theo B ký hiệu A⊖B và được định nghĩa như sau: A⊝B={p | ⊆ }. Nói cách khác đó là tập hợp các điểm p thuộc A, mà nếu cấu trúc B dịch chuyển theo các tọa độ của p, thì B vẫn nằm trong đối tượng ảnh A tức B là một tập con của đối tượng cần co ảnh A. Tuy nhiên điều đó sẽ chưa chắc chắn đã đúng nếu như phần tử cấu trúc B không chứa gốc (tức điểm ảnh gốc màu trắng). Để minh họa cách thức phép toán hoạt động có thể xem Hình 2.8 với A và B tương tự như ví dụ ở phép toán Dilation. Phép mở (Openning). Nếu như ta áp dụng phép co ảnh đối với một ảnh và sau đó lại áp dụng tiếp theo phép dãn ảnh đối với kết quả trước thì thao tác đó được gọi là phép mở ảnh, hay nếu gọi I là ảnh, D là Dilation (dãn) và E là Erosion(co). Openning(I)=D(E(I)). Trang 25
- Chương 2: Cơ Sở Lý Thuyết Hình 2.9: Sử dụng phép mở. a. Một ảnh có nhiều vật thể liên kết. b. Các vật thể được cách ly bởi phép mở với cấu trúc đơn giản. c. Một ảnh có nhiễu. d. Ảnh nhiễu sau khi sử dụng phép mở, các điểm nhiễu đen đã biến mất. Tên của phép toán “mở” ảnh dường như cũng phản ánh rõ tác dụng của nó. Tác dụng của nó là mở những khoảng trống nhỏ giữa các phần tiếp xúc trong đối tượng ảnh, làm cho ảnh dường như bớt gai. Hiệu quả dễ quan sát nhất khi sử dụng cấu trúc đơn giản. Hình 2.9 trình bày ảnh có những phần tiếp xúc nhau. Sau thao tác mở đơn giản đối tượng ảnh đã dễ nhận hơn so với ban đầu. Hình 2.9 cũng minh họa một đối tượng khác, hoàn toàn tương tự, sử dụng phép mở ảnh và nhiễu ở giữa số 3 đã biến mất. Bước co trong phép mở ảnh sẽ xóa những điểm ảnh cô lập được coi như những biên, phép dãn ảnh tiếp sau sẽ khôi phục lại các điểm biên và loại nhiễu. Phép đóng (Closing). Tương tự phép mở nhưng trong phép đóng ảnh, thao tác dãn ảnh được thực hiện trước, sau đó mới tới thao tác co ảnh và cùng làm việc trên cùng một phần tử cấu trúc, nếu gọi I là ảnh, D là Dilation (dãn) và E là Erosion(co). Close(I)=E(D(I)). Trang 26
- Chương 2: Cơ Sở Lý Thuyết Hình 2.10: Phép đóng. a. Kết quả đóng của hình 2.d sử dụng cấu trúc đơn giản. b. Ảnh của một bảng mạch được phân ngưỡng và có các vết nứt. c. Ảnh tương tự sau khi đóng những nét dứt đã được nối liền. Nếu như phép mở ảnh tạo ra những khoảng trống nhỏ trong điểm ảnh thì trái lại, phép đóng ảnh sẽ lấp đầy những chỗ hổng đó. Hình 2.10a trình bày một thao tác đóng ảnh áp dụng cho Hình 2.9d, mà nhớ rằng đó là kết quả của việc xóa nhiễu. Phép đóng ảnh có tác dụng trong việc xóa những nhiễu trắng trong đối tượng ảnh mà phép mở ảnh chưa làm được. Hình 2.10b và 2.10c trình bày một ứng dụng của phép co ảnh nhằm nối lại những nét gãy. Ảnh ban đầu Hình 2.10b là một bản mạch, sau khi sử dụng phép co các điểm gãy đã được liên kết nhau ở một số điểm ảnh. Phép đóng ảnh này đã gắn được nhiều điểm ảnh gãy, nhưng không phải là tất cả. Điều quan trọng nhận thấy rằng khi sử dụng những ảnh thực, thật hiếm khi xử lý ảnh một cách hoàn chỉnh mà chỉ cần một kĩ thuật phải sử dụng nhiều phẩn tử cấu trúc mà có khi những kĩ thuật nằm ngoài hình thái học. Đóng ảnh cũng có thể được sử dụng để làm trơn những đường viền của những đối tượng trong ảnh. Thỉnh thoảng việc phân ngưỡng có thể đưa ra một sự xuất hiện những điểm nhám trên viền. Trang 27
- Chương 2: Cơ Sở Lý Thuyết 2.2.5. Không gian màu. Hình 2.11: Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới). Mọi vật mà chúng ta quan sát được là nhờ ánh sáng. Bề mặt của các vật đó là sáng hay tối có hai nguyên nhân chính: năng xuất phản xạ của nó và số lượng ánh sáng mà chúng ta nhận được từ nguồn. Có hai loại nguồn sáng. Loại thứ nhất tự nó phát ra ánh sáng gọi là nguồn sơ cấp (mặt trời, đèn điện ). Loại thứ hai là chỉ phản xạ hay khuyếch tán ánh sáng mà nó nhận được từ các nguồn sáng khác nhau gọi là nguồn sáng thứ cấp (như mặt trăng, đồ vật ). Ánh sáng khác với sóng điện từ khác là mắt người nhận biết được nó. Mắt người nhậy cảm với sóng điện từ trong dải của bước sóng trong khoảng từ 350nm đến 750nm. Hình 2.11 trên biểu diễn các loại sóng điện từ theo bước sóng và dải nhìn thấy được. Cảm nhận màu có được do 3 loại tế bào hình chóp trong võng mạc mắt người. Mỗi tế bào nhậy cảm với một dải phổ nhất định tương ứng với các màu đỏ,xanh lục và xanh dương. Nguồn sáng có thành phần phổ f() được biến đổi bởi bề mặt phản xạ của vật thể. Giả sử r() là hàm phản xạ này. Khi đó số đo R được tạo bởi tế bào màu đỏ sẽ là [2]: R f ()r()h ()d() . (2.24) R Tức là tín hiệu hình ảnh trên các lối ra của sensor(tế bào). Trong thực tế chính bằng tích phân của 3 thành phần phụ thuộc vào bước sóng khác nhau: nguồn sáng f, phản xạ bề mặt của vật r và đặc tính sensor hR . Trang 28
- Chương 2: Cơ Sở Lý Thuyết Vậy mọi màu sắc tự nhiên đều được tổ hợp từ 3 màu cơ bản: đỏ R(red), xanh G(green) và xanh dương B(blue). Người ta cũng đã quy định 3 màu cơ bản ứng với các bước sóng 700 nm(R), bước sóng 546,8 nm(G), và 435,8 nm (B). Có 3 thuộc tính chủ yếu trong cảm nhận màu: Brightness còn gọi là độ chói. Hue còn gọi là sắc thái. Saturation là độ bão hòa màu. Mô hình không gian màu là phương pháp diễn giải các đặc tính và tác động của màu trong ngữ cảnh nhất định. Song không có mô hình màu nào là đầy đủ cho mọi việc được ví dụ như không gian màu RGB ứng dụng cho màn hình, TV và không gian màu HSV dùng cho nhận nhức của con người ngoài ra còn có không gian màu CMYK dùng cho máy in [4]. Mô hình không gian màu RGB. Tổ chức quốc tế về chuẩn hoá màu CIE(Commision Internationale d'Eclairage) đưa ra một số các chuẩn để biểu diễn màu. Các hệ này có các chuẩn riêng, với chuẩn màu CIE-RGB (hệ toạ độ dùng 3 màu cơ bản) được sự kết hợp của 3 màu sắc cơ bản : màu đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue) để mô tả tất cả các màu sắc khác .RGB là không gian màu rất phổ biến được dùng trong đồ họa máy tính và nhiều thiết bị kĩ thuật số khác. Như đã nêu trên, một màu là tổ hợp của các màu cơ bản theo một tỉ lệ nào đấy. Như vậy, một pixel ảnh màu kí hiệu Px được viết [2]: red Px = green (2.25) blue Trang 29
- Chương 2: Cơ Sở Lý Thuyết Hình 2.12: Ba màu cơ bản red, green, blue. Hình 2.13: Mô hình không gian màu RGB. Người ta dùng hệ toạ độ ba màu R-G-B (tương ứng với hệ toạ độ x-y-z) để biểu diễn màu như Hình 2.13. Với cách biểu diễn như Hình 2.13 ta có công thức: đỏ + lục + lơ =1 (2.26) Công thức này gọi là công thức Maxwell. Trong hình trên, tam giác tạo bởi ba đường đứt đoạn gọi là tam giác Maxwell. Trang 30
- Chương 2: Cơ Sở Lý Thuyết Mô hình không gian màu CMYK [7]. Hình 2.14:Màu cơ bản trong hệ CMYK. CMYK (hay đôi khi là YMCK) là từ viết tắt trong tiếng Anh để chỉ mô hình màu loại trừ sử dụng trong in ấn màu. Mô hình màu này dựa trên cơ sở trộn các chất màu của các màu sau: C=Cyan có nghĩa là màu xanh lơ. M=Magenta nghĩa là màu cánh sen hay hồng sẫm. Y=Yellow có nghĩa là màu vàng K=Key (trong tiếng Anh nên hiểu theo nghĩa là cái gì đó then chốt hay chủ yếu để ám chỉ màu đen mặc dù màu này có tên tiếng Anh là black do chữ B đã được sử dụng để chỉ màu xanh lam (blue) trong mô hình màu RGB. Hỗn hợp của các màu CMY lý tưởng là loại trừ (các màu này khi in cùng một chỗ trên nền trắng sẽ tạo ra màu đen). Nguyên lý làm việc của CMYK là trên cơ sở hấp thụ ánh sáng. Màu mà người ta nhìn thấy là từ phần của ánh sáng không bị hấp thụ. Trong CMYK hồng sẫm cộng với vàng sẽ cho màu đỏ, cánh sen cộng với xanh lơ cho màu xanh lam, xanh lơ cộng với vàng sinh ra màu xanh lá cây và tổ hợp của các màu xanh lơ, cánh sen và vàng tạo ra màu đen. Vì màu đen sinh ra bởi việc trộn các màu gốc loại trừ là không thực sự giống như mực đen thật sự hay màu đen của vật đen tuyệt đối (là vật hấp thụ toàn bộ ánh sáng), Trang 31
- Chương 2: Cơ Sở Lý Thuyết việc in ấn trên cơ sở bốn màu (đôi khi gọi là in các màu mặc dù điều này không chính xác) phải sử dụng mực đen để bổ sung thêm vào với các màu gốc loại trừ là các màu vàng, cánh sen và xanh lơ. Nguyên lý làm việc của hệ màu này như sau : Trên một nền giấy trắng, khi mỗi màu này được in lên sẽ loại bỏ dần đi thành phần màu trắng. Ba màu C, M, Y khác nhau in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đó một cách khác nhau và cuối cùng cho ta màu sắc cần in. Khi cần in màu đen, thay vì phải in cả 3 màu người ta dùng màu đen để in lên. Nguyên lý này khác với nguyên lý làm việc của hệ RGB ở chỗ hệ RGB là sự kết hợp của các thành phần màu, còn hệ CMYK là sự loại bỏ lẫn nhau của các thành phần màu. Mô hình không gian màu HSV [7]. HSV là không gian màu được dùng nhiều trong việc chỉnh sữa ảnh, phân tích ảnh và một phần của lĩnh vực thị giác máy tính. Không gian màu HSV là một không gian màu dựa trên ba số liệu: H: (Hue) Vùng màu. S: (Saturation) Độ bão hòa màu. V: (Value) Độ sáng. Không gian màu này thường được biểu diễn dưới dạng hình trụ hoặc hình nón. Hình 2.15: Mô hình không gian màu HSV biểu diễn dưới dạng hình nón. Theo như Hình 2.15, đi theo vòng tròn theo chiều mũi tên từ 0 -360 độ là trường biểu diễn màu sắc(Hue). Trường này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu Trang 32
- Chương 2: Cơ Sở Lý Thuyết xanh lục đầu tiên (green primary) nằm trong khoảng 0-120 độ, từ 120 - 240 độ là màu xanh lục tới xanh lơ (green primary - blue primary). Từ 240 - 360 là từ màu đen tới lại màu đỏ. Hình 2.16: Mô hình không gian màu HSV biểu diễn dưới dạng hình trụ. Theo như cách biểu diễn không gian màu theo hình trụ như Hình 2.16, đi từ giá trị độ sáng (V) được biểu diễn bằng cách đi từ dưới đáy hình trụ lên và nằm trong khoảng từ 0 -1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng lớn nhất (V = 1). Đi từ tâm hình trụ ra mặt trụ là giá trị bão hòa của màu sắc (S). S có giá trị từ 0 - 1. 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất. S = 1 ở ngoài mặt trụ, là nơi mà giá trị màu sắc là đậm đặc nhất. Như vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ thông tin về màu sắc, độ đậm đặc và độ sáng của màu đó. Mô hình không gian màu HSI [8]. Mô hình không gian màu HSI bao gồm 3 thành phần: H: (Hue) Vùng màu có gí trị 0-2π mang thông tin về màu sắc. S: (Saturation) có giá trị từ 0-1 mang thông tin về độ thuần khiết cả thành phần Hue. I: (Intensity) có gí trị 0-1 mang thông tin về độ sáng của điểm ảnh Trang 33
- Chương 2: Cơ Sở Lý Thuyết . Hình 2.17: Mô hình không gian màu HSI. Có thể hình dung không gian màu HSI như là vật hình nón với trục chính biểu thị cường độ sáng Intensity, khoảng cách đến trục biểu thị độ tập trung Saturation, góc xung quanh trục biểu thị cho màu sắc Hue. Đôi khi hệ màu HSI được coi là hệ màu HSV dùng Value thay thế Intensity. Hệ thống màu HSI thì thích hợp hơn với một số thiết kế đồ họa bởi vì nó cung cấp sự điều khiển trực tiếp đến ánh sáng và sắc độ. Hệ thống màu HSI cũng hỗ trợ tốt hơn những thuật toán xử lý ảnh vì tiêu chuẩn hóa về ánh sáng và tập trung vào hai tham số về độ hội tụ màu và cường độ màu. Hệ thống màu HSI có sự phân chia rõ rệt về ánh sáng và màu sắc do đó có khả năng rất lớn được áp dụng cho việc tính đặc trưng và so sánh sự giống nhau về màu sắc của hai ảnh nên thích hợp cho việc tìm kiếm ảnh dựa vào màu. Mô hình không gian màu CIE- L*a*b* [8] . Mô hình không gian màu CIE-L*a* b*, màu được biểu diễn bằng một tổ hợp 3 kênh: L* (Lightness-Luminance): Kênh L* là trục thẳng đứng, biểu diến độ sáng của màu, có giá trị từ 0 (Black) đến 100 (White). Kênh này hoàn toàn chỉ chứa thông tin về độ sáng, không chứa giá trị màu thực sự. Trang 34
- Chương 2: Cơ Sở Lý Thuyết Hình 2.18: Mô hình không gian màu CIE- L*a*b*. Kênh “a*”: Chứa giá trị màu từ Green (-) cho tới Red (+). Kênh “b*”: Chứa giá trị màu từ Blue (-) tới Yellow không làm ảnh hưởng đến màu nguyên thủy của tấm ảnh. Mô hình CIE L*a*b* được xây dựng dựa trên khả năng cảm nhận màu của mắt người. Các giá trị L*a*b* mô tả tất cả những màu mà mắt một người bình thường có thể nhìn thấy được. L*a*b* được xem là một mô hình màu độc lập đối với thiết bị và thường được sử dụng như một cơ sở tham chiếu khi chuyển đổi một màu từ một không gian màu này sang một không gian màu khác. Theo như Hình 2.18, tất cả các màu có cùng một độ sáng sẽ nằm trên cùng một mặt phẳng có dạng hình tròn theo 2 trục a* và b*. Màu có giá trị a* dương thì ngả đỏ, màu có giá trị a* âm thì ngả lục. Tương tự b* dương thì ngả vàng và b* âm thì ngả lam. Còn độ sáng của màu thì thay đổi theo trục dọc. Chuyển đổi không gian màu RGB sang CIE-L*a*b* [11]. Chuyển RGB sang XYZ. 0.412452 0.357580 0.180423 푅 [푌] = [0.212671 0.715160 0.072169] . [ ] (2.27) 푍 0.019334 0.119193 0.950227 Trang 35
- Chương 2: Cơ Sở Lý Thuyết Chuyển XYZ sang CIE- L*a*b*. Nếu X/Xn, Y/Yn, Z/Zn đều lớn hơn 0.008856 thì: ∗ 3 퐿 = 116√푌/푌푛 − 16 (2.28) ∗ 3 3 = 500(√ / 푛 − √푌/푌푛 ) (2.29) ∗ 3 3 = 500(√푌/푌푛 − √푍/푍푛 ) (2.30) Nếu một trong ba X/Xn, Y/Yn, Z/Zn nhỏ hơn hoặc bằng 0.008856 thì: ∗ 퐿 = 903.3(푌/푌푛) (2.31) ∗ = 500[ ( / 푛) − (푌/푌푛)] (2.32) ∗ = 200[ (푌/푌푛) − (푍/푍푛)] (2.33) Trong đó: X, Y, Z là giá trị của hệ màu XYZ. Xn, Yn, Zn là giá trị của vật chiếu sáng. Yn=100. Xn, Zn có giá trị như bảng bên dưới: Bảng 2.1: Bảng tiêu chuẩn quan sát. CIE2 Degree CIE10 Degree Illuminant Standard Observer Standard Observer Xn Zn Xn Zn A 109.83 35.55 111.16 35.19 C 98.04 118.11 97.3 116.14 D65 95.02 108.82 94.83 107.38 F2 98.09 67.53 102.13 69.37 TL4 101.4 65.9 103.82 66.9 UL3000 107.99 33.91 111.12 35.21 D50 96.38 82.45 96.72 81.45 D60 95.23 100.86 95.21 99.6 D75 94.96 122.53 94.45 120.7 Trang 36
- Chương 2: Cơ Sở Lý Thuyết 3 ( / 푛)= √ / 푛 nếu / 푛>0.008856. 16 ( / )=7.87( / )+ nếu / 0.008856. 16 (푌/푌 )=7.87(푌/푌 )+ nếu 푌/푌 0.008856. 16 (푍/푍 )=7.87(푍/푍 )+ nếu 푍/푍 <0.008856. 푛 푛 116 푛 Tìm điểm tương đồng giữa hai ảnh [9]. Để tìm điểm tương đồng giữa hai ảnh ta sử dụng phương pháp tổng bình phương khác biệt SSD( Sum Square Differencens). Phương pháp tổng bình phương khác biệt có công thức như sau: 2 SSD=∑푖,푗∈푤[ (푖, 푗) − 퐽(푖, 푗)] (2.34) 2.2.6. Những định dạng của ảnh. Ảnh thu nhận được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý tiếp theo hay truyền đi. Trong quá trình truyền của kỹ thuật xử lý ảnh, tồn tại nhiều định dạng khác nhau từ ảnh đen trắng như định dạng IMG, ảnh đa cấp xám cho đến ảnh màu (BMP,JPEG,GIF). tùy thuộc định dạng khác nhau. Nhưng chúng đều tuân theo một cấu trúc chung nhất. Nhìn chung một tệp ảnh bất ký thường bao gồm các phần sau: Header: Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu. Data Compression: Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong phần Header. Palette Color: Palette Color(bảng màu) không nhất thiết phải có ví dụ ảnh đen trắng. Nếu có bảng màu được sử dụng để hiển thị màu của Trang 37
- Chương 2: Cơ Sở Lý Thuyết ảnh. Một số các định dạng khác, cấu hình, đặc trưng của từng định dạng và các tham số. Hình 2.19: Cấu trúc chung của định dạng ảnh. Trang 38
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc Chương 3: NHẬN DẠNG GẠO DỰA TRÊN HÌNH DẠNG VÀ MÀU SẮC Chương này sẽ trình bày các bước trong xử lý ảnh để có thể xác định được những hạt gạo không đạt yêu cầu theo hình dáng và màu sắc. 3.1. Quy trình xử lý ảnh. Bắt đầu Ảnh chụp từ camera Chuyển đổi ảnh sang mức Chuyển đổi ảnh từ hệ màu xám RGB sang Lab Lọc nhiễu Tách biên ảnh Gạo đạt về Đ màu sắc Loại bỏ các pixel nhỏ S Phân đoạn ảnh Gạo đạt về S Gạo được đánh dấu và loại bỏ hình dáng Đ Kết thúc Hình 3.1: Sơ đồ khối thể hiện quy trình xử lý ảnh gạo. Trang 39
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc 3.2. Phần mềm sử dụng [10]. Hình 3.2: Phần mềm Matlab. Phần mềm được sử dụng trong quá trình phân tích ảnh là phần mềm Matlab. Matlab là từ viết tắt của Matrix Laboratory, matlab là một chương trình viết cho máy tính PC nhằm hỗ trợ cho các tính toán khoa học và kĩ thuật với các phần tử cơ bản là ma trận trên máy tính cá nhân do công ty "The MATHWORKS" viết ra. Chương trình này hiện đang được sử dụng nhiều trong nghiên cứu các vấn đề tính toán của các bài toán kĩ thuật như: Lý thuyết điều khiển tự động, kĩ thuật thống kê xác suất, xử lý số các tín hiệu, phân tích dữ liệu, dự báo chuổi quan sát Matlab được điều khiển bởi các tập lệnh, tác động qua bàn phím. Nó cũng cho phép một khả năng lập trình với cú pháp thông dịch lệnh – còn gọi là Script file. Các lệnh hay bộ lệnh của Matlab lên đến số hàng trăm và ngày càng được mở rộng bởi các phần Tools Box ( thư viện trợ giúp) hay thông qua các hàm ứng dụng được xây dựng từ người sử dụng. Matlab có hơn 25 Tools Box để trợ giúp cho việc khảo sát những vấn đề có liên quan trên. Tools Box Simulink là phần mở rộng của Matlab, sử dụng để mô phỏng các hệ thống động học một cách nhanh chóng và tiện lợi. Trang 40
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc 3.3. Phân loại theo diện tích và tỷ lệ. 3.3.1. Chuyển đổi ảnh RGB sang ảnh mức xám. Hình 3.3: Ảnh gạo RGB. Hình 3.4: Ảnh gạo chuyển mức xám. Ảnh RGB thường là ảnh màu 24 bit với 3 lớp màu sẽ khó nhận dạng nên ta cần chuyển về ảnh xám dữ liệu 8 bit với một lớp để dể dàng nhận dạng và xử lý ảnh hơn. Trang 41
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc 3.3.2. Lọc nhiễu. Hình 3.5: Ảnh đã được lọc nhiễu. Ảnh thu nhận được thường sẽ bị nhiễu nên cần phải loại bỏ nhiễu. Sử dụng bộ lọc trung vị để lọc nhiễu do nó có ưu điểm là lọc nhiễu tốt nhưng không làm mờ ảnh. Lọc nhiễu giúp cho quá trình xử lý sau này được chính xác hơn. Hình 3.5 ảnh đã được lọc nhiễu qua bộ lọc trung vị. 3.3.3. Tách biên. Sau khi chuyển ảnh màu sang ảnh mức xám, lọc nhiễu tiếp đến cần xác định biên của hạt gạo. Việc phát hiện được biên là cực kì quan trọng vì các kỹ thuật phân đoạn ảnh sau này chủ yếu dựa vào biên. Ở đây toán tử Sobel được dùng để phát hiện được đường biên của hạt gạo. Hình 3.6 ảnh đã được tách biên. Trang 42
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc Hình 3.6: Ảnh đã được tách biên. 3.3.4. Loại nhỏ pixel nhỏ. Hình 3.7: Ảnh loại bỏ những vùng nhỏ hơn 10 pixel. Ảnh sau khi được tách biên thường xuất hiện nhiễu nền vì thế cần khử các nhiễu ngoài gạo. Hình 3.7 loại bỏ những vùng nhỏ hơn 10 pixel. Trang 43
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc 3.3.5. Phân đoạn ảnh. Hình 3.8: Lắp đầy những vùng biên kín. Hình 3.9: Biên được làm dầy lên. Với những vùng biên kín sẽ tiến hành lắp đầy các vùng biên này, được thể hiện như Hình 3.8. Tuy nhiên vẫn còn các vùng biên không kín vì thế mà một số vùng không được lắp đầy nên tiến hành làm dầy biên với bề rộng biên được làm dầy 4 pixel được thể hiện như Hình 3.9. Trang 44
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc Hình 3.10: Lắp đầy những vùng biên kín lần 2. Hình 3.11: Biên được làm mảnh trở lại. Khi những vùng biên còn lại được làm kín tiến hành lắp đầy lần hai những vùng biên này được thể hiện như Hình 3.10. Để trở lại kích thước ban đầu các biên sẽ được làm mảnh trở lại và được thể hiện như Hình 3.11. Trang 45
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc Hình 3.12: Các vùng ảnh gạo được đánh dấu. Hình 3.13: Những hạt gạo được đánh dấu không đạt yêu cầu theo diện tích và tỷ lệ. Tiến hành đánh dấu những vùng có ảnh gạo, những vùng được đánh dấu sẽ tính toán được diện tích và vị trí trọng tâm của vùng có hạt gạo được thể hiện như Hình 3.12. Khi xác định được diện tích tiến hành đánh dấu những hạt gạo không đạt yêu cầu, những hạt không đạt yêu cầu có diện tích nhỏ hơn 400 pixel và tỷ lệ chiều dài/chiều nhỏ hơn 2.5 được thể hiện như Hình 3.13. Trang 46
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc 3.4. Phân loại theo màu sắc. 3.4.1. Chuyển ảnh từ hệ màu RGB sang hệ màu Lab. Hình 3.14: Ảnh màu RGB. Hình 3.15: Ảnh sau khi chuyển sang hệ màu Lab. Do hệ màu RGB là hệ màu được dùng phổ biến trong đồ họa máy tính nên cần chuyển sang hệ màu Lab vì hệ này được xây dựng dựa trên khả năng cảm nhận màu của mắt con người, ảnh sau khi chuyển sang hệ màu Lab được thể hiện như Hình 3.15. Trang 47
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc 3.4.2. So sánh với ảnh mẫu. Hình 3.16: Ảnh gạo mẫu. Hình 3.17: Ảnh gạo mẫu chuyển sang hệ màu Lab. Để xác định những hạt gạo không đạt yêu cầu theo màu sắc cần so sánh ảnh cần xác định với ảnh có hạt gạo mẫu bằng phương pháp SSD (Sum Square Differences-tổng bình phương khác biệt). Ảnh mẫu phải là ảnh có hạt gạo chuẩn về màu sắc được thể hiện như Hình 3.16. Ảnh mẫu cũng cần phải chuyển về hệ màu Lab để đồng nhất trong việc so sánh giữa ảnh mẫu và ảnh cần kiểm tra, Hình 3.17 ảnh mẫu được chuyển sang hệ Lab. Trang 48
- Chương 3: Nhận Dạng Gạo Dựa Trên Hình Dạng Và Màu Sắc Hình 3.18: Những hạt gạo được đánh dấu không đạt theo màu sắc. Sau khi so sánh điểm tương đồng giữa ảnh mẫu và ảnh cần kiểm tra bằng phương pháp SSD tìm ra được những hạt gạo không đạt yêu cầu về màu sắc khi giá trị SSD>900. Những hạt gạo không đạt được đánh dấu như Hình 3.18. 3.5. Kết quả. Hình 3.19: Những hạt gạo được đánh dấu không đạt về diện tích, tỷ lệ và màu Kết hợp giữa việc phân loại gạo theo diện tích, tỷ lệ và màu sắc ta được kết quả như hình 3.19. Trang 49
- Chương 4: Kết Quả Thực Nghiệm Chương 4: KẾT QUẢ THỰC NGHIỆM Trong chương này sẽ trình bày kết quả thực hiện về phần cứng và phần mềm. Kết quả thực hiện có được khi chạy mô hình thực nghiệm phần cứng và phần mềm, kết quả được trình bày cụ thể với những hình ảnh tương ứng. 4.1. Hình ảnh phần cứng mô hình. Sau quá trình thiết kế và thi công mô hình phân loại gạo mô hình được hoàn thành với các bộ phận và thiết bị nhu phần khung mô hình, thiết bị camera, hệ thống LED dùng chiếu sáng. 4.1.1. Khung mô hình. Hình 4.1: Khung mô hình phần cứng. Khung mô hình được thể hiện như Hình 4.1. Khung mô hình là một khối hình hộp chữ nhật kín nhằm ngăn chặn các các yếu tố bên ngoài tác động vào làm ảnh hưởng đến quá trình xử lý ảnh. Trang 50
- Chương 4: Kết Quả Thực Nghiệm 4.1.2. Thiết bị Camera. Hình 4.2: Vị trí lắp đặt camera. Thiết bị thu nhận ảnh để đưa vào máy tính xử lý là loại Logitech B525 HD Webcam. Thiết bị thu nhận ảnh cực kỳ quan trọng vì nó sẻ quyết định đến chất lượng ảnh, vì chất lượng ảnh càng cao thì quá trình xử lý càng dễ dàng. Hình 4.2 là vị trí lắp đặt camera. Camera sử dụng là loại Logitech B525 HD Webcam với độ phân giải 1280x720, tốc độ chụp ảnh là 30 frame/s tự động lấy nét. Sử dụng cảm biến 2,0 megapixel với công nghệ RightLight ™ 2. Hình 4.2 là loại Logitech B525 HD Webcam. Hình 4.3: Logitech B525 HD Webcam. Trang 51
- Chương 4: Kết Quả Thực Nghiệm 4.1.3. Thiết bị chiếu sáng. Hình 4.4: Đèn LED dùng cho chiếu sáng. Nhằm đảm bảo trong việc xác định chính xác màu của hạt gạo mô hình sử dụng loại LED có ánh sáng trắng với công suất 3w. Hình 4.4 là hệ thống đèn LED dùng cho chiếu sáng. 4.2. Kết quả thực nghiệm. Sau khi tiến hành chạy mô hình phần cứng đạt được kết quả tương đối tốt, có thể phát hiện được những hạt không đạt chất lượng. Những hạt không đạt chất lượng sẽ được đánh dấu màu vàng. Sau khi tiến hành kiểm tra với 10 ảnh khác nhau thì tỷ lệ phát hiện gạo không đạt chất lượng tương đối cao. Trang 52
- Chương 4: Kết Quả Thực Nghiệm Hình 4.5: Ảnh 1. Hình 4.6: Ảnh 2. Trang 53
- Chương 4: Kết Quả Thực Nghiệm Hình 4.7: Ảnh 3. Hình 4.8: Ảnh 4. Trang 54
- Chương 4: Kết Quả Thực Nghiệm Hình 4.9: Ảnh 5. Hình 4.10: Ảnh 6. Trang 55
- Chương 4: Kết Quả Thực Nghiệm Hình 4.11: Ảnh 7. Hình 4.12: Ảnh 8. Trang 56
- Chương 4: Kết Quả Thực Nghiệm Hình 4.13: Ảnh 9. Hình 4.14: Ảnh 10. Trang 57
- Chương 4: Kết Quả Thực Nghiệm Kết quả phát hiện gạo không đạt: Bảng 4.1: Độ chính xác trong việc phát hiện gạo không đạt. Ảnh 1 2 3 4 5 6 7 8 9 10 Độ chính 92.3 88.9 91.2 91.4 90 87 96.7 100 100 94.7 xác (%) Trang 58
- Chương 5: Kết Luận và Hướng Phát Triển Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Trong chương này sẽ trình bày những nhận xét, đánh giá kết quả đã đạt được đồng thời cũng trình bày những hạn chế mà đề tài gặp phải. Đồng thời cũng đưa ra hướng giải quyết những vấn đề mà đề tài còn mắc phải và đề xuất các phương án phát triển trong tương lai nhằm hoàn thiện đề tài hơn. 5.1. Kết luận. 5.1.1. Kết quả đạt được. Tổng hợp các kết quả đạt được đã trình bài chi tiết trong chương 4, so sánh các kết quả đó với những yêu cầu thiết kế cho thấy hệ thống đã đáp ứng tương đối đầy đủ các mục tiêu đề ra với những kết quả đạt được như sau: + Mô hình phần cứng hoạt động tương đối tốt. Thiết bị gọn nhẹ, lắp đặt dễ dàng, có tính kinh tế thuận tiện cho mục đích mô phỏng phục vụ vào việc học tập, có thể phát triển và ứng dụng vào thực tế về sau. + Chương trình xử lý ảnh được xây dựng khá tốt, mô hình hoạt động khá ỗn định trong phạm vi cho phép. + Phát hiện được các hạt gạo không đạt yêu cầu theo tiêu chuẩn về diện tích, tỷ lệ và màu sắc. 5.1.2. Những mặt hạn chế. Ngoài những kết quả đạt được nêu trên thì đề tài vẫn còn những mặt hạn chế sau: + Thời gian và tốc độ xử lý của mô hình còn chậm. + Đối với những ảnh chụp có những hạt gạo bị dính nhau sẽ dẫn đến việc xác định sai diện tích của hạt gạo. Trang 59
- Chương 5: Kết Luận và Hướng Phát Triển 5.2. Hướng phát triển. Từ những mặt hạn của đề tài, để đề tài hoạt động tốt và có thể ứng dụng vào thực tế sau này nhóm đã đề ra những hướng phát triển như sau: + Để tốc độ đạt nhanh nhất đáp ứng xử lý ảnh trong thời gian thực thì nên xử lý ảnh bằng chíp xử lý có tốc độ nhanh như chip DSP. + Sử dụng thiết bị chụp ảnh có chất lượng tốt. + Sử dụng thêm hệ thống súng hơi để có thể loại bỏ được những hạt gạo không đạt chất lượng. Trang 60
- Tài Liệu Tham Khảo TÀI LIỆU THAM KHẢO [1]. Báo cáo của Hiệp hội Lương thực Việt Nam (VFA) ngày 19/1/2015. [2]. Hà Thiên Sơn (2008), Nghiên Cứu Máy Phân Loại Cà Phê Bằng Màu Sắc, Khoa Điện tử -Viễn Thông, Đại học Công Nghệ-Đại học Quốc Gia Hà Nội. [3]. PGS.TS Nguyễn Quang Hoan (2006), Xử lý ảnh, Học Viện Công Nghệ Bưu Chính Viễn Thông. [4]. Ths Nguyễn Xuân Vinh, Ths Lê Đình Lương (2010), Ứng Dụng Xử Lý Ảnh và Mạng Nơron Trong Phân Loại Gạo Trắng Thành Phẩm, Trường Đại học Kỹ Thuật Công Nghệ. [5]. Vũ Văn Trọng Nghĩa và các cộng sự (2010), Phương Pháp Morphology, Khoa Toán-Tin Học, Đại học KHTN TP HCM. [6]. Vũ Việt Hà (2009), Tìm Hiểu Các Phép Toán Hình Thái, Trường Đại học Dân Lập Hải Phòng. [7]. Nguyễn Hoài Anh (2014), Kỹ Thuật Đồ Họa Và Xử Lý Ảnh, khoa Công Nghệ Thông Tin, Học Viện Kỹ Thuật Quân Sự. [8]. Nguyễn Hoàng Bách và các cộng sự (2010), Cảm Nhận và Biểu Diễn Màu Sắc, Đại học Bách Khoa Hà Nội. [9]. Bạch Ngọc Minh (2014), Nghiên Cứu So Sánh Các Thuật Toán Xử Lý Ảnh Tính Độ Sâu Ảnh Stereo Ứng Dụng Trong Hệ Thống Camera Thị Giác, Trung tâm Phát triển Đại học Quốc gia Hà Nội. [10]. Ths. Thái Duy Quý (2013), Matlab Căn Bản, khoa Công Nghệ Thông Tin, Đại học Đà Lạt. [11]. CIE-L*a*b* Color Scale, Applications Note. Trang 61
- Phụ Lục PHỤ LỤC Code chương trình: clear all close all a = imread('C:\Users\PHONG\Downloads\ANH\1.jpg'); figure imshow(a); B=rgb2gray(a); figure imshow(B); X=medfilt2(B);%loc nhieu bang bo loc trung vi figure imshow(X); BB=edge(X,'sobel'); figure imshow(BB); figure bw = bwareaopen(BB,20); %tach bien theo thong so dat truoc imshow(bw); bw = imfill(bw,'holes'); figure imshow(bw); title('lap lo trong') %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%% figure se = strel('disk',4); %bw = imclose(bw,se); bw=imdilate(bw,se); imshow(bw); title('lam day bien') bw = imfill(bw,'holes'); Trang 62
- Phụ Lục figure imshow(bw); title('lap lo trong lan 2') %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%% figure bw=imerode(bw,se); imshow(bw); title('anh da lam manh duong bien') %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%% L = bwlabel(bw); % We assign a label to each region n = max(L(:)); % Number of regions figure imshow(L) % Each region has a different gray-value title('Labeled regions') A = zeros(n,1); % Area x = zeros(n,1); % Location x y = zeros(n,1); % Location y for i=1:n R = L==i; % Binary image '1' means pixel belongs to region i [ii,jj] = find(R==1); % Coordinates of each pixel of region i A(i) = length(ii); % Area of region i x(i) = mean(jj); % x value of center of mass of region i y(i) = mean(ii); % y value of center of mass of region j text(x(i),y(i),num2str(i)) end [D,T]=bwboundaries(bw,'noholes'); stats = regionprops(bw,'all'); kichthuoc=zeros(n,1); figure imshow(a); for k=1:length(D) Areas(1,k) = stats(k,1).Area; thisBB = stats(k,1).BoundingBox; Trang 63
- Phụ Lục MajorAxisLengths(1,k)=stats(k,1).MajorAxisLength; MinorAxisLengths(1,k)=stats(k,1).MinorAxisLength; if Areas(1,k)>500 &&((MajorAxisLengths(1,k)/MinorAxisLengths(1,k))>2.3) rectangle('Position', thisBB, 'EdgeColor','r','LineWidth',2 ) else kichthuoc(k,1)=k; rectangle('Position', thisBB, 'EdgeColor','B','LineWidth',2 ) end end %[indmax2] = find(Avec2 == max(Avec2)); for k=1:length(D) centroid=cat(1,stats.Centroid); thisBB = stats(k,1).BoundingBox; E=zeros(n,2); E(:,1)=centroid(:,1); E(:,2)=centroid(:,2); end La=zeros(3,3); B=zeros(3,3); C=zeros(3,3); img = imread('C:\Users\PHONG\Downloads\hinh\2.jpg'); Lab = RGB2Lab(img); L1 = Lab(:,:,1); a1 = Lab(:,:,2); b1 = Lab(:,:,3); for i=1:3 for j=1:3 La(i,j)=L1(i+521,j+521); B(i,j)=a1(i+521,j+521); C(i,j)=b1(i+521,j+521); end end Lab1 = RGB2Lab(a); L2 = Lab1(:,:,1); a2 = Lab1(:,:,2); Trang 64
- Phụ Lục b2 = Lab1(:,:,3); t=0; sum1=zeros(n,1); m=zeros(3,3); j=zeros(3,3); z=zeros(3,3); vitri=zeros(n,1); hold on; figure imshow(a) %for k=1:length(D) % thisBB = stats(k,1).BoundingBox; for i=1:n sum=0; for x=1:3 for y=1:3 a= round(E(i,1)); b= round(E(i,2)); m(x,y)=L2(x+b-2,y+a-2); j(x,y)=a2(x+b-2,y+a-2); z(x,y)=b2(x+b-2,y+a-2); sum = sum+((B(x,y)-j(x,y))^2+(C(x,y)-z(x,y))^2); end sum1(i,1)=sum; end if sum >900 t=t+1; vitri(i,1)=i; end end for k=1:n point = stats(k,1).BoundingBox; if vitri(k,1)~=0 || kichthuoc(k,1)~=0 rectangle('Position', point, 'EdgeColor','y','LineWidth',2 ) Trang 65
- Phụ Lục % else % rectangle('Position', point, % 'EdgeColor','r','LineWidth',2 ) end end Trang 66
- S K L 0 0 2 1 5 4