Đề tài Nghiên cứu và xây dựng module xử lý ảnh nhận dạng màu sắc của vật thể (Phần 1)
Bạn đang xem tài liệu "Đề tài Nghiên cứu và xây dựng module xử lý ảnh nhận dạng màu sắc của vật thể (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
de_tai_nghien_cuu_va_xay_dung_module_xu_ly_anh_nhan_dang_mau.pdf
Nội dung text: Đề tài Nghiên cứu và xây dựng module xử lý ảnh nhận dạng màu sắc của vật thể (Phần 1)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG NGHIÊN CỨU VÀ XÂY DỰNG MODULE XỬ LÝ ẢNH NHẬN DẠNG MÀU SẮC CỦA VẬT THỂ MÃ SỐ: T2010 - 35 NGƯỜI CHỦ TRÌ: Th.S TRẦN MINH THUẬN S K C 0 0 3 0 8 5 THÀNH PHỐ HỒ CHÍ MINH, THÁNG 10/2010
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP. HỒ CHÍ MINH KHOA CƠ KHÍ CHẾ TẠO MÁY BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG NGHIÊN CỨU VÀ XÂY DỰNG MODULE XỬ LÝ ẢNH NHẬN DẠNG MÀU SẮC CỦA VẬT THỂ Mã số: T2010-35 Chủ nhiệm đề tài: ThS. Trần Minh Thuận TP. HCM, 10/2010
- MỤC LỤC Phần 1: Đặt vấn đề 1 I. Đối tượng nghiên cứu 1 II. Tình hình nghiên cứu trong và ngoài nước 1 III. Những vấn đề còn tồn tại 2 Phần 2: Giải quyết vấn đề 3 I. Mục đích đề tài 3 II. Phương pháp nghiên cứu 3 III. Nội dung 3 3.1 Cơ sở nghiên cứu 3 3.2 Phương pháp thực hiện 12 IV. Kết quả đạt được 16 4.1 Tính khoa học 17 4.2 Khả năng ứng dụng vào thực tế 18 4.3 Hiệu quả kinh tế - xã hội 18 Phần 3: Kết luận 19 I. Kết luận 19 II. Đề nghị 19 Tài liệu tham khảo 20 Phụ lục: Mã lệnh tóm tắt 21 i
- DANH MỤC HÌNH VẼ Hình 1.1 - Camera VS724 của Siemens 1 Hình 2.1 - Sơ đồ khối của quá trình xử lý ảnh 3 Hình 2.2 - Không gian màu RGB 5 Hình 2.3 - Không gian màu HSV 6 Hình 2.4 - Hệ thống camera-computer 6 Hình 2.5 - Dãy quang phổ mà thị giác con người nhìn thấy được 7 Hình 2.6 - Webcam dùng trong lĩnh vực dân dụng 8 Hình 2.7 - Netbook của Acer 8 Hình 2.8 - Bus mở rộng PCI trong máy tính 9 Hình 2.9 - Chuẩn kết nối USB 10 Hình 2.10 - FireWire (IEEE-1394) 10 Hình 2.11 - Camera dùng giao tiếp Ethernet 11 Hình 2.12 - Công cụ lập trình Microsoft Visual Studio 2008 12 Hình 2.13 – Cấu trúc phần cứng 12 Hình 2.14 – Lưu đồ hoạt động của chương trình xử lý ảnh 14 Hình 2.15 – Lưu đồ giải thuật xử lý ảnh 15 Hình 2.16 – Kết quả hệ thống phần cứng 16 Hình 2.17 – Kết quả chương trình phần mềm 17 ii
- DANH MỤC BẢNG Bảng 2.1 - Thông số kỹ thuật của Creative Optia 13 Bảng 2.2 - Thông số kỹ thuật của netbook Acer Aspire One: 13 iii
- TÓM TẮT ĐỀ TÀI Mục đích của đề tài nghiên cứu là tạo ra một hệ thống hoàn chỉnh (phần cứng và phần mềm) có khả năng chụp ảnh của một vật để phân tích vật trong ảnh là màu nào trong danh sách các màu chuẩn. Danh sách màu chuẩn có thể được thay đổi động. Hệ thống ứng dụng được cho các đội robot tham gia giải đấu Robocon. Về phần cứng, netbook và webcam được sử dụng làm hai thành phần chính. Về phần mềm, một chương trình chạy trên Windows được tạo ra để thực hiện chức năng xử lý ảnh, phân tích màu sắc. Thuật giải phân tích màu chủ yếu dựa trên kiến thức về không gian màu HSV. Kết quả thực nghiệm chứng tỏ được hệ thống hoạt động đúng với yêu cầu đặt ra và dễ dàng triển khai sử dụng thực tế, phần cứng gọn nhẹ, phần mềm ổn định, chính xác. iv
- PHẦN 1 ĐẶT VẤN ĐỀ I. Đối tượng nghiên cứu Thị giác máy (Machine vision) là một ứng dụng của thị giác máy tính (Computer vision) vào trong cộng nghiệp và trong cuộc sống. Nhưng ngược lại, thị giác máy tính là qui tắc chung để máy tính có thể nhìn được. Thị giác máy, là một qui tắc kỹ thuật, liên quan tới các thiết bị số vào/ra và mạng máy tính để điều khiển thiết bị sản xuất khác chẳng hạn như robot, cánh tay máy. Thị giác máy là trường phụ kỹ thuật mà có liên quan tới khoa học máy tính, quang học, kỹ thuật chế tạo máy, và tự động hóa. Cùng với xu thế phát triển công nghệ thông tin mạnh mẽ, là xu thế phát triển các hệ thống hoạt động trên cơ sở nhận dạng bằng kỹ thuật xử lý ảnh. Ảnh ở đây nhiều thông tin về màu sắc, hình dáng, kích thước Với công cụ xử lý ảnh cho chúng ta các khả năng nhận biết chính xác các sự vật dựa trên các đặt tính trực quan bên ngoài của đối tượng. Thực tế là xử lý ảnh đã và đang được ứng dụng rộng rãi trong các lĩnh vực của cuộc sống. Trong số các ứng dụng đó là thị giác cho robot tự hành mà các robot tham giam cuộc thi Robocon đang tập trung phát triển. Từ đó đề tài “NGHIÊN CỨU VÀ XÂY DỰNG MODULE XỬ LÝ ẢNH NHẬN DẠNG MÀU SẮC CỦA VẬT THỂ” được thực hiện nhằm ứng dụng kết quả cho các đội robot tham gia giải Robocon trong thời gian tới. II. Tình hình nghiên cứu trong và ngoài nước Trong thời gian gian gần dây xử lý ảnh có những bước phát triển rất lớn. Các hãng chuyên về xử lý ảnh đã không ngừng đư ra các sản phẩm để đáp ứng nhu cầu của khách hàng. Các công cụ ngày càng hiện đại, với tốc độ xử lý cao, nhiều công cụ xử lý và có khả năng kết nối với các thiết bị ngoại vi khác. Trong mảng xử lý không thể không nhắc tới hai phần mềm xử lý ảnh tốt nhất hiện giờ là Spectation của Siemen và Intellect của Cognex. Hình 1.1 - Camera VS724 của Siemens với chức năng và tốc độ xử lý ảnh rất cao nhưng rất đắt tiền 1
- Thị giác máy chưa được ứng dụng cho các đội robocon của trường ĐH Sư Phạm Kỹ Thuật Tp. HCM. Điều này làm giảm sức cạnh tranh của trường tại các cuộc thi robocon trong nước và quốc tế. Trong khi đó, thực tế đã cho thấy sự vượt trội của các đội robot có ứng dụng thị giác máy trong thi đấu. III. Những vấn đề còn tồn tại Với các chủ đề của cuộc thi Robocon sắp tới, việc trang bị cho các robot tự hành có khả năng “nhìn” bằng thị giác là rất cần thiết, giúp cho các robot hoàn thành nhiệm vụ nhanh hơn và chính xác hơn. Yêu cầu đặt ra là phải có một module có chức năng nhận dạng màu sắc, mà các đội robotcon của trường có thể áp dụng để trang bị khả năng thị giác cho các robot tham dự cuộc thi robocon toàn quốc 2010. 2
- PHẦN 2 GIẢI QUYẾT VẤN ĐỀ I. Mục đích đề tài Tạo ra một hệ thống (phần cứng và phần mềm) có chức năng nhận biết màu sắc của một đối tượng được chụp bằng camera. Hệ thống cho phép thay đổi tiêu chuẩn màu sắc phù hợp với một ứng dụng, ngữ cảnh cụ thể. Hệ thống còn có thể phân biệt các đối tượng có màu sắc khác nhau dựa trên phương pháp đánh giá đặc tính màu. Phần cứng phải nhỏ gọn, linh hoạt. Phần mềm xử lý có khả năng chạy trên các PC nhỏ gọn như netbook, PC/104 mà các PC này có thể gắn trên các robot tự hành. II. Phương pháp nghiên cứu - Bước 1: Xác định yêu cầu nghiên cứu. - Bước 2: Xác định cơ sở khoa học (các công thức, thuật giải, phương pháp) dựa trên việc tổng hợp tài liệu chuyên môn có liên quan. - Bước 3: Tìm hiều phần cứng và công cụ phần mềm phù hợp với mục đích nghiên cứu và kinh phí thực hiện. - Bước 4: Triển khai xây dựng hệ thống phần cứng và viết phần mềm phần mềm. - Bước 5: Kiểm tra thử nghiệm thực tế và chỉnh sửa. - Bước 6: Thử nghiệm, kết hợp với các robot. - Bước 7 Hoàn thiện, đóng gói sản phẩm. III. Nội dung 3.1 Cơ sở nghiên cứu 3.1.1 Xử lý ảnh Xử lý ảnh là quá trình chụp ảnh, phân tích nhận dạng ảnh và đưa ra các tín hiệu điều khiển hợp lý. Thiết bị thu nhận (chụp ảnh) có thể là Scanner, camera, webcam, .Thực chất quá trình phân tích và nhận dạng ảnh bao gồm nhiều công đoạn nhỏ có thể hình hình dung quá trình xử lý ảnh thông qua sơ đồ khối sau. Hệ quyết định Thu nhận ảnh (Scanner, camera, Tiền Trích chọn Hậu Đối sánh rut sensor, webcam) xử lý đặc điểm xử lý ra kết luận Hình 2.1 - Sơ đồ khối của quá trình xử lý ảnh Lưu giữ 3
- 3.1.2 Thu nhận ảnh Thiết bị thu nhận ảnh là camera, scanner, webcam, . Các thiết bị thu nhận ảnh này có thể cho ảnh trắng đen B/W (Black and White), ảnh xám hoặc ảnh màu. Với ảnh B/W mức màu z là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên từ 0 đến 255. Ảnh màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2 8x3 = 2 24 màu (cỡ 16, 7 triệu màu). Một điểm ảnh màu thể hiện bằng 3 giá trị tương ứng với thành phần màu đỏ (Red), lục (Green) và lam (Blue). Nhìn chung, các hệ thống thu nhận ảnh thực hiện 2 quá trình: Biến đổi năng lượng quang học thành năng lượng điện. Tổng hợp năng lượng điện thành ảnh số. 3.1.3 Nâng cao chất lượng ảnh Một trong những kỹ thuật quan trọng trong xử lý ảnh là nâng cao chất lượng ảnh bằng biểu đồ tần suất sáng Histogram. Biểu đồ tần suất của mức xám g của ảnh I là số điểm ảnh có giá trị g của ảnh I, ký hiệu là h(g). Kỹ thuật tách ngưỡng tự động: Ngưỡng θ trong kỹ thuật tách ngưỡng thường được cho bởi người sử dụng. Kỹ thuật tách ngưỡng tự động nhằm tìm ra ngưỡng θ một cách tự động dựa vào histogram theo nguyên lý trong vật lý là vật thể tách làm 2 phần nếu tổng độ lệnh trong từng phần là tối thiểu. Giả sử, ta có ảnh I ~ kích thước m × n G ~ là số mức xám của ảnh kể cả khuyết thiếu t(g) ~ số điểm ảnh có mức xám ≤ g 1 g m(g) i.h(i) ~ mômen quán tính TB có mức xám g t(g) i 0 Hàm f: g f(g) t(g) f (g) m(g) m(G 1) 2 m n t(g) Tìm θ sao cho: f(g) = max {f(g)} 0≤g≤G-1 3.1.4 Không gian màu Không gian màu RGB (Red - Green - Blue) Không gian màu RGB mô tả màu sắc bằng 3 thành phần chính là Red (đỏ)- Green (xanh lục) và Blue (xanh lam). Không gian này được xem như một khối lập phương 3 chiều với màu red là trục x, màu Green là truc y, và màu Blue là trục z. Mỗi màu trong không gian này được xác định bởi 3 thành phần R, G, B. Ứng với các tổ hợp khác nhau của 3 màu này sẽ cho ta một màu mới. 4
- Hình 2.2 - Không gian màu RGB Trong hình lập phương trên, mỗi màu gốc (R,G,B) có các gốc đối diện là các màu bù với nó. Hai màu được gọi là bù nhau khi kết hợp hai màu này lại với nhau ra màu trắng. Ví dụ : Green - Magenta, Red - Cyan, Blue - Yellow. HSV (Hue - Saturation – Value) Thực chất của không gian này là sự biến đổi của không gian RGB. Không gian HSV được mô tả bằng lệnh lập phương RGB quay trên đỉnh Black. H (Hue) là góc quay trục V (value) qua 2 đỉnh Black và White. Các giá trị biến thiên của H, S, V như sau : H (Hue) chỉ sắc thái có giá trị từ 00 - 3600 . S (Saturation) chỉ độ bão hoà. V (Value) có giá trị từ 0 - 1. Các màu đạt giá trị bảo hòa khi s = 1 và v = 1. 5
- Hình 2.3 - Không gian màu HSV 3.1.5 Kiến trúc phần cứng Để có khả năng tiếp nhận dữ liệu video, một hệ thống camera-computer bao gồm những thành phần chủ yếu như sau: Camera Máy vi tính Kênh truyền thông Phần mềm Hình 2.4 - Hệ thống camera-computer 6
- Camera có chức năng ghi nhận hình ảnh từ ánh sáng bên ngoài. Khung dữ liệu video được camera truyền về máy tính thông qua các kết nối tín hiệu tương tự hoặc tín hiệu số (phụ thuộc vào loại camera tương tự hay số). Máy tính phải có phần cứng thu nhận dữ liệu video tương ứng với từng loại camera, sử dụng: Card chức năng để chuyển đổi tín hiệu tương tự sang tín hiệu số. Hoặc các chuẩn giao tiếp máy tính với các thiết bị ngoại vi tốc độ cao như USB, IEEE-1394 Camera Camera là thiết bị ghi lại hình ảnh được tạo ra bởi sóng ánh sáng có trường điện từ có bước sóng 400nm đến 700nm, tương ứng với dãy màu từ đỏ đến tím mà mắt người nhìn thấy được. 700nm 400nm Hình 2.5 - Dãy quang phổ mà thị giác con người nhìn thấy được Dưới khía cạnh kỹ thuật, camera được chia ra thành 2 loại là camera tương tự và camera số tùy thuộc vào tín hiệu video truy xuất dạng tỷ biến hay dạng kỹ thuật số. Camera còn được phân loại dựa vào mục đích sử dụng: camera dân dụng, camera chuyên dụng và camera công nghiệp: Camera dân dụng dùng cho gia đình và trong các sinh hoạt thường ngày. Camera chuyên dụng có các tính năng cao cấp như độ phân giải rất cao, tốc độ chụp ảnh nhanh được sử dụng nhiều trong các lĩnh vực quan trọng như nghiên cứu khoa học, quân sự và y học. Camera công nghiệp có tính năng gần giống như camera dân dụng. Ngoài ra nó còn được bổ sung hoặc rút gọn các tính năng phù hợp để hoạt động hiệu quả trong môi trường công nghiệp khắc nghiệt. 7



