Đồ án Nhận dạng thứ tự màu cho cáp kết nối trong công nghiệp dùng xử lý ảnh (Phần 1)
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Nhận dạng thứ tự màu cho cáp kết nối trong công nghiệp dùng xử lý ảnh (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- do_an_nhan_dang_thu_tu_mau_cho_cap_ket_noi_trong_cong_nghiep.pdf
Nội dung text: Đồ án Nhận dạng thứ tự màu cho cáp kết nối trong công nghiệp dùng xử lý ảnh (Phần 1)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP CÔNG NGHỆ KỸ THUẬT ĐIỀU KHIỂN - TỰ ĐỘNG HÓA NHẬN DẠNG THỨ TỰ MÀU CHO CÁP KẾT NỐI TRONG CÔNG NGHIỆP DÙNG XỬ LÝ ẢNH GVHD: TS. LÊ MỸ HÀ SVTH: LÊ QUỐC NHẬT 12151144 CHÂU THÁI BẢO 12151125 S K L 0 0 4 6 8 6 Tp. Hồ Chí Minh, tháng 7 năm 2016
- CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI CHƯƠNG 1 TỔNG QUAN ĐỀ TÀI Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác. Hiện nay, nó đang là một trong những lĩnh vực được quan tâm và trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công Nghệ Thông Tin. 1.1 Đặt vấn đề Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm 1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh sô thuận lợi. Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan. Ở Việt Nam, các ứng dụng về xử lý ảnh đã bước đầu được triển khai trên một số lĩnh vực như lắp đặt hệ thống nhận dạng biển số xe , hệ thống nhận dạng vân tay chấm công ở các công sở và các máy đó chủ yếu nhập khẩu ở nước ngoài . Ví dụ Công ty Keox Technologies ở Nhật Bản đã sản xuất ra máy kiểm tra màu sắc cáp (hình 1.1). Với giá thành nhập về Việt Nam rất cao và đặc thù của máy không phù hợp với các sản phẩm ở Việt Nam. Từ những vấn đề đã tìm hiểu ở trên , nhóm đã lựa chọn đề tài: Nhận Dạng Thứ Tự Màu Cho Cáp Kết Nối Trong Công Nghiệp Dùng Xử Lý Ảnh. ĐỒ ÁN TỐT NGHIỆP Trang 1
- CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI Hình 1.1. Mô hình hệ thống nhận dạng dây cáp màu 1.2 Nội dung nghiên cứu Phương pháp cơ bản để thay thế cho việc kiểm tra ngoại quan bằng mắt người là dùng thị giác máy tính (computer vision). Thị giác máy tính đúng như tên gọi mà người ta gắn cho chúng, giống như thị giác con người vậy. Nếu như bằng cặp mắt của mình, con người có thể thu nhận hình ảnh từ môi trường xung quanh, biết được màu sắc của vật, hình dáng của vật và vô số thông tin khác để có những phản ứng, hành động trong môi trường sống thì thị giác máy tính cũng vậy, chỉ có điều cặp mắt của máy tính giờ đây được thay bằng những thiết bị điện tử khác như camera, sensor hồng ngoại chẳng hạn Camera có thể thay thế cho đôi mắt trong việc thu nhận hình ảnh xung quanh. Với mỗi ứng dụng phân loại sản phẩm sẽ có một đặc thù riêng . Để đề tài mang tính khả thi cao và thích hợp với khả năng của nhóm đồ án đã lựa chọn hướng ứng dụng . “ Nhận Dạng Thứ Tự Màu Cho Cáp Kết Nối Trong Công Nghiệp Dùng Xử Lý Ảnh ”. Webcam là một dạng camera đơn giản được ứng dụng cho việc trao đổi và ghi nhận hình ảnh không cần chất lượng cao và có giá rẻ hơn nhiều so mới các camera chuyên dụng việc sử dụng camera thích hợp với việc nghiên cứu trong trường đại học với chi phí và mang lại một khả năng ứng dụng công nghệ cao. 1.3 Nhiệm vụ nghiên cứu của đề tài Thiết kế hệ thống nhận thứ tự màu cho cáp kết nối. Có mô hình kiểm chứng độ chính xác , màn hình giao diện thống kê các thông số màu , kiểm tra sai số giữa màu chuẩn và màu sản phẩm . 1.4 Phương pháp nghiên cứu Nghiên cứu lý thuyết kết hợp mô phỏng và kiểm chứng trên mô hình thực tế, chọn phần mềm Visual studio 2013 (C++) làm công cụ hỗ trợ cho nghiên cứu của đề tài vì đây là phần mềm cho kỹ thuật rất phổ biến và hỗ trợ hiệu quả cho sinh viên , đọc dữ liệu từ webcam và chuyển thành ảnh số trên máy tính, thực hiện các phương pháp so sánh với ảnh mẫu và xuất lệnh điều khiển ra mô hình tiến hành phân loại dây theo màu sắc, chạy tốt trong thời gian thực. ĐỒ ÁN TỐT NGHIỆP Trang 2
- CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI 1.5 Giới hạn đề tài Việc xây dựng mô hình đồ án được thực hiện sao cho phù hợp với mục tiêu nghiên cứu, nhưng do kiến thức và kinh nghiệm của nhóm còn nhiều hạn chế, cùng với những giới hạn về thời gian và một số vấn đề liên quan khác nên mô hình hoàn thành vẫn còn nhiều thiếu sót. Nhóm sẽ cố gắng phát triển hoàn thiện đề tài được tốt hơn và chính xác hơn và từ đó đưa vào ứng dụng ra bên ngoài. 1.6 Ý nghĩa khoa học và thực tiễn của đề tài Hệ thống được kế thừa từ những kiến thức nhóm đã tìm hiểu về các lĩnh vực như xử lý ảnh sử dụng thư viện OpenCV, đưa ứng dụng trên hệ điều hành Windown với tốc độ cao, đáp ứng Real-Time. Dùng trong các nhà máy xí nghiệp sản xuất cáp kết hoặc các ngành công nghiệp phụ trợ đang thiếu hụt ở Việt Nam. 1.7 Cấu trúc của đồ án Đồ án được thực hiện theo trình tự đúng yêu cầu thiết kế, trình bày chi tiết các công đoạn tiến hành xây dựng mô hình từ quá trình tìm hiểu đến các phần mềm lập trình phổ biến hiện nay. Trên cơ sở đó đưa ra phương án lựa chọn và thuật toán điều khiển cho hệ thống được trình bày chi tiết trong nội dung các chương sau: Chương 1: Tổng quan đề tài. Chương 2: Nền tảng và cơ sở lý thuyết của xử lý ảnh. Chương 3: Hệ thống nhận dạng thứ tự màu cho cáp kết nối trong công nghiệp dùng xử lý ảnh. Chương 4: Kết quả thực nghiệm. Chương 5: Kết luận và hướng phát triển. ĐỒ ÁN TỐT NGHIỆP Trang 3
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT CHƯƠNG 2 NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT Chương 2 trình bày các bước cơ bản trong việc thu nhận, lưu trữ và xử lý ảnh. Ngoài ra còn tập trung giới thiệu cơ sở không gian màu khác nhau và các hàm hỗ trợ cho xử lý ảnh. 2.1 Tổng quan về xử lý ảnh Xử lý ảnh là gì? Là 1 công nghệ ra đời từ những năm 1960, tuy nhiên thì vào thời điểm đó cấu hình của máy tính chưa đủ mạnh để hỗ trợ công nghệ xử lý ảnh đòi hỏi tốc độ phải cao và tốn nhiều bộ nhớ lưu trữ. Vào thời điểm đó thì đã có nhiều trường đại học lớn và các viện nghiên cứu trên thế giới như MIT đã trang bị những chiếc máy tính khổng lồ để nghiên cứu về công nghệ này. Từ những năm 1970 trở đi, cấu hình máy tính đã mạnh mẽ hơn, các ứng dụng như cải thiện và nâng cao chất lượng ảnh, lưu trữ và truyền ảnh bắt đầu được phổ biến hơn. Còn ngày nay thì Xử lý ảnh đang là 1 công nghệ làm thay đổi cuộc sống giúp máy móc thay thế cho thị giác của con người . Xử lý ảnh có thể được chia ra làm 3 lĩnh vực: - Cải thiện chất lượng ảnh (Improvement of pictorial information): ví dụ việc làm cho chất lượng một hình ảnh đã cũ trở lên rõ, nét như khi nó được chụp cách đây nhiều năm. - Lưu trữ và Truyền ảnh (Efficient Storage and transmission): Các định dạng ảnh ra đời nhằm làm giảm dung lượng lưu trữ và tăng tốc độ truyền nhận hình ảnh khi băng thông có giới hạn. Các nhà nghiên cứu đã cho ra đời các định dạng ảnh như .jpg, .png, .bmp đã dần làm giảm đáng kể dung lượng của ảnh nhưng vẫn đảm bảo chất lượng của hình ảnh. - Nhận diện ảnh (Image processing for autonomous machine): đây là ứng dụng hay được sử dụng trong các dây truyền giám sát, đánh giá và kiểm tra chất lượng sản phẩm trong công nghiệp Ví dụ như nhận diện biển số xe trong các bãi giữ xe, kiểm tra nhãn chai đã được dán đúng tiêu chuẩn hay chưa, kiểm tra các linh kiện điện tử đã được gắn đúng vị trí trên các bo mạch hay chưa, giúp robot phát hiện và chữa cháy kịp thời hay trong quân sự thì sử dụng công nghệ xử lý ảnh để giúp cho robot có thể theo dõi và bám đuổi mục tiêu ĐỒ ÁN TỐT NGHIỆP 4
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT Thu nhận Tiền xử Phân Biểu diễn Nhận dạng ảnh lý ảnh đoạn ảnh và mô tả và nội suy Cơ sở tri thức Hình 2.1. Các bước cơ bản trong xử lý ảnh. Phần thu nhận ảnh (Image Acquisition) Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh) Tiền xử lý (Image Processing) Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Biểu diễn ảnh (Image Representation) Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn ĐỒ ÁN TỐT NGHIỆP 5
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản: - Nhận dạng theo tham số. - Nhận dạng theo cấu trúc. Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người Trong phép nội suy tín hiệu, ta phục hồi tín hiệu liên tục từ các mẫu. Phép nội suy tín hiệu có nhiều ứng dụng, có thể sử dụng trong việc thay đổi kích cỡ của ảnh số để cải thiện thể hiện của ảnh khi xem trên thiết bị hiển thị. Xét ảnh số cỡ 64x64 pixel, nếu thiết bị hiển thị hiện hình bậc không, từng cá thể pixel đều được nhìn thấy, ảnh thể hiện thành các khối. Nếu tăng kích thước ảnh bằng nội suy và lấy mẫu lại trước khi hiển thị thì ảnh sẽ xuất hiện mịn và đẹp mắt hơn. Một dãy khung hình cũng có thể nội suy theo thứ nguyên thời gian. Ảnh động 24 khung/sec cũng có thể đổi thành tín hiệu truyền hình NTSC 60 mành/giây bằng phép nội suy. Cũng có thể dùng phép nội suy thời gian để cải thiện thể hiện ảnh video của ảnh chuyển động chậm. Phép nội suy cũng có thể sử dụng trong các ứng dụng khác như mã hóa ảnh. Chẳn hạn, một cách tiếp cận đơn giản để làm giảm tốc độ bit là loại bỏ một số pixel hoặc một vài khung và tạo lại chúng từ pixel và khung đã mã hóa [1]. 2.1.1 Ảnh và điểm ảnh Ảnh là hình vẽ bao gồm vô số điểm ảnh tạo nên. Điểm ảnh là đơn vị nhỏ nhất tạo nên hình ảnh, thường mang một màu duy nhất (kết quả của sự pha trộn các màu cơ bản giữa các kênh màu). Để thông số điểm ảnh có ý nghĩa, người ta phải qui về một đơn vị kích thước nhất định, như inch hay cm/mm để tính và ĐỒ ÁN TỐT NGHIỆP 6
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT điểm ảnh thường được diễn đạt theo số lượng điểm trên một inch/cm chiều dài. Hình 2.2. giúp bạn có thể tưởng tượng được về điểm ảnh và số lượng điểm ảnh. Hình2.2 (a) cho thấy trên cùng một đơn vị diện tích. Ví dụ, 4 điểm ảnh nên chỉ thể hiện được 4 màu sắc chi tiết. Trong khi hình 2.2 (b) có tới 16 điểm ảnh giúp thể hiện 16 màu sắc, và làm ảnh chi tiết hơn nhiều. (a) (b) Hình 2.2. Số lượng điểm ảnh trên cùng 1 ảnh. (a) 4 điểm ảnh (b) 16 điểm ảnh 2.1.2 Độ phân giải của ảnh Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên ảnh số được hiển thị. Độ phân giải của màn hình càng lớn, ảnh có kích thước hiển thị càng nhỏ và ngược lại. Ví dụ: độ phân giải trên màn hình CGA (Color Graphic Adapter) là một lưới điểm theo chiều ngang màn hình 320 * điểm chiều dọc 200 điểm ảnh (320*200). Rõ ràng cùng một độ phân giải thì màn hình 12” mịn hơn màn hình 17”. Do cùng một mật độ điểm ảnh (độ phân giải), màn hình càng lớn thì độ mịn càng kém (độ liên tục giữa các điểm ảnh kém hơn). 2.1.3 Mức xám và ảnh xám Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó. Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255). ĐỒ ÁN TỐT NGHIỆP 7
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT (a) (b) Hình 2.3. Ảnh xám. (a) Ảnh xám. (b) Giá trị pixel trên 1 vùng ảnh. Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1. (a) (b) Hình 2.4. Ảnh nhị phân (a) Ảnh đen trắng, (b) giá trị pixel trong 1 vùng ảnh. Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau 2.1.4 Ảnh màu Định nghĩa: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 3 * 28=224≈ 16,7 triệu màu. ĐỒ ÁN TỐT NGHIỆP 8
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT (a) (b) (c) (d) Hình 2.5. Các kênh màu. (a) Ảnh màu (b) Kênh blue (c) Kênh green (d) Kênh red. 2.1.5 Nén ảnh Từ lúc các bức ảnh điện tử ra đời, đã có rất nhiều định dạng cũng được khai sinh. Mỗi loại định dạng ảnh đều có những sắc thái và cách sử dụng hoàn toàn khác nhau. Trong đó, JPG, PNG và GIF là 3 loại định dạng ảnh số phổ biến nhất. Định dạng ảnh JPG JPG đã trở thành định dạng phổ biến nhất trên Internet bởi vì công nghệ nói trên có thể nén ảnh rất nhiều. JPG chia nhỏ bức ảnh thành những vùng nhỏ hơn. Một khi đã dùng phương thức JPG để nén ảnh, bạn sẽ không thể nào khôi phục trạng thái ban đầu. Thường thì công nghệ này chỉ được dùng với mục đích lưu trữ nhiều bức ảnh trong 1 khoảng nhỏ, chứ không dùng để chỉnh sửa ảnh. Định dạng ảnh GIF GIF là một tập tin màu 8-bit, có nghĩa là hình ảnh mà tập tin cho ra bị giới hạn bởi 1 bảng gồm 256 màu sắc. Có 2 điều đặc biệt về định dạng GIF đó là tập tin có khả năng lưu lại màu trong suốt và hỗ trợ hình ảnh động. Tập tin GIF dùng nén dữ liệu bảo toàn trong đó kích thước tập tin có thể được giảm mà không làm chất lượng hình ảnh kém đi (cho những hình ảnh có ít hơn 256 màu). Định dạng ảnh PNG PNG là dạng hình ảnh sử dụng phương pháp nén dữ liệu mới mà không làm mất đi dữ liệu gốc. PNG được tạo ra nhằm cải thiện và thay thế định dạng ảnh GIF. PNG hỗ trợ màu 8-bit giống như GIF, đồng thời cũng hỗ trợ màu 24-bit RGB như JPG. Khi bạn nén một bức ảnh bằng định dạng PNG, bức ảnh đó sẽ không hề bị giảm chất lượng. Chính vì thế dung lượng các bức ảnh PNG rất lớn. ĐỒ ÁN TỐT NGHIỆP 9
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT 2.2 Các không gian màu cơ bản 2.2.1 Không gian màu RGB Mô hình RGB là mô hình màu sắc cơ bản nhất (red, green, blue), được ứng dụng cho màn hình máy tính, dễ hiểu và dễ sử dụng. Các thông số màu red, green, blue sẽ được cân bằng sao cho khi toàn bộ các giá trị này đạt 100%, màu thu được là màu trắng. Khi biểu diễn dưới dạng số, các giá trị RGB trong mô hình 24 byte thông thường được ghi bằng cặp ba số nguyên nguyên giữa 0 và 255, mỗi số đại diện cho cường độ của màu đỏ, xanh lá cây, xanh lam trong trật tự như thế. Số lượng màu tối đa sẽ là: 256 x 256 x 256 = 16.777.216 Ví dụ: (0, 0, 0) là màu đen (255, 255, 255) là màu trắng (255, 0, 0) là màu đỏ (0, 255, 0) là màu xanh lá cây (0, 0, 255) là màu xanh lam (255, 255, 0) là màu vàng Hình 2.6. Không gian màu RGB 2.2.2 Không gian màu CMYK CMYK là từ viết tắt tiếng Anh của cơ chế hệ màu trừ, thường được sử ĐỒ ÁN TỐT NGHIỆP 10
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT dụng trong in ấn. Bao gồm các màu sau: - C = Cyan (xanh) - M = Magenta (hồng) - Y = Yellow (vàng) - K = Black (Đen) (sở dĩ dùng từ K để chỉ màu đen vì ký tự B đã được dùng để chỉ màu Blue rồi, ngoài ra K còn có nghĩa là Key, mang ý chỉ cái gì đó là chủ yếu, là then chốt). Nguyên lý làm việc của hệ CMYK là hấp thụ ánh sáng. Màu mà người ta nhìn thấy là từ phần của ánh sáng không bị hấp thụ, hay nói cách khác, chúng hoạt động trên cơ chế những vật không tự phát ra ánh sáng mà chỉ phản xạ ánh sáng từ các nguồn khác chiếu tới. Nghĩ về màu CMYK thì dễ dàng hơn bởi vì chế độ dường như tuân theo các quy tắc đã được học ở trường. Trộn màu xanh (Cyan) với màu hồng (Magenta) sẽ cho ra màu xanh dương (Blue), màu hồng (Magenta) với màu vàng (Yellow) sẽ cho ra màu đỏ (Red), màu xanh (Cyan) với màu vàng (Yellow) sẽ cho ra màu xanh lá cây (Green), ba màu Cyan, Magenta, Yellow kết hợp lại sẽ cho ra màu Đen (Black). Hình 2.7. Không gian màu CKMY. Các máy in ngày nay sử dụng bốn mực CMYK để tạo nội dung in màu. Do đó, đối với các nội dung mà bạn muốn in, bạn nên chọn chế độ màu CMYK. 2.2.3 Không gian màu HSV HSV và cũng gần tương tự như HSL là không gian màu được dùng nhiều trong việc chỉnh sữa ảnh, phân tích ảnh và một phần của lĩnh vực thị giác máy tính. Hệ không gian này dựa vào 3 thông số sau để mô tả màu sắc: ĐỒ ÁN TỐT NGHIỆP 11
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT - H = Hue: màu sắc - S = Saturation: độ đậm đặc, sự bảo hòa - V = value: giá trị cường độ sang Hình 2.8. Không gian màu HSV. Không gian màu này thường được biểu diễn dưới dạng hình trụ hoặc hình nón. Theo đó, đi theo vòng tròn từ 0 -360 độ là trường biểu diễn màu sắc(Hue). Trường này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu xanh lục đầu tiên (green primary) nằm trong khoảng 0-120 độ, từ 120 - 240 độ là màu xanh lục tới xanh lơ (green primary - blue primary). Từ 240 - 360 là từ màu đen tới lại màu đỏ. Hình 2.9. Hình tròn biểu diễn màu sắc không gian (Hue). Theo như cách biểu diễn không gian màu theo hình trụ như hình 2.8, đi từ giá trị độ sáng (V) được biểu diễn bằng cách đi từ dưới đáy hình trụ lên và nằm trong khoảng từ 0 -1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng lớn nhất (V = 1). Đi từ tâm hình trụ ra mặt trụ là giá trị ĐỒ ÁN TỐT NGHIỆP 12
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT bão hòa của màu sắc (S). S có giá trị từ 0 - 1. 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất. S = 1 ở ngoài mặt trụ, là nơi mà giá trị màu sắc là đậm đặc nhất. Như vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ thông tin về máu sắc, độ đậm đặc và độ sáng của màu đó. 2.2.3 Hệ màu LAB Ở chế độ LAB, màu được biểu diễn bằng một tổ hợp 3 kênh: - L (Lightness-Luminance): là trục thẳng đứng, biểu diến độ sáng của màu, có giá trị từ 0 (Black) đến 100 (White). Kênh này hoàn toàn chỉ chứa thông tin về độ sáng, ko chứa giá trị màu thực sự. - Kênh “a”: Chứa giá trị màu từ Green (-) cho tới Red (+). - Kênh “b”: Chứa giá trị màu từ Blue (-) tới Yellowta không làm ảnh hưởng đến mầu nguyên thủy của tấm ảnh. Hình 2.10. Mô hình CIE Lab Mô hình CIE L*a*b* được xây dựng dựa trên khả năng cảm nhận màu của mắt người. Các giá trị Lab mô tả tất cả những màu mà mắt một người bình thường có thể nhìn thấy được. Lab được xem là một mô hình màu độc lập đối với thiết bị và thường được sử dụng như một cơ sở tham chiếu khi chuyển đổi một màu từ một không gian màu này sang một không gian màu khác. Theo mô hình Lab ( Hình 2.10), tất cả các màu có cùng một độ sáng sẽ nằm trên cùng một mặt phẳng có dạng hình tròn theo 2 trục a* và b*. Màu có giá trị a* dương thì ngả đỏ, màu có giá trị a* âm thì ngả lục. Tương tự b* dương ĐỒ ÁN TỐT NGHIỆP 13
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT thì ngả vàng và b* âm thì ngả lam. Còn độ sáng của màu thì thay đổi theo trục dọc. 2.3 Biên Một số khái niệm Điểm biên : một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột về mức xám (hoặc màu). Ví dụ: trong ảnh nhị phân điểm đen được gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng. Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành đường biên hoặc đường bao. Ý nghĩa đường biên trong xử lý: đường biên là một loại đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Người ta sử dụng biên làm phân tách các vùng xám( màu) cách biệt. Ngược lại người ta sử dụng ảnh để tìm đường phân tách. Mô hình biểu diễn đường biên: điểm ảnh có độ thay đổi mức xám một cách đột ngột. Hình 2.11. Đường biên của ảnh 2.4 Các phương pháp phát hiện,nhận dạng biên 2.4.1 Gradient Gradient là một vector có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo 2 hướng x và y, hay có thể nói là nó đại diện cho sự thay đổi về hướng và độ lớn của một vùng ảnh. Các thành phần của gradient được tính như sau: 휕 ( , ) ( + , ) − ( , ) = ′ = ∆ ≈ (1) 휕 휕 ( , ) ( + , ) − ( , ) = ′ = ∆ ≈ (2) 휕 Như vậy ta có ta có vector gradient là G( ′ , ′ ). ĐỒ ÁN TỐT NGHIỆP 14
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT Do tính chất phức tạp trong tính toán khi áp dụng phương pháp Gradient trong xử lý ảnh, người ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ Hx, Hy trực giao (theo 2 hướng vuông góc). ′ ′ Nếu định nghĩa 1( ), 2( ) là Gradient (vector gradient thành G( 1, 2)) theo hai hướng x, y tướng ứng thì biên độ (tức độ lớn) g(m,n) và hướng của biên tại điểm (m,n) được tính như sau: 2 2 0 = ( , 푛) = √ 1 ( , 푛) + 2 ( , 푛) (3) 휃 = 푡 푛 ( 2) (4) 1 Để giảm độ phức tạp tính toán, A0 được tính gần đúng như sau: 0 = | 1( , 푛)| + | 2( , 푛)| (5) ′ ′ Việc tính xấp xỉ đạo hàm bậc nhất ( và ở đây là g1 và g2) theo các hướng x và y được thực hiện thông qua 2 mặt nạ nhân chập (toán tử đạo hàm), tương ứng sẽ cho ta các kỹ thuật phát hiện biên khác nhau tương ứng với mặt nạ mà nó sử dụng (Roberts, Sobel, Prewitt ). 2.4.2 Sobel Bộ tách biên Sobel sử dụng các mặt nạ để xấp xỉ đạo hàm bậc nhất Nói cách khác, gradient tại điểm tâm trong một lân cận được tính theo bộ tách Sobel. Bộ tách biên Sobel có thể được thực hiện bằng cách lọc một ảnh, f, (dùng imfilter) với mặt nạ , lọc lại f với mặt nạ khác, bình phương các giá trị pixel với mỗi ảnh được lọc, cộng hai kết quả, và tính căn bậc hai. Các chú thích tương tự đối với các phần thứ 2 và thứ 3 . Hàm edge đơn giản các gói toán tử trước thành một hàm gọi và thêm vào các đặc tính khác, chẳng hạn như chấp nhận một giá trị ảnh ngưỡng hoặc xác định ngưỡng một cách tự động. Thêm vào đó, edge chứa các kỹ thuật tách biên không hiện thực trực tiếp được bằng imfilter. Cú pháp gọi bộ tách Sobel tổng quát là: [g , t ] = edge(f, ‘sobel’, T, dir) Trong đó f là ảnh đầu vào, T là ngưỡng được chỉ định và dir xác định hướng cần tính tách biên: ‘ngang’, ‘dọc’ hoặc cả hai. Như đã nói, g là ảnh logic chứa giá trị 1 tại những nơi biên được tách và giá trị 0 tại những nơi biên được tách. Tham số t trong ngõ ra là tùy chọn. Nó là giá trị ngưỡng được dùng bởi edge. Nếu T được chỉ định thì t = T. Mặt khác nếu T không được chỉ định ĐỒ ÁN TỐT NGHIỆP 15
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT (hoặc để rỗng []), f sẽ đặt t bằng với ngưỡng do nó tự động xác định và sau đó sử dụng cho việc tách biên. Một trong những lý do cơ bản cho việc gộp t trong tham số ngõ ra là để nhận giá trị khởi tạo cho ngưỡng. Hàm edge sử dụng bộ tách Sobel mặc định nếu cú pháp. g = edge (f), hoặc là [g, t] = edge(f). 2.4.3 Các mặt nạ dùng phát hiện biên Mặt nạ lọc sobel Toán tử Sobel được Duda và Hart đặt ra năm 1973 với các mặt nạ tương tự như của Robert nhưng cấu hình khác như sau: −1 0 1 −1 −2 1 = [−2 0 2] = [ 0 0 0] −1 0 1 1 2 1 Phương ngang(x) Phương dọc(y) Mặt nạ Prewitt Toán tử được Prewitt đưa ra vào năm 1970 có dạng: −1 0 1 −1 −1 −1 = [−1 0 1] = [ 0 0 0 ] −1 0 1 1 1 1 Phương ngang(x) Phương dọc(y) Mặt nạ Robert 0 1 −1 0 [ ] [ ] = −1 0 = 0 1 Phương ngang(x) Phương dọc(y) 2.5 Histogram và cân bằng Histogram 2.5.1 Histogram là gì? Phương pháp này được sử dụng nhằm làm tăng cường độ tương phản toàn cục (global contrast) của bức ảnh, nó đặc biệt có ý nghĩa trong tình huống dữ liệu đầu vào có giá trị điểm ảnh co cụm, độ tách bạch hình ảnh thấp (close contrast value). Điều này có thể được nhận thấy rõ thông qua thể hiện của biểu đồ histogram. Khi bạn nhận được một histogram của một hình đa mức xám với dải giá trị điểm ảnh không phân tán đều [0-255] mà chỉ tập trung trong một phân đoạn ngắn điều đó có nghĩa là nhiều khả năng bạn đang có trong tay một ảnh có độ tương phản thấp. Mục tiêu của cân bằng Histogram là giúp bạn biến đổi bức ảnh có độ tương phản thấp thành bức ảnh có độ tương phản cao hơn ĐỒ ÁN TỐT NGHIỆP 16
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT bằng cách trải đều giá trị của pixel làm chúng phân tán trên vùng giá trị rộng hơn, thay vì co cụm mà vẫn giữa được nội dung bức ảnh. Phương pháp này có ưu điểm của sự đơn giản, trong sáng, tính toán không nặng nề, cho phép phục hồi lại trạng thái ban đầu của ảnh trong tình huống cần thiết. Tuy nhiên nó lại có một khuyết điểm rất quan trọng, đó là nó dễ dàng làm tăng độ tương phản của nhiễu trong nền của ảnh và giảm các chi tiết hữu ích trong ảnh. 2.5.2 Cân bằng histogram Ảnh I được gọi là cân bằng lý tưởng nếu với mọi mưc xám g, g’ ta có h(g) = h(g’) [2]. Giả sử, ta có: - I: kích thước (m x n). - New_level: số mức xám cúa ảnh cân bằng. - Số điểm ảnh trung bình của mỗi mức xám của ảnh cân bằng. 푛 = (6) 푛푒푤_푙푒푣푒푙 - Số điểm ảnh có mức xám ≥ g. (g) = ∑푖=0 ℎ(푖) (7) Xác định hàm f: g−> f(g) Sao cho: 푡( ) f(g) = max{0,round( ) – 1} (8) Ví dụ: Cân bằng ảnh sau với New_level= 4. 1 2 4 7 7 2 1 3 4 5 I= [ ] 7 2 6 9 1 4 1 2 1 2 g h(g) t(g) f(g) 1 5 5 0 2 5 10 1 3 1 11 1 ĐỒ ÁN TỐT NGHIỆP 17
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT 4 3 14 2 5 1 15 2 6 2 17 2 7 2 19 3 8 1 20 3 Kết quả 0 0 2 2 3 1 3 1 2 2 Ikq = [ ] 3 3 2 3 0 2 2 1 0 1 (a) (b) Hình 2.12. Cân bằng histogram. (a) Ảnh gốc. (b) Ảnh sau khi cân bằng. 2.6 Lấy ngưỡng THRESHOLD Ngưỡng (Threshold) là một khái niệm khá quen thuộc trong xử lý ảnh cũng như rất nhiều giải thuật khác. Nó dùng để chỉ một giá trị mà người ta dựa vào để phân hoạch một tập hợp thành các miền phân biệt. Ví dụ thang điểm đánh giá học sinh là từ 1 đến 10. Trong một tập hợp gồm 40 học sinh của 1 lớp, người ta muốn phân lọai ra hai miền, miền thứ nhất bao gồm các học sinh đạt yêu cầu và miền thứ hai gồm các học sinh không đạt. Trong tình huống đó người ta dùng giá trị 5 (điểm) như là một ngưỡng ĐỒ ÁN TỐT NGHIỆP 18
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT (threshold) để phân loại học sinh. Các học sinh có điểm dưới 5 sẽ xem như không đạt, những học sinh có điểm từ 5 trở lên là đạt yêu cầu. Giá trị ngưỡng thường được xác định dựa vào những điểm đặc biệt (ví dụ ở trung bình), dựa vào kinh nghiệm khảo sát. Nếu dựa vào số lượng Ngưỡng áp dụng cho cùng một tập dữ liệu người ta sẽ phân ra các phương pháp ứng dụng ngưỡng đơn, ngưỡng kép, hay đa ngưỡng. Nếu dựa vào sự biến thiên của giá trị Ngưỡng, trong cùng phạm vi ứng dụng người ta sẽ phân ra các phương pháp dùng ngưỡng cố định (Constant|Fixed Threshold) và không cố định (Adaptive Threshold). Ngưỡng không cố định nghĩa là giá trị của nó sẽ thay đổi tùy theo sự biến thiên của tập dữ liệu theo không gian và thời gian. Thông thường giá trị này được xác định thông qua khảo sát tập dữ liệu bằng phương pháp thống kê. Để dễ hình dung hơn về ứng dụng khái niệm Threshold, sau đây chúng ta sẽ xét một ví dụ bộ lọc ngưỡng (Threshold Filter) đơn giản trong xử lý ảnh. Hình 2.13. Ảnh xám đồng xu Với mỗi pixel trong hình đa mức xám (grayscale) ở trên giá trị sẽ trong khoảng 0 - 255 vậy pixel nào lớn hơn ngưỡng là 120 ta gán giá trị cho nó thành đen (0), ngược lại gán giá trị trắng (255). Kết quả thu được như hình 2.14. Hình 2.14. Ảnh threshould đồng xu ĐỒ ÁN TỐT NGHIỆP 19
- CHƯƠNG 2: NỀN TẢNG VÀ CƠ SỞ LÝ THUYẾT 2.7 Thuật toán MORPHOLOGY Hình thái học toán học (Mathematical morphology) là một lý thuyết và kỹ thuật để phân tích và xử lý cấu trúc hình học, dựa trên lý thuyết tập hợp, lý thuyết lưới, cấu trúc liên kết và chức năng ngẫu nhiên. Hình thái học toán học phổ biến nhất được áp dụng cho hình ảnh kỹ thuật số. Ngoài ra hình thái học toán học nó có thể được sử dụng là tốt trên đồ thị, bề mặt mắt lưới, chất rắn, và nhiều các cấu trúc không gian khác. Hình thái học toán học đã được phát triển cho hình ảnh nhị phân, và sau đó được mở rộng cho ảnh đa mức xám (Image Grayscale), Đây là một trong những kỹ thuật được áp dụng trong giai đoạn tiền xử lý. Hai phép toán thường dùng là phép giãn nở (Dilation) và phép co (Erosion) . Từ hai phép toán cơ bản này người ta phát triển thành một số phép toán như phép đóng (Closing) và phép mở (Opening). Phần tử cấu trúc (Structuring element) Phần tử cấu trúc ảnh (Image structuring element) là một hình khối được định nghĩa sẵn nhằm tương tác với ảnh xem nó có thỏa mãn một số tính chất nào đó . Là một ma trận nhỏ có hai giá trị 0 và 1, các giá trị 0 được bỏ qua trong quá trình tính toán. Một số hình dáng của phần tử cấu trúc thường xuyên sử dụng trên ảnh nhị phân: - Dạng đường theo chiều ngang và dọc. - Dạng chữ thập. - Dạng hình vuông. - Dạng hình ellipse . 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 0 1 1 1 0 0 0 0 0 0 1 1 1 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0 0 1 1 1 0 0 1 1 1 0 0 0 0 0 0 [0 0 1 0 0] [0 0 0 0 0] [0 0 1 0 0] [0 0 0 0 0] Có hai thao tác Morphology cơ bản: Erosion và Dilation a. Phép toán giãn nở (Dilation) Là một trong các hoạt động cơ bản trong hình thái toán học. Phép toàn này có tác dụng làm cho đối tượng ban đầu trong ảnh tăng lên về kích thước (Giãn nở ra). Phép giãn nở trên ảnh nhị phân (Binary operator) Công thức: 퐀⨁퐁 = { 퐜 | 퐜 = 퐚 + 퐛, 퐚 ∈ 퐀, 퐛 ∈ 퐁 } (9) ĐỒ ÁN TỐT NGHIỆP 20
- S K L 0 0 2 1 5 4