Đồ án Xác định vị trí robot bằng camera (Phần 1)

pdf 22 trang phuongnguyen 2350
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Xác định vị trí robot bằng camera (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfdo_an_xac_dinh_vi_tri_robot_bang_camera_phan_1.pdf

Nội dung text: Đồ án Xác định vị trí robot bằng camera (Phần 1)

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA CƠ KHÍ CHẾ TẠO MÁY ĐỒ ÁN TỐT NGHIỆP NGÀNH CƠ ĐIỆN TỬ XÁC ĐỊNH VỊ TRÍ ROBOT BẰNG CAMERA SVTH: NGUYỄN THÀNH NAM MSSV: 10111040 SVTH: NGUYỄN HOÀNG TUẤN MSSV: 10111091 GVHD: ThS. NGUYỄN VIỆT THẮNG SKL003024 Tp. Hồ Chí Minh, tháng 07/2014
  2. TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHOA CƠ KHÍ CHẾ TẠO MÁY ĐỒ ÁN TỐT NGHIỆP XÁC ĐỊNH VỊ TRÍ ROBOT BẰNG CAMERA SVTH : NGUYỄN THÀNH NAM MSSV : 10111040 SVTH : NGUYỄN HOÀNG TUẤN MSSV : 10111091 GVHD: ThS. NGUYỄN VIỆT THẮNG Tp. Hồ Chí Minh, tháng 7 năm 2014
  3. CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc Tp. Hồ Chí Minh, ngày tháng năm 2014 NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Họ và tên sinh viên: Nguyễn Thành Nam MSSV: 10111040 Họ và tên sinh viên: Nguyễn Hoàng Tuấn MSSV: 10111091 Ngành: CƠ ĐIỆN TỬ Lớp: 101111 Giảng viên hướng dẫn: ThS. Nguyễn Việt Thắng ĐT: 0938240049 Ngày nhận đề tài: 1/3/2014 Ngày nộp đề tài:24/7/2014 1. Tên đề tài: XÁC ĐỊNH VỊ TRÍ ROBOT BẰNG CAMERA 2. Các số liệu, tài liệu ban đầu: 3. Nội dung thực hiện đề tài: - Nghiên cứu, xây dựng thuật toán tính vị trí robot. - Xây dựng chương trình định vị vị trí robot dựa trên thư viện OpenCV của Intel. - Tìm hiểu và viết chương trình điều khiển động cơ bước bằng vi điều khiển. - Giao tiếp giữa vi điều khiển và máy tính. 4. Sản phẩm: TRƯỞNG NGÀNH GIẢNG VIÊN HƯỚNG DẪN
  4. CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ và tên Sinh viên: Nguyễn Thành Nam MSSV: 10111040 Họ và tên Sinh viên: Nguyễn Hoàng Tuấn MSSV: 10111091 Ngành: CƠ ĐIỆN TỬ Tên đề tài: XÁC ĐỊNH VỊ TRÍ ROBOT BẰNG CAMERA Họ và tên Giáo viên hướng dẫn: Th.S Nguyễn Việt Thắng NHẬN XÉT 1. Về nội dung đề tài & khối lượng thực hiện: 2. Ưu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày tháng năm 2014 Giáo viên hướng dẫn (Ký & ghi rõ họ tên)
  5. CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ và tên Sinh viên: Nguyễn Thành Nam MSSV: 10111040 Họ và tên Sinh viên: Nguyễn Hoàng Tuấn MSSV: 10111091 Ngành: CƠ ĐIỆN TỬ Tên đề tài: XÁC ĐỊNH VỊ TRÍ ROBOT BẰNG CAMERA Họ và tên Giáo viên phản biện: Th.S Lê Tấn Cường NHẬN XÉT 1. Về nội dung đề tài & khối lượng thực hiện: 2. Ưu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày tháng năm 2014 Giáo viên phản biện (Ký & ghi rõ họ tên)
  6. LỜI CẢM ƠN Trong quá trình thực hiện đồ án, dù gặp rất nhiều khó khăn nhưng cuối cùng nhóm đã hoàn thành Đồ án đúng thời gian. Xin gửi lời tri ân sâu sắc đến cha mẹ của các thành viên trong nhóm đã miệt mài lo lắng và chu cấp kinh phí cho nhóm trong suốt quá trình học tập. Xin gửi lời cảm ơn chân thành đến thầy Nguyễn Việt Thắng đã giúp đỡ và động viên, khích lệ nhóm trong suốt quá trình thực hiện đồ án. Xin gửi lời cảm ơn đến các thầy, các nhân viên trong bộ môn Cơ điện tử, Khoa Cơ Khí Chế Tạo Máy, Trường ĐH Sư Phạm Kỹ Thuật Tp.Hồ Chí Minh và các bạn sinh viên đã tạo điều kiện, đóng góp ý kiến để nhóm sớm hoàn thành Báo cáo Đồ án. i
  7. TÓM TẮT ĐỒ ÁN Tìm hiểu xây dựng thuật toán, xây dựng phần mềm tính toán, xác định vị trí của robot trong không gian 2D viết trên nền Visual C++, ứng dụng thư viện xử lý ảnh OpenCV. Tìm hiểu nguyên nhân gây sai số và biện pháp khắc phục. Các vấn đề nghiên cứu: - Phương pháp nhận diện được đối tượng cần quan sát sau đó thu nhận thông tin cần thiết. - Xác định vị trí của đối tượng dựa trên các thông tin đã nhận được. Các hướng tiếp cận: - Dùng 1 camera đặt trên robot, camera xoay xác định góc của các cột mốc, từ đó tính ra vị trí của robot. - Dùng 2 camera đặt cố định, dò tìm vị trí của robot dựa theo tọa độ của robot trên 2 camera. Kết quả đạt được: - Xác định được vị trí của robot với sai số chấp nhận được. - Giải thích được một số nguyên nhân cơ bản gây sai số. ii
  8. ABSTRACTS Learn to build algorithms, computational building software, locate the robot in 2D space written in Visual C + + application OpenCV image processing library. Learn the cause of the error and corrective measures. The research problem: - Method of identifying objects that should be observed after receiving the necessary information. - Determine the location of the object based on the information received. The approach: - Use one camera mounted on the robot, camera angles of rotation defined milestones, which calculated the position of the robot. - Use 2 fixed cameras detect the position of the robot based on the robot's coordinates on two cameras. The results are: - Identify the location of the robot with an acceptable error. - Explain some basic reasons causing errors. iii
  9. MỤC LỤC Trang phụ bìa TRANG LỜI CẢM ƠN i TÓM TẮT ĐỒ ÁN ii ABSTRACTS iii MỤC LỤC iv DANH MỤC CÁC TỪ VIẾT TẮT vii DANH MỤC CÁC HÌNH ẢNH, BIỂU ĐỒ viii Chương 1 TỔNG QUAN 1 1.1 Giới thiệu đề tài 1 1.2 Yêu cầu và giới hạn đề tài 1 1.3 Đối tượng nghiên cứu 1 1.4 Mục tiêu 1 1.5 Phương pháp nghiên cứu 2 1.6 Các công trình nghiên cứu liên quan 2 Chương 2 CƠ SỞ LÝ THUYẾT 5 2.1 Lựa chọn phương pháp định vị 5 2.2 Xử lý ảnh 5 2.2.1 Giới thiệu về xử lý ảnh 5 2.2.2 Ứng dụng của xử lý ảnh 5 2.2.3 Những vấn đề cơ bản trong hệ thống xử lý ảnh 6 2.2.3.1 Điểm ảnh (Picture Element) 6 2.2.3.2 Độ phân giải của ảnh 6 2.2.3.3 Mức xám của ảnh 7 2.2.3.4 Định nghĩa ảnh số 7 2.2.3.5 Quan hệ giữa các điểm ảnh 7 2.2.3.6 Các thành phần cơ bản của hệ thống xử lý ảnh 9 2.2.3.7 Các thiết bị thu nhận ảnh 11 2.2.3.8 Hệ tọa độ màu 12 iv
  10. 2.2.3.9 Ảnh đen trắng và ảnh màu 14 2.2.4 Phần cứng cho xử lý ảnh 16 2.2.4.1 Máy tính PC, laptop 16 2.2.4.2 Main công nghiệp PC 104 17 2.2.4.3 FPGA 17 2.2.4.4 DSP (Digital signal processing) 17 2.2.5 Phần mềm dùng cho xử lý ảnh 18 2.2.5.1 Thư viện OpenCV là gì 18 2.2.5.2 Các thành phần trong hệ thống thư viện OpenCV 18 2.3 Lựa chọn cột mốc định vị 21 2.3.1 Phương án 1 21 2.3.2 Phương án 2 22 2.4 Vi điều khiển 23 2.4.1 Giới thiệu về vi điều khiển Arduino 23 2.4.2 Lý do chọn vi điều khiển Arduino 24 2.5 Thuật toán định vị vị trí robot 26 Chương 3 THIẾT KẾ BỘ ĐIỀU KHIỂN VÀ GIAO TIẾP VỚI MÁY TÍNH 28 3.1 Động cơ 28 3.1.1 Động cơ bước 28 3.1.2 Nguyên tắc điều khiển động cơ bước đơn cực 30 3.1.3 Lý do chọn động cơ bước 33 3.2 Camera 33 3.3 Mạch điện tử 34 3.3.1 Mạch cầu H 34 3.3.2 Mạch vi điều khiển 34 3.4 Giao tiếp với giao diện xử lý ảnh 37 Chương 4 THUẬT TOÁN XỬ LÝ ẢNH 39 4.1 Thuật toán phát hiện cột mốc 40 4.1.1 Lọc các đối tượng màu đỏ 40 v
  11. 4.1.2 Tách riêng từng đối tượng và dán nhãn 41 4.1.3 Loại bỏ các đối tượng không phù hợp 42 4.1.4 Tổng hợp thông tin để nhận biết cột 45 4.2 Thuật toán xác định góc của cột mốc so với trục robot 46 Chương 5 KẾT QUẢ THỰC NGHIỆM VÀ HƯỚNG PHÁT TRIỂN 48 5.1 Kết quả thực nghiệm 48 5.2 Kết luận 53 5.3 Hướng phát triển 53 TÀI LIỆU THAM KHẢO 55 Phụ lục A GIAO DIỆN CHƯƠNG TRÌNH 56 A.1 Các thành phần 56 A.2 Hướng dẫn sử dụng giao diện 59 vi
  12. DANH MỤC CÁC TỪ VIẾT TẮT ADC: Analog to Digital Converter API: Application Programming Interface AVR: Automatic Voltage Regulator CCD: Charge-Coupled Devices CGA: Color Graphic Adaptor CIE: Commission Internationale d’Eclairage CMY:Cyan Magenta Yellow DAC: Digital to Analog Converter DC: Direct Current DCT: Discrete Cosine Transform DSP: Digital Signal Processing DSP: Digital signal processing EEPROM: Electrically Erasable Programmable Read-Only Memory FPGA: Field programmable Gate Array GPS: Global Positioning System IDE: Integrated Development Environment NTSC: National Television System Committee OpenCV: Open Computer Vision Library PEL: Picture Element PWM: Pulse-width modulation RBG: Red, Blue, Green SIMD: Single Intruction Multiple Data SRAM: Static Random Access Memory SVGA: Super Video Graphics Array TV: television UART: Universal Asynchronous Receiver-Transmitter USB: Universal Serial Bus VCR: Video Cassette Recording VGA: Video Graphic Adapter YIQ: Mô hình màu YIQ vii
  13. DANH MỤC CÁC HÌNH ẢNH, BIỂU ĐỒ Chương 1 Hình 1.1 Sơ đồ khối tổng quan đề tài Hình 1.2 Hình ảnh nhận được từ camera của robot Hình 1.3 Bản đồ robot đã tạo ra Hình 1.4 Robot phân tích dữ liệu khi quan sát các tòa nhà Hình 1.5 Robot và các thành phần chính Chương 2 Hình 2.1 Lân cận các điểm ảnh của tọa độ (x,y) Hình 2.2 Các bước cơ bản trong xử lý ảnh Hình 2.3 Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các khối Hình 2.4 Các thành phần chính của hệ thống xử lý ảnh Hình 2.5 Hệ thống xử lý ảnh Hình 2.6 Hệ tọa độ RGB Hình 2.7 Không gian màu HSV Hình 2.8 Biểu diễn mức xám của ảnh số Hình 2.9 Tổ chức thư viện OpenCV Hình 2.10 Cột mốc dùng trong phương án 1 Hình 2.11 Cột mốc dùng trong phương án 2 Hình 2.12 Cột mốc dùng để định vị Hình 2.13 Board Arduino Uno Hình 2.14 Chu trình hoạt động của Arduino Hình 2.15 Mô hình toán học của phương pháp định vị vị trí với 3 mốc định vị Chương 3 Hình 3.1 Động cơ bước Hình 3.2 Nguyên lý hoạt động của động cơ bước đơn cực Hình 3.3 Bước góc của động cơ bước Hình 3.4 Động cơ bước đơn cực Hình 3.5 PWM Hình 3.6 Độ rộng xung ảnh hưởng đến điện áp trung bình Hình 3.7 Webcam HYUNDAI Full HD Hình 3.8 Mạch cầu H Hình 3.9 Arduino Uno Hình 3.10 Cáp Arduino Hình 3.11 Giao diện chương trình Arduino IDE viii
  14. Hình 3.12 Mạch điều khiển động cơ bước Chương 4 Hình 4.1 Sơ đồ giải thuật tổng quát Hình 4.2 Lưu đồ giải thuật phát hiện cột mốc Hình 4.3 Ảnh chụp trước và sau khi lọc màu (các điểm ảnh màu đỏ được thay bằng màu trắng, các điểm ảnh còn lại được thay bằng màu đen) Hình 4.4 Các đối tượng được tách riêng Hình 4.5 Hàm CBlobResult trả về các giá trị nhiễu Hình 4.6 Loại bỏ các đối tượng không đúng tỉ lệ Hình 4.7 Cộng hai đối tượng thành một Hình 4.8 Loại bỏ các đối tượng mà phía dưới không có đối tượng khác Hình 4.9 Loại bỏ các đối tượng có diện tích quá nhỏ Hình 4.10 Đếm các vạch màu Chương 5 Hình 5.1 Giao diện chương trình xác định vị trí robot Hình 5.2 Nhận diện được cột mốc thứ 1 Hình 5.3 Nhận diện được cột mốc thứ 2 Hình 5.4 Nhận diện được cột mốc thứ 3 Hình 5.5 Giao diện chương trình đã hiển thị được vị trí Hình 5.6 Nhiễu do có nguồn sáng gần cột mốc Hình 5.7 Nhiễu do ánh sáng chiếu thẳng vào cột mốc Hình 5.8 Nhiễu do vùng làm việc quá tối Hình 5.9 Nhiễu do những vật xung quanh có màu đỏ Hình 5.10 Ảnh hưởng của tốc độ quay camera (13vòng/phút) Hình 5.11 Nhận dạng sai cột mốc Phụ lục A Hình A.1 Giao diện chính của chương trình Hình A.2 Khung Image Hình A.3 Khung Mark Detail Hình A.4 Khu vực hiển thị tọa độ Hình A.5 Thanh Menu Hình A.6 Cửa sổ Field Setup Hình A.7 Cửa sổ Serial Port Setup ix
  15. Chương 1 TỔNG QUAN 1.1 Giới thiệu đề tài Ngày nay, cùng với sự phát triển không ngừng của khoa học công nghệ, robot ngày càng được sử dụng rộng rãi, không chỉ trong lĩnh vực sản xuất công nghiệp mà còn trong nhiều lĩnh vực khác: robot y tế, robot giúp việc, nội trợ, mobile robot quân sự; và đặc biệt là sự xuất hiện của các robot trong lĩnh vực giải trí. Các robot này đã và đang được tập trung nghiên cứu phát triển, ngày càng trở nên thân thiện hơn với con người. Việc kết hợp xử lý ảnh vào điều khiển robot ngày càng phát triển và đang mở ra một hướng đi mới cho việc điều khiển robot. Nhằm mục đích nghiên cứu, khảo sát tìm ra hướng đi trong việc sử dụng công nghệ xử lý ảnh để xác định vị trí của vật trong không gian 2D. Nhóm đã chọn đề tài Xác định vị trí robot bằng camera từ đó đưa ra kết luận về tính khả thi, mức độ phù hợp, hiệu quả của việc dùng công nghệ xử lý ảnh trong xác định vị trí robot. 1.2 Yêu cầu và giới hạn đề tài Đề tài: Xác định vị trí robot bằng camera ứng dụng công nghệ xử lý ảnh, trong đó: - Nghiên cứu về lĩnh vực thị giác máy tính, công nghệ xử lý ảnh (Image Procesing). - Tìm hiểu về lập trình ứng dụng với ngôn ngữ C++ kết hợp thư viện xử lý ảnh mã nguồn mở OpenCV của Intel. - Lập trình điều khiển trên board Arduino, giao tiếp với máy tính. - Xây dựng thuật toán tính toán vị trí cho robot. - Lập trình giao diện hiển thị vị trí robot. 1.3 Đối tượng nghiên cứu Đối tượng nghiên cứu của đề tài là công nghệ xử lý ảnh (cụ thể dùng thư viện mã nguồn mở OpenCV - Intel), và các vấn đề liên quan đến việc điều khiển động cơ bước, lập trình trên board vi điều khiển Arduino, thuật toán xác định vị trí robot. 1.4 Mục tiêu - Tìm hiểu lựa chọn phương pháp định vị phù hợp. - Tìm hiểu lý thuyết và ứng dụng cơ bản công nghệ xử lý ảnh. - Thu nhận hình ảnh động từ camera (webcam). - Nghiên cứu xây dựng chương trình xử lý ảnh nhận diện màu sắc nhằm nhận diện và phân biệt được các cột mốc định vị. 1
  16. - Giao tiếp giữa vi điều khiển và máy tính để xác định vị trí các cột mốc, từ đó xử lý và đưa ra vị trí của robot. Hình 1.1 Sơ đồ khối tổng quan đề tài 1.5 Phương pháp nghiên cứu Tìm hiểu tài liệu: các tài liệu liên quan đến thị giác máy tính, công nghệ xử lý ảnh, board mạch vi điều khiển Arduino, mạch cầu H, mạch nguồn, nguyên lý hoạt động và điều khiển của động cơ bước được sử dụng trong đề tài. Tham khảo từ nhiều nguồn khác nhau, bao gồm: các đồ án có liên quan đã được thi công đưa vào sử dụng ổn định, tài liệu trên mạng Internet và sự tham vấn trực tiếp của các giảng viên chuyên ngành thuộc Bộ môn Cơ điện tử. Phương pháp thực nghiệm, thử và sửa sai: qua những lần thử nghiệm trên từng phần riêng lẻ (như nhận biết các cột mốc, góc của các cột mốc so với camera, ) sau đó kết hợp lại cho hoàn chỉnh, nhóm đã xác định được một số nguyên nhân gây ra sai số, lỗi để từ đó có những biện pháp khắc phục, cải thiện. 1.6 Các công trình nghiên cứu liên quan a) Dùng công nghệ xử lý ảnh Monocular Vision for Mobile Robot Localization and Autonomous Navigation tác giả Eric Royer, Maxime Lhuillier, Michel Dhome and Jean-marc Lavest Lasmea. 2
  17. Đây là một robot tự động có thể di chuyển đến nơi cần đến. Robot sẽ xử lý và hoạt động theo trình tự như sau: ban đầu nhờ vào một camera được gắn trên robot sẽ quan sát môi trường xung quanh, sau đó từ chuỗi các hình ảnh thu nhận được từ camera, robot sẽ xử lý để xây dựng nên bản đồ 3D của không gian xung quanh, tiếp theo từ bản đồ này robot sẽ dựa trên đó mà di chuyển đến nơi cần đến. Hình 1.2 Hình ảnh nhận được từ camera của robot Hình 1.3 Bản đồ robot đã tạo ra 3
  18. b) Dùng công nghệ khác Localization Methods for a Mobile Robot in Urban Environments tác giả Atanas Georgiev và Peter K. Allen. Ngoài xử lý ảnh trên robot còn sử dụng nhiều công nghệ khác như: GPS, DGPS, Đây là robot có khả năng tự định vị và di chuyển trong thành phố, camera trên robot sẽ quan sát xung quanh, sau đó dùng xử lý ảnh để phân tích kết hợp với định vị GPS qua đó robot có thể nhận biết xung quanh và di chuyển được trong thành phố. Hình 1.4 Robot phân tích dữ liệu khi quan sát các tòa nhà Hình 1.5 Robot và các thành phần chính 4
  19. CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 2.1 Lựa chọn phương pháp định vị Định vị robot đã và đang được nghiên cứu ở nhiều nước trên thế giới. Đó là các robot được định vị nhờ vào các công nghệ như: định vị bằng GPS, cảm biến la bàn, cảm biến quét laser, radar, camera xử lý ảnh, hoặc định vị bằng cách kết hợp nhiều công nghệ lại với nhau, . Đề tài tập trung nghiên cứu xây dựng phương pháp, giải thuật xác định vị trí bằng camera dựa trên công nghệ xử lý ảnh, trong đó có những đặc điểm như: dễ dàng tiếp cận (dựa trên thư viện mở OpenCV, máy tính, ngôn ngữ lập trình C++, camera, ), chi phí phần cứng hợp lý tuy nhiên nhược điểm là dễ bị nhiễu và thời gian xử lý dài, phụ thuộc vào chất lượng của camera. 2.2 Xử lý ảnh 2.2.1 Giới thiệu về xử lý ảnh Ngày nay cùng với sự phát triển của khoa học kỹ thuật, xử lý ảnh đã mở ra một hướng đi mới của khoa học kỹ thuật ngày càng được ứng dụng nhiều và phổ biến từ công nghiệp cho đến đời sống, giải trí, quân sự, hàng không vũ trụ Xử lý ảnh là việc phân tích xử lý đối tượng từ những bức ảnh tĩnh hoặc ảnh động được thu trực tiếp từ camera nhằm ứng dụng vào từng công việc cụ thể. Không giống nhiều loại cảm biến chỉ xử lý trong không gian 1 chiều, đặc điểm nổi bật của xử lý ảnh là có thể xử lý một lượng lớn thông tin trong không gian 2 hoặc 3 chiều. 2.2.2 Ứng dụng của xử lý ảnh Có rất nhiều ứng dụng của xử lý ảnh có thể kể ra như: a) Trong công nghiệp: Là lĩnh vực ứng dụng xử lý ảnh rất nhiều. Việc phân loại và kiểm tra sản phảm phẩm là một ví dụ điển hình: kiểm tra lỗi cho các board mạch điện tử (gồm hàng trăm linh kiện điện tử trên đó, điều mà bằng mắt thường sẽ phải làm rất lâu và khó tránh được sai sót), kiểm tra lỗi của các nhãn in b) Trong lĩnh vực hàng không vũ trụ: Từ việc thám hiểm không gian cho đến công nghệ bản đồ thì xử lý ảnh là một phần quan trọng. Nhờ xử lý ảnh từ các vệ tinh, người ta có thể phát hiện được các vật thể nhỏ khi nhìn từ không gian, việc phối hợp với công nghệ GPS có đóng góp quan trọng trong việc phát triển quốc phòng an ninh, kinh tế xã hội, 5
  20. c) Trong nghiên cứu y sinh học : Những bức ảnh được xử lý tốt đã góp phần giúp các bác sỹ chẩn đoán bệnh chính xác hơn. Những ca phẫu thuật phức tạp, đòi hỏi chính xác cao đã không còn khó khăn với việc sử dụng công nghệ xử lý ảnh và các phần cứng cần thiết như camera, kính hiển vi. d) Trong lĩnh vực giải trí, nghiên cứu khoa học: Nhiều robot, ứng dụng thực tiễn đã kết hợp thành công công nghệ xử lý ảnh (các robot tự hành, nhận diện đồ vật, khuôn mặt ). Nhiều nghiên cứu khoa học đã góp phần giới thiệu công nghệ xử lý ảnh, những ứng dụng thực tiễn cũng như chia sẻ công nghệ, hướng phát triển đến mọi người có đam mê và quan tâm. 2.2.3 Những vấn đề cơ bản trong hệ thống xử lý ảnh 2.2.3.1 Điểm ảnh (Picture Element) Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y). Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số có toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. 2.2.3.2 Độ phân giải của ảnh Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều. Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm ảnh chiều dọc x 200 điểm ảnh chiều ngang (320x200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn 6
  21. màn hình CGA 17” độ phân giải 320x200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (sự liên tục của các điểm) kém hơn. 2.2.3.3 Mức xám của ảnh Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh. a) Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó. b) Các thang giá trị mức xám thông thường: Các thang giá trị mức xám thông thường là: 16, 32, 64, 128, 256 (Mức 256 là mức thông dụng. Do trong kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám, mức xám dùng 1 byte biểu diễn: 28=256 mức (tức là từ 0 đến 255). c) Ảnh đen trắng: Là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau. d) Ảnh nhị phân: Ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 2 (21) mức khác nhau. Tức là mỗi điểm ảnh của ảnh nhị phân chỉ có chỉ có thể là 0 hoặc 1. e) Ảnh màu: Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 8x3 24 2 =2 ≈ 16,7 triệu màu. 2.2.3.4 Định nghĩa ảnh số Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật. 2.2.3.5 Quan hệ giữa các điểm ảnh Một ảnh số giả sử được biểu diễn bằng hàm f(x, y). Tập con các điểm ảnh là S, cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q. Chúng có một số các khái niệm sau: a) Các lân cận của điểm ảnh (Image Neighbors) Giả sử có điểm ảnh p tại toạ độ (x, y). p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc). {(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p) Trong đó: số 1 là giá trị logic, N4(p) tập 4 điểm lân cận của p. 7
  22. S K L 0 0 2 1 5 4