Luận văn Xây dựng mô hình 3D vật thể (Phần 1)
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Xây dựng mô hình 3D vật thể (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
luan_van_xay_dung_mo_hinh_3d_vat_the_phan_1.pdf
Nội dung text: Luận văn Xây dựng mô hình 3D vật thể (Phần 1)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ NGUYỄN QUỐC AN XÂY DỰNG MÔ HÌNH 3D VẬT THỂ NGÀNH: KỸ THUẬT ÐIỆN TỬ - 60520203 S K C0 0 5 0 5 0 Tp. Hồ Chí Minh, tháng 4/2016
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ NGUYỄN QUỐC AN XÂY DỰNG MÔ HÌNH 3D VẬT THỂ NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203 Tp. Hồ Chí Minh, tháng 4/2016
- LÝ LỊCH KHOA HỌC I. LÝ LỊCH SƠ LƢỢC: Họ & tên: Nguyễn Quốc An Giới tính: Nam Ngày, tháng, năm sinh: 08-06-1989 Nơi sinh: Tây Ninh Quê quán: Trảng Bàng, Tây Ninh Dân tộc: Kinh Chỗ ở riêng hoặc địa chỉ liên lạc: Lộc Trát, Gia Lộc, Trảng Bàng, Tây Ninh Điện thoại cơ quan: Điện thoại nhà riêng: 0973468912 Fax: E-mail: nguyenquocan869@gmail.com II. QUÁ TRÌNH ĐÀO TẠO: 1. Trung học chuyên nghiệp: Hệ đào tạo: Thời gian đào tạo từ / đến / Nơi học (trƣờng, thành phố): Ngành học: 2. Đại học: Hệ đào tạo: Đại Học Chính Quy Thời gian đào tạo từ /2007 đến / 2012 Nơi học (trƣờng, thành phố): Đại Học Sƣ Phạm Kỹ Thuật TP.HCM Ngành học: Kỹ thuật Điện- Điện tử Tên đồ án, luận án hoặc môn thi tốt nghiệp: XÂY DỰNG HỆ THỐNG BÁO NGHỈ BÁO BÙ QUA TIN NHẮN SMS Ngày & nơi bảo vệ đồ án, luận án hoặc thi tốt nghiệp: 2012 Ngƣời hƣớng dẫn: Ths. Nguyễn Thanh Bình i
- III. QUÁ TRÌNH CÔNG TÁC CHUYÊN MÔN KỂ TỪ KHI TỐT NGHIỆP ĐẠI HỌC: Thời gian Nơi công tác Công việc đảm nhiệm Từ 2012 đến Làm việc tại công ty TNHH Kỹ thuật viên nay TMDVKT S.I.S ii
- LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ công trình nào khác Tp. Hồ Chí Minh, ngày tháng năm 2016 (Ký tên và ghi rõ họ tên) iii
- LỜI CẢM ƠN Em xin chân thành cám ơn các Thầy, Cô trong khoa Điện – Điện Tử đã trang bị cho em một kiến thức có liên quan giúp em có thể hoàn thành tốt đề tài này. Cám ơn các bạn trong lớp đã chia sẽ các kinh nghiệm và hỗ trợ nhau trong lúc làm đề tài. Đặc biệt em xin chân thành cảm ơn Thầy hƣớng dẫn, T.S Nguyễn Văn Thái đã hƣớng dẫn và hỗ trợ em trong lúc thực hiện đề tài Học viên Nguyễn Quốc An iv
- TÓM TẮT Tái tạo hiện trƣờng là khâu quan trọng phục vụ cho việc phá án. Hiện nay để tái tạo hiện trƣờng, các cảnh sát viên phải chụp ảnh màu và dựng lại hiện trƣờng thực dựa vào ảnh màu đó. Việc làm này tốn thời gian và không chính xác phụ thuộc nhiều vào việc chụp ảnh màu của cảnh sát. Trƣớc thực trạng này ngƣời nghiên cứu đề xuất một giải pháp là tái tạo hiện trƣờng ảo 3D bằng cách sử dụng camera 3D. Đầu tiên ta sử dụng camera 3D Kinect thu thập dữ liệu ảnh màu và ảnh độ sâu của đối tƣợng. Sau đó tìm các kết nối tƣơng đồng 2D giữa các khung hình liên tiếp bằng thuật toán SURF. Tiếp tục ta sẽ tiến hành loại các kết nối không tƣơng đồng 2D bằng thuật toán RANSAC. Các kết nối tƣơng đồng này chỉ mới là kết nối tƣơng đồng 2D nên chúng ta cần chuyển sang kết nối tƣơng đồng 3D bằng cách thêm thành phần độ sâu z. Các kết nối tƣơng đồng 3D này loại đƣợc lọc tiếp tục bằng các kỹ thuật lọc độ sâu, lọc góc, lọc khoảng cách và lọc diện tích. Bây giờ chúng ta đã có các kết nối tƣơng đồng 3D thực sự. Sau đó các kết nối này đƣa vào thuật toán ICP để tìm ma trận chuyển đổi giữa 2 đám mây điểm chứa các kết nối này. Tiếp đến ta tiến hành quy đổi các đám mây điểm về cùng hệ trục tọa độ với đám mây gốc. Trong quá trình quy đổi các đám mây điểm ta sẽ loại bớt các điểm trùng nhau giữa 2 đám mây điểm liên tiếp bằng thuật toán k-d tree và lọc trung bình với ngƣỡng sai số. Khi các đám mây đã đƣợc quy đổi, tiếp tục hiển thị để quan sát, lúc này ta thu đƣợc các mô hình 3D của vật thể hay hiện trƣờng. Hƣớng phát triển của đề tài “XÂY DỰNG MÔ HÌNH 3D VẬT THỂ “ là xây dựng và nhận dạng trực tuyến mô hình, sử dụng camera của hãng khác để đáp ứng các ứng dụng của nhiều môi trƣờng hơn nhƣ ngoài trời v
- ABSTRACT Reconstructing a crime scene is an important step to serve the slug. Currently, to reconstruct the scene, the police officer must capture color images and reconstruct the real scene based on that color images. This job takes lots of time and does not exactly depends on the color photography of police. Before this situation the researcher proposes a solution is reconstructing the 3D virtual scene using the 3D camera. First, we use Kinect 3D camera to collect data such as color images and depth images of the object. Then, finding out the 2D correspondences between the consecutive scenes by using SURF algorithm. After that, we will continue to eliminate the false correspondences by using 2D RANSAC algorithm. Then, we need to convert 2D correspondences to 3D„s by adding a depth component z. These 3D correspondences are filtered by depth filtration, angle filtration, distance filtration and area filtration. Now, we have the real correspondences. Next, they are given into the ICP algorithm to look for the transformation matrixes between the consecutive scenes (point clouds). Then, we will conduct conversion the point clouds into the original point cloud‟s coordinate. In these conversion processes, we will remove the overlap points between the consecutive point clouds by applying k-d tree algorithm and filtering mean distance with tolerance threshold. When the clouds were converted, we continue to show the 3D objects to observe and evaluate. Development orientation of the project "BUILDING 3D A MODEL OF OBJECT "is building and identify the model online; using other cameras to meet the different environments such as outdoors, vi
- MỤC LỤC Trang tựa TRANG Quyết định giao đề tài Lý lịch khoa học i Lời cam đoan iii Lời cảm ơn iv Tóm tắt v Mục lục vii Danh sách các chữ viết tắt x Danh sách các hình xi Danh sách các bảng xvi Chƣơng 1 TỔNG QUAN 5 1.1 Tổng quan về hƣớng nghiên cứu 5 1.2 Tính cấp thiết của đề tài, ý nghĩa khoa học và thực tiễn của đề tài 6 1.3 Mục đích nghiên cứu và đối tƣợng nghiên cứu của đề tài 6 1.4 Nhiệm vụ và giới hạn của đề tài 6 1.5 Phƣơng pháp nghiên cứu và nội dung nghiên cứu 7 1.5.1 Phƣơng pháp nghiên cứu 7 1.5.2 Nội dung nghiên cứu 7 1.6 Kết quả dự kiến đạt đƣợc 8 1.7 Kế hoạch thực hiện đề tài 8 Chƣơng 2 CƠ SỞ LÝ THUYẾT 9 2.1 Tìm hiểu về camera 3D Kinect của Microsoft 9 2.1.1 Giới thiệu tổng quan về camera 3D Kinect của Microsoft 9 2.1.2 Các thành phần chính của camera 3D Kinect 9 2.1.3 Tính toán thông tin độ sâu 13 vii
- 2.1.4 Môi trƣờng hoạt động 14 2.1.5 Hạn chế về ánh sáng cấu trúc 15 2.1.6 Công suất tiêu thụ và nguồn cung cấp 15 2.1.7 Cân chỉnh cho ảnh RGB và ảnh độ sâu 15 2.1.8 Các thƣ viện hỗ trợ 16 2.2 Thuật toán SURF 16 2.3 Thuật toán RANSAC 26 2.4 Thuật toán lọc độ sâu 27 2.5 Thuật toán lọc hình học 27 2.5.1 Lọc góc 27 2.5.2 Lọc khoảng cách 30 2.5.3 Lọc diện tích 32 2.6 Thuật toán ICP cho ghép đám mây điểm 35 2.7 Thuật toán k-d tree 38 2.7.1 Định nghĩa k-d tree và cách xây dựng một cây k-d tree 38 2.7.2 Kỹ thuật tìm kiếm nút gần nhất trong k-d tree 42 2.8 Các thƣ viện sử dụng 46 Chƣơng 3 XÂY DỰNG MÔ HÌNH 3D VẬT THỂ 47 3.1 Sơ đồ khối 47 3.2 Khối lấy dữ liệu từ Kinect 48 3.3 Khối cài đặt 50 3.4 Khối xử lý đám mây điểm 51 3.5 Khối hiển thị dữ liệu 3D 57 3.6 Khối đồ thị 57 viii
- 3.7 Mối quan hệ giữa các khối với nhau 58 Chƣơng 4 CHƢƠNG TRÌNH VÀ HƢỚNG DẪN SỬ DỤNG 59 4.1 Giao diện và chức năng chƣơng trình 59 4.1.1 Giao diện của giai đoạn thu thập dữ liệu 59 4.1.2 Giao diện của giai đoạn cài đặt 64 4.1.3 Giao diện của giai đoạn xử lý dữ liệu 66 4.1.4 Giao diện của giai đoạn hiển thị dữ liệu 3D 72 4.1.5 Giao diện của giai đoạn đồ thị 75 4.2 Code chƣơng trình 89 4.3 Cài đặt các thông số cho các khâu: 89 4.3.1 Khâu lấy dữ liệu 89 4.3.2 Khâu cài đặt 90 4.3.3 Khâu xử lý dữ liệu 90 4.3.4 Khâu hiển thị dữ liệu 3D 91 4.3.5 Khâu hiển thị đồ thị 92 Chƣơng 5 THỰC NGHIỆM VÀ KẾT QUẢ THU ĐƢỢC 93 5.1 Kết quả thu đƣợc 93 5.1.1 Các thực nghiệm tìm thông số 93 5.1.2 Các thực nghiệm tái tạo mô hình vật thể, hiện trƣờng 110 Chƣơng 6 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 115 6.1 Kết luận 115 6.2 Hƣớng phát triển của đề tài 115 TÀI LIỆU THAM KHẢO 117 ix
- DANH SÁCH CÁC CHỮ VIẾT TẮT SURF Speeded-Up Robust Features SIFT Scale-Invariant Feature Transform RANSAC Random Sample Consensus ICP Iterative Closest Point k-d tree k-dimensional tree 3D three dimensions IR camera Infrared rays camera DOG Difference-of-Gaussian xi
- DANH SÁCH CÁC HÌNH HÌNH TRANG Hình 2.1: Các loại camera 3D của các hãng khác nhau 10 Hình 2.2: Thành phần chính của cảm biến Kinect của Microsoft 10 Hình 2.3: Ảnh màu thu đƣợc từ camera 3D Kinect 11 Hình 2.4: Phạm vi độ sâu của cảm biến Kinect 12 Hình 2.5: Ảnh độ sâu thu đƣợc từ camera 3D Kinect 12 Hình 2.6: Tính toán độ sâu ảnh của cảm biến Kinect 14 Hình 2.7: Góc mở của cảm biến Kinect 15 Hình 2.8: Quá trình tính không gian đo (L) và hàm sai khác D 17 Hình 2.9: Tìm điểm cực trị trong nhiều lớp với số đo khác nhau bằng cách sử dụng hàm DOG 18 Hình 2.10: Mô phỏng sử dụng công thức mở rộng của Taylor cho hàm DoG 19 Hình 2.11: Mô tả tạo bộ mô tả cục bộ 20 Hình 2.12: Xấp xỉ đạo hàm cấp 2 hàm Gaussian bằng hộp lọc 21 Hình 2.13: Sử dụng ảnh tích lũy để tính tổng khu vực hình vuông 23 Hình 2.14: Vùng hình tròn xung quanh và hƣớng đại diện cho điểm đặc trƣng 24 Hình 2.15: Lọc Haar wavelet để tính sự ảnh hƣởng trên hai hƣớng x và y. Vùng tối có trọng số là -1, vùng sáng là +1 24 Hình 2.16: Ma trận 4x4 hình vuông con xung quanh điểm đặc trƣng 25 Hình 2.17: Lƣu đồ của quá trình lọc góc cho loại bỏ các kết nối xấu 28 Hình 2.18: Lọc góc để lọc bỏ kết nối 3D xấu 29 Hình 2.19: Lƣu đồ của quá trình lọc khoảng cách cho loại bỏ các kết nối xấu 31 Hình 2.20: Lọc khoảng cách để lọc bỏ kết nối xấu 32 Hình 2.21: Lƣu đồ của quá trình lọc diện tích cho loại bỏ các kết nối xấu 33 Hình 2.22: Lọc diện tích để lọc bỏ kết nối xấu 34 Hình 2.23: Lƣu đồ giải thuật của thuật toán ICP cho 2 đám mây điểm 36 Hình 2.24: Một cây k-d tree trong không gian 3 chiều 38 xii
- Hình 2.25: Ví dụ về tập hợp điểm trong không gian 2 chiều 39 Hình 2.26: Kết quả phân chia dữ liệu theo trục x trong không gian 2 chiều 39 Hình 2.27: Kết quả phân chia dữ liệu theo trục y trong không gian 2 chiều 40 Hình 2.28: Một cây k-d tree sau khi phân chia dữ liệu trong không gian 2 chiều 40 Hình 2.29: Loại bỏ các điểm theo chiều dọc của cây kd-tree 41 Hình 2.30: Loại bỏ các điểm theo chiều ngang của cây kd-tree 41 Hình 2.31: Loại bỏ các điểm theo chiều dọc của cây kd-tree 42 Hình 2.32: Ví dụ tìm điểm gần nhất trong không gian 2 chiều 43 Hình 2.33: Cách tính điểm gần nhất trong không gian 2 chiều 43 Hình 2.34: Kiểm tra không gian tiềm năng và không gian cắt 44 Hình 2.35: Tính toán kiểm tra không gian tiềm năng và không gian cắt 44 Hình 3.1: Sơ đồ khối của quá trình xây dựng mô hình 3D 47 Hình 3.2: Lƣu đồ thu thập dữ liệu chế độ tự động từ camera 3D Kinect với đối tƣợng đứng yên. 49 Hình 3.3: Sơ đồ khối của giai đoạn xử lý đám mây điểm 51 Hình 3.4: Mô tả các điểm tƣơng đồng trên 2 ảnh dùng thuật toán SURF 52 Hình 3.5: Mô tả các điểm tƣơng đồng trên 2 ảnh dùng thuật toán RANSAC 53 Hình 3.6: Sơ đồ khối của quá trình hiệu chỉnh các đám mây điểm 56 Hình 4.1: Giao diện chính của chƣơng trình xây dựng mô hình 3D vật thể 59 Hình 4.2: Giao diện của quá trình thu thập dữ liệu 60 Hình 4.3: Thông báo lỗi khi kết nối cảm biến Kinect 61 Hình 4.4: Kết quả hiển thị sau khi kết nối Kinect thành công 63 Hình 4.5: Giao diện của quá trình lấy dữ liệu khi ở chế độ bằng tay 64 Hình 4.6: Giao diện của quá trình cài đặt 65 Hình 4.7: Giao diện của quá trình xử lý dữ liệu 66 Hình 4.8: Thông báo xử lý đám mây điểm thành công 68 Hình 4.9: Thông báo lỗi không tìm ra kết nối tƣơng đồng giữa các khung hình 69 Hình 4.10: Thông báo lƣu trữ ma trận chuyển đổi và đám mây điểm thành công 70 Hình 4.11: Thông báo việc sao chép thành công 71 xiii
- Hình 4.12: Giao diện của quá trình hiển thị dữ liệu 3D 73 Hình 4.13: Thông báo lỗi không đọc đƣợc file đám mây điểm 73 Hình 4.14.a: Cài đặt hiển thị số kết nối tƣơng đồng 75 Hình 4.14.b: Đồ thị hiển thị số kết nối tƣơng đồng 75 Hình 4.15: Đồ thị số kết nối tƣơng đồng SURF ở các khung hình khác nhau 77 Hình 4.16: Đồ thị số kết nối tƣơng đồng RANSAC ở các khung hình khác nhau 78 Hình 4.17: Đồ thị số kết nối tƣơng đồng 3DKeyPoints ở các khung hình 78 Hình 4.18: Đồ thị số kết nối tƣơng đồng Mean Angle ở các khung hình 79 Hình 4.19: Đồ thị số kết nối tƣơng đồng Mean Distance ở các khung hình 79 Hình 4.20: Đồ thị số kết nối tƣơng đồng Triangle area ở các khung hình 80 Hình 4.21: Đồ thị số kết nối tƣơng đồng SURF ở các khung hình 81 Hình 4.22: Đồ thị số kết nối tƣơng đồng của các thuật toán ở các khung hình 81 Hình 4.23.a: Cài đặt hiển thị kết nối các giá trị góc, khoảng cách của các kết nối tƣơng đồng 82 Hình 4.23.b: Đồ thị hiển thị góc trung bình giữa các kết nối tƣơng đồng 82 Hình 4.24.a: Cài đặt hiển thị khoảng cách của các kết nối tƣơng đồng của 2 khung liên tiếp 84 Hình 4.24.b: Đồ thị hiển thị khoảng cách giữa các kết nối tƣơng đồng các kết nối tƣơng đồng của 2 khung liên tiếp 84 Hình 4.25.a: Cài đặt hiển thị góc của các kết nối tƣơng đồng của 2 khung hình liên tiếp 84 Hình 4.25.b: Đồ thị hiển thị góc các kết nối tƣơng đồng của 2 khung hình liên tiếp 85 Hình 4.26: Đồ thị hiển thị góc các kết nối tƣơng đồng của 2 khung hình liên tiếp sau khi quy đổi. 85 Hình 4.27.a: Cài đặt hiển thị số điểm trong các đám mây điểm 86 Hình 4.27.b: Đồ thị hiển thị số điểm trong các đám mây điểm 86 Hình 4.28.a: Cài đặt thông số cho đồ thị ICP chart 87 Hình 4.28.b: Đồ thị hiển thị khoảng cách trung bình thực tế của thuật toán ICP 88 xiv
- Hình 4.28.c: Đồ thị hiển thị số vòng lặp thực tế của thuật toán ICP 88 Hình 4.29: Hình chiếu đứng của mô hình 3D vật thể 91 Hình 4.30: Hình chiếu bằng của mô hình 3D vật thể 92 Hình 5.1: Kết quả tái tạo vào các 2 thời điểm lấy ảnh 94 Hình 5.2: Ảnh độ sâu và ảnh màu với khoảng cách lấy ảnh là 30-35cm 94 Hình 5.3: Đám mây điểm 3D thu đƣợc với khoảng cách lấy ảnh là 30cm 95 Hình 5.4: Ảnh độ sâu và ảnh màu với khoảng cách lấy ảnh là 40 cm 95 Hình 5.5: Đám mây điểm 3D thu đƣợc với khoảng cách lấy ảnh là 40cm 96 Hình 5.6: Ảnh độ sâu và ảnh màu với khoảng cách lấy ảnh là 1,2m-1,5m 96 Hình 5.7: Đám mây điểm 3D thu đƣợc với khoảng cách lấy ảnh là 1,2m-1,5m 97 Hình 5.8: Ảnh độ sâu và ảnh màu với khoảng cách lấy ảnh là 4m-4,5m 97 Hình 5.9: Đám mây điểm 3D thu đƣợc với khoảng cách lấy ảnh là 4m-4,5m 98 Hình 5.10: Cài đặt thông số cho khâu cài đặt 98 Hình 5.11: Các kết nối tƣơng đồng từ các thuật toán với khoảng cách 4m 99 Hình 5.12: Kết quả tái tạo đám mây điểm với khoảng cách 4m 99 Hình 5.13: Các kết nối tƣơng đồng từ các thuật toán với khoảng cách 1,5m 100 Hình 5.14: Kết quả tái tạo đám mây điểm với khoảng cách 1,5m 100 Hình 5.15: Các kết nối tƣơng đồng từ các thuật toán với khoảng cách 40cm 100 Hình 5.16: Kết quả tái tạo đám mây điểm với khoảng cách 40cm 101 Hình 5.17: Kết quả đám mây điểm ứng với tỷ lệ ảnh là 1 và 2 102 Hình 5.18: Kết quả đám mây điểm ứng với tỷ lệ ảnh là 4 và 8 103 Hình 5.19: Lọc góc với khoảng cách là 1m sai số góc là 10 độ 105 Hình 5.20: Lọc góc với khoảng cách là 2m sai số góc là 10 độ 105 Hình 5.21: Lọc góc với khoảng cách là 3m sai số góc là 10 độ 106 Hình 5.22: Kết nối tƣơng đồng với lọc khoảng cách với khoảng cách là 1m 108 Hình 5.23: Kết nối tƣơng đồng với lọc khoảng cách với khoảng cách là 2m 108 Hình 5.24: Kết nối tƣơng đồng với lọc khoảng cách với khoảng cách là 3m 108 Hình 5.25: Mô hình 3D bàn ở nhà 110 Hình 5.26: Mô hình 3D bàn làm việc 111 xv
- Hình 5.27: Mô hình 3D xe gắn máy 111 Hình 5.28: Mô hình 3D ngƣời 112 Hình 5.29: Mô hình 3D ghế sa lông 112 Hình 5.30: Mô hình 3D hiện trƣờng trong nhà 113 xvi
- DANH SÁCH CÁC BẢNG BẢNG TRANG Bảng 1.1: Kế hoạch thực hiện đề tài 8 Bảng 5.1: Số kết nối tƣơng đồng ứng với các khoảng cách lấy ảnh 101 Bảng 5.2: Số điểm ảnh, thời gian xử lý, chất lƣợng ảnh với các tỷ lệ ảnh 103 Bảng 5.3: Số kết nối tƣơng đồng sau khi lọc góc 104 Bảng 5.4: Số kết nối bị loại bỏ (%) sau khi lọc góc 106 Bảng 5.5: Số kết nối tƣơng đồng sau khi lọc khoảng cách 107 xvii
- Chƣơng 1 TỔNG QUAN 1.1 Tổng quan về hƣớng nghiên cứu Hiện nay, 3D vision là một lĩnh vực nghiên cứu tƣơng đối mới. Một trong những nhánh nhỏ của lĩnh vực này là sử dụng camera 3D (là camera vừa thu ảnh màu và ảnh độ sâu) để phát hiện chuyển động của cơ thể ngƣời, xác định vị trí của đối tƣợng để điều khiển, xây dựng mô hình 3D và nhận dạng mô hình 3D Jun Xie, et al. đã nêu ra đƣợc phƣơng pháp xây dựng mô hình vật thể dựa trên thuật toán SIFT, thuật toán RANSAC và thuật toán ICP sử dụng ảnh độ sâu lấy từ camera 3D Kinnect của Microsoft [1], [2]. Với thuật toán SIFT sẽ trích xuất đặc trƣng của ảnh và tìm các kết nối tƣơng đồng của hai ảnh với nhau. Sau đó thuật toán RANSAC sẽ loại bớt các kết nối không tƣơng đồng từ thuật toán SIFT tìm ở trên. Cuối cùng thuật toán ICP với hàm mục tiêu mới cho canh chỉnh các đám mây điểm lại với nhau. Ƣu điểm của phƣơng pháp này là giải quyết đƣợc bài toán vật thể mà thiếu các đặc trƣng cấu trúc, những sự thay đổi về ánh sáng và tầm nhìn của camera. Việc xây dựng mô hình theo phƣơng pháp này chính xác hơn các phƣơng pháp trƣớc đó và quá trình xử lý tính toán tƣơng đối ngắn. Herbert Bay, et al. đã sử dụng thuật toán SURF để trích đặc trƣng và tìm điểm tƣơng đồng giữa hai ảnh [3]. Với ƣu điểm của thuật toán SURF là thời gian tính toán nhanh so với thuật toán SIFT, thƣờng dùng cho các ứng dụng đáp ứng thời gian thực. Sau khi tham khảo hai bài báo trên, ngƣời nghiên cứu quyết định kết hợp hai bài cáo để xây dựng cho bài báo của ngƣời nghiên cứu. Đề tài là XÂY DỰNG MÔ HÌNH 3D VẬT THỂ, sử dụng thuật toán SURF, thuật toán RANSAC, thuật toán lọc hình học, thuật toán ICP, thuật toán k-d tree sử dụng camera 3D Kinect của hãng Microsoft. 5
- 1.2 Tính cấp thiết của đề tài, ý nghĩa khoa học và thực tiễn của đề tài Việc xây dựng mô hình 3D là công việc thực sự cần thiết có nhiều ứng dụng khác nhau trong thực tế nhƣ tái tạo lại hiện trƣờng vụ án, tái tạo mô hình 3D của sản phẩm, Với sự ra đời của camera 3D không những cung cấp ảnh màu mà còn cung cấp ảnh độ sâu để giúp việc xây dựng mô hình 3D hiệu quả hơn. Vì thế, sau khi xây dựng mô hình 3D thành công sẽ có ý nghĩa thực tiễn, đặc biệt trong quá trình tái tạo lại hiện trƣờng vụ án phục vụ cho các công việc phá án sau này. 1.3 Mục đích nghiên cứu và đối tƣợng nghiên cứu của đề tài Với tính cấp thiết và ý nghĩa thực tiễn trên của đề tài, ngƣời nghiên cứu đã lựa chọn đề tài “XÂY DỰNG MÔ HÌNH 3D VẬT THỂ” làm đề tài tốt nghiệp thạc sĩ chuyên ngành Kỹ Thuật Điện Tử của mình. Với mục đích nghiên cứu là có thể xây dựng thành công mô hình 3D vật thể sẽ là động lực cho quá trình nhận dạng tiếp theo và góp phần vào sự phát triển các ứng dụng từ công việc tái tạo mô hình 3D. Ngƣời nghiên cứu xác định đối tƣợng nghiên cứu của mình là vật thể (nhiều vật thể), hiện trƣờng. 1.4 Nhiệm vụ và giới hạn của đề tài Nhiệm vụ chủ yếu của đề tài là xây dựng đƣợc mô hình 3D một cách hoàn chỉnh nhất. Cụ thể việc xây dựng mô hình 3D vật thể, hiện trƣờng bao gồm ba giai đoạn chính: Giai đoạn đầu tiên là giai đoạn thu thập dữ liệu từ camera 3D. Việc thu thập dữ liệu này mất nhiều thời gian do phải tìm các dữ liệu “tốt” phục vụ cho giai đoạn tiếp theo. Giai đoạn thứ hai là giai đoạn tạo các đám mây điểm và canh chỉnh các đám mây điểm. Giai đoạn cuối cùng là giai đoạn hiển thị dữ liệu 3D, mô hình đối tƣợng. Do thời gian bị giới hạn nên ngƣời nghiên cứu chỉ làm khâu đầu tiên của quá trình xây dựng mô hình 3D và nhận dạng đối tƣợng, và thực hiện xây dựng mô hình 3D với đối tƣợng là vật thể (nhiều vật thể), hiện trƣờng sử dụng camera 3D Kinect của hãng Microsoft. 6
- S K L 0 0 2 1 5 4



